Table de redirection - Récupérer toutes les pages existantes d'un site
Table de redirection - Récupérer toutes les pages existantes d'un site
1. Export Google site: avec SEOQuake
Télécharger SEOQuake dans le Chrome Web Store
Changer les paramètre de recherche Google pour afficher 100 résultats de recherche :
ATTENTION : Une fois votre export complet effectué, remettre les paramètres de recherche à leur valeur par défaut (10 résultats par page)
Utiliser l'opérateur Google "site:nomdedomaine.tld" pour afficher toutes les pages du site indexées par Google.
Activer l'extension SEOQuake :
Une fois SEOQuake activé, utiliser la fonction "Exporter au format CSV" :
Répéter l'opération pour l'ensemble des pages de résultats de Google.
ATTENTION : une fois vos exports terminés, désactiver l'extension SEOQuake car elle fait beaucoup de requêtes lors de l'affichage d'une page Google, ce qui risque de faire apparaître un Captcha sur Google.
Compiler l'ensemble des fichier .csv en un seul fichier et l'enregistrer.
2. Export All URL 1 an Google Analytics pageviews > 10
Après avoir récupérer l'ensemble des pages indexées par Google, nous allons récupérer les pages qui ont reçu plus de 10 visites dans Google Analytics au cours de la dernière année.
Dans Google Analytics, se rendre dans le rapport "Comportement > Toutes les pages" et appliquer un filtre avancé pour éliminer les pages ayant reçu moins de 10 pageviews au cours de l'année :
Utiliser la fonction "Exporter" de Google Analytics et exporter en .csv :
Garder une copie intact du fichier .csv et créer un autre fichier pour agréger les URL issues de l'index Google et de l'export Google Analytics.
3. Crawl site Screaming Frog
Effectuer un crawl Screaming Frog du site et exporter toutes les URL recensées par le crawler.
Garder une copie intacte du fichier d'export et ajouter les URL au fichier utilisé pour agréger les URL index Google et Analytics.
4. Agrégation des différentes URL dans un fichier Excel
On possède désormais un fichier qui compile toutes les URL recensées via l'index Google, Google Analytics et le crawl Screaming Frog.
5. Dédoublonner les URL
Utiliser Excel pour dédoublonner immédiatement toutes les URL dans le fichier .csv
***
ATTENTION : Ajouter partie sur récupération des redirections 301 déjà existantes (.htaccess ou autre).
***
En suivant ces étapes, on croise 3 sources pour la récolte d'URL (Index Google, visites Google Analytics, crawl Screaming Frog) ce qui nous permet de ne rien rater des pages existantes d'un site afin d'établir une table de redirections la plus complète possible.
Pas de commentaires