Skip to main content

Table de redirection - Récupérer toutes les pages existantes d'un site

Table de redirection - Récupérer toutes les pages existantes d'un site

 

1. Export Google site: avec SEOQuake

Télécharger SEOQuake dans le Chrome Web Store

Changer les paramètre de recherche Google pour afficher 100 résultats de recherche :

param-search-1.png

param-search-2.png

param-search-3.png

param-search-4.png

ATTENTION : Une fois votre export complet effectué, remettre les paramètres de recherche à leur valeur par défaut (10 résultats par page)

Utiliser l'opérateur Google "site:nomdedomaine.tld" pour afficher toutes les pages du site indexées par Google.

Activer l'extension SEOQuake :

seoquake-inactif.png

seoquake-actif.png

Une fois SEOQuake activé, utiliser la fonction "Exporter au format CSV" :

seoquake-export.png

Répéter l'opération pour l'ensemble des pages de résultats de Google.

ATTENTION : une fois vos exports terminés, désactiver l'extension SEOQuake car elle fait beaucoup de requêtes lors de l'affichage d'une page Google, ce qui risque de faire apparaître un Captcha sur Google.

Compiler l'ensemble des fichier .csv en un seul fichier et l'enregistrer.

2. Export All URL 1 an Google Analytics pageviews > 10

Après avoir récupérer l'ensemble des pages indexées par Google, nous allons récupérer les pages qui ont reçu plus de 10 visites dans Google Analytics au cours de la dernière année.

Dans Google Analytics, se rendre dans le rapport "Comportement > Toutes les pages" et appliquer un filtre avancé pour éliminer les pages ayant reçu moins de 10 pageviews au cours de l'année :

analytics-filtre-pageviews.png

Utiliser la fonction "Exporter" de Google Analytics et exporter en .csv :

analytics-export.png

Garder une copie intact du fichier .csv et créer un autre fichier pour agréger les URL issues de l'index Google et de l'export Google Analytics. 

3. Crawl site Screaming Frog

Effectuer un crawl Screaming Frog du site et exporter toutes les URL recensées par le crawler.

Garder une copie intacte du fichier d'export et ajouter les URL au fichier utilisé pour agréger les URL index Google et Analytics.

4. Agrégation des différentes URL dans un fichier Excel

On possède désormais un fichier qui compile toutes les URL recensées via l'index Google, Google Analytics et le crawl Screaming Frog.

5. Dédoublonner les URL

Utiliser Excel pour dédoublonner immédiatement toutes les URL dans le fichier .csv

***

ATTENTION : Ajouter partie sur récupération des redirections 301 déjà existantes (.htaccess ou autre).

***

En suivant ces étapes, on croise 3 sources pour la récolte d'URL (Index Google, visites Google Analytics, crawl Screaming Frog) ce qui nous permet de ne rien rater des pages existantes d'un site afin d'établir une table de redirections la plus complète possible.