Audit technique SEO : les étapes à suivre pour le réaliser seul

L’audit technique est la base de toute bonne stratégie de référencement. Il permet de voir ce comment fonctionne votre site web, et s’il y a des erreurs techniques à corriger. L’audit est souvent effectué par un expert SEO. Mais si votre site ne contient que quelques pages, vous pouvez l’effectuer tout seul grâce à notre méthode. Nous vous donnons tous les paramètres essentiels à vérifier pour garantir la santé de votre site. C’est parti !

Sommaire

Quels outils utiliser pour un audit technique SEO ?

Pour commencer, équipez-vous des outils suivants qui vont vous servir dans l’analyse technique de votre site. La plupart sont gratuits, à l’exception de Screaming Frog. Bien que payant, cet outil est très puissant et vous fera gagner du temps !

seo-outils-audit

Les vérifications techniques de base

Les redirections

Top Level Domains (TLDs)

Outil : Vérification manuelle

- - Objectif : Vérifier que toutes les extensions de votre domaine redirigent bien vers l’extension principale que vous avez choisi. Par exemple, si vous choisissez l’extension “.fr”, toutes les autres extensions que vous possédez doivent rediriger vers “.fr”.
  - Méthode : Dans la barre de recherche, taper votre domaine suivi des extensions “.fr”, “.com” (et d’autres telles que “.info”, “.eu”) et vérifier que l’on retombe bien sur l’extension principale choisie.
  - Résolution : Si ce n’est pas le cas, cela signifie que vous ne possédez pas cette extension. A ce moment là, nous vous recommandons d’acheter le domaine à l’extension manquante.

HTTP(S)

Outil : Vérification manuelle

- - Objectif : Vérifier que la version “http” de votre site redirige bien vers “https”.
  - Méthode : Dans la barre de recherche, taper l’URL contenant le “http” (par exemple : http://monsite.fr) et vérifier que l’on retombe bien sur l’URL en “https”.
  - Résolution : Si ce n’est pas le cas, nous vous recommandons de mettre en place une redirection 301 de l’URL en “http” vers l’URL en “https”.

Avec ou sans “www”

Outil : Vérification manuelle

- - Objectif : Vérifier que la version avec “www” de votre site redirige bien vers la version sans “www”.
  - Méthode : Dans la barre de recherche, taper l’URL contenant le “www” (par exemple : https://www.monsite.fr) et vérifier que l’on retombe bien sur l’URL sans “www”.
  - Résolution : Si ce n’est pas le cas, nous vous recommandons de mettre en place une redirection 301 de l’URL avec “www” vers l’URL sans “www”.

Les principaux codes HTTP

Le code HTTP indique la réponse à la requête faite au serveur qui héberge une page web lorsque l’internaute tape l’adresse de la page ou bien clique sur un lien hypertexte. Il existe plusieurs catégories de réponses, symbolisées par le premier chiffre du code. Les plus communes sont les 3xx (redirection), les 4xx (erreur client) et les 5xx (erreur serveur).

Les pages ayant un code HTTP en 3xx

Outils : Screaming Frog et Ayima Redirect Path

Les deux codes 3xx les plus courants sont les codes 301 (redirection définitive) et 302 (redirection temporaire).

- - Objectif : Vérifier le bon fonctionnement de vos pages en 3xx
  - Méthode :
    - Dans Screaming Frog, extraire la liste des URLs dans le menu “Response Code” > “Redirection (3xx)”.
    - Sélectionner 3 à 5 URLs de cette liste et utiliser le plug-in Redirect Path afin d’analyser la redirection.
  - Résolution :
    - Si le plug-in indique une redirection directe, c’est à dire qu’il n’y a pas de redirections intermédiaires, tout va bien.

audit-technique-balise-h1

- - - Si le plug-in indique une redirection avec plusieurs pages intermédiaires, il faut alors modifier la redirection de la page d’origine vers la page finale de manière à ce que cette redirection soit directe.

audit-technique-redirection-multiple

Attention les pages en 301 diminuent le poids d’un lien interne. Pour les pages importantes en SEO, il est préférable de les lier directement à l’URL finale sans passer par l’URL en 301.

Les pages ayant un code HTTP en 4xx

Outil : Screaming Frog

Les codes 4xx indiquent des erreurs sur les URLs. Ils apparaissent le plus souvent lorsqu’un internaute tape une adresse incorrecte ou que la page n’existe plus (erreur 404).

Tandis que c’est tout à fait normal d’utiliser ces codes lorsqu’on supprime une page, il faut encore une fois surtout s’assurer que ces pages ne sont pas maillées dans le site.

- - Objectif : Vérifier que les pages en 404 sont bien redirigées avec un code 301 et contiennent une balise “noindex” afin de ne pas les indexer sur Google.
  - Méthode : Il faut donc récupérer les liens entrants de ces URLs en 4xx, pour soit les supprimer soit les modifier. Pour rappel : ces inlinks sont disponibles via le crawler, et dans le cadre d’un audit avec Smartkeyword, ils vous sont fournis. Dans Screaming Frog, aller dans le menu “Response Code” > “Client error (4xx)” et cliquer sur chaque lien pour vérifier la redirection 301 et la balise noindex (les informations apparaissent en bas de l’écran).
  - Résolution : Mettre à jour les URLs sans 301 ni balise “noindex”.

Attention les pages en 301 diminuent le poids d’un lien interne. Pour les pages importantes en SEO, il est préférable de les lier directement à l’URL finale sans passer par l’URL en 301.

Les pages ayant un code HTTP en 5xx

Outil : Screaming Frog

Les erreurs 500 sont des erreurs liées au serveur qui héberge votre site. Il faut alors contacter votre hébergeur pour résoudre le problème.

- - Objectif : Soit l’erreur doit être corrigée car la page doit être visible. Soit la page résulte d’un souci technique et il faut alors la mettre en 410 et la supprimer du maillage interne.
  - Méthode : Dans Screaming Frog, aller dans le menu “Response Code” > “Server error (5xx)” pour extraire la liste des URLs concernées.
  - Résolution : Contacter votre hébergeur et lui transmettre la liste des URL en erreur 500.

Les balises “noindex”

Outil : Screaming Frog

La balise “noindex” indique à Google de ne pas indexer la page web. Elle est en général utilisée sur les pages de conditions générales de vente , mentions légales, panier d’achat, page de connexion à un compte en ligne…

- - Objectif : Vérifier que toutes les pages qui sont en noindex sont bien des pages que vous voulez que les moteurs de recherche n’indexe pas.
  - Méthode : Dans Screaming Frog, aller dans le menu “Directive” > “Noindex” pour extraire la liste des URLs concernées.
  - Résolution : Supprimer ou ajouter une balise “noindex” sur les pages concernées.

L’audit SEO de pages web

Les principales balises de contenu

La balise title

Outil : Screaming Frog

La balise title apparaît sur les pages de résultats des moteurs de recherche et répond à des critères strictes. Grâce à Screaming Frog, vous allez pouvoir extraire la liste des pages qui présentent des erreurs de balise title.

Dans Screaming Frog, aller dans le menu “Page Title” et sélectionner les filtres suivants :

- - “Missing” : vérifier que toutes vos pages ont une balise title.
  - “Duplicate” : vérifier qu’il n’y a pas title en double. Souvent il s’agit de problème de pagination.
  - “Below” : ce sont les titles trop court qui font moins de 30 caractères, il faut donc les rallonger.
  - “Over 65” : ce sont le titles trop long qui font plus de 65 caractères, il faut donc les écourter.

audit-technique-balise-title

Les balises H1 et H2

Outil : Screaming Frog

La balise H1 correspond au “gros titre” de votre page, et doit être unique par site web. Attention, certains CMS créent des H1 multiples, ce qui nuit à votre SEO.

Les balises H2, sont les titres de section du contenu d’une page web. Bien qu’elles ne soient pas soumises à des règles strictes, toute page doit contenir des balises H2. C’est pour ça qu’il est important de les vérifier.

Dans Screaming Frog, aller successivement dans les menus “H1” et “H2”, et faire les mêmes vérifications que pour la balise title.

La balise meta description

Outil : Screaming Frog

La balise meta description apparaît sur les pages de résultats des moteurs de recherche et répond à des critères strictes. Grâce à Screaming Frog, vous allez pouvoir extraire la liste des pages qui présentent des erreurs de balise meta description.

Dans Screaming Frog, aller dans le menu “Meta description” et faire les mêmes vérifications que pour la balise title.

audit-technique-balise-h1-et-h2

La profondeur des pages

Outil : Screaming Frog

La profondeur d’une page d’un site web correspond au nombre de clics nécessaires à faire depuis la page d’accueil pour accéder à la page. Plus le nombre de clics est élevé, plus la page est dite “profonde”. Google préconise une profondeur maximum désirable à 4 clics.

Dans Screaming Frog, dans la section de droite, aller dans “Site Structure” > “Internal”, puis “Crawl Depth” pour savoir le nombre d’URLs par palier de profondeur (de 0 clics à 1, 2, 3, etc.).

audit-technique-site-structure

La pagination

Outil : Screaming Frog

La pagination permet de diviser en sous-pages des listes de contenus quand ceux-ci sont trop nombreux, notamment sur les sites e-commerces lorsqu’il y a des dizaines de produits pour chaque catégorie.

Les bonnes pratiques pour une pagination SEO friendly sont :

- - Chaque page paginée doit contenir une balise canonical (self-referencing pour la page 1, et qui pointe vers la page 1 pour les pages suivantes).
  - Chaque page paginée doit contenir les balises <rel=”next”> et <rel=”prev”> dans la partiedu code HTML (la page 1 n’a pas de <rel=”prev”> et la dernière page n’a pas de <rel=”next”>).
  - Ne pas mettre de balise “noindex” ou “nofollow” sur ces pages.
  - L’URL de la page 1 ne contient pas la mention “page=1” contrairement aux pages suivantes.

Dans Screaming Frog, filtrer les URLs paginées (celles qui contiennent les balises “rel=next/prev”), et vérifier qu’elles sont implémentées selon les bonnes pratiques. Pour cela, analyser une “page 1”, une page intermédiaire et une page finale.

Attention, si Screaming Frog ne liste rien, cela signifie que la pagination n’est pas en place sur votre site.

audit-technique-pagination

audit-technique-pagination-Leclerc

La présence du fil d’Ariane

Outil : Vérification manuelle

- - Objectif : Vérifier que le fil d’Ariane est présent, et pertinent.
  - Méthode : Aller sur plusieurs pages du site web. Il doit y avoir un fil d’Ariane en haut de page. Le fil d’Ariane doit indiquer le chemin à parcourir pour arriver à la page web, avec un lien vers les pages “mères”.
  - Résolution : Mettre en place le fil d’Ariane (si absent) et mettre en place la structure navigationnelle du site à partir de laquelle le CMS construit le fil d’Ariane.

Exemple de fil d’Ariane pertinent :

audit-technique-fil-Ariane-pertinent

Exemple de fil d’Ariane inutile, car il passe directement de la page d’accueil à la page visitée sans indiquer les pages intermédiaires :

La structure des URLs

Outil : Screaming Frog

L’URL d’une page web apparaît sur les pages de résultats des moteurs de recherche et doit donc répondre à quelques critères d’optimisation.

- - Objectif : Vérifier que les URLs soient au format ASCII et qu’elles soient toutes uniques.
  - Méthode :
    - Dans Screaming Frog, aller dans le menu “URL” > “non ASCII” pour extraire la liste d’URLs non conformes.
    - Aller dans “URL” > “Duplicate” pour extraire la liste d’URLs dupliquées.
  - Résolution :
    - Convertir les URL non ASCII en ASCII
    - Désindexer les URLs dupliquées et les ajouter au fichier robots.txt

La balise canonical

Outil : Screaming Frog

La balise canonical permet de “créditer” la page de contenu d’origine en cas de contenu dupliqué. De manière générale, la bonne pratique est d’ajouter une balise canonical “self referencing”, c’est à dire qui pointe vers elle-même, pour chaque page web de votre site.

- - Objectif : Vérifier qu’une balise canonical self referencing est présente sur chaque page web.
  - Méthode :
    - Dans Screaming Frog, aller dans le menu “Canonical” > “Self Referencing” pour extraire la liste d’URLs correctes.
    - Puis dans “Canonical” > “Missing” pour extraire la liste d’URLs pour lesquelles il manque la balise canonical.
  - Résolution : Ajouter une balise canonical qui pointe vers elle-même sur chaque page où elle est manquante.

Attention : Si vous modifiez une url, préférez mettre en place une redirection 301de l’ancienne vers la nouvelle, plutôt qu’une balise canonique.

Les liens en JavaScript

Outil : Vérification manuelle

- - Objectif : Vérifier que les balises « a href » sont implémentées proprement sur les blocs de contenu d’une page web du type “bouton” etc. Et donc que le contenu n’est pas implémenté en JavaScript.
  - Méthode : Sur une page web de votre choix, faites un clic droit puis “Inspecter” sur un bouton par exemple. La balise « a href » doit indiquer la sémantique du bouton. C’est à dire que Google peut lire le contenu du bloc, que chaque élément du bloc est lisible individuellement (sans JavaScript).
  - Résolution : Ajouter une balise canonical qui pointe vers elle-même sur chaque page où elle est manquante.

Exemple de balise « a href » correctement implémentée :

audit-technique-balise-ahref

Exemple d’une mauvaise implémentation car le bouton est une image et ne contient pas de balise « a href » :

audit-technique-javascript

L’optimisation des images

Outil : Screaming Frog

Les images sont importantes pour illustrer une page web. Attention, afin de ne pas être pénalisés par Google, il faut veiller à ce qu’elles ne soient pas trop lourdes, car elles risquent de ralentir le chargement de la page. Et afin de bien optimiser vos images pour Google images, et de bien les contextualiser dans le contenu de la page (dire à Google de quoi parle l’image, et confirmer qu’elle est en lien avec le thème de la page), il est important de renseigner l’attribut ALT, un champ proposé lors du téléchargement de l’image sur votre CMS.

- - Objectif : Vérifier que chaque image contient un attribut ALT et qu’elle ne dépasse pas 100Kb en poids.
  - Méthode :
    - Dans Screaming Frog, aller dans le menu “Image” > “Over 100Kb” pour extraire la liste d’images trop lourdes.
    - Puis dans “Image” > “Missing ALT” pour extraire la liste d’images n’ayant pas d’attributs ALT.
  - Résolution : Compresser vos images trop lourdes (un plug-in dans votre CMS peut faire ça automatiquement) et ajouter un attribut ALT à toutes les images qui n’en ont pas.

Les vérifications d’indexation

Le fichier robots.txt

Outil : Vérification manuelle

Le fichier robots.txt indique aux robots de Google les pages du site que vous ne souhaitez pas être crawlées, ni indexées.

- - Objectif : Vérifier que le fichier existe et contient bien les URLs que vous ne souhaitez pas indexer.
  - Méthode : Dans la barre de recherche, taper l’URL de votre site suivie du sous-dossier /robots.txt (par exemple https://smartkeyword.io/robots.txt)
  - Résolution : Si le fichier d’existe pas, il faut le créer. S’il existe mais est incomplet, il faut y ajouter les URLs manquantes.

Les fichiers sitemap

Outil : Google Search Console

Les fichiers sitemap servent à indiquer aux robots de Google les pages que vous souhaitez qu’il crawl en priorité dans le but de les indexer.

audit-technique-sitemap

- - Objectif : Vérifier que le fichier existe et contient bien les URLs que vous souhaitez indexer.
  - Méthode : Dans la Google Search Console, allez dans “Sitemap” et vérifier la présence et le contenu du ou des sitemaps.
  - Résolution : Pour modifier ou créer un sitemap voici des documents utiles :
    - Dans Wodpress : https://wpmarmite.com/sitemap-wordpress/
    - Aide Google : https://support.google.com/webmasters/answer/183668?hl=fr

Les erreurs dans la Google Search Console

Outil : Google Search Console

La Google Search Console est un outil en ligne mis à disposition gratuitement par Google pour vous donner les informations de référencements de votre site web. C’est là que Google vous indique les erreurs qu’il détecte sur vos pages. Toutes ces erreurs sont listées dans le menu “Couverture”.

Le rapport d’avertissement

Le rapport d’avertissement concerne les URLs “valides” qui sont indexées mais qui sont bloquées par le fichier robots.txt.

audit-technique-rapport-avertissement

Ces erreurs peuvent être de 8 types :

- - Erreur de serveur (5xx) : le serveur n’a pas répondu à une requête apparemment valide.
- - Erreur liée à des redirections : la redirection 301/302 ne fonctionne pas.
- - URL envoyée bloquée par le fichier robots.txt : cette page est bloquée par le fichier robots.txt. Vous pouvez essayer de tester votre page à l’aide de l’outil de test du fichier robots.txt.
- - URL envoyée désignée comme “noindex” : vous avez envoyé cette page pour qu’elle soit indexée, mais elle contient une directive “noindex” dans une balise Meta ou un en-tête HTTP. Si vous souhaitez que cette page soit indexée, vous devez supprimer cette balise ou l’en-tête HTTP.
- - URL envoyée semble être une erreur de type “soft 404” : vous avez envoyé cette page pour qu’elle soit indexée, mais le serveur a renvoyé ce qui semble être une erreur de type “soft 404”.
- - URL envoyée renvoie une demande non autorisée (401) : vous avez envoyé cette page pour qu’elle soit indexée, mais Google a reçu une réponse 401 (accès non autorisé). Supprimez les exigences d’autorisation pour cette page ou permettez à Googlebot d’accéder à vos pages en vérifiant qu’il s’agit bien de lui.
- - URL envoyée introuvable (404) : vous avez envoyé une URL pour qu’elle soit indexée, mais celle-ci n’existe pas. Découvrez comment corriger les erreurs de type 404.
  - L’URL envoyée contient une erreur d’exploration : vous avez envoyé cette page pour qu’elle soit indexée, et Google détecté une erreur d’exploration non spécifiée qui ne correspond à aucune des autres raisons. Pour essayer de déboguer la page, utilisez l’outil d’inspection d’URL.

audit-technique-erreur-url

Pour résoudre ce problème, cliquer sur “Indexée malgré le blocage par le fichier robots.txt”, pour obtenir la liste des pages en erreur. En cliquant sur chaque URL listée, vous pouvez tester le blocage par le fichier robots.txt.

Si les URLs sont vraiment censées être bloquées, dans ce cas, retirez les du fichier robots.txt, ajoutez une balise meta robots en no index sur ces pages. Une fois qu’elles sont effectivement désindexées, ajoutez les URLs de ces pages de nouveau au fichier robots.txt.

audit-technique-url-bloqué

Les erreurs sur les URLs “exclues”

Les URLs dites “exclues” sont les URLs qui ne sont pas indexées. Il est possible qu’elles soient utiles à indexer. Google vous en donne la liste afin que vous puissiez remédier au problème. Ceci dit, si leur non indexation est voulue, il n’y a pas de problèmes à résoudre.

audit-technique-URL-exclu

Le mot de la fin

Grâce à nos conseils, vous avez à présent une liste de corrections à apporter à votre site web afin d’en améliorer la santé technique. Pour les questions plus poussées, nous vous invitons à nous contacter sur https://smartkeyword.io/contact/.

Article rédigé par Louis Chevant

Complétez votre lecture

Le guide de l’audit technique SEO

Méthode pas à pas pour réaliser un audit technique de votre site.

Télécharger gratuitement

Le guide ultime de l’audit technique SEO

Quels outils utiliser pour un audit technique SEO ?

Les vérifications techniques de base

Les redirections

Top Level Domains (TLDs)

HTTP(S)

Avec ou sans “www”

Les principaux codes HTTP

Les pages ayant un code HTTP en 3xx

Les pages ayant un code HTTP en 4xx

Les pages ayant un code HTTP en 5xx

Les balises “noindex”

L’audit SEO de pages web

Les principales balises de contenu

La balise title

Les balises H1 et H2

La balise meta description

La profondeur des pages

La pagination

La présence du fil d’Ariane

La structure des URLs

La balise canonical

Les liens en JavaScript

L’optimisation des images

Les vérifications d’indexation

Le fichier robots.txt

Les fichiers sitemap

Les erreurs dans la Google Search Console

Le rapport d’avertissement

Les erreurs sur les URLs “exclues”

Le mot de la fin