L’URL canonique (canonical URL) est une balise permettant d’indiquer à un moteur de recherche l’URL “principale” à prendre en compte pour l’indexation, lorsqu’un même contenu est présent sous différentes URLs, évitant ainsi de laisser le soin au moteur de choisir à votre place.

Sommaire

En matière d’optimisation du contenu d’un site web, le problème du contenu dupliqué est l’une des difficultés les plus fréquemment rencontrées par les webmasters, e-commerçants et autres spécialistes du SEO. La redirection 301 est alors préconisée comme une potentielle solution. Mais cette dernière n’est pas toujours possible à mettre en œuvre, ou n’est parfois pas appropriée. C’est le cas par exemple si la redirection doit conduire à un ralentissement du chargement de la page, ou si la page à contenu dupliqué doit nécessairement être consultée par les utilisateurs. C’est à ce niveau qu’intervient l’URL canonique, via l’attribut rel= »canonical », qui permet de résoudre la plupart des problèmes de contenu dupliqué.

URL canonique : définition

URL canonique : définition

On parle de contenu dupliqué lorsque deux pages web, possédant donc des URL différentes, présentent un contenu identique. Pour rappel, l’URL (Uniform Resource Locator) désigne l’adresse unique de format « www.exemple.com » ou « http:exemple.com/contenu » correspondant à une page internet. Dans la gestion de vos plates-formes en ligne, il est donc dommageable pour leur réputation d’avoir deux pages différents avec un même contenu.

La duplication peut être causée par une mauvaise structuration ou un mauvais paramétrage des pages du site web. Généralement, les moteurs de recherche analysent les sites web suivant le principe qu’à chaque URL, correspond une seule et même page. Lorsque la duplication survient, la conséquence immédiate est que cette analyse se retrouve biaisée. En guise d’exemple, lors d’une recherche via le moteur de recherche Google, les deux pages à contenu dupliqué seront concurrentes l’une de l’autre. Evidemment, cela n’est guère convenable pour un bon référencement.

L’URL canonique permet d’indiquer aux moteurs de recherche quelle est l’adresse canonique, c’est-à-dire l’adresse officielle, associée à chaque page. Le moteur comprend donc qu’il doit indexer la page sous cette adresse précise. Inclusivement, toute autre version sera tout simplement considérée comme étant la même page. Cette composante de page internet peut donc être vue comme étant un élément qui précise aux moteurs de recherche quelle est la page la plus représentative dans un lot de pages dupliquées.

Comment optimiser ses URL canoniques ?

L’optimisation de ses URL canoniques passe par l’identification des contenus dupliqués, et par la compréhension des causes de cette duplication. Plusieurs astuces permettent d’y arriver. Vous pouvez par exemple vérifier les pages que génèrent les commentaires, puisque les moteurs de recherche affichent aussi des résultats en considérant le contenu des commentaires. Par ailleurs, aidez-vous d’une petite recherche Google ou Bing pour vérifier si les pages indexées de votre site web ne sont pas plus nombreuses que le nombre d’articles ou de pages publiées. Ensuite, jetez un coup d’œil à vos catégories (si vous en avez) et assurez-vous qu’aucun article ne se retrouve dans deux catégories à la fois. Enfin, examinez les redirections de votre site, pour vous assurer qu’elles sont toutes bien configurées. Une fois que vous avez effectué ces vérifications, assurez-vous maintenant que l’URL officielle de chaque page est optimale.

Pour optimiser une URL canonique, vous devez veiller à respecter les règles de base qui régissent les URL en général. Ce faisant, gardez également à l’esprit que vous devez donner à l’URL préférée, pour renvoyer à une page donnée, toutes les chances d’être bien vu par les moteurs de recherche. Cela implique par exemple d’y faire figurer un mot clé. Ce principe, aussi anodin puisse-t-il paraître, joue un rôle dans le référencement. Au niveau des algorithmes de Google, il est plus logique qu’une adresse contienne le mot clé d’indexation de la page. En insérant donc cette expression clé, veillez à ne pas y insérer d’accent ou de signe difficile à interpréter pour les moteurs de recherche.

L’ajout d’un terme à l’URL canonique ne suffit bien sûr pas pour celle-ci soit optimisée, et ne saurait d’ailleurs être considéré comme solution ultime. Il faut également éviter que cette URL soit trop longue, afin qu’elle puisse aisément être exploitée sur les réseaux sociaux et sur les forums. Sur ce point, l’arborescence fait partie des éléments qui influencent la longueur d’une URL. Si deux pages de votre site ont des titres primaires identiques, et que leurs URL seront donc similaires, la présence de l’arborescence dans l’adresse peut aider à les différencier. Mais vous n’avez pas besoin de reprendre toute la chaîne de catégories ; limitez-vous par exemple à un ou deux éléments permettant de différencier ces deux pages.

Toujours dans l’optique d’optimiser l’URL canonique d’une page de votre site, assurez-vous qu’elle comprenne des séparateurs de mots, mais des séparateurs faciles à interpréter par les moteurs de recherche. En règle générale, l’on retient le tiret (-) comme étant le séparateur le plus simple. Des signes telles que la virgule ou le point-virgule devront être évités, alors que l’esperluette (&) ou encore le dièse (#) seront réservés pour identifier des zones de pages dynamiques.

En dehors de ces détails, il faudra aussi se rendre dans la Search Console de Google pour indiquer à ce moteur de recherche quelle version de l’adresse de votre site devra être considérée comme canonique pour votre domaine. Une fois que vous avez passé en revue toutes ces spécificités, il est ensuite temps de passer à la mise en place à proprement parler d’une URL canonique.

Comment mettre en place une URL canonique et quelle valeur ajoutée apporte-t-elle ?

Lorsque vous avez configuré l’épellation adresse canonique que vous souhaitez prioriser pour un contenu donné sur votre site, il faut à présent la mettre en place en choisissant la méthode qui vous convient le mieux.

1ère méthode : insérer la balise de l’URL canonique dans un code HTML

L’utilisation de cette méthode consiste à placer la balise, avec l’attribut approprié, au niveau de l’entête head. Cette balise doit être ajoutée sur toutes les pages possédant le contenu identique ; ainsi, elles renverront toutes vers la page associée à l’adresse canonique. Pour ce faire, entre le « head » et le « /head », insérez le code suivant :

<link rel = »canonical » href= »www.urlcanonique.com »>.

url-canonical-html

2ème méthode : paramétrer l’URL canonique via l’entête http

Depuis juin 2011, il vous est aussi possible de paramétrer en procédant à l’ajout d’une ligne dans l’entête HTTP. Pour ce faire, il vous suffit d’adopter le format Link: <URL>; rel= »canonical », expression qui est à insérer au niveau de l’entête.

url-canonical-entete

3ème méthode : la solution des sitemaps

Les sitemaps contiennent à priori les URL canoniques de toutes les pages de votre site internet. Ainsi, vous pouvez y ajouter les adresses que vous définissez comme celles devant être officiellement associées aux diverses pages.

En résumé :

Vous n’avez pas l’obligation d’employer l’une de ces méthodes en vue de définir des URL canoniques pour vos pages existant en double. Toutefois, en le faisant, vous veillez à garder le contrôle sur l’URL la plus appropriée pour renvoyer vers un contenu donné sur votre site. Car, en l’absence d’URL canonique définie par vous, Google choisit simplement l’URL qu’il juge meilleure selon ses critères. Et ces critères ne sont pas forcément les vôtres.

Quelques cas d’utilisation de rel= »canonical »

En plus de la difficulté ou du caractère inapproprié de la redirection 301, plusieurs autres situations peuvent rendre nécessaire l’adoption de références canoniques. C’est le cas par exemple lorsque vous possédez sur votre site plusieurs pages pour des produits appartenant à une même série, et qui ne diffèrent que par la taille par exemple, ou par la couleur. Si cela se produit, il est alors préférable de choisir une seule page dont l’URL sera optimisée avec la balise link rel= »canonical ».

url-canonical-inidexable

L’URL canonique peut également s’imposer au cas où vous disposeriez d’un système de tri de produits, avec le critère de tri apparaissant dans l’adresse. Vous devrez alors insérer un lien vers l’URL canonique sur toutes les nouvelles pages générées par les tris. Vous pouvez le faire à l’aide de la première méthode de mise en place évoquée ci-dessus. Comme autre situation pouvant conduire à l’emploi de la balise canonique, il y a aussi l’utilisation d’un contenu identique sur plusieurs domaines ou la publication d’un même contenu dans plusieurs langues. Pour chacun de ces contextes, il serait opportun d’introduire rel= »canonical » dans l’entête de la page principale.

URL canonique : les erreurs à éviter

Erreur n°1 : une même URL canonique pour des contenus différents

Il peut arriver que, par erreur, vous configuriez une même URL canonique pour de trop nombreuses pages sur votre site, alors même que leurs contenus diffèrent. Cette erreur risquerait de plomber votre référencement global, puisque certaines pages seront moins en vue.

Erreur n°2 : plusieurs liens canoniques pour une même page

Il n’est également pas rare que certains utilisateurs paramètrent plusieurs URL canoniques pour une même page. Cela pourrait tout simplement amener les moteurs de recherche à choisir une URL canonique, puisqu’ils n’en retiendront qu’une, qui n’est pas forcément la plus optimisée.

Erreur n°3 : une référence canonique non-indexable

Pour un meilleur référencement, vous optez pour l’emploi des URL canoniques. Il serait alors un peu bête que ces dernières ne soient pas indexables, non ?

Erreur n°4 : l’utilisation de l’URL canonique sur les pages avec pagination

Parfois, dans le paramétrage de contenus devant s’afficher sur plusieurs pages, vous pouvez être tenté de mettre une adresse canonique sur la première page. Pourtant, tant que la pagination est mise en place, chaque page doit être indexée. Cette erreur empêcherait toutes les pages suivantes d’être indexées.

Erreur n°5 : inversion des rôles entre la page favorite et une page secondaire

Une autre erreur possible consiste à inverser les rôles. En clair, la page indiquée pour l’URL canonique renvoie vers la page supposée être secondaire et sur laquelle son adresse est ajoutée comme canonique.

Cas 1 : les balises manquantes

Le premier cas à analyser est celui des pages qui ne contiennent pas la balise.

  • S’il n’y en a pas : tant mieux, il n’y a rien à faire
  • S’il y en a : repérer le nombre et le type de page(s) concernée(s). S’il s’agit de pages à désindexer (panier d’achat, etc), vérifiez qu’elles le sont ou procédez à leur désindexation. Sinon, il faut placer une balise canonique « self-referencing », c’est-à-dire qui pointe vers la page en question, pour indiquer à Google que c’est la page d’origine et se prémunir du contenu dupliqué..

Balise canonical self-referencing : si mon site internet est : www.monsite.fr ma balise sera :  <link rel= »canonical » href= »https://monsite.fr/ » />.

Cas 2 : les balises présentes

Logiquement, le crawl du site devrait nous permettre de voir l’équation suivante :

Total de pages du site = Nb canoniques manquantes + Nb canoniques présentes
Avec Nb canoniques présentes = Nb canoniques self-referencing + Nb canoniques « referencing other »

==> On va donc s’intéresser aux balises canoniques présentes pour analyser leur type.

Cas 2.1 : autant de balises canoniques présentes que de self-referencing

Cela signifie que toutes les balises présentes sur votre site pointent vers la page même : c’est l’usage le plus fréquent de cette balise.
Il n’y a à priori rien à faire, sauf si vous vous retrouvez dans l’un des cas justifiant de pointer la canonique vers une autre page. Par exemple, si votre site reprend un article déjà présent ailleurs, par exemple pour donner de la visibilité à des blogueurs partenaires, il faut placer une balise canonique pointant vers la page d’origine.

Cas 2.2 : moins de canoniques self-referencing que de canoniques présentes au total

Cela signifie que vous avez des balises canonicals qui pointent vers d’autres pages et non pas vers « elles-même ».

  • s’il s’agit de pagination : il est très fréquent, si vous avez des pages paginées, que toutes les pages après la première aient une canonique pointant vers la page 1. Dans ce cas, nous vous conseillons de modifier ce fonctionnement en mettant des canonical self-referencing. Cela permet à Google d’explorer et prendre connaissance du contenu de toutes les pages.
  • sinon : s’agit-il de pages en double ? S’il s’agit de pages en double qui doivent exister (exemple du cas 2.1 ci-dessus de syndication de contenu), alors conservez la canonique. Si en revanche, il s’agit de pages qui ne devraient pas exister en double, comme un changement d’URLs par exemple, alors ce n’est pas la balise canonique qu’il faut mettre en place, mais une redirection 301 de l’ancienne URL vers la nouvelle.

En effet, la redirection 301 permet de renvoyer le trafic de l’ancienne page vers la nouvelle, et de maîtriser le maillage interne (liens internes) de votre site, en évitant de créer des pages identiques sans besoin pour l’utilisateur.

Les solutions / astuces pour bien utiliser l’URL canonique

Plusieurs astuces peuvent vous aider à tirer le meilleur de l’optimisation des URL canoniques de vos sites web. Entre autres, si vous utilisez des CMS, vous devez par exemple veiller à bien configurer les URL canoniques. La plupart de ces outils de gestion de site web proposent des plugins ou des modules en ce sens. C’est le cas de Frontend SEO ou EFSEO – Easy avec Joomla, ou encore Yoast SEO ou All in One SEO sous WordPress. On peut aussi évoquer Metatag du côté de Drupal.

En outre, il est recommandé d’opter pour des adresses absolues lors du paramétrage de vos URL canoniques. De fait, en plus du risque d’erreur lié aux références relatives, il y a aussi le risque que certains moteurs de recherche aient du mal à les interpréter. Pour les cas d’URL canonique renvoyant à un code d’erreur, notamment à une erreur 404, il est vrai qu’elles n’empêcheront pas l’indexation de la page concernée. Les moteurs de recherche chercheront automatiquement une URL à lui attribuer comme étant canonique. Mais puisque vous n’aurez alors plus la maîtrise voulue sur l’optimisation de votre site, il est primordial de vérifier minutieusement vos adresses canoniques, en vue de vous assurer qu’elles fonctionnent convenablement. Dans cette optique, vous pouvez dans un premier temps explorer tous les liens internes à votre site web. Ensuite, vous pourrez extraire une liste d’URL, au sein de laquelle vous concentrerez votre attention sur celles répondant correctement.

Une fois ce résultat obtenu, extrayez l’URL canonique de chacune et comparez-la à l’URL d’origine obtenue lors de l’exploration du site. Si les deux sont identiques, tout va bien. Dans le cas contraire, assurez-vous de bien indiquer sur l’URL canonique sur la page concernée. Cette phase de vérification vous permet aussi de déterminer les éventuels cas d’erreur en ce qui concerne vos adresses canoniques. Il peut arriver que celles-ci renvoient vers des codes d’erreur. Il importe donc que vous régliez immédiatement ce problème. De même, évitez qu’une URL canonique soit attribuée à une page dont le contenu est trop différent.

Conclusion

Vous savez désormais comment mettre en place une URL canonique pour éviter le contenu dupliqué et comment les optimiser pour améliorer votre référencement.

   Article rédigé par Louis Chevant

Complétez votre lecture

Le guide complet du Maillage interne

La méthode pas à pas pour construire vos cocons sémantiques, votre maillage et l’arborescence optimale de votre site web.