Google Panda : le guide complet pour éviter une pénalité

Panda est le nom d’une mise à jour de l’algorithme Google destinée à réduire la prévalence des contenus de faible qualité et/ou dupliqués pour ne proposer aux utilisateurs que des contenus pertinents et uniques. Ce filtre a vu le jour alors que les fermes de contenu étaient monnaie courante et polluaient considérablement le web.

Sommaire

Comment fonctionne l’algorithme Google Panda ?
Quels sont les sites et contenus visés par Panda ?
Comment sortir d’une pénalité Panda ?
Comment savoir si mon site est sanctionné par Panda ?

Comment fonctionne l’algorithme Google Panda ?

Panda a été introduit pour la première fois le 23 février 2011. Cet algorithme est chargé d’attribuer aux pages une classification en termes de qualité, qui constitue un facteur de classement dans les SERP. Ses critères de classement sont avant tout basés sur une réflexion “humaine”. Ce site est-il digne de confiance selon vous ? Lui confieriez-vous vos coordonnées bancaires ? Son contenu est-il pertinent ? Ses publicités gênent-elles votre expérience utilisateur ? etc.

Google-panda

Amit Singhal, l’un des responsables chez Google, a même publié les 23 questions directrices sur lesquelles Panda est basé. Nous trouvons intéressant de vous les communiquer car ils permettent d’intégrer en grande partie les critères de l’algorithme :

Feriez-vous confiance aux informations présentées dans cet article?
Cet article est-il écrit par un expert ou un passionné maitrisant bien le sujet ?
Le site contient-il des articles en double ou dont la thématique est redondante ?
Effectueriez-vous sans crainte un paiement sur ce site ?
Les articles du site sont-ils bien écrits ? Comportent-ils des fautes d’orthographe, de style, de grammaire ?
Les sujets sont-ils motivés par les besoins des lecteurs ou le site génère-t-il du contenu uniquement dans l’espoir de se positionner dans les résultats de recherche ?
L’article fournit-il un contenu ou des informations inédites ?
La page offre-t-elle une valeur substantielle par rapport aux autres pages dans les résultats de recherche?
Combien de contrôles sur la qualité sont effectués ?
L’article décrit-il les deux versions d’une histoire ou est-il purement subjectif ?
Le site est-il reconnu pour sa pertinence dans sa thématique ?
Le contenu semble t-il produit en masse et/ou diffusé sur un grand nombre de sites ?
L’article a-t-il été correctement édité et mis en page ou semble-t-il bâclé ? (absence d’images, de structure, de paragraphes etc.)
Pour une requête liée à la santé, feriez-vous confiance aux informations de ce site?
Qualifieriez-vous ce site en tant que source faisant autorité ?
Cet article est-il complet ?
Cet article contient-il une analyse approfondie ou est-il superficiel ?
Recommanderiez-vous ce site et ses articles ?
Cet article comporte t-il trop d’annonces publicitaires qui nuisent à votre navigation et vous détournent du sujet initial ?
Cet article pourrait-il être facilement publié dans un magazine, une encyclopédie ou un livre ?
Les articles sont-ils trop courts et pas assez précis ?
Les pages sont-elles conçues avec soin ?
Les utilisateurs se plaindraient-ils lorsqu’ils visitent une page du site ? (lenteur, mauvaise navigation …)

Panda fonctionne aujourd’hui en utilisant l’apprentissage automatique pour deviner la manière dont les utilisateurs évaluent la qualité du contenu. Ce système ne fait guère l’unanimité auprès des référenceurs qui ont désormais de plus en plus de mal à percevoir et comprendre les attentes de Panda au fur et à mesure de son apprentissage.

Quels sont les sites et contenus visés par Panda ?

En fait, contrairement à Pingouin, tous les sites peuvent potentiellement être dans le viseur de Panda car ce dernier ne se contente plus de fliquer uniquement le contenu dupliqué. Il va bien plus loin.

Les sites au contenu “mince”

Panda traque les pages pauvres, qui comportent peu de texte et de ressources pertinentes. Aujourd’hui, on estime un minimum de 300 mots nécessaires pour espérer séduire Google. Mais cette estimation est très générale. Certains secteurs de niche se démarqueront facilement avec 300 mots, tandis que d’autres, beaucoup plus concurrentiels, auront besoin de 1000 mots et plus.

Le contenu dupliqué

Il s’agit du contenu copié d’un site à un autre qui peut ainsi apparaître plusieurs fois dans les résultats de recherche. La duplication interne est également très fréquente. Elle survient lorsque 2 pages de votre propre site sont trop similaires. Les sites e-commerces sont particulièrement touchés par ce phénomène à cause de la navigation à facettes, la pagination etc.

Le contenu de faible qualité

Panda fait aussi la guerre aux pages qui n’offrent aucune valeur ajoutée et qui semblent être écrites uniquement pour séduire les robots. Ce type de pages était omniprésent à l’époque des fermes de contenu et du SEO “facile” ! Il en reste encore quelques vestiges que Panda traque quotidiennement.

Le manque d’autorité ou de fiabilité

Connu sous le terme “Google EAT”(Expertise Authority and Trust), ce critère est aujourd’hui l’un des plus importants. Les contenus produits par des sources qui ne sont pas considérées comme fiables représentent un risque pour le positionnement du site.

Panda- Google-EAT

Le contenu généré par l’utilisateur de faible qualité

Certains sites ou blogs se contentent de publier des articles pour “remplir”. L’exemple le plus courant sont les blogs qui publient des articles courts d’invités, bourrés de fautes d’orthographe et de grammaire et manquant d’informations pertinentes.

La publicité trop intrusive

Les pages composées principalement de publicité payante plutôt que de contenu original sont sévèrement sanctionnées par Panda. Et pour cause, elles perturbent non seulement l’UX et n’apportent aucune plus-value au site. Google a publié dans son support, un guide pour l’intégration des publicités sur les pages web.

Les flux produit en affiliation

Les sites comportant des liens d’affiliation et des annonces payantes ne sont pas directement ciblés. Néanmoins, une partie d’entre eux se trouve régulièrement sanctionnée par Panda. C’est le cas des sites dont le contenu est composé quasi exclusivement de flux produit ou d’éléments d’affiliation, qui ne contribuent pas à l’enrichissement de la page.

Comment sortir d’une pénalité Panda ?

La voie à suivre pour se relever après une attaque de Panda est à la fois simple et complexe.

Si l’on considère que Panda récompense les sites dont le contenu est de haute qualité, la solution consiste donc à améliorer la qualité et l’unicité de votre contenu. Si cela n’est pas toujours chose aisée, notamment lorsque le site comporte plusieurs milliers de pages, il a été prouvé à maintes reprises que c’était exactement ce qu’il fallait pour se sortir d’une pénalité de Panda. Il y a donc un réel intérêt à prendre le temps de passer au peigne fin toutes ces pages et de les enrichir.

Supprimer les contenus de faible qualité

Il est possible de faire remonter un site dans les SERP en supprimant les contenus pauvres et de qualité médiocre qui n’ont jamais affiché de bons résultats (taux de rebond et de sortie élevé, temps passé sur la page très court). Si pour une quelconque raison vous souhaitez conserver ces contenus, il faut alors veiller à les enrichir et les nettoyer de toutes les fautes. Si cela n’est pas possible (manque de temps ou de ressources humaines), mieux vaut s’en séparer. Il est préférable de se couper le pied maintenant plutôt que la jambe plus tard.

Combattre le contenu dupliqué

Parfois, nous ne sommes pas à l’origine du contenu dupliqué. Certains blogueurs ou internautes néophytes peuvent reprendre nos contenus parce qu’ils les apprécient ou par facilité, même si cela est illégal. Pour se prémunir de ce genre de désagréments, vous pouvez désactiver le clic droit et la copie du texte, mais ce dernier reste quand même disponible dans le code source de la page. La méthode la plus pérenne reste d’intégrer une balise canonique sur chacune de vos pages. Ainsi, vous signalez à Google que le contenu “original” est le vôtre.

Toutefois, si les équipes de Google ont affirmé à maintes reprises que Panda encourage les contenus uniques, elles confirment aussi que les propriétaires de sites ne doivent pas s’arrêter à ça. Ce que Panda recherche, ce sont des informations justes qui offrent une valeur unique aux utilisateurs. On parle donc d’unicité en termes d’information et pas seulement de texte.

Selon John Mueller, webmaster trend analyst chez Google, la suppression des doublons techniques ne serait même pas prioritaire par rapport à la pertinence et à l’unicité de l’information. Dans son post, il invite à «réfléchir à ce qui rend votre site Web différent du meilleur site absolu de votre niche». Mais ne nous leurrons pas, l’idéal reste tout de même d’avoir des pages uniques ET du contenu très pertinent.

Réfléchir au nombre de mots nécessaire

Le nombre de mots est un autre aspect de Panda qui est souvent mal compris par les référenceurs, annonceurs ou blogueurs. En effet, certains sites font l’erreur d’imposer un minimum de mots sans tenir compte de l’intention de recherche et du besoin de l’internaute. En réalité, Google recommande de définir le nombre de mots que le contenu doit avoir pour répondre aux attentes de l’utilisateur. Si votre page donne simplement l’heure de Tokyo, personne ne vous demande de retracer l’historique de la ville à travers les âges ! Ecrire pour écrire n’aurait ici aucun sens. Il existe ainsi de nombreuses pages avec très peu de contenu qui sont pourtant privilégiées par Google. Bien que le nombre de mots puisse être un moyen pratique d’identifier les pages trop pauvres, il ne constitue pas un facteur déterminant pour Panda.

Améliorer la structure de son site

Techniquement, Panda se focalise uniquement sur le contenu et non sur la structure ou les performances. Ceci dit, ces deux derniers points peuvent impacter le classement général du site et ne doivent pas être ignorés. En améliorant la structure, vous pouvez par exemple corriger de grosses erreurs de contenu dupliqué, qui sont elles surveillées par Panda.

Comment savoir si mon site est sanctionné par Panda ?

Les pénalités algorithmiques sont beaucoup plus difficiles à identifier que les pénalités manuelles qui sont directement envoyées par message sur la Google Search Console. Une pénalité de Panda se traduit au début par une baisse du trafic naturel, mais cet indicateur est loin d’être suffisant car la baisse de trafic peut avoir d’autres raisons (saisonnalité, tendances …). Une comparaison avec N-1 peut vous aider à exclure d’autres pistes.

Une fois que vous vous êtes assuré que la baisse de trafic ne provient pas d’un facteur externe, il faut définir quels groupes de pages et de termes sont affectés. Vous pouvez pour cela vous aider de la Search Console ou d’autres outils de suivi de positionnement comme SeeUrank. Si la baisse de trafic est persistante et si les positions ne remontent pas, il est très probable que le site ait reçu une pénalité algorithmique.

Une pénalité de Panda peut être assez violente, notamment en cas de contenu dupliqué. Mais en principe, si vous réagissez assez vite et si votre site affiche un bon taux de crawl, vous devriez rapidement refaire surface.

Conclusion

Google Panda est un donc un algorithme plutôt sévère, qui peut pénaliser l’ensemble d’un site. Toutefois, les sites privilégiant le contenu de qualité et unique ont peu de craintes à avoir. Il peut même devenir un véritable allié dans certains secteurs qui manquent d’informations pertinentes. Pour plaire au Panda, il suffit de réfléchir à des contenus inédits et de mettre définitivement au placard la méthode encore trop présente du “rédiger pour rédiger”.