Le damos todos los consejos para corregir el contenido duplicado. Esto le ayudará a deshacerse del contenido duplicado que desafortunadamente puede afectar a su SEO.

Resumen

Definición de contenido duplicado

El contenido duplicado es, por definición, el contenido que aparece por duplicado dentro del mismo sitio o de dos sitios distintos (en este caso también hablamos de plagio). En otras palabras, encontramos el mismo contenido (texto, imágenes, etc.) en 2 páginas que tienen 2 URLs muy diferentes. Se trata de un problema recurrente, especialmente entre los comerciantes electrónicos que caen rápidamente en esta trampa debido a los múltiples filtros dedicados a la experiencia del usuario.

Contenido duplicado

El contenido duplicado, también conocido como "contenido duplicado" o "DC" puede estar sujeto a una penalización algorítmica por nuestro querido Panda. A diferencia de su compañero Pingüino, Panda no penaliza todo el sitio, sino sólo las páginas duplicadas que pueden estar degradadas o incluso ausentes en los resultados de la búsqueda. Por una vez, sólo podemos aprobar los métodos del buscador. De hecho, ¿cuál sería el uso de una página de resultados con el mismo contenido?

¿Cómo se produce el contenido duplicado dentro de un sitio?

Uno podría pensar legítimamente que al ser consciente de esta regla, uno está a salvo de la duplicación de contenido.

"No copio y pego mis hojas de producto de otro sitio o de una página de mi sitio, ¡así que está bien! »

¡Ah, si fuera tan simple!

Hoy en día, con la multiplicación de los megamenúsculos y los filtros facetados, el contenido duplicado constituye una verdadera espada de Damocles sin que se note siquiera. De acuerdo con algunas estimaciones, el 29% de la web se duplicaría de esta manera!

Aquí están las causas más comunes de la duplicación de contenido:

Parámetros de URL y códigos de rastreo

Los URL y los parámetros de rastreo son una fuente frecuente de contenido duplicado. Esto puede ser un problema causado no sólo por los parámetros en sí mismos, sino también por el orden en que aparecen en la URL.

Por ejemplo:
https://exemple.com/produits/femmes/robes/vert.html se puede duplicar con
https://exemple.com/produits/femmes/?category=robesolor=vert

Además, es posible que la propia sesión de un usuario pueda generar contenido duplicado. Si el ID de sesión se crea automáticamente y es un parámetro de la URL, puede generar contenido duplicado si esa URL se utiliza en otro lugar y, por lo tanto, es rastreada por Google.
Como es muy difícil anticipar las consecuencias de los parámetros del URL, es preferible evitarlos en la medida de lo posible. En cualquier caso, las URL con parámetros suelen estar mal indexadas o mal posicionadas en Google.

Navegación facetada

Las facetas, más comúnmente llamadas filtros, son la bestia negra de los SEO. Si son bastante simples de manejar en sitios pequeños, pueden convertirse en una verdadera fábrica de gas en sitios muy grandes.

Tomemos un primer caso concreto:

- La página de la categoría Pantalones de mujer contiene 10 productos
- De estos 10 productos, 9 son rojos

Haciendo clic en el filtro "rojo", encontrará 9 productos. ¡Las páginas con y sin el filtro "rojo" por lo tanto se ven muy similares!

filtro-contenido-duplicado

Segundo caso concreto, en un sitio de repuestos para 2 ruedas:

- Los carburadores de los scooters de 10 marcas X y Y también son compatibles con los ciclomotores y motocicletas de 50cc.
- En cada categoría Scooter / Ciclomotor / Moto 50cc, si seleccionas los carburadores de la marca X y la dimensión Y, te encontrarás con los mismos productos ... y por lo tanto un bonito contenido duplicado!

En los sitios que no utilizan la reescritura de URL, este contenido duplicado puede incluso extenderse a las hojas de producto que se encuentran en varias categorías, con diferentes URL.

HTTP/HTTPS

Al migrar de HTTP a HTTPS, los casos de contenido duplicado pueden aumentar considerablemente si no se tienen en cuenta ciertos controles. Dos páginas disponibles en versiones HTTP y HTTPS son consideradas estrictamente similares por los motores de búsqueda e igualmente penalizadas.

El contenido simplemente copiado

El problema recurrente de todos los sitios de comercio electrónico se refiere a la alimentación del catálogo de productos. Algunos sitios tienen decenas de miles de productos para entrar, algunos de los cuales se distinguen sólo por el color o el tamaño. Pocos sitios tienen suficientes recursos humanos para escribir un artículo único por producto. Si Google afirma que aplica una cierta tolerancia, en la práctica nos damos cuenta de que no todas las páginas están indexadas o posicionadas.

¿Cuáles son las consecuencias del contenido duplicado?

El contenido duplicado afectará a la forma en que los motores de búsqueda indexan su contenido.

- Tendrán que elegir entre las versiones del contenido a referenciar.

- Además, los motores de búsqueda dedicarán tiempo a rastrear el mismo contenido varias veces (dependiendo del número de veces que su contenido esté duplicado) y, por lo tanto, clasificarán potencialmente peor algunos contenidos buenos.

Porque, de nuevo, los motores de búsqueda quieren ofrecer la mejor experiencia al usuario, por lo que no ofrecerán múltiples versiones del mismo contenido y elegirán la versión del contenido que consideren mejor en cada ocasión.

A lo que te arriesgas en caso de no intervenir, es a ver caer tus posiciones en los resultados de búsqueda y, por tanto, a perder tráfico. 

Google también puede eliminar algunas páginas de los resultados de búsqueda.

Finalmente, el último riesgo se refiere a su popularidad. 

En efecto, si realiza acciones de adquisición de enlaces o si recibe enlaces de forma natural, el hecho de que haya varios puntos de entrada diluirá / dispersará el valor de estos enlaces entrantes mientras que si todos estos enlaces llegaran a una sola página, su peso en términos de notoriedad y popularidad sería más importante.

Para resumir, el contenido duplicado obstaculiza el potencial de su contenido en términos de visibilidad en los motores de búsqueda y afecta negativamente a su tráfico SEO.

Pero le aseguro que hay soluciones.

¿Cómo puedo corregir o eliminar el contenido duplicado?

Detectar el contenido duplicado externo

Cuando se sospecha de plagio, hay herramientas para detectar sitios que pueden haber copiado nuestro contenido. Positeo, Plagio y Copyscape tienen versiones gratuitas. Sin embargo, rápidamente muestran sus limitaciones. Si queremos detectar contenido duplicado en masa, es necesario tomar las versiones pagadas.

Detección de contenido interno duplicado

Sólo una herramienta de rastreo puede resaltar el contenido duplicado interno de un sitio. Entre los más poderosos: Botify y Oncrawl. También hay herramientas menos poderosas para sitios pequeños, como el Analizador de Sitios o la Araña Rana Gritona en su versión gratuita.
Estas herramientas permiten ver el porcentaje de duplicación entre las páginas. Las herramientas más poderosas distinguen la duplicación de contenido puro (descripción de artículos por ejemplo) de la plantilla (que se encuentra en todas las páginas del sitio).

¿Cómo puedo comprobar si hay contenido duplicado?

Afortunadamente, hay técnicas para evitar la duplicación de contenidos que no siempre son obvias.

Evitar la duplicación de contenido gracias al atributo rel=canónico

La mejor manera de evitar la duplicación de contenido es usar el atributo rel=canónico. Este atributo se utiliza para indicar a los motores de búsqueda qué URL debe considerarse como la original. De esta manera, si los robots encuentran una página duplicada, sabrán que deben ignorarla.

El atributo rel= "canónico" se integra directamente en el encabezado HTML de la página (o "encabezado").
Es en esta forma:

Formato general :

... [código de cabecera]...

Esta etiqueta debe ser añadida en cada versión duplicada. La página original también debe contener una url canónica, que esta vez se señalará a sí misma.

Las 301 redirecciones

A veces el contenido duplicado es puntual. Por ejemplo, puede ser una página de un nuevo producto con una nueva referencia, pero cuyo contenido es idéntico a la versión antigua del producto (fuera de stock). En este caso, la etiqueta canónica no es la más juiciosa porque los motores de búsqueda seguirían rastreando la versión antigua que se ha vuelto obsoleta. Una redirección 301 evita el contenido duplicado mientras transmite la popularidad de la página antigua.

El uso de un Meta Robot Noindex

Esta es la solución menos "limpia". De hecho, un sitio bien construido no debería necesitar poner páginas en el noindex. No obstante, algunas limitaciones técnicas impiden a veces la aplicación de las mejores prácticas. La etiqueta content="noindex,follow" tiene la ventaja de poder ser añadida manualmente en cada página. Esto permite, en particular, corregir rápidamente los problemas de contenido duplicado, mientras se espera una solución más duradera.

Es lo siguiente:

... [código de cabecera]... "> "robots

Esta etiqueta permite a los robots navegar por las páginas, pero impide la indexación. Al usarlo, nos "limpiamos" de los motores de búsqueda. Es un poco como decirles: "Sé que tengo páginas duplicadas, pero prometo que no lo hago a propósito y no trato de manipular a los robots para que tengan varias páginas idénticas en las SERPs!

Un error común es prohibir la exploración de estas páginas en el robots.txt. Para que los robots vean la etiqueta de Noindex, deben ser capaces de explorarlos.

Administración de dominios y configuraciones favoritas en la consola de búsqueda de Google

La consola de búsqueda de Google le permite establecer el dominio preferido para su sitio, a la vez que especifica si Googlebot debe navegar por los múltiples parámetros de las URL de forma diferente. Dependiendo de la estructura de su sitio y del origen de su contenido duplicado, la configuración de su dominio preferido y/o la gestión de la configuración puede ser una solución útil. Este es un método que sólo funcionará para Google. No corregirá sus problemas a los ojos de Bing o de otros motores de búsqueda. Para ello, también hay que reflejar estos cambios en las herramientas para los webmasters de los otros motores de búsqueda, lo que puede ser bastante laborioso! Siempre es mejor tratar el fondo que poner una "tirita".

Cuida tu malla interna

Al desarrollar una estructura limpia y libre de contenido duplicado, es esencial mantener la consistencia en la malla interna. Cada enlace interno debe apuntar al URL canónico y no a la página duplicada. ¡Su presupuesto de arrastre será preservado!

Conclusión

Por lo tanto, la duplicación del contenido es un problema importante para todos los sitios, especialmente los de comercio electrónico. Incluso con la experiencia, a veces es difícil prever todos los posibles casos de contenido duplicado. Por eso es esencial invertir en una buena herramienta de rastreo que le permita controlar constantemente el estado de su sitio.

class="img-responsive
   Artículo escrito por Louis Chevant

Completa tu lectura

La guía completa de la malla interna

El método paso a paso para construir sus capullos semánticos, su malla y la estructura óptima de su sitio web.