La guía definitiva para contenido duplicado y SEO

El contenido duplicado se refiere al contenido que aparece en línea en más de un lugar. Por «lugar» nos referimos a una página con una URL única. Puede ser exactamente el mismo contenido o casi exactamente el mismo, y puede estar en el mismo sitio web o en otro sitio.

Es posible que Google no lo penalice, técnicamente, por contenido duplicado, pero puede dañar su clasificación en los motores de búsqueda. Esto se debe a que es difícil para los motores de búsqueda determinar qué ubicación del contenido es la más relevante. Como resultado, ninguna de las URL termina en una clasificación alta y ninguna página individual obtiene la mayor visibilidad de búsqueda posible.

Se supone que Google puede detectar contenido duplicado, agrupar todas las URL en un grupo y luego elegir el mejor resultado. Pero esto no siempre funciona correctamente y es posible que se elija la URL incorrecta. En última instancia, los propietarios de sitios web pueden notar clasificaciones más bajas o tráfico reducido debido al contenido duplicado. Afortunadamente, existen formas de evitar que este tipo de cosas le sucedan a sus sitios.

Por qué el contenido duplicado es un problema

El contenido duplicado afecta a los motores de búsqueda y a los propietarios de sitios de varias formas:

  • Los motores de búsqueda no saben qué URL incluir o no incluir en los índices.
  • Los motores de búsqueda no saben si las métricas de enlaces ( autoridad, confianza, etc. ) deben dirigirse todas a una página oa varias páginas.
  • No está claro qué URL clasificar en las SERP (páginas de resultados del motor de búsqueda) y, a veces, la URL no deseada puede superar a la legítima.
  • La equidad de enlace (la autoridad y el valor que una página pasa a otra) se diluye porque otros sitios que desean incluir un vínculo de retroceso al contenido tienen que elegir entre varias URL. La equidad del enlace se distribuye entre los duplicados en lugar de centrarse en una sola página.

Incluso con direcciones URL que dirijan a su sitio web, si uno tiene atributos de enlace que hacen que parezca poco amigable para los usuarios, y Google clasifica esa versión de la URL en lugar de la original, es posible que las personas no quieran hacer clic en ella. Por ejemplo, yoursite.com/besttrails parece mucho más atractivo que yoursite.com/besttrails/?utm_content=buffer&utm_medium=social . Pero si Google clasifica el segundo porque cree que es la versión principal del contenido duplicado, la gente no hará clic en él porque es intimidante y de apariencia poco confiable.

Además, el «presupuesto» de rastreo de su sitio web se agota cuando tiene contenido duplicado. Google rastrea sitios web para encontrar contenido nuevo y Google también vuelve a rastrear sitios periódicamente para ver si hay algo nuevo. Si tiene contenido duplicado en su sitio, eso significa que llevará más tiempo rastrear minuciosamente todas las páginas. Eso puede conducir a un calendario más lento para que Google indexe y vuelva a indexar páginas y las muestre en los resultados de búsqueda.

Política de contenido duplicado de Google

Según Google :

El contenido duplicado en un sitio no es motivo de acción en ese sitio a menos que parezca que la intención del contenido duplicado es ser engañoso y manipular los resultados del motor de búsqueda.

Sin embargo, aunque Google no penaliza a los propietarios de sitios web por la mayoría de los casos de contenido duplicado, la empresa continúa diciendo:

En los raros casos en los que Google perciba que se puede mostrar contenido duplicado con la intención de manipular nuestra clasificación y engañar a nuestros usuarios, también realizaremos los ajustes apropiados en la indexación y clasificación de los sitios involucrados. Como resultado, la clasificación del sitio puede verse afectada o el sitio puede eliminarse por completo del índice de Google, en cuyo caso ya no aparecerá en los resultados de búsqueda.

¿Qué podría considerar Google como una intención de engañar a los usuarios y/o manipular las clasificaciones de los motores de búsqueda? Hacer intencionalmente dominios, subdominios y páginas con contenido duplicado. Además, publicar contenido extraído , especialmente si no le agrega nada más de valor.

Sin embargo, recuerde esto: incluso si Google no lo penaliza oficialmente o considera que su contenido duplicado es malicioso, aún puede dañar sus esfuerzos de SEO. Si Google ha dejado de clasificar su sitio debido a problemas de contenido duplicado, puede enviar una solicitud de reconsideración una vez que se hayan solucionado los problemas.

Cómo ocurre el contenido duplicado

Por lo general, el propietario de un sitio web no creará deliberadamente contenido duplicado. Es por eso que Google no lo penaliza demasiado drásticamente. Esa es también la diferencia entre contenido copiado y contenido duplicado .

El contenido copiado es cuando toma la redacción exacta de otro sitio web y la publica por su cuenta. El contenido duplicado es cuando accidentalmente o sin saberlo tienes otra versión de tu propio contenido en otro lugar en línea.

Aquí, repasaremos las formas comunes en que el contenido duplicado termina en línea. Después de eso, hablaremos sobre cómo resolver el problema del contenido duplicado.

Páginas HTTP, HTTPS, WWW y no WWW

Si su sitio tiene dos versiones diferentes, www.yoursite.com y yoursite.com , por ejemplo, el mismo contenido estará en ambas versiones del sitio, lo que significa que hay contenido duplicado. Lo mismo es cierto para los sitios http:// y https:// .

Paginación

La paginación puede ocurrir cuando un artículo o la sección de comentarios de una publicación de blog abarca varias páginas. O tal vez hay una galería de imágenes con cada una en una página separada. Este tipo de duplicación también puede ocurrir en una página con desplazamiento infinito, donde el nuevo contenido se completa a medida que el usuario sigue desplazándose hacia abajo.

Variaciones de URL

Los parámetros de URL, como los códigos de seguimiento , pueden crear contenido duplicado sin querer. Por ejemplo, una página en su sitio web puede ser yoursite.com/sneakers , pero si tiene un código de seguimiento para ver desde dónde hicieron clic las personas, podría parecerse a yoursite.com/newsletter?utm_source=newsletter . Incluso si Google y otros motores de búsqueda no consideran este contenido duplicado, es posible que también deba lidiar con los parámetros separados que crean múltiples entradas en sus plataformas de análisis.

Los ID de sesión pueden tener el mismo efecto. Una sesión es un breve historial de lo que hace un visitante en un sitio web, como cuando agrega algo a su carrito de compras. La sesión permanece cuando la persona hace clic en otras páginas para que su carrito permanezca intacto. El ID de sesión es el modificador exclusivo de esa sesión y, a veces, se almacena en la URL (yoursite.com?sessionId=jow8082345hnfn8456). Esto puede crear varias URL diferentes con el mismo contenido de página.

Lo mismo puede suceder si tiene una versión para imprimir o una versión para dispositivos móviles del contenido. Los motores de búsqueda pensarán que hay varias páginas del mismo contenido. Porque hay.

Esto también es una ocurrencia común en los sitios web de comercio electrónico, particularmente cuando los usuarios filtran los resultados de búsqueda. La URL permanece prácticamente igual, pero con un apéndice al final, como el tamaño o el color. Esto se llama navegación facetada o filtrada . El contenido de las páginas es casi el mismo, pero las URL son únicas.

Incluso las barras diagonales finales pueden hacer que una URL sea única. Por ejemplo, yoursite.com/page y yoursite.com/page/ . La forma más rápida de ver si esto está causando un problema de contenido duplicado es ir a ambas versiones de una página. Si uno no carga, no tienes que preocuparte por eso. De lo contrario, la redirección es una opción (más sobre eso en un momento).

Más formas en que ocurre el contenido duplicado

  • Descripciones de productos de comercio electrónico:  Es común que diferentes sitios de comercio electrónico tengan contenido duplicado cuando se utiliza la descripción del fabricante de un producto.
  • Páginas de imágenes adjuntas: cuando cada imagen adjunta tiene una página separada, esto puede crear contenido duplicado.
  • Páginas de resultados de búsqueda: agregan un parámetro a la URL de búsqueda, como yoursite.com?q=search-term .
  • Entorno de prueba: esta es una versión duplicada de su sitio que se utiliza para la prueba.
  • Páginas de etiquetas y categorías: cuando usa una etiqueta o categoría, WordPress creará automáticamente páginas de etiquetas y categorías dedicadas. Esto a veces puede causar contenido duplicado cuando una página tiene varias categorías o etiquetas.

Cómo arreglar contenido duplicado

Dependiendo del complemento SEO de WordPress que esté utilizando, encontrará configuraciones que lo ayudarán a abordar la mayoría de los problemas menores enumerados anteriormente. Por ejemplo, en el complemento Yoast, puede deshabilitar las URL de la página de archivos adjuntos para las imágenes:

WordPress también tiene una opción integrada para desactivar la paginación de comentarios:

De lo contrario, sin embargo, las siguientes prácticas son las principales formas de resolver problemas de contenido duplicado.

1. Encuentra el contenido duplicado

Primero, debe encontrar instancias de contenido duplicado. Herramientas como Ahrefs Site Audit y Google Search Console pueden rastrear tu sitio y avisarte si hay advertencias de contenido duplicado.

Si está tratando de encontrar contenido duplicado en su sitio para una palabra clave específica, puede escribir esto en Google:

site:yoursite.com intitle: palabra clave

A continuación, verá todas las páginas de su sitio web que incluyen esa palabra clave. Una buena regla general es buscar una palabra clave específica para que sea más fácil revisar los resultados.

Si cree que hay un artículo en particular que se ha duplicado en otro lugar en línea, puede usar un verificador de plagio como Grammarly o Copyscape para encontrar otras instancias de oraciones de coincidencia exacta. O bien, puede pegar una oración completa o dos en Google para ver si aparece en otro lugar que no sea su sitio.

2. Ajustar la URL del Contenido a través de Canonicalización

Una vez que sepa que hay contenido duplicado en línea, es hora de determinar qué página es la principal que debe conservar.

Canonicalizas esa página principal para los motores de búsqueda. La canonicalización le dice a los motores de búsqueda que una URL es una versión maestra de una página, que esta página debe aparecer en los resultados de búsqueda en lugar de cualquier duplicado que pueda encontrar el motor. Aquí hay dos formas de canonicalizar el contenido:

Redirección 301

Cree una redirección 301 desde las páginas duplicadas a la página principal. Puede usar un complemento de redirección para hacer esto. Las páginas duplicadas dejarán de competir entre sí y la página principal se volverá más popular y relevante, lo que significa que comenzará a clasificarse más alto. Tenemos un artículo sobre cómo crear redirecciones con WordPress para ayudarte.

También obtiene el beneficio adicional de cualquier autoridad de página/jugo de enlace de la URL redirigida que también se transfiere al nuevo objetivo.

Atributo Rel=”canónico”

Este atributo permite que los motores de búsqueda sepan que una página es una copia de una URL y que los enlaces, las métricas y el poder de clasificación deben aplicarse a la URL principal especificada, no a la página copiada. El atributo debe incluirse en el encabezado HTML de cada página duplicada con un enlace a la página original en la que desea enfocarse. Google tiene documentación que profundiza sobre cómo agregar el atributo, y tenemos contenido más detallado sobre las URL canónicas y WordPress para complementar eso.

Para evitar el scraping de contenido, que es cuando los bots copian, descargan y vuelven a publicar el contenido de su sitio web, agregue el atributo rel=”canonical” a sus propias páginas web. El atributo será autorreferencial: apuntará a la URL en la que se encuentra actualmente. Incluso si el contenido se raspa, siempre que los bots porten el código HTML completo, su versión seguirá considerándose la original.

3. Ajuste las URL de su dominio usando la consola de búsqueda de Google

Google Search Console le permite designar el dominio preferido de su sitio web, como yoursite.com en lugar de www.yoursite.com , por ejemplo. También puede informar a Googlebot cómo manejar diferentes parámetros de URL. Esto puede solucionar algunos o todos sus problemas de contenido duplicado. Pero solo con Google. No con otros motores de búsqueda . Las plataformas como Bing y Yandex tienen sus propias herramientas para webmasters.

Más consejos para prevenir o reparar contenido duplicado

  1. Al agregar enlaces internos, use la misma versión del dominio, ya sea con o sin www , por ejemplo. También use siempre la misma versión de una página con o sin una barra diagonal. No importa qué estructura elija, pero sea coherente con ella.
  2. Si está organizando contenido sindicado , el sitio web que usa el contenido debe agregar un vínculo de retroceso al contenido original . No es una variación de la URL. Pero la URL original, principal y canónica .
  3. No publiques páginas vacías como marcadores de posición. Cada página vacía se indexará, lo que puede hacer que el motor de búsqueda piense que tienes mucho contenido duplicado.
  4. Reduzca la cantidad de contenido similar que tiene. Por ejemplo, supongamos que tiene un sitio web legal y atiende a diferentes condados en su área. Cada página específica del condado puede incluir información similar si se trata del mismo tema legal, como la ley de lesiones personales. Una opción es fusionar la página en una más grande sobre ambos condados, o puede variar más el contenido para mantener las páginas separadas.

Reflexiones finales sobre el contenido duplicado

Encontrar una pequeña cantidad de contenido duplicado no suele ser motivo de preocupación. Pero es necesario solucionar los problemas técnicos que afectan a cientos o miles de páginas. Además, no estará de más aclarar todos y cada uno de los problemas de contenido duplicado. Eso es solo parte de ejecutar un sitio despejado y de alto rendimiento. Después de todo, lo último que quieres hacer es competir contigo mismo y arruinar tu propia clasificación debido al contenido sobre el que tienes control total.

Una vez que haya resuelto el contenido duplicado, también puede consultar nuestro artículo sobre cómo manejar la canibalización de palabras clave para evitar problemas de palabras clave duplicadas.

¿Cómo se las ha arreglado para lidiar con el contenido duplicado en sus sitios? ¡Hablemos de estrategias del mundo real en los comentarios!

Imagen destacada del artículo por NikAndr / shutterstock.com