Duplicacion de contenido

Duplicar el contenido y referenciación

La duplicación de contenido es un verdadero problema para los motores de búsqueda. ¿Mientras que Google anunció en julio de 2008 que tenía 1000 mil millones de URLs en su índice, se imaginan este número en 2020?

¡Así que Google no indexa todas las URL que encuentra, simplemente porque mucho contenido no es de interés (página vacía) o simplemente está duplicado! 

Cuando se trabaja con un volumen tan grande de datos y se tienen que ofrecer resultados relevantes a todo el mundo en menos de medio segundo, se comprenderá que la caza del desperdicio es más que necesaria.

¿Cómo los motores de búsqueda tratan de la duplicación de contenidos?

La duplicación de contenidos es una pérdida de tiempo, recursos, relevancia y, en última instancia, de dinero para los motores de búsqueda. Además, el tamaño de la red sigue creciendo y esto cada vez más rápido. Para sobrevivir y no agobiarse, los motores tienen que tomar decisiones y dejar de lado el contenido considerado como duplicado.

Este contenido duplicado puede ser sometido a varios tratamientos diferentes:

  • Quitarlo del índice.
  • Arrastrarlo con menos frecuencia.
  • Estar desclasificado.

Por supuesto, este tratamiento difiere de un motor a otro y depende de varios factores.

Tomando en cuenta las consecuencias, se podría imaginar que los motores deben asegurarse de haber visto la copia original antes de penalizar... En realidad, no es realmente el caso, ya que sus algoritmos aún parecen ser incapaces de manejar este problema perfectamente. He aquí algunos criterios que tienen en cuenta (o deberían tener en cuenta):

  • Similitud del contenido con otra URL.
  • La popularidad de la página.
  • Autoridad del sitio.
  • Presencia de un enlace con la fuente.
  • Fecha de publicación.
  • Fecha de la primera indexación.

Sanción general por duplicación de contenido

Más allá de las penalizaciones que pueden tocar una URL, si se le da a un sitio un nivel de contenido duplicado muy alto, todo el dominio puede estar penalizado.

Los diferentes tipos de contenido duplicado

Se pueden distinguir dos casos de duplicación de contenido:

  • Autoduplicación de contenido: Cuando un sitio duplica sus propias páginas en su propio dominio.
  • Duplicación de contenido externo: Cuando su contenido está presente en otro sitio.

¿Cómo evitar la duplicación de contenido en su sitio?

Antes de irse de guerra contra el contenido duplicado por webmasters sin escrúpulos, debe asegurarse de que su sitio no ofrece contenido idéntico bajo diferentes URL. Estos son los casos más comunes:

  • Contenido accesible con y sin www.
  • Diferentes enlaces internos con el mismo contenido.
  • Páginas con muy poco contenido: Por ejemplo, una sola línea de contenido original.
  • Enlaces entrantes que contienen parámetros (por ejemplo, parámetros de rastreo).
  • Creación de sesiones por los robots.

La regla de oro es que un documento sólo debe mostrarse bajo una y sólo una URL. Sin embargo, esto no siempre es posible. En este caso, se deben poner en marcha mecanismos para que los robots puedan indexar sólo una URL. 

Aquí hay varias soluciones:

  • Usando el archivo robots.txt.
  • Implementación de un meta robot noindex.
  • Despliegue de redireccionamiento 301.
  • Eliminación de URL a través de la Google Search Console.
  • Marcado meta-canónico.

Cazar el contenido duplicado o robado

El uso de su contenido en otros sitios puede tener un impacto negativo en su visibilidad en los motores de búsqueda. Los webmasters que actúan de esta manera a veces actúan de buena fe y no se imaginan los problemas que puede suponer esto. Para otros, el robo de contenidos es un verdadero negocio. Hoy en día, es posible utilizar la palabra “agregador” para ocultar sus delitos... 

El número de inserciones de Adsense es a menudo una manera de diferenciar al hombre honesto del saqueador.

El uso masivo del formato RSS es para algunos como una autorización para robar contenido. 

Google es una excelente herramienta para detectar el plagio o cualquier otro uso de su contenido sin autorización. Escriba entre comillas una frase sacada del corazón de su artículo y consulte los resultados.

El sitio copyscape.com es también una excelente manera de asegurarse de la originalidad de un texto.

El discurso de Google sobre la duplicación de contenido

En primer lugar, es importante saber que Google no está hablando realmente de una penalización por duplicación de contenido, sino más bien de filtros. Personalmente, admito que no veo ninguna diferencia al final... También anuncia que tiene algoritmos eficientes capaces de localizar el contenido original, especialmente si la copia contiene un enlace hacia la fuente. Su índice prueba que todo esto está aún lejos de quedar perfecto.

Además, la noción de un índice complementario ha desaparecido de las páginas de resultados.

Google también aconseja no preocuparse demasiado por el contenido duplicado. A cada uno su forma de trabajar…

 

Próximo : Tecnica

Anterior : Imagen

Oseox Monitoring