¿Cuáles son los problemas con los identificadores de sesión en las URLs?

Las sesiones son muy prácticas, incluso imprescindibles, en muchos casos (un seguimiento publicitario...). Sin embargo, cuando sus identificadores se utilizan en las URLs, esto plantea un problema importante.

En cada nueva visita, cuando se inicia una nueva sesión, se añade un parámetro que contiene el ID de la sesión en cada URL. El contenido del sitio no cambia, por supuesto.

Así que potencialmente obtenemos miles de URLs diferentes para el mismo contenido. En cada visita, los motores de búsqueda seguirán encontrando nuevas URLs, representando tantas duplicaciones como sea posible.

Cada vez más, los motores que no quieren llenar sus servidores con datos idénticos (el famoso "contenido duplicado") están limpiando y perdiendo lo menos tiempo posible penetrando en la arquitectura de su sitio, si no es "Google-friendly".

Una de las reglas de oro a recordar es la siguiente:

  • Un contenido = una URL (indexada)

Existen varias soluciones para superar este problema:

  • No utilizar la URL para memorizar sesiones, preferir cookies (no disponibles para los robots).
  • Evitar de crear una sesión para los motores.
  • Iniciar sesión sólo cuando su visitante (en su espacio privado, no SEO) inicia sesión y no la primera vez.
  • Modificar el comportamiento de las URLs de su sitio si se detecta un robot (camuflaje “cloaking”).

En los servidores IIS (Microsoft), el problema a veces se puede resolver directamente configurandolo correctamente. ¡Pero se requiere precaución y pruebas de antemano!

Oseox Monitoring