Google y la canonicalización

Canonicalización es el proceso de seleccionar la URL representativa o canónica de un contenido.


Una URL canónica es la URL de una página que Google eligió como la más representativa de un conjunto de páginas duplicadas. A menudo se llama deduplicación. Este proceso ayuda a Google a mostrar solamente una versión del contenido duplicado en sus resultados de búsqueda.


Hay muchas razones por las que un sitio puede tener contenido duplicado:

Algún contenido duplicado en un sitio es normal y no es una violación de las políticas de spam de Google.

Sin embargo, tener el mismo contenido accesible a través de muchas URLs diferentes puede ser una mala experiencia para el usuario. También puede hacer que sea más difícil realizar un seguimiento de cómo se desempeña su contenido en los resultados de búsqueda.

Cómo Google indexa y elige la URL canónica

Cuando Google indexa una página, determina el contenido principal (o pieza central) de cada página. Si Google encuentra múltiples páginas que parecen ser iguales o tienen un contenido principal muy similar, elige la página y la marca como canónica. Para ello se basa en los factores (o señales) que recopiló en el proceso de indexación y es objetivamente la más completa y útil para los usuarios. La página canónica será rastreada con más frecuencia; las duplicadas son rastreadas con menos frecuencia para reducir la carga de rastreo en los sitios.

Además de los factores que desempeñan un papel en la canonicalización, como si la página se sirve a través de HTTP o HTTPS, las redirecciones, la presencia de la URL en un mapa del sitio y demás, puede recomendarse a los motores de búsqueda, en el código HTML de las páginas, cuál de ellas es la canónica. Para ello, en el header se incluye un meta con las anotaciones de enlace rel="canonical".

<link rel=“canonical” href=”https://www.aquí_va_la_URL_canónica”/>