Canonical tag: conoce lo que hay detrás de las URL canónicas
Cuando los buscadores indexan el contenido de las páginas web se guían fundamentalmente por dos principios: por un lado, toda página web que tenga que incluirse en el índice debe ser capaz de responder a una consulta relevante; por el otro, el contenido de la página web debe estar disponible bajo un único localizador de recursos uniforme o URL, de lo contrario será considerado como duplicate content (contenido duplicado), lo que tiene como consecuencia que la página web no llegue a formar parte del índice o desaparezca de él. Esto supone un desafío para algunos proyectos web que ofrecen contenido idéntico en un mismo idioma bajo dominios geográficos diferentes (por ejemplo, tiendas con páginas para España, Colombia y México), puesto que, a menudo, las descripciones de los productos solo se diferencian entre sí en la divisa y en los gastos de envío. En general, para muchas tiendas online existe el riesgo de generar contenido duplicado cuando se ofrecen varias versiones de un mismo producto y la descripción solo varía en algunas palabras. Tal es el caso de los zapatos que se ofertan en varios colores.
Una posible solución para este problema es el llamado canonical tag, con el que se puede declarar una dirección URL o URI como recurso estándar para la indexación.
¿Qué es el canonical tag?
En 2009, Yahoo, Microsoft y Google introdujeron un nuevo tipo de enlace al que denominaron "canonical" (canónico) que se convertiría en una de las herramientas más importantes para el SEO y que desde 2012 es considerado un estándar web oficial en la norma RFC 6596. Como parte esencial del elemento "link", esta etiqueta se implementa en la cabecera HTML de las páginas web, es decir, en el mismo lugar en el que se encuentran el título y la descripción meta. Integrado en una página web, el canonical link remite a una dirección URL estándar o URI que hace las veces de URL canónica, sustituyendo a la página web como referente para la indexación. Por consiguiente, una canonical URL aúna su propia reputación y la de las páginas a las que hace referencia, posicionando mucho mejor y, debido a que las direcciones URL destacadas con esta etiqueta no se incorporan al índice, no surgen problemas de contenido duplicado. No obstante, esta indicación actúa solo como recomendación a los buscadores para que no tengan necesariamente que registrar el atributo "link" ni incluirlo en la valoración. Si no se implementa correctamente existe el riesgo de que se ignore la página en su totalidad, por lo que es de vital importancia prestar la debida atención a su colocación.
¿Cómo funciona el canonical tag?
Para que la etiqueta canónica funcione correctamente se requieren dos elementos: por un lado es necesaria la dirección URL exacta de la página canónica deseada que tiene que declararse como recurso estándar y por otro lado se necesita un elemento "link" en el que se incluya la etiqueta y la URL canónica. El código adecuado para ello es el siguiente:
<link rel="canonical" href="URL/URI de la página canónica">
El elemento "link", que en HTML no tiene una etiqueta de cierre, contiene, en calidad de elemento vacío, los atributos rel y href. El primero es necesario para especificar la relación entre el documento actual y el enlazado, mientras que href indica dónde se encuentra el documento enlazado. Entre comillas aparecen los valores requeridos a tales efectos: el valor rel "canonical" determina que el enlace es una dirección URL canónica que se indica a continuación en el atributo href.
La etiqueta “canonical” no solo es válida para los enlaces internos, sino que también puede remitir a dominios externos. El procedimiento no difiere en ningún aspecto, por lo que en este caso también se tiene que facilitar la URL exacta y no la dirección estándar de la página web.
Para que las páginas alternativas solo hagan referencia a los recursos estándar indicados como tales, el código debe integrarse en el encabezado de los documentos HTML correspondientes, tal y como se ha indicado anteriormente, incluso aunque el contenido no tenga formato HTML, como, por ejemplo, en el caso de los archivos PDF. En este caso se utiliza la siguiente sintaxis:
Link: <URL/URI de la página canónica>; rel="canonical"
¿Cuándo se deben usar los canonical tags?
Por definición, las etiquetas canónicas no son un factor que los buscadores tengan que incluir en su valoración obligatoriamente. La utilización de una versión concreta y representativa para el contenido que aparece en repetidas ocasiones únicamente sirve de ayuda a los crawlers de las herramientas de búsqueda, pero no se puede tener la certeza de que lo tenga en cuenta. Debido a que el código y cada URI alternativa se tienen que implementar de forma individual para cada uno de los contenidos existentes, se plantea la pregunta de si los costes, relativamente elevados, resultan rentables. A continuación, te mostramos ejemplos de situaciones en las que conviene considerar la utilización del canonical tag.
El contenido se reparte en varias direcciones URL dinámicas
Las URL dinámicas desempeñan hoy en día un papel muy importante, sobre todo en el ámbito del eCommerce. Las páginas personalizadas constituyen ciertamente una opción excelente y sencilla para presentar el mismo contenido (con ligeras variaciones) a usuarios diferentes, pero también causan problemas a los crawlers de los buscadores. Los canonical tags son, en este sentido, más que recomendables para evitar la posible clasificación de contenido duplicado.
Se puede acceder al mismo contenido con diferentes URL
En lo que respecta a la estructura, algunos proyectos web, como blogs, tiendas virtuales o guías digitales, ofrecen contenidos distribuidos simultáneamente en diferentes categorías y a menudo también en diferentes URL. Así, una tienda podría redirigir, por ejemplo, a la página general del artículo “camisa verde” bajo las siguientes direcciones URL:
- mi-tienda.shop/moda/camisa-verde
- mi-tienda.shop/modadeverano/camisa-verde
- mi-tienda.shop/modadeinvierno/camisa-verde
El hecho de que los contenidos estén disponibles bajo diferentes URL es frecuente cuando se han modificado las estructuras de una página web o se ha trasladado un dominio completo. En estos casos los redireccionamientos 301 son una buena opción pero si no se puede llevar a cabo técnicamente, entonces el elemento link rel="canonical" se erige como una buena alternativa.
El mismo contenido está disponible en dominios diferentes
Ya se ha mencionado la posibilidad de recurrir a las llamadas cross-domain canonicals. Con ellas se pueden hacer contribuciones sin problemas en otros dominios sin generar contenido duplicado. Asimismo, las señales positivas de los usuarios, los enlaces u otros factores de posicionamiento relevantes se transmiten a la dirección URL original, lo que permite mejorar el rendimiento de manera considerable.
Los contenidos tienen formatos diferentes
En algunas situaciones resulta significativo publicar contenido en diferentes formatos y no ofrecer solo, por ejemplo, un formulario en versión HTML, sino también como archivo PDF y en versión para imprimir. En este sentido se recomienda usar la etiqueta canonical para que los buscadores no tengan que evaluar cada una de las variantes por separado y al final clasifiquen la que no deben. Como ya se ha indicado, esta etiqueta debe integrarse en la sintaxis modificada de la cabecera HTTP en función del formato correspondiente.
Si dispones de un certificado SSL/TLS válido, debes convertir las direcciones URL de HTTPS en URL canónicas y hacer que las variantes no seguras (HTTP) remitan a estas. Lo mismo se puede decir para las páginas móviles o AMP, en cuyo caso los canonical tags son incluso obligatorios.
Diferencias entre canonical tag y redireccionamiento 301
A simple vista, el canonical tag se parece bastante a los redireccionamientos 301, los cuales se basan en el código de estado 301 de HTTP (Moved Permanently) que indica a los buscadores que deben evaluar diversas páginas como versión única. Asimismo, estos redireccionamientos también permiten redirigir a los visitantes a la dirección URL original, mientras que se suprime el resto de variantes. Las páginas que contienen el canonical tag son consideradas por los buscadores como copias y, por lo tanto, siempre están disponibles para los visitantes.
Otra de las diferencias estriba en el hecho de que los buscadores nunca ignoran un redireccionamiento, lo que sí puede ocurrir con el elemento "link" recomendado. Ambos métodos se diferencian, por último, en cuanto a su funcionalidad con respecto al uso de los dominios: mientras que los redireccionamientos 301 transportan una página de un dominio a otro, la etiqueta canónica señala que una página del dominio A tiene un equivalente en el dominio B.
Canonical tag: errores comunes
Una URL canónica es en muchas situaciones la mejor opción para evitar el contenido duplicado. Los buscadores más importantes tienen en cuenta el elemento canonical en la indexación y reconocen que la web no tiene intención de posicionarse de manera paralela con contenido repetido. Además, las señales positivas de los buscadores se reúnen en la URL principal, lo que mejora las opciones de posicionamiento. En este punto, no obstante, ha de hacerse hincapié en la posibilidad de que el empleo de canonical tags puede convertirse en un factor negativo si estos no se aplican correctamente. En los párrafos siguientes te mostramos los errores “canónicos” más comunes.
Las páginas numeradas remiten a una URL canónica
Para elaborar contenido atractivo, muchos webmasters recurren a la paginación. Son sobre todo los portales de noticias los que utilizan este método en el que el contenido se numera y divide en varias páginas. Si para ello se emplean las etiquetas canónicas y se hace referencia a páginas posteriores que remitan a la dirección de salida con el link-rel="canonical", se está incurriendo en un error grave, porque las siguientes páginas no serían un duplicado, sino que albergarían contenido único que no se registraría en el índice. Para informar a los buscadores sobre la paginación escogida, puedes optar por dos procedimientos:
- En cada URL se hace referencia tanto a la página anterior como a la posterior, para lo que es necesario el atributo rel y para lo que también hay que reemplazar el valor "canonical" por "prev" o "next".
- Con link-rel="canonical" se remite a una versión unilateral del contenido correspondiente que aúna todas las webs paginadas.
Las direcciones URL relativas no enlazan a la página canónica deseada
Como la mayoría de etiquetas de HTML, <link> ofrece la posibilidad de indicar direcciones URL absolutas y relativas. Mientras que las absolutas describen toda la ruta (incluido “http://”, etc.), las relativas aluden específicamente a una carpeta determinada en la página web actual sin que para ello sea necesario indicar la dirección URL completa. Así, la ruta “imágenes/imagen.jpg” indica, por ejemplo, que la imagen “imagen.jpg” está ubicada en la subcarpeta “imágenes” del directorio actual. La utilización de tales rutas al hacer uso de la etiqueta canonical tag da lugar a complicaciones, de modo que los crawlers la ignoran completamente en los casos menos favorables.
Para ello, Google emplea la siguiente sintaxis:
< link rel="canonical" href="example.com/cupcake.html" >
Debido a la ausencia del prefijo HTTP, el crawler valora la dirección “example.com/cupcake.html” como URL relativa y asume que “http://example.com/example.com/cupcake.html” es la canonical URL deseada. En el mejor de los casos es conveniente indicar la dirección completa cuando se hace uso del canonical tag o también recurrir a una URL absoluta sin dominio:
< link rel="canonical" href="/cupcake.html" />
Las páginas hacen referencia a más de una URL canónica
La naturaleza misma de las URL canónicas descarta que una subpágina pueda hacer referencia a varias páginas estándar. Estos enlaces múltiples aparecen fácilmente al trabajar con un sistema de gestión de contenidos o con un software para tiendas. A menudo, los plugins y las plantillas colocan canonical tags de manera automática, aun a pesar de haber indicado la presencia de una canonical URL. Sobre todo al utilizar este tipo de extensiones, pero también en el caso de los cambios en la estructura de las páginas, se debe verificar el texto fuente y corregir los datos si fuera necesario. De lo contrario, todo esfuerzo será en vano, ya que lo más probable es que los buscadores ignoren todos los canonical tags en lugar de decidirse por uno.
La URL canónica está incluida en el body
El elemento <link> puede integrarse en un documento HTML tantas veces como sea menester, con la condición de que se utilice para ello el <head>. Si en lugar de ello el elemento se encuentra en el <body> de la página web, dejará de tener efecto. Para evitar la aparición de problemas a la hora de procesar el código HTML (análisis sintáctico de HTML), Google recomienda que el canonical tag aparezca lo antes posible en la cabecera.
Los canonical tags no aparecen en la versión móvil
Cuando, además de la versión de escritorio, se ofrece una versión móvil de una página, puede que se tenga que hacer frente a varios errores. Asimismo, aun cuando las páginas móviles se indexan a pesar de la existencia de errores, se debe asistir a los buscadores en lo que respecta al registro y la categorización. Así, Google recomienda destacar los homólogos móviles como versión alternativa mediante el elemento rel="alternate" y que las páginas móviles remitan por canonical tag a las correspondientes URL de escritorio. En la página web de Google Developers puedes encontrar más consejos e información sobre las URL independientes.
Contradicciones entre los canonical tags y el hreflang
Los proyectos web internacionales con diferentes dominios geográficos plantean un gran reto a los especialistas en SEO. Por un lado, las páginas de todas las versiones deben lograr un buen posicionamiento y entregarse a los usuarios correctos. Por otro, se trata de reducir el riesgo del contenido doble al mínimo. Una de la herramientas más importantes a este respecto es el atributo hreflang, pues sirve de ayuda para que las versiones individuales sean consideradas como alternativas equivalentes. Para ello es necesario que las páginas siempre hagan referencia a sí mismas. Si estas URL remiten a una canonical URL por medio de un canonical tag, esto se convierte, lógicamente, en una contradicción para los crawlers de los buscadores. El resultado es que los buscadores ignoran dichas señales e indexan las páginas web en función de otras características, por lo que se debe evitar, así, el uso conjunto de ambas instrucciones.
La combinación de URL canónicas y del atributo hreflang no es el único factor que genera contradicciones negativas para el ranking de las páginas web, sino que Google también rechaza el uso compartido de canonical tags y de instrucciones como nofollow, noindex o disallow.