Sitemap XML: todo sobre su función y cómo crearlo

Aquellos que se preocupan especialmente por la indexación de su página web en los resultados de los motores de búsqueda saben que existen numerosos factores que influyen en la lucha por los primeros puestos. Por ejemplo, la lista de elementos que afectan a la clasificación en Google incluye más de 200 criterios, algunos de los cuales ha confirmado el propio Matt Cutts, antiguo director del departamento contra spam de Google. Sin embargo, hay muchos otros que solo son hipótesis. No es casualidad que la optimización para los motores de búsqueda sea un desafío de cada webmaster que quiere que su sitio web sea visible y accesible a largo plazo. Mientras que algunos factores como las palabras clave relevantes, el contenido de calidad o el diseño responsivo están en boca de todos, el valor de un buen sitemap XML a menudo se subestima.

¿Qué es un sitemap XML?

Un sitemap XML (sitemap.xml) es un archivo de texto en formato XML (Extensible Markup Language) que contiene una lista de todas las subpáginas de una página web en forma de enlace. Como tal, se puede subir a la Search Console de Google o a las herramientas para Webmasters de Bing para informar a los rastreadores de los motores de búsqueda de todas las páginas disponibles y relevantes y acelerar y optimizar así el proceso de indexación. Los sitemaps XML deben cumplir los requisitos del protocolo Sitemaps, que fue adoptado como estándar por Google, Yahoo y Microsoft en 2006 con el objetivo de mejorar la calidad de los resultados de búsqueda a largo plazo. Por tanto, el estándar recomienda tanto la codificación en UTF-8 y el mencionado lenguaje de marcado XML como el uso de códigos de entidad para ciertos caracteres ("&gt" en lugar de ">").

Nota

Los sitemaps XML son diferentes de los mapas del sitio que muchos CMS muestran automáticamente en la interfaz. Estos constituyen el índice del sitio web, que tiene por objeto facilitar la navegación de los visitantes. Sin embargo, de forma predeterminada los usuarios no pueden ver los sitemaps, aunque generalmente es posible hacerlos accesibles a través de su URL.

Las ventajas de un sitemap XML

Aunque no hay garantía de que la indexación, en Google y en otros buscadores, mejore siempre que se sube un sitemap XML, los directorios de enlaces estructurados aumentan las posibilidades en cualquier caso. Un índice con todos los contenidos fácilmente accesibles a las arañas puede ser rentable, especialmente para páginas con contenido dinámico que están sujetas a cambios constantes. Lo mismo se aplica a proyectos web más grandes que tienen un gran número de subpáginas pero ninguna estructura de backlinks extensa (todavía). Estas páginas tienden a recibir menos visitas por parte de las arañas de los buscadores, por lo que un archivo sitemap.xml puede ayudarte a que los robots rastreen estas páginas de forma más eficaz.

Otra ventaja: los sitemaps XML no solo pueden recoger los URL de las subpáginas, sino también archivos multimedia como vídeos o imágenes. Para estos, hay incluso etiquetas adicionales que indican a los robots qué tipo de contenido es (<image>, <video>). Además, se pueden utilizar atributos que describan el contenido con más detalle o que especifiquen su duración para que los motores de búsqueda puedan registrarlo mejor. También existe una versión especial de sitemap XML para portales de noticias que promete una indización optimizada de los artículos gracias a atributos específicos como género, fecha de publicación o título.

Consejo

Aunque el sitemap XML se puede realizar a mano, hay generadores que lo elaboran de forma automática, como el generador online de XML Sitemaps.com. Además, para la mayoría de los sistemas de gestión de contenidos existen plugins que automatizan la creación de sitemaps XML.

Estructura de un sitemap XML: componentes más importantes

Al igual que con cualquier documento en lenguaje de marcas extensible, el formato de un mapa del sitio funciona con etiquetas XML. Según el estándar actual "Sitemaps 0.9", hay tres etiquetas obligatorias para poder hablar de un sitemap XML:

<urlset>, </urlset> Cada archivo de un sitemap XML debe comenzar con una etiqueta de apertura <urlset> y terminar con una etiqueta de cierre </urlset>. La etiqueta tiene la función de resumir el archivo y hace referencia al protocolo estándar actual.
<url>, </url> Las etiquetas <url> de apertura y de cierre son superiores a las entradas de URL individuales y, por lo tanto, indican el comienzo y el final de una subpágina de la lista.
<loc>, </loc> La etiqueta <loc> identifica a cada una de las páginas del proyecto web o sus URL. El URL debe comenzar siempre con el protocolo (por ejemplo, "http") y terminar con una barra oblicua de cierre (si lo requiere el servidor web). También se define una longitud máxima de 2.048 caracteres.

Aparte de estos atributos XML obligatorios, hay etiquetas adicionales como <priority>, <lastmod> y <changefreq> para especificar las entradas de URL individuales. Sin embargo, el grado de compatibilidad de estas etiquetas opcionales depende del motor de búsqueda correspondiente. Por ejemplo, el rastreador de Google utiliza principalmente marcas <lastmod> para la indexación, mientras que ignora en gran medida los otros dos atributos o solo les permite fluir mínimamente en el proceso de rastreo.

sitemap.xml: etiquetas opcionales

<lastmod>, </lastmod> Mediante la etiqueta <lastmod> se puede especificar la fecha (formato W3C) del último cambio de una página. La etiqueta es independiente de la cabecera "if modified since" que el servidor web puede devolver como parte de una respuesta HTTP 304.
<changefreq>, </changefreq> La etiqueta <changefreq> proporciona a los robots de los buscadores información general sobre la frecuencia con la que se espera que se actualice una página (cada hora, cada día, cada mes, etc.). Los documentos que cambian con cada acceso se marcan con el valor "siempre", los URL archivados con "nunca".
<priority>, </priority> Con esta etiqueta, la prioridad de un URL dentro de la página web puede expresarse en una escala de 0,0 a 1,0 (prioridad por defecto: 0,5). De este modo, los rastreadores pueden conocer las páginas cuya indexación es especialmente importante.

Dado que un archivo sitemap XML puede contener un máximo de 50 000 URL y no puede superar los 50 MB, los URL de páginas web más grandes también pueden repartirse en varios documentos. Sin embargo, en este caso, cada uno de los documentos del mapa de sitio debe figurar en un archivo de índice adicional cuya estructura no difiere en principio de la de los archivos del mapa de sitio: las etiquetas <sitemapindex> y <sitemap> deben utilizarse en lugar de <urlset> y <url>.

Nota

Es posible comprimir archivos sitemap (por ejemplo, con gzip), pero solo es recomendable para reducir los requisitos de ancho de banda. El tamaño máximo de un sitemap no puede aumentarse de esta forma, ya que el límite se aplica siempre a la versión descomprimida del archivo.

Ejemplo de sitemap XML

La forma más fácil de entender la estructura de un sitemap XML es utilizar un ejemplo concreto:

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

En este caso, nuestro sitemap XML de ejemplo incluye el URL principal one-test.website y los URL de dos subpáginas (página 1 y página 2). Los rastreadores de los motores de búsqueda pueden ver en el documento que el webmaster ha dado la máxima prioridad a la página principal y que los cambios se realizan aproximadamente una vez al mes. El último ajuste se realizó el 1 de enero de 2018. La página 1 tiene el valor de prioridad predeterminado (0,5) pero, a diferencia de la página principal, se estima que se ajustará semanalmente (se prevé que la última modificación tenga lugar el 5 de marzo de 2018). Si el robot trabaja con el atributo de prioridad del sitemap, sabe que debe prestar una menor atención a la página 2 durante la indexación (<prioridad> con valor 0.3). La parte inferior también se modifica semanalmente (última modificación, el 8 de marzo de 2018).

Creación y envío de un sitemap XML: cómo funciona

Dada la enorme cantidad de trabajo que implica la creación manual de un mapa del sitio, la elección de plugins o de herramientas en línea es una buena opción siempre que se utilicen correctamente. Los sitemaps XML pueden generarse sin configuraciones específicas, pero es mejor que realices ajustes individuales para que el documento cumpla con las condiciones que te interesan. A modo de ejemplo, te presentamos las posibilidades que ofrece el generador en línea de XML-Sitemaps.com y el plugin de WordPress Google XML Sitemaps para la creación e integración de estos documentos.

Generar sitemaps utilizando el generador en línea XML-Sitemaps.com

Desde 2005, el generador en línea de XML-Sitemaps.com ofrece a los usuarios una buena solución para crear sus propios sitemaps XML. El servicio web es gratuito para páginas web de hasta 500 subpáginas, mientras que las páginas más grandes deben tener un plan de suscripción de pago. El procedimiento es muy sencillo: después de entrar en la aplicación web, inserta el URL de tu página web en la barra de direcciones:

Utiliza el botón "Más opciones" para indicar si las entradas del sitemap deben especificarse mediante el atributo <lastmod>, <priority> o <changefreq>. La primera puede activarse o desactivarse, mientras que la segunda permite ajustar la frecuencia de actualización deseada (horaria, diaria, semanal, etc.) si se desea utilizar esta opción de etiquetado. De lo contrario, simplemente mantén el ajuste predeterminado "No especificar".

Haz clic en "START" para iniciar el proceso de generación, cuya duración depende del tamaño de tu página web. Una vez finalizado el proceso, podrás visualizar el resultado en " VIEW SITEMAP DETAILS" > " VIEW FULL XML SITEMAP".

Utiliza el botón “Descargar” para bajar el archivo generado y cargarlo en el directorio raíz de tu página web. Para informar al rastreador de Google sobre la existencia del archivo, envíalo a la Search Console de Google (requiere una cuenta de Google y la entrada del sitio web como propiedad). También puedes especificar la ruta en la que se puede encontrar el sitemap en cualquier parte del archivo robots.txt:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: crear sitemaps con el plugin de WordPress

Desde hace más de una década, el plugin de WordPress Google XML Sitemaps, desarrollado por Arne Brachhold, ha hecho que la creación de Sitemaps XML para una página web sea un juego de niños. Para utilizar el popular plugin (que tiene más de 2 millones de instalaciones activas en todo el mundo) en tu página web de WordPress, instálalo primero a través del centro de instalación y configuración de plugins del sistema de gestión de contenidos. Selecciona "Plugins" en el menú, a continuación haz clic en "Instalar" e introduce "Google XML Sitemaps" en el campo de búsqueda. Al hacer clic en "Instalar ahora" se iniciará el proceso de instalación de la extensión, que debería aparecer en la parte superior de los resultados presentados:

Los Google XML Sitemaps también pueden descargarse manualmente e instalarse en el directorio de plugins de tu instalación de WordPress. Si activas la extensión, puedes acceder a ella a través de "XML Sitemap" en el menú "Configuración". En comparación con XML-Sitemaps.com, hay un número significativamente mayor de opciones de configuración disponibles en las siguientes siete áreas:

  • Parametrizaciones generales: aquí se definen los ajustes básicos y se determina, por ejemplo, si se debe informar automáticamente a Google y a Bing sobre los cambios o si se debe comprimir el sitemap automáticamente.
  • Páginas adicionales: en esta sección puedes añadir archivos o URL que no pertenecen a la página de WordPress, pero que se ejecutan en el mismo dominio.
  • Prioridad de las contribuciones: los ajustes en este menú son de particular interés para los blogs y portales de noticias. Si trabajas con la etiqueta <priority> en el sitemap, define en este punto si el plugin debe calcular la prioridad de un mensaje y cómo hacerlo.
  • Contenido del mapa del sitio: utiliza este menú para seleccionar las categorías de páginas que se incluirán en el sitemap XML (por ejemplo, página de inicio, páginas estáticas, páginas de archivo, etc.).
  • Elementos excluidos: si deseas excluir categorías o mensajes individuales de la indexación, puedes hacerlo aquí.
  • Frecuencias de cambio: Google XML Sitemaps ofrece la posibilidad de preestablecer la etiqueta <changefreq>. La frecuencia de actualización se puede ajustar incluso por separado para los diferentes tipos de página.
  • Prioridades: a continuación, puedes realizar los mismos ajustes para el atributo <priority>.

Una vez hayas diseñado la configuración del sitemap según tus necesidades, guarda los cambios realizados. Si haces clic en el enlace "Su mapa de sitio" después del proceso de guardado, enviarás tu sitemap XML a los rastreadores de los motores de búsqueda seleccionados.

¿Le ha resultado útil este artículo?
Page top