Aquellos que se preocupan es­pe­cia­l­me­n­te por la in­de­xa­ción de su página web en los re­su­l­ta­dos de los motores de búsqueda saben que existen numerosos factores que influyen en la lucha por los primeros puestos. Por ejemplo, la lista de elementos que afectan a la cla­si­fi­ca­ción en Google incluye más de 200 criterios, algunos de los cuales ha co­n­fi­r­ma­do el propio Matt Cutts, antiguo director del de­pa­r­ta­me­n­to contra spam de Google. Sin embargo, hay muchos otros que solo son hipótesis. No es ca­sua­li­dad que la op­ti­mi­za­ción para los motores de búsqueda sea un desafío de cada webmaster que quiere que su sitio web sea visible y accesible a largo plazo. Mientras que algunos factores como las palabras clave re­le­va­n­tes, el contenido de calidad o el diseño re­s­po­n­si­vo están en boca de todos, el valor de un buen sitemap XML a menudo se subestima.

¿Qué es un sitemap XML?

Un sitemap XML (sitemap.xml) es un archivo de texto en formato XML (Ex­te­n­si­ble Markup Language) que contiene una lista de todas las su­b­pá­gi­nas de una página web en forma de enlace. Como tal, se puede subir a la Search Console de Google o a las he­rra­mie­n­tas para We­b­ma­s­te­rs de Bing para informar a los ra­s­trea­do­res de los motores de búsqueda de todas las páginas di­s­po­ni­bles y re­le­va­n­tes y acelerar y optimizar así el proceso de in­de­xa­ción. Los sitemaps XML deben cumplir los re­qui­si­tos del protocolo Sitemaps, que fue adoptado como estándar por Google, Yahoo y Microsoft en 2006 con el objetivo de mejorar la calidad de los re­su­l­ta­dos de búsqueda a largo plazo. Por tanto, el estándar re­co­mie­n­da tanto la co­di­fi­ca­ción en UTF-8 y el me­n­cio­na­do lenguaje de marcado XML como el uso de códigos de entidad para ciertos ca­ra­c­te­res ("&gt" en lugar de ">").

Nota

Los sitemaps XML son di­fe­re­n­tes de los mapas del sitio que muchos CMS muestran au­to­má­ti­ca­me­n­te en la interfaz. Estos co­n­s­ti­tu­yen el índice del sitio web, que tiene por objeto facilitar la na­ve­ga­ción de los vi­si­ta­n­tes. Sin embargo, de forma pre­de­te­r­mi­na­da los usuarios no pueden ver los sitemaps, aunque ge­ne­ra­l­me­n­te es posible hacerlos ac­ce­si­bles a través de su URL.

Las ventajas de un sitemap XML

Aunque no hay garantía de que la in­de­xa­ción, en Google y en otros bu­s­ca­do­res, mejore siempre que se sube un sitemap XML, los di­re­c­to­rios de enlaces es­tru­c­tu­ra­dos aumentan las po­si­bi­li­da­des en cualquier caso. Un índice con todos los co­n­te­ni­dos fá­ci­l­me­n­te ac­ce­si­bles a las arañas puede ser rentable, es­pe­cia­l­me­n­te para páginas con contenido dinámico que están sujetas a cambios co­n­s­ta­n­tes. Lo mismo se aplica a proyectos web más grandes que tienen un gran número de su­b­pá­gi­nas pero ninguna es­tru­c­tu­ra de backlinks extensa (todavía). Estas páginas tienden a recibir menos visitas por parte de las arañas de los bu­s­ca­do­res, por lo que un archivo sitemap.xml puede ayudarte a que los robots rastreen estas páginas de forma más eficaz.

Otra ventaja: los sitemaps XML no solo pueden recoger los URL de las su­b­pá­gi­nas, sino también archivos mu­l­ti­me­dia como vídeos o imágenes. Para estos, hay incluso etiquetas adi­cio­na­les que indican a los robots qué tipo de contenido es (<image>, <video>). Además, se pueden utilizar atributos que describan el contenido con más detalle o que es­pe­ci­fi­quen su duración para que los motores de búsqueda puedan re­gi­s­trar­lo mejor. También existe una versión especial de sitemap XML para portales de noticias que promete una in­di­za­ción op­ti­mi­za­da de los artículos gracias a atributos es­pe­cí­fi­cos como género, fecha de pu­bli­ca­ción o título.

Consejo

Aunque el sitemap XML se puede realizar a mano, hay ge­ne­ra­do­res que lo elaboran de forma au­to­má­ti­ca, como el generador online de XML Sitemaps.com. Además, para la mayoría de los sistemas de gestión de co­n­te­ni­dos existen plugins que au­to­ma­ti­zan la creación de sitemaps XML.

Es­tru­c­tu­ra de un sitemap XML: co­m­po­ne­n­tes más im­po­r­ta­n­tes

Al igual que con cualquier documento en lenguaje de marcas ex­te­n­si­ble, el formato de un mapa del sitio funciona con etiquetas XML. Según el estándar actual "Sitemaps 0.9", hay tres etiquetas obli­ga­to­rias para poder hablar de un sitemap XML:

<urlset>, </urlset> Cada archivo de un sitemap XML debe comenzar con una etiqueta de apertura <urlset> y terminar con una etiqueta de cierre </urlset>. La etiqueta tiene la funci贸n de resumir el archivo y hace re颅fe颅re颅n颅cia al protocolo est谩ndar actual.
<url>, </url> Las etiquetas <url> de apertura y de cierre son su颅pe颅rio颅res a las entradas de URL in颅di颅vi颅dua颅les y, por lo tanto, indican el comienzo y el final de una subp谩gina de la lista.
<loc>, </loc> La etiqueta <loc> ide颅n颅ti颅fi颅ca a cada una de las p谩ginas del proyecto web o sus URL. El URL debe comenzar siempre con el protocolo (por ejemplo, "http") y terminar con una barra oblicua de cierre (si lo requiere el servidor web). Tambi茅n se define una longitud m谩xima de 2.048 ca颅ra颅c颅te颅res.

Aparte de estos atributos XML obli­ga­to­rios, hay etiquetas adi­cio­na­les como <priority>, <lastmod> y <cha­n­ge­freq> para es­pe­ci­fi­car las entradas de URL in­di­vi­dua­les. Sin embargo, el grado de co­m­pa­ti­bi­li­dad de estas etiquetas op­cio­na­les depende del motor de búsqueda co­rre­s­po­n­die­n­te. Por ejemplo, el ra­s­trea­dor de Google utiliza pri­n­ci­pa­l­me­n­te marcas <lastmod> para la in­de­xa­ción, mientras que ignora en gran medida los otros dos atributos o solo les permite fluir mí­ni­ma­me­n­te en el proceso de rastreo.

sitemap.xml: etiquetas op­cio­na­les

<lastmod>, </lastmod> Mediante la etiqueta <lastmod> se puede es颅pe颅ci颅fi颅car la fecha (formato W3C) del 煤ltimo cambio de una p谩gina. La etiqueta es in颅de颅pe颅n颅die颅n颅te de la cabecera "if modified since" que el servidor web puede devolver como parte de una respuesta HTTP 304.
<cha颅n颅ge颅freq>, </cha颅n颅ge颅freq> La etiqueta <cha颅n颅ge颅freq> pro颅po颅r颅cio颅na a los robots de los bu颅s颅ca颅do颅res in颅fo颅r颅ma颅ci贸n general sobre la fre颅cue颅n颅cia con la que se espera que se actualice una p谩gina (cada hora, cada d铆a, cada mes, etc.). Los do颅cu颅me颅n颅tos que cambian con cada acceso se marcan con el valor "siempre", los URL ar颅chi颅va颅dos con "nunca".
<priority>, </priority> Con esta etiqueta, la prioridad de un URL dentro de la p谩gina web puede ex颅pre颅sar颅se en una escala de 0,0 a 1,0 (prioridad por defecto: 0,5). De este modo, los ra颅s颅trea颅do颅res pueden conocer las p谩ginas cuya in颅de颅xa颅ci贸n es es颅pe颅cia颅l颅me颅n颅te im颅po颅r颅ta颅n颅te.

Dado que un archivo sitemap XML puede contener un máximo de 50 000 URL y no puede superar los 50 MB, los URL de páginas web más grandes también pueden re­pa­r­ti­r­se en varios do­cu­me­n­tos. Sin embargo, en este caso, cada uno de los do­cu­me­n­tos del mapa de sitio debe figurar en un archivo de índice adicional cuya es­tru­c­tu­ra no difiere en principio de la de los archivos del mapa de sitio: las etiquetas <si­te­ma­pi­n­dex> y <sitemap> deben uti­li­zar­se en lugar de <urlset> y <url>.

Nota

Es posible comprimir archivos sitemap (por ejemplo, con gzip), pero solo es re­co­me­n­da­ble para reducir los re­qui­si­tos de ancho de banda. El tamaño máximo de un sitemap no puede au­me­n­tar­se de esta forma, ya que el límite se aplica siempre a la versión de­s­co­m­pri­mi­da del archivo.

Ejemplo de sitemap XML

La forma más fácil de entender la es­tru­c­tu­ra de un sitemap XML es utilizar un ejemplo concreto:

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

En este caso, nuestro sitemap XML de ejemplo incluye el URL principal one-test.website y los URL de dos su­b­pá­gi­nas (página 1 y página 2). Los ra­s­trea­do­res de los motores de búsqueda pueden ver en el documento que el webmaster ha dado la máxima prioridad a la página principal y que los cambios se realizan apro­xi­ma­da­me­n­te una vez al mes. El último ajuste se realizó el 1 de enero de 2018. La página 1 tiene el valor de prioridad pre­de­te­r­mi­na­do (0,5) pero, a di­fe­re­n­cia de la página principal, se estima que se ajustará se­ma­na­l­me­n­te (se prevé que la última mo­di­fi­ca­ción tenga lugar el 5 de marzo de 2018). Si el robot trabaja con el atributo de prioridad del sitemap, sabe que debe prestar una menor atención a la página 2 durante la in­de­xa­ción (<prioridad> con valor 0.3). La parte inferior también se modifica se­ma­na­l­me­n­te (última mo­di­fi­ca­ción, el 8 de marzo de 2018).

Creación y envío de un sitemap XML: cómo funciona

Dada la enorme cantidad de trabajo que implica la creación manual de un mapa del sitio, la elección de plugins o de he­rra­mie­n­tas en línea es una buena opción siempre que se utilicen co­rre­c­ta­me­n­te. Los sitemaps XML pueden generarse sin co­n­fi­gu­ra­cio­nes es­pe­cí­fi­cas, pero es mejor que realices ajustes in­di­vi­dua­les para que el documento cumpla con las co­n­di­cio­nes que te interesan. A modo de ejemplo, te pre­se­n­ta­mos las po­si­bi­li­da­des que ofrece el generador en línea de XML-Sitemaps.com y el plugin de WordPress Google XML Sitemaps para la creación e in­te­gra­ción de estos do­cu­me­n­tos.

Generar sitemaps uti­li­za­n­do el generador en línea XML-Sitemaps.com

Desde 2005, el generador en línea de XML-Sitemaps.com ofrece a los usuarios una buena solución para crear sus propios sitemaps XML. El servicio web es gratuito para páginas web de hasta 500 su­b­pá­gi­nas, mientras que las páginas más grandes deben tener un plan de su­s­cri­p­ción de pago. El pro­ce­di­mie­n­to es muy sencillo: después de entrar en la apli­ca­ción web, inserta el URL de tu página web en la barra de di­re­c­cio­nes:

Utiliza el botón "Más opciones" para indicar si las entradas del sitemap deben es­pe­ci­fi­car­se mediante el atributo <lastmod>, <priority> o <cha­n­ge­freq>. La primera puede activarse o des­ac­ti­var­se, mientras que la segunda permite ajustar la fre­cue­n­cia de ac­tua­li­za­ción deseada (horaria, diaria, semanal, etc.) si se desea utilizar esta opción de eti­que­ta­do. De lo contrario, si­m­ple­me­n­te mantén el ajuste pre­de­te­r­mi­na­do "No es­pe­ci­fi­car".

Haz clic en "START" para iniciar el proceso de ge­ne­ra­ción, cuya duración depende del tamaño de tu página web. Una vez fi­na­li­za­do el proceso, podrás vi­sua­li­zar el resultado en " VIEW SITEMAP DETAILS" > " VIEW FULL XML SITEMAP".

Utiliza el botón “Descargar” para bajar el archivo generado y cargarlo en el di­re­c­to­rio raíz de tu página web. Para informar al ra­s­trea­dor de Google sobre la exi­s­te­n­cia del archivo, envíalo a la Search Console de Google (requiere una cuenta de Google y la entrada del sitio web como propiedad). También puedes es­pe­ci­fi­car la ruta en la que se puede encontrar el sitemap en cualquier parte del archivo robots.txt:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: crear sitemaps con el plugin de WordPress

Desde hace más de una década, el plugin de WordPress Google XML Sitemaps, de­sa­rro­lla­do por Arne Brachhold, ha hecho que la creación de Sitemaps XML para una página web sea un juego de niños. Para utilizar el popular plugin (que tiene más de 2 millones de in­s­ta­la­cio­nes activas en todo el mundo) en tu página web de WordPress, instálalo primero a través del centro de in­s­ta­la­ción y co­n­fi­gu­ra­ción de plugins del sistema de gestión de co­n­te­ni­dos. Se­le­c­cio­na "Plugins" en el menú, a co­n­ti­nua­ción haz clic en "Instalar" e introduce "Google XML Sitemaps" en el campo de búsqueda. Al hacer clic en "Instalar ahora" se iniciará el proceso de in­s­ta­la­ción de la extensión, que debería aparecer en la parte superior de los re­su­l­ta­dos pre­se­n­ta­dos:

Los Google XML Sitemaps también pueden de­s­ca­r­gar­se ma­nua­l­me­n­te e in­s­ta­lar­se en el di­re­c­to­rio de plugins de tu in­s­ta­la­ción de WordPress. Si activas la extensión, puedes acceder a ella a través de "XML Sitemap" en el menú "Co­n­fi­gu­ra­ción". En co­m­pa­ra­ción con XML-Sitemaps.com, hay un número si­g­ni­fi­ca­ti­va­me­n­te mayor de opciones de co­n­fi­gu­ra­ción di­s­po­ni­bles en las si­guie­n­tes siete áreas:

  • Pa­ra­me­tri­za­cio­nes generales: aquí se definen los ajustes básicos y se determina, por ejemplo, si se debe informar au­to­má­ti­ca­me­n­te a Google y a Bing sobre los cambios o si se debe comprimir el sitemap au­to­má­ti­ca­me­n­te.
  • Páginas adi­cio­na­les: en esta sección puedes añadir archivos o URL que no pe­r­te­ne­cen a la página de WordPress, pero que se ejecutan en el mismo dominio.
  • Prioridad de las co­n­tri­bu­cio­nes: los ajustes en este menú son de pa­r­ti­cu­lar interés para los blogs y portales de noticias. Si trabajas con la etiqueta <priority> en el sitemap, define en este punto si el plugin debe calcular la prioridad de un mensaje y cómo hacerlo.
  • Contenido del mapa del sitio: utiliza este menú para se­le­c­cio­nar las ca­te­go­rías de páginas que se incluirán en el sitemap XML (por ejemplo, página de inicio, páginas estáticas, páginas de archivo, etc.).
  • Elementos excluidos: si deseas excluir ca­te­go­rías o mensajes in­di­vi­dua­les de la in­de­xa­ción, puedes hacerlo aquí.
  • Fre­cue­n­cias de cambio: Google XML Sitemaps ofrece la po­si­bi­li­dad de pree­s­ta­ble­cer la etiqueta <cha­n­ge­freq>. La fre­cue­n­cia de ac­tua­li­za­ción se puede ajustar incluso por separado para los di­fe­re­n­tes tipos de página.
  • Prio­ri­da­des: a co­n­ti­nua­ción, puedes realizar los mismos ajustes para el atributo <priority>.

Una vez hayas diseñado la co­n­fi­gu­ra­ción del sitemap según tus ne­ce­si­da­des, guarda los cambios rea­li­za­dos. Si haces clic en el enlace "Su mapa de sitio" después del proceso de guardado, enviarás tu sitemap XML a los ra­s­trea­do­res de los motores de búsqueda se­le­c­cio­na­dos.

Ir al menú principal