Schema.org es un proyecto iniciado en común por Google, Microsoft, Yahoo y, re­cie­n­te­me­n­te, también Yandex para es­ta­n­da­ri­zar el eti­que­ta­do de datos en los códigos fuente de las páginas web. En la página web homónima del proyecto, los re­s­po­n­sa­bles ponen a di­s­po­si­ción de los we­b­ma­s­te­rs el listado completo de marcas de schema.org: un extenso vo­ca­bu­la­rio que sirve para añadir in­fo­r­ma­ción adicional en el código HTML para facilitar la co­m­pre­n­sión a los crawlers y así una in­de­xa­ción más eficiente de los co­n­te­ni­dos. Estos datos es­tru­c­tu­ra­dos  son los que co­n­s­ti­tu­yen el núcleo de la llamada web semántica, que aspira a optimizar la ex­pe­rie­n­cia del usuario en los bu­s­ca­do­res. Schema.org soporta los formatos de datos RDFa, Mi­cro­da­tos y JSON-LD.

3 razones para usar Schema.org

Para los ad­mi­ni­s­tra­do­res de páginas web, los datos es­tru­c­tu­ra­dos tienen cada vez más im­po­r­ta­n­cia. Al contrario que los usuarios, los crawlers y otros programas de in­de­xa­ción necesitan mark ups o marcas para co­m­pre­n­der se­má­n­ti­ca­me­n­te una página web, y es aquí donde estos datos es­tru­c­tu­ra­dos, al fa­ci­li­tar­les la tarea, juegan un papel fu­n­da­me­n­tal. Las ventajas que traen consigo las ano­ta­cio­nes se­má­n­ti­cas se extienden también al ámbito del po­si­cio­na­mie­n­to en bu­s­ca­do­res, porque si los co­n­te­ni­dos están eti­que­ta­dos de forma uniforme, los bu­s­ca­do­res pueden extraer la in­fo­r­ma­ción que les interesa mucho más fá­ci­l­me­n­te y usarla en las listas de re­su­l­ta­dos como "fra­g­me­n­tos en­ri­que­ci­dos" o rich snippets, que muestran más in­fo­r­ma­ción sobre la página al haber sido indexada al detalle mediante este nuevo sistema de marcado. Estos rich snippets atraen la atención del usuario mucho más rá­pi­da­me­n­te y son ela­bo­ra­dos tanto por los bu­s­ca­do­res como por las redes sociales. Para ga­ra­n­ti­zar la co­he­re­n­cia requerida para ello, usando incluso formatos di­fe­re­n­tes de datos, schema.org organiza estas etiquetas en un esquema es­ta­n­da­ri­za­do de los llamados "types" (tipos), cada uno de ellos derivado en un set es­pe­cí­fi­co de pro­pie­da­des o "pro­pe­r­ties". Para los we­b­ma­s­te­rs, esta cla­si­fi­ca­ción aporta tres ventajas fu­n­da­me­n­ta­les:

  • Es­ta­n­da­ri­za­ción: este sistema se basa en un acuerdo entre los bu­s­ca­do­res pree­mi­ne­n­tes, por lo que, al usar este eti­que­ta­do los we­b­ma­s­te­rs se están ase­gu­ra­n­do formar parte del estándar.
  • Co­m­pa­ti­bi­li­dad: derivada de una es­que­ma­ti­za­ción homogénea y de la co­m­pa­ti­bi­li­dad con los mi­cro­fo­r­ma­tos más ha­bi­tua­les como RDFa, mi­cro­da­tos y JSON-LD. Los co­n­te­ni­dos eti­que­ta­dos según el estándar de schema.org están pre­pa­ra­dos para todos los clientes web más usados.
  • Va­li­da­ción: el es­ta­ble­ci­mie­n­to de un estándar tiene la ventaja de favorecer un análisis más sencillo de errores. La he­rra­mie­n­ta gratuita de Google Stru­c­tu­red Data Testing Tool permite verificar los datos es­tru­c­tu­ra­dos ela­bo­ra­dos según este estándar.

La jerarquía de tipos según schema.org

El sistema de schema.org se ordena en un esquema de tipos y pro­pie­da­des que permite ide­n­ti­fi­car una gran variedad de temas. Mientas que los tipos definen elementos de contenido para marcarlos como ítems cla­ra­me­n­te di­fe­re­n­cia­dos, las pro­pie­da­des sirven para otorgar un de­te­r­mi­na­do valor a los tipos definidos pre­via­me­n­te. Estos tipos se organizan en un árbol es­tru­c­tu­ra­do je­rá­r­qui­ca­me­n­te que, además, fijan qué pro­pie­da­des co­rre­s­po­n­den a cada tipo.

El abanico de tipos abarca desde de­fi­ni­cio­nes generales como "thing" (cosa) a otros más es­pe­cí­fi­cos como "movie"(película). Cada tipo, sin contar con la categoría "thing", tiene uno o varios tipos-padre:

  • Thing > Crea­ti­ve­Wo­rk > Movie

El tipo "cosa" es muy general, pero el tipo "Crea­ti­ve­Wo­rk" define algo más es­pe­cí­fi­co, en este caso una actividad creativa que podría ser un libro, una fo­to­gra­fía o una película. Así, el tipo "movie" (película) es una su­b­ca­te­go­ría del tipo "Crea­ti­ve­Wo­rk", a su vez una su­b­ca­te­go­ría de “thing”. Conocer esta jerarquía es relevante en cuanto que los tipos es­pe­cí­fi­cos "heredan" ca­ra­c­te­rí­s­ti­cas de sus tipos-padre.

Un elemento eti­que­ta­do como “movie” admite las ca­ra­c­te­rí­s­ti­cas es­pe­cí­fi­cas de una película, ya que las películas tienen actores y actrices, di­re­c­to­res, un tráiler, etc.

Pero al tipo “movie” le co­rre­s­po­n­den también las pro­pie­da­des del tipo-padre “Crea­ti­ve­Wo­rk”, porque todos los trabajos ar­tí­s­ti­cos cuentan con un autor, un género y va­lo­ra­cio­nes. Y también se heredan las pro­pie­da­des del tipo-padre “thing”: nombre, de­s­cri­p­ción, URL e imagen. Todas las cua­li­da­des se pueden definir con valores in­di­vi­dua­les según el elemento.

Estos tipos y ca­ra­c­te­rí­s­ti­cas se pueden usar en los formatos RDFa, mi­cro­da­tos y JSON-LD, aunque la in­te­gra­ción de las etiquetas tiene lugar de forma diferente según el formato que se use.

La elección del formato de los datos

Una vez el webmaster ha se­le­c­cio­na­do las etiquetas, queda de­ca­n­tar­se por uno u otro formato de datos. En los si­guie­n­tes artículos se ofrece una de­s­cri­p­ción detallada de la anotación con RDFa, mi­cro­da­tos y JSON-LD sobre la base de los tipos y pro­pie­da­des es­ta­n­da­ri­za­dos por Schema.org:

Ir al menú principal