Durante muchos años la lucha por conseguir las mejores po­si­cio­nes en los re­su­l­ta­dos de búsqueda de Google y compañía se ha basado en incluir tantas palabras clave como fuera posible en los diversos textos de una página web. Sin embargo, esta técnica ya no es co­n­ve­nie­n­te y pueden pe­na­li­zar­se por malas prácticas SEO. Ya sea en la página de inicio o en una subpágina, en fichas de producto o en ca­te­go­rías: el contenido exclusivo y relevante que aporta in­fo­r­ma­ción útil e in­te­re­sa­n­te para los usuarios sienta las bases para de­s­ba­n­car­se de la co­m­pe­te­n­cia y lograr cla­si­fi­ca­cio­nes en la primera página de los re­su­l­ta­dos de búsquedas. Un término que se utiliza cada vez más en este contexto es el llamado análisis o fórmula WDF*IDF.

¿Qué es WDF*IDF?

WDF*IDF es un método de análisis que se puede utilizar en el campo de la op­ti­mi­za­ción en motores de búsqueda para de­te­r­mi­nar palabras clave y términos que aumentan de forma so­s­te­ni­ble la re­le­va­n­cia de los textos pu­bli­ca­dos y, por tanto, de toda la página web. Es una fórmula en la que los dos valores WDF (Within Document Frequency) e IDF (Inverse Document Frequency) se mu­l­ti­pli­can entre sí. El resultado es la fre­cue­n­cia relativa del término (también "po­n­de­ra­ción del término") de un documento en relación con todos los demás do­cu­me­n­tos web, que también contienen la palabra clave co­n­si­de­ra­da en el análisis. Antes de poder llevar a cabo el análisis WDF*IDF, se deben de­te­r­mi­nar los dos factores me­n­cio­na­dos.

De­te­r­mi­nar el valor Within Document Frequency (WDF)

El valor Within Document Frequency describe la fre­cue­n­cia con la que un de­te­r­mi­na­do término aparece en un documento en co­m­pa­ra­ción con todos los demás términos que contiene el texto completo. Para aumentar el si­g­ni­fi­ca­do del valor de­te­r­mi­na­do, la fórmula se basa en un logaritmo que evita que se so­bre­po­n­ga el término central. El término se mencionó por primera vez en 1992 en el trabajo de Donna Harman y en su artículo "Al­go­ri­t­mos de Ranking" lo describe entre otras cosas como una po­si­bi­li­dad de dar a las palabras de un documento un de­te­r­mi­na­do valor de po­n­de­ra­ción uti­li­za­ble para la ciencia de la in­fo­r­ma­ción. En la op­ti­mi­za­ción de páginas web, el valor WDF se utiliza desde hace tiempo como al­te­r­na­ti­va al valor de la densidad de palabras clave, que es menos flexible y solo re­pre­se­n­ta la fre­cue­n­cia relativa de una palabra clave.

La fórmula para de­te­r­mi­nar el valor Within Document Fre­c­que­n­cy es la siguiente:

Los co­m­po­ne­n­tes in­di­vi­dua­les de la ecuación se pueden explicar de la siguiente manera:

i Período de validez para el que se debe de­te­r­mi­nar la fre­cue­n­cia de do­cu­me­n­tos internos
j Documento que analizar
Lj Número total de palabras en el documento "j"
Freq(i,j) Fre­cue­n­cia de una palabra "i" en el documento "j"
log2 Logaritmo del número x a la base 2

El valor WDF para un término "i" en el documento "j" se determina sumando la fre­cue­n­cia del término a "1" y di­vi­dié­n­do­lo por el número total de palabras de este documento. El logaritmo " log2" se aplica a ambos valores, lo que garantiza que se obtienen re­su­l­ta­dos más si­g­ni­fi­ca­ti­vos para la re­le­va­n­cia del término que cuando se determina la densidad de palabras clave pura o la fre­cue­n­cia relativa. Un ejemplo ilu­s­tra­ti­vo para entender mejor esta fórmula:

Un término examinado que aparece 50 veces en un documento de 1000 palabras tiene un valor WDF de 0,57. En este caso, la fre­cue­n­cia relativa es del 5 %. Si aumenta la fre­cue­n­cia del término a 500, por ejemplo, por razones de op­ti­mi­za­ción, obtendrá un valor WDF de 0,9 (re­do­n­dea­do), un valor que es apro­xi­ma­da­me­n­te 1,5 veces superior al del texto original. Si, por otro lado, se utiliza como base el valor relativo, que ha subido hasta el 50 %, el aumento es 10 veces mayor que el valor original.

De­te­r­mi­nar el valor Inverse Document Frequency (IDF)

El valor Inverse Document Frequency (IDF) es un valor que mide el si­g­ni­fi­ca­do de un término no por su fre­cue­n­cia en un documento de­te­r­mi­na­do, sino por su di­s­tri­bu­ción y uso en el cuerpo del texto: cuanto mayor sea el potencial de un término, mayor será el IDF. El caso ideal es que un término aparezca con mucha fre­cue­n­cia en unos pocos do­cu­me­n­tos. Las palabras que aparecen en casi todos los do­cu­me­n­tos o en casi ninguno, son las que menos im­po­r­ta­n­cia tienen. Por ejemplo, la palabra "Aviso legal" alcanza un valor IDF muy bajo porque se utiliza en casi todas las páginas web.

Para calcular el valor Inverse Document Frequency, se requiere la siguiente fórmula, que también utiliza un logaritmo para regular los re­su­l­ta­dos:

Los co­m­po­ne­n­tes in­di­vi­dua­les de la ecuación se pueden explicar de la siguiente manera:

i Término para el que se debe definir el IDF
log Logaritmo del número x a la base 10 o a cualquier base b
ND Número de todos los do­cu­me­n­tos en el corpus de do­cu­me­n­tos (que contiene términos re­le­va­n­tes)
fi Número de todos los do­cu­me­n­tos que contienen el término i

Para de­te­r­mi­nar el valor IDF de un término "i", el número total de todos los do­cu­me­n­tos co­n­te­ni­dos (y re­le­va­n­tes) en el corpus se divide por el número de do­cu­me­n­tos que contienen el término y, a co­n­ti­nua­ción, se añade el número 1 y se toma el logaritmo "log" del resultado de este cálculo.

¿Cómo se calcula el número de todos los do­cu­me­n­tos re­le­va­n­tes en el corpus?

Con ND la fórmula del valor Inverse Document Frequency contiene un co­m­po­ne­n­te que no puede de­te­r­mi­nar­se de manera uniforme. Es más bien el resultado de la fre­cue­n­cia de todas las palabras si­g­ni­fi­ca­ti­vas en el documento examinado, así como del número de do­cu­me­n­tos. Sin embargo, cuando se analizan do­cu­me­n­tos web para fines SEO, el número total potencial es enorme, ya que entran en juego todas las páginas indexadas por Google (u otros motores de búsqueda). Para obtener un valor concreto, se determina y se suma el número de re­su­l­ta­dos de búsqueda de todos los términos re­le­va­n­tes del documento. Por ejemplo, en un documento muy si­m­pli­fi­ca­do que solo contenga las dos palabras "op­ti­mi­za­ción para los motores de búsqueda" (10.100.000 re­su­l­ta­dos de búsqueda, julio de 2018) y "he­rra­mie­n­tas para realizar páginas web" (28.900.000 re­su­l­ta­dos de búsqueda, julio de 2018), ND tiene el valor 39.000.000.

WDF*IDF: la co­m­bi­na­ción de ambas fórmulas

Dado que el WDF re­pre­se­n­ta la re­le­va­n­cia de un término dentro de un documento en pa­r­ti­cu­lar y el IDF puede reflejar el papel de un término en relación con todos los do­cu­me­n­tos de un corpus, la co­m­bi­na­ción de ambos valores pro­po­r­cio­na una visión profunda de la fre­cue­n­cia real del término y el potencial de la palabra co­rre­s­po­n­die­n­te para optimizar el contenido de texto existente. Para este propósito, solo es necesario mu­l­ti­pli­car ambos valores entre sí, lo que resulta en la siguiente fórmula global para el análisis WDF*IDF y la de­te­r­mi­na­ción de una fre­cue­n­cia de término que sea lo más exacta y uti­li­za­ble posible:

En principio, todos los co­m­po­ne­n­tes im­po­r­ta­n­tes se combinan para de­te­r­mi­nar el valor de los términos uti­li­za­dos en los textos web. Por supuesto, cuanto mayor sea la base de datos, más si­g­ni­fi­ca­ti­vos serán los re­su­l­ta­dos. Para que el análisis WDF*IDF sea realmente útil para la op­ti­mi­za­ción en los motores de búsqueda, debe rea­li­zar­se para todas las palabras si­g­ni­fi­ca­ti­vas dentro de un documento. Realizar este proceso de forma manual re­que­ri­ría demasiado esfuerzo, por lo que es in­di­s­pe­n­sa­ble utilizar he­rra­mie­n­tas de análisis WDF*IDF apro­pia­das para calcular la po­n­de­ra­ción del término. Estos programas (véanse más abajo) te ayudarán a analizar los textos de forma rápida y eficiente. Por otra parte, también pro­po­r­cio­nan in­fo­r­ma­ción sobre los términos de los que carece un documento para que sea lo más único y relevante posible.

Co­n­clu­sión

La fre­cue­n­cia de un término "i" en el documento "j" puede de­te­r­mi­nar­se mu­l­ti­pli­ca­n­do el WDF del término "i" en el documento "j" por IDF del término "i" en todo el corpus del documento.

Las ventajas del análisis WDF*IDF para la op­ti­mi­za­ción en los motores de búsqueda

Las ventajas de un análisis completo WDF*IDF son evidentes: los valores obtenidos para la po­n­de­ra­ción de los términos centrales sirven como puntos de re­fe­re­n­cia perfectos para componer textos de manera que:

  • tengan una gran re­le­va­n­cia para los motores de búsqueda,
  • se cubran áreas temáticas de baja co­m­pe­te­n­cia,
  • no haya ninguna palabra clave spam,
  • y sean tan únicos como sea posible.

Si no estás sa­ti­s­fe­cho con el ranking de tus páginas web y estás tratando de op­ti­mi­zar­las, tienes aliados poderosos con los valores WDF*IDF. Sobre la base de los datos de análisis, los re­da­c­to­res pueden recibir di­re­c­tri­ces muy es­pe­cí­fi­cas para revisar el contenido, que van más allá de aumentar la densidad de palabras clave o a in­co­r­po­rar otras palabras clave en el texto.

Nota

Aunque un análisis WDF*IDF es si­g­ni­fi­ca­ti­vo, nunca debes olvidar que el contenido está escrito pri­n­ci­pa­l­me­n­te para los lectores, no para los motores de búsqueda. Dado que estos últimos también están mejorando cada vez más la co­m­pre­n­sión semántica de textos, no hay forma de evitar que las palabras clave jueguen un papel cada vez menos im­po­r­ta­n­te a largo plazo, mientras que la calidad de los textos está ad­qui­rie­n­do cada vez una mayor im­po­r­ta­n­cia.

¿Cuáles son las de­bi­li­da­des del análisis WDF*IDF?

Aunque el valor WDF*IDF pro­po­r­cio­na in­fo­r­ma­ción muy valiosa para la op­ti­mi­za­ción de la página web, todavía hay algunos puntos que deben co­n­si­de­rar­se antes del análisis y la posterior eva­lua­ción de los re­su­l­ta­dos. Un problema básico es que un análisis WDF*IDF siempre incluye todos los elementos de texto de un documento, in­de­pe­n­die­n­te­me­n­te de si se trata de titulares, de­s­cri­p­cio­nes de ca­te­go­rías, productos o leyendas de imágenes. Los co­m­po­ne­n­tes in­di­vi­dua­les no se di­fe­re­n­cian. Si un de­te­r­mi­na­do párrafo contiene de­ma­sia­das palabras clave o muy pocos términos ele­me­n­ta­les, el método de análisis no pro­po­r­cio­na una respuesta sa­ti­s­fa­c­to­ria, ya que la po­n­de­ra­ción de fre­cue­n­cia se evalúa siempre para todo el documento.

Consejo

Antes de co­n­si­de­rar un análisis WDF*IDF para tu página web propia, debes comprobar cui­da­do­sa­me­n­te si el contenido es adecuado para el pro­ce­di­mie­n­to de análisis de fre­cue­n­cia de términos. Además, los re­su­l­ta­dos obtenidos deben ser revisados exhau­s­ti­va­me­n­te para evitar posibles co­n­clu­sio­nes erróneas, por ejemplo, debido a una base de datos demasiado pequeña.

Otra debilidad de la fórmula WDF*IDF es que solo es realmente útil si el volumen de palabras es muy alto. Para pasajes de texto más cortos, como de­s­cri­p­cio­nes de productos, entradas de blog más pequeñas o artículos de noticias, el análisis no pro­po­r­cio­na re­su­l­ta­dos si­g­ni­fi­ca­ti­vos y útiles, por lo que a menudo no es adecuado para ciertos proyectos web como tiendas online o portales de noticias. Para páginas web como esta última, basadas en el trabajo editorial, la de­s­ve­n­ta­ja es que el análisis WDF*IDF es difícil de integrar en el proceso de trabajo. Dado que los tiempos de respuesta rápidos y la ac­tua­li­dad de las noticias son pa­r­ti­cu­la­r­me­n­te im­po­r­ta­n­tes en este caso, solo sería viable  una op­ti­mi­za­ción posterior de los textos pu­bli­ca­dos, tarea que re­su­l­ta­ría muy compleja.

Ventajas y de­s­ve­n­ta­jas del análisis WDF*IDF en un resumen tabular

Ventajas del análisis WDF*IDF De­s­ve­n­ta­jas del análisis WDF*IDF
Pro­po­r­cio­na una gran opo­r­tu­ni­dad para descubrir las posibles palabras clave spam en los textos Examina siempre el contenido del texto completo de un documento
Destaca la im­po­r­ta­n­cia y la si­n­gu­la­ri­dad como criterios decisivos para la po­n­de­ra­ción de fre­cue­n­cias No pro­po­r­cio­na in­fo­r­ma­ción sobre párrafos o pasajes es­pe­cia­les que puedan necesitar op­ti­mi­za­ción
Califica los términos con menor co­m­pe­te­n­cia mejor que aquellos muy di­spu­tados No apto para textos cortos con pocas palabras
Combina las di­s­ci­pli­nas de análisis de do­cu­me­n­tos es­pe­cí­fi­cos y de análisis de do­cu­me­n­tos cruzados Difícil de cla­si­fi­car en los procesos de trabajo en los que se requiere pu­n­tua­li­dad y capacidad de respuesta
Utiliza lo­ga­ri­t­mos para lograr re­su­l­ta­dos más si­g­ni­fi­ca­ti­vos Es difícil de­te­r­mi­nar el número exacto de todos los do­cu­me­n­tos pe­r­ti­ne­n­tes

¿Qué he­rra­mie­n­tas WDF*IDF están di­s­po­ni­bles?

Existen varias he­rra­mie­n­tas que pueden uti­li­zar­se para realizar un análisis WDF*IDF. Hay que hacer una di­s­ti­n­ción fu­n­da­me­n­tal entre las apli­ca­cio­nes que forman parte ex­clu­si­va­me­n­te de una suite de SEO y las que también están di­s­po­ni­bles como so­lu­cio­nes in­de­pe­n­die­n­tes. Para pro­po­r­cio­nar­te una visión general de la variedad de apli­ca­cio­nes, hemos re­co­pi­la­do algunas de las mejores he­rra­mie­n­tas WDF*IDF en la siguiente lista:

  • OnpageDoc: si deseas analizar y optimizar el estado SEO de tu página web, OnpageDoc, el paquete completo de SAC Solutions GmbH de Colonia, te pro­po­r­cio­na todas las he­rra­mie­n­tas ne­ce­sa­rias. Al escoger una su­s­cri­p­ción mensual, tendrás di­s­po­ni­bles varias funciones para comprobar y mejorar palabras clave, meta tags, backlinks y aspectos similares. Esta solución SEO también incluye una he­rra­mie­n­ta WDF*IDF para el análisis de po­n­de­ra­ción pro­gra­ma­da y de co­m­pa­ra­ción co­m­pe­ti­ti­va dirigida. Si no deseas acceder a la suite completa, también puedes utilizar la he­rra­mie­n­ta de forma gratuita en wdfidf-tool.com. Sin embargo, el número de consultas posibles está limitado a 100 por hora (para todos los usuarios en total).
  • SEOlyze: los análisis se­má­n­ti­cos y las búsquedas basadas en el principio WDF*IDF también se pueden realizar fá­ci­l­me­n­te con el módulo de análisis de contenido de pago de SEOlyze. Este producto, de la empresa austriaca Helminger GmbH, se centra en las po­si­bi­li­da­des de pe­r­fe­c­cio­nar el contenido de una página web y ofrece diversas he­rra­mie­n­tas para ello, como por ejemplo, un cue­s­tio­na­rio de preguntas en W para la in­ve­s­ti­ga­ción de objetivos, un ve­ri­fi­ca­dor de contenido duplicado o análisis de le­gi­bi­li­dad. Entre sus diversas he­rra­mie­n­tas, en­co­n­tra­rás también una función muy completa de análisis WDF*IDF, cuyos re­su­l­ta­dos pueden im­ple­me­n­tar­se di­re­c­ta­me­n­te en la interfaz de SEOlyze gracias al editor integrado. Además de la he­rra­mie­n­ta WDF*IDF, la suite SEO incluye varias ca­ra­c­te­rí­s­ti­cas de se­gui­mie­n­to de rankings y varias otras he­rra­mie­n­tas para la op­ti­mi­za­ción general de una página (análisis de palabras clave, metadatos, imágenes, enlaces, etc.).
     
  • XOVI: XOVI GmbH, con sede en Colonia, que forma parte de la compañía de software global Plesk desde 2017, ofrece a sus clientes una suite SEO que no tiene nada que envidiar a otras so­lu­cio­nes del mercado. El kit de he­rra­mie­n­tas de XOVI, que está di­s­po­ni­ble en tres modelos de su­s­cri­p­ción di­fe­re­n­tes (Pro, Business y En­te­r­pri­se), incluye he­rra­mie­n­tas para realizar se­gui­mie­n­to de anuncios, tráfico, palabras clave, backlinks y posts en redes sociales. XOVI Te­x­tO­p­ti­mi­zer también incluye una he­rra­mie­n­ta de texto WDF*IDF que no solo calcula la re­le­va­n­cia de los términos uti­li­za­dos y sugiere otros términos basados en las primeras diez páginas de re­su­l­ta­dos de búsqueda de Google, sino que también permite la edición directa.
     
  • Seobility: La empresa Seobility GmbH de Núremberg ofrece varias he­rra­mie­n­tas SEO de uso gratuito en su página web: entre ellas, una simple he­rra­mie­n­ta WDF*IDF. La apli­ca­ción web permite analizar la po­n­de­ra­ción de un término en base a la fórmula WDF*IDF. Además, la he­rra­mie­n­ta analiza otros valores (in­clu­ye­n­do el valor de fre­cue­n­cia) que coinciden con la palabra buscada. El acceso al programa Seobility está limitado a cinco usos por día y usuario. Los usuarios que crean una cuenta pueden realizar ajustes de búsqueda avanzada y, por ejemplo, ajustar la base del logaritmo, aumentar el número de re­su­l­ta­dos de búsqueda para analizar o se­le­c­cio­nar la pla­ta­fo­r­ma (es­cri­to­rio/móvil) para la que se requiere op­ti­mi­za­ción.
QAfNI6xhSRE.jpg Para mostrar este video, se requieren cookies de terceros. Puede acceder y cambiar sus ajustes de cookies aquí.
Ir al menú principal