El análisis de sentimiento se basa en la evaluación automatizada de los comentarios de los usuarios para determinar si un texto se ha escrito con una intención positiva o negativa. Para ello, se usa la minería de textos, es decir, el análisis automático de textos escritos en lenguaje natural.
Primer contratiempo: el lenguaje natural no está compuesto de listas con elementos positivos y negativos. Los métodos de análisis más sencillos buscan en el texto palabras que tengan un significado positivo o negativo de acuerdo con un diccionario adecuado según el tema y que ha sido creado previamente. Este método nos permite hacernos una buena idea general, pero no parece muy útil para analizar el ambiente imperante real. Ni siquiera es realmente determinante la frecuencia con la que aparecen ciertas palabras consideradas positivas o negativas en relación con la evaluación subjetiva de un producto.
Veamos dos evaluaciones de clientes como ejemplo: “¡Me quedé impresionado!” y “Está bien, cumple su función.”. La primera oración incluye una palabra positiva: impresionar, mientras que la segunda incluye dos, bien y cumplir.
Un análisis simple, basado en métodos estadísticos, calificaría la segunda oración como más positiva, sin embargo, una persona real la calificaría, como mucho, de mediocre o incluso, negativa. Es por ello, que un análisis de sentimiento fiable requiere el uso de herramientas de inteligencia artificial.
A todo esto, hay que sumar que los consumidores normalmente expresan sus opiniones en redes sociales como si estuvieran hablando con un amigo y no siempre siguen las normas gramaticales y ortográficas vigentes. Muchas oraciones tienen un significado totalmente distinto si tenemos en cuenta el texto entero que si las evaluamos de manera aislada. Uno de los mayores desafíos de las herramientas de análisis radica justamente en detectar esos matices. También cabe tener en cuenta que existen las tendencias pasajeras, sobre todo en el lenguaje juvenil.
Por tanto, una herramienta de análisis de sentimiento debe reconocer de forma precisa el público objetivo y el entorno del producto que se está analizando. En este contexto, son muy útiles los métodos del aprendizaje automático, que permiten ir entrenando a las herramientas poco a poco para mejorar la calidad de los resultados a largo plazo.