Predictive analytics: definición y ejemplos

Predecir el futuro con ayuda de métodos matemáticos: esta parece ser la intrépida ambición del modelo predictivo en un futuro próximo. Este método de análisis de datos forma parte del análisis de big data y tiene como objetivo la predicción de tendencias futuras en disciplinas como la ciencia, el marketing o en los sectores financiero o de los seguros.

El elemento más importante de lo que también se podría denominar como prediction analytics es el llamado indicador predictivo, término acuñado, por ejemplo, para designar a una persona o unidad a las que se les hace un seguimiento para poder pronosticar un comportamiento futuro. Un ejemplo concreto de ello sería un seguro que se anticipa a los posibles factores para el cálculo de riesgos del propietario de un vehículo, donde se tendrían en cuenta aspectos como la experiencia al volante, la edad o la salud de la persona en cuestión. De la suma de estos factores y, gracias al análisis predictivo, se pueden calcular los posibles riesgos de accidente, así como la cuantía de la prima del seguro.

Data mining, la base de los sondeos analíticos

En la práctica, el término predictive analytics se usa a menudo como sinónimo de minería de datos o data mining. En muchos casos, los métodos de data mining desempeñan un papel fundamental en el proceso de identificación de los enfoques de predictive analytics, metodología que precisa la funcionalidad de la minería de datos y tiene en cuenta otras técnicas. Hay otros elementos como, por ejemplo, la teoría de juegos y el aprendizaje de las máquinas, que también desempeñan un papel esencial. Asimismo, a la hora de aplicar el método del análisis predictivo también se utilizan procedimientos de análisis especiales basados en algoritmos complejos para obtener un patrón claro a partir de fragmentos de textos inconexos procedentes de entradas en las redes sociales o de artículos de blogs.

Hecho

El data mining (extracción de datos) intenta identificar patrones inherentes en grandes cantidades de datos con ayuda de métodos matemáticos y estocásticos y de algoritmos. Con los conocimientos extraídos con esta práctica se pueden leer y anticipar tendencias y posibles desarrollos.

Para poder comprender mejor la funcionalidad de las predictive analytics, cabe conocer los términos convencionales del análisis del big data o del data mining:  

  • Análisis de la regresión: se identifican las interacciones entre diversas variables dependientes e independientes. En este caso, las estimaciones dependen del precio de los productos y de la solvencia de los clientes.
  • Clustering (agrupamiento): mediante la segmentación de los datos se puede agrupar a los clientes potenciales en función de sus ingresos o de factores similares.  
  • Análisis asociativo: el objetivo es  mostrar las estructuras con aquellas variables que conduzcan a resultados idénticos. Como consecuencia, se pueden extraer conclusiones del comportamiento de los clientes así como prever compras futuras. Por ejemplo, si un cliente está interesado en zapatos, también podría comprar un zapatero.

La diferenciación de las predictive analytics

El reconocimiento de patrones en bases de datos recuerda en cierto modo al proceso de interpretación propio del cerebro humano, aunque por su complejidad los análisis del big data superan de largo su capacidad. A decir verdad, hay cierto paralelismo entre las estructuras de data mining aplicadas y las conexiones neuronales del cerebro humano, ya que la red artificial también tiene la capacidad de identificar y almacenar patrones. En consecuencia, se puede determinar que el data mining es, a nivel estructural, similar a la inteligencia artificial (AI) o al aprendizaje de las máquinas. En este sentido, los programas informáticos aprenden prácticamente de manera autónoma a partir de la base almacenada y adquieren nuevos datos de los patrones aprendidos y desarrollados.

Se puede poner de relieve, sin embargo, una diferencia importante entre el data mining y el análisis predictivo, y es que, en general, el objetivo de la minería de datos convencional es mostrar patrones estructurales en los datos y los clústeres existentes. Centrar la atención en el desarrollo prácticamente autodidacta de los cálculos que se llevan a cabo de forma progresiva en la base de datos es una característica del aprendizaje automático y desempeña un papel esencial para el modelo de análisis predictive. Los algoritmos ya existentes deben combinarse de manera autónoma a partir de las bases de datos y, además, extraer nuevas conclusiones para, de un modo independiente y por medio de predicciones poder prever, por ejemplo, el comportamiento de los clientes. El condensado de estas encuestas es lo que se conoce como Smart Customer Data.

Para mostrar este video, se requieren cookies de terceros. Puede acceder y cambiar sus ajustes de cookies aquí.

Ámbitos de aplicación de las predictive analytics

La integración del modelo predictivo ya ha demostrado su validez en los sectores más diversos. Además de las empresas de tecnología, el sector de la sanidad también utiliza este método para prever patologías. El sector de la energía, por su parte, es otro de los más populares y en él, la red eléctrica inteligente del futuro ha sido denominada como “smart grid”. En este sentido, se puede prever el consumo de electricidad con ayuda de los patrones de conducta almacenados de los clientes (Smart Customer Data) para regular el suministro de energía eólica e hidráulica con exactitud.

Otro ejemplo son las técnicas de mantenimiento predictivo (predictive maintenance), con respecto a las que se introducen los datos actuales de una máquina en funcionamiento con el objetivo de prever su utilización futura y el desgaste resultante. Así, las vulnerabilidades detectadas en la cadena de producción pueden identificarse y repararse rápidamente para, por ejemplo, evitar pérdidas en la misma.

Aplicar predictive analytics tiene sentido sobre todo cuando se dispone de muchos paquetes extensos y limpios de datos. Todos ellos se integran en el análisis, la precisión de cuyo resultado

depende de la amplitud de datos de que se dispone. La mayoría de empresas se valen de los efectos sinérgicos para incrementar su estructura de inteligencia empresarial ya existente para las funciones del prediction analytics. Entre las herramientas más populares para la utilización de predictive analytics se encuentran: 

  • Alpine Data Labs
  • Alteryx
  • Angoss KnowledgeSTUDIO
  • BIRT Analytics
  • IBM SPSS Statistics and IBM SPSS Modeler
  • KXEN Modeler
  • Mathematica
  • MATLAB

El siguiente paso en el análisis de datos se define como Prescriptive Analytics, un método empleado cuando el análisis predictivo topa con sus límites. Con este sistema se intenta leer las disposiciones con respecto al modo de actuar para encauzar la trayectoria de las tendencias. Los supuestos previstos son, dependiendo del caso, más sencillos de ejecutar y también se tiene en cuenta la redirección del desarrollo que ha tenido lugar hasta ahora. Este procedimiento es posible gracias a estructuras analíticas sobre la base de complejos modelos y de los estocásticos métodos Montecarlo. Al igual que en el análisis predictivo, la precisión de los resultados también depende de la cantidad de variables conocidas y seguras que se conocen.

En resumen

Existen numerosos ejemplos para la aplicación y funcionamiento de predictive analytics, método que está asociado con la cantidad y calidad de los datos introducidos. No obstante, los algoritmos empleados son cada vez más restrictivos, de modo que las predicciones desarrolladas son cada vez más precisas. Los análisis prescriptivos también se benefician de este desarrollo como paso posterior al análisis de datos.