Big data: cómo se usan los datos que generamos

Desde hace algún tiempo, el big data es un tema controvertido. Mientras que sus defensores remarcan la gran utilidad de los datos masivos en diferentes ámbitos, sus detractores manifiestan dudas al respecto de la protección de la intimidad de las personas. Las polémicas declaraciones de Edward Snowden a propósito de las prácticas de espionaje y vigilancia llevadas a cabo a nivel global no han hecho más que avivar el fuego de la desconfianza general sobre la protección de los datos personales de los ciudadanos. En este ambiente general de suspicacia, todo lo que gira alrededor del big data viene cargado de connotaciones negativas aunque, en realidad, este aspecto es solo una parte de la definición de este concepto.

¿Qué es el big data?

Con este término, o con su equivalente en español “datos masivos”, se designa a un volumen de datos tan complejo que no puede ser procesado con ningún tipo de software y hardware tradicional. En sí, es un concepto neutro, ya que también puede referirse a una cantidad inabarcable de datos procedente de la investigación. Sin embargo, y dado que los datos recopilados pueden ser de carácter personal (hábitos de comunicación o de consumo de los usuarios), el término ha acabado por adquirir un tono negativo. Sus detractores ven en la recolección de datos y, en especial, en su evaluación, una clara agresión a los derechos personales.

¿Qué tamaño tiene el big data?

El concepto de big data no se refiere a una cantidad determinada de datos, ya que no hay ninguna limitación definida a partir de la cual los datos masivos pasen a considerarse big data. En la práctica, el término es sinónimo de un volumen de datos que no puede medirse en gigabytes.

¿Cómo se genera el big data?

El volumen de datos ha crecido de forma exponencial: la cantidad de datos recopilados por la humanidad desde el comienzo de su historia hasta 2002 se generó en 2014 en un plazo de diez minutos. Según los pronósticos, esta montaña de datos seguirá creciendo, doblándose cada dos años. Esta marea de datos es consecuencia de la digitalización general en todos los ámbitos de la vida diaria y procede de fuentes como:

  • Conexión a Internet desde el móvil
  • Redes sociales
  • Geolocalización
  • Medición de datos vitales
  • Consumo de medios audiovisuales

El big data no hace referencia únicamente a los datos en sí, sino también a su análisis y a su utilización. En este proceso de evaluación se intentan buscar patrones y conexiones para contextualizarlos correctamente. El desafío no es solamente el ingente volumen de datos, sino también su velocidad y su variedad (las tres “v” del big data), ya que estos acuden de forma constante a un archivo desestructurado y deben ser, idealmente, registrados, almacenados y procesados en tiempo real. Para leerlos correctamente y poder conectarlos es necesaria una sofisticada infraestructura de datos.

¿Cómo puedo trabajar con big data?

El big data es responsable del surgimiento de nuevos requisitos técnicos respecto al software. Para analizar estos datos se requieren frameworks especiales (infraestructuras digitales), cuya función principal sea la de procesar tantos conjuntos de datos como sea posible y de importarlos rápidamente. Además, este software debe poner a disposición del usuario los datos en tiempo real y responder al mismo tiempo a varias solicitudes de bases de datos.  

Hadoop es una conocida solución de código abierto para este fin, aunque su extremamente compleja implementación requiere, a menudo, el apoyo por parte de expertos, los llamados data scientists. Sin embargo, para introducirse en el mundo del big data una muy buena opción la representan las soluciones en la nube.

Ejemplos de uso del big data

Los ámbitos de aplicación del big data incluyen diversos aspectos de la vida cotidiana. Por ejemplo, en sector del eCommerce, quien haya comprado alguna vez en una tienda online conoce la frase “clientes que compraron el producto A, compraron también el producto B”. Estas recomendaciones se basan en la evaluación de millones de datos de otros clientes.

Otros ámbitos de aplicación incluyen:

  • Investigación médica: mediante la evaluación de datos masivos, los científicos pueden encontrar las mejores soluciones y planificaciones terapéuticas para sus pacientes.
  • Industria: gracias a la utilización de datos sobre sus máquinas, las empresas pueden aumentar la productividad y trabajar de forma más sostenible.
  • Economía: el big data permite a las empresas conocer mejor a sus clientes y ajustar mejor sus ofertas.
  • Energía: para adaptar el consumo de energía a las necesidades individuales hay que conocerlas. La recolección de datos de consumo permiten un abastecimiento energético sostenible.
  • Marketing: el big data en el marketing se usa a menudo con objetivos de targeting. La finalidad es, sobre todo, la mejora de las relaciones con el cliente y un aumento de las conversiones en diferentes estrategias.
  • Lucha contra el crimen: también para el gobierno y la seguridad del estado es útil la recolección y análisis de datos masivos (por ejemplo, para combatir el terrorismo).

Críticas al big data

Principalmente se trata de la protección de la privacidad de las personas. A la hora de optimizar estrategias de marketing, las grandes bases de datos presentan un gran potencial para empresas y marcas, ya que, usadas para segmentar a su audiencia según su comportamiento, sirven para crear perfiles de usuario mucho más precisos. Y esto es considerado en sí mismo un ataque a la esfera privada del usuario. Es por eso que, si se trata con big data, hay que informar en la página web (apartado de Protección de Datos) sobre el uso de los datos personales que se recaban de los usuarios.

Otro punto crítico es la “autocracia de los datos”. Naturalmente, también en este ámbito existen los llamados “big player”, empresas que, ya desde hace años, trabajan con grandes bases de datos y obtienen beneficios de ellas (Google y otros buscadores). Es así como unas pocas empresas monopolizan la propiedad de esos datos. Y esto es precisamente lo que se critica, así como el peligro de un abuso de los datos a gran escala. Sin la existencia de reglas claras en cuanto a la protección de los datos y al anonimato de los datos evaluados, no se puede excluir la posibilidad de un mal uso de los datos de los usuarios.

Uso responsable del big data

Dando por sentado un uso correcto de la tecnología, en el otro extremo se encuentran los beneficios que el uso del big data puede procurar. Por ejemplo, algunos avances importantes en la investigación sobre el cáncer no habrían sido posibles sin el uso del big data. El abastecimiento de energía y el control del tráfico también son continuamente optimizados mediante la evaluación de datos masivos, ofreciendo mayor seguridad en la vida diaria.

A pesar de todas las oportunidades que brinda en medicina, control de tráfico y economía, surgen preguntas de índole ética a propósito del big data, pues, por ejemplo, la predicción de ciertos sucesos, como podría ser la probabilidad de que alguien sea víctima de una determinada enfermedad, sigue siendo para muchos ciertamente indeseable. La ciudadanía tiene sus reservas al respecto, haciendo que el miedo hacia las empresas recolectoras de información crezca cada vez más. En este sentido, los expertos abogan por la transparencia a la hora de informar a los usuarios sobre el uso de sus datos y por la creación de un marco legal que permita los avances tecnológicos sin perder de vista la protección de la privacidad de las personas.