Deep learning: el cerebro humano como inspiración

Al hablar con asistentes de voz como el de Google o Siri, ya estamos recolectando los frutos del deep learning o aprendizaje profundo. Sin esta tecnología, estas voces del smartphone y de los altavoces no reconocerían nuestro lenguaje ni, naturalmente, encontrarían tampoco las respuestas adecuadas.

El concepto de deep learning en sí no es nuevo, pero en los últimos años esta tecnología se ha desarrollado y se sigue desarrollando a gran velocidad, proporcionando un valor añadido real que se ha colado incluso, por primera vez, en la vida diaria de los usuarios. Grandes multinacionales como Google están investigando de forma intensiva el deep learning, y no solo para que lleguemos a tener conversaciones humanas con sus asistentes de voz, sino para realizar tareas de lo más variadas.

Aquí te explicamos cómo funciona esta tecnología, cuáles son sus puntos fuertes, sus puntos débiles, y qué ámbitos de aplicación tiene o podría tener.

¿Qué es el deep learning?

Para llegar a considerar inteligentes a los ordenadores, las personas les pedimos, principalmente, que puedan aprender de forma autónoma. El deep learning es, por lo tanto, una de las ramas de investigación científica en materia de inteligencia artificial o, mejor dicho: es una rama del aprendizaje automático o machine learning, uno de los muchos métodos que existen para aplicarlo.

Definición: deep learning

El deep learning es una rama del machine learning o aprendizaje automático, gracias al cual los ordenadores pueden procesar grandes cantidades de datos con la ayuda de redes neuronales inspiradas en el cerebro humano. Las conexiones existentes se van mejorando y ampliando con la nueva información de entrada, de manera que el sistema va aprendiendo sin necesidad de intervención humana y mejora constantemente las decisiones y predicciones que realiza.

Para procesar la información se utilizan redes neuronales artificiales formadas por una capa de entrada, una o más capas intermedias (layers) y una capa de salida. Los datos llegan como vector de entrada a la capa de entrada, luego son ponderados por neuronas artificiales en las capas intermedias y, finalmente, resultan en un patrón concreto en la capa de salida. Cuantas más capas tenga una red neuronal artificial, más complejas serán las tareas a las que pueda enfrentarse.

Ejemplo: reconocimiento de imágenes

Supongamos que queremos clasificar fotos según muestren personas, gatos o perros: todo un desafío para un ordenador. Naturalmente, al contrario que las personas, un ordenador no es capaz de reconocer imágenes de un vistazo, sino que debe realizar para ello un análisis de ciertas características concretas de la imagen.

En el proceso de deep learning se analizan capa a capa los datos primarios introducidos (en este caso, la imagen). En la primera capa de la red neuronal artificial, el sistema comprueba, por ejemplo, qué color tiene cada uno de los píxeles. Cada píxel es procesado entonces por una neurona de la red. En la capa siguiente se identificarán los contornos y esquinas y, en la siguiente, se analizarán características más complejas. 

Las informaciones que se recaben pasarán a formar parte de un algoritmo flexible que se mejora a sí mismo basándose en los resultados que se van transmitiendo de una capa a la siguiente. De esta manera, el ordenador puede decidir, tras haber realizado numerosos análisis, si la imagen muestra un perro, un gato o una persona.

Al principio del proceso tiene lugar un training en el que las conclusiones erróneas del ordenador son corregidas por personas para afinar así el algoritmo, el cual, al poco tiempo, será capaz de mejorar su propia capacidad de reconocimiento por sí mismo. Alterando los enlaces entre las neuronas y adaptando la ponderación de las variables dentro del algoritmo, ciertas informaciones de entrada (fotos variadas de gatos, por ejemplo) conducirán, cada vez de forma más exacta y con menos fallos, a ciertos resultados (identificación del gato). Cuantas más imágenes se le propongan al sistema, más aprenderá.

Para las personas no siempre está claro qué patrones ha identificado el ordenador en el proceso de deep learning para llegar a cierta conclusión, pero el sistema es capaz de optimizar sus reglas continuamente por sí solo.

La historia del deep learning

Como término, deep learning es bastante nuevo: se mencionó por primera vez aproximadamente en el año 2000. No obstante, la idea de usar redes neuronales artificiales para permitir al ordenador tomar decisiones inteligentes tiene ya varias décadas.

La investigación básica en este ámbito se remonta incluso a los años 40 y las primeras redes neuronales artificiales se desarrollaron en los 80, pero con resultados aún bastante decepcionantes. Una de las razones de tan pobres resultados es que el deep learning, es decir, el aprendizaje autónomo por parte del ordenador, requiere grandes cantidades de datos digitales, de las que entonces aún no se disponía. Hasta la llegada del nuevo milenio no empezó la era de los big data, que volvieron a reavivar con fuerza el interés de la ciencia y de la economía en el deep learning.

Puntos fuertes y débiles

En comparación con tecnologías anteriores de inteligencia artificial, el deep learning tiene mucha más capacidad de rendimiento, lo cual justifica la gran atención de los medios que ha recibido, así como el interés con el que se investiga en el tema. Sin embargo, para que esta tecnología pueda desarrollar todo su potencial, habrá que lidiar primero con ciertos puntos débiles que presenta.

Puntos fuertes del deep learning

Uno de los argumentos más importantes a favor del deep learning es la calidad de sus resultados, que superan con creces a los de otras tecnologías, especialmente en el ámbito del reconocimiento de imágenes y del procesamiento de voz. Suponiendo que se disponga de datos de entrada de calidad para el training, con deep learning pueden realizarse tareas rutinarias de forma más rápida y eficiente que si las hiciesen personas, y todo ello sin signos de cansancio ni estancamiento de la calidad. 

En otras ramas del aprendizaje automático, los desarrolladores analizan los datos primarios y definen regularmente características adicionales que el algoritmo deberá tener en cuenta a la hora de aprender, con el fin de mejorar así su capacidad de predicción. En el deep learning, en cambio, el sistema reconoce por sí mismo variables útiles y las integra en su proceso de aprendizaje, de manera que, tras un entrenamiento inicial, es capaz de aprender sin intervención humana. De esta manera, no se necesita personal especializado para el desarrollo de dichas características.

Hasta hace poco, para hacer posible el aprendizaje automático había que etiquetar o identificar grandes cantidades de datos a mano: para el reconocimiento de imágenes, por ejemplo, los trabajadores debían asignar en primer lugar la etiqueta de gato o perro a las imágenes. Con el deep learning, el training manual requerido es mucho más breve, lo cual es especialmente relevante porque, si bien las empresas suelen recabar grandes cantidades de datos, solo en pocos casos se trata de datos estructurados (números de teléfono, direcciones postales, tarjetas de crédito, etc.). En la mayoría de casos, se guardan datos no estructurados (imágenes, documentos, correos electrónicos, etc.). A diferencia de otros métodos de machine learning, el deep learning es capaz de analizar datos procedentes de fuentes no estructuradas basándose en la tarea que se le haya asignado. 

El argumento de que esta tecnología es demasiado costosa como para comercializarse en masa va perdiendo su fuerza: cada vez aparecen más servicios como Vision, de Google o Watson, de IBM, que permiten a las empresas seguir desarrollando redes neuronales ya existentes en lugar de tener que crearlas desde cero. Gracias a esta posibilidad, en el futuro podremos ver cómo los puntos fuertes del deep learning se desarrollan cada vez más en la práctica empresarial.

Resumen de los puntos fuertes

  • Mejores resultados que con otros métodos de machine learning
  • No es necesario desarrollar características ni etiquetar los datos manualmente
  • Realización eficiente de tareas rutinarias sin fluctuaciones de calidad
  • Funcionamiento sin complicaciones con datos no estructurados
  • Cada vez hay más servicios que simplifican el uso de las redes neuronales artificiales

Puntos débiles del deep learning

El deep learning requiere una enorme capacidad de procesamiento para establecer conexiones en las redes neuronales y procesar las cantidades de datos necesarias. La potencia de procesamiento necesaria depende en gran medida de la complejidad de la tarea y del tamaño de los datos introducidos. Todo esto encarecía esta tecnología hasta hace poco, hasta el punto de ponerla solo al alcance de la investigación y de algunas multinacionales. 

En este sentido ha habido muchas mejoras, pero lo que ciertamente no cambiará en el futuro próximo es que las decisiones tomadas por los procesos de deep learning no siempre son comprensibles para las personas, al menos no en detalle. La red neuronal sigue siendo una black box, es decir, un sistema cuyo funcionamiento no se llega a conocer en profundidad. Eso la hace inaprovechable para ciertos fines en los que la comprensión de la tecnología en sí es clave.

Para que el deep learning funcione, se necesitan grandes conjuntos de datos de training. Si no se dispone de ellos, los ordenadores aún no son capaces de dar buenos resultados. Si bien ya se están fundando las primeras bibliotecas de redes neuronales, que facilitan el uso del deep learning para un público más amplio, estos servicios no se pueden aplicar a todos los fines. Por eso, el desarrollo de algoritmos de aprendizaje de deep learning sigue requiriendo grandes inversiones de tiempo e incluso podría llegar a requerir más tiempo que otros métodos alternativos.

Resumen de los puntos débiles

  • Requiere una alta potencia de procesamiento.
  • El desarrollo de algoritmos de aprendizaje necesita relativamente mucho tiempo.
  • Se necesitan grandes cantidades de datos de entrada.
  • Se necesitan más datos de entrenamiento que con otros métodos de machine learning.
  • Las decisiones tomadas por el sistema son comprensibles, como mucho, en parte (black box).

Ámbitos de aplicación del deep learning

El deep learning ya se usa en sectores muy diversos y su uso se extenderá aún más en el futuro, hasta llegar a muchos ámbitos de nuestra vida cotidiana.

Experiencia de usuario

Actualmente se está usando el deep learning para optimizar los llamados chatbots, es decir, las aplicaciones de chat en tiempo real para la atención al cliente. Con el deep learning se pueden mejorar las respuestas del chat a los comentarios de los clientes y reducir así la necesidad de personal en este ámbito.

Asistentes de voz

Como se ha mencionado, uno de los ejemplos más conocidos de la aplicación de deep learning son los asistentes de voz como Alexa, el asistente de Google o Siri. Gracias a esta tecnología, mejoran su vocabulario y su comprensión lingüística.

Traducciones

Algunos programas de traducción ya utilizan el deep learning, que les permite, por ejemplo, traducir automáticamente también dialectos o texto en imágenes, algo que hasta ahora no era posible con las aplicaciones de machine learning que solo trabajan con datos estructurados.

Redacción de textos

Con la ayuda del deep learning, los ordenadores pueden redactar textos que no solo son correctos gramatical y ortográficamente, sino que también pueden imitar el estilo de autores concretos, por ejemplo, siempre que hayan recibido suficiente input para entrenarse. En los primeros intentos en este ámbito, los sistemas de IA crearon artículos de Wikipedia que parecían dignos de Shakespeare.

Seguridad cibernética

Los sistemas de inteligencia artificial con deep learning, gracias a su aprendizaje autónomo y continuo, funcionan especialmente bien a la hora de identificar irregularidades en la actividad del sistema. De esta manera, pueden avisar de posibles ataques de hackers. Además, puesto que los sistemas también integran material de vídeo, pueden protegerse mejor los lugares que están típicamente en el punto de mira de ataques, como los aeropuertos, ya que el ordenador puede detectar anormalidades en el tráfico habitual del lugar.

Finanzas

La habilidad de detectar anomalías resulta especialmente útil en el delicado ámbito de las transacciones financieras. Si se entrena el algoritmo de forma adecuada, pueden evitarse ataques a las redes bancarias y fraudes con tarjetas de crédito mucho mejor que hasta ahora.

Marketing y ventas

Los sistemas de inteligencia artificial son capaces de realizar análisis de sentimiento o sentiment analysis con la ayuda del deep learning, es decir, detectar qué mensajes de los clientes (del chat y del correo electrónico) transmiten indignación, por ejemplo, para transmitirlos prioritariamente al personal encargado.

Estos sistemas pueden, además, tomar medidas de forma autónoma para devolver la satisfacción al cliente y evitar que se interrumpa la relación comercial. Mediante la recolección de información acerca del cliente en el CRM, los sistemas de deep learning pueden predecir cómo se comportará en el futuro y definir así medidas adecuadas que eviten que deje de contratar los servicios de la empresa, por ejemplo.

Conducción autónoma

La idea de un tráfico más seguro gracias a coches que transiten sin conductor sigue siendo una fantasía, pero la tecnología necesaria para ello ya existe y combina diversos algoritmos de deep learning: un algoritmo reconoce, por ejemplo, las señales de tráfico, mientras que otro se especializa en detectar peatones.

Robots industriales

Los robots con inteligencia artificial basada en deep learning son útiles en muchos sectores industriales. Estos sistemas son capaces de aprender, con tan solo observar a las personas, cómo manejar la maquinaria y cómo optimizarse a sí mismos.

Mantenimiento

Especialmente en el ámbito del mantenimiento industrial existen muchas posibilidades de aplicación de sistemas de deep learning. En instalaciones complejas es necesario controlar continuamente muchos parámetros para garantizar la seguridad. Con deep learning no solo se podría controlar que los sistemas funcionasen sin fallos, sino también crear predicciones de qué unidades de la instalación requieren trabajos de mantenimiento, en lo que se denomina predictive maintenance.

Medicina

Los sistemas de deep learning son capaces de analizar imágenes en busca de anomalías de forma mucho más eficaz que el ojo humano más experto. En tomografías computarizadas o radiografías, por ejemplo, la inteligencia artificial permite detectar enfermedades tan prematuramente como nunca se había hecho, lo cual aumenta en gran medida las probabilidades de curación o supervivencia de los pacientes.

Deep learning: un gran potencial, pero no una solución universal

En general, al oír hablar de deep learning, uno tiene a veces la sensación de que se trata del único modo viable de implementar la inteligencia artificial. Sin embargo, y a pesar de que el deep learning realmente da mejores resultados en muchos ámbitos que las tecnologías usadas hasta ahora, el gran potencial de las redes neuronales artificiales aún no se ha explotado del todo, ni mucho menos, y su uso está aún en las fases iniciales.

Además, el deep learning no es siempre la mejor solución para los problemas tecnológicos, sino que hay muchas otras maneras de dotar de inteligencia a los ordenadores. Existen soluciones, por ejemplo, que funcionan también con menores cantidades de datos y que permiten a las personas comprender las decisiones que toma el sistema.

Algunos investigadores en materia de IA ven el deep learning como una solución transitoria y están convencidos de que se desarrollarán mejores estrategias que no estén inspiradas en el cerebro humano. La estrategia empresarial de Google en este sentido es un ejemplo de que no se deben ignorar las críticas: en Google, el deep learning es solo una parte de la estrategia de IA, de la que también forman parte otros métodos de aprendizaje automático, como el desarrollo de ordenadores cuánticos.