El deep learning, también conocido como apre­n­di­za­je profundo, es una rama del machine learning o apre­n­di­za­je au­to­má­ti­co en la que los or­de­na­do­res procesan grandes ca­n­ti­da­des de datos mediante redes neu­ro­na­les que se inspiran en el fu­n­cio­na­mie­n­to del cerebro humano.

He­rra­mie­n­tas de IA
Saca el máximo partido a la in­te­li­ge­n­cia ar­ti­fi­cial
  • Crea tu página web en tiempo récord
  • Impulsa tu negocio gracias al marketing de IA
  • Ahorra tiempo y obtén mejores re­su­l­ta­dos

En el deep learning, el foco principal está en el proceso de apre­n­di­za­je autónomo de las redes neu­ro­na­les. Estas redes están formadas por una capa de entrada, una o más capas o in­te­r­me­dias y una capa de salida. La in­fo­r­ma­ción llega a la capa de entrada en forma de vector, después se procesa en las capas in­te­r­me­dias a través de pesos asignados por las neuronas ar­ti­fi­cia­les, y fi­na­l­me­n­te, se genera un patrón es­pe­cí­fi­co en la capa de salida. Cuantas más capas o “layers” tenga una red neuronal ar­ti­fi­cial, más complejas pueden ser las tareas que la in­te­li­ge­n­cia ar­ti­fi­cial puede realizar.

¿Cómo funciona el deep learning? Ejemplo de re­co­no­ci­mie­n­to de imágenes

Su­po­n­ga­mos que queremos cla­si­fi­car fotos según muestren personas, gatos o perros: esto es todo un desafío para un ordenador. Na­tu­ra­l­me­n­te, al contrario que las personas, un ordenador no es capaz de reconocer imágenes de un vistazo, sino que debe realizar para ello un análisis de ciertas ca­ra­c­te­rí­s­ti­cas concretas de la imagen.

En el proceso de deep learning se analizan capa a capa los datos primarios in­tro­du­ci­dos (en este caso, la imagen). En la primera capa de la red neuronal ar­ti­fi­cial, el sistema comprueba, por ejemplo, qué color tiene cada uno de los píxeles. A co­n­ti­nua­ción, cada píxel es procesado por una neurona de la red. En la capa siguiente se ide­n­ti­fi­ca­rán los contornos y esquinas y, en la siguiente, se ana­li­za­rán ca­ra­c­te­rí­s­ti­cas más complejas.

Las in­fo­r­ma­cio­nes que se recaben pasarán a formar parte de un algoritmo flexible que se irá op­ti­mi­za­n­do en base a los re­su­l­ta­dos que se van tra­n­s­mi­tie­n­do de una capa a la siguiente. De esta manera, el ordenador puede decidir, tras haber realizado numerosos análisis, si la imagen muestra un perro, un gato o, por el contrario, una persona.

Al principio del proceso tiene lugar un en­tre­na­mie­n­to en el que las co­n­clu­sio­nes erróneas del ordenador son co­rre­gi­das por personas para afinar así el algoritmo, el cual, al poco tiempo, será capaz de mejorar su propia capacidad de re­co­no­ci­mie­n­to por sí mismo. Alterando los enlaces entre las neuronas y adaptando la po­n­de­ra­ción de las variables dentro del algoritmo, ciertas in­fo­r­ma­cio­nes de entrada (fotos variadas de gatos, por ejemplo) co­n­du­ci­rán, cada vez de forma más exacta y con menos fallos, a ciertos re­su­l­ta­dos (la ide­n­ti­fi­ca­ción del gato). Cuantas más imágenes se le propongan al sistema, más aprenderá.

Para las personas no siempre está claro qué patrones ha ide­n­ti­fi­ca­do el ordenador en el proceso del deep learning para llegar a cierta co­n­clu­sión, pero el sistema es capaz de optimizar sus reglas co­n­ti­nua­me­n­te por sí mismo.

La historia del deep learning

Como término, el deep learning o apre­n­di­za­je profundo es bastante nuevo, ya que se mencionó por primera vez apro­xi­ma­da­me­n­te en el año 2000. No obstante, la idea de usar redes neu­ro­na­les ar­ti­fi­cia­les para permitir a los or­de­na­do­res tomar de­ci­sio­nes in­te­li­ge­n­tes ya tiene varias décadas.

La in­ve­s­ti­ga­ción básica en este ámbito se remonta incluso a los años 40 y las primeras redes neu­ro­na­les ar­ti­fi­cia­les se de­sa­rro­lla­ron en los 80, pero la calidad de los re­su­l­ta­dos era aún bastante de­ce­p­cio­na­n­te. Una de las razones de estos pobres re­su­l­ta­dos se debe a que el deep learning, esto es, el apre­n­di­za­je autónomo por parte del ordenador, requiere grandes ca­n­ti­da­des de datos digitales, de las que por entonces aún no se disponía. Hasta la llegada del nuevo milenio no empezó la era de los datos masivos o big data, que volvieron a reavivar con fuerza el interés de la ciencia y la economía en el deep learning.

Puntos fuertes y débiles del deep learning

En co­m­pa­ra­ción con te­c­no­lo­gías an­te­rio­res de in­te­li­ge­n­cia ar­ti­fi­cial, el deep learning o apre­n­di­za­je profundo tiene mucha más capacidad de re­n­di­mie­n­to. Sin embargo, para que esta te­c­no­lo­gía pueda de­sa­rro­llar todo su potencial, habrá que lidiar primero con algunas de las li­mi­ta­cio­nes que presenta.

Puntos fuertes del apre­n­di­za­je profundo

Uno de los ar­gu­me­n­tos más im­po­r­ta­n­tes a favor del deep learning es la calidad de sus re­su­l­ta­dos, que superan con creces a los de otras te­c­no­lo­gías, es­pe­cia­l­me­n­te en el ámbito del re­co­no­ci­mie­n­to de imágenes y del pro­ce­sa­mie­n­to de voz. Su­po­nie­n­do que se disponga de datos de entrada de calidad para el en­tre­na­mie­n­to, mediante el apre­n­di­za­je profundo se pueden realizar tareas ru­ti­na­rias de forma más rápida y eficiente que si las llevaran a cabo personas, y todo ello sin signos de cansancio ni es­ta­n­ca­mie­n­to de la calidad.

En otras ramas del apre­n­di­za­je au­to­má­ti­co, los de­sa­rro­lla­do­res analizan los datos primarios y definen re­gu­la­r­me­n­te ca­ra­c­te­rí­s­ti­cas adi­cio­na­les que el algoritmo deberá tener en cuenta a la hora de aprender, con el fin de mejorar así su capacidad de pre­di­c­ción. En el deep learning, en cambio, el sistema reconoce por sí mismo variables útiles y las integra en su proceso de apre­n­di­za­je, de manera que, tras un en­tre­na­mie­n­to inicial, es capaz de aprender sin in­te­r­ve­n­ción humana. De esta manera, no se necesita personal es­pe­cia­li­za­do para el de­sa­rro­llo de dichas ca­ra­c­te­rí­s­ti­cas.

Hasta hace poco, para hacer posible el apre­n­di­za­je au­to­má­ti­co había que etiquetar o ide­n­ti­fi­car grandes ca­n­ti­da­des de datos a mano: para el re­co­no­ci­mie­n­to de imágenes, por ejemplo, los tra­ba­ja­do­res debían asignar en primer lugar la etiqueta de gato o perro a las imágenes. Con el deep learning, el en­tre­na­mie­n­to manual requerido es mucho más breve, lo cual es es­pe­cia­l­me­n­te relevante porque, si bien las empresas suelen recabar grandes ca­n­ti­da­des de datos, solo en pocos casos se tratan de datos es­tru­c­tu­ra­dos (como números de teléfono, di­re­c­cio­nes postales, tarjetas de crédito, etc.). En la mayoría de los casos, se guardan datos no es­tru­c­tu­ra­dos (como imágenes, do­cu­me­n­tos, correos ele­c­tró­ni­cos, etc.). A di­fe­re­n­cia de otros métodos de apre­n­di­za­je au­to­má­ti­co o machine learning, el deep learning es capaz de analizar datos pro­ce­de­n­tes de fuentes no es­tru­c­tu­ra­das basándose en la tarea que se le haya asignado.

El argumento de que esta te­c­no­lo­gía es demasiado costosa como para co­me­r­cia­li­zar­se en masa va perdiendo su fuerza, ya que cada vez aparecen más servicios como Vision de Google o Watson de IBM , que permiten a las empresas seguir de­sa­rro­lla­n­do redes neu­ro­na­les ya exi­s­te­n­tes en lugar de tener que crearlas desde cero. Gracias a esta po­si­bi­li­dad, en el futuro podremos ver cómo los puntos fuertes del deep learning se de­sa­rro­llan cada vez más en la práctica em­pre­sa­rial.

Resumen de los puntos fuertes

  • Mejores re­su­l­ta­dos que con otros métodos de apre­n­di­za­je au­to­má­ti­co
  • No es necesario de­sa­rro­llar ca­ra­c­te­rí­s­ti­cas ni etiquetar los datos ma­nua­l­me­n­te
  • Rea­li­za­ción eficiente de tareas ru­ti­na­rias sin flu­c­tua­cio­nes de calidad
  • Fu­n­cio­na­mie­n­to sin co­m­pli­ca­cio­nes con datos no es­tru­c­tu­ra­dos
  • Cada vez hay más servicios que si­m­pli­fi­can el uso de las redes neu­ro­na­les ar­ti­fi­cia­les

Puntos débiles del apre­n­di­za­je profundo

El apre­n­di­za­je profundo o deep learning requiere una enorme capacidad de pro­ce­sa­mie­n­to que depende en gran medida de la co­m­ple­ji­dad y di­fi­cu­l­tad de la tarea y del tamaño del conjunto de datos in­tro­du­ci­dos. Esto ha hecho que, hasta ahora, la te­c­no­lo­gía sea costosa y esté limitada a la in­ve­s­ti­ga­ción y a unas pocas me­ga­co­r­po­ra­cio­nes.

En este sentido ha habido muchas mejoras, pero lo que cie­r­ta­me­n­te no cambiará en el futuro próximo es que las de­ci­sio­nes tomadas por los procesos de deep learning no siempre son co­m­pre­n­si­bles para las personas, al menos no en detalle. La red neuronal sigue siendo como una caja negra; un sistema cuyo fu­n­cio­na­mie­n­to no se llega a conocer en pro­fu­n­di­dad. Por ello, en algunos casos de uso donde la tra­za­bi­li­dad es crucial, esta te­c­no­lo­gía resulta irre­le­va­n­te.

Para que el deep learning funcione, se necesitan grandes conjuntos de datos de en­tre­na­mie­n­to o training. Si no se dispone de ellos, los or­de­na­do­res aún no son capaces de obtener buenos re­su­l­ta­dos. Si bien ya se están fundando las primeras bi­blio­te­cas de redes neu­ro­na­les, que facilitan el uso del apre­n­di­za­je profundo para un público más amplio, estos servicios no se pueden aplicar a todos los fines. Por eso, el de­sa­rro­llo de al­go­ri­t­mos de apre­n­di­za­je para el apre­n­di­za­je profundo sigue re­qui­rie­n­do grandes in­ve­r­sio­nes de tiempo e incluso podría llegar a requerir más tiempo que otros métodos al­te­r­na­ti­vos.

Resumen de los puntos débiles

  • Requiere una alta potencia de pro­ce­sa­mie­n­to
  • El de­sa­rro­llo de al­go­ri­t­mos de apre­n­di­za­je necesita re­la­ti­va­me­n­te mucho tiempo
  • Se necesitan grandes ca­n­ti­da­des de datos de entrada
  • Se necesitan más datos de en­tre­na­mie­n­to que con otros métodos de apre­n­di­za­je au­to­má­ti­co
  • Las de­ci­sio­nes tomadas por el sistema son apenas o nada co­m­pre­n­si­bles (caja negra)

Ámbitos de apli­ca­ción del deep learning

El deep learning ya se usa en sectores muy diversos y su uso se extenderá aún más en el futuro, hasta llegar a muchos ámbitos de nuestra vida cotidiana.

  • Ex­pe­rie­n­cia de usuario: en la ac­tua­li­dad ya se está usando el apre­n­di­za­je profundo y el pro­ce­sa­mie­n­to del lenguaje natural (Natural Language Pro­ce­s­si­ng (NLP)) con el fin de optimizar algunos chatbots. De esta forma, se puede responder mejor a las consultas de los clientes y reducir al mismo tiempo la carga del personal en este ámbito.
  • Asi­s­te­n­tes de voz: el deep learning se utiliza, como ya se ha me­n­cio­na­do, en diversos asi­s­te­n­tes de voz como Alexa, Google Assistant o Siri, a través de síntesis de voz. Estos asi­s­te­n­tes amplían de forma autónoma su vo­ca­bu­la­rio y co­m­pre­n­sión del lenguaje.
  • Tra­du­c­cio­nes: con tra­du­c­to­res basados en apre­n­di­za­je profundo, como DeepL, es posible realizar tra­du­c­cio­nes de alta calidad. Gracias a esta te­c­no­lo­gía, también se pueden traducir au­to­má­ti­ca­me­n­te dialectos y textos presentes en imágenes a otros idiomas.
  • Creación de textos: los modelos de lenguaje extensos (LLM) como ChatGPT pueden generar textos uti­li­za­n­do apre­n­di­za­je profundo que no solo son correctos en cuanto a gramática y or­to­gra­fía, sino que también imitan el estilo de autores concretos, siempre que reciban su­fi­cie­n­te material para en­tre­nar­se. En los primeros intentos, los sistemas de IA crearon artículos para Wikipedia y textos de Sha­ke­s­pea­re so­r­pre­n­de­n­te­me­n­te realistas gracias al deep learning.
  • Ci­be­r­se­gu­ri­dad: los sistemas de in­te­li­ge­n­cia ar­ti­fi­cial con deep learning funcionan es­pe­cia­l­me­n­te bien a la hora de ide­n­ti­fi­car irre­gu­la­ri­da­des en la actividad del sistema. De esta manera, pueden avisar de posibles ataques de hackers.
  • Finanzas: la habilidad de detectar anomalías resulta es­pe­cia­l­me­n­te útil en el delicado ámbito de las tra­n­sac­cio­nes fi­na­n­cie­ras. Si se entrena el algoritmo de forma adecuada, pueden evitarse ataques a las redes bancarias y fraudes con tarjetas de crédito mucho mejor que hasta ahora.
  • Marketing y ventas: los sistemas de IA son capaces de realizar análisis de se­n­ti­mie­n­to con la ayuda del deep learning y tomar medidas definidas de forma autónoma para mejorar la sa­ti­s­fa­c­ción del cliente.
  • Co­n­du­c­ción autónoma: la idea de un tráfico más seguro gracias a coches que transiten sin conductor sigue siendo una fantasía, pero la te­c­no­lo­gía necesaria para ello ya existe y combina diversos al­go­ri­t­mos de deep learning: un algoritmo reconoce, por ejemplo, las señales de tráfico, mientras que otro se es­pe­cia­li­za en detectar peatones.
  • Robots in­du­s­tria­les: los robots equipados con in­te­li­ge­n­cia ar­ti­fi­cial basada en deep learning podrían ser útiles en muchos sectores in­du­s­tria­les. Estos sistemas son capaces de aprender a manejar máquinas si­m­ple­me­n­te ob­se­r­va­n­do a un humano y luego optimizar su desempeño de forma autónoma.
  • Ma­n­te­ni­mie­n­to: es­pe­cia­l­me­n­te en el ámbito del ma­n­te­ni­mie­n­to in­du­s­trial, existen muchas po­si­bi­li­da­des de apli­ca­ción de sistemas de deep learning. En in­s­ta­la­cio­nes complejas, es necesario su­pe­r­vi­sar co­n­ti­nua­me­n­te numerosos pa­rá­me­tros. Además, el apre­n­di­za­je profundo puede realizar pre­di­c­cio­nes sobre qué co­m­po­ne­n­tes de un sistema re­que­ri­rán trabajos de ma­n­te­ni­mie­n­to en el futuro próximo, lo que también se conoce como pre­di­c­ti­ve mai­n­te­na­n­ce.
  • Medicina: las IA basadas en deep learning pueden analizar imágenes con mucha más precisión que el ojo humano, incluso el de un es­pe­cia­li­s­ta. Gracias a estos sistemas in­te­li­ge­n­tes, es posible detectar en­fe­r­me­da­des en imágenes de to­mo­gra­fías o ra­dio­gra­fías antes de lo que sería posible con métodos tra­di­cio­na­les.

Deep learning: un gran potencial, pero no una solución universal

En general, al oír hablar de deep learning, uno tiene a veces la sensación de que se trata del único modo viable de im­ple­me­n­tar la in­te­li­ge­n­cia ar­ti­fi­cial. En realidad, el deep learning ofrece re­su­l­ta­dos si­g­ni­fi­ca­ti­va­me­n­te mejores en muchos ámbitos que las te­c­no­lo­gías usadas hasta ahora.

Sin embargo, el deep learning no es siempre la mejor solución para los problemas te­c­no­ló­gi­cos, sino que hay muchas otras maneras de dotar de in­te­li­ge­n­cia a los or­de­na­do­res. Existen so­lu­cio­nes, por ejemplo, que funcionan también con menores ca­n­ti­da­des de datos y cuyos procesos de decisión son co­m­pre­n­si­bles para los humanos.

Algunos in­ve­s­ti­ga­do­res en materia de IA ven el deep learning como una solución tra­n­si­to­ria y están co­n­ve­n­ci­dos de que se de­sa­rro­lla­rán mejores es­tra­te­gias que no estén in­s­pi­ra­das en el cerebro humano. La es­tra­te­gia em­pre­sa­rial de Google en este sentido es un ejemplo de que no se deben ignorar las críticas: en Google, el apre­n­di­za­je profundo es solo una parte de la es­tra­te­gia de IA, de la que también forman parte otros métodos de apre­n­di­za­je au­to­má­ti­co, como el de­sa­rro­llo de la or­de­na­do­res cuánticos.

Ir al menú principal