En el aprendizaje automático, los ordenadores aprenden a reconocer patrones y reglas. En vez de reaccionar únicamente a las entradas de los usuarios humanos, las máquinas aprenden a tomar decisiones de forma autónoma, basadas en las reglas que han aprendido. Por ejemplo, los algoritmos pueden aprender a reconocer correctamente un mensaje de spam o a interpretar el contenido de una imagen. Los desarrolladores y científicos emplean distintos métodos para el aprendizaje, entre los cuales el más utilizado es, probablemente, el supervised learning o aprendizaje supervisado.
En el supervised machine learning, los desarrolladores proporcionan a los algoritmos un conjunto de datos preparados para entrenarlos. De este modo, los algoritmos ya conocen el resultado y solo tienen que reconocer el patrón: ¿por qué esta información pertenece a la categoría A y no a la categoría B?
El supervised learning se utiliza, por tanto, para algoritmos destinados a categorizar los datos naturales (fotos, escritura, habla, etc.). Otro campo de aplicación típico del aprendizaje supervisado son los llamados problemas de regresión. Con ellos, los algoritmos aprenden a hacer predicciones, por ejemplo, sobre la evolución de los precios o el crecimiento de la clientela.
Por otro lado, el semi-supervised learning es una forma mixta de aprendizaje en la que solo se etiqueta parte del conjunto de datos. El resto permanece sin clasificar y los algoritmos deben emprender esta tarea motu proprio. Un buen ejemplo de este método es el algoritmo de reconocimiento de rostros. Basta con etiquetar algunas fotos con los nombres de los amigos: el algoritmo se encargará de encontrar a los demás.