El secreto detrás del Machine Learning 

Avatar de Daily Rodríguez

Desde el diagnóstico médico hasta las recomendaciones en plataformas digitales, el Machine Learning transforma decisiones y está cada vez más presente en nuestra vida.

La detección de correos no deseados, las aplicaciones de imagen para diagnósticos médicos, la detección de riesgos de fraudes bancarios, compras en internet y hasta las recomendaciones en una aplicación de streaming como Netflix o Amazon Prime se benefician de un modelo de aprendizaje automático que aprende de grandes cantidades de datos.

Es tal su relevancia actual, que en 2024 el Premio Nobel de Física se les otorgó a los profesores John Hopfield y Geoffrey Hinton por sus investigaciones sobre el Machine Learning, un aspecto clave para el desarrollo actual de la Inteligencia Artificial (IA), la investigación e innovación científica.

¿Qué es el Machine Learning?

“Machine Learning es un subcampo de la Inteligencia Artificial, y busca hacer dos cosas: encontrar patrones en un conjunto de datos que luego se puedan usar para tomar decisiones, agrupar la información de cierta manera o identificar individuos. O bien, puede ayudarnos a predecir ciertos fenómenos a partir de un conjunto de características”, explica Víctor Hugo Zaldívar Carrillo, académico del Departamento de Electrónica, Sistemas e Informática del ITESO.

Para lograr estos objetivos, las computadoras aprenden por sí mismas a partir de grandes volúmenes de datos, y ese aprendizaje puede ser supervisado o no supervisado.

Así aprenden los modelos

En entrevista, Zaldívar Carrillo explica que en el aprendizaje supervisado los datos que nos interesan estudiar son descritos con

características, y esto les permite a las computadoras aprender patrones para trabajar con grandes cantidades de datos nuevos, hacer predicciones y obtener un resultado.

Este tipo de aprendizaje es útil, por ejemplo, para que un banco decida de manera rápida si nos concede un crédito o no. ¿Cómo lo hace? El banco entrena su modelo de Machine Learning con datos de clientes anteriores etiquetados tomando en cuenta algunas características como cantidad de ingresos, historial crediticio, deudas y criterios de riesgos que desee asumir el banco para ofrecernos un crédito. Con esa información, cada vez que llega un nuevo cliente el modelo es capaz de predecir si será capaz de cumplir o no con los pagos de su crédito facilitando así la decisión del banco. A su vez, esos mismos datos pueden ser utilizados por el banco para entrenar el modelo para que sea capaz de detectar riesgos de fraude en tarjetas de crédito o en movimientos bancarios.

Los bancos usas Machine Learning para predecir si un cliente podrá pagar un crédito, analizando ingresos, historial y nivel de riesgo.

Una de las aplicaciones del aprendizaje supervisado más comunes en nuestra vida diaria es la detección de spam. El modelo de Machine Learning se entrena con ejemplos reales de muchos correos que son clasificados previamente como “spam” o correos prioritarios, y aprende a identificar patrones como enlaces raros, direcciones de correo dudosas o el uso de ciertas palabras o frases. 

Con esa información el modelo puede analizar nuevos correos y predecir si se trata de un mensaje prioritario o no deseado. Actúa como un filtro que clasifica y organiza los mensajes permitiendo la llegada de correos importantes a la bandeja principal, y lo que parece publicidad, fraude o phishing se va directo a la carpeta de spam. Así que cada vez que hacemos clic e informamos que llegó un correo no deseado o phishing a nuestra bandeja principal el modelo continúa aprendiendo de nosotros y de cada correo que recibimos. 

Por el contrario, en el aprendizaje no supervisado Zaldívar Carrillo menciona que, el modelo no posee datos etiquetados previamente, sino que trata de encontrar patrones o grupos que tengan algo en común, para decirnos cuáles son las características que hacen que se parezcan mucho. Es como cuando armamos un rompecabezas sin tener la imagen final y vamos juntando piezas que encajan entre sí.

Las plataformas de streaming usan Machine Learning para recomendarte contenido, analizando qué ves, pausas, calificaciones y hábitos de reproducción.

Las recomendaciones que recibimos cuando interactuamos con aplicaciones de streaming como Netflix o Amazon Prime son resultado de un modelo de Machine Learning que utiliza un aprendizaje no supervisado. El modelo va identificando qué géneros y películas se reproducen, a cuáles le damos “me gusta”, cuáles quedan a la mitad o vemos capítulo tras capítulo y, con esa información, nos recomienda contenido similar que podría interesarnos. Lo mismo sucede con aplicaciones de ventas en internet. Según los productos que hemos comprado con anterioridad nos empieza a mostrar ofertas relacionadas con ellos, o a recomendarnos otros productos similares. 

En áreas importantes relacionadas con salud, como en el caso de las imágenes médicas, el Machine Learning no supervisado es una herramienta para el diagnóstico más rápido y preciso de pacientes. Por ejemplo, los equipos que se utilizan en radiología o patología procesan grandes cantidades de imágenes que detectan, clasifican y segmentan patrones que le permiten a los médicos identificar la presencia de algunas enfermedades, incluso en etapas tempranas y a los pacientes recibir la atención necesaria. 

El Machine Learning detecta correos spam al analizar miles de mensajes previos y aprender patrones como palabras sospechosas o direcciones dudosas.

La relevancia social del Machine Learning 

Para el académico del ITESO, más que las diferencias entre los tipos de aprendizaje utilizados para entrenar un modelo de Machine Learning, lo fundamental es tener claridad, desde el inicio, sobre los resultados que se desean obtener con el uso de la inteligencia artificial. Esto permite comprender mejor los datos que se proporcionarán al modelo y, además, reduce significativamente el riesgo de que aprenda a partir de información errónea, lo que podría generar resultados inexactos o inesperados sobre los que las personas tomarían decisiones. Tener claro qué se busca lograr con estas herramientas también ayuda a tomar conciencia del impacto social que implica su uso. 

Zaldívar Carrillo advierte que: “Prácticamente no habrá ninguna industria que no utilice algún modelo de Machine Learning para llevar a cabo su trabajo cotidiano. El Machine Learning, junto con otras herramientas de inteligencia artificial,  son muy importantes en la toma de decisiones diarias”.  

La carrera en Ingeniería en Inteligencia Artificial del ITESO es más que una oportunidad para conocer los fundamentos matemáticos y estadísticos del Machine Learning, así como los algoritmos que permiten crear y entrenar modelos. Es una apuesta por formar personas que no solo comprendan cómo funciona esta tecnología, sino que también reflexionen sobre su impacto social, para que puedan adaptarla y mejorarla con el fin de responder a problemáticas reales. Así lo comenta, con entusiasmo, al hablar del nuevo programa que iniciará en el ciclo escolar otoño 2025.