De los algoritmos a la historia: cómo un modelo de IA busca preservar la lengua Tseltal

Avatar de Estefany Franco

¿Te imaginas poder acceder a textos de más de 50 años escritos en otra lengua? Un proyecto del ITESO busca traducir documentos en tsetsal con ayuda de herramientas de IA para proteger el patrimonio cultural de Bachajón, Chiapas. La iniciativa surgió a partir de un vínculo con la Compañía de Jesús y traductores locales.

Visita a la comunidad de Bachajón, Chiapas.  
Foto: Cortesía Gabriela Calvario 

Actualmente, el acercamiento a la inteligencia artificial (IA) y sus avances han contribuido a su implementación en diversos campos y el lenguaje no es la excepción. Una de las tecnologías más potentes desarrolladas en este campo son los Large Languages Models (LLM), que en español se conocen como modelos de lenguaje de gran tamaño. Estos consisten en sistemas de IA generativa que son entrenados con millones de palabras para comprender y generar textos. Incluso, su capacidad para procesar enormes cantidades de datos les permite traducir textos a múltiples idiomas. Son utilizados en herramientas como ChatGPT, Bard o DeepSeek; en pocas palabras, fungen como una herramienta para procesar grandes volúmenes de datos y convertirlos en textos precisos.  

Pero, ¿qué ocurriría si estas tecnologías se aplicaran no solo para mejorar la productividad o automatizar tareas, sino para preservar lenguas y conservar el conocimiento cultural de los pueblos originarios? 

Un proyecto con raíces comunitarias 

Esa es la apuesta de un proyecto interdisciplinario que se desarrolla en el ITESO. Busca aplicar los LLM a la traducción de documentos en tseltal, una lengua que se habla en Bachajón, un pueblo ubicado en la región selvática de Chiapas. El objetivo es generar herramientas educativas y de traducción que fortalezcan el habla y uso del tseltal. La intención que motiva este trabajo es resguardar las costumbres, memorias y conocimientos históricos de esta comunidad que ha mantenido una relación de trabajo colaborativo con la Compañía de Jesús por más de 50 años.  

Esta iniciativa forma parte de un proyecto más amplio titulado Analítica de datos en los servicios con enfoque social, utilizando métodos de inteligencia artificial y aprendizaje automático, el cual comenzó en 2023 como parte de una convocatoria del Fondo de Apoyo a la Investigación (FAI) del ITESO. 

Desde el inicio, se planteó como una propuesta interdisciplinaria con tres líneas de trabajo: la traducción del tseltal al español, análisis y detección de sentimientos en redes sociales y el desarrollo de asistentes virtuales. Si bien el equipo involucrado se ha centrado en impulsar la línea de traducción, también ha sumado esfuerzos para abordar las otras dos áreas. 

Gabriela Calvario, investigadora del Departamento de Electrónica Sistemas e Informática de ITESO, coordina esta iniciativa y explica que surgió a partir de un interés por preservar la lengua tseltal y fortalecer el vínculo entre la comunidad de Bachajón y la Compañía de Jesús. El proyecto también cuenta con el acompañamiento de José Avilés, SJ, sacerdote con una amplia trayectoria de la misión de esta región de Chiapas. 

“El padre Pepe Avilés se acercó a mí con una preocupación, tenían décadas de documentos traducidos entre tseltal y español, pero sin herramientas que facilitaran el acceso y preservación de ese acervo. Ahí comenzó todo”, relata la académica quien destaca que el equipo realizó una visita a la comunidad de Bachajón en mayo de 2024, donde dialogaron directamente con traductores y miembros de la comunidad 

Sesión de trabajo con miembros de la comunidad de Bachajón, Chiapas. Foto: Cortesía Gabriela Calvario

La riqueza del archivo sorprendió al equipo. “Nos dijeron que tenían alrededor de 50 años de documentos que incluían traducciones de textos religiosos, de cultura de paz, derecho y sociedad. Una riqueza que estaba ahí, resguardada”, añade Gabriela. 

A partir de este encuentro se firmó un convenio de colaboración entre el ITESO, la compañía jesuita y los habitantes del pueblo. Este vínculo, según la académica, no solo es profesional: “También se ha generado un lazo de amistad, de confianza y de profundo respeto. Vamos paso a paso, siempre con su visto bueno”. 

Utilizar LLM para traducir no es solo un reto técnico, sino un desafío cultural. Como explica la investigadora, “traducir no es simplemente pasar palabras de un idioma a otro. En tseltal, una palabra como esposa tiene diversas traducciones por ejemplo se puede interpretar como la pareja de mi boca y de mi corazón, mi costilla o la madre de mi humo refiriendo a su actividad en la cocina. Hay un trasfondo emocional y cultural que debemos respetar”. 

Visita a la comunidad de Bachajón, Chiapas. Foto: Cortesía Gabriela Calvario 

Más allá de la traducción, el equipo reconoce la pertinencia social de este trabajo: “Uno de los retos que nos compartió el padre Pepe es que muchos jóvenes ya no ven utilidad en aprender el tseltal. Cuando una lengua se pierde, también se pierde la historia, las costumbres, las formas de ver el mundo”. 

La investigadora comparte que este proyecto también despertó un interés académico y social dentro y fuera del ITESO. Actualmente se encuentra inscrito en el Departamento de Electrónica, Sistemas e Informática (DESI) y se articula con otras dependencias de la universidad como el Departamento de Lenguas. También cuenta con colaboración del Centro Universitario de los Valles de la Universidad de Guadalajara, y recientemente, de escuelas extranjeras como la Universidad del País Vasco, gracias a una presentación que se hizo del proyecto en junio de este año en el Congreso Internacional HOPE 25 “La Universidad Jesuita en el Siglo XXI: Un Proyecto de Esperanza para el Mundo”, realizado en la Universidad Loyola en Sevilla, España. A este esfuerzo también se han sumado académicos de ITESO como Lizeth Carrillo, Luis Rizo, Mildreth Alcaraz y Euridice Minerva Ochoa.

“La presentación que hicimos en el Congreso HOPE 25 de universidades jesuitas despertó mucho interés. Investigadores expertos en IA y LLM, manifestaron su deseo de sumarse al trabajo”, cuenta la coordinadora. Añade que también se ha ingresado a una convocatoria de la Universidad del País Vasco para financiamiento, y a otra por parte del SECIHTI con el objetivo de fortalecer la investigación.

Participación y presentación del proyecto en el Congreso HOPE25.  
Foto: Cortesía Gabriela Calvario 

Tecnología con sentido social 

El proyecto se encuentra en fase inicial y el equipo contempla diversas actividades para los próximos semestres como nuevas visitas a Bachajón y el fortalecimiento de las colaboraciones ya en marcha. La apuesta por una inteligencia artificial al servicio de las personas se traduce en involucrar a la comunidad más allá del trabajo de campo.  

La investigadora comenta que en atención de una lógica de ética se involucra a la comunidad en todos los procesos de la iniciativa.  “Todo paso que demos se consulta con la comunidad. Para nosotros es fundamental respetar su autoridad, sus usos y costumbres”, afirma la académica. 

Enfocar el uso de la IA a proyectos con un propósito social, es un recordatorio de que el sentido de la tecnología recae en el propósito con el que sea utilizada y en su capacidad para promover y preservar los saberes colectivos.