¿Es posible prevenir enfermedades a partir de nuestros genes? 

Avatar de Estéfany Franco

Una investigación combina la bioinformática, la ciencia de datos y la inteligencia artificial para identificar información genética asociada con la letalidad del meduloblastoma. El objetivo es avanzar hacia diagnósticos más oportunos, precisos y accesibles.

Getting your Trinity Audio player ready…

Foto de portada: Ejemplo de una resonancia magnética cerebral.

Cada persona alberga en su interior una enorme cantidad de información genética. En cada una de nuestras células habitan miles de genes que, en conjunto, funcionan como una base de datos responsable de regular procesos como el crecimiento, el desarrollo e, incluso, cuál es nuestra resistencia a las enfermedades. El reto para la ciencia no es solo generar esa información, sino aprender a interpretarla. 

Cuando se trata del cáncer, esta tarea se vuelve especialmente urgente. No todos los tumores se comportan igual ni todos los pacientes responden de la misma manera a los tratamientos. Entender qué ocurre a nivel genético puede marcar la diferencia para un diagnóstico oportuno y para el diseño de un tratamiento más preciso.  

En este cruce entre biología y datos se encuentra la investigación de Andrés Rivera, estudiante de la Maestría en Ciencia de Datos del ITESO. Su trabajo explora cómo herramientas de la bioinformática y el aprendizaje profundo pueden ayudar a identificar genes clave asociados con la letalidad del meduloblastoma, uno de los tumores cerebrales más frecuentes en pacientes pediátricos.  

Andrés Rivera. Foto: Roberto Ornelas. Diseño: @todo_fany 

¿Qué nos dicen los genes sobre las enfermedades? 

La biología molecular estudia el ADN, el ARN y las proteínas que permiten que nuestras células funcionen. Desde esta perspectiva, numerosas enfermedades pueden entenderse como consecuencia de alteraciones en el comportamiento de los genes, es decir, las enfermedades se conciben como el resultado de cambios en el comportamiento de los genes, ya sea por su ausencia, por una activación más intensa de lo habitual o por cambios en su funcionamiento.  

“El cáncer sigue siendo uno de los problemas más grandes de la salud humana hoy en día, y mucha de la explicación de por qué algunos pacientes sobreviven y otros no, la podemos encontrar justamente en la genética”, explica Andrés. Sin embargo, acceder a esta información no es sencillo. Los estudios genéticos suelen ser costosos y altamente especializados, lo que limita su aplicación clínica.  

Aun así, existen repositorios públicos de datos genómicos: plataformas digitales que recopilan, almacenan y ponen a disposición grandes volúmenes de información genética obtenida a partir de investigaciones realizadas en distintas partes del mundo. Estas bases de datos contienen perfiles genéticos de miles de pacientes que constituyen un recurso clave para el desarrollo de nuevas investigaciones. 

Un solo estudio genético puede generar millones de datos. Cada gen, cada paciente y cada prueba experimental se traducen en matrices de información que serían casi imposibles de analizar manualmente. Aquí es donde entra la bioinformática, una disciplina que combina biología, informática, matemáticas y estadística para transformar grandes volúmenes de datos biológicos en conocimiento. La bioinformática se apoya en herramientas computacionales para analizar datos biológicos y comprender la función de los genes. Sus aplicaciones abarcan desde el estudio de la evolución de las especies hasta la identificación de enfermedades genéticas y el desarrollo de fármacos. 

Además, esta investigación incorpora el aprendizaje profundo (deep learning), una rama de la inteligencia artificial inspirada en el funcionamiento del cerebro humano. A través de redes neuronales artificiales, estos modelos pueden aprender patrones complejos a partir de volúmenes masivos de datos. En otras palabras, los algoritmos reciben grandes cantidades de datos de entrada —por ejemplo, sobre la actividad de una célula o de un tejido—, que procesan mediante múltiples capas de cálculo. 

Como resultado, generan clasificaciones, predicciones o estimaciones probabilísticas sobre su estado. En el caso del cáncer, estas aplicaciones pueden traducirse en identificar grupos moleculares, estimar la agresividad de un tumor o reconocer genes asociados con una mayor letalidad. 

Aplicar la ciencia para un diagnóstico oportuno 

El meduloblastoma es un tumor primario del sistema nervioso central que se origina en el cerebro o la médula espinal, suele manifestarse como una masa sólida en el cerebelo. Afecta principalmente a pacientes pediátricos de entre cinco y diez años de edad.  

Aunque sus causas no se conocen por completo, un porcentaje de los casos se relaciona con alteraciones genéticas hereditarias. De acuerdo con el Instituto Nacional del Cáncer de Estados Unidos, este tumor se origina en las células formadas durante el desarrollo fetal que permanecen en el encéfalo después del nacimiento.  

Según la Organización Mundial de la Salud, cada año se diagnostican aproximadamente 400 mil nuevos casos de cáncer infantil en el mundo. De ellos, cerca del 90 % se presentan en países de ingresos bajos y medios, donde la tasa de supervivencia es inferior al 30 %, mientras que en los países de ingresos altos la supervivencia alcanza el 80 %.  

En México, datos del INEGI indican que en 2023 los tumores malignos del encéfalo y del sistema nervioso central se ubicaron como la segunda causa de muerte por cáncer en pacientes de entre 0 y 19 años, solo por debajo de la leucemia. 

Su impacto es devastador para las familias, especialmente cuando no se detecta a tiempo: “Muchas veces no hay un diagnóstico temprano, y eso tiene consecuencias irreversibles. A esto se suman los casos que no llegan a reportarse correctamente y que no aparecen en las estadísticas oficiales”, advierte Andrés.  

Para la inteligencia artificial, la ausencia de datos también es un problema, pues los modelos aprenden de la información disponible y, cuando está incompleta, pueden reproducir sesgos o generar resultados poco representativos.   

El ser humano cuenta con alrededor de 25 mil genes, analizarlos todos es poco práctico y extremadamente costoso. Por esta razón, uno de los objetivos centrales de este trabajo es limitar ese universo a un conjunto reducido de genes altamente informativos, conocidos como biomarcadores. 

“Mi trabajo es una parte de la cadena de valor. Consiste en entrenar, validar y probar los algoritmos con distintos conjuntos de datos para aumentar la certeza de que estos biomarcadores sirvan como guía para nuevos experimentos”, explica. En el ámbito de la biotecnología y las ciencias biofarmacéuticas, estos biomarcadores tienen un enorme potencial para el desarrollo de terapias personalizadas y accesibles. 

Aunque la investigación se apoya fuertemente en herramientas computacionales, su motivación es profundamente humana. Andrés, quien también cuenta con formación en biotecnología por el ITESO, reconoce que su interés por la ciencia de datos aplicada a la salud nació de experiencias personales relacionadas con enfermedades graves en su familia, lo cual también se refleja en su interés por la prevención: “En lugar de reaccionar cuando la enfermedad ya está avanzada, el objetivo es anticiparse e identificar riesgos”. Rivera compara el potencial de estas herramientas con las de pruebas ampliamente democratizadas, como las de embarazo o VIH, que ofrecen alta precisión a bajo costo. 

La investigación se desarrolló en colaboración entre el Centro de Investigación y Asistencia en Tecnología y Diseño del Estado de Jalisco (CIATEJ), el Tecnológico de Monterrey y el ITESO. Se sustenta tanto en datos de repositorios públicos como en estudios previamente validados con muestras de pacientes; por ejemplo, en el Instituto Nacional de Pediatría

En la actualidad, Andrés se encuentra en la etapa final de la redacción de su tesis de posgrado. Los siguientes pasos incluyen la validación experimental y la extrapolación de la metodología a otros tipos de cáncer y enfermedades. El enfoque, asegura, no se limita a la medicina humana, ya que podría aplicarse también en campos como la veterinaria o la agronomía.  

Además, destaca la importancia de incorporar la perspectiva de género tanto en la participación de investigadores como de pacientes, con el fin de evitar sesgos en este tipo de estudios.  

“Caminamos sobre huellas de gigantes”, dice, al recordar que la ciencia es un esfuerzo colectivo. En un contexto de avances cada vez más frecuentes en áreas como la bioinformática y la inteligencia artificial, investigaciones como esta muestran que, bien utilizadas, estas herramientas pueden convertirse en aliadas para salvar vidas a tiempo.