AlphaGenome, una IA para predecir cómo las variaciones del ADN afectan a la regulación génica

Comprender cómo las pequeñas variaciones en el ADN alteran la actividad de los genes es uno de los mayores desafíos de la genómica. Un nuevo modelo desarrollado por Google DeepMind aborda este problema analizando regiones del genoma de gran tamaño con un nivel de detalle sin precedentes. Podría tener futuras aplicaciones en el desarrollo de terapias génicas, el diagnóstico de enfermedades raras o la biología sintética.

ADN, inteligencia artificial
AlphaGenome es un nuevo modelo de IA de aprendizaje profundo que busca predecir cómo las variaciones en la secuencia del ADN, en su mayoría localizadas en regiones no codificantes, influyen en la regulación de los genes. / Wikimedia Commons

Con su programa Alphafold, la empresa británica DeepMind de Google ha logrado predecir la forma en 3D de millones de proteínas. Sus resultados se ofrecen en abierto a la comunidad científica y dos de sus investigadores: Demis Hassabis y John Michael Jumper fueron distinguidos con el Nobel de Química el año pasado “por sus contribuciones al uso de inteligencia artificial para la predicción exacta de la estructura tridimensional de las proteínas”.

Ahora DeepMind traslada esa aproximación al genoma. AlphaGenome es un nuevo modelo de IA de aprendizaje profundo que busca predecir cómo las variaciones en la secuencia del ADN —en su mayoría localizadas en regiones no codificantes— influyen en la regulación de los genes. Estas variaciones, que representan alrededor del 98 % de los cambios en el genoma, no producen proteínas pero determinan cuándo, dónde y en qué cantidad se expresan, y su interpretación sigue siendo uno de los mayores retos de la genómica moderna debido al importante papel que desempeñan en numerosos procesos biológicos y en el desarrollo de enfermedades.

AlphaGenome es un modelo de IA de aprendizaje profundo capaz de predecir la función de secuencias de ADN de hasta un millón de pares de bases

AlphaGenome, que se presenta esta semana en Nature, es capaz de predecir la función de secuencias de ADN de hasta un millón de pares de bases. A diferencia de los métodos existentes, que suelen tener que elegir entre analizar fragmentos largos con poca precisión o fragmentos cortos con gran detalle, la tecnología combina ambas capacidades: contexto genómico amplio y resolución a nivel de base.

Datos de genomas humanos y de ratón

La empresa explica en un comunicado que el modelo ha sido entrenado con datos de genomas humanos y de ratón procedentes de grandes consorcios públicos y aprende a relacionar la secuencia de ADN con distintos procesos biológicos. Entre otras cosas, puede predecir patrones de expresión génica, empalme del ARN, accesibilidad del ADN o interacciones entre regiones distantes del genoma. En total, AlphaGenome puede generar predicciones simultáneas para 5 930 señales funcionales humanas o 1 128 en ratón.

El programa está disponible en fase preliminar para uso no comercial a través de una API, con el objetivo de que la comunidad científica explore sus aplicaciones y contribuya a su desarrollo

Según señalaron los autores principales del estudio, Žiga Avsec, Natasha Latysheva y Pushmeet Kohli, todos ellos de DeepMind, en un briefing online para medios de comunicación este martes, “el sistema iguala o supera el rendimiento de los mejores modelos disponibles en 25 de 26 evaluaciones estándar sobre el efecto de variantes genéticas”.

El programa está disponible en fase preliminar para uso no comercial a través de una API, con el objetivo de que la comunidad científica explore sus aplicaciones y contribuya a su desarrollo.

Más de 500 usuarios en España

Según comentó Natasha Latysheva durante su intervención, “alrededor de 3 000 científicos de 160 países están utilizando la API AlphaGenome”. Fuentes de DeepMind comentan a SINC que en España están viendo un “interés inicial increíble, con más de 500 usuarios que utilizan ya el programa”. Y añaden que están deseando ver los casos de uso específicos y las investigaciones que surjan de este grupo en los próximos meses.

Una de las principales ventajas del sistema es que reúne en una sola herramienta tareas que antes exigían modelos distintos

Una de las principales ventajas del sistema es que reúne en una sola herramienta tareas que antes exigían modelos distintos, lo que permite evaluar de forma conjunta múltiples consecuencias moleculares de una misma variante.

“Es la primera vez que un modelo combina un contexto genómico de largo alcance con precisión a nivel de base y un rendimiento puntero en una amplia gama de tareas genómicas”, señala Caleb Lareau, investigador del Memorial Sloan Kettering Cancer Center, que no ha participado en el estudio.

Una herramienta de investigación

El trabajo también muestra ejemplos prácticos de su aplicación en investigación biomédica. En un estudio previo sobre leucemia linfoblástica aguda de células T, AlphaGenome fue capaz de reproducir el mecanismo conocido por el que una mutación no codificante activa un gen implicado en la enfermedad, lo que ilustra su potencial para conectar variantes regulatorias con genes diana.

El sistema reprodujo un mecanismo conocido en leucemia linfoblástica aguda de células T, mostrando su capacidad para vincular variantes no codificantes con genes diana

Los autores subrayan que AlphaGenome está pensado como una herramienta de investigación y no ha sido diseñado ni validado para su uso clínico directo. El modelo predice efectos moleculares, pero no permite inferir de forma completa rasgos complejos o riesgo individual de enfermedad, que dependen también de factores ambientales y de desarrollo.

“Determinar la relevancia de las variantes no codificantes es extremadamente difícil, especialmente cuando se trata de hacerlo a gran escala”, afirma Marc Mansour, de University College London, que tampoco participa en el estudio. “Herramientas como AlphaGenome pueden ayudar a establecer mejores conexiones entre variación genética y enfermedad”.

Herramientas como AlphaGenome pueden ayudar a establecer mejores conexiones entre variación genética y enfermedad

Marc Mansour (University College London)

Aun así, los investigadores consideran que el modelo abre nuevas vías para estudiar enfermedades genéticas, especialmente las asociadas a variantes raras, además de impulsar la biología sintética y favorecer nuevos avances en la investigación básica sobre el funcionamiento del genoma.

El equipo de DeepMind señaló en el briefing que la herramienta también podría resultar útil en el desarrollo de terapias génicas, en la identificación de variantes que actúan como ‘drivers’ en cáncer, en el diagnóstico de enfermedades raras y en el diseño de terapias basadas en ARN, incluidos los ARNt terapéuticos, ámbitos en los que disponer de predicciones más completas y precisas permitiría progresar con mayor rapidez.

Referencia

Žiga Avsec et al. “Advancing regulatory variant effect prediction with AlphaGenome”. Nature, 2026.

Fuente:
SINC
Derechos: Creative Commons.
Artículos relacionados