Un equipo del Centro de Regulación genómica ha desarrollado una herramienta de inteligencia artificial que logra activar o desactivar genes con gran precisión en tipos celulares. Se trata del primer caso de biología generativa para regular el genoma de células de mamífero sanas, según los autores
Un nuevo estudio, publicado en la revista Cell, desarrolla una inteligencia artificial (IA) que diseña moléculas sintéticas capaces de controlar la expresión génica en células de mamíferos sanas.
El equipo del Centro de Regulación Genómica (CRG) ha llevado a cabo un proyecto de investigación que genera secuencias reguladoras de ADN no presentes en la naturaleza. A partir de un modelo de IA se puede pedir a la interfaz que cree fragmentos sintéticos de ADN con criterios personalizados como: “activa este gen en las células madre que se convertirán en glóbulos rojos, pero no en plaquetas”, señalan los autores.
A continuación, el modelo predice la combinación de letras de ADN (A, T, C, G) necesaria para los patrones de expresión génica deseados en tipos específicos de células. Así, los investigadores pueden usar esta información para sintetizar químicamente los fragmentos de ADN de aproximadamente 250 letras y agregarlos a un virus para que lo entregue en el interior de las células.
Para comprobar su efectividad, los investigadores pidieron a la IA que diseñara fragmentos sintéticos que activaran un gen que codifica una proteína fluorescente en algunas células y así dejar los patrones de expresión génica inalterados en otros tipos.
El aprendizaje automático de esta tecnología creó dichos fragmentos desde cero y los investigadores los insertaron en células sanguíneas de ratón, donde el ADN sintético se fusionó con el genoma en lugares aleatorios. El resultado obtenido fue exactamente el deseado y esperado.
Según los científicos, el estudio podría ayudar a desarrollar nuevas terapias génicas que aumenten o reduzcan la actividad de algunos genes. Además, facilita el camino a nuevas estrategias para ajustar las combinaciones de ADN de un paciente y hacer que los tratamientos sean más efectivos y reducir los efectos secundarios.
“Las aplicaciones potenciales son enormes. Es como escribir software, pero para la biología. Nos proporciona nuevas formas de dar instrucciones a una célula y guiar la forma en que se desarrollan y se comportan con una precisión sin precedentes”, afirma Robert Frömel, primer autor del estudio que llevó a cabo el trabajo en el CRG.
Es como escribir software biológico, proporciona nuevas maneras de dar instrucciones a una célula y guiar la forma en que se desarrollan y se comportan con una precisión sin precedentes
El estudio marca un hito en el campo de la biología generativa. Hasta la fecha, los avances en este campo se habían centrado en el diseño de proteínas para crear enzimas y anticuerpos. Sin embargo, muchas enfermedades humanas se derivan de una expresión génica defectuosa que es específica del tipo de célula, para la cual es posible que nunca exista la proteína perfecta para un potencial fármaco.
Según señala a SINC Lars Velten, jefe de grupo en el CRG, “el objetivo de este trabajo es entender la ‘gramática’ del ADN potenciador, es decir, cómo funciona y regula la expresión genética”. Los resultados se han obtenido usando células sanguíneas de ratón y “si se utilizara en organismos vivos en el futuro, necesitaríamos estudios de seguridad a corto plazo en animales”, aclara.
Hemos creado una IA que nos ayuda a comprender y elaborar las frases cortas de ADN, un paso que algún día podría hacer que las terapias génicas sean más seguras y precisas
En cuanto a cuestiones bioéticas, el coautor añade: “No reescribimos genomas completos. Hemos creado una IA que nos ayuda a comprender y elaborar las frases cortas de ADN, un paso de conocimiento que algún día podría hacer que las terapias génicas sean más seguras y precisas”.
“El modelo sugiere diseños de ADN, pero una rigurosa validación de laboratorio decide cuáles de ellos avanzan. Además, añadimos elementos de control solo a las células no reproductivas (somáticas), por lo que ningún cambio pasa a las generaciones futuras”, aclara.
La expresión génica está controlada por elementos reguladores como los potenciadores, pequeños fragmentos de ADN que activan o desactivan genes. Para corregir la expresión génica defectuosa, la IA puede ayudar a diseñar potenciadores ultraselectivos que no existen en la naturaleza y crear terapias sin efectos no deseados en células sanas.
El desarrollo esta tecnología de aprendizaje automático requiere una gran cantidad de datos de alta calidad, pero en el caso de los potenciadores hay un registro escaso. Por ese motivo, los investigadores crearon enormes volúmenes de datos biológicos para construir su modelo de IA.
A través de miles de experimentos con modelos de laboratorio de formación de sangre humana, estudiaron tanto los potenciadores como los factores de transcripción, proteínas que también intervienen en el control de la expresión génica.
“Para crear un modelo de lenguaje para la biología, hay que entender el lenguaje que hablan las células. Nos propusimos descifrar estas reglas de gramática para los potenciadores y así poder crear palabras y frases completamente nuevas”, explica Velten.
Hasta ahora, los potenciadores y los factores de transcripción se han estudiado utilizando líneas celulares de cáncer porque resulta más fácil trabajar con ellas. En cambio, los autores de esta investigación estudiaron células sanas porque es más representativo de la biología humana. Su trabajo ayudó a descubrir mecanismos sutiles que dan forma a nuestro sistema inmunológico y a la producción de células sanguíneas.
Durante cinco años, el equipo diseñó más de 64 000 potenciadores sintéticos, cada uno meticulosamente construido para probar su interacción con los sitios de unión para 38 factores de transcripción diferentes. Es la biblioteca más grande de potenciadores sintéticos jamás construida en células sanguíneas hasta la fecha.
Una vez insertados en las células, el equipo midió la actividad de cada potenciador sintético en siete etapas del desarrollo de las células sanguíneas. Con este método descubrieron que muchos potenciadores activan genes en un tipo de célula, pero reprimen la actividad de genes en otra.
La mayoría de los potenciadores funcionan como el volumen de una radio que aumenta o disminuye la actividad de los genes mientras que otros actúan como interruptores de encendido o apagado. Los autores del estudio lo denominan ‘sinergia negativa’.
Los datos de los experimentos fueron cruciales para establecer los principios de diseño del modelo de aprendizaje automático. Una vez el modelo tuvo suficientes mediciones sobre cómo cada potenciador sintético cambiaba la actividad génica en células reales, este pudo predecir nuevos códigos de ADN.
El estudio fue diseñado como un proyecto piloto para determinar si la tecnología funcionaría antes de iniciar una investigación a mayor escala. Esto es solo la punta del iceberg, ya que tanto los humanos como los ratones cuentan con aproximadamente 1 600 factores de transcripción encargados de regular sus genomas.
Referencia:
Frömel, R. et. al. "" Cell (2025)