La tercera fase del Proyecto ENCODE ofrece nuevos hallazgos sobre la organización y regulación del genoma humano y de ratón, un logro que ayudará a revelar cómo la variación genética interviene en el desarrollo de enfermedades. Aproximadamente 500 científicos de todo el mundo, también España, han participado en este registro online. Los resultados se han publicado en 14 artículos de la revista Nature.
El genoma humano contiene unos 20.000 genes encargados de codificar proteínas, esas moléculas que desempeñan gran variedad de funciones dentro de una célula: estructurales, mecánicas, bioquímicas y de señalización. Sin embargo, las partes codificantes de nuestros genes solo representan alrededor del 2 % de todo el genoma.
Durante las últimas dos décadas, los científicos han estado tratando de averiguar qué hace el 98 % restante de nuestro ADN. Uno de los grandes desafíos ha sido el mapeo de los elementos funcionales –las regiones que determinan el grado de expresión de los genes– en ese alto porcentaje.
El proyecto de la Enciclopedia de Elementos de ADN (más conocido como ENCODE) se creó en 2003, poco después de la primera secuenciación completa del genoma humano, con el objetivo de crear un catálogo de dichos elementos funcionales y perfilar su papel en la regulación génica.
Desde entonces, miles de investigadores de todo el mundo se han valido de sus datos para arrojar luz sobre la biología del cáncer, las enfermedades cardiovasculares y la genética humana, entre otros. Esta semana, una colección de 14 artículos en la revista Nature hace pública la tercera fase de este programa, que proporciona nuevos hallazgos sobre la organización y función del genoma.
En 2007, la fase piloto buscó elementos funcionales en el 1 % del genoma de unas pocas líneas celulares humanas. Cinco años más tarde, la segunda fase amplió la búsqueda a todo el genoma en más líneas celulares humanas. Ahora, la última fase ha generado el catálogo más completo, con células tomadas directamente de tejidos.
El equipo, formado por un consorcio internacional de aproximadamente 500 científicos, ha conseguido publicar un registro online de más de 1.200.000 candidatos a elementos funcionales del ADN en el genoma humano y roedor –muy similares genómica y biológicamente–, un logro que ayudará a revelar cómo la variación genética da forma a la salud y las enfermedades humanas.
“Si pensamos en el genoma como un libro, los resultados de este estudio representan un antes y un después en la descripción de sus capítulos, letras y contenido”, explica a Sinc Manuel Muñoz Aguirre, investigador en el Centro de Regulación Genómica (CRG) y uno de los autores de un estudio complementario realizado con datos de ENCODE. “Este proyecto ha abierto nuevas fronteras para entender el código de la vida humana”.
“Entender la composición del genoma humano es vital para deducir los mecanismos que forman parte de los procesos biológicos normales, así como los que tienen un papel en la manifestación de enfermedades”, añade Muñoz Aguirre.
El propósito principal de ENCODE es identificar y caracterizar los elementos del genoma que podrían tener un rol potencial en la regulación de los genes, algo fundamental para avanzar en el conocimiento sobre cómo funciona el cuerpo humano.
Además, esta enciclopedia del genoma es fácilmente accesible a la comunidad investigadora. “Es un compendio tan amplio de datos biológicos que puede servir como base para contestar muchos tipos de preguntas diferentes acerca del funcionamiento de nuestro cuerpo”, apunta Muñoz Aguirre. “Es un proyecto ejemplar de colaboración científica desde distintas partes del mundo”.
Estos esfuerzos en la ciencia abierta han dado como resultado más de 2.000 publicaciones de investigadores no pertenecientes a ENCODE, que han utilizado los datos generados por el proyecto.
Sobre cómo estos hallazgos pueden cambiar la forma en la que nos enfrentamos a distintas patologías, el experto del CRG lo tiene claro: “Caracterizar los elementos reguladores en nuestro genoma es indispensable para describir cómo este puede cambiar al cursar una enfermedad”.
En el caso del cáncer, donde ocurren muchas mutaciones y cambios en el genoma, saber si estas mutaciones afectan a los elementos reguladores puede ayudar a los equipos investigadores a entender cómo funcionan los distintos mecanismos detrás del tumor –así como de otras patologías–, e identificar tratamientos potenciales.
Portada de esta semana de la revista 'Nature'. / Nature
Otros trabajos de la colección utilizan los datos de ENCODE para revelar los principios que rigen el funcionamiento de algunos elementos funcionales. Por ejemplo, los expertos mapearon las interacciones de la cromatina (un complejo de ADN y proteínas) en 24 tipos de células humanas y descubrieron que las diferencias en el bucle de cromatina entre los tipos de células pueden afectar a la expresión de los genes.
Además, los investigadores han identificado muchos sitios adicionales que codifican las moléculas de ARN que probablemente influyan en la expresión de los genes. Estas secuencias de ARN no se traducen en proteínas, sino que actúan de diversas maneras para controlar la cantidad que se produce a partir de los genes codificantes.
También se ha explorado el papel regulador de los elementos reguladores en cis –regiones no codificantes del ADN que regulan la transcripción de los genes cercanos– durante el desarrollo prenatal de los mamíferos en los ratones.
Así, tres de los artículos publicados presentan información sobre los ratones fetales durante ocho etapas de desarrollo. Los resultados pueden servir de punto de partida para la investigación de los elementos reguladores que intervienen en los trastornos del desarrollo humano.
En una publicación en Genome Research, complementaria al informe ENCODE, un equipo dirigido por Thomas Gingeras del Laboratorio Cold Spring Harbor (CHSL) de EE UU y Roderic Guigó del CRG detalla que las células del cuerpo humano pueden clasificarse en cinco grupos principales.
Los investigadores crearon esta nueva clasificación monitorizando el transcriptoma (conjunto de transcripciones de genes) de las células primarias en múltiples órganos. Los cinco grupos celulares actúan como bloques de construcción fundamentales, a partir de los cuales se ‘ensamblan’ los tejidos y órganos del cuerpo humano.
Basándose en la expresión de estos genes, los autores estimaron la composición celular de los tejidos, y descubrieron que esta composición refleja los rasgos fenotípicos de los tejidos y cambia con la edad, el sexo y los estados de enfermedad.
“Entender esto es un buen primer paso para la caracterización de lo que ocurre en una patología”, declara Muñoz Aguirre. “Al contrastar la información entre individuos enfermos y saludables, tendremos una pista para entender qué puede salir mal en las células”.
El proyecto ENCODE ha comenzado ya su cuarta fase, empleando nuevas tecnologías e investigando tipos de células adicionales. “Esta enciclopedia es un recurso vivo. Tiene un principio pero en realidad no tiene fin. Seguirá mejorando y creciendo a medida que pase el tiempo”, concluye Thomas Gingeras.
Referencias:
Expanded encyclopaedias of DNA elements in the human and mouse genomes. DOI 10.1038/s41586-020-2493-4 https://www.nature.com/articles/s41586-020-2493-4
Perspectives on ENCODE. DOI 10.1038/s41586-020-2449-8 https://www.nature.com/articles/s41586-020-2449-8
A large-scale binding and functional map of human RNA-binding proteins. DOI 10.1038/s41586-020-2077-3 https://www.nature.com/articles/s41586-020-2077-3
Landscape of cohesin-mediated chromatin loops in the human genome. DOI 10.1038/s41586-020-2151-x https://www.nature.com/articles/s41586-020-2151-x
Occupancy maps of 208 chromatinassociated proteins in one human cell type. DOI 10.1038/s41586-020-2023-4 https://www.nature.com/articles/s41586-020-2023-4
An atlas of dynamic chromatin landscapes in mouse fetal development. DOI 10.1038/s41586-020-2093-3 https://www.nature.com/articles/s41586-020-2093-3
Spatiotemporal DNA methylome dynamics of the developing mouse fetus. DOI 10.1038/s41586-020-2119-x https://www.nature.com/articles/s41586-020-2119-x
The changing mouse embryo transcriptome at whole tissue and single-cell resolution. DOI 10.1038/s41586-020-2536-x https://www.nature.com/articles/s41586-020-2536-x
Global reference mapping of human transcription factor footprints. DOI 10.1038/s41586-020-2528-x https://www.nature.com/articles/s41586-020-2528-x
Index and biological spectrum of human DNase I hypersensitive sites. DOI 10.1038/s41586-020-2559-3 https://www.nature.com/articles/s41586-020-2559-3
An integrative ENCODE resource for cancer genomics. DOI 10.1038/s41467-020-14743-w https://www.nature.com/articles/s41467-020-14743-w
Transcriptional activity and strain-specific history of mouse pseudogenes. DOI 10.1038/s41467-020-17157-w https://www.nature.com/articles/s41467-020-17157-w
Detecting sample swaps in diverse NGS data types using linkage disequilibrium. DOI 10.1038/s41467-020-17453-5 https://www.nature.com/articles/s41467-020-17453-5
Supervised enhancer prediction with epigenetic-pattern recognition and targeted validation. DOI 10.1038/s41592-020-0907-8 https://www.nature.com/articles/s41592-020-0907-8