Investigadores del Instituto de Investigación Biomédica (IRB Barcelona) han desarrollado un software para analizar y comprender a través de mapas de fácil interpretación el gran volumen de datos epigenéticos y genéticos disponibles. Su nombre, ChroGPS, que se presenta en la revista Nucleic Acids Resarch.
ChroGPS es un software para facilitar el análisis y la comprensión de los datos epigenéticos y extraer información inteligible, que se puede descargar gratuitamente en Bioconductor, un repositorio de referencia de software biocomputacional. Los investigadores del Instituto de Investigación Biomédica (IRB Barcelona) describen los usos del programa en la revista Nucleic Acids Research, donde explican que ChroGPS es una respuesta a un problema que se arrastra desde hace una década.
En los últimos 15 años, investigadores de todo el mundo han ido generando una gran cantidad de información sobre el epigenoma: proteínas, factores y marcas epigenéticas que unidas al DNA regulan la expresión de los genes. Proyectos multitudinarios como el ENCODE (para humanos y ratones) o el modENCODE (para otros sistemas modelo de laboratorio, como la mosca Drosophila o el gusano C.Elegans) se han dedicado a recoger estos datos para analizarlos e interpretarlos en conjunto con los datos genómicos y extraer hipótesis de funciones y relaciones.
A pesar de estos y otros esfuerzos, se requieren todavía herramientas que permitan extraer información funcional y relacional del epigenoma y presenten los resultados de una manera tan visual como ChroGPS.
“Con ChroGPS hemos querido integrar los datos epigenéticos con los genéticos para sacarles todo el jugo, que hay mucho, y poder comprender la información que contienen. A día de hoy, los análisis son extremadamente complejos y los resultados para interpretar los datos muy opacos”, dice Ferran Azorín, jefe del laboratorio de Estructura y Función de la Cromatina en el IRB y profesor de investigación del CSIC, estudioso de la regulación epigenómica.
“Con nuestra herramienta hemos llegado a las mismas conclusiones que las presentadas en Nature por los investigadores del modENCODE, pero con la enorme diferencia que en vez de ver la información representado en centenares de gráficos y figuras que generó modENCODE, lo hemos conseguido con un único mapa”, señala Azorín.
La iniciativa surge del diálogo entre el grupo de Azorín, a través del estudiante de doctorado, Joan Font-Burgada, y el bioinformático Òscar Reina del equipo de la Plataforma de Bioestadística y Bioinformática del IRB, liderada por David Rossell en ese momento.
“ChroGPS se basa en la aplicación secuencial de dos pasos: primero, la generación de distancias (o grados de similitud) entre elementos epigenéticos basándonos en varias métricas posibles que hemos desarrollado, y después, en la representación de estas distancias en forma de mapas bi- o tridimensionales para facilitar su interpretación. Como son, por ejemplo, los mapas visuales que se pueden derivar de esas tablas de distancias por quilómetros entre ciudades”, describe Òscar Reina, uno de los desarrolladores.
“Lo más importante para nosotros en esta primera etapa ha sido presentar información biológica de forma sencilla, pero a su vez fiable desde un punto de vista de tratamiento de datos, por ejemplo corrigiendo desviaciones sistemáticas entre experimentos que pueden inducir a conclusiones erróneas”, añade Rossell, hoy en la Universidad de Warwick, en el Reino Unido.
Ahora que el programa ya está disponible como código abierto para toda la comunidad, los investigadores se plantean nuevos retos con ChroGPS. Ferran Azorín tiene entre los objetivos seguir un proceso complejo de transformación de célula normal en cancerosa a través de los cambios genéticos y epigenéticos que presenta. Para encarar este proyecto con ChroGPS, deberán dar nuevo pasos en metodología estadística y matemática.