El pino taeda es la especie arbórea más importante comercialmente en EE UU y la fuente de la mayoría de los productos de papel de este país. Investigadores de la Universidad de California han publicado la secuenciación de su genoma, que es el mayor hasta la fecha y el más completo del grupo de las coníferas.
Un equipo de científicos liderados por la Universidad de California (EE UU) ha logrado secuenciar el enorme genoma del pino taeda, que es alrededor de siete veces más grande que el humano. Se convierte así en el mayor secuenciado hasta la fecha y la secuencia más completa del genoma de coníferas que haya sido publicada.
"Es un gran genoma. Pero el reto no ha sido solo recopilar los datos de la secuencia. El mayor problema era el montaje de esa secuencia en orden", declara David Neale, investigador que ha dirigido el estudio que publica la revista Genome Biology.
Este logro marca la primera gran prueba de un nuevo método de análisis que puede acelerar el montaje del genoma comprimiendo cien veces la secuencia de datos. Asimismo, esta secuenciación ayudará a los científicos a crear variedades mejoradas, y comprender la evolución y la diversidad de las plantas.
Según el trabajo, el enorme tamaño del genoma de este pino había sido un obstáculo para su secuenciación. Los métodos modernos que se emplean para esta tarea hacen que sea relativamente fácil de leer las ‘letras’ individuales en el ADN, pero solo en fragmentos cortos. En el caso del pino taeda, 16.000 millones de fragmentos separados tuvieron que adaptarse de nuevo juntos en un puzle computacional denominado genoma de montaje.
"Hemos sido capaces de ensamblar el genoma humano, pero estaba cerca del límite de nuestra capacidad, siete veces más grande era simplemente demasiado", explica Steven Salzberg, profesor de medicina y bioestadística en la Universidad Johns Hopkins (EE UU), uno de los directores del equipo de montaje del genoma de este pino.
El método lo desarrollaron el profesor James A. Yorke y otros científicos de la Universidad de Maryland (EE UU) y compila por superposición fragmentos de secuencia en trozos mucho más grandes, y luego deshecha toda la información redundante. La eliminación de las redundancias deja al ordenador con 100 veces menos secuencia de datos a tratar.
El estudio confirma que el genoma de este pino es tan grande porque está repleto de elementos de ADN invasivos que se copian a sí mismos en todo el genoma. Aproximadamente el 82% del genoma se compone de estos y otros fragmentos repetitivos de secuencia.
La secuenciación reveló además la localización de los genes que pueden estar implicados en la lucha contra patógenos, lo que ayudará a los científicos comprender mejor la resistencia a enfermedades en los pinos.