Han pasado ya veintiún años desde la publicación de las primeras versiones del genoma humano. Se trataba entonces de secuencias incompletas, pero aún así de incalculable valor. Ahora, en un esfuerzo conjunto sin precedentes, seis equipos de investigación, todos miembros del consorcio T2T (Telomere to Telomere) han presentado, en sendos estudios, la primera secuenciación completa del ‘código de instrucciones’ del ser humano.
El nuevo genoma incluye el 8% de ADN que hace dos décadas no pudo identificarse por la falta de la tecnología necesaria. Ahora, sin embargo, las lagunas de aquellos primeros intentos han podido rellenarse con éxito, hasta completar los más de 6.000 millones de pares de bases, las ‘letras’ de ADN que conforman la totalidad de nuestra herencia genética. El nuevo genoma, pues, incluye los más de 200 millones de pares de bases que se ‘perdieron’ en 2001, añade más de 2.000 genes a los que ya se conocían y revela «capítulos en el manual de la vida que nunca antes se habían leído».
El trabajo del consorcio T2T, formado por más de 100 investigadores bajo la dirección de Karen Miga, de la Universidad de California en Santa Cruz, y Adam Phillippy, del Instituto Nacional de Investigación del Genoma Humano en Maryland, fue anunciado extraoficialmente el año pasado, antes de ser revisado por pares. La propia Miga insistió entonces en que no consideraría el anuncio como oficial hasta que el artículo fuera revisado y publicado en una revista científica. Ahora ese momento ha llegado y no solo uno, sino seis artículos diferentes sobre el logro acaban de aparecer en la revista ‘Science’. (1, 2, 3, 4, 5 y 6).
Los seres humanos tenemos miles de genes que son, en conjunto, el ‘libro de instrucciones’ que nos convierte en lo que somos. Los genes se agrupan en largas moléculas de ADN, los cromosomas, que se encuentran en el interior de los núcleos de cada una de nuestras células. Si desplegáramos un único cromosoma, su longitud superaría los dos metros. La información genética se ‘escribe’ combinando cuatro pequeñas ‘letras químicas’, llamadas bases (A, C, G y T) que se encadenan a lo largo de los cromosomas. Las múltiples combinaciones de estas cuatro únicas letras conforman la totalidad de nuestra información genética.
Cada cromosoma, además, tiene cuatro brazos que se unen por el centro, lo que les confiere la forma de una ‘X’. La mayor parte del ADN que no se había podido secuenciar hasta ahora procede precisamente de esos puntos centrales, llamados ‘centrómeros’, que desempeñan un papel clave en la división celular y que, extrañamente, están llenos de repeticiones. Otra dificultad es que la mayoría de las células contienen dos genomas, uno del padre y otro de la madre. Cuando los investigadores intentan ensamblar todas las piezas, las secuencias de cada padre pueden mezclarse, oscureciendo la variación real dentro de cada genoma individual.
Ya en 2018, Miga y Phillippy formaron parte de un equipo que consiguió secuenciar algunas de las partes que faltaban del genoma humano. Y ahora, por fin, han conseguido completarlo.
Diez años de trabajo
Hace cerca de diez años, los investigadores tuvieron la idea de obtener un genoma completo secuenciando solo uno de los dos genomas que contienen las células. Para ello utilizaron unas líneas celulares muy especiales, las CHM13, en las que trabajaba el genetista reproductivo Urvashi Surti, de la Universidad de Pittsburg y en las que, debido a un fallo en su desarrollo, las células terminan teniendo dos copias del ADN del padre y ninguna de la madre. Esa línea celular con un solo genoma fue lo que hizo posible su ensamblaje completo.
«Se trata de algo único -explica Phillippy-, en el sentido de que no es el genoma de nadie que haya vivido. El ADN procede de un único espermatozoide, por lo que es la mitad del genoma de un padre potencial, que se ha duplicado». Las células utilizadas se recolectaron de un voluntario anónimo hace varias décadas y no se sabe, por lo tanto, de quién proceden. «Incluso si quisiéramos -dice el investigador- no podríamos averiguar a quién pertenecen esas células».
Cuando comenzaron el proyecto, recuerda Phillippy, no había garantías de éxito, pero «teníamos la ventaja del optimismo juvenil y nos entusiasmó la promesa de las nuevas tecnologías» que empezaban a estar disponibles. Así, los avances parciales que cada uno de los seis equipos de científicos fue consiguiendo a lo largo de una década se fueron sumando para llegar por fin al objetivo final. El último empujón, prosigue el investigador, llegó cuando la firma Pacific Biosciences introdujo una nueva máquina de secuenciación que generó lecturas de secuenciación de lectura larga con una precisión superior al 99 por ciento. «Era la última pieza del rompecabezas, como ponerse un nuevo par de anteojos».
El origen de los humanos
A medida que iba surgiendo cada nuevo capítulo de nuestro manual de instrucciones genético, los investigadores trataban de darle un significado biológico. Por ejemplo, el equipo descubrió niveles inesperadamente altos de variación genética en los centrómeros y otras regiones: «Un nuevo cofre del tesoro de variantes que podemos estudiar para ver si tienen un significado funcional», dice Phillippy.
En conjunto, los datos obtenidos son, en palabras de Miga, «la base para una nueva era» en el estudio de los centrómeros. A partir de ahora, en efecto, los científicos podrán explorar cómo los nuevos hallazgos afectan a las enfermedades y «cómo cambia el ADN del centrómero con el tiempo».
Los resultados de T2T también apuntan a patrones más complejos de variación en los genes, que podrían haber ayudado a crear la especie humana y que explicarían nuestra rápida evolución. La secuencia completa del genoma, por ejemplo, revela que algunos genes asociados con cerebros más grandes son muy variables. Una persona puede tener 10 copias de un gen en particular, mientras que otras pueden tener solo una o dos. Esta variación puede significar problemas durante la fertilización, cuando los cromosomas del padre y de la madre se alinean e intercambian piezas. Los genes que no coinciden pueden conducir a ‘un terremoto’ de alteraciones genéticas que pueden explicar tanto los rápidos cambios evolutivos como la susceptibilidad a enfermedades.
Con todo, la secuenciación exitosa de un solo genoma no significa que se haya dicho la última palabra. Los miembros del consorcio ya están trabajando para secuenciar un genoma con los diferentes cromosomas heredados de cada progenitor. También están comenzando un esfuerzo de pan-genoma para leer las secuencias de ADN completas de cientos de personas de todo el mundo, con el objetivo de crear un genoma humano lo más completo posible, que represente mucha más diversidad humana.
El hito recién alcanzado por los científicos del T2T es, pues, un primer paso indispensable, una auténtica ‘piedra Roseta’ que permitirá, por primera vez, observar la variación completa en cientos de miles de otros genomas en el futuro.