El 26 de junio de 2000, el presidente de los Estados Unidos Bill Clinton, acompañado de los investigadores J. Craig Venter Francis Collins, comparecía para anunciar al mundo que el Proyecto Genoma Humano había tenido éxito: la mayoría de los genes codificadores de proteínas, las 'líneas de código' que nos hacen humanos, habían sido desentrañados. Una pequeña mácula, no obstante, empañaba el hito: un 8% del código genético, unas 151 millones de secuencias, habían escapado al escrutinio. Recibió el despectivo mote de 'ADN basura': material superfluo incapaz de codificar y abandonado por la evolución en los recodos de nuestros cromosomas.

Para algunos investigadores, sin embargo, fue como completar un rompecabezas y descubrir que te sobran piezas: estos puntos ciegos han supuesto una obsesión durante las dos últimas dos décadas. Para Evan Eichler, investigador del Instituto Médico Howard Hughes (HHMI) de la Universidad de Washington, estas regiones dispersas en el genoma y formadas por largas secuencias repetitivas con genes duplicados eran precisamente lo "más interesante". Ahora, junto al centenar de científicos que forman el Consorcio Telómero a Telómero (T2T), puede cantar victoria: la secuenciación del genoma humano ha sido completada, según publica la revista Science

"Se podría pensar que, con el 92% del genoma completado hace tiempo, el 8% restante no contribuiría mucho", comenta con humor Erich D. Jarvis, investigador de la Universidad Rockefeller y coautor del trabajo. "Pero gracias a esa parte ignorada estamos entendiendo de manera completamentamente nueva la división celular, y nos permitirá estudiar varias enfermedades inaccesibles hasta ahora". El Instituto Nacional de Investigación del Genoma Humano (NHGRI) y la Universidad de California (UC) son otros de los centros que han contibuido al descubrimiento.

Según explica Eichler, el código genético del ser humano se compone de tres mil millones de pares de bases (unos seis mil millones de letras individuales -las famosas adenina (A), timina (T), citosina (C) y guanina (G)-) repartidas por 23 pares de cromosomas. El Proyecto Genoma Humano logró 'cortar' esas líneas de ADN en secuencias de cientos a miles de letras de largo, que los investigadores volvieron a ordenar de nuevo, como una página de un libro triturada y recompuesta letra a letra. Esta tarea se desarrolló en la eucromatina que forma el 92% del genoma: una región muy activa con genes relativamente bien delimitados que producen el ARN necesario para la fabricación de proteínas.  

Esto no fue posible en la región restante, la heterocromatina, porque las secuencias de letras eran tan largas y repetitivas que los científicos se veían incapaces de recomponerlas. Así, las secciones que quedaron a ciegas incluían al centrómero, el punto de unión del cromosoma que lo separa en un brazo corto y otro largo. Cuando la célula se divide, es la primera parte que debe replicarse correctamente para garantizar que la copia se realice sin defectos. Pese a su importancia, sin embargo, ha permanecido hasta la fecha a oscuras. "Solíamos decirles a los jóvenes genetistas que no se metieran en el centrómero porque no iban a salir", bromea otro de los investigadores, el profesor de Evolución y Ecología de la UC Charles Langley.

A día de hoy, la tecnología permite una secuenciación genética mucho más exhaustiva: los socios técnicos del proyecto -Jarvis Labs, Oxford Nanopore Technologies, Pacific Biosciences- proporcionaron herramientas para analizar secuencias largas con alta fidelidad y un margen de acierto del 99,9%, así como algoritmos capaces de detectar anomalías y errores. Sin embargo, la longitud de las líneas no era la única dificultad a salvar. "La mayoría de las células contienen dos genomas, uno que procede del padre y otro de la madre", explica Eichler. "Cuando los investigadores tratan de juntar las piezas, las secuencias de cada uno de los progenitores pueden terminar mezclándose", provocando confusión.

La solución pasaba por trabajar con células que, por alguna alteración, conservasen una única copia de genoma pero no sufrieran ningún otro tipo de anomalía. Así, el genoma de referencia no pertenece a un "ser humano" estrictamente hablando: se obtuvo a partir de un tumor no canceroso denominado mola hidatiforme, que se produce cuando un óvulo pierde su material genético propio pero es fecundado por un espermatozoide. Así termina conteniendo dos copias idénticas del mismo genoma. La cantidad de genes y de material que han aflorado con este proceso, destacan los investigadores, es equivalente a "un cromosoma más".

"Un cofre del tesoro de variantes"

Los autores del hallazgo no ahorran los epítetos literarios. "Vemos aparecer capítulos nunca leídos antes del manuscrito genético de la vida", glosa Eichler. Las regiones antes inexploradas de los centrómeros y los telómeros, las secuencias en los extremos de los cromosomas, están revelando "niveles sin precedentes de variaciones genéticas humanas en genes claves para el desarrollo neurológico y las enfermedades relacionadas". Adam Phillippy, del NHGRI, lo califica como un auténtico "cofre del tesoro de variantes genéticas".

"Sabemos que muchas enfermedades están relacionadas con las repeticiones estructurales en el centrómero, y ahora que estas secuencias ya forman parte del genoma humano de referencia, podemos empezar a trazar un mapa de los orígenes de estos males", destaca por su parte Jarvis. El cáncer es la principal línea de investigación: las células metastásicas se reproducen sin control cuando determinados genes heterocromáticos del centrómero se sobreexpresan, y conocerlos por completo puede abrir la puerta a nuevas terapias.

Las alteraciones del centrómero están también relacionadas con trastornos congénitos vinculados a defectos en la capacidad de réplica celular, como el síndrome de Down. Esta tecnología ha permitido además analizar por completo un cromosoma Y diferente al del genoma de referencia, ya que es de origen africano cuando el segundo es europeo. Los resultados están pendientes de publicación, pero la variabilidad genética contenida en el cromosoma masculino sería tal que "han tardado tanto en secuenciarlo" como en terminar el genoma humano restante.

Finalmente, las implicaciones del hallazgo para la medicina personalizada son relevantes. "En el futuro, cuando alguien vaya a que le secuencien el genoma, podremos identificar todas las variantes en su ADN y usar esa información para guiar mejor su atención sanitaria", valora Phillippy. "Completar la secuenciación del genoma humano ha sido como ponerse un nuevo par de gafas. Ahora podemos verlo todo con claridad, y estamos un paso más cerca de entender qué significa realmente". 

Noticias relacionadas