Ciencia

La semiótica molecular

Pedro García Barreno explica cómo leer el ADN

Pedro García Barreno

Publicada 24 enero 2001 01:00h

Continuando la serie de artículos en torno al genoma humano que Pedro García Barreno viene realizando para EL CULTURAL, el académico de Ciencias Exactas, Físicas y Naturales aborda en esta ocasión el relevante y al mismo tiempo apasionante proceso de decodificación de moléculas de ADN. Determinando en primer lugar su relevancia en el entorno científico, García Barreno analiza paso a paso los mecanismos de lectura de lo que se ha denominado la llave de la medicina molecular.

En 1953, dos jóvenes y desconocidos científicos pusieron en marcha una revolución en las ciencias de la vida cuyas consecuencias persisten. James D. Watson (1928) y Francis Crick (1916) determinaron la estructura del ADN: "Deseamos sugerir una estructura para el ADN. Esa estructura tiene hechos originales que son de considerable interés biológico". Su observación ha tenido consecuencias extraordinarias y representa uno de los logros capitales de la ciencia del siglo XX; por ello recibieron el premio Nobel de Fisiología o Medicina en 1962. La biotecnología, la medicina molecular, la terapia génica o el Proyecto Genoma Humano, son fruto de aquel trabajo.

Una molécula de ADN es una larguísima hebra de cuatro subunidades diferentes denominadas bases: adenina, citosina, guanina y timina (A, C, G y T). Esas bases están unidas entre sí a modo de las cuentas de un collar; ello, mediante un mecanismo de engarce formado por moléculas de azúcar (desoxirribosa) y fosfato. El ADN en el núcleo celular se dispone en dos hebras o bandas enrolladas entre sí formando una superestructura llamada doble hélice, que semeja una escalera de caracol. Las bases de cada una de las bandas interaccionan entre sí formando pares de bases y a modo de los escalones de la escalera; por su parte, las moléculas de azúcar y los grupos fosfato de cada banda forman los largueros de la escalera. Si una determinada posición en una de las bandas está ocupada por la base A, el otro miembro del par, correspondiente a la otra banda, será T, y viceversa. De manera similar, a C corresponderá G, y viceversa. En otras palabras, A es complementaria de T, y C de G. Esta complementariedad se denomina regla de Chargaff (Erwin, 1905). Consecuencia de esta complementariedad estricta entre bases en la doble hélice de ADN es que, si se conoce la secuencia de bases de una de las bandas, puede deducirse la secuencia de bases de la banda opuesta. En otras palabras, cada banda de ADN contiene toda la información necesaria para recrear la otra banda. En la célebre publicación sobre la estructura del ADN, Watson y Crick escribieron: "No se nos escapa que el apareamiento específico de bases propuesto sugiere, inmediatamente, un posible mecanismo de copia para el material genético". Ello garantiza un mecanismo de copia fiable cuando la célula se divide; y para formar un organismo complejo, que contiene miles y miles de millones de células formadas a partir de una célula fecundada, se requieren numerosos ciclos de división celular.

En términos generales, el mecanismo de replicación del ADN es sencillo; primero, las dos bandas complementarias de ADN se desenrollan y se separan la una de la otra. Luego, se copian dos nuevas hebras a partir de cada una de las dos bandas por separado y usando la regla A:T/C:G. Dado que cada banda independiente de ADN dirige la síntesis de su complementaria, el resultado de la replicación es la síntesis de dos moléculas de doble banda de ADN idénticas. La pieza principal de la máquina copiadora responsable de la replicación del ADN es una molécula denominada ADN polimerasa.

¿Cómo accede la célula a la información génica almacenada en su ADN? El programa genético completo de un organismo se denomina genoma. El genoma puede imaginarse como una secuencia de pares de bases (A:T, C:G, G:C o T:A); de 100 millones a 3.000 millones de pares de bases según el organismo. Si una base se representa por una letra impresa en páginas similares a las que acogen el presente artículo, el genoma humano corresponde a una enciclopedia de un millón de páginas. El genoma se organiza en unidades discretas de ADN denominadas cromosomas; ellos, en número dispar, desde un par en una lombriz hasta más de cien en algunas mariposas y crustáceos; la especie humana tiene 23 pares. La unidad elemental de la información génica contenida en los cromosomas se denomina gen. Cada cromosoma contiene varios miles de genes formados, cada uno de ellos, por mil a diez mil pares de bases. La información necesaria para construir una levadura está contenida en, aproximadamente, seis mil genes; la de un ser humano debe estarlo en, más o menos, 80.000 genes.

Un gen típico puede subdividirse en dos componentes funcionalmente independientes. Uno de ellos, región codificante, dirige la síntesis de su producto funcional -proteína- en un proceso de dos pasos: trascripción y traducción. La otra parte del gen, denominada región reguladora o de control, es un interruptor de "encendido-apagado" que determina si la región codificante ha de expresarse o no. El desarrollo de un organismo y el funcionamiento distintivo de cada uno de sus tipos celulares puede considerarse como una cascada de acciones sobre los interruptores mencionados. Si se consideran todos los interruptores que controlan la expresión de los genes en dos tipos celulares diferentes, la mayoría de ellos estarán en posición de apagado en ambos; el 10-20% estarán en posición de encendido en los dos, y sólo 1-2% de los interruptores estará en esa última posición en un tipo celular pero no en el otro.
Si la replicación del ADN garantiza la continuidad de la información génica de padres a hijos, la trascripción regula la expresión de esa información en cada célula; la trascripción dicta lo que cada célula es. La ARN polimerasa transcribe porciones determinadas -genes- de una de las bandas de la doble hélice de ADN en un polímero lineal similar de bases, el ácido ribonucleico (ARN, que contiene el azúcar ribosa en vez de desoxirribosa, y las bases A, C, G, y U -uridina- en vez de T). El PNFM de 1959 recayó en Severo Ochoa y Arthur Kornberg "por su descubrimiento de los mecanismos de biosíntesis del ARN y del ADN".

La transcripción sigue un principio de complementariedad similar al indicado para la replicación del ADN. En el caso de la transcripción, la complementariedad es similar a excepción de que a una A en la banda de lectura del ADN le corresponderá una U en el ARN complementario; pero a una T en el ADN corresponderá una A en el ARN. Esto es, a la secuencia de bases ATCG en el ADN le corresponde la secuencia de bases UAGC en el ARN. La banda de ADN que es transcrita se denomina banda codificante. Una vez que ha sido completada la síntesis del ARN complementario a un gen determinado, se libera como una molécula lineal sencilla: ARN nuclear. Este ARN será procesado y convertido en ARN mensajero que dirigirá la síntesis de la proteína codificada en el correspondiente gen; ello, en un proceso denominado traducción. La replicación y la transcripción tienen lugar en el núcleo de la célula; la traducción se realiza en el citoplasma sobre unas estructuras especializadas (ribosomas). Esta secuencia de información, ADN ® ARN ® proteína, se denomina dogma central de la biología molecular. Aunque la mayoría de los genes transcriben ARN mensajeros, algunos genes transcriben ARN ribosómicos (ARNr) y otros ARN de transferencia (ARNt). Ni ARNr ni ARNt traducen proteínas; están involucrados en la estructura de los ribosomas los primeros, y en el proceso de biosíntesis de las proteínas -transfieren los aminoácidos a la cadena polipeptídica en crecimiento- los segundos.

La traducción refleja el hecho de que un lenguaje molecular se traduce a otro. El primer lenguaje, el del ADN y del ARN, se escribe mediante el orden de las cuatro bases y obedece, esencialmente, a las mismas reglas de complementariedad; ADN y ARN son dialectos de un mismo lenguaje. El lenguaje de proteína es muy diferente al del ADN/ARN y requiere una traducción compleja que convierta la secuencia de bases en los ácidos nucleicos en una secuencia de aminoácidos en las proteínas. Los aminoácidos son completamente diferentes de las bases. Frente a las cuatro bases, 20 son los aminoácidos que forman las cadenas polipeptídicas que conforman las proteínas. Dada la gran diferencia estructural entre aminoácidos y bases no debe extrañar que se requiera una compleja maquinaria de traducción para convertir la secuencia de bases de un gen, en otra gramaticalmente correcta de aminoácidos en la correspondiente proteína.

¿Cómo una secuencia de sólo cuatro bases en un gen dirige la síntesis de una proteína formada por una secuencia de 20 aminoácidos? La solución a este problema de codificación es que cada aminoácido está especificado por una combinación de tres bases contiguas. El código que relaciona la secuencia de bases en el ARN con la secuencia de aminoácidos en una proteína se denomina código genético. El código genético asigna cada uno de los 20 aminoácidos a un determinado grupo contiguo de tres bases, tripletes o codones en el ARN. Existen 64 combinaciones posibles de cuatro bases agrupadas en tripletes. La correspondencia se asegura, primero porque algunos aminoácidos están especificados por más de un triple (redundancia del código), y segundo porque algunos triples no codifican aminoácidos sino que se utilizan como señales de terminación del proceso de traducción. El PNFM de 1968 se concedió a Robert W. Holley (1922-1993), Har G. Khorana (1922) y Marshall Niremberg (1927) "por su interpretación del código genético y su función en la síntesis de proteínas".
Un hecho importante respecto a las diferencias estructurales entre el ADN y las proteínas es que mientras la secuencia de bases apenas influye en la estructura en doble hélice del ADN, la secuencia de aminoácidos tiene enormes consecuencias sobre la estructura de la proteína. Cada proteína se pliega en una estructura tridimensional, compleja y distintiva; y esta gran diversidad estructural permite a las diferentes proteínas desarrollar funciones celulares distintivas. Ello significa que mientras posibles cambios de una base por otra no alteran la estabilidad del ADN -mutaciones que se transmiten a la descendencia-, la sustitución de un aminoácido por otro puede tener graves consecuencias: enfermedad molecular. El objetivo del Proyecto Genoma Humano es, una vez conseguida la secuencia completa del ADN -el "santo grial" de la biología-, identificar todos los genes y su función. Ello ha de representar un broche de oro al "conócete a ti mismo" y la llave de la medicina molecular.

Más en Ciencia