La secuencia del material genético se compone de cuatro bases nitrogenadas distintas, que tienen una función equivalente a letras en el código genético: adenina (A), timina (T), guanina (G) y citosina (C) en el ADN y adenina (A), uracilo (U), guanina (G) y citosina (C) en el ARN.
Debido a esto, el número de codones posibles es 64, de los cuales 61 codifican aminoácidos (siendo además uno de ellos el codón de inicio, AUG) y los tres restantes son sitios de parada (UAA, llamado ocre; UAG, llamado ámbar; UGA, llamado ópalo). La secuencia de codones determina la secuencia aminoacídica de una proteína en concreto, que tendrá una estructura y una función específicas.
El genoma de un organismo se encuentra en el ADN o, en el caso de algunos virus, en el ARN. La porción de genoma que codifica una proteína o un ARN se conoce como gen. Esos genes que codifican proteínas están compuestos por unidades de trinucleótidos llamadas codones, cada una de los cuales codifica un aminoácido. Cada subunidad nucleotídica está formada por un fosfato, una desoxirribosa y una de las cuatro posibles bases nitrogenadas. Las bases purínicas adenina (A) y guanina (G) son más grandes y tienen dos anillos aromáticos. Las bases pirimidínicas citosina (C) y timina (T) son más pequeñas y sólo tienen un anillo aromático. En la configuración en doble hélice, dos cadenas de ADN están unidas entre sí por puentes de hidrógeno en una asociación conocida como emparejamiento de bases. Además, estos puentes siempre se forman entre una adenina de una cadena y una timina de la otra y entre una citosina de una cadena y una guanina de la otra. Esto quiere decir que el número de residuos A y T será el mismo en una doble hélice y lo mismo pasará con el número de residuos de G y C. En el ARN, la timina (T) se sustituye por uracilo (U), y la desoxirribosa por una ribosa.
Cada gen codificante de proteína se transcribe en una molécula plantilla, que se conoce como ARN mensajero o ARNm. Éste, a su vez, se traduce en el ribosoma, en una cadena aminoacídica o polipeptídica. En el proceso de traducción se necesita un ARN de transferencia específico para cada aminoácido con el aminoácido unido a él covalentemente, guanosina trifosfato como fuente de energía y ciertos factores de traducción. Los ARNt tienen anticodones complementarios a los codones del ARNm y se pueden “cargar” covalentemente en su extremo 3' terminal CCA con aminoácidos. Los ARNt individuales se cargan con aminoácidos específicos por las enzimas llamadas aminoacil ARNt sintetasas, que tienen alta especificidad tanto por aminoácidos como por ARNt. La alta especificidad de estas enzimas es motivo fundamental del mantenimiento de la fidelidad de la traducción de proteínas.
Hay 4³ = 64 combinaciones diferentes de codones que sean posibles con tripletes de tres nucleótidos: los 64 codones están asignados a aminoácido o a señales de parada en la traducción. Si, por ejemplo, tenemos una secuencia de ARN, UUUAAACCC, y la lectura del fragmento empieza en la primera U (convenio 5' a 3'), habría tres codones que serían UUU, AAA y CCC, cada uno de los cuales especifica un aminoácido. Esta secuencia de ARN se traducirá en una secuencia aminoacídica de tres aminoácidos de longitud. Se puede comparar con la informática, donde un codón se asemejaría a una palabra, lo que sería el “trozo” estándar para el manejo de datos (como un aminoácido a una proteína), y un nucleótido es similar a un bit, que sería la unidad más pequeña. (En la práctica, se necesitarían al menos 2 bits para representar un nucleótido, y 6 para un codón, en un ordenador normal).
Características
Universalidad
El código genético es compartido por todos los organismos conocidos, incluyendo virus y organulos, aunque pueden aparecer pequeñas diferencias. Así, por ejemplo, el codón UUU codifica para el animoácido fenilalanina tanto en bacterias, como en arqueas y en eucariontes. Este hecho indica que el código genético ha tenido un origen único en todos los seres vivos conocidos.
Gracias a la genética molecular, se han distinguido 22 códigos genéticos, que se diferencian del llamado código genético estándar por el significado de uno o más codones. La mayor diversidad se presenta en las mitocondrias, orgánulos de las células eucariotas que se originaron evolutivamente a partir de miembros del dominio Bacteria a través de un proceso de endosimbiosis. El genoma nuclear de los eucariotas sólo suele diferenciarse del código estándar en los codones de iniciación y terminación.
Especificidad y continuidad
Ningún codón codifica más de un aminoácido, ya que, de no ser así, conllevaría problemas considerables para la síntesis de proteínas específicas para cada gen. Tampoco presenta solapamiento: los tripletes se hallan dispuesto de manera lineal y continua, de manera que entre ellos no existan comas ni espacios y sin compartir ninguna base nitrogenada. Su lectura se hace en un solo sentido (5' - 3'), desde el codón de iniciación hasta el codón de parada. Sin embargo, en un mismo ARNm pueden existir varios codones de inicio, lo que conduce a la síntesis de varios polipéptidos diferentes a partir del mismo transcrito.
Degeneración
El código genético tiene redundancia pero no ambigüedad (ver tablas de codones). Por ejemplo, aunque los codones GAA y GAG especifican los dos el ácido glutámico (redundancia), ninguno especifica otro aminoácido (no ambigüedad). Los codones que codifican un aminoácido pueden diferir en alguna de sus tres posiciones, por ejemplo, el ácido glutámico se especifica por GAA y GAG (difieren en la tercera posición), el aminoácido leucina se especifica por los codones UUA, UUG, CUU, CUC, CUA y CUG (difieren en la primera o en la tercera posición), mientras que en el caso de la serina, se especifica por UCA, UCG, UCC, UCU, AGU, AGC (difieren en la primera, segunda o tercera posición).
Tabla del código genético estándar
El código genético estándar se refleja en las siguientes tablas. La tabla 1 muestra qué aminoácido especifica cada uno de los 64 codones. La tabla 2 muestra qué codones especifican cada uno de los 20 aminoácidos que intervienen en la traducción. Estas tablas se llaman tablas de avance y retroceso respectivamente. Por ejemplo, el codón AAU es el aminoácido asparagina, y UGU y UGC representan cisteína (en la denominación estándar por 3 letras, Asn y Cys, respectivamente).
Nótese que el codón AUG codifica para la metionina pero además sirve de sitio de iniciación; el primer AUG en un ARNm es la región que codifica el sitio donde la traducción de proteínas se inicia.
La siguiente tabla inversa indica qué codones codifican cada uno de los aminoácidos.
Aminoácidos
Los aminoácidos son las pequeñas porciones moleculares llamados monómeros los cuales unidos por medio de un enlace principalmente covalente (enlace peptídico) se unen para formar las proteínas.
1. Esenciales: la carencia de estos aminoácidos en la dieta limita el desarrollo del organismo, ya que no es posible reponer las células de los tejidos que mueren o crear tejidos nuevos. En el ser humano, los aminoácidos esenciales son:
• Valina (Val)
• Leucina (Leu)
• Treonina (Thr)
• Lisina (Lys)
• Triptófano (Trp)
• Histidina (His)
• Fenilalanina (Phe)
• Isoleucina (Ile)
• Arginina (Arg)
• Metionina (Met)
2. No esenciales: son los que pueden ser sintetizados por el cuerpo, en estos encontramos:
• Alanina (Ala)
• Prolina (Pro)
• Glicina (Gly)
• Serina (Ser)
• Cisteina (Cys)
• Asparagina (Asn)
• Glutamina (Gln)
• Tirosina (Tyr)
• Ácido aspártico (Asp)
• Ácido glutámico (Glu)
Los aminoácidos, normalmente se nombran mediante símbolos de tres letras, aunque en la actualidad se ha adoptado usar símbolos de una sola letra para facilitar la comparación de las secuencias aminoácidas de proteínas homólogas.