Código genético

Origem: Wikipédia, a enciclopédia livre.

Código genético é a relação entre a sequência de bases no DNA e a sequência correspondente de aminoácidos, na proteína. Ele é equivalente a uma língua e é constituído basicamente por um dicionário de palavras, a tabela do código genético, e por uma gramática, correspondente às propriedades do código, que estabelece como a mensagem codificada no material genético é traduzida em uma sequência de aminoácidos na cadeia polipeptídica.

O código genético forma os modelos hereditários dos seres vivos. É nele que está toda a informação que rege a sequência dos aminoácidos codificada pelo encadeamento de nucleotídeos. Estes são compostos de desoxirribose, fosfato e uma base orgânica, do tipo citosina, adenina, guanina ou timina.

Tripletos e códons

Esquema de uma cadeia dupla do DNA.

Na cadeia polinucleotídica de DNA, um conjunto de 3 nucleotídeos corresponde a um aminoácido: são os tripletos. Mas por que 3 nucleótidos? Sabemos de antemão que existem 20 aminoácidos diferentes sendo, por isso, de se esperar que existam pelo menos 20 arranjos de nucleotídeos diferentes para que cada arranjo codifique um aminoácido diferente. Se supusermos que cada nucleótido codifica um aminoácido, facilmente compreendemos que tal seria impossível porque apenas existem 4 nucleótidos. Se escolhermos um arranjo de 2 nucleótidos obteríamos um conjunto de 16 arranjos diferentes (levando em conta a repetição de nucleótidos), ainda insuficiente para os 20 aminoácidos que a célula produz. Contudo, se supusermos que são necessários arranjos com repetição de 3 nucleótidos de ADN para codificar um aminoácido, obtemos um universo de 64 arranjos com repetição possíveis; mais do que o suficiente para os 20 aminoácidos existentes.

Esta hipótese foi confirmada pelos trabalhos de Marshall Nirenberg e Har Gobind Khorana, pelos quais receberam ambos, em conjunto com Robert W. Holley, o Nobel de Fisiologia ou Medicina de 1968.

Através do processo de transcrição os tripletos de ADN são convertidos em códons de ARN. Estes codões são, à semelhança dos tripletos, conjuntos de 3 nucleótidos da cadeia de ARN mensageiro. Este migra para o citoplasma da célula, onde se liga a um ribossoma e a uma molécula de ARN transportador. Através do processo de tradução e utilizando a informação genética do ADN do indivíduo com a molécula de ARN, o ribossoma produz então os aminoácidos para formarem proteínas.

Códons de finalização e de iniciação

No código genético existem códons de finalização (UAA,UGA e UAG) que indicam à célula que a sequência de aminoácidos destinada àquela proteína acaba ali. Existe ainda um códon de iniciação (AUG) que indica que a sequência de aminoácidos da proteína começa a ser codificada ali. Este códon (AUG) codifica o aminoácido Metionina (Met) de forma que todas as proteínas começam com o aminoácido Met.

Códons de finalização

Veja na tabela embaixo que alguns códons não especificam nenhum aminoácido. Estes códons são códons finanalizadores ou término. Eles podem ser vistos como sendo similares a uma pontuação na mensagem codificada pelo DNA.

Uma das primeiras indicações da existência de códons finalizadores surgiu em 1965 do trabalho de Brenner com o fago T4. Brenner estudou algumas mutações (m1-m6) em um único gene que controla a proteína de cada mutante era uma cadeia polipeptídica mais curta do que a do tipo selvagem.

Brenner examinou as pontas das proteínas encurtadas e as comparou com a do tipo selvagem. Os aminoácidos para as seis mutações eram glutamina, lisina, ácido glutâmico, tirosina, triptofano, e serina (Ver também: Aminoácido). Não há um padrão imediatamente óbvio destes resultado, mas Brenner brilhatemente deduziu que alguns códons para cada um destes aminoácidos eram similares. Especificamente, cada um destes códons pode mudar para o códon UAG por uma mudança em um par de nucleotídeos de DNA. Ele então postulou que UAG é um códon de fim, um sinal para o mecanismo de tradução de que a proteína agora está completa.

UAG foi primeiro códon finalizador a ser decifrado. Ele é chamado de códon âmbar. Os mutantes que são defectivos de mutantes âmbar. Os mutantes que são defectivos porque contêm códons opala e ocre, respectivamente. Os códons de fim em geral são chamados de sem sentidos porque não indicam nenhum aminoácido.

Os fagos mutantes de Brenner têm uma segunda característica interessante em comum além de uma proteína mais curta: a presença de uma mutação supressora (su-) no cromossomo hospedeiro faria com que o fago desenvolvesse a despeito da presênça da mutação m. Consideramos os códons finalizadores e seus supressores depois de tratar do processo de síntese de proteínas.

Decifrando o código

Decifrar o código genético, determinando o aminoácido especifico por cada trinca, foi uma das maiores conquistas dos últimos 50 anos. Quando as técnicas experimentais necessárias tornaram-se disponíveis, o código genético foi rapidamente decifrado.

Uma conquista foi a descoberta de como fazer RNA sintético. Se os nucleotídeos do RNA são misturados com uma enzima especial (polinucleotídeo fosforilase) , um RNA unifilamentar é formado na reação. Ao contrário da transcrição, nenhum molde de DNA é necessario para esta síntese, e assim os nucleotídeos são incorporados aleatoriamente. A habilidade em produzir mRNA criou uma perspectiva entusiasmante de produzir sequências específicas de mRNA e então ver que aminoácidos elas poderiam espeficicar. O primeiro mensageiro sintético obtido foi feito apenas com nucleotídeos uracil reagindo com a enzima de síntese de RNA, produzindo -UUUU-[pol(U)]. Em 1961, Marshall Nirenberg e Heinrich Matthaei misturaram poli(U) com a maquinaria de síntese de síntese de proteínas de E. coli in vitro e observaram a formação de uma proteína. O principal entusiasmo estava centrado na questão da sequência de aminoácido desta proteína. Ficou provado que era uma polifenilalanina, uma sequencia de moléculas de fenilalanina, ligada para formar um polipepitídeo. Assim, a trinca UUU deve codificar fenilalanina:

UUU UUU UUU UUU UUU UUU
Fen Fen Fen Fen Fen Fen

Em seguida,foram produzidos os mRNA contendo dois tipos de nucleotídeos em grupos repetidos. Por exemplo, o mRNA sintético tendo a sequências (AGA)n, que é uma longa sequências de AGAAGAAGAAGAAGA, foi usada para estimular a síntese de polipetídeos in vitro (em um tubo de ensaio que também continha um extrato celular com todos os componentes para a tradução). A partir da sequência dos polipeptídeos resultantes e as possíveis trincas que podiam residir em outros RNA sintéticos, podiam ser verificadas muitas palavras código.

Tabela de código genético

Assim, facilmente percebemos a ligação entre os tripletos de ADN e os aminoácidos. Esta linguagem que os une é o que chamamos código genético. No final da década de 60 o código genético foi decifrado, e agora é geralmente representado em uma tabela que estabece a conexão entre as bases azotas dos códons deos aminoácidos formados.

2a base
U C A G
1a
base
U

UUU (Phe/F) Fenilalanina
UUC (Phe/F) Fenilalanina
UUA (Leu/L) Leucina
UUG (Leu/L) Leucina

UCU (Ser/S) Serina
UCC (Ser/S) Serina
UCA (Ser/S) Serina
UCG (Ser/S) Serina

UAU (Tyr/Y) Tirosina
UAC (Tyr/Y) Tirosina
UAA "Ocre" (Códon de parada)
UAG "Âmbar" (Códon de parada)

UGU (Cys/C) Cisteína
UGC (Cys/C) Cisteína
UGA "Opala" (Códon de parada)
UGG (Trp/W) Triptofano

C

CUU (Leu/L) Leucina
CUC (Leu/L) Leucina
CUA (Leu/L) Leucina
CUG (Leu/L) Leucina

CCU (Pro/P) Prolina
CCC (Pro/P) Prolina
CCA (Pro/P) Prolina
CCG (Pro/P) Prolina

CAU (His/H) Histidina
CAC (His/H) Histidina
CAA (Gln/Q) Glutamina
CAG (Gln/Q) Glutamina

CGU (Arg/R) Arginina
CGC (Arg/R) Arginina
CGA (Arg/R) Arginina
CGG (Arg/R) Arginina

A

AUU (Ile/I) Isoleucina
AUC (Ile/I) Isoleucina
AUA (Ile/I) Isoleucina
AUG (Met/M) Metionina, Códon de iniciação

ACU (Thr/T)Treonina
ACC (Thr/T)Treonina
ACA (Thr/T)Treonina
ACG (Thr/T)Treonina

AAU (Asn/N) Asparagina
AAC (Asn/N) Asparagina
AAA (Lys/K) Lisina
AAG (Lys/K) Lisina

AGU (Ser/S) Serina
AGC (Ser/S) Serina
AGA (Arg/R) Arginina
AGG (Arg/R) Arginina

G

GUU (Val/V) Valina
GUC (Val/V) Valina
GUA (Val/V) Valina
GUG (Val/V) Valina

GCU (Ala/A) Alanina
GCC (Ala/A) Alanina
GCA (Ala/A) Alanina
GCG (Ala/A) Alanina

GAU (Asp/D) Ácido aspártico
GAC (Asp/D) Ácido aspártico
GAA (Glu/E) Ácido glutâmico
GAG (Glu/E) Ácido glutâmico

GGU (Gly/G) Glicina
GGC (Gly/G) Glicina
GGA (Gly/G) Glicina
GGG (Gly/G) Glicina

Tabela Inversa
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
INICIAÇÃO AUG PARADA UAG, UGA, UAA

Redundância e ambiguidade

Diz-se que o código genético é degenerado ou redundante por existirem vários codões que codificam o mesmo aminoácido. Por exemplo, os codões UCU, UCC,UCA e UCG codificam todos o aminoácido Serina (Ser). Este fenómeno é também apelidado de degenerescência. Já o contrário não é possível e não existe nenhum codão que possa codificar mais do que um único aminoácido e, logo, nunca é ambíguo. Com apenas 20 palavras necessárias para os 20 aminoácidos comuns, para que são usadas as outras palavras, se o forem? O trabalho de Crick sugeriu que o código genético é redundante, significando que cada uma das trincas deve ter um significado no código. Para que seja verdadeiro, alguns aminoácidos devem ser especificados, por pelo menos duas ou mais trincas diferentes.

O raciocínio é o seguinte. Se apenas 20 trincas fossem usadas, então as outras 44 não teriam significado, pois não codificariam nenhum aminoácido. Neste caso, seria esperado que a maioria das mutações de mudança de matriz de leitura produzisse palavras (códons) sem sentido, o que supostamente pararia o processo de construção de proteína. Se este fosse o caso, então as mutações de deleção ou de mudança de matriz raramente, ou nunca, produziriam proteínas viáveis ou funcionais. Entretanto, se todas as trincas especificam algum aminoácido, então as palavras mutadas simplesmente resultariam na inserção de aminoácidos incorretos na proteína. Então, Crick raciocinou que muitos ou todos os aminoácidos deveriam ter mais de um "nome" (códon) possível no código de pares de bases. Esta hipótese depois foi confirmada bioquimicamente.

Universalidade

Afirma-se que o Código Genético é universal porque os códons têm o mesmo significado em quase todos os organismos. Assim, o códon AAU codifica o aminoácido Asparagina (Asn) tanto em um ser humano como em um Streptococcus.

Referências gerais

  • Introdução à genética; Griffths, Wessler, Lewontin, Gelbart, Suzuki, Miller; oitava edição; Guanabara Koogan; 2005.