Código genético

Código genético é a relação entre a sequência de bases no DNA e a sequência correspondente de aminoácidos, na proteína. Ele é equivalente a uma língua e é constituído basicamente por um dicionário de palavras, a tabela do código genético, e por uma gramática, correspondente às propriedades do código, que estabelece como a mensagem codificada no material genético é traduzida em uma sequência de aminoácidos na cadeia polipeptídica.

O código genético forma os modelos hereditários dos seres vivos. É nele que está toda a informação que rege a sequência dos aminoácidos codificada pelo encadeamento de nucleotídeos. Estes são compostos de desoxirribose, fosfato e uma base orgânica, do tipo citosina, adenina, guanina ou timina.

Tripletos e códons

Na cadeia polinucleotídica de DNA, um conjunto de 3 nucleotídeos corresponde a um aminoácido: são os tripletos. Mas por que 3 nucleótidos? Sabemos de antemão que existem 20 aminoácidos diferentes sendo, por isso, de se esperar que existam pelo menos 20 arranjos de nucleotídeos diferentes para que cada arranjo codifique um aminoácido diferente. Se supusermos que cada nucleótido codifica um aminoácido, facilmente compreendemos que tal seria impossível porque apenas existem 4 nucleótidos. Se escolhermos um arranjo de 2 nucleótidos obteríamos um conjunto de 16 arranjos diferentes (levando em conta a repetição de nucleótidos), ainda insuficiente para os 20 aminoácidos que a célula produz. Contudo, se supusermos que são necessários arranjos com repetição de 3 nucleótidos de ADN para codificar um aminoácido, obtemos um universo de 64 arranjos com repetição possíveis; mais do que o suficiente para os 20 aminoácidos existentes.

Esta hipótese foi confirmada pelos trabalhos de Marshall Nirenberg e Har Gobind Khorana, pelos quais receberam ambos, em conjunto com Robert W. Holley, o Nobel de Fisiologia ou Medicina de 1968.

Através do processo de transcrição os tripletos de ADN são convertidos em códons de ARN. Estes codões são, à semelhança dos tripletos, conjuntos de 3 nucleótidos da cadeia de ARN mensageiro. Este migra para o citoplasma da célula, onde se liga a um ribossoma e a uma molécula de ARN transportador. Através do processo de tradução e utilizando a informação genética do ADN do indivíduo com a molécula de ARN, o ribossoma produz então os aminoácidos para formarem proteínas.

Códons de finalização e de iniciação

No código genético existem códons de finalização (UAA,UGA e UAG) que indicam à célula que a sequência de aminoácidos destinada àquela proteína acaba ali. Existe ainda um códon de iniciação (AUG) que indica que a sequência de aminoácidos da proteína começa a ser codificada ali. Este códon (AUG) codifica o aminoácido Metionina (Met) de forma que todas as proteínas começam com o aminoácido Met.

Códons de finalização

Veja na tabela embaixo que alguns códons não especificam nenhum aminoácido. Estes códons são códons finanalizadores ou término. Eles podem ser vistos como sendo similares a uma pontuação na mensagem codificada pelo DNA.

Uma das primeiras indicações da existência de códons finalizadores surgiu em 1965 do trabalho de Brenner com o fago T4. Brenner estudou algumas mutações (m₁-m₆) em um único gene que controla a proteína de cada mutante era uma cadeia polipeptídica mais curta do que a do tipo selvagem.

Brenner examinou as pontas das proteínas encurtadas e as comparou com a do tipo selvagem. Os aminoácidos para as seis mutações eram glutamina, lisina, ácido glutâmico, tirosina, triptofano, e serina (Ver também: Aminoácido). Não há um padrão imediatamente óbvio destes resultado, mas Brenner brilhatemente deduziu que alguns códons para cada um destes aminoácidos eram similares. Especificamente, cada um destes códons pode mudar para o códon UAG por uma mudança em um par de nucleotídeos de DNA. Ele então postulou que UAG é um códon de fim, um sinal para o mecanismo de tradução de que a proteína agora está completa.

UAG foi primeiro códon finalizador a ser decifrado. Ele é chamado de códon âmbar. Os mutantes que são defectivos de mutantes âmbar. Os mutantes que são defectivos porque contêm códons opala e ocre, respectivamente. Os códons de fim em geral são chamados de sem sentidos porque não indicam nenhum aminoácido.

Os fagos mutantes de Brenner têm uma segunda característica interessante em comum além de uma proteína mais curta: a presença de uma mutação supressora (su-) no cromossomo hospedeiro faria com que o fago desenvolvesse a despeito da presênça da mutação m. Consideramos os códons finalizadores e seus supressores depois de tratar do processo de síntese de proteínas.

Decifrando o código

Decifrar o código genético, determinando o aminoácido especifico por cada trinca, foi uma das maiores conquistas dos últimos 50 anos. Quando as técnicas experimentais necessárias tornaram-se disponíveis, o código genético foi rapidamente decifrado.

Uma conquista foi a descoberta de como fazer RNA sintético. Se os nucleotídeos do RNA são misturados com uma enzima especial (polinucleotídeo fosforilase) , um RNA unifilamentar é formado na reação. Ao contrário da transcrição, nenhum molde de DNA é necessario para esta síntese, e assim os nucleotídeos são incorporados aleatoriamente. A habilidade em produzir mRNA criou uma perspectiva entusiasmante de produzir sequências específicas de mRNA e então ver que aminoácidos elas poderiam espeficicar. O primeiro mensageiro sintético obtido foi feito apenas com nucleotídeos uracil reagindo com a enzima de síntese de RNA, produzindo -UUUU-[pol(U)]. Em 1961, Marshall Nirenberg e Heinrich Matthaei misturaram poli(U) com a maquinaria de síntese de síntese de proteínas de E. coli in vitro e observaram a formação de uma proteína. O principal entusiasmo estava centrado na questão da sequência de aminoácido desta proteína. Ficou provado que era uma polifenilalanina, uma sequencia de moléculas de fenilalanina, ligada para formar um polipepitídeo. Assim, a trinca UUU deve codificar fenilalanina:

UUU	UUU	UUU	UUU	UUU	UUU
Fen	Fen	Fen	Fen	Fen	Fen

Em seguida,foram produzidos os mRNA contendo dois tipos de nucleotídeos em grupos repetidos. Por exemplo, o mRNA sintético tendo a sequências (AGA)_n, que é uma longa sequências de AGAAGAAGAAGAAGA, foi usada para estimular a síntese de polipetídeos in vitro (em um tubo de ensaio que também continha um extrato celular com todos os componentes para a tradução). A partir da sequência dos polipeptídeos resultantes e as possíveis trincas que podiam residir em outros RNA sintéticos, podiam ser verificadas muitas palavras código.

Tabela de código genético

Assim, facilmente percebemos a ligação entre os tripletos de ADN e os aminoácidos. Esta linguagem que os une é o que chamamos código genético. No final da década de 60 o código genético foi decifrado, e agora é geralmente representado em uma tabela que estabece a conexão entre as bases azotas dos códons deos aminoácidos formados.


		U	C	A	G
		2^a base
1^a base	U	UUU (Phe/F) Fenilalanina UUC (Phe/F) Fenilalanina UUA (Leu/L) Leucina UUG (Leu/L) Leucina	UCU (Ser/S) Serina UCC (Ser/S) Serina UCA (Ser/S) Serina UCG (Ser/S) Serina	UAU (Tyr/Y) Tirosina UAC (Tyr/Y) Tirosina UAA "Ocre" (Códon de parada) UAG "Âmbar" (Códon de parada)	UGU (Cys/C) Cisteína UGC (Cys/C) Cisteína UGA "Opala" (Códon de parada) UGG (Trp/W) Triptofano
	C	CUU (Leu/L) Leucina CUC (Leu/L) Leucina CUA (Leu/L) Leucina CUG (Leu/L) Leucina	CCU (Pro/P) Prolina CCC (Pro/P) Prolina CCA (Pro/P) Prolina CCG (Pro/P) Prolina	CAU (His/H) Histidina CAC (His/H) Histidina CAA (Gln/Q) Glutamina CAG (Gln/Q) Glutamina	CGU (Arg/R) Arginina CGC (Arg/R) Arginina CGA (Arg/R) Arginina CGG (Arg/R) Arginina
	A	AUU (Ile/I) Isoleucina AUC (Ile/I) Isoleucina AUA (Ile/I) Isoleucina AUG (Met/M) Metionina, Códon de iniciação	ACU (Thr/T)Treonina ACC (Thr/T)Treonina ACA (Thr/T)Treonina ACG (Thr/T)Treonina	AAU (Asn/N) Asparagina AAC (Asn/N) Asparagina AAA (Lys/K) Lisina AAG (Lys/K) Lisina	AGU (Ser/S) Serina AGC (Ser/S) Serina AGA (Arg/R) Arginina AGG (Arg/R) Arginina
	G	GUU (Val/V) Valina GUC (Val/V) Valina GUA (Val/V) Valina GUG (Val/V) Valina	GCU (Ala/A) Alanina GCC (Ala/A) Alanina GCA (Ala/A) Alanina GCG (Ala/A) Alanina	GAU (Asp/D) Ácido aspártico GAC (Asp/D) Ácido aspártico GAA (Glu/E) Ácido glutâmico GAG (Glu/E) Ácido glutâmico	GGU (Gly/G) Glicina GGC (Gly/G) Glicina GGA (Gly/G) Glicina GGG (Gly/G) Glicina

Tabela Inversa
Ala/A	GCU, GCC, GCA, GCG	Leu/L	UUA, UUG, CUU, CUC, CUA, CUG
Arg/R	CGU, CGC, CGA, CGG, AGA, AGG	Lys/K	AAA, AAG
Asn/N	AAU, AAC	Met/M	AUG
Asp/D	GAU, GAC	Phe/F	UUU, UUC
Cys/C	UGU, UGC	Pro/P	CCU, CCC, CCA, CCG
Gln/Q	CAA, CAG	Ser/S	UCU, UCC, UCA, UCG, AGU, AGC
Glu/E	GAA, GAG	Thr/T	ACU, ACC, ACA, ACG
Gly/G	GGU, GGC, GGA, GGG	Trp/W	UGG
His/H	CAU, CAC	Tyr/Y	UAU, UAC
Ile/I	AUU, AUC, AUA	Val/V	GUU, GUC, GUA, GUG
INICIAÇÃO	AUG	PARADA	UAG, UGA, UAA

Redundância e ambiguidade

Diz-se que o código genético é degenerado ou redundante por existirem vários codões que codificam o mesmo aminoácido. Por exemplo, os codões U CU, UCC,UCA e UCG codificam todos o aminoácido Serina (Ser). Este fenómeno é também apelidado de degenerescência. Já o contrário não é possível e não existe nenhum codão que possa codificar mais do que um único aminoácido e, logo, nunca é ambíguo. Com apenas 20 palavras necessárias para os 20 aminoácidos comuns, para que são usadas as outras palavras, se o forem? O trabalho de Crick sugeriu que o código genético é redundante, significando que cada uma das trincas deve ter um significado no código. Para que seja verdadeiro, alguns aminoácidos devem ser especificados, por pelo menos duas ou mais trincas diferentes.

O raciocínio é o seguinte. Se apenas 20 trincas fossem usadas, então as outras 44 não teriam significado, pois não codificariam nenhum aminoácido. Neste caso, seria esperado que a maioria das mutações de mudança de matriz de leitura produzisse palavras (códons) sem sentido, o que supostamente pararia o processo de construção de proteína. Se este fosse o caso, então as mutações de deleção ou de mudança de matriz raramente, ou nunca, produziriam proteínas viáveis ou funcionais. Entretanto, se todas as trincas especificam algum aminoácido, então as palavras mutadas simplesmente resultariam na inserção de aminoácidos incorretos na proteína. Então, Crick raciocinou que muitos ou todos os aminoácidos deveriam ter mais de um "nome" (códon) possível no código de pares de bases. Esta hipótese depois foi confirmada bioquimicamente.

Universalidade

Afirma-se que o Código Genético é universal porque os códons têm o mesmo significado em quase todos os organismos. Assim, o códon AAU codifica o aminoácido Asparagina (Asn) tanto em um ser humano como em um Streptococcus.

Referências gerais

Introdução à genética; Griffths, Wessler, Lewontin, Gelbart, Suzuki, Miller; oitava edição; Guanabara Koogan; 2005.