Quadro de Leitura

Origem: Wikipédia, a enciclopédia livre.
Três possíveis quadros de leitura na direção 5'→3'

Na biologia molecular, um quadro de leitura (em inglês reading frame) é uma forma de dividir a sequência de nucleotídeos de uma molécula de ácido nucleico (DNA ou RNA) em um conjunto de trímeros consecutivos e não sobrepostos.

Uma cadeia de uma molécula de ácido nucleico tem uma extremidade fosforil, chamada de extremidade 5', e uma hidroxila, ou extremidade 3'; estes definem a direção 5'→3. Existem três quadros de leitura que podem ser lidos nessa direção 5'→3', cada um começando de um nucleotídeo diferente em um trio. Em um ácido nucleico de fita dupla, três quadros de leitura adicionais podem ser lidos da outra fita complementar na direção 5'→3' ao longo dessa fita. Como as duas fitas de uma molécula de ácido nucleico de fita dupla são antiparalelas, a direção 5'→3' na segunda fita corresponde à direção 3'→5' ao longo da primeira fita.[1]

O código genético[editar | editar código-fonte]

Os genes, fatores codificados nos ácidos nucleicos, podem estar diretamente relacionados com a síntese de polipeptídeos (proteínas).[2] Cada um dos polipeptídeos possivelmente formados, a partir dos respectivos processos de transcrição e tradução, é composto por uma sequência específica de aminoácidos, determinados pelo RNA mensageiro maduro, moldado a partir de um DNA preexistente. Esse tipo de RNA é formado por quatro tipos de bases nitrogenadas (A, U, C e G) que podem ser codificadas em até 20 tipos de aminoácidos a partir de diferentes agrupamentos em três, formando uma linguagem em código; dessa forma, é possível inferir que cada código de trinca, ou códon, corresponde a um aminoácido diferente.[3]

Diferentes códons, com seus respectivos trímeros e aminoácidos

Ao final do processo de transcrição, o RNA mensageiro (RNAm), onde se encontram os códons (determinantes da sequência de aminoácidos das proteínas), está pronto para ser liberado no citoplasma. Essa fita simples se liga à porção menor de um ribossomo, composto de proteínas e RNAs ribossômicos (RNAr); durante essa ligação, um RNA transportador (RNAt), que possui em uma extremidade um aminoácido que estará correspondendo à trinca de bases nitrogenadas, chamadas de anticódons, em outra sua outra extremidade, entra no ribossomo para dar início ao processo de tradução no sítio ativo P da sua porção maior. Os anticódons conseguem reconhecer seus códons correspondentes e complementares, por exemplo: um AAC reconhecerá um UUG, para se ligar a ele.[4]

No entanto, o início de tais ligações não acontece em qualquer região ou em qualquer códon correspondente. As moléculas de RNAm apresentam um códon de iniciação (AUG) que corresponderá à formação do aminoácido metionina e, após diversos códons (que determinam a sequência de aminoácidos da proteína) haverá um códon de terminação, que pode ser UAG, UAA ou UGA.[5] Assim, todo o processo de transcrição se inicia com a chegada de uma RNAt de metionina, que percorre a molécula de RNAm em busca do códon de iniciação para a união das porções ribossomais. O processo de tradução se repetirá até se passar algum dos códons de terminação.

Após isso, uma proteína, conhecida como fator de liberação, se encaixa no sítio A, sobre o códon terminal e cessa a síntese proteica. Vale relembrar que éxons são sequências de bases transcritas e traduzidas, enquanto os íntrons são sequências transcritas e não traduzidas. Assim, as partes traduzidas do gene é que correspondem à informação genética que realmente codifica a sequência de aminoácidos da proteína.

Múltiplos quadros de leitura[editar | editar código-fonte]

O uso de múltiplos quadros de leitura leva à possibilidade de sobreposição de genes (um código sobreposto ocorre quando um único nucleotídeo é incluído em mais de um códon, porém cada nucleotídeo é parte de um único códon), que podem ocorrer em genomas virais, procariotos e mitocondriais.[6] Alguns vírus, por exemplo, vírus da hepatite B e BYDV, usam vários genes sobrepostos em diferentes quadros de leitura, mas os códons do mesmo gene não se sobrepõem.

Em casos raros, um ribossomo pode mudar de um quadro para outro durante a tradução de um RNAm (frameshift traducional). Isso faz com que a primeira parte do RNAm seja traduzida em um quadro de leitura, e a última parte seja traduzida em um quadro de leitura diferente. Isso difere de uma mutação frameshift, pois a sequência de nucleotídeos não é alterada — apenas o quadro em que é lida.[1]

Na mutação frameshift, há a eliminação ou inserção de uma ou poucas bases. Caso o número de bases afetadas não seja múltiplo de três (número de códons), ambas a sequência de nucleotídeos e o quadro de leitura são alterados; a partir do ponto da mutação, uma nova sequência de códons é gerada, codificando aminoácidos incorretos, o que levará a uma proteína não funcional. Se o número de pares de bases alterados for um múltiplo de três, por sua vez, não ocorrerão mudanças na matriz de leitura e haverá uma simples inserção ou eliminação de aminoácidos correspondentes no produto gênico normalmente traduzido.[7]

Open Reading Frame[editar | editar código-fonte]

Três possíveis quadros de leitura aberta, com os códons de início em rosa e os códons de parada em vermelho

Um quadro de leitura aberta (em inglês open reading frame, ou ORF) é um quadro de leitura com o potencial de ser transcrito em RNA e traduzido em proteína, geralmente com um comprimento que é um múltiplo de 3 nucleotídeos, e não sendo interrompido por um códon de parada na mesma região. Em relação ao início dos ORFs, existem duas definições: a sequência iniciando em um códon de início e terminando em um códon de parada, ou a sequência entre dois códons de parada.[8]

Para identificar possíveis ORF, softwares realizam a varredura da sequência do DNA nos dois filamentos, em cada uma das três possíveis matrizes de leitura, levando assim à seis matrizes de leitura possíveis no total.

Outra forma de identificar ORF e éxons (sequências de bases transcritas e traduzidas) é por meio da análise da expressão de RNAm, que pode ser realizada de dois modos: envolvendo a síntese de ORFs de moléculas de DNA complementares a sequências de RNAm, denominadas cDNA, que são clonadas e amplificadas em um vetor, ou sequenciadas direto de moléculas de cDNA curtas, não envolvendo a etapa de clonagem (denominado sequenciamento de RNA, ou RNA-seq).[9] Em ambos os métodos utilizados, as sequências de DNA complementares são importantes, uma vez que são a evidência direta de que um determinado segmento do genoma é expresso, podendo codificar um gene.

O alinhamento dos cDNA, com a sequência de genes a qual ele corresponde, delineia claramente os éxons e, portanto, os íntrons (sequências de bases apenas transcritas) são revelados como as regiões que se situam entre os éxons. Na sequência de cDNA, o ORF é contínuo desde o códon de inicial até o final e por isso podem auxiliar na identificação da matriz de leitura correta.

Além dessas sequências completas, há grandes conjuntos de dados de cDNA em relação aos quais apenas as extremidades 5′ ou 3′, ou ambas foram sequenciadas, chamadas de Marcador de Sequências Expressas (EST), que podem ser alinhadas com o DNA genômico e, assim, ser utilizadas para determinar os limites do transcrito.[10]

Uso prático[editar | editar código-fonte]

Os ORFs são usados na previsão de genes, para identificar regiões codificadoras de proteínas ou regiões codificadoras de RNA em uma sequência de DNA. No entanto, sua presença não significa que a região é sempre traduzida.[9] Também é possível realizar um alinhamento de duas (alinhamento pareado) ou mais (alinhamento múltiplo) sequências, com a finalidade de verificar semelhanças (se forem parecidas, é possível observar se elas são homólogas, têm funções similares ou a mesma estrutura).

Essas operações são feitas a partir de softwares, como: ORF Finder[11] é uma ferramenta de análise que encontra todos os quadros de leitura abertos em uma sequência inserida pelo usuário ou uma sequência já existente no banco de dados; ORF Investigator[12] é um programa que não só fornece informações sobre as sequências codificadoras e não codificantes, mas também pode realizar o alinhamento global pareado de diferentes sequências de genes de DNA; Orfipy[13] é uma ferramenta escrita em Python/Cython para extrair ORFs de forma extremamente rápida e flexível.

Referências

  1. a b Pierce, Benjamin A. (2016). Genética : un enfoque conceptual. São Paulo: Grupo Gen - Guanabara Koogan. OCLC 958553020. Consultado em 18 de novembro de 2022 
  2. Portin, Petter; Wilkins, Adam (1 de abril de 2017). «The Evolving Definition of the Term "Gene"». Genetics (em inglês) (4): 1353–1364. ISSN 1943-2631. PMC 5378099Acessível livremente. PMID 28360126. doi:10.1534/genetics.116.196956. Consultado em 24 de dezembro de 2022 
  3. LOPES, Sônia; ROSSO, Sergio (2013). Bio: volume único. São Paulo: Saraiva. ISBN 9788502210592 
  4. Hinnebusch, Alan G. (setembro de 2011). «Molecular Mechanism of Scanning and Start Codon Selection in Eukaryotes». Microbiology and Molecular Biology Reviews (em inglês) (3): 434–467. ISSN 1092-2172. PMC 3165540Acessível livremente. PMID 21885680. doi:10.1128/MMBR.00008-11. Consultado em 19 de dezembro de 2022 
  5. GRIFFITHS, Anthony J. F.; WESSLER, Susan R.; CAROLL, Sean B.; DOEBLEY, John (2016). Introdução à Genética. Rio de Janeiro: Grupo GEN. ISBN 9788527729963 
  6. Johnson, Zackary I.; Chisholm, Sallie W. (novembro de 2004). «Properties of overlapping genes are conserved across microbial genomes». Genome Research (em inglês) (11): 2268–2272. ISSN 1088-9051. PMC 525685Acessível livremente. PMID 15520290. doi:10.1101/gr.2433104. Consultado em 24 de dezembro de 2022 
  7. RAMOS, Anna Karolina Silva. Busca da etiologia genética da deficiência intelectual pelo sequenciamento de nova geração. 2022. [88] f., il. Dissertação (Mestrado em Ciências da Saúde) — Universidade de Brasília, Brasília, 2022. Consultado em 10 de janeiro de 2023
  8. Sieber, Patricia; Platzer, Matthias; Schuster, Stefan (março de 2018). «The Definition of Open Reading Frame Revisited». Trends in Genetics (em inglês) (3): 167–170. doi:10.1016/j.tig.2017.12.009. Consultado em 25 de dezembro de 2022 
  9. a b Deonier, Richard C. (2005). Computational genome analysis : an introduction. Simon Tavaré, Michael S. Waterman. New York: Springer. OCLC 262680463. Consultado em 17 de novembro de 2022 
  10. Pearson, William R.; Wood, Todd; Zhang, Zheng; Miller, Webb (novembro de 1997). «Comparison of DNA Sequences with Protein Sequences». Genomics (em inglês) (1): 24–36. doi:10.1006/geno.1997.4995. Consultado em 17 de outubro de 2022 
  11. National Center for Biotechnology Information. «Open Reading Frame Finder». ORFfinder. Consultado em 17 de novembro de 2022 
  12. DHAR, Dwivedi Vivek; KUMAR, Mishra Sarad (2012). «ORF Investigator: A New ORF finding tool combining Pairwise Global Gene Alignment» (PDF). International Science Congress Association. Research Journal of Recent Sciences. Consultado em 17 de novembro de 2022 
  13. Singh, Urminder; Wurtele, Eve Syrkin (29 de setembro de 2021). Birol, Inanc, ed. «orfipy: a fast and flexible tool for extracting ORFs». Bioinformatics (em inglês) (18): 3019–3020. ISSN 1367-4803. PMC 8479652Acessível livremente. PMID 33576786. doi:10.1093/bioinformatics/btab090. Consultado em 17 de novembro de 2022