Pseudogene

Origem: Wikipédia, a enciclopédia livre.

Um pseudogene é uma sequência nucleotídica similar a um gene normal mas que não dá como resultado um produto funcional, quer dizer, que não se expressa.

Propuseram-se vários cenários para explicar a origem de um pseudogene:

  1. Fragmentos da transcrição em ARNm de um gene podem ser transcritos inversamente de maneira espontânea e inseridos no DNA cromossômico (chamada retrotransposição). A estes pseudogenes são chamados processados. Já que estes pseudogenes carecem dos promotores dos genes normais, não se expressam com normalidade.
  2. Um sucesso de duplicação genética pode significar que um genoma tenha duas cópias de um gene quando só necessita de uma. As mutações que desativem uma das cópias não seriam, portanto, selecionadas contra (e inclusive poderiam ter certa vantagem seletiva estando desativados). Mais, o sucesso da duplicação pode não ser completo, de maneira que a cópia tenha promotores incompletos. Estes pseudogenes chamam-se duplicados.
  3. Um gene pode deixar de ser funcional ou desactivar-se se uma mutação assim se fixa na população. Isto pode ocorrer por meios normais como a selecção natural ou a deriva genética.

Os pseudogenes podem complicar os estudos de genética molecular. Por exemplo, um investigador que queira amplificar um gene mediante PCR pode amplificar simultaneamente um pseudogene que compartilhe sequências similares. Mais, em ocasiões os pseudogenes registam-se como genes na sequenciação de genomas.

É típico em biologia molecular encontrar exemplos raros que questionam qualquer definição simples de um termo, e o de pseudogene não é uma exceção. Há certa divisão entre os geneticistas sobre a natureza do produto final. Se o produto final tem que ser uma proteína, então alguns pseudogenes poden funcionar como ARN. Por exemplo, Hirotsune et al (2003)[1] descobriram uma sequência no genoma humano que se havia identificado como pseudogene mas que aparentemente tem una função reguladora para seu gene homólogo codificador. No entanto, esta definição não permite pseudogenes de ARNt ou ARNr.

Em 2008, vários estudos em moscas[2][3][4][5] e em ratos,[6][7] proporcionam nova informação: nestes estudos, se sugere uma conexão entre RNAi e pseudogenes. De maneira geral, o processo de RNAi implica vários tipos de pequenas sequências de ARN "guia" que regulam os níveis da proteína alvo ao direccionar para a sua degradação o ARNm desta. Nos seis estudos indicados, siRNAs procedentes de pseudogenes geram duas das quatro categorias de siRNAs naturais ou endo-siRNAs.

Propriedades[editar | editar código-fonte]

Pseudogenes é geralmente caracterizada por uma combinação da homologia de um gene conhecido e a sua perda de alguma funcionalidade. Ou seja, embora todo pseudogene tenha uma sequência de DNA semelhante a algum gene funcional, eles geralmente são incapazes de produzir proteínas finais funcionais.[8] Geralmente, os pseudogenes são difíceis de identificar e caracterizar nos genomas, porque os dois requisitos de homologia e perda de funcionalidade são geralmente implícitos por meio de alinhamentos de sequências, em vez de comprovados biologicamente.

  1. A homologia está implícita na identidade de sequência entre as sequências de DNA do pseudogene e do gene parental. Depois de alinhar as duas sequências, a porcentagem de pares de bases idênticos é calculada. Uma alta identidade de sequência significa que é altamente provável que essas duas sequências tenham divergido de uma sequência ancestral comum (são homólogas) e altamente improvável que essas duas sequências tenham evoluído independentemente (consulte Convergent Evolution).
  2. A falta de funcionalidade pode se manifestar de várias maneiras. Normalmente, um gene deve passar por várias etapas até se tornar uma proteína totalmente funcional: Transcrição, processamento de pré-mRNA, tradução e enovelamento de proteínas são partes necessárias desse processo. Se qualquer uma dessas etapas falhar, a sequência pode ser considerada não funcional. Na identificação de pseudogenes de alto rendimento, as deficiências mais comumente identificadas são códons de parada prematuros e mudanças de estrutura, que quase universalmente impedem a tradução de um produto proteico funcional.

Pseudogenes para genes de RNA são geralmente mais difíceis de descobrir, pois não precisam ser traduzidos e, portanto, não possuem "quadros de leitura".

Os pseudogenes podem complicar os estudos de genética molecular. Por exemplo, a amplificação de um gene por PCR pode amplificar simultaneamente um pseudogene que compartilha sequências semelhantes. Isso é conhecido como viés de PCR ou viés de amplificação. Da mesma forma, os pseudogenes às vezes são anotados como genes nas sequências do genoma.

Pseudogenes processados muitas vezes representam um problema para programas de predição de genes, muitas vezes sendo erroneamente identificados como genes reais ou éxons. Foi proposto que a identificação de pseudogenes processados pode ajudar a melhorar a precisão dos métodos de predição de genes.[9]

Recentemente, 140 pseudogenes humanos demonstraram ser traduzidos.[10] No entanto, a função, se houver, dos produtos proteicos é desconhecida.

Tipos e origem[editar | editar código-fonte]

Existem quatro tipos principais de pseudogenes, todos com mecanismos distintos de origem e características. As classificações de pseudogenes são as seguintes:

Processado

Em eucariotos superiores, particularmente mamíferos, a retrotransposição é um evento bastante comum que teve um grande impacto na composição do genoma. Por exemplo, algo entre 30 e 44% do genoma humano consiste em elementos repetitivos como SINEs e LINEs (ver retrotransposons).[11][12] No processo de retrotransposição, uma porção do mRNA ou hnRNA transcrito de um gene é espontaneamente transcrito de volta ao DNA e inserido no DNA cromossômico. Embora os retrotransposons geralmente criem cópias de si mesmos, foi demonstrado em um sistema in vitro que eles também podem criar cópias retrotranspostas de genes aleatórios.[13] Uma vez que esses pseudogenes são inseridos de volta no genoma, eles geralmente contêm uma cauda poli-A e geralmente tiveram seus íntrons cortados; essas são características marcantes dos cDNAs. No entanto, como são derivados de um produto de RNA, os pseudogenes processados também carecem dos promotores a montante dos genes normais; assim, eles são considerados "mortos na chegada", tornando-se pseudogenes não funcionais imediatamente após o evento de retrotransposição.[14] No entanto, essas inserções ocasionalmente contribuem com éxons para genes existentes, geralmente por meio de transcritos com splicing alternativo.[15] Uma outra característica dos pseudogenes processados é o truncamento comum da extremidade 5' em relação à sequência parental, que é resultado do mecanismo de retrotransposição relativamente não processual que cria pseudogenes processados.[16] Pseudogenes processados são continuamente criados em primatas.[17] Populações humanas, por exemplo, têm conjuntos distintos de pseudogenes processados entre seus indivíduos.[18]

Não processado

Pseudogenes não processados (ou duplicados). A duplicação de genes é outro processo comum e importante na evolução dos genomas. Uma cópia de um gene funcional pode surgir como resultado de um evento de duplicação de gene causado por recombinação homóloga em, por exemplo, sequências senoidais repetitivas em cromossomos desalinhados e subsequentemente adquirir mutações que fazem com que a cópia perca a função do gene original. Os pseudogenes duplicados geralmente têm todas as mesmas características dos genes, incluindo uma estrutura de exon-intron intacta e sequências reguladoras. A perda da funcionalidade de um gene duplicado geralmente tem pouco efeito sobre o fitness de um organismo, uma vez que ainda existe uma cópia funcional intacta. De acordo com alguns modelos evolutivos, pseudogenes duplicados compartilhados indicam o parentesco evolucionário de humanos e outros primatas. Se a pseudogenização for devida à duplicação do gene, ela geralmente ocorre nos primeiros milhões de anos após a duplicação do gene, desde que o gene não tenha sido submetido a nenhuma pressão de seleção.[19] A duplicação de genes gera redundância funcional e normalmente não é vantajoso carregar dois genes idênticos. As mutações que perturbam a estrutura ou a função de qualquer um dos dois genes não são deletérias e não serão removidas por meio do processo de seleção. Como resultado, o gene que foi mutado torna-se gradualmente um pseudogene e não será expresso ou não terá função. Este tipo de destino evolutivo é mostrado pela modelagem genética populacional [20][21] e também pela análise do genoma.[19][22] De acordo com o contexto evolutivo, esses pseudogenes serão deletados ou se tornarão tão distintos dos genes parentais que não serão mais identificáveis. Pseudogenes relativamente jovens podem ser reconhecidos devido à sua similaridade de sequência.[23]

Pseudogenes unitários

Várias mutações (como indels e mutações sem sentido) podem impedir que um gene seja normalmente transcrito ou traduzido e, portanto, o gene pode se tornar menos ou não funcional ou "desativado". Esses são os mesmos mecanismos pelos quais os genes não processados se tornam pseudogenes, mas a diferença nesse caso é que o gene não foi duplicado antes da pseudogenização. Normalmente, é improvável que tal pseudogene se fixe em uma população, mas vários efeitos populacionais, como deriva genética, gargalo populacional ou, em alguns casos, seleção natural, podem levar à fixação. O exemplo clássico de um pseudogene unitário é o gene que presumivelmente codificou a enzima L-gulono-γ-lactona oxidase (GULO) em primatas. Em todos os mamíferos estudados além dos primatas (exceto porquinhos-da-índia), o GULO auxilia na biossíntese do ácido ascórbico (vitamina C), mas existe como um gene desativado (GULOP) em humanos e outros primatas.[24][25] Outro exemplo mais recente de um gene desativado liga a desativação do gene da caspase 12 (através de uma mutação sem sentido) à seleção positiva em humanos.[26]

Foi demonstrado que os pseudogenes processados acumulam mutações mais rapidamente do que os pseudogenes não processados.[27]

Pseudo-pseudogenes

A rápida proliferação de tecnologias de sequenciamento de DNA levou à identificação de muitos pseudogenes aparentes usando técnicas de predição de genes. Os pseudogenes são frequentemente identificados pelo aparecimento de um códon de parada prematuro em uma sequência de mRNA prevista, o que, em teoria, impediria a síntese (tradução) do produto proteico normal do gene original. Houve alguns relatos de leitura translacional de tais códons de parada prematuros em mamíferos. Conforme aludido na figura acima, uma pequena quantidade do produto proteico dessa leitura ainda pode ser reconhecível e funcionar em algum nível. Nesse caso, o pseudogene pode estar sujeito à seleção natural. Isso parece ter acontecido durante a evolução das espécies de Drosophila.

Em 2016, foi relatado que quatro pseudogenes previstos em várias espécies de Drosophila realmente codificam proteínas com funções biologicamente importantes,[28] "sugerindo que tais 'pseudo-pseudogenes' poderiam representar um fenômeno generalizado". Por exemplo, a proteína funcional (um receptor olfativo) é encontrada apenas em neurônios. Esta descoberta de genes biologicamente funcionais específicos de tecido que poderiam ter sido classificados como pseudogenes por análise in silico complica a análise de dados de sequência. No genoma humano, foram identificados vários exemplos que foram originalmente classificados como pseudogenes, mas posteriormente descobertos como tendo um papel funcional, embora não necessariamente codificador de proteínas.[29][30] Em 2012, parecia que havia aproximadamente 12.000 a 14.000 pseudogenes no genoma humano.[31] Uma análise proteogenômica de 2016 usando espectrometria de massa de peptídeos identificou pelo menos 19.262 proteínas humanas produzidas a partir de 16.271 genes ou grupos de genes, com 8 novos genes codificadores de proteínas identificados que eram anteriormente considerados pseudogenes.[32]

Referências[editar | editar código-fonte]

  1. Hirotsune S, Yoshida N, Chen A, Garrett L, Sugiyama F, Takahashi S, Yagami K, Wynshaw-Boris A, Yoshiki A.An expressed pseudogene regulates the messenger-RNA stability of its homologous coding gene. Nature 2003 423:91-96 [1]
  2. Czech B, Malone CD, Zhou R, Stark A, Schlingeheyde C, Dus M, Perrimon N, Kellis M, Wohlschlegel JA, Sachidanandam R, Hannon GJ, Brennecke J. An endogenous small interfering RNA pathway in Drosophila.Nature 2008 Jun 5;453(7196):798-802 [2]
  3. Ghildiyal M, Seitz H, Horwich MD, Li C, Du T, Lee S, Xu J, Kittler EL, Zapp ML, Weng Z, Zamore PD.Endogenous siRNAs derived from transposons and mRNAs in Drosophila somatic cells.Science 2008 May 23;320(5879):1077-81 [3]
  4. Kawamura Y, Saito K, Kin T, Ono Y, Asai K, Sunohara T, Okada TN, Siomi MC, Siomi H.Drosophila endogenous small RNAs bind to Argonaute 2 in somatic cells.Nature 2008 Jun 5;453(7196):793-7 [4]
  5. Okamura K, Chung WJ, Ruby JG, Guo H, Bartel DP, Lai EC. The Drosophila hairpin RNA pathway generates endogenous short interfering RNAs.Nature 2008 Jun 5;453(7196):803-6 [5]
  6. Tam OH, Aravin AA, Stein P, Girard A, Murchison EP, Cheloufi S, Hodges E, Anger M, Sachidanandam R, Schultz RM, Hannon GJ.Pseudogene-derived small interfering RNAs regulate gene expression in mouse oocytes.Nature 2008 May 22;453(7194):534-8 [6]
  7. Watanabe T, Totoki Y, Toyoda A, Kaneda M, Kuramochi-Miyagawa S, Obata Y, Chiba H, Kohara Y, Kono T, Nakano T, Surani MA, Sakaki Y, Sasaki H.Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes.Nature 2008 May 22;453(7194):539-43 [7]
  8. Mighell, A.J.; Smith, N.R.; Robinson, P.A.; Markham, A.F. (25 de fevereiro de 2000). «Vertebrate pseudogenes». FEBS Letters (em inglês) (2-3): 109–114. doi:10.1016/S0014-5793(00)01199-6. Consultado em 15 de dezembro de 2022 
  9. van Baren, Marijke J.; Brent, Michael R. (maio de 2006). «Iterative gene prediction and pseudogene removal improves genome annotation». Genome Research (em inglês) (5): 678–685. ISSN 1088-9051. PMC PMC1457044Acessível livremente Verifique |pmc= (ajuda). PMID 16651666. doi:10.1101/gr.4766206. Consultado em 15 de dezembro de 2022 
  10. Kim, Min-Sik; Pinto, Sneha M.; Getnet, Derese; Nirujogi, Raja Sekhar; Manda, Srikanth S.; Chaerkady, Raghothama; Madugundu, Anil K.; Kelkar, Dhanashree S.; Isserlin, Ruth (29 de maio de 2014). «A draft map of the human proteome». Nature (em inglês) (7502): 575–581. ISSN 0028-0836. PMC PMC4403737Acessível livremente Verifique |pmc= (ajuda). PMID 24870542. doi:10.1038/nature13302. Consultado em 15 de dezembro de 2022 
  11. Jurka, Jerzy (dezembro de 2004). «Evolutionary impact of human Alu repetitive elements». Current Opinion in Genetics & Development (em inglês) (6): 603–608. doi:10.1016/j.gde.2004.08.008. Consultado em 25 de dezembro de 2022 
  12. Dewannieux, M.; Heidmann, T. (2005). «LINEs, SINEs and processed pseudogenes: parasitic strategies for genome modeling». Cytogenetic and Genome Research (em inglês) (1-4): 35–48. ISSN 1424-8581. doi:10.1159/000084936. Consultado em 25 de dezembro de 2022 
  13. Dewannieux, Marie; Esnault, Cécile; Heidmann, Thierry (setembro de 2003). «LINE-mediated retrotransposition of marked Alu sequences». Nature Genetics (em inglês) (1): 41–48. ISSN 1061-4036. doi:10.1038/ng1223. Consultado em 25 de dezembro de 2022 
  14. Graur, Dan; Shuali, Yuval; Li, Wen-Hsiung (abril de 1989). «Deletions in processed pseudogenes accumulate faster in rodents than in humans». Journal of Molecular Evolution (em inglês) (4): 279–285. ISSN 0022-2844. doi:10.1007/BF02103423. Consultado em 25 de dezembro de 2022 
  15. Baertsch, Robert; Diekhans, Mark; Kent, W James; Haussler, David; Brosius, Jürgen (2008). «Retrocopy contributions to the evolution of the human genome». BMC Genomics (em inglês) (1). 466 páginas. ISSN 1471-2164. PMC PMC2584115Acessível livremente Verifique |pmc= (ajuda). PMID 18842134. doi:10.1186/1471-2164-9-466. Consultado em 25 de dezembro de 2022 
  16. Pavlı́ček, Adam; Pačes, Jan; Zı́ka, Radek; Hejnar, Jiřı́ (outubro de 2002). «Length distribution of long interspersed nucleotide elements (LINEs) and processed pseudogenes of human endogenous retroviruses: implications for retrotransposition and pseudogene detection». Gene (em inglês) (1-2): 189–194. doi:10.1016/S0378-1119(02)01047-8. Consultado em 25 de dezembro de 2022 
  17. Navarro, Fábio C.P.; Galante, Pedro A.F. (agosto de 2015). «A Genome-Wide Landscape of Retrocopies in Primate Genomes». Genome Biology and Evolution (em inglês) (8): 2265–2275. ISSN 1759-6653. PMC PMC4558860Acessível livremente Verifique |pmc= (ajuda). PMID 26224704. doi:10.1093/gbe/evv142. Consultado em 25 de dezembro de 2022 
  18. Schrider, Daniel R.; Navarro, Fabio C. P.; Galante, Pedro A. F.; Parmigiani, Raphael B.; Camargo, Anamaria A.; Hahn, Matthew W.; de Souza, Sandro J. (24 de janeiro de 2013). Akey, Joshua M., ed. «Gene Copy-Number Polymorphism Caused by Retrotransposition in Humans». PLoS Genetics (em inglês) (1): e1003242. ISSN 1553-7404. PMC PMC3554589Acessível livremente Verifique |pmc= (ajuda). PMID 23359205. doi:10.1371/journal.pgen.1003242. Consultado em 25 de dezembro de 2022 
  19. a b Lynch, Michael; Conery, John S. (10 de novembro de 2000). «The Evolutionary Fate and Consequences of Duplicate Genes». Science (em inglês) (5494): 1151–1155. ISSN 0036-8075. doi:10.1126/science.290.5494.1151. Consultado em 25 de dezembro de 2022 
  20. Walsh, J B (1 de janeiro de 1995). «How often do duplicated genes evolve new functions?». Genetics (em inglês) (1): 421–428. ISSN 1943-2631. PMC PMC1206338Acessível livremente Verifique |pmc= (ajuda). PMID 7705642. doi:10.1093/genetics/139.1.421. Consultado em 25 de dezembro de 2022 
  21. Lynch, Michael; O'Hely, Martin; Walsh, Bruce; Force, Allan (1 de dezembro de 2001). «The Probability of Preservation of a Newly Arisen Gene Duplicate». Genetics (em inglês) (4): 1789–1804. ISSN 1943-2631. PMC PMC1461922Acessível livremente Verifique |pmc= (ajuda). PMID 11779815. doi:10.1093/genetics/159.4.1789. Consultado em 25 de dezembro de 2022 
  22. Harrison, Paul M.; Hegyi, Hedi; Balasubramanian, Suganthi; Luscombe, Nicholas M.; Bertone, Paul; Echols, Nathaniel; Johnson, Ted; Gerstein, Mark (1 de fevereiro de 2002). «Molecular Fossils in the Human Genome: Identification and Analysis of the Pseudogenes in Chromosomes 21 and 22». Genome Research (em inglês) (2): 272–280. ISSN 1088-9051. PMC PMC155275Acessível livremente Verifique |pmc= (ajuda). PMID 11827946. doi:10.1101/gr.207102. Consultado em 25 de dezembro de 2022 
  23. Zhang, Jianzhi (junho de 2003). «Evolution by gene duplication: an update». Trends in Ecology & Evolution (em inglês) (6): 292–298. doi:10.1016/S0169-5347(03)00033-8. Consultado em 25 de dezembro de 2022 
  24. Nishikimi, M; Kawai, T; Yagi, K (outubro de 1992). «Guinea pigs possess a highly mutated gene for L-gulono-gamma-lactone oxidase, the key enzyme for L-ascorbic acid biosynthesis missing in this species.». Journal of Biological Chemistry (em inglês) (30): 21967–21972. doi:10.1016/S0021-9258(19)36707-9. Consultado em 25 de dezembro de 2022 
  25. Nishikimi, M.; Fukuyama, R.; Minoshima, S.; Shimizu, N.; Yagi, K. (maio de 1994). «Cloning and chromosomal mapping of the human nonfunctional gene for L-gulono-gamma-lactone oxidase, the enzyme for L-ascorbic acid biosynthesis missing in man.». Journal of Biological Chemistry (em inglês) (18): 13685–13688. doi:10.1016/S0021-9258(17)36884-9. Consultado em 25 de dezembro de 2022 
  26. Xue, Yali; Daly, Allan; Yngvadottir, Bryndis; Liu, Mengning; Coop, Graham; Kim, Yuseob; Sabeti, Pardis; Chen, Yuan; Stalker, Jim (abril de 2006). «Spread of an Inactive Form of Caspase-12 in Humans Is Due to Recent Positive Selection». The American Journal of Human Genetics (em inglês) (4): 659–670. PMC PMC1424700Acessível livremente Verifique |pmc= (ajuda). PMID 16532395. doi:10.1086/503116. Consultado em 25 de dezembro de 2022 
  27. Zheng, Deyou; Frankish, Adam; Baertsch, Robert; Kapranov, Philipp; Reymond, Alexandre; Choo, Siew Woh; Lu, Yontao; Denoeud, France; Antonarakis, Stylianos E. (junho de 2007). «Pseudogenes in the ENCODE regions: Consensus annotation, analysis of transcription, and evolution». Genome Research (em inglês) (6): 839–851. ISSN 1088-9051. PMC PMC1891343Acessível livremente Verifique |pmc= (ajuda). PMID 17568002. doi:10.1101/gr.5586307. Consultado em 25 de dezembro de 2022 
  28. Prieto-Godino, Lucia L.; Rytz, Raphael; Bargeton, Benoîte; Abuin, Liliane; Arguello, J. Roman; Peraro, Matteo Dal; Benton, Richard (3 de novembro de 2016). «Olfactory receptor pseudo-pseudogenes». Nature (em inglês) (7627): 93–97. ISSN 0028-0836. PMC PMC5164928Acessível livremente Verifique |pmc= (ajuda). PMID 27776356. doi:10.1038/nature19824. Consultado em 25 de dezembro de 2022 
  29. Cheetham, Seth W.; Faulkner, Geoffrey J.; Dinger, Marcel E. (março de 2020). «Overcoming challenges and dogmas to understand the functions of pseudogenes». Nature Reviews Genetics (em inglês) (3): 191–201. ISSN 1471-0056. doi:10.1038/s41576-019-0196-1. Consultado em 25 de dezembro de 2022 
  30. Zerbino, Daniel R.; Frankish, Adam; Flicek, Paul (31 de agosto de 2020). «Progress, Challenges, and Surprises in Annotating the Human Genome». Annual Review of Genomics and Human Genetics (em inglês) (1): 55–79. ISSN 1527-8204. PMC PMC7116059Acessível livremente Verifique |pmc= (ajuda). PMID 32421357. doi:10.1146/annurev-genom-121119-083418. Consultado em 25 de dezembro de 2022 
  31. Pei, Baikang; Sisu, Cristina; Frankish, Adam; Howald, Cédric; Habegger, Lukas; Mu, Xinmeng; Harte, Rachel; Balasubramanian, Suganthi; Tanzer, Andrea (2012). «The GENCODE pseudogene resource». Genome Biology (em inglês) (9): R51. ISSN 1465-6906. PMC PMC3491395Acessível livremente Verifique |pmc= (ajuda). PMID 22951037. doi:10.1186/gb-2012-13-9-r51. Consultado em 25 de dezembro de 2022 
  32. Wright, James C.; Mudge, Jonathan; Weisser, Hendrik; Barzine, Mitra P.; Gonzalez, Jose M.; Brazma, Alvis; Choudhary, Jyoti S.; Harrow, Jennifer (setembro de 2016). «Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow». Nature Communications (em inglês) (1). 11778 páginas. ISSN 2041-1723. PMC PMC4895710Acessível livremente Verifique |pmc= (ajuda). PMID 27250503. doi:10.1038/ncomms11778. Consultado em 25 de dezembro de 2022