Usuário:Yleite/Genômica comparativa

Origem: Wikipédia, a enciclopédia livre.

Genômica comparativa é o estudo da relação entre genomas de diferentes espécies ou linhagens biológicas, desde estruturas às funções dos mesmos. Embora sendo um campo ainda jovem, não muito aproveitado e aprofundado, garante a aptidão de novos conhecimentos sobre os aspectos da evolução de espécies modernas. As informações fornecidas pelos genomas podem ser requeridas através da genômica comparativa, tomando proveito das similaridades e das divergências encontradas em RNA’s (Ácido ribonucleico), proteínas, regiões reguladoras de diferentes organismos, entre outros, para entender os processos evolutivos e os processos de função pela ação da seleção natural sob os mesmos. A evolução molecular agora, entrando na genômica, sustenta a promessa através de dados genômicos, tanto de revelar os locais dentro do DNA (Ácido desoxirribonucleico) onde a seleção atua, quanto de estimar as frações de substituições evolutivas que foram conduzidas pela seleção natural e, também, por deriva genética.

Seleção Natural e Deriva Genética[editar | editar código-fonte]

Para melhor compreensão, Deriva genética e Seleção natural são explicadas da seguinte forma: A deriva genética, também chamada de deriva gênica, deriva alélica, derivação genética ou ainda oscilação genética é um mecanismo que altera aleatoriamente as frequências alélicas (microevolutivamente falando) ao longo do tempo, enquanto a Seleção Natural é um processo proposto pelo naturalista Charles Darwin para explicar a adaptação e a especialização dos seres vivos de acordo com a evidência pelo registro fóssil[1]. Seu conceito básico explica que em uma população de organismos que se reproduzem, características favoráveis que são hereditárias tornam-se mais comuns em gerações sucessivas, enquanto características desfavoráveis que também são hereditárias tornam-se menos comuns.

Exemplo de Distribuição Normal.

Esse fato ocorre da seguinte forma: Os elementos que se referem às semelhanças entre diferentes espécies, com o passar do tempo permanecem conservados, ou seja, quando tal população estabiliza um valor determinado de uma característica em particular e a diversidade genética diminui, então, tem a tendência de manter a população constante ao longo do tempo (tipo de seleção natural chamada de Seleção Estabilizadora ou Seleção Purificante). Os elementos que se referem às diferenças entre espécies deverão divergir, em outras palavras, há benefício de um único fenótipo, onde o alelo mais vantajoso aumenta de frequência (tipo de seleção natural chamada de Seleção Direcional). Com o passar das gerações a seleção direcional age sobre fenótipos homozigotos e não há necessidade de dominância no alelo, quando é constatado que um alelo recessivo também pode ser fixado na população. Esse tipo de seleção ocorre com frequência em casos de mudanças ambientais e de migração de populações para novas áreas com diferentes pressões ambientais. Além destes, há ainda mais um tipo de seleção natural que mostra que os itens que não tem tanta importância para eventos evolutivos não será conservada. Este tipo de seleção é chamado de Seleção Disruptiva e favorece simultaneamente os indivíduos localizados nos extremos da distribuição normal, ou seja, os indivíduos encontrados nos extremos (em menor quantidade) tendem a produzir maior descendência que aqueles que se encontram no centro da distribuição. Após muitas pesquisas e sucessos em encontrar proteínas funcionais, a genômica comparativa tem se concentrado em encontrar regiões reguladoras e moléculas de siRNA (small interfering RNA) que são moléculas envolvidas no processo de RNA de interferência (RNAi), que é um mecanismo de controle da expressão gênica. Sinais externos podem induzir a uma célula a alterar a expressão de seus genes. A descoberta das proteínas da regulação gênica é um exemplo de que a genômica comparativa é importante, já que tal descoberta foi feita por genética bacteriana - utilizando um vírus bacteriano, o bacteriófago lambda.

Alinhamento de Sequências[editar | editar código-fonte]

Exemplo de alinhamento entre duas sequências, produzido pelo programa ClustalW entre duas proteínas dedo-de-zinco humanas (human zinc finger proteins) identificadas por seus números de acesso no GenBank.

O alinhamento de sequência de nucleotídeos é fundamental em genômica comparativa, pois faz o mapeamento de nucleotídeos de uma sequência com relação aos nucleotídeos de outra sequência que está sendo comparada. Em Bioinformática, essa é a melhor forma de organizar as sequências primárias de DNA, RNA ou de proteínas para identificação de regiões similares que possam ser consequência de relações funcionais, estruturais ou até evolucionárias entre elas[2]. Além disso, é importante encontrar partes funcionais das sequências genômicas para que estas informações sejam usadas para a melhoria da saúde humana - tanto individual quanto socialmente falando - e também apoiar o desenvolvimento da agricultura e pecuária, por exemplo.

Por causa do tamanho de genomas complexos (como no caso do genoma dos seres humanos) é necessária a exigência da automatização de métodos comparativos, para obtenção de toda a informação contida nos mesmos. Recentemente, essas abordagens computacionais para tais comparações se tornaram tema de pesquisa comum na ciência da computação. A coleta pública destes estudos de casos e demonstrações tem crescido e vão desde comparações de genomas inteiros até análises de expressões gênicas. Percebe-se que as duas áreas crescem muito bem juntamente, isso aumenta a introdução de diferentes ideias, incluindo conceitos de sistemas e controle, teoria da informação, análise de cordas e mineração de dados, antecipando-se, também, que as abordagens computacionais se tornarão um tema padrão para a pesquisa e o ensino, enquanto vários cursos começarão a formação de estudantes fluentes em ambos os tópicos.

Abordagens computacionais para o alinhamento de sequências são divididas, basicamente, em duas classes: alinhamentos globais e alinhamentos locais. O cálculo de um alinhamento global é uma forma de otimização global que faz com que o alinhamento cubra todo o comprimento de todas as sequências examinadas. Por outro lado, os alinhamentos locais identificam regiões similares dentro de sequências longas que geralmente, são muito divergentes tratando-se de um todo[3]. Os alinhamentos locais são preferíveis, frequente e geralmente, mas podem acabar sendo difíceis de ser calculados por causa do problema de identificação de regiões internas de similaridade. Existe uma grande variedade de algoritmos para tentar solucionar o problema de alinhamento de sequências.

Genoma humano[editar | editar código-fonte]

Visão geral da estrutura do DNA.

O genoma humano é o genoma do Homo sapiens - do latim, homem sábio, sendo a única espécie animal de primata bípede do gênero Homo ainda viva - que é um genoma extenso, possuindo aproximadamente 2900 Mb, com 27.000 genes, mas apenas 25% do DNA pode ser transcrito em RNA e menos de 2% codifica proteínas. Ele está distribuído por pares de cromossomos, os quais contêm os genes.

Toda a informação é codificada pelo DNA, ácido desoxirribonucleico, que consiste em duas longas cadeias polipeptídicas compostas por quatro tipos de subunidades nucleotídicas, sendo cada uma delas conhecidas como fitas ou cadeias de DNA [4]. No caso dos nucleotídeos do DNA, o açúcar é uma desoxirribose ligada a um único grupo fosfato - por isso denominado ácido desoxirribonucleico - e a base pode ser: Adenina (A), Timina (T), Citosina (C) e Guanina (G). No DNA, Adenina é complementar à Timina, enquanto no RNA, ácido ribonucleico, a Adenina será complementar à Uracila (U) ao invés da Timina (T) e nos dois casos Citosina (C) e Guanina(G) serão sempre complementares. A ordem do alinhamento dos pares de base ao longo da cadeia corresponde à sequência do genoma. No genoma humano existem sequências intervenientes, que são genes chamados de íntrons (do inglês, "intragenic regions"). Os íntrons são parte do DNA que não codificam qualquer parte da proteína produzida pelo gene, por isso, são considerados “DNA-lixo”. Inicialmente são transcritos na molécula de pré-RNAm (pré-RNA mensageiro), mas depois através do splicing são eliminados, seguido da junção dos éxons, outrora separados pelos íntrons. Estes existem principalmente, porém não exclusivamente, nas células eucarióticas. Os éxons - do inglês “expressed regions” - por sua vez, são segmentos de DNA de um gene eucarioto, cujo transcrito sobreviverá ao processo de splicing. Em uma molécula de RNAm os éxons podem codificar aminoácidos de uma proteína e em outras moléculas de RNA maduro, como RNAt (RNA transportador) e RNAr (RNA ribossômico), constituem a parte estrutural.

Os íntrons do genoma humano são muito mais abundantes que em outros genomas, quando comparados. Eles permitem que a célula realize um processo que se denomina “splicing alternativo”, onde formas proteicas diferentes poderão ser produzidas a partir de um mesmo RNA mensageiro (RNAm). Neste processo, o íntron sairá do RNA mensageiro (RNAm), o que possibilitará assim, que o RNA ribossômico (RNAr) faça a tradução gênica, permitindo que fiquem apenas os éxons. Dentro das organelas celulares, as mitocôndrias têm um tipo especial de DNA, o DNA mitocondrial (mtDNA).

Diferente do material genético encontrado no núcleo das células, que é linear, o DNA mitocondrial (mtDNA) possui uma estrutura circular e é uma herança materna. Além disso, o DNA mitocondrial (mtDNA) codifica um número limitado de RNAs e proteínas essenciais para que se desenvolva a função mitocondrial. A principal função da mitocôndria é a formação de ATP (Trifosfato de adenosina ou adenosina trifosfato, nucleotídeo responsável pelo armazenamento de energia em suas ligações químicas) pela fosforilação oxidativa, de modo que seria coerente que os genes que regulam tal função fossem encontrados no DNA mitocondrial (mtDNA). Apesar disso, muitos genomas mitocondriais têm muitos destes genes importantes que podem ser encontrados no genoma nuclear. Tal fato é uma evidência da transferência intranuclear de genes.

Há incertezas na história do conjunto gênico humano, além de ser incompleto. Pois se baseia em poucos genomas comparativos como o camundongo, a drosófila e outros. Os métodos de reconhecimento de genes em seqüência brutas de DNA estão sujeitas a erros. Genes podem não ser detectados, ou serem comparados errados. Além disso, um único gene pode ter a leitura de uma proteína a mais.

Genoma eucarioto[editar | editar código-fonte]

A Identificação dos mecanismos da evolução do genoma eucarioto é um dos objetivos importantes no campo de comparação genômica. Contudo, muitas vezes isso se torna complicado devido à abundância de acontecimentos que tiveram lugar ao longo da história das linhagens individuais, deixando apenas vestígios distorcidos e sobrepostos no genoma de cada organismo vivo. Por esta razão, os estudos comparativos da genômica de organismos modelo de pequeno porte - como por exemplo, de levedura - são de grande valor para o progresso e para a compreensão dos mecanismos gerais da evolução.

Atualmente, existem mais de 50 genomas totalmente sequenciados de organismos eucariotos, mesmo que em muitas dessas sequências haja lacunas e regiões de heterocromatina que não podem ser sequenciadas. Por estes fatos, os tamanhos dos genomas destes organismos são, geralmente, estimativas. Estes genomas contêm mais genes que os genomas de organismos procariotos. Uma característica marcante destes genomas é a presença de sequências genômicas de genes funcionais, que representam cerca de 25% do total da eucromatina - região na qual a cromatina encontra-se desespiralizada na fase Interfase do ciclo celular.

Uma grande parte do genoma destes organismos multicelulares é formada de sequências altamente repetitivas moderadas, que podem ter surgido através de transposição. Cerca de 45% do DNA do genoma humano é derivado de elementos transponíveis e graças à combinação entre domínios diferentes, presentes nos vertebrados, a diversidade dos animais é mais elevada do que a proteína de outras entidades com número de domínios similar.

Genoma procarioto[editar | editar código-fonte]

DNA Mitocondrial

Atualmente, não existe uma quantidade considerável de genomas já sequenciados de organismos procariotos. São genomas de tamanhos pequenos - muito menores que o humano, por exemplo - sendo que o tamanho de tais varia dentro de uma mesma espécie. Os organismos com genomas menores tem a tendência de viver em lugares ou habitats muito restritos - bactérias, por exemplo, que vivem dentro de outros organismos - e possuem características estáveis.

Organismos com genomas maiores podem habitar em regiões mais complexas e variáveis, por exemplo, raízes de plantas ou de solo. As bactérias podem produzir nova informação genética através de processos como o de duplicação de genes, inserção de elementos transponíveis genéticos (os transposons) ou de transferência horizontal de genes, processo que se dá quando duas espécies bacterianas trocam suas informações genéticas ao longo da evolução. A permuta pode ser feita por incorporação de DNA pelas bactérias do espaço devido à troca de plasmídeos ou de vetores virais como os bacteriófagos.

O número de genes que codificam funções biológicas como transcrição ou tradução é similar, em diferentes espécies de bactérias, o que sugere que estas funções são codificadas por um grupo de genes que estão presentes em todas as espécies das mesmas. Por outro lado, funciona como a biossíntese ou como o metabolismo de energia, é regulada por um número variável de genes, de acordo com cada espécie.

Genoma viral[editar | editar código-fonte]

Diferente dos procariotos e dos eucariotos, o genoma viral é constituído de RNA e/ou DNA. Podendo ter o material genético, as moléculas de ácido nucléico,como fita simples ou dupla, linear ou circular, e segmentada ou não. A varíola é um exemplo de genoma usado na genômica comparativa. É um vírus de DNA, do gênero Orthopoxvirus (OPV), da família Poxviridae. É um dos vírus mais resistentes, em particular, aos agentes físicos e a doença considerada uma das mais sérias de todas as doenças infecciosas, matando de 25% a 30% das pessoas infectadas não imunizadas. Por esta razão, existe apenas em dois laboratórios autorizados pela Organização Mundial da Saúde (OMS): U.S. Centers for Disease Control and Prevention / Centro para Controle e Prevenção de Doenças dos EUA (CDC) e Russia’s State Research Center of Virology and Biotechnology / Centro de Pesquisa de Virologia e Biotecnologia do Estado Rússia (VETOR).

Em estudos realizados, foram comparados 45 isolados da varíola em um alinhamento múltiplo e através de um cálculo da diversidade de sítios em todo o alinhamento de nucleotídeos foram observados Polimorfismo de Nucleotídeo Único (SNPs) e uso máximo do alinhamento, que marcou inserções-deleções (indels) no 1 º trimestre de base como um SNPs.

Os resultados inferem recombinação dentro das extremidades do CRS (Regiões de Sequências Codificadas) e, assim, indicam que os CRS finais têm uma história evolutiva diferente do CRS central, o que sugere ainda que os filogramas dos poxvírus podem não ser exatos, exatamente por causa da influência da recombinação em taxas de mutação.

Através da genômica comparativa, foi apontada uma baixa diversidade de sequências para uma seleção de isolados, o que é reconfortante e importante do ponto de vista da biodefesa; por causa de toda a história de bioterrorismo que supostamente, poderia ser feito utilizando vírus da varíola. Além disso, essa baixa diversidade das sequências relatada, aumenta as chances de entender o proteoma e reproduzir um sistema de avaliar contramedidas[5]

Genes parálogos e ortólogos[editar | editar código-fonte]

B1, B2 e B3 são ortólogos entre si, assim como C1, C2 e C3. C e B são parálogos entre si. A representa um evento de duplicação gênica.

Genes homólogos permitem o reconhecimento de funções comuns em diferentes organismos. Genes ortólogos e parálogos são tipos de genes homólogos, sendo com genes equivalentes e que descendam diretamente do mesmo gene do antecessor comum dos dois organismos, que realizam a mesma função molecular ou celular e codificam proteínas correspondentes em organismos diferentes (genes ortólogos) ou genes que podem realizar a mesma função, em um mesmo organismo, ou podem ter divergido depois da sua duplicação gênica para realização uma função diferente ou para atuar sobre substratos diferentes (genes parálogos)[6].

De forma mais explicativa e compreensível: os genes ortólogos são aqueles que serão originados de um único gene do ancestral comum entre as espécies e frequentemente possuirão o mesmo papel biológico que os ancestrais, enquanto os genes parálogos serão aqueles que serão originados por duplicação antes ou depois da especiação e poderão ou não possuir o mesmo papel biológico. Os conceitos de genes ortólogos e parálogos podem ser utilizados como guias, já que servem para analisar a informação de um genoma completo frente a outro. A ortología pode ser verificada em genomas completos através da Sintenia. O termo sintenia está relacionado à propriedade de dois ou mais genes se localizarem em um mesmo cromossomo, ou também à orientação de genes em genomas de organismos relacionados e a conservação de sua ordem.

Referências

  1. RIDLEY, M. Evolução - 3. Ed. - Porto Alegre: Artmed, 2006. 752 p.
  2. CATANHO, M. et al. Biotecnologia Ciência & Desenvolvimento, n. 37, 2007.
  3. VIANA, C. J. M. Aspectos de Genômica Comparativa. 2006. 72 f. Dissertação (Mestrado em Biologia Computacional) – Universidade Federal do Rio Grande do Sul, Campo Grande. 2006.
  4. ALBERTS, B. Biologia Molecular da Célula – 5. Ed. – Porto Alegre: Artmed, 2010. 1396 p.
  5. Esposito J. J. (2006). Genome Sequence Diversity and Clues to the Evolution of Variola (Smallpox) Virus. In Science, vol. 313, pp. 807-812.
  6. Dominguez, A. - Anotação de genomas e bases de dados de fungos. Universidade de Salamanca, disponível em http://esa.ipb.pt/combatinta/ficheiros/doc/abstract/anotacao_%20de_genomas_%20e_bases_de_dados_de_fungos.pdf, acessado em abr/2013.

Ligações Externas[editar | editar código-fonte]