Genoma humano: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Criado ao traduzir a página "Human genome"
Etiquetas: Inserção do elemento "nowiki", possivelmente errônea Remoção considerável de conteúdo Tradução de Conteúdo Tradução de Conteúdo 2
Linha 1: Linha 1:
O '''genoma humano''' é um [[genoma]] (do grego geno: que forma e ma: ação) do ''[[Homo sapiens]]:'' é a sequência dos 23 pares de [[cromossomo]]s do núcleo de cada [[célula]] humana [[diplóide]] somado ao pequeno porém distinto grupamento de [[DNA mitocondrial]]. Dos 23 pares, 22 são [[autossomo|cromossomos autossômicos]] e um par é determinante do sexo (o cromossomo X nas mulheres e o cromossomo Y nos homens). O [[Projeto Genoma Humano]] produziu uma sequência de referência do genoma humano eucromático, usado em todo o mundo e nas ciências biomédicas. Estimava-se que o genoma humano possui cerca de 27.000 [[gene]]s,<ref>{{citar web|url=http://cienciahoje.uol.com.br/4210|titulo=Quantos genes tem o ser humano e por que esse número é menor que o de proteínas?|acessodata=27/02/2009}}</ref><ref name="Watson">Watson, JD, Baker TA, Bell SP, Gann A, Levine M, Losick R. (2004). “Ch9-10”, Molecular Biology of the Gene, 5th ed., Peason Benjamin Cummings; CSHL Press.</ref>.que codificam todas as [[proteína]]s humanas com exceção daquelas codificadas pela [[mitocôndria]]. No entanto, estudos de 2014 trazem evidencias de existir 19.000 genes. <ref>{{Citar web|url=https://www.sciencedaily.com/releases/2014/07/140703112830.htm|titulo=Multiple evidence strands suggest that there may be as few as 19 000 human protein-coding genes|data=3 June 2014|acessodata=27 Mar 2017|obra=Multiple evidence strands suggest that there may be as few as 19 000 human protein-coding genes|publicado=Hum Mol Genet (2014)|ultimo=Iakes Ezkurdia David Juan Jose Manuel Rodriguez Adam Frankish Mark Diekhans Jennifer Harrow Jesus Vazquez Alfonso Valencia Michael L. Tress|primeiro=Iakes Ezkurdia David Juan Jose Manuel Rodriguez Adam Frankish Mark Diekhans Jennifer Harrow Jesus Vazquez Alfonso Valencia Michael L. Tress}}</ref>


{{Infobox genome|image=Karyotype.png|caption=Graphical representation of the idealized human diploid [[karyotype]], showing the organization of the genome into chromosomes. This drawing shows both the female (XX) and male (XY) versions of the 23rd chromosome pair. Chromosomes are shown aligned at their [[centromeres]]. The mitochondrial DNA is not shown.|taxId=51|ploidy=diploid|chromosomes=23 pairs|size=3,234.83 Mb (Mega-basepairs) per haploid genome<br/> 6,469.66 Mb total (diploid).|year=}}O '''genoma humano''' é o conjunto completo de [[Sequência de ADN|sequências de ácido nucleico]] codificado como [[Ácido desoxirribonucleico|DNA]] dentro dos 23 pares de [[Cromossomo|cromossomos]] nos [[Núcleo celular|núcleos das células]] e em uma pequena molécula de DNA encontrada nas [[Mitocôndria|mitocôndrias]] individuais. Usualmente, o genoma mitocondrial é tratado separadamente do genoma nuclear. <ref name="Brown">{{Citar web|titulo=The Human Genome|url=https://www.ncbi.nlm.nih.gov/books/NBK21134/|lingua=en}}</ref>
Uma recontagem de genes humanos, em 2018, eleva o número para pelo menos 46.831. Essa estimativa é baseada em uma definição mais ampla de exatamente o que é um gene. Os genes costumavam ser definidos como trechos de DNA que contêm instruções que são copiadas para o RNA e transformadas em proteínas. Pesquisadores não concordam totalmente sobre quantos desses genes codificadores de proteínas existem. Muitos cientistas expandiram a definição de um gene para incluir aqueles que produzem RNAs que, em vez de serem transformados em proteínas, têm outras funções na célula. Nem todos os genes produzem proteínas<ref>{{Citar periódico|ultimo=Saey|primeiro=Tina Hesman|data=2018-09-17|titulo=How many human genes are there? No one really knows even 15 years after the completion of the Human Genome Project.|url=https://www.sciencenews.org/article/recount-human-genes-ups-number-least-46831?tgt=nr|jornal=Science News|lingua=en}}</ref>. Pesquisadores encontraram 25,525 genes de RNA, incluindo 18,484 RNA não codificador de longo comprimento ou genes de [[lncRNA]]<ref>{{Citar web|url=https://www.genenames.org/cgi-bin/genefamilies/set/788|titulo=Long non-coding RNAs (published) Gene Family {{!}} HUGO Gene Nomenclature Committee|acessodata=2018-09-18|obra=www.genenames.org}}</ref>


Os [[Genoma|genomas]] humanos são compostos tanto por genes de DNA codificadores de proteínas quanto por [[ADN não codificante|DNAs não codificadores]].
A sequência de [[DNA]] que conforma o genoma humano contém codificada a informação necessária para a expressão altamente coordenada e adaptável ao ambiente, do conjunto de proteínas humanas. As proteínas e não o DNA, são as principais [[biomolécula]]s reguladoras, sinalizadoras, organizando-se em enormes redes funcionais de interação.


Os genomas humanos [[Ploidia|haplóides]] estão contidos nas [[Célula germinativa|células germinativas]] ([[óvulo]]<nowiki/>s e [[espermatozóides]]) e são constituídos por três bilhões de [[Par de bases|pares de bases de]] [[Ácido desoxirribonucleico|DNA]], enquanto os genomas [[Ploidia|diplóides]] (encontrados em [[Célula somática|células somáticas]]) tem o dobro do conteúdo de DNA. Embora existam diferenças significativas entre os genomas de indivíduos humanos (na ordem de 0,1%), <ref>{{Citar periódico|titulo=An integrated map of genetic variation from 1,092 human genomes|jornal=Nature|volume=491|bibcode=2012Natur.491...56T|doi=10.1038/nature11632|pmc=3498066|pmid=23128226}}</ref> estes são consideravelmente menores que as diferenças entre humanos e seus parentes vivos mais próximos, os [[Chimpanzé-comum|chimpanzés]] (aproximadamente 4% <ref>{{Citar periódico|titulo=Comparing the human and chimpanzee genomes: searching for needles in a haystack|jornal=Genome Research|volume=15|doi=10.1101/gr.3737405|pmid=16339373}}</ref> ) e os [[Bonobo|bonobos.]] <section begin="lead" /><section end="lead" /> As primeiras sequências do genoma humano foram publicadas em fevereiro de 2001 pelo [[Projeto Genoma Humano]] <ref> [https://www.genome.gov/10002192 Consórcio Internacional de Seqüenciamento do Genoma Humano Publica Sequência e Análise do Genoma Humano] </ref> e pela Celera Corporation . <ref name="Celera2001">{{Citar jornal|url=http://science.sciencemag.org/content/291/5507/1177|titulo=The Human Genome}}</ref> A conclusão da sequência do projeto do genoma humano foi publicada em 2004. <ref name="IHSGC2004">{{Citar periódico|titulo=Finishing the euchromatic sequence of the human genome|url=http://www.nature.com/nature/journal/v431/n7011/full/nature03001.html|jornal=Nature|volume=431|bibcode=2004Natur.431..931H|doi=10.1038/nature03001|pmid=15496913}}</ref> O genoma humano foi o primeiro de todos os vertebrados a ser completamente sequenciado. A partir de 2012, milhares de genomas humanos foram completamente sequenciados, e muitos outros foram mapeados em níveis mais baixos de resolução. Esses dados são usados mundialmente em [[ciências biomédicas]] , [[Antropologia física|antropologia]] , ciência [[Impressão genética|forense]] e outros ramos da ciência. Existe uma expectativa amplamente difundida de que os estudos genômicos levarão a avanços no diagnóstico e tratamento de doenças e em novas teorias em muitos campos da biologia, por exemplo [[Evolução humana|a evolução humana]] .
Em definitivo, o proteoma fundamenta particularmente a [[Morfologia (biologia)|morfologia]] e a funcionalidade de cada célula, assim como, a organização estrutural e funcional de células distintas conforme cada [[tecido]], [[Órgão (anatomia)|órgão]] e finalmente um [[organismo]] em seu conjunto. Assim o genoma humano contém a informação básica necessária para o desenvolvimento físico de um ser humano.


Embora a sequência do genoma humano tenha sido quase totalmente sequenciada, ela ainda não é totalmente compreendida. A maioria dos genes foi identificada por uma combinação de abordagens experimentais e de [[bioinformática]] de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar melhor as funções biológicas de seus produtos ([[proteínas]] e [[Ácido ribonucleico|RNA]]).
<center>

{| class="wikitable" style="float:center; margin:0 0 1em 1em"
Existem cerca de 19.000 a 20.000 genes codificadores de proteínas humanas. <ref>{{Citar periódico|titulo=Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes|jornal=Human Molecular Genetics|volume=23|doi=10.1093/hmg/ddu309|pmc=4204768|pmid=24939910}}</ref> A estimativa do número de genes humanos foi repetidamente revisada para baixo de previsões iniciais de 100.000 ou mais, já que a qualidade da sequência do genoma e os métodos de detecção de genes melhoraram e poderiam continuar a cair ainda mais. <ref name="IHSGC2004">{{Citar periódico|titulo=Finishing the euchromatic sequence of the human genome|url=http://www.nature.com/nature/journal/v431/n7011/full/nature03001.html|jornal=Nature|volume=431|bibcode=2004Natur.431..931H|doi=10.1038/nature03001|pmid=15496913}}</ref> <ref name="ENCODEScience">{{Citar periódico|titulo=Genomics. ENCODE project writes eulogy for junk DNA|jornal=Science|volume=337|doi=10.1126/science.337.6099.1159|pmid=22955811}}</ref> Sequências codificadoras de proteínas representam apenas uma pequena fração do genoma (aproximadamente 1,5%), e o resto é associado com moléculas de [[ARN não codificante|RNA não codificante]], [[Sequência reguladora|sequências reguladoras de DNA]] , [[Retrotransposão|LINEs]] , [[Retrotransposão|SINEs]] , [[Intrão|intróns]] , e sequências de funções ainda indeterminadas. <ref name="IHSGC2001">{{Citar periódico|titulo=Initial sequencing and analysis of the human genome|jornal=Nature|volume=409|bibcode=2001Natur.409..860L|doi=10.1038/35057062|pmid=11237011}}</ref>
|+<small>'''Conteúdo de genes e tamanho do genoma de vários organismos'''</small><ref name="Watson"/>

Em junho de 2016, os cientistas anunciaram formalmente o HGP-Write, um plano para sintetizar o genoma humano. <ref name="NYT-20160602">{{Citar jornal|titulo=Scientists Announce HGP-Write, Project to Synthesize the Human Genome|url=https://www.nytimes.com/2016/06/03/science/human-genome-project-write-synthetic-dna.html}}</ref> <ref name="SCI-20160602">{{Citar periódico|numero-autores=6|titulo=The Genome Project-Write|jornal=Science|volume=353|bibcode=2016Sci...353..126B|doi=10.1126/science.aaf6850|pmid=27256881}}</ref>

== Organização molecular e conteúdo genético ==
O comprimento total do genoma humano é superior a 3 bilhões de pares de bases. O genoma é organizado em 22 cromossomos pareados, mais o [[cromossomo X]] pareado com outro cromossomo X em fêmeas, e, em machos, com um [[cromossomo Y]].

[[Cromossomos]] são grandes moléculas lineares de DNA contidas no núcleo da célula. O genoma também inclui o [[ADN mitocondrial|DNA mitocondrial]] , uma molécula circular com tamanho bem menor que o do DNA nuclear e que se localiza nas [[mitocôndria]]<nowiki/>s .

Na tabela a seguir, estão expostas informações básicas sobre o genoma humano, baseadas em uma referência. Logo, a tabela não representa a sequência de nenhum indivíduo específico. (Fonte de dados: [http://useast.ensembl.org/Homo_sapiens/Location/Genome?r=Y:1-1000 Ensembl genome browser release 87] , December 2016 para a maioria dos valores; [http://jul2012.archive.ensembl.org/Homo_sapiens/Location/Chromosome?r=1:1-1000000 Ensembl genome browser release 68] , julho de 2012 para miRNA, rRNA, snRNA, snoRNA. )
{| class="wikitable sortable" style="font-size:75%;"
!Cromossomo
!<br />Comprimento ([[Milímetro|mm]])
!Número de pares de base
!Variações
!Número de genes que codificam proteínas
!Pseudo-<br /><br />genes
!Quantidade de RNA não codificantes longos
!Quantidade de RNA não codificantes curtos
!miRNA
!rRNA
!snRNA
!snoRNA
!Misc<br /><br />ncRNA
!Links
!Posição do Centromer<br /><br /><br />([[Par de bases|Mbp]])
!Cumulativo<br /><br />(%)
|-
|-
|[[Cromossoma 1 (humano)|1]]
! Espécie
|85
! Tamanho do<br />genoma (Mb)
| style="text-align: right;" |248,956,422
! Número<br />de genes
| style="text-align: right;" |12,151,146
|2058
|1220
|1200
|496
|134
|66
|221
|145
|192
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=1 EBI]
|125
|7.9
|-
|-
|[[Cromossoma 2 (humano)|2]]
| ''[[Mycoplasma genitalium]]''
|83
| 0,58
| style="text-align: right;" |242,193,529
| 500
| style="text-align: right;" |12,945,965
|1309
|1023
|1037
|375
|115
|40
|161
|117
|176
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=2 EBI]
|93.3
|16.2
|-
|-
|[[Cromossoma 3 (humano)|3]]
| ''[[Streptococcus pneumoniae]]''
|67
| 2,2
| style="text-align: right;" |198,295,559
| 2300
| style="text-align: right;" |10,638,715
|1078
|763
|711
|298
|99
|29
|138
|87
|134
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=3 EBI]
|91
|23
|-
|-
|[[Cromossoma 4 (humano)|4]]
| ''[[Escherichia coli]]''
|65
| 4,6
| style="text-align: right;" |190,214,555
| 4.400
| style="text-align: right;" |10,165,685
|752
|727
|657
|228
|92
|24
|120
|56
|104
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=4 EBI]
|50.4
|29.6
|-
|-
|[[Cromossoma 5 (humano)|5]]
| ''[[Saccharomyces cerevisiae]]''
| 12
|62
| style="text-align: right;" |181,538,259
| 5.800
| style="text-align: right;" |9,519,995
|876
|721
|844
|235
|83
|25
|106
|61
|119
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=5 EBI]
|48.4
|35.8
|-
|-
|[[Cromossoma 6|6]]
| ''[[Caenorhabditis elegans]]''
| 97
|58
| style="text-align: right;" |170,805,979
| 19.000
| style="text-align: right;" |9,130,476
|1048
|801
|639
|234
|81
|26
|111
|73
|105
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=6 EBI]
|61
|41.6
|-
|-
|[[Cromossoma 7 (humano)|7]]
| ''[[Arabidopsis thaliana]]''
|54
| 125
| style="text-align: right;" |159,345,973
| 25.500
| style="text-align: right;" |8,613,298
|989
|885
|605
|208
|90
|24
|90
|76
|143
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=7 EBI]
|59.9
|47.1
|-
|-
|[[Cromossoma 8 (humano)|8]]
| ''[[Drosophila melanogaster]]'' (mosca)
|50
| 180
| style="text-align: right;" |145,138,636
| 13.700
| style="text-align: right;" |8,221,520
|677
|613
|735
|214
|80
|28
|86
|52
|82
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=8 EBI]
|45.6
|52
|-
|-
|[[Cromossoma 9 (humano)|9]]
| ''[[Oryza sativa]]'' (arroz)
|48
| 466
| style="text-align: right;" |138,394,717
| 45-55.000
| style="text-align: right;" |6,590,811
|786
|661
|491
|190
|69
|19
|66
|51
|96
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=9 EBI]
|49
|56.3
|-
|-
|[[Cromossoma 10 (humano)|10]]
| ''[[Camundongo|Mus musculus]]''
|46
| 2500
| style="text-align: right;" |133,797,422
| 29.000
| style="text-align: right;" |7,223,944
|733
|568
|579
|204
|64
|32
|87
|56
|89
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=10 EBI]
|40.2
|60.9
|-
|-
| ''[[Homo sapiens]]'' (ser humano)
|[[Cromossoma 11 (humano)|11]]
|46
| 2900
| style="text-align: right;" |135,086,622
| 19.000
| style="text-align: right;" |7,535,370
|}</center>
|1298
|821
|710
|233
|63
|24
|74
|76
|97
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=11 EBI]
|53.7
|65.4
|-
|[[Cromossoma 12 (humano)|12]]
|45
| style="text-align: right;" |133,275,309
| style="text-align: right;" |7,228,129
|1034
|617
|848
|227
|72
|27
|106
|62
|115
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=12 EBI]
|35.8
|70
|-
|[[Cromossoma 13 (humano)|13]]
|39
| style="text-align: right;" |114,364,328
| style="text-align: right;" |5,082,574
|327
|372
|397
|104
|42
|16
|45
|34
|75
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=13 EBI]
|17.9
|73.4
|-
|[[Cromossoma 14 (humano)|14]]
|36
| style="text-align: right;" |107,043,718
| style="text-align: right;" |4,865,950
|830
|523
|533
|239
|92
|10
|65
|97
|79
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=14 EBI]
|17.6
|76.4
|-
|[[Cromossoma 15 (humano)|15]]
|35
| style="text-align: right;" |101,991,189
| style="text-align: right;" |4,515,076
|613
|510
|639
|250
|78
|13
|63
|136
|93
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=15 EBI]
|19
|79.3
|-
|[[Cromossoma 16 (humano)|16]]
|31
| style="text-align: right;" |90,338,345
| style="text-align: right;" |5,101,702
|873
|465
|799
|187
|52
|32
|53
|58
|51
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=16 EBI]
|36.6
|82
|-
|[[Cromossoma 17 (humano)|17]]
|28
| style="text-align: right;" |83,257,441
| style="text-align: right;" |4,614,972
|1197
|531
|834
|235
|61
|15
|80
|71
|99
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=17 EBI]
|24
|84.8
|-
|[[Cromossoma 18 (humano)|18]]
|27
| style="text-align: right;" |80,373,285
| style="text-align: right;" |4,035,966
|270
|247
|453
|109
|32
|13
|51
|36
|41
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=18 EBI]
|17.2
|87.4
|-
|[[Cromossoma 19 (humano)|19]]
|20
| style="text-align: right;" |58,617,616
| style="text-align: right;" |3,858,269
|1472
|512
|628
|179
|110
|13
|29
|31
|61
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=19 EBI]
|26.5
|89.3
|-
|[[Cromossoma 20 (humano)|20]]
|21
| style="text-align: right;" |64,444,167
| style="text-align: right;" |3,439,621
|544
|249
|384
|131
|57
|15
|46
|37
|68
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=20 EBI]
|27.5
|91.4
|-
|[[Cromossoma 21 (humano)|21]]
|16
| style="text-align: right;" |46,709,983
| style="text-align: right;" |2,049,697
|234
|185
|305
|71
|16
|5
|21
|19
|24
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=21 EBI]
|13.2
|92.6
|-
|[[Cromossoma 22 (humano)|22]]
|17
| style="text-align: right;" |50,818,468
| style="text-align: right;" |2,135,311
|488
|324
|357
|78
|31
|5
|23
|23
|62
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=22 EBI]
|14.7
|93.8
|-
|X
|53
| style="text-align: right;" |156,040,895
| style="text-align: right;" |5,753,881
|842
|874
|271
|258
|128
|22
|85
|64
|100
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=X EBI]
|60.6
|99.1
|-
|Y
|20
| style="text-align: right;" |57,227,415
| style="text-align: right;" |211,643
|71
|388
|71
|30
|15
|7
|17
|3
|8
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=Y EBI]
|12.5
|100
|-
|[[ADN mitocondrial|mtDNA]]
|0.0054
| style="text-align: right;" |16,569
| style="text-align: right;" |929
|13
|0
|0
|24
|0
|2
|0
|0
|0
|[http://useast.ensembl.org/Homo_sapiens/Location/Chromosome?r=MT EBI]
|N/A
|100
|-
|total
|
| style="text-align: right;" |3,088,286,401
| style="text-align: right;" |155,630,645
|20412
|14600
|14727
|5037
|1756
|532
|1944
|1521
|2213
|
|
|
|}
'''Tabela 1''' (acima) resume a organização física e o conteúdo gênico do genoma de referência humano , com links para a análise original, conforme publicado no [[Ensembl|banco de]] dados [[Ensembl]] do Instituto Europeu de Bioinformática (EBI) e do Wellcome Trust Sanger Institute .

Os comprimentos cromossômicos foram estimados pela multiplicação do número de pares de bases por 0,34 nanômetros - a distância entre pares de bases em uma [[Ácido desoxirribonucleico|dupla hélice]] do [[Ácido desoxirribonucleico|DNA]] .

O número de proteínas baseia-se no número inicial de transcritos de precursores RNAm e não inclui produtos de [[splicing alternativo]] , ou modificações na estrutura proteica que ocorrem após a [[Tradução (genética)|tradução]] .

Variações são diferenças únicas na sequência de DNA que foram identificadas nas sequências do genoma humano analisadas pela Ensembl em dezembro de 2016. Espera-se que o número de variações identificadas aumente à medida que outros genomas pessoais sejam sequenciados e analisados. Além do conteúdo gênico mostrado nesta tabela, um grande número de sequências funcionais não expressas foram identificadas em todo o genoma humano (ver abaixo).

[[ARN não codificante|RNAs não-codificantes pequenos]] são RNAs de até 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: [[Micro-ARN|microRNAs]] ou miRNAs (reguladores pós-transcricionais da expressão gênica), [[Pequeno ARN nuclear|RNAs nucleares pequenos]] ou snRNAs (os componentes de RNA dos [[Spliceossoma|spliceosomos]] ) e [[SnoRNA|RNAs nucleolares pequenos]] , ou snoRNA (envolvido na orientação de modificações químicas para outras moléculas de RNA). RNAs longos não-codificantes são moléculas de RNA com mais de 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: [[ARN ribossômico|RNAs ribossômicos]] ou rRNAs (os componentes de RNA dos [[Ribossoma|ribossomos]] ), e uma variedade de outros RNAs longos que estão envolvidos na [[regulação da expressão gênica]] , [[epigenética]], e regulação da atividade de genes codificadores de proteínas.

=== Completude da sequência do genoma humano ===
Embora o genoma humano tenha sido completamente sequenciado para todos os fins práticos, ainda existem centenas de lacunas na sequência. Um estudo recente observou mais de 160 lacunas [[Eucromatina|eucromáticas,]] das quais 50 lacunas foram fechadas. <ref name="Chaisson">{{Citar periódico|titulo=Resolving the complexity of the human genome using single-molecule sequencing|jornal=Nature|volume=517|bibcode=2015Natur.517..608C|doi=10.1038/nature13907|pmc=4317254|pmid=25383537}}</ref> No entanto, ainda existem numerosas lacunas nas partes [[Heterocromatina|heterocromáticas]] do genoma que são muito mais difíceis de [[Sequenciamento de DNA|sequenciar]] devido a numerosas [[Sequência repetitiva (ADN)|repetições]] e outras sequências de características intratáveis.

=== Conteúdo da informação ===
O genoma humano de referência (GRC v38) foi compactado com sucesso para ~ 5,2 vezes (razoavelmente menos que 550 MB) em 155 minutos usando um computador de mesa com 6,4 GB de RAM. <ref name="Pratas"> Pratas, D., Pinho, AJ e Ferreira, PJSG Compressão eficiente de seqüências genômicas. ''Conferência de Compressão de Dados'' , Snowbird, Utah, 2016. </ref>
[[Ficheiro:Genes_and_base_pairs_on_chromosomes.svg|esquerda|miniaturadaimagem|400x400px| Diagrama mostrando o número de pares de bases em cada cromossomo em verde. ]]
O genoma humano [[Ploidia|haplóide]] (23 [[Cromossomo|cromossomos]] ) tem cerca de 3 bilhões de pares de bases e contém cerca de 30.000 genes. <ref>{{Citar web|url=https://www.genome.gov/11006943/human-genome-project-completion-frequently-asked-questions/|titulo=Human Genome Project Completion: Frequently Asked Questions|obra=National Human Genome Research Institute (NHGRI)|lingua=en-US}}</ref> Como cada par de bases pode ser codificado por 2 bits, isso significa aproximadamente 750 [[Megabyte|megabytes]] de dados. Uma célula somática individual ( [[Ploidia|diploide]] ) contém o dobro dessa quantidade, isto é, cerca de 6 bilhões de pares de bases. Os homens têm menos que as mulheres porque o cromossomo Y tem cerca de 57 milhões de pares de bases, enquanto o X é cerca de 156 milhões, mas em termos de informação os homens têm mais porque o segundo X contém quase as mesmas informações que o primeiro.  Como os genomas individuais variam em sequência em menos de 1% um do outro, as variações do genoma de um dado humano a partir de uma referência comum podem ser [[Compressão sem perda de dados|compactadas sem perda]] para aproximadamente 4 megabytes. <ref name="Christley">{{Citar periódico|titulo=Human genomes as email attachments|jornal=Bioinformatics|volume=25|doi=10.1093/bioinformatics/btn582|issn=1460-2059}}</ref>

A taxa de entropia do genoma difere significativamente entre sequências codificadoras e não codificadoras. Está perto do máximo de 2 bits por par de bases para as sequências de codificação (cerca de 45 milhões de pares de bases), mas menos para as partes não codificantes. Ele varia entre 1,5 e 1,9 bits por par de bases para o cromossomo individual, exceto pelo cromossomo Y, que tem uma taxa de entropia abaixo de 0,9 bits por par de bases. <ref name="Liu">Zhandong Liu, Santosh S Venkatesh and Carlo C Maley,'' Sequence space coverage, entropy of genomes and the potential to detect non-human DNA in human samples'', BMC Genomics 2008, 9:509, [http://www.biomedcentral.com/1471-2164/9/509] {{DOI|10.1186/1471-2164-9-509}}, fig. 6, using the [[Lempel-Ziv]] estimators of entropy rate.</ref> <div class="toccolours searchaux" id="Container" style="text-align: left; padding:0.5em 0 0 0; border-style:solid; float:right;clear:right; padding:0 0.5em; margin:0.3em 0 0.8em 1.4em; overflow: hidden;"><div class="toccolours" id="Caption" style="margin:0 0.5em; float:left; padding:0 auto; border-style:none; clear:both; text-align:center; width:20.5em"><div id="1351" style="float: left;"> </div></div></div>

== DNA mitocondrial ==
O [[ADN mitocondrial|DNA mitocondrial]] humano é de tremendo interesse para os geneticistas, uma vez que, sem dúvida, desempenha um papel em doenças mitocondriais . Também esclarece a evolução humana; por exemplo, a análise da variação no genoma mitocondrial humano levou à postulação de um ancestral comum recente para todos os seres humanos na linha de descendência materna (ver [[Eva mitocondrial]] ).

Devido à falta de um sistema para checar erros de cópia, o DNA mitocondrial (mtDNA) tem uma taxa de variação mais rápida do que o DNA nuclear. Esta taxa de mutação 20 vezes maior permite que o mtDNA seja usado para um rastreamento mais preciso da ancestralidade materna. Estudos de mtDNA em populações permitiram traçar antigos caminhos migratórios, como a migração de [[Povos ameríndios|nativos americanos]] da [[Sibéria]] ou [[Polinésia|polinésios]] do sudeste da [[Ásia]] . Ele também tem sido usado para mostrar que não há vestígios de DNA [[Homem de Neandertal|neandertal]] na mistura genética européia herdada através da linhagem puramente materna. <ref>{{Citar web|url=http://genome.wellcome.ac.uk/doc_WTD020876.html|titulo=Mitochondrial DNA and human history|urlmorta=yes}}</ref> Devido à forma restritiva de todos ou nenhum tipo de herança de mtDNA, este resultado (nenhum vestígio de mtDNA de Neandertal) seria provável ao menos que houvesse uma grande porcentagem de ascendência neandertal, ou houvesse forte seleção positiva para esse mtDNA (por exemplo, 5 gerações, apenas 1 de seus 32 ancestrais contribuiu para o seu mtDNA, então se um desses 32 fosse puro Neanderthal, você esperaria que ~ 3% do seu DNA autossômico fosse de origem neandertal, mas você teria uma chance de ~ 97% de ter nenhum vestígio de mtDNA de Neanderthal).

== [[Epigenoma]] ==
A [[epigenética]] descreve uma variedade de características do genoma humano que transcendem sua sequência primária de DNA, como o acondicionamento da [[cromatina]] , modificações de [[Histona|histonas]] e [[Metilação do ADN|metilação do DNA]] , e que são importantes na regulação da expressão gênica, replicação do genoma e outros processos celulares.

Os marcadores epigenéticos podem promover ou desestimular a transcrição de certos genes, mas não afetam a sequência real dos nucleotídeos do DNA.

A metilação do DNA é uma das principais formas de controle epigenético sobre a expressão gênica e um dos tópicos mais estudados em epigenética. Durante o desenvolvimento, o perfil de metilação do DNA humano experimenta mudanças dramáticas. Nas primeiras células da linhagem germinativa, o genoma tem níveis muito baixos de metilação. Esses baixos níveis geralmente descrevem genes ativos. À medida que o desenvolvimento progride, as etiquetas de impressão dos pais levam ao aumento da atividade de metilação. <ref name="pmid17320514">{{Citar periódico|titulo=Beyond the sequence: cellular organization of genome function|jornal=Cell|volume=128|doi=10.1016/j.cell.2007.01.028|pmid=17320514}}</ref> <ref name="pmid17320505">{{Citar periódico|titulo=The mammalian epigenome|jornal=Cell|volume=128|doi=10.1016/j.cell.2007.01.033|pmid=17320505}}</ref>

Padrões epigenéticos podem ser identificados entre os tecidos dentro de um mesmo indivíduo.

Genes idênticos que têm diferenças apenas em seu estado epigenético são chamados '''epialelos''' . Os epialelos podem ser colocadas em três categorias:

* aquelas diretamente determinadas pelo genótipo de um indivíduo;
* aquelas influenciadas pelo genótipo;
* aquelas inteiramente independentes do genótipo.

O epigenoma também é influenciado significativamente por fatores ambientais. Dieta, toxinas e hormônios afetam o estado epigenético. Estudos em manipulação dietética demonstraram que dietas com deficiência de metil estão associadas à hipometilação do epigenoma. Tais estudos estabelecem a epigenética como uma importante interface entre o ambiente e o genoma. <ref>{{Citar periódico|titulo=[Epigenetics, interface between environment and genes: role in complex diseases]|jornal=Revue Médicale de Liège|volume=67|pmid=22891475}}</ref>

== Referências ==
<references group="" responsive="0"></references>


== Links externos ==
{{Referências|Notas e referências}}


* [http://www.ensembl.org/ Ensembl] O projeto [[Ensembl|Navegl]] Genome Browser
{{esboço-genética}}
* [https://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=9606 Visualizador do genoma humano da Biblioteca Nacional de Medicina]
* [http://genome.ucsc.edu/ Navegador do Genoma UCSC] .
* [http://www.ornl.gov/sci/techresources/Human_Genome/project/info.shtml Projeto Genoma Humano] .


* [http://www.genome.gov/ O Instituto Nacional de Pesquisa do Genoma Humano] * [https://www.cdc.gov/genomics/default.htm O Escritório Nacional de Genômica de Saúde Pública]
{{DEFAULTSORT:Genoma Humano}}
* [https://grrreggg.github.io/gene/ Visualizador simples do genoma humano]
[[Categoria:Genética]]
[[Categoria:Evolução humana]]
[[Categoria:Genética humana]]
[[Categoria:Genómica]]
[[Categoria:!Páginas com traduções não revistas]]

Revisão das 21h11min de 30 de março de 2019

Predefinição:Infobox genomeO genoma humano é o conjunto completo de sequências de ácido nucleico codificado como DNA dentro dos 23 pares de cromossomos nos núcleos das células e em uma pequena molécula de DNA encontrada nas mitocôndrias individuais. Usualmente, o genoma mitocondrial é tratado separadamente do genoma nuclear. [1]

Os genomas humanos são compostos tanto por genes de DNA codificadores de proteínas quanto por DNAs não codificadores.

Os genomas humanos haplóides estão contidos nas células germinativas (óvulos e espermatozóides) e são constituídos por três bilhões de pares de bases de DNA, enquanto os genomas diplóides (encontrados em células somáticas) tem o dobro do conteúdo de DNA. Embora existam diferenças significativas entre os genomas de indivíduos humanos (na ordem de 0,1%), [2] estes são consideravelmente menores que as diferenças entre humanos e seus parentes vivos mais próximos, os chimpanzés (aproximadamente 4% [3] ) e os bonobos. As primeiras sequências do genoma humano foram publicadas em fevereiro de 2001 pelo Projeto Genoma Humano [4] e pela Celera Corporation . [5] A conclusão da sequência do projeto do genoma humano foi publicada em 2004. [6] O genoma humano foi o primeiro de todos os vertebrados a ser completamente sequenciado. A partir de 2012, milhares de genomas humanos foram completamente sequenciados, e muitos outros foram mapeados em níveis mais baixos de resolução. Esses dados são usados mundialmente em ciências biomédicas , antropologia , ciência forense e outros ramos da ciência. Existe uma expectativa amplamente difundida de que os estudos genômicos levarão a avanços no diagnóstico e tratamento de doenças e em novas teorias em muitos campos da biologia, por exemplo a evolução humana .

Embora a sequência do genoma humano tenha sido quase totalmente sequenciada, ela ainda não é totalmente compreendida. A maioria dos genes foi identificada por uma combinação de abordagens experimentais e de bioinformática de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar melhor as funções biológicas de seus produtos (proteínas e RNA).

Existem cerca de 19.000 a 20.000 genes codificadores de proteínas humanas. [7] A estimativa do número de genes humanos foi repetidamente revisada para baixo de previsões iniciais de 100.000 ou mais, já que a qualidade da sequência do genoma e os métodos de detecção de genes melhoraram e poderiam continuar a cair ainda mais. [6] [8] Sequências codificadoras de proteínas representam apenas uma pequena fração do genoma (aproximadamente 1,5%), e o resto é associado com moléculas de RNA não codificante, sequências reguladoras de DNA , LINEs , SINEs , intróns , e sequências de funções ainda indeterminadas. [9]

Em junho de 2016, os cientistas anunciaram formalmente o HGP-Write, um plano para sintetizar o genoma humano. [10] [11]

Organização molecular e conteúdo genético

O comprimento total do genoma humano é superior a 3 bilhões de pares de bases. O genoma é organizado em 22 cromossomos pareados, mais o cromossomo X pareado com outro cromossomo X em fêmeas, e, em machos, com um cromossomo Y.

Cromossomos são grandes moléculas lineares de DNA contidas no núcleo da célula. O genoma também inclui o DNA mitocondrial , uma molécula circular com tamanho bem menor que o do DNA nuclear e que se localiza nas mitocôndrias .

Na tabela a seguir, estão expostas informações básicas sobre o genoma humano, baseadas em uma referência. Logo, a tabela não representa a sequência de nenhum indivíduo específico. (Fonte de dados: Ensembl genome browser release 87 , December 2016 para a maioria dos valores; Ensembl genome browser release 68 , julho de 2012 para miRNA, rRNA, snRNA, snoRNA. )

Cromossomo
Comprimento (mm)
Número de pares de base Variações Número de genes que codificam proteínas Pseudo-

genes
Quantidade de RNA não codificantes longos Quantidade de RNA não codificantes curtos miRNA rRNA snRNA snoRNA Misc

ncRNA
Links Posição do Centromer


(Mbp)
Cumulativo

(%)
1 85 248,956,422 12,151,146 2058 1220 1200 496 134 66 221 145 192 EBI 125 7.9
2 83 242,193,529 12,945,965 1309 1023 1037 375 115 40 161 117 176 EBI 93.3 16.2
3 67 198,295,559 10,638,715 1078 763 711 298 99 29 138 87 134 EBI 91 23
4 65 190,214,555 10,165,685 752 727 657 228 92 24 120 56 104 EBI 50.4 29.6
5 62 181,538,259 9,519,995 876 721 844 235 83 25 106 61 119 EBI 48.4 35.8
6 58 170,805,979 9,130,476 1048 801 639 234 81 26 111 73 105 EBI 61 41.6
7 54 159,345,973 8,613,298 989 885 605 208 90 24 90 76 143 EBI 59.9 47.1
8 50 145,138,636 8,221,520 677 613 735 214 80 28 86 52 82 EBI 45.6 52
9 48 138,394,717 6,590,811 786 661 491 190 69 19 66 51 96 EBI 49 56.3
10 46 133,797,422 7,223,944 733 568 579 204 64 32 87 56 89 EBI 40.2 60.9
11 46 135,086,622 7,535,370 1298 821 710 233 63 24 74 76 97 EBI 53.7 65.4
12 45 133,275,309 7,228,129 1034 617 848 227 72 27 106 62 115 EBI 35.8 70
13 39 114,364,328 5,082,574 327 372 397 104 42 16 45 34 75 EBI 17.9 73.4
14 36 107,043,718 4,865,950 830 523 533 239 92 10 65 97 79 EBI 17.6 76.4
15 35 101,991,189 4,515,076 613 510 639 250 78 13 63 136 93 EBI 19 79.3
16 31 90,338,345 5,101,702 873 465 799 187 52 32 53 58 51 EBI 36.6 82
17 28 83,257,441 4,614,972 1197 531 834 235 61 15 80 71 99 EBI 24 84.8
18 27 80,373,285 4,035,966 270 247 453 109 32 13 51 36 41 EBI 17.2 87.4
19 20 58,617,616 3,858,269 1472 512 628 179 110 13 29 31 61 EBI 26.5 89.3
20 21 64,444,167 3,439,621 544 249 384 131 57 15 46 37 68 EBI 27.5 91.4
21 16 46,709,983 2,049,697 234 185 305 71 16 5 21 19 24 EBI 13.2 92.6
22 17 50,818,468 2,135,311 488 324 357 78 31 5 23 23 62 EBI 14.7 93.8
X 53 156,040,895 5,753,881 842 874 271 258 128 22 85 64 100 EBI 60.6 99.1
Y 20 57,227,415 211,643 71 388 71 30 15 7 17 3 8 EBI 12.5 100
mtDNA 0.0054 16,569 929 13 0 0 24 0 2 0 0 0 EBI N/A 100
total 3,088,286,401 155,630,645 20412 14600 14727 5037 1756 532 1944 1521 2213

Tabela 1 (acima) resume a organização física e o conteúdo gênico do genoma de referência humano , com links para a análise original, conforme publicado no banco de dados Ensembl do Instituto Europeu de Bioinformática (EBI) e do Wellcome Trust Sanger Institute .

Os comprimentos cromossômicos foram estimados pela multiplicação do número de pares de bases por 0,34 nanômetros - a distância entre pares de bases em uma dupla hélice do DNA .

O número de proteínas baseia-se no número inicial de transcritos de precursores RNAm e não inclui produtos de splicing alternativo , ou modificações na estrutura proteica que ocorrem após a tradução .

Variações são diferenças únicas na sequência de DNA que foram identificadas nas sequências do genoma humano analisadas pela Ensembl em dezembro de 2016. Espera-se que o número de variações identificadas aumente à medida que outros genomas pessoais sejam sequenciados e analisados. Além do conteúdo gênico mostrado nesta tabela, um grande número de sequências funcionais não expressas foram identificadas em todo o genoma humano (ver abaixo).

RNAs não-codificantes pequenos são RNAs de até 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: microRNAs ou miRNAs (reguladores pós-transcricionais da expressão gênica), RNAs nucleares pequenos ou snRNAs (os componentes de RNA dos spliceosomos ) e RNAs nucleolares pequenos , ou snoRNA (envolvido na orientação de modificações químicas para outras moléculas de RNA). RNAs longos não-codificantes são moléculas de RNA com mais de 200 bases que não possuem potencial de codificação de proteínas. Estes incluem: RNAs ribossômicos ou rRNAs (os componentes de RNA dos ribossomos ), e uma variedade de outros RNAs longos que estão envolvidos na regulação da expressão gênica , epigenética, e regulação da atividade de genes codificadores de proteínas.

Completude da sequência do genoma humano

Embora o genoma humano tenha sido completamente sequenciado para todos os fins práticos, ainda existem centenas de lacunas na sequência. Um estudo recente observou mais de 160 lacunas eucromáticas, das quais 50 lacunas foram fechadas. [12] No entanto, ainda existem numerosas lacunas nas partes heterocromáticas do genoma que são muito mais difíceis de sequenciar devido a numerosas repetições e outras sequências de características intratáveis.

Conteúdo da informação

O genoma humano de referência (GRC v38) foi compactado com sucesso para ~ 5,2 vezes (razoavelmente menos que 550 MB) em 155 minutos usando um computador de mesa com 6,4 GB de RAM. [13]

Diagrama mostrando o número de pares de bases em cada cromossomo em verde.

O genoma humano haplóide (23 cromossomos ) tem cerca de 3 bilhões de pares de bases e contém cerca de 30.000 genes. [14] Como cada par de bases pode ser codificado por 2 bits, isso significa aproximadamente 750 megabytes de dados. Uma célula somática individual ( diploide ) contém o dobro dessa quantidade, isto é, cerca de 6 bilhões de pares de bases. Os homens têm menos que as mulheres porque o cromossomo Y tem cerca de 57 milhões de pares de bases, enquanto o X é cerca de 156 milhões, mas em termos de informação os homens têm mais porque o segundo X contém quase as mesmas informações que o primeiro.  Como os genomas individuais variam em sequência em menos de 1% um do outro, as variações do genoma de um dado humano a partir de uma referência comum podem ser compactadas sem perda para aproximadamente 4 megabytes. [15]

A taxa de entropia do genoma difere significativamente entre sequências codificadoras e não codificadoras. Está perto do máximo de 2 bits por par de bases para as sequências de codificação (cerca de 45 milhões de pares de bases), mas menos para as partes não codificantes. Ele varia entre 1,5 e 1,9 bits por par de bases para o cromossomo individual, exceto pelo cromossomo Y, que tem uma taxa de entropia abaixo de 0,9 bits por par de bases. [16]

DNA mitocondrial

O DNA mitocondrial humano é de tremendo interesse para os geneticistas, uma vez que, sem dúvida, desempenha um papel em doenças mitocondriais . Também esclarece a evolução humana; por exemplo, a análise da variação no genoma mitocondrial humano levou à postulação de um ancestral comum recente para todos os seres humanos na linha de descendência materna (ver Eva mitocondrial ).

Devido à falta de um sistema para checar erros de cópia, o DNA mitocondrial (mtDNA) tem uma taxa de variação mais rápida do que o DNA nuclear. Esta taxa de mutação 20 vezes maior permite que o mtDNA seja usado para um rastreamento mais preciso da ancestralidade materna. Estudos de mtDNA em populações permitiram traçar antigos caminhos migratórios, como a migração de nativos americanos da Sibéria ou polinésios do sudeste da Ásia . Ele também tem sido usado para mostrar que não há vestígios de DNA neandertal na mistura genética européia herdada através da linhagem puramente materna. [17] Devido à forma restritiva de todos ou nenhum tipo de herança de mtDNA, este resultado (nenhum vestígio de mtDNA de Neandertal) seria provável ao menos que houvesse uma grande porcentagem de ascendência neandertal, ou houvesse forte seleção positiva para esse mtDNA (por exemplo, 5 gerações, apenas 1 de seus 32 ancestrais contribuiu para o seu mtDNA, então se um desses 32 fosse puro Neanderthal, você esperaria que ~ 3% do seu DNA autossômico fosse de origem neandertal, mas você teria uma chance de ~ 97% de ter nenhum vestígio de mtDNA de Neanderthal).

Epigenoma

A epigenética descreve uma variedade de características do genoma humano que transcendem sua sequência primária de DNA, como o acondicionamento da cromatina , modificações de histonas e metilação do DNA , e que são importantes na regulação da expressão gênica, replicação do genoma e outros processos celulares.

Os marcadores epigenéticos podem promover ou desestimular a transcrição de certos genes, mas não afetam a sequência real dos nucleotídeos do DNA.

A metilação do DNA é uma das principais formas de controle epigenético sobre a expressão gênica e um dos tópicos mais estudados em epigenética. Durante o desenvolvimento, o perfil de metilação do DNA humano experimenta mudanças dramáticas. Nas primeiras células da linhagem germinativa, o genoma tem níveis muito baixos de metilação. Esses baixos níveis geralmente descrevem genes ativos. À medida que o desenvolvimento progride, as etiquetas de impressão dos pais levam ao aumento da atividade de metilação. [18] [19]

Padrões epigenéticos podem ser identificados entre os tecidos dentro de um mesmo indivíduo.

Genes idênticos que têm diferenças apenas em seu estado epigenético são chamados epialelos . Os epialelos podem ser colocadas em três categorias:

  • aquelas diretamente determinadas pelo genótipo de um indivíduo;
  • aquelas influenciadas pelo genótipo;
  • aquelas inteiramente independentes do genótipo.

O epigenoma também é influenciado significativamente por fatores ambientais. Dieta, toxinas e hormônios afetam o estado epigenético. Estudos em manipulação dietética demonstraram que dietas com deficiência de metil estão associadas à hipometilação do epigenoma. Tais estudos estabelecem a epigenética como uma importante interface entre o ambiente e o genoma. [20]

Referências

  1. «The Human Genome» (em inglês) 
  2. «An integrated map of genetic variation from 1,092 human genomes». Nature. 491. Bibcode:2012Natur.491...56T. PMC 3498066Acessível livremente. PMID 23128226. doi:10.1038/nature11632 
  3. «Comparing the human and chimpanzee genomes: searching for needles in a haystack». Genome Research. 15. PMID 16339373. doi:10.1101/gr.3737405 
  4. Consórcio Internacional de Seqüenciamento do Genoma Humano Publica Sequência e Análise do Genoma Humano
  5. «The Human Genome» 
  6. a b «Finishing the euchromatic sequence of the human genome». Nature. 431. Bibcode:2004Natur.431..931H. PMID 15496913. doi:10.1038/nature03001 
  7. «Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes». Human Molecular Genetics. 23. PMC 4204768Acessível livremente. PMID 24939910. doi:10.1093/hmg/ddu309 
  8. «Genomics. ENCODE project writes eulogy for junk DNA». Science. 337. PMID 22955811. doi:10.1126/science.337.6099.1159 
  9. «Initial sequencing and analysis of the human genome». Nature. 409. Bibcode:2001Natur.409..860L. PMID 11237011. doi:10.1038/35057062 
  10. «Scientists Announce HGP-Write, Project to Synthesize the Human Genome» 
  11. «The Genome Project-Write». Science. 353. Bibcode:2016Sci...353..126B. PMID 27256881. doi:10.1126/science.aaf6850 
  12. «Resolving the complexity of the human genome using single-molecule sequencing». Nature. 517. Bibcode:2015Natur.517..608C. PMC 4317254Acessível livremente. PMID 25383537. doi:10.1038/nature13907 
  13. Pratas, D., Pinho, AJ e Ferreira, PJSG Compressão eficiente de seqüências genômicas. Conferência de Compressão de Dados , Snowbird, Utah, 2016.
  14. «Human Genome Project Completion: Frequently Asked Questions». National Human Genome Research Institute (NHGRI) (em inglês) 
  15. «Human genomes as email attachments». Bioinformatics. 25. ISSN 1460-2059. doi:10.1093/bioinformatics/btn582 
  16. Zhandong Liu, Santosh S Venkatesh and Carlo C Maley, Sequence space coverage, entropy of genomes and the potential to detect non-human DNA in human samples, BMC Genomics 2008, 9:509, [1] doi:10.1186/1471-2164-9-509, fig. 6, using the Lempel-Ziv estimators of entropy rate.
  17. «Mitochondrial DNA and human history» [ligação inativa] 
  18. «Beyond the sequence: cellular organization of genome function». Cell. 128. PMID 17320514. doi:10.1016/j.cell.2007.01.028 
  19. «The mammalian epigenome». Cell. 128. PMID 17320505. doi:10.1016/j.cell.2007.01.033 
  20. «[Epigenetics, interface between environment and genes: role in complex diseases]». Revue Médicale de Liège. 67. PMID 22891475 

Links externos