Read

Origem: Wikipédia, a enciclopédia livre.

No sequenciamento de DNA, uma read é uma sequência inferida de pares de bases (ou probabilidades de pares de bases) correspondentes a todo ou parte de um único fragmento de DNA. Um experimento de sequenciamento típico envolve a fragmentação do genoma em milhões de moléculas, que são selecionadas por tamanho e ligadas a adaptadores. O conjunto de fragmentos é denominado biblioteca de sequenciamento, que é sequenciado para produzir um conjunto de reads.[1]

Tamanho de reads[editar | editar código-fonte]

As tecnologias de sequenciamento variam no tamanho das reads produzidas. Reads de tamanho entre 20-40 pares de bases (pb) são chamadas de ultracurtas.[2] Sequenciadores típicos produzem tamanho de reads na faixa de 100-500 pb.[3] No entanto, as plataformas da Pacific Biosciences produzem reads de aproximadamente 1500 bp.[4] O tamanho da read é um fator que pode afetar os resultados dos estudos biológicos.[5] Por exemplo, reads mais longas melhoram a resolução da montagem do genoma de novo e a detecção de variantes estruturais. Estima-se que reads com tamanho superior a 100 quilobases (kb) serão necessários para a montagem de novo do genoma humano.[6] Os pipelines de bioinformática para analisar dados de sequenciamento geralmente levam em consideração o tamanho das reads.[7]

Referências

  1. «Sequencing library: what is it?». Breda Genetics. 12 de agosto de 2016. Consultado em 23 de julho de 2017 
  2. Chaisson, Mark J. (2009). «De novo fragment assembly with short mate-paired reads: Does the read length matter?». Genome Research. 19: 336–346. PMC 2652199Acessível livremente. PMID 19056694. doi:10.1101/gr.079053.108. Consultado em 23 de julho de 2017 
  3. Junemann, Sebastian (2013). «Updating benchtop sequencing performance comparison». Nature Biotechnology. 31: 294–296. PMID 23563421. doi:10.1038/nbt.2522 
  4. Quail, Michael A. (2012). «A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers». BMC Genomics. 13: 341. PMC 3431227Acessível livremente. PMID 22827831. doi:10.1186/1471-2164-13-341 
  5. Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E.; Rosenfeld, Jeffrey A. (23 de junho de 2015). «The impact of read length on quantification of differentially expressed genes and splice junction detection». Genome Biology. 16. 131 páginas. PMC 4531809Acessível livremente. PMID 26100517. doi:10.1186/s13059-015-0697-y 
  6. Chaisson, Mark J.P. (2015). «Genetic variation and the de novo assembly of human genomes». Nature Reviews Genetics. 16: 627–640. PMC 4745987Acessível livremente. PMID 26442640. doi:10.1038/nrg3933 
  7. Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (26 de janeiro de 2016). «A survey of best practices for RNA-seq data analysis». Genome Biology. 17. 13 páginas. PMC 4728800Acessível livremente. PMID 26813401. doi:10.1186/s13059-016-0881-8 

Ver também