Biocuradoria

Um biocurador (ou uma biocuradora) é um cientista que cura, recolhe, anota, e valida informações, que são então disponibilizadas na forma de bases de dados.^[1] O papel de um biocurador inlcui o controle de qualidade dos dados de pesquisa biológica destinados à publicação e, em outra etapa, a extração e organização de dados da literatura científica. Esse trabalho de curadoria é feito por meio de protocolos padronizados e vocabulários controlados que permitem ainteroperabilidade de banco de dados biológico. Os biocuradores se comunicam com pesquisadores para garantir que as informações selecionadas são precisas, e promovem a conexão de dados científicos de diferentes fontes.^[2]

Os biocuradores (também chamados de curadores científicos, curadores de dados ou anotadores) foram reconhecidos como os "catalogadores de museus da era da Internet".^[3]^[4]

Curadoria e anotação

Na anotação de genomas, por exemplo, os biocuradores geralmente trabalham com ontologias biomédicas : vocabulários estruturados e controlados que abrangem muitos domínios do conhecimento biológico e médico, como as Ontologias Biomédicas Abertas.

Os biocuradores, em linhas gerais, promovem as diretrizes de nomenclaturas de genes e participam dos comitês de nomenclatura gênicas de de organismos modelo, frequentemente em colaboração com o Comitê de Nomenclatura Gênica HUGO (HGNC). Eles também apoiam outras diretrizes de nomenclatura padronizadas, como as fornecidas pelo Comitê de Nomenclatura da União Internacional de Bioquímica e Biologia Molecular (IUBMB), como o número EC, utilizado para padronizar tipos diferentes de enzimas.

Sociedade Internacional de Biocuração (ISB)

A Sociedade Internacional de Biocuração (ISB) foi fundada em 2008; a organização sem fins lucrativos "promove o campo da biocuração e oferece um fórum para troca de informações por meio de reuniões e workshops". A sociedade possui encontros anuais para a comunidade de biocuradores.

Sobreposição com Wikipédia

Há alguma sobreposição entre o trabalho dos biocuradores e a Wikipédia, com as fronteiras entre bancos de dados científicos e os dados na Wikipédia cada vez menos distinguíveis.^[5]^[6]^[7] Bancos de dados como o Rfam^[8]^[9] e o Protein Data Bank^[10] por exemplo, fazem usam a Wikipédia e seus editores para seleção de informações informações.^[11]^[12] No entanto, a maioria dos bancos de dados oferece dados estruturados que podem ser pesquisados por programação. Isso não é possível de forma simples na Wikipédia. O desenvolvimento do projeto Wikidata, que visa estruturar o conhecimento da Wikipédia, tende a tornar os projetos de biocuradoria e os projetos Wikimedia cada vez mais interligados.

Curadoria auxiliada por mineração de texto

Há um interesse recente na exploração de tecnologias de processamento de linguagem natural e mineração de texto para permitir uma extração sistemática de informações para subsequente curadoria manual. O uso de técnicas de mineração de texto para vários estágios da curadoria, desde a detecção inicial de artigos relevantes (triagem) até a extração de anotações e relacionamentos de entidades, é parte de diversos sistemas especializados.^[13]

Curadoria da comunidade vs. especialistas

A Curadoria da Comunidade aproveita a inteligência da comunidade na curadoria do conhecimento, e é uma promessa para lidar com o grande fluxo de conhecimento biológico. A curadoria por comunidades é exemplificada em projetos do tipo wiki, como bio-wikis.

Para aumentar a curadoria da comunidade em bio-wikis, o AuthorReward,^[14] uma extensão do MediaWiki foi desenvolvidoa para recompensar os esforços de comunidade na curadoria de conhecimento. O AuthorReward fornece às bio-wikis uma métrica de autoria; quantifica as contribuições dos pesquisadores, considerando adequadamente a quantidade e a qualidade da edição e produz autoria explícita e automática de acordo com suas contribuições quantitativas.

O RiceWiki, um banco de dados baseado em wiki para curadoria comunitária de genes do arroz, é uma demonstração viva equipada com o AuthorReward, disponível em http://ricewiki.big.ac.cn/index.php/Os01g0883800.

Referências

↑ «Curators of the world unite: The International Society of Biocuration». Bioinformatics. 26. 991 páginas. 2010. PMID 20305270. doi:10.1093/bioinformatics/btq101
↑ «The Biocurator: Connecting and Enhancing Scientific Data». PLoS Computational Biology. 2: e125. 2006. PMC 1626147. PMID 17069454. doi:10.1371/journal.pcbi.0020125
↑ «Biocurators: Contributors to the World of Science». PLoS Computational Biology. 2: e142. 2006. PMC 1626157. PMID 17411327. doi:10.1371/journal.pcbi.0020142
↑ «Biocurators and Biocuration: Surveying the 21st century challenges». Database. 2012: bar059. 2012. PMC 3308150. PMID 22434828. doi:10.1093/database/bar059
↑ «Topic Pages: PLoS Computational Biology Meets Wikipedia». PLoS Computational Biology. 8: e1002446. 2012. PMC 3315447. PMID 22479174. doi:10.1371/journal.pcbi.1002446
↑ «Making your database available through Wikipedia: The pros and cons». Nucleic Acids Research. 40: D9–12. 2011. PMC 3245093. PMID 22144683. doi:10.1093/nar/gkr1195
↑ «Linking NCBI to Wikipedia: A wiki-based approach». PLoS Currents. 3: RRN1228. 2011. PMC 3080707. PMID 21516242. doi:10.1371/currents.RRN1228
↑ «Rfam: Wikipedia, clans and the "decimal" release». Nucleic Acids Research. 39: D141–D145. 2010. PMC 3013711. PMID 21062808. doi:10.1093/nar/gkq1129
↑ «The RNA WikiProject: Community annotation of RNA families». RNA. 14: 2462–2464. 2008. PMC 2590952. PMID 18945806. doi:10.1261/rna.1200508
↑ «A Biocurator Perspective: Annotation at the Research Collaboratory for Structural Bioinformatics Protein Data Bank». PLoS Computational Biology. 2: e99. 2006. PMC 1626146. PMID 17069453. doi:10.1371/journal.pcbi.0020099
↑ «Ten Simple Rules for Editing Wikipedia». PLOS Computational Biology. 6: e1000941. 2010. PMC 2947980. PMID 20941386. doi:10.1371/journal.pcbi.1000941
↑ «Publish in Wikipedia or perish: Journal to require authors to post in the free online encyclopaedia». Nature. 2008. doi:10.1038/news.2008.1312
↑ «Text mining for the biocuration workflow». Database. 2012: bas020. 2012. PMC 3328793. PMID 22513129. doi:10.1093/database/bas020
↑ «AuthorReward: Increasing community curation in biological knowledge wikis through automated authorship quantification». Bioinformatics. 29: 1837–1839. 2013. PMC 3702255. PMID 23732274. doi:10.1093/bioinformatics/btt284

Ver também

[ref1-1] «Curators of the world unite: The International Society of Biocuration». Bioinformatics. 26. 991 páginas. 2010. PMID 20305270. doi:10.1093/bioinformatics/btq101

[2] «The Biocurator: Connecting and Enhancing Scientific Data». PLoS Computational Biology. 2: e125. 2006. PMC 1626147. PMID 17069454. doi:10.1371/journal.pcbi.0020125

[3] «Biocurators: Contributors to the World of Science». PLoS Computational Biology. 2: e142. 2006. PMC 1626157. PMID 17411327. doi:10.1371/journal.pcbi.0020142

[4] «Biocurators and Biocuration: Surveying the 21st century challenges». Database. 2012: bar059. 2012. PMC 3308150. PMID 22434828. doi:10.1093/database/bar059

[5] «Topic Pages: PLoS Computational Biology Meets Wikipedia». PLoS Computational Biology. 8: e1002446. 2012. PMC 3315447. PMID 22479174. doi:10.1371/journal.pcbi.1002446

[6] «Making your database available through Wikipedia: The pros and cons». Nucleic Acids Research. 40: D9–12. 2011. PMC 3245093. PMID 22144683. doi:10.1093/nar/gkr1195

[7] «Linking NCBI to Wikipedia: A wiki-based approach». PLoS Currents. 3: RRN1228. 2011. PMC 3080707. PMID 21516242. doi:10.1371/currents.RRN1228

[8] «Rfam: Wikipedia, clans and the "decimal" release». Nucleic Acids Research. 39: D141–D145. 2010. PMC 3013711. PMID 21062808. doi:10.1093/nar/gkq1129

[9] «The RNA WikiProject: Community annotation of RNA families». RNA. 14: 2462–2464. 2008. PMC 2590952. PMID 18945806. doi:10.1261/rna.1200508

[10] «A Biocurator Perspective: Annotation at the Research Collaboratory for Structural Bioinformatics Protein Data Bank». PLoS Computational Biology. 2: e99. 2006. PMC 1626146. PMID 17069453. doi:10.1371/journal.pcbi.0020099

[11] «Ten Simple Rules for Editing Wikipedia». PLOS Computational Biology. 6: e1000941. 2010. PMC 2947980. PMID 20941386. doi:10.1371/journal.pcbi.1000941

[12] «Publish in Wikipedia or perish: Journal to require authors to post in the free online encyclopaedia». Nature. 2008. doi:10.1038/news.2008.1312

[13] «Text mining for the biocuration workflow». Database. 2012: bas020. 2012. PMC 3328793. PMID 22513129. doi:10.1093/database/bas020

[14] «AuthorReward: Increasing community curation in biological knowledge wikis through automated authorship quantification». Bioinformatics. 29: 1837–1839. 2013. PMC 3702255. PMID 23732274. doi:10.1093/bioinformatics/btt284

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]