Saltar para o conteúdo

Biocuradoria

Origem: Wikipédia, a enciclopédia livre.


Um biocurador (ou uma biocuradora) é um cientista que cura, recolhe, anota, e valida informações, que são então disponibilizadas na forma de bases de dados.[1] O papel de um biocurador inlcui o controle de qualidade dos dados de pesquisa biológica destinados à publicação e, em outra etapa, a extração e organização de dados da literatura científica. Esse trabalho de curadoria é feito por meio de protocolos padronizados e vocabulários controlados que permitem ainteroperabilidade de banco de dados biológico. Os biocuradores se comunicam com pesquisadores para garantir que as informações selecionadas são precisas, e promovem a conexão de dados científicos de diferentes fontes.[2]

Os biocuradores (também chamados de curadores científicos, curadores de dados ou anotadores) foram reconhecidos como os "catalogadores de museus da era da Internet".[3][4]

Curadoria e anotação

[editar | editar código-fonte]

Na anotação de genomas, por exemplo, os biocuradores geralmente trabalham com ontologias biomédicas : vocabulários estruturados e controlados que abrangem muitos domínios do conhecimento biológico e médico, como as Ontologias Biomédicas Abertas.

Os biocuradores, em linhas gerais, promovem as diretrizes de nomenclaturas de genes e participam dos comitês de nomenclatura gênicas de de organismos modelo, frequentemente em colaboração com o Comitê de Nomenclatura Gênica HUGO (HGNC). Eles também apoiam outras diretrizes de nomenclatura padronizadas, como as fornecidas pelo Comitê de Nomenclatura da União Internacional de Bioquímica e Biologia Molecular (IUBMB), como o número EC, utilizado para padronizar tipos diferentes de enzimas.

Sociedade Internacional de Biocuração (ISB)

[editar | editar código-fonte]

A Sociedade Internacional de Biocuração (ISB) foi fundada em 2008; a organização sem fins lucrativos "promove o campo da biocuração e oferece um fórum para troca de informações por meio de reuniões e workshops". A sociedade possui encontros anuais para a comunidade de biocuradores.

Sobreposição com Wikipédia

[editar | editar código-fonte]

Há alguma sobreposição entre o trabalho dos biocuradores e a Wikipédia, com as fronteiras entre bancos de dados científicos e os dados na Wikipédia cada vez menos distinguíveis.[5][6][7] Bancos de dados como o Rfam[8][9] e o Protein Data Bank[10] por exemplo, fazem usam a Wikipédia e seus editores para seleção de informações informações.[11][12] No entanto, a maioria dos bancos de dados oferece dados estruturados que podem ser pesquisados por programação. Isso não é possível de forma simples na Wikipédia. O desenvolvimento do projeto Wikidata, que visa estruturar o conhecimento da Wikipédia, tende a tornar os projetos de biocuradoria e os projetos Wikimedia cada vez mais interligados.

Curadoria auxiliada por mineração de texto

[editar | editar código-fonte]

Há um interesse recente na exploração de tecnologias de processamento de linguagem natural e mineração de texto para permitir uma extração sistemática de informações para subsequente curadoria manual. O uso de técnicas de mineração de texto para vários estágios da curadoria, desde a detecção inicial de artigos relevantes (triagem) até a extração de anotações e relacionamentos de entidades, é parte de diversos sistemas especializados.[13]

Curadoria da comunidade vs. especialistas

[editar | editar código-fonte]

A Curadoria da Comunidade aproveita a inteligência da comunidade na curadoria do conhecimento, e é uma promessa para lidar com o grande fluxo de conhecimento biológico. A curadoria por comunidades é exemplificada em projetos do tipo wiki, como bio-wikis.

Para aumentar a curadoria da comunidade em bio-wikis, o AuthorReward,[14] uma extensão do MediaWiki foi desenvolvidoa para recompensar os esforços de comunidade na curadoria de conhecimento. O AuthorReward fornece às bio-wikis uma métrica de autoria; quantifica as contribuições dos pesquisadores, considerando adequadamente a quantidade e a qualidade da edição e produz autoria explícita e automática de acordo com suas contribuições quantitativas.

O RiceWiki, um banco de dados baseado em wiki para curadoria comunitária de genes do arroz, é uma demonstração viva equipada com o AuthorReward, disponível em http://ricewiki.big.ac.cn/index.php/Os01g0883800.

Referências

  1. «Curators of the world unite: The International Society of Biocuration». Bioinformatics. 26. 991 páginas. 2010. PMID 20305270. doi:10.1093/bioinformatics/btq101 
  2. «The Biocurator: Connecting and Enhancing Scientific Data». PLoS Computational Biology. 2: e125. 2006. PMC 1626147Acessível livremente. PMID 17069454. doi:10.1371/journal.pcbi.0020125 
  3. «Biocurators: Contributors to the World of Science». PLoS Computational Biology. 2: e142. 2006. PMC 1626157Acessível livremente. PMID 17411327. doi:10.1371/journal.pcbi.0020142 
  4. «Biocurators and Biocuration: Surveying the 21st century challenges». Database. 2012: bar059. 2012. PMC 3308150Acessível livremente. PMID 22434828. doi:10.1093/database/bar059 
  5. «Topic Pages: PLoS Computational Biology Meets Wikipedia». PLoS Computational Biology. 8: e1002446. 2012. PMC 3315447Acessível livremente. PMID 22479174. doi:10.1371/journal.pcbi.1002446 
  6. «Making your database available through Wikipedia: The pros and cons». Nucleic Acids Research. 40: D9–12. 2011. PMC 3245093Acessível livremente. PMID 22144683. doi:10.1093/nar/gkr1195 
  7. «Linking NCBI to Wikipedia: A wiki-based approach». PLoS Currents. 3: RRN1228. 2011. PMC 3080707Acessível livremente. PMID 21516242. doi:10.1371/currents.RRN1228 
  8. «Rfam: Wikipedia, clans and the "decimal" release». Nucleic Acids Research. 39: D141–D145. 2010. PMC 3013711Acessível livremente. PMID 21062808. doi:10.1093/nar/gkq1129 
  9. «The RNA WikiProject: Community annotation of RNA families». RNA. 14: 2462–2464. 2008. PMC 2590952Acessível livremente. PMID 18945806. doi:10.1261/rna.1200508 
  10. «A Biocurator Perspective: Annotation at the Research Collaboratory for Structural Bioinformatics Protein Data Bank». PLoS Computational Biology. 2: e99. 2006. PMC 1626146Acessível livremente. PMID 17069453. doi:10.1371/journal.pcbi.0020099 
  11. «Ten Simple Rules for Editing Wikipedia». PLOS Computational Biology. 6: e1000941. 2010. PMC 2947980Acessível livremente. PMID 20941386. doi:10.1371/journal.pcbi.1000941  publicação de acesso livre - leitura gratuita
  12. «Publish in Wikipedia or perish: Journal to require authors to post in the free online encyclopaedia». Nature. 2008. doi:10.1038/news.2008.1312 
  13. «Text mining for the biocuration workflow». Database. 2012: bas020. 2012. PMC 3328793Acessível livremente. PMID 22513129. doi:10.1093/database/bas020 
  14. «AuthorReward: Increasing community curation in biological knowledge wikis through automated authorship quantification». Bioinformatics. 29: 1837–1839. 2013. PMC 3702255Acessível livremente. PMID 23732274. doi:10.1093/bioinformatics/btt284