Documentação linguística

Origem: Wikipédia, a enciclopédia livre.

A documentação linguística ou linguística documental é um subcampo da linguística que visa descrever a gramática e o uso das línguas humanas. Tem como objetivo fornecer um registro abrangente das práticas linguísticas características de uma determinada comunidade de fala.[1][2][3] A documentação linguística busca criar um registro o mais completo possível da comunidade de fala, tanto para a posteridade quanto para a revitalização da língua. Esse registro pode ser público ou privado dependendo das necessidades da comunidade e da finalidade da documentação. Na prática, a documentação linguística pode variar desde trabalho de campo antropológico linguístico individual até a criação de vastos arquivos online que contêm dezenas de línguas diferentes, como FirstVoices ou OLAC.[4]

A documentação linguística fornece uma base mais sólida para a análise linguística, na medida em que cria um corpus de materiais na língua. Os materiais em questão podem variar desde listas de vocabulário e regras gramaticais até livros infantis e obras traduzidas. Esses materiais podem então apoiar afirmações sobre a estrutura da linguagem e seu uso. Isso deve ser visto como uma tarefa taxonômica básica para a linguística, identificando a gama de línguas e suas características.[5]

Métodos[editar | editar código-fonte]

As etapas típicas envolvem gravação, manutenção de metadados, transcrição (muitas vezes usando o Alfabeto Fonético Internacional e/ou uma ortografia prática feita para determinada língua), anotação e análise, tradução para uma língua de comunicação mais ampla, arquivamento e disseminação.[6] Os materiais podem ser arquivados, mas nem todos os arquivos são igualmente aptos a lidar com materiais linguísticos preservados em diversos formatos tecnológicos, e nem todos são igualmente acessíveis a potenciais usuários.[7]

A documentação complementa a descrição da língua, que visa descrever o sistema abstrato de estruturas e regras na forma de uma gramática ou dicionário. Ao praticar uma boa documentação na forma de gravações com transcrições e depois coleções de textos e um dicionário, um linguista trabalha melhor e pode fornecer materiais para uso dos falantes da língua. As novas tecnologias permitem melhores gravações com melhores descrições que podem ser armazenadas em arquivos digitais como AILLA, Pangloss ou Paradisec. O primeiro exemplo de gramática com corpus de mídia é a gramática da língua nafsan, de Nicholas Thieberger (2006).[8]

A documentação linguística também deu origem a novas publicações especializadas, como a revista online gratuita e revisada por pares Language Documentation & Conservation e os documentos de trabalho SOAS Language Documentation & Description.

Arquivos digitais[editar | editar código-fonte]

A digitalização de arquivos é um componente crítico da documentação linguística e dos projetos de revitalização.[9] Existem registos descritivos de línguas locais que poderiam ser utilizados em projetos de revitalização linguística que são negligenciados devido à formatação obsoleta, registos impressos incompletos ou inacessibilidade sistemática. Os arquivos locais, em particular, que podem conter registos vitais das línguas indígenas da área, são cronicamente subfinanciados e com falta de pessoal.[10] Os registos históricos relativos à língua que foram recolhidos por não-linguistas, como missionários, podem ser ignorados se a coleção não for digitalizada.[11] Os arquivos físicos são naturalmente mais vulneráveis ​​a danos e perda de informação.[9]

Referências

  1. Himmelmann, Nikolaus P. (1998). «Documentary and descriptive linguistics» (PDF). Linguistics. 36 (1): 161–195. doi:10.1515/ling.1998.36.1.161. Consultado em 18 de janeiro de 2018 
  2. Gippert, Jost; Himmelmann, Nikolaus P.; Mosel, Ulrike, eds. (2006). Essentials of language documentation. Berlin: Mouton de Gruyter. pp. x,424. ISBN 978-3-11-018864-6 
  3. Woodbury, Anthony C. (2003). «Defining documentary linguistics». In: Austin, Peter K. Language documentation and description. 1. London: SOAS. pp. 35–51. Consultado em 18 de janeiro de 2018 
  4. Bird, Steven; Simons, Gary (2003). «Seven Dimensions of Portability for Language Documentation and Description». Language. 79 (3): 557–582. ISSN 0097-8507. JSTOR 4489465. arXiv:cs/0204020Acessível livremente. doi:10.1353/lan.2003.0149 
  5. Cushman, Ellen (2013). «Wampum, Sequoyan, and Story: Decolonizing the Digital Archive». College English. 76 (2): 115–135. ISSN 0010-0994. JSTOR 24238145 
  6. Boerger, Brenda H.; Moeller, Sarah Ruth; Reiman, Will; Self, Stephen (2018). Language and culture documentation manual. [S.l.]: Leanpub. Consultado em 18 de janeiro de 2018 
  7. Chang, Debbie. 2011. TAPS: Checklist for Responsible Archiving of Digital Language Resources Arquivado em 2013-06-17 no Wayback Machine. MA thesis: Graduate Institute of Applied Linguistics.
  8. Thieberger, Nick (2006). A Grammar of South Efate: An Oceanic Language of Vanuatu. Col: Oceanic Linguistics Special Publication (em inglês). Honolulu: University of Hawai'i Press. ISBN 9780824830618 
  9. a b Conway, Paul (2010). «Preservation in the Age of Google: Digitization, Digital Preservation, and Dilemmas». The Library Quarterly (em inglês). 80 (1): 61–79. JSTOR 10.1086/648463. doi:10.1086/648463. hdl:2027.42/85223Acessível livremente 
  10. Miller, Larisa K. (2013). «All Text Considered: A Perspective on Mass Digitizing and Archival Processing». The American Archivist. 76 (2): 521–541. ISSN 0360-9081. JSTOR 43490366. doi:10.17723/aarc.76.2.6q005254035w2076 
  11. Bickel, Rachel; Dupont, Sarah (29 de novembro de 2018). «Indigitization». KULA: Knowledge Creation, Dissemination, and Preservation Studies (em inglês). 2 (1). 11 páginas. ISSN 2398-4112. doi:10.5334/kula.56Acessível livremente