Indigenous Tweets

Origem: Wikipédia, a enciclopédia livre.

Indigenous Tweets é um site que registra mensagens do Twitter em línguas minoritárias para ajudar os falantes indígenas a entrar em contato entre si. Foi fundada em março de 2011 por Kevin Scannell , que faz pesquisas em linguística computacional no Departamento de Matemática e Ciência da Computação da Universidade Saint Louis.[1][2] O objetivo do site é permitir que falantes de línguas minoritárias se comuniquem na internet.[3]

Em sua página inicial, o site exibe uma lista de línguas minoritárias armazenados em cache. Depois de selecionar, o usuário é levado a uma tabela com todos que estão twittando naquela língua. O Indigenous Tweets fornece a foto do perfil de cada usuário do Twitter e estatísticas sobre o número de seguidores de cada pessoa. Além de fornecer estatísticas sobre a porcentagem de tweets que uma pessoa escreve em diferentes idiomas, possui uma seleção de trending topics nas diversas línguas minoritárias.[3]

História[editar | editar código-fonte]

No início do site, em março de 2011, ele catalogava 35 línguas.[3] Em 16 de abril de 2011, gravou tweets em 76 línguas minoritárias.[4] Em 26 de abril de 2011, o site suportava 82.[5] As línguas catalogados incluem galamiraay, crioulo haitiano e basco;[6] os dois últimos têm o primeiro e o segundo maior número de usuários, respectivamente.[7] O galês está em terceiro lugar em tweets indígenas.[7]

Kapampangan, que ficou em sétimo lugar na última semana de abril de 2011, foi a primeira língua filipina apoiada pelo site.[5]

Mineração de dados[editar | editar código-fonte]

O Indigenous Tweets emprega um banco de dados de palavras e frases das línguas minoritárias para localizar pessoas que falam essas línguas. Em uma entrevista de abril de 2011 à BBC News, Scannell disse que passou 8 anos construindo um banco de dados de cerca de 500 línguas revisando blogs, jornais e sites.[3]

O site coleta dados por meio da API do Twitter, pesquisando um banco de dados de palavras e frases das línguas minoritárias.[3] O mecanismo de busca do site não consegue decifrar o idioma de um tweet quando uma palavra está em mais de um idioma. Para evitar esse enigma, Scannell insere palavras exclusivas do idioma.[4]

Referências

  1. Scannel, Kevin (2012). «Kevin Scannell's website». Saint Louis University. Consultado em 11 de maio de 2012. Cópia arquivada em 18 de maio de 2012 
  2. הארץ (29 de março de 2011). «האם האינטרנט יציל את הקולות שהוא משתיק?». Haaretz (em Hebrew). Consultado em 22 de abril de 2011. Cópia arquivada em 25 de outubro de 2019 
  3. a b c d e Lee, Dave (8 de abril de 2011). «Micro-blogging in a mother tongue on Twitter». BBC News. Consultado em 22 de abril de 2011. Cópia arquivada em 22 de abril de 2011 
  4. a b Martín, Javier (16 de abril de 2011). «Rastreando lenguas minoritarias». El País. Consultado em 22 de abril de 2011. Cópia arquivada em 20 de outubro de 2012 
  5. a b Manuel, Mark Anthony (26 de abril de 2011). «Kapampangan is 7th online». Manila Bulletin. Consultado em 30 de abril de 2011. Cópia arquivada em 25 de agosto de 2012 
  6. Ungerleider, Neal (14 de abril de 2011). «Preserving Indigenous Languages Via Twitter». Fast Company. Consultado em 22 de abril de 2011. Cópia arquivada em 17 de abril de 2011 
  7. a b Olwen, Mears (15 de abril de 2011). «Basque second most tweeted minority language on Twitter». EITB. Consultado em 22 de abril de 2011. Cópia arquivada em 20 de abril de 2011 

Ligações externas[editar | editar código-fonte]