Corretor ortográfico

Origem: Wikipédia, a enciclopédia livre.

No software, um corretor ortográfico é um recurso de software que verifica erros ortográficos em um texto. Os recursos de verificação ortográfica geralmente são incorporados em software ou serviços, como processador de texto, cliente de e-mail, dicionário eletrônico ou mecanismo de pesquisa.


Eye have a spelling chequer,
It came with my Pea Sea.
It plane lee marks four my revue
Miss Steaks I can knot sea.

Eye strike the quays and type a whirred
And weight four it two say
Weather eye am write oar wrong
It tells me straight a weigh.

Eye ran this poem threw it,
Your shore real glad two no.
Its vary polished in its weigh.
My chequer tolled me sew.

A chequer is a bless thing,
It freeze yew lodes of thyme.
It helps me right all stiles of righting,
And aides me when eye rime.

Each frays come posed up on my screen
Eye trussed too bee a joule.
The chequer pours o'er every word
Two cheque sum spelling rule.

A versão original deste poema foi escrita por Jerrold H. Zar em 1992. Um corretor ortográfico não sofisticado encontrará pouca ou nenhuma falha neste poema porque verifica palavras isoladamente. Um corretor ortográfico mais sofisticado fará uso de um modelo linguístico para considerar o contexto em que uma palavra ocorre.
Verificador ortográfico do Google Chrome em ação para o poema acima, a palavra "chequer" marcada como palavra não reconhecida

Design[editar | editar código-fonte]

Um corretor ortográfico básico realiza os seguintes processos:

Não está claro se a análise morfológica – permitindo muitas formas de uma palavra dependendo de seu papel gramatical – fornece um benefício significativo para o inglês, embora seus benefícios para idiomas altamente sintéticos como alemão, húngaro ou turco sejam claros.

Como complemento a esses componentes, a interface de usuário do programa permite que os usuários aprovem ou rejeitem substituições e modifiquem a operação do programa.

Os corretores ortográficos podem usar algoritmos de correspondência aproximada de cadeia de caracteres, como a distância de Levenshtein, para encontrar grafias corretas de palavras com erros ortográficos.[1] Um tipo alternativo de corretor ortográfico usa apenas informações estatísticas, como n-gramas, para reconhecer erros em vez de palavras escritas corretamente. Essa abordagem geralmente requer muito esforço para obter informações estatísticas suficientes. As principais vantagens incluem a necessidade de menos armazenamento em tempo de execução e a capacidade de corrigir erros em palavras que não estão incluídas em um dicionário.[2]

Em alguns casos, os corretores ortográficos usam uma lista fixa de erros ortográficos e sugestões para esses erros ortográficos; essa abordagem menos flexível é frequentemente usada em métodos de correção baseados em papel, como ver também verbetes de enciclopédias.

Algoritmos de clustering também têm sido usados ​​para verificação ortográfica[3] combinada com informações fonéticas.[4]

Referências

  1. Perner, Petra (5 de julho de 2010). Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings (em inglês). [S.l.]: Springer Science & Business Media. ISBN 978-3-642-14399-1 
  2. U.S. Patent 6618697, Method for rule-based correction of spelling and grammar errors
  3. de Amorim, R.C.; Zampieri, M. (2013) Effective Spell Checking Methods Using Clustering Algorithms. Arquivado em 2017-08-17 no Wayback Machine Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.
  4. Zampieri, M.; de Amorim, R.C. (2014) Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery. Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.

Ligações externas[editar | editar código-fonte]

O Commons possui uma categoria com imagens e outros ficheiros sobre Corretor ortográfico