Tesseract (software)
Tesseract (software) | |
---|---|
![]() | |
![]() | |
Desenvolvedor | |
Plataforma | Linux, Windows e macOS |
Versão estável | 4.1.1 |
Idioma(s) | Interface: Inglês
Reconhecimento: africâner , albanês , árabe , azerbaijano , basco , bielorrusso , bengali , búlgaro , catalão , tcheco , cherokee , croata , dinamarquês , holandês , inglês , esperanto , estoniano , finlandês , francês , galego , alemão , grego ,Hindi , Húngaro , Indonésio , Italiano , Japonês , Kannada , Coreano , Letão , Lituano , Malaiala , Macedônio , Maltês , Malaio , Norueguês , Polonês , Português , Romeno , Russo , Sérvio , Eslovaco , Esloveno, Espanhol , Suaíli, Sueco,Tagalo, tâmil, télugo, tailandês , turco, ucraniano e vietnamita |
Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0)[1], originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub.
Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.
Referências
- ↑ https://github.com/tesseract-ocr/tesseract/blob/master/README.md Visitado em 04 de fevereiro de 2016.