Tesseract (software)

Origem: Wikipédia, a enciclopédia livre.
Saltar para a navegação Saltar para a pesquisa
Tesseract (software)
Tesseract OCR logo (Google).png
Tesseract v3.02.png
Desenvolvedor Google
Plataforma Linux, Windows e macOS
Versão estável 4.1.1
Idioma(s) Interface: Inglês

Reconhecimento: africâner , albanês , árabe , azerbaijano , basco , bielorrusso , bengali , búlgaro , catalão , tcheco , cherokee , croata , dinamarquês , holandês , inglês , esperanto , estoniano , finlandês , francês , galego , alemão , grego ,Hindi , Húngaro , Indonésio , Italiano , Japonês , Kannada , Coreano , Letão , Lituano , Malaiala , Macedônio , Maltês , Malaio , Norueguês , Polonês , Português , Romeno , Russo , Sérvio , Eslovaco , Esloveno, Espanhol , Suaíli, Sueco,Tagalo, tâmil, télugo, tailandês , turco, ucraniano e vietnamita

Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0)[1], originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub.

Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.

Referências

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre software livre é um esboço. Você pode ajudar a Wikipédia expandindo-o.