Tesseract (software)

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Tesseract é um software de reconhecimento ótico de caracteres de código aberto (Licença Apache 2.0)[1] , originalmente desenvolvido pela Hewlett-Packard e foi por um tempo mantido pelo Google; atualmente o projeto está hospedado no GitHub.

Se aplica a imagens em formato tiff com texto puro em uma única coluna, convertendo a saída em um arquivo txt. Não possui mecanismos para reconhecimento de layout, desta forma não é recomendável para textos que possuam imagens, fórmulas ou mais de uma coluna.

Referências

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre software livre é um esboço. Você pode ajudar a Wikipédia expandindo-o.