Origem: Wikipédia, a enciclopédia livre.
OCR é um acrónimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
Em 1950 David Shepard e Louis Tordella começaram a pesquisa do procedimento para automação de dados da Agência de Segurança dos Estados Unidos, com a ajuda de Harvey Cook eles construíram o "Gismo" o primeiro software de OCR. Shepard então fundou a Intelligent Machines Research Corporation (IMR) que fez os primeiros softwares OCR comerciais. Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.
[editar] Programas de OCR
| Nome |
Licença |
Sistema Op. |
Notas |
| GOCR |
GPL |
Muitos (open source) |
Converte imagens digitalizadas em arquivos texto. |
| HOCR |
GPL |
Linux |
OCR Hebraico |
| SimpleOCR 3.5 |
Freeware |
Windows |
Programa OCR para scan de textos de imagens. Vem também em formato ActiveX DLL para melhor interoperabilidade entre componentes COM e afins. |
| TopOCR 3.1 |
Freeware |
Windows |
Programa OCR para scan de textos de imagens. Possui reconhecimento de texto em português, boa qualidade das ferramentas de edição para configuração da leitura do texto. |
| OCR Terminal |
Freeware e versões comerciais |
Windows, Mac OS X, Linux |
Serviço de OCR baseado na Web. |
[editar] Ver também
[editar] Fornecedores de OCR