Reconhecimento ótico de caracteres
OCR é um acrónimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
Índice |
[editar] História
Em 1950 David Shepard e Louis Tordella começaram a pesquisa do procedimento para automação de dados da então Agência de Segurança das Forças Armadas (AFSA) dos Estados Unidos, que dois anos depois se tornaria a Agência de Segurança Nacional (NSA). Com a ajuda de Harvey Cook eles construíram o "Gismo", o primeiro software de OCR. Shepard então fundou a Intelligent Machines Research Corporation (IMR) que fez os primeiros softwares OCR comerciais.
Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.
[editar] Programas gratuitos de OCR
| Nome | Licença | Sistema Op. | Notas |
|---|---|---|---|
| GOCR | GPL | Muitos (open source) | Converte imagens digitalizadas em arquivos texto. |
| HOCR | GPL | Linux | OCR Hebraico |
| SimpleOCR 3.5 | Freeware | Windows | Programa OCR para scan de textos de imagens. Vem também em formato ActiveX DLL para melhor interoperabilidade entre componentes COM e afins. |
| TopOCR 3.1 | Freeware | Windows | Programa OCR para scan de textos de imagens. Possui reconhecimento de texto em português, boa qualidade das ferramentas de edição para configuração da leitura do texto. |
| OCR Terminal | Freeware e versões comerciais | Windows, Mac OS X, Linux | Serviço de OCR baseado na Web. |
Também é possível submeter um arquivo de imagem no site Free OCR, que converte o texto na imagem em arquivo de texto. Não é necessário nenhum tipo de registro ou uso de e-mail.
[editar] Ver também
[editar] Fornecedores de OCR
- Adobe Acrobat Professional (Windows, Mac OS)
- BIT-Alpha (Windows)
- ABBYY FineReader] (Unix, Windows, Mac OS)
- ExactScan Pro (Mac OS)
- OCRKit (Mac OS)
- Readiris (Unix, Windows, Mac OS)
- Scansoft Omnipage (Windows)