Reconhecimento ótico de caracteres: diferenças entre revisões
m adicionou Categoria:Tecnologia da informação usando HotCat |
|||
Linha 56: | Linha 56: | ||
* Nuance Omnipage (Windows) |
* Nuance Omnipage (Windows) |
||
* Nicomsoft OCR (Windows, Unix) |
* Nicomsoft OCR (Windows, Unix) |
||
* [https://onlineocr.org/br OnlineOCR] - Reconhecimento óptico de caracteres para todos os dispositivos. |
|||
== Ver também == |
== Ver também == |
Revisão das 16h51min de 6 de março de 2021
OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador.
Combinado com outras tecnologias, como a inteligência artificial, empresas de diversos segmentos têm aplicado o OCR[1] para automatizar processos de cadastro, onboarding e formalização, extraindo informações de documentos de identificação pessoal, contratos e comprovantes de residência.
História
Em 1950 David Shepard e Louis Tordella começaram a pesquisa do procedimento para automação de dados da então Agência de Segurança das Forças Armadas (AFSA) dos Estados Unidos, que dois anos depois se tornaria a Agência de Segurança Nacional (NSA). Com a ajuda de Harvey Cook eles construíram o "Gismo", o primeiro software de OCR. Shepard então fundou a Intelligent Machines Research Corporation (IMR) que fez os primeiros softwares OCR comerciais.
Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.
Programas gratuitos de OCR
Nome | Licença | Sistema Op. | Notas | Última versão |
---|---|---|---|---|
Google Drive | Freeware | Acesso Web | Software de acesso Web que traz todas as funcionalidades do OCR e converte em vários formatos após conversão. | |
GOCR | GPL | Linux, Windows, OS/2 | Também conhecido por JOCR. É utilizado por linha de comando, ou seja, sem interface gráfica.[2] |
0.50, 05 de março de 2013, ainda não atualizado no SourceForge[3] |
HOCR | GPL | Linux | OCR Hebraico | |
SimpleOCR | Freeware | Windows | Programa OCR para scan de textos de imagens. Vem também em formato ActiveX DLL para melhor interoperabilidade entre componentes COM e afins. | 3.5, 2008 |
TopOCR | Freeware | Windows | Programa OCR para scan de textos de imagens. Possui reconhecimento de texto em português, boa qualidade das ferramentas de edição para configuração da leitura do texto. | 3.1 |
OCR Terminal | Freeware e versões comerciais | Windows, Mac OS X, Linux | Serviço de OCR baseado na Web. | |
FreeOCR | Licença Apache 2.0 | Windows | Utiliza o motor do Tesseract, suporta PDF e os formatos mais comuns de imagem, a partir da versão 4.2 suporta reconhecimento em português. | 4.2, Agosto de 2012 |
Tesseract | Licença Apache 2.0 | Windows, Mac OS X, Linux | Motor que permite o reconhecimento de textos em imagens, suportando diferentes linguas. | 3.05.01 |
Também é possível submeter arquivos em conversores on-line como o disponível no sítio do Google Drive e no sítio do Free OCR (não confundir com o FreeOCR listado acima).
Fornecedores de OCR
- Adobe Acrobat (Windows, Mac OS)
- BIT-Alpha (Windows)
- ABBYY FineReader (Unix, Windows, Mac OS)
- ExactScan Pro (Mac OS)
- OCRKit (Mac OS)
- Readiris (Unix, Windows, Mac OS)
- Nuance Omnipage (Windows)
- Nicomsoft OCR (Windows, Unix)
- OnlineOCR - Reconhecimento óptico de caracteres para todos os dispositivos.
Ver também
Referências
- ↑ «O que é OCR e quais os benefícios para a sua empresa». Blog da Simply. 21 de maio de 2018. Consultado em 19 de junho de 2019
- ↑ http://www.digipedia.org/man/doc/view/gocr.1/
- ↑ «GOCR». Consultado em 10 de junho de 2013