Screen scraping
Screen scraping ("captura de tela") é uma técnica na qual um programa de computador extrai dados da saída de vídeo de um outro programa. O programa que faz a "captura" é denominado screen scraper. O elemento-chave que distingue o screen scraping do parsing habitual é que a saída que está sendo capturada foi destinada a ser vista por um utilizador humano , em vez de servir de input para um outro programa, e por isto não é nem documentada nem estruturada para permitir o uso conveniente do parsing. O uso do screen scraping implica com freqüência ignorar dados em formato binário (geralmente imagens ou conteúdo multimédia) e formatar elementos que confundam os dados desejados em formato texto. Um software de reconhecimento óptico de caracteres é um tipo de scraper visual.
Existem uma série de sinônimos de screen scraping, incluindo: data scraping, data extraction, Web scraping, page scraping, web page wrapping e HTML scraping (sendo que os quatro últimos são específicos para webpages).
[editar] Referências
[editar] Livros
- HEMENWAY, Kevin e CALISHAIN, Tara. Spidering Hacks. Cambridge, Massachusetts: O'Reilly, 2003. ISBN 0-596-00577-6.