Surface Web

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

A Surface Web ou Internet superficial é a parte da World Wide Web indexada pelos motores de busca. A parte que não é indexada chama-se Deep Web. Motores de busca constroem um banco de dados através de programas chamados Web Crawlers ou spiders (aranhas) que começam com uma lista de páginas de internet conhecidas. Esse programa pega uma cópia de cada pagina e indexa-a, guardando informações importantes que permitirão que a página seja facilmente recuperada mais tarde. Qualquer hiperlink para novas páginas são adicionadas para a lista de páginas para serem indexadas. Eventualmente todas as páginas acessíveis são indexadas a menos que exceda os limites do motor de busca.[1] O conjunto de páginas acessíveis definem a Surface Web. Por diversas razões(como o Protocolo de Exclusão de Robôs, links gerados por JavaScript e Flash, proteção de senhas) algumas páginas não podem ser acessadas pelos Web Crawlers. Essas páginas compõem a Deep Web. Em Janeiro de 2014 as páginas indexadas eram pelo menos 15 bilhões de páginas.[2]

Referências


Ícone de esboço Este artigo sobre Internet é um esboço relacionado ao Projeto Internet. Você pode ajudar a Wikipédia expandindo-o.