Deep web e surface web: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Mirelli Navarra (discussão | contribs)
Desfeita a edição 36256050 de 186.207.138.159
texto trocado por 'BUNDA'
Etiqueta: Remoção considerável de conteúdo
Linha 1: Linha 1:
BUNDA
[[Arquivo:Iceberg.jpg|thumb|Analogia do ''[[iceberg]]'', bastante utilizada para mostrar o tamanho da Deep Web (parte imersa) em relação ao da Surface Web (parte emersa)]]

'''Deep Web''' (também chamada de '''Deepnet''', '''Web Invisível''', '''Undernet''' ou '''Web oculta''') se refere ao conteúdo da [[World Wide Web]] que não faz parte da [[Surface Web]], a qual é indexada pelos [[Motor de busca|mecanismos de busca]] padrão.

Não deve ser confundida com a [[dark Internet]], na qual os computadores não podem mais ser alcançados via Internet, ou com a [[Darknet]], rede de compartilhamento de arquivos.

Mike Bergman, fundador da BrightPlanet<ref name=bergman2000>{{citar livro|nome= Michael K | sobrenome= Bergman | título = The Deep Web: Surfacing Hidden Value | editora = BrightPlanet LLC | ano = 2000 | mês = Julho | url = http://brightplanet.com/wp-content/uploads/2012/03/12550176481-deepwebwhitepaper1.pdf}}</ref> e autor da expressão<ref name="wright2009">{{citar web
| sobrenome = Wright
| nome = Alex
| título = Exploring a 'Deep Web' That Google Can’t Grasp
| publicado = The New York Times
| data = 22/02/2009
| url = http://www.nytimes.com/2009/02/23/technology/internet/23search.html?th&emc=th
| accessodata = 23/03/2009
| idioma = inglês}}</ref>, afirmou que a busca na Internet atualmente pode ser comparada com o arrastar de uma rede na superfície do oceano: pode-se pescar um peixe grande, mas há uma grande quantidade de informação que está no fundo, e, portanto, faltando. A maior parte da informação da Web está enterrada profundamente em sites gerados dinamicamente, a qual não é encontrada pelos mecanismos de busca padrão. Estes não conseguem "enxergar" ou obter o conteúdo na Deep Web - aquelas páginas não existem até serem criadas dinamicamente como resultado de uma busca específica. A Deep Web possui um tamanho muito superior ao da Surface Web.<ref name= bergman2001>{{citar periódico |primeiro= Michael K | ultimo= Bergman | titulo = The Deep Web: Surfacing Hidden Value | jornal = The Journal of Electronic Publishing | ano = 2001 | mes = August | volume = 7 | numero = 1 | url = http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104 | idioma=inglês | doi=10.3998/3336451.0007.104}}</ref>

== Tamanho ==
Estimativas baseadas em [[Extrapolação|extrapolações]] de um estudo feito na [[Universidade da Califórnia em Berkeley]] em 2001<ref name=bergman2001 /> especularam que a Deep Web possui 7.500 [[terabyte]]s de informação. Estimativas feitas por He et al.<ref name=he07>{{citar periódico |primeiro=Bin |ultimo=He |coautores= Patel, Mitesh; Zhang, Zhen; Chang, Kevin Chen-Chuan | titulo = Accessing the Deep Web: A Survey | jornal = Communications of the ACM (CACM) | paginas = 94–101 | ano = 2007 | mes = May | volume = 50 | numero = 2 | url = http://doi.acm.org/10.1145/1230819.1241670 |doi=10.1145/1230819.1241670 | idioma = inglês}}</ref>, em 2004, detectaram cerca de 300.000 sites da deep web e, de acordo com Shestakov, cerca de 14.000 destes eram da parte [[Rússia|russa]] da Web em 2006.<ref name=shestakov11>{{cite conference
| author = [http://www.mendeley.com/profiles/denis-shestakov/ Denis Shestakov]
| title = Sampling the National Deep Web
| booktitle = Proceedings of the 22nd International Conference on Database and Expert Systems Applications (DEXA)
| publisher = Springer
| pages = 331-340
| date = 2011
| url = http://www.mendeley.com/download/public/1423991/4300016182/a07080a3191f90cc97cf60fcd21566b1b915d894/dl.pdf
| format = PDF
| accessdate = 06/10/2011}}</ref>
Em 2008, a web chamada “Deep Web”, não ref­er­en­ci­ada pelos motores de busca rep­re­senta 70 a 75% do total, ou seja, cerca de um tril­hão de pági­nas não indexadas.

== Nomenclatura ==
Para referir-se aos [[website]]s que não estavam registrados em nenhum mecanismo de busca.<ref name=bergman2001/> Bergman citou um artigo de janeiro de 1996 por [[Frank Garcia]], no qual ele afirma que estes<ref>{{citar periódico
| ultimo = Garcia
| primeiro = Frank
| titulo = Business and Marketing on the Internet
| jornal = Masthead
| volume = 9
| numero = 1
| data = Janeiro de 1996
| url = http://tcp.ca/Jan96/BusandMark.html
| accessodata = 24/02/2009
| arquivourl = http://web.archive.org/web/19961205083117/http://tcp.ca/Jan96/BusandMark.html
| arquivodata = 05/12/1996}}</ref>
<blockquote>"Seriam sites projetados propositalmente, mas que não se teve o interesse de registrá-lo em nenhum mecanismo de busca. Então, ninguém pode encontrá-los! Estão escondidos. Eu os chamo de Web Invisível."</blockquote>

Outro uso antigo do termo ''Web Invisível'' foi feito por Bruce Mount e Matthew B. Koll do ''Personal Library Software'', descrevendo a ferramenta da deep Web "@1", na edição de dezembro de 1996.<ref name="PLS">@1 começou com 5,7 terabytes de conteúdo, aproximadamente 30 vezes maior do que a então nascente World Wide Web; O PLS foi adquirido pela AOL em 1998, e a @1 foi abandonada. {{cite press release
| title = PLS introduces AT1, the first 'second generation' Internet search service
| publisher = Personal Library Software
| date = dezembro de 1996
| url = http://web.archive.org/web/19971021232057/www.pls.com/news/pr961212_at1.html
| accessdate = 24/02/2009}}</ref>

O primeiro uso do termo específico ''deep Web'', agora reconhecido, ocorreu no estudo de 2001 de Berman, mencionado anteriormente.<ref name=bergman2001/>

== Classificação ==
[[Imagem:WL Hour Glass Bottom.jpg|thumb|O [[Wikileaks]] começou na ''deep web'', logo depois seu conteúdo foi disponibilizado na ''surface web''.]]
O conteúdo da deep web pode ser classificado em uma ou mais das seguintes categorias:

* '''Conteúdo dinâmico''': [[Página dinâmica|páginas dinâmicas]] que são retornadas em resposta a uma requisição ou através de um formulário.
* '''Conteúdo isolado''': páginas que não possuem referências ou ligações vindas de outras páginas, o que impede o acesso ao seu conteúdo através de [[web crawler]]s. Diz-se que essas páginas não possuem [[backlink]]s.
* '''Web privada''': sites que exigem um registro e um login (conteúdo protegido por senha).
* '''Web contextual''': páginas cujo conteúdo varia de acordo com o contexto de acesso (por exemplo, IP do cliente ou sequência de navegação anterior). Muitos sites estão escondidos e não há possibilidade de acesso, propositalmente.
* '''Conteúdo de acesso limitado''': sites que limitam o acesso às suas páginas de modo técnico (usando [[CAPTCHA]]s por exemplo).
* '''Conteúdo de scripts''': páginas que são acessíveis apenas por links gerados por [[JavaScript]], assim como o conteúdo baixado dinamicamente através de aplicações em [[Adobe Flash|Flash]] ou [[AJAX (programação)|Ajax]].
* '''Conteúdo não-HTML/texto''': conteúdo textual codificado em arquivos multimídia (imagem ou vídeo) ou [[Formato de arquivo|formatos de arquivo]] específicos que não são manipulados pelos motores de busca.
* Conteúdo que utiliza o protocolo [[Gopher]] ou hospedado em servidores [[FTP]], por exemplo, não é indexado pela maioria dos mecanismos de busca. O Google, por exemplo, não indexa páginas fora dos protocolos [[HTTP]] ou [[HTTPS]].<ref>{{Citar web|arquivourl=http://www.webcitation.org/60RCHAbNK|arquivodata=25 de julho de 2011 |url=http://talkgeektome.us/gopher.xhtml|acessodata=25 de julho de 2011|data=29 de novembro de 2009|título=Gopher&nbsp;— DeepGeek|publicado=[http://www.talkgeektome.us Talk Geek To Me]}}</ref>

== Ver também ==
*[[Freenet]]
*[[Gopher]]
*[[I2P]]
*[[Silk Road]]
*[[The Hidden Wiki]]
*[[The Onion Router]]
*[[Wikileaks]]
*[[Contracultura]]

{{em tradução|:en:Deep Web|tipo = artigo | língua = inglesa}}

{{Referências}}

{{DEFAULTSORT:Deep Web}}
[[Categoria:Internet]]

Revisão das 19h08min de 17 de julho de 2013

BUNDA