Wikipédia:Esplanada/propostas/Tamanho dos artigos (10out2010)

Origem: Wikipédia, a enciclopédia livre.

Tamanho dos artigos (10out2010)

Olá, as vezes certo temas são difíceis, quando não impossíveis, de adaptar dentro das regras de EAD de que o tamanho máximo dos artigos sejam de 190KB, quase teve um "problema" em Wikipedia:Escolha do artigo em destaque/Porto Alegre, pois o artigo passou dos 190KB e alguns votos contra em Wikipedia:Escolha do artigo em destaque/Doutrina da Igreja Católica por causa do tamanho, agora são apenas 2KB acima.

A Wikipédia já tem alguns anos e algumas regras, são bem velhinhas, mas a tecnologia evoluiu, tanto quantos os navegadores, o hardware, a velocidade da Internet e o próprio formato da Wikipédia, que mudou até de visual, etc.

A evolução da Wikipédia é visivel, se antes os padrões de qualidade de artigos eram tão fraquinho, agora temos artigos tão bons, e esse padrões podem mudar mais ainda, a própria referenciação pesa bastante no tamanhos das páginas.

Alguma sugestão? o comentário precedente não foi assinado por Bruno Ishiai (discussão • contrib.) 00h42min de 10 de outubro de 2010

por mim poderíamos deixar o tamanho livre, ou pelo menos expandir um pouco o limite. quem sabe 250kb? Tetraktys (discussão) 02h14min de 10 de outubro de 2010 (UTC)[responder]

Discordo Uma página com 200 Kb demora imenso tempo a carregar num computador moderno ligado a uma linha com alguns Mbs. (imenso tempo em informática são alguns segundos). Editá-los é ainda mais demorado. Não é por acaso que Ajuda:Guia de edição/Tamanho de páginas e a sua correspondente na en.wp (en:Wikipedia:Article size) classificam como artigos longos aqueles que teem mais do que 32 Kb (o que também é um exagero, nem tanto ao mar nem tanto à terra). Há também a questão da legibilidade — a página da en menciona-os resumidamente. É certo que não é nada de grave, mas se os artigos em destaque são "o que temos de melhor", não faz sentido que sejam exemplos de desrespeito por recomendações. Quanto à evolução tecnológica, lembro que, se por um lado nos computadores de secretária e portáteis mais potentes ligados a uma linha de internet por cabo os problemas não são assim tão graves, isso não se verifica, nem verificará tão cedo, para dispositivos mais pequenos, menos potentes, e ligados por 3G. No que toca a facilitar a edição de artigos longos, há um método, que ao que julgo saber também é benéfico para carregar o artigo, que aparentemente pouca gente usa que são anexos embebidos (vejam por exemplo, o artigo Plasencia ou Alanya). --Stegop (discussão) 03h50min de 10 de outubro de 2010 (UTC)[responder]

Fiz muitas edições em Palácio de Versalhes utilizando o acesso discado, não todas as edições, foi de suar, com a ADSL o carregamento dessas páginas se fazem instantaneamente, 200 KB para o tamanho das páginas estaria de bom tamanho, da mesma forma que alguns acham que a ajuda de edição onde diz que as páginas com os 32 KB são consideradas páginas longas, talvez as páginas com 190 KB não sejam aquele limite de acesso que um computador nunca carregaria, que tal arredondarmos para 200 KB? Bruno Ishiai (discussão) 16h11min de 10 de outubro de 2010 (UTC)[responder]

Acabei de cronometrar o tempo que leva a carregar completamente a página Manaus (186 Kb): 17 segundos usando um Quadcore 3.2 GHz com 6 Gb de RAM, Windows 7 64 bits, Firefox 3.6.10. Segundo os testes acabados de fazer a ligação de Internet debita entre 11 e 13 Mbs Mbs de download para a Europa (o servidor que serve pt.wikipedia.org de onde estou aparentemente está na Holanda), entre 5 e 9 Mbs para os E.U. Se isto é instantâneo... Parece-me que o tempo de download não é o único factor a pesar quando as páginas são pesadas, o rendering também é demorado. --Stegop (discussão) 17h47min de 10 de outubro de 2010 (UTC)[responder]
Uma página com 200 KB demora quanto tempo? Bruno Ishiai (discussão) 21h12min de 10 de outubro de 2010 (UTC)[responder]
Na prática há-de demorar praticamente o mesmo tempo. Tudo o que seja mais do 2 ou 3 segundos é "lento", suponho que é por isso que usam os 32 Kb como limite. Claro que não vou fazer finca-pé contra 200 Kb, do mesmo modo que não me atrevo a propor baixar o limite dos artigos destacados para, por ex., 150 Kb, pois só editei extensivamente um artigo tão grande (Plasencia é a tradução da es, onde tinha na altura duzentos e muitos Kb), pelo que não sei se sempre é possível fazer o que fiz com ele (entre a página propriamente dita e os anexos embebidos acho que tem pouco mais de 100 Kb). No entanto, creio que seria bom começar a pensar-se em encarar a dimensão execessiva dos artigos como negativa, o que poderia passar, por exemplo, por avaliar a cobertura do tema não apenas pelo que está no artigo diretamente, mas também nos seus anexos ou artigos especializados. Afinal, o que se pretende é informar o consulente da melhor forma possível e isso passa, quanto a mim, por partir em várias páginas os temas cuja cobertura é muito extensa. "Contra mim falo", pois tenho uma dificuldade imensa em sintetizar, como se pode ver pelas minhas mensagens nas discussões, mas creio que, comparando, por ex., com os destaques na en, por aqui temos tendência a só destacar artigos paquidérmicos - por lá há artigos destacados de menos de 30 kb que cá provavelmente nem chegariam a bons por causa do preconceito inconsciente de achar que artigo destacado tem que ser grande. --Stegop (discussão) 05h57min de 11 de outubro de 2010 (UTC)[responder]
Mas há assuntos que para serem completos são muito maiores que os artigos convercionais. Bruno Ishiai (discussão) 15h06min de 11 de outubro de 2010 (UTC)[responder]
190Kb é muito grande e demora uma eternidade para visualizar. De casa, não consigo ler boa parte dos artigos candidatos a destaque devido ao tamanho. Um verbete de enciclopédia é um resumo de informação e não devemos supor que cobrirá por extenso a maioria dos assuntos. Sou contra aumentar este limite e favorável a sua redução.OTAVIO1981 (discussão) 15h33min de 11 de outubro de 2010 (UTC)[responder]

Eu não sei quem chegou à conclusão que embutir páginas e predefinições em um artigo torna o carregamento mais rápido, mas gostaria muito de saber como isso foi feito. Ora, todos sabem que a velocidade de carregamento de uma página depende de vários fatores. Os maiores gargalos são:

  • o tamanho da informação a ser baixada do servidor web para o computador;
  • a largura de banda disponível para o cliente (velocidade de donwload do usuário).

Mas também há muitos outros fatores, como por exemplo:

  • a largura de banda disponível para o servidor (velocidade de upload do webhost);
  • velocidade dos servidores DNS;
  • processamento prévio, no servidor web, de informações a serem disponibilizadas para o cliente, geralmente decorrentes de requisições prévias (renderização de imagens, preenchimentos de formulários, jogos, etc);
  • a velocidade do próprio micro do cliente.

Usar uma predefinição ou uma página embutida, não agiliza o carregamento de uma página, o efeito é exatamente o contrário. Se uma determinada quantidade de imagens e texto têm 190 kB de tamanho, ela demora um tempo X para carregar. Porém, ao levar, por exemplo, 90 kB para uma predefinição ou qualquer outra página e embuti-la no artigo principal (agora com apenas 100 kB), a visualização da página precisará ser feita com os mesmos 190 kB. Isto é, sempre teremos que baixar 190 kB de dados. Páginas embutidas tornam isso ainda mais lento, porque o servidor web terá que aguardar processamentos adicionais (no caso, esperar que o MediaWiki analise a predef ou a "embedded page", pegue o código wiki presente lá e "una-o" com o código do artigo principal, para poder enviar todos os 190 kB de dados necessários à correta visualização da página). Isso fará o carregamento da página demorar X + processamento adicional.

Enfim, agradeço se alguém puder me explicar se estou equivocado ou não. Se eu não estiver, desde já proponho retirar tal a informação disponível em anexos embebidos (por falar nisso, "embebidos", embora não esteja errada, é uma tradução "literal" demais... =P). Kleiner msg 16h08min de 11 de outubro de 2010 (UTC)[responder]

Acho que você está certíssimo em relação aos anexo embebidos. Podem até diminuir o tamanho do artigo, mas o tempo de processamento da informação é o mesmo. OTAVIO1981 (discussão) 16h45min de 11 de outubro de 2010 (UTC)[responder]

Começo por dizer que embebido, não é tradução literal nenhuma, é o termo técnico utilizado quando se adiciona uma chave de chamamento a um ficheiro externo. Não lhe sei explicar a razão de ser mais rápido, porque isso é demasiado técnico, mas se duvida faça a experiência. Ligue-se de um telemóvel à wiki e verá que um artigo com artigos embebidos ex: Spirou e Fantásio, abre mais rapidamente que outro artigo com o mesmo tamanho e que não tenha nenhum artigo embebido. Acho que o que acontece é que quando é feito a chamada de dados, é primeiro activada a chave dos artigos embebidos, isso tem a ver com a estrutura do software em si que é 95% compilado em C e que utiliza o recurso de bancos embebidos, ou seja em vez de se repetir ad æternum uma determinada linha de programação é criada uma base de dados de bibliotecas que são embebidas no programa e quando essa linha é necessária ela é chamada da biblioteca em vez de estar no corpo do programa. Tal como disse é uma estrutura de software não tem nada a ver com hardware, e tal como já disse, se duvidam experimentem. Pelo Poder do Z Alaf Ogimoc 19h35min de 11 de outubro de 2010 (UTC)[responder]

Pelos vistos não fui explicito lá em cima, mas a principal razão para mencionar os anexos embebidos foi a edição e não exatamente a performance. Mesmo que os ganhos em termos de carregamento da página sejam marginais, é mais fácil editar se isso puder ser feito por partes. É certo que se pode fazer secção por secção, mas isso não é prático para alterações que incidam sobre várias secções. --Stegop (discussão) 19h59min de 11 de outubro de 2010 (UTC)[responder]
Zorglub, eu não tenho como fazer o teste com um aparelho móvel, mas confesso que não entendi sua explicação. Se entendi bem, ela faz referência a bancos de dados embarcados (único termo usado em pt-br). que se tratam de sistemas e aplicações diferentes das usadas pelo projeto. Sendo usados aqui, agilizariam apenas o acesso a dados originalmente em bancos externos, como imagens (provenientes do Commons), por exemplo. Isto só tornaria o carregamento mais rápido em circunstâncias especiais. Mas, como disse, não entendi bem o que você explicou, e talvez eu esteja falando apenas falando uma bobagem qualquer. Portanto, vou aceitar sua resposta como correta.
Stegop, acho que é muito mais fácil para uma pessoa pouco experiente em informática ou na Wikipédia que se use uma janela só para editar todo o conteúdo de uma página do que seguir em várias páginas para modificar diferentes textos de um mesmo artigo. Mas essa é só uma opinião, sem nenhuma base em experiências nem nada do tipo. Kleiner msg 20h41min de 11 de outubro de 2010 (UTC)[responder]
Experimente editar um artigo com mais de 60 kb e vai perceber! À exceção de correções menores, que incidam sobre todo o texto, quando se está a fazer uma edição que "mereça esse nome", ou seja, que refaça texto já existente e o expanda, não se faz isso na totalidade da página de uma vez se ela for muito grande. Quanto aos "poucos experientes", uma coisa é não se saber embeber páginas, outra é considerar que haverá muita gente que não consiga perceber que o texto que quer editar e que não encontra está no anexo quando vir {{Anexo:....}}. Já vi demasiadas vezes preocupações dessas com os menos instruídos darem o resultado contrário das boas intenções, isto é, dificultarem a vida a todos sem facilitarem a vida a ninguém, quando não mesmo complicarem ainda mais as coisas aqueles em que se estava a pensar. --Stegop (discussão) 21h53min de 11 de outubro de 2010 (UTC)[responder]
Eu já experimentei, inúmeras vezes, editar artigos de mais de 100 kB e nunca tive problemas com isso. Eu já vi demasiadas vezes a falta de preocupação com os menos instruídos afastando-os totalmente da Wikipédia. É só passar alguns meses respondendo-os no café dos novatos ou na wikipedia/contato. Quem ajuda novatos por e-mail, no IRC e até no Twitter pode confirmar ou refutar o que eu digo. Existem literalmente milhares de usuários muito bem intencionados, verdadeiros especialistas em determinada área do conhecimento e interessados em participar, mas ao verem o emaranhado de código wiki em uma simples página, acabam desistindo. Agora, se não for pedir demais, peço um único exemplo de "preocupações dessas com os menos instruídos darem o resultado contrário das boas intenções", porque confesso que nunca vi aqui. No máximo, vejo idéias sendo implementadas e abandonadas quando se vê que não deram/darão certo. Nada pior que isso. Minha proposta é usar a Navalha de Occam. A solução mais simples para o problema discutido aqui é desmembrar o artigo em artigos específicos e deixar no principal apenas o essencial para uma compreensão rápida do assunto tratado. Isso já é usado e dá certo na imensa maioria das vezes. Kleiner msg 22h42min de 11 de outubro de 2010 (UTC)[responder]

Quando disse que Citação: Kleiner escreveu: «...essa é só uma opinião, sem nenhuma base em experiências...» entendi que estava a dizer que não tinha experiência de editar páginas grandes. Pessoalmente só vi utilidade em partir em anexos em três ou quatro casos em que trabalhei durante muitos dias em artigos longos. É claro que poderia passar sem isso, principalmente naquelas edições pouco mais que pontuais, quando se trata de corrigir uns quantos pormenores e reescrever dois ou três parágrafos e acrescentar outros tantos.

Quanto às preocupações com os menos instruídos, não estava a pensar na wiki. Claro que isto aqui não é um lugar fácil para os menos familiarizados com informática, mas não é usar anexos embebidos que vai contribuir alguma coisa para piorar isso significativamente! Se reparar, eu tb. defendo que os artigos devem ser partidos, mas olhando para o que se passa nas EAD's e ao que motivou esta discussão, não creio que essa tese tenha muitos adeptos. O que é quase caricato: a esmagadora maioria dos verbetes são esboços, quando não mínimos, no entanto qualquer pretexto serve para criar artigos, mesmo que não se tenha informação para lá colocar, em vez de concentrar a informação que existe em artigos mais genéricos, mas os artigos destacados tendem a ser enormes e dificilmente algum que não seja é destacado. Mas note que os anexos embebidos é apenas uma sugestão que, quanto a mim, facilita o trabalho de edição. Não estou a propor que se torne uma recomendação oficial e muito menos uma imposição. --Stegop (discussão) 23h11min de 11 de outubro de 2010 (UTC)[responder]

Ok, pessoal tenho muita pouca experiência na Esplanada, fico agradecido pelas respostas, espero usar esse espaço mais vezes, trouxe essa votação por causa das regras de EAD sobre tamanhos de artigo, pq ao meu entender 190KB em certo assuntos seriam um gargalo, mas agora vi a opção de usar os anexos embebidos, o que pode ajudar em muitos artigos. A Wikipédia é um espaço aberto e temos de tentar satisfazer a todos, se para uns não seria a melhor opção aumentar o tamanho dos artigos, para outros não seria viável diminuir o tamanho dos artigos nas regras de EAD, então acredito que a melhor coisa sé deixar como está. Boas edições. Bruno Ishiai (discussão) 12h52min de 12 de outubro de 2010 (UTC)[responder]

Peço desculpa ao Bruno, na qualidade de iniciador desta discussão, e aos restantes participantes, por ter contribuído involuntariamente para que a proposta em concreto fosse relegada para segundo plano. Para o caso de não ter ficado claro, não entendo que seja assim tão necessário baixar o limite, mas acho que seria desejável se houvesse uma recomendação para que se evitasse ao máximo que esse limite seja atingido. Quando trouxe à baila os anexos embebidos estava a pensar principalmente nas vantagens que isso traz na edição. Nem todos concordam, é natural e não é assunto pelo qual valha a pena "brigar" muito, quem quer usa, quem não quer não usa, ninguém prejudica ninguém grandemente. Mas só espero que não desatem a usar isso para tornear o limite, pois aí é pior a emenda que o soneto. O tamanho dos artigos deve ser entendido como a soma do tamanho de todas as páginas usadas para compor o que o leitor vê no seu browser. --Stegop (discussão) 13h31min de 12 de outubro de 2010 (UTC)[responder]
  • Stegop, ao cronometrar o tempo, lembrou-se de deslogar (para não ter scripts pessoais ativados, nem preferências que aumentam o tempo que o parser do MediaWiki leva para produzir a página)? Fez a medição apenas no primeiro acesso, ou em uma segunda vez também? É que o MediaWiki procura, sempre que possível, evitar o processamento (parser) de qualquer página, pois esta é uma parte bem lenta. Para isso ele usa caches. Um exemplo: quando acessei (instantes atrás) esta página, o código fonte HTML tinha o seguinte comentário:
<!-- Saved in parser cache with key ptwiki:pcache:idhash:2915311-0!1!0!!pt!4 and timestamp 20101016113304 -->

Se eu não me engano, se qualquer outro leitor acessar a mesma página e a chave acima for a mesma, o MediaWiki simplesmente usará a cópia que tem em cache, sem fazer qualquer processamento. Houve uma discussão recentemente na wikitech, na qual foi falado um pouco sobre os caches:

http://thread.gmane.org/gmane.science.linguistics.wikipedia.technical/48847/focus=48869

Há algumas preferências (matemática, formato da data, numeração automática de cabeçalhos, idioma da interface, tamanho da miniatura das imagens) que, se usadas com um valor diferente do padrão, tornam bastante provável que o MediaWiki terá que processar novamente toda página que for acessada, sem poder usar o cache (criado quando outro leitor acessou a página):

http://thread.gmane.org/gmane.science.linguistics.wikipedia.technical/48847/focus=48893

Isso significa que para aqueles (usuários registrados) que definiram tais preferências, e que portanto não poderão receber a cópia existente em cache, o tempo de espera é bem maior (podendo chegar a 50s). Experimentem comparar os tempos de carregamento deslogados versus com todas as preferências e bugigangas que existem a disposição! =)

  • Citação: Kleiner escreveu: «Isto é, sempre teremos que baixar 190 kB de dados» Na verdade, o tamanho do HTML é diferente e razoavelmente independente do tamanho do código wiki da página. Se parte do conteúdo é movido para uma predefinição, este conteúdo não precisará ser baixado para quem editar a página onde a predefinição é usada. O que continuará essencialmente igual é o tamanho do HTML.
  • E para quem tiver curiosidade, há uns tempos apresentou-se na wikitech um protótipo da ideia de uma interface para edição wiki a nível de frases ou parágrafos. Isso significa que para pequenas edições, só seria preciso carregar o código wiki do parágrafo que se pretendesse editar. Vejam a discussão aqui e experimentem a interface aqui ;-). Helder19h45min de 16 de outubro de 2010 (UTC)[responder]
Discussões e considerações interessantes, Helder! Já há muito que suspeitava que a "tralha" que se pendura quando estamos logados, nomeadamente javascript deve pesar muito no carregamento das páginas; e os add-ons que tenho no Firefox não devem ajudar nada, pois devem ter que analisar imenso código antes de apresentar a página, mesmo que ela não seja muito pesada. Mas de qualquer forma, mesmo no IE plain vanilla sem me logar, uma página de 190 Kb demora pelo menos 7 segundos a carregar, o que, há-de concordar, é muito tempo para uma máquina que é bem mais rápida que qualquer topo de gama portátil e está ligado à Internet por uma linha incomparavelmente superior a, por exemplo, qualquer 3G, tanto em termos de largura de banda como noutras parâmetros (latência, etc.).
Já agora, uma pormenor importante que me esqueci de referir em relação ao que considero uma vantagem inestimável em usar anexos embebidos tem a ver com o ajuste de layout (leia-se imagens), uma das coisas mais complicadas de fazer na wiki, pois na prática requer inúmeras tentativas com pré-visualização de toda a página (por causa do TOC). --Stegop (discussão) 20h01min de 16 de outubro de 2010 (UTC)[responder]