Wikipédia Discussão:Central de pesquisas

O conteúdo da página não é suportado noutras línguas.
Adicionar tópico
Origem: Wikipédia, a enciclopédia livre.
Último comentário: 11 de setembro de 2013 de MisterSanderson no tópico Estatísticas de eliminação de páginas

Páginas aleatórias[editar código-fonte]

Uma pesquisa que eu já vi fazerem e que parece muito importante é a estimativa do tamanho do lixo. Era algo como rodar várias vezes "Páginas aleatórias" e contar quantas não tem fontes, quantas estão porcamente referenciadas e quantas tem partes significativas sem fontes. Albmont (discussão) 14h25min de 7 de março de 2013 (UTC)Responder

Uia, será que rola um Método de Monte Carlo para isso? :D --ezalvarenga (discussão) 14h30min de 7 de março de 2013 (UTC)Responder
Overkill. Basta rodar Páginas aleatórias algumas vezes e analisar a amostra. Albmont (discussão) 14h33min de 7 de março de 2013 (UTC)Responder
Alb, essa é antiga hein, nem lembrava mais. Usuário:Indech/15 artigos aleatórios. Vou colocar lá o link.
Seria útil fazer isso de modo automático, mensalmente uma amostra (mais significativa q 15, claro), usando os critérios de avaliação automática. Rjclaudio msg 15h23min de 7 de março de 2013 (UTC)Responder
Que tal adicionar essa tarefa ao Planejamento de Análise de Dados e Experimentos? HAndrade (WMF) (discussão) 17h16min de 7 de março de 2013 (UTC)Responder
Isso tb podia ser feito por wikiprojeto. 20 artigos de cada wikiprojeto principal, seis projetos (seis? ou oito?), 120~160 artigos. Daria para ver a qualidade da wikipédia por tema, e gerava um relatório por projeto. Rjclaudio msg 17h35min de 7 de março de 2013 (UTC)Responder

────────────Ideia interessante. --ezalvarenga (discussão) 17h50min de 7 de março de 2013 (UTC)Responder

Tenham em mente esse dado:

152 mil artigos foram criados por bots na Wikipédia lusófona, cerca de 20% do total, 1 a cada 5 artigos fonte: http://stats.wikimedia.org/EN/BotActivityMatrixCreates.htm. JAMAL 11h27min de 13 de março de 2013 (UTC)Responder

E esses dados:

Ou seja, se o número de bytes é um dos indicadores de qualidade ou pelo menos estão quase sempre bem correlacionados, e que cerca de 70% da Wikipédia lusófona é de artigos com menos de 2000 bytes podemos concluir que: dos 772 700 artigos temos atualmente algo em torno de 540 890 artigos um tanto... superficiais. Como 15% dos artigos possui menos de 500 bytes, o número de artigos muito superficiais seria de 115 905 artigos. JAMAL 12h03min de 13 de março de 2013 (UTC)Responder

Fiz uma pesquisa em páginas aleatórias com ajuda do robô há um tempo atrás separando os artigos por assunto de forma semiautomática, cheguei a uma amostra de 432 artigos e ao seguinte resultado: 22,5% dos artigos estão relacionados com ciência, 9,7% com história, 8,3% com esporte, 17,6% com arte, 18,8% com sociedade, 18,3% são artigos de cidades e 4,9% estão relacionados com outros assuntos; também separei pelo tipo: 19,6% são artigos sobre pessoas, 24,5% sobre lugares, 7,6% sobre grupos ou organizações, 1,6% sobre objetos, 8,6% sobre terminologias, 4,9% sobre objetos astronômicos, 12,0% sobre espécies de seres vivos e 21,1% sobre outros tipos (músicas, personagens, competições, etc). Além desse tipo de pesquisa o robô também pode fazer outros tipos de pesquisa como fazer busca no texto, procurando predefinições, referências, imagens, etc, e pegar dados como tamanho do artigo, criador, data da criação, tamanho do artigo um ano após a criação, etc, e depois ainda pode fazer cruzamento dos dados para tentar encontrar alguma correlação entre eles. Eu ia fazer uma pesquisa dessa com uma amostra grande mas ainda não tive tempo. Danilo.mac(discussão) 04h00min de 27 de abril de 2013 (UTC)Responder
Muito interessante sua pesquisa, Danilo. O código do robô está disponível em algum lugar onde eu possa dar uma olhada? HAndrade (WMF) (discussão) 07h24min de 30 de abril de 2013 (UTC)Responder

Como melhorar o visual[editar código-fonte]

Vejam esse exemplo. --ezalvarenga (discussão) 14h38min de 7 de março de 2013 (UTC)Responder

Organização por tema[editar código-fonte]

Ao invés de termos vários relatórios, por pessoas e épocas diferentes, em várias páginas diferentes, não seria melhor organizar as coisas por tema? Uma subpagina da Central de pesquisas para reunir tudo sobre criação x eliminação de páginas, outra sobre tomada de decisão, outra sobre ips, outra sobre retenção de usuários, e etc. Fica mais fácil de achar as informações qnd se está discutindo o tema.

Vendo o lado automático, tinha pensado q o Portal de dados poderia ser assim, com os dados organizados isoladamente, e com uma 'tag' associando os dados a um tema, e aí abrindo a tag se via todas as informações reunidas em um único lugar sobre aquele tema. Rjclaudio msg 18h55min de 15 de março de 2013 (UTC)Responder

Apoio as ideias. JAMAL 19h57min de 15 de março de 2013 (UTC)Responder

Identificar problemas nas discussões[editar código-fonte]

Fiz Usuário:Rjclaudio/Textos/Discussões para listar coisas que creio serem problemas, aceita-se adições. Estava falando com o Otavio aqui sobre fazermos alguma pesquisa com editores (e leitores?) para saber como a comunidade vê esses problemas (e possíveis soluções). Rjclaudio msg 17h16min de 18 de março de 2013 (UTC)Responder

Pesquisa de opinião[editar código-fonte]

Fiz um esboço em Wikipédia:Central de pesquisas/Pesquisa de Opinião com editores da Wikipédia e todas as opiniões para melhorar (e ajudar a implementar) são bem-vindas.OTAVIO1981 (discussão) 21h26min de 28 de março de 2013 (UTC)Responder

Remoção do modo emergencial do CAPTCHA[editar código-fonte]

Ver WP:Esplanada/anúncios#Remoção do modo emergencial do CAPTCHA. O Captcha foi removido do modo emergencial, é uma oportunidade única para analisar como vai ficar as coisas. Até pq isso não deve durar muito tempo. E a análise pode ajudar a decidir o que fazer depois. Ideias de como coletar algum dado útil? Rjclaudio msg 02h54min de 10 de abril de 2013 (UTC)Responder

Claudio, acho que podemos medir a variação nos números de reversões, bloqueios, número de edições, número de edições não-revertidas, criação de novos usuários, retenção de novos usuários. Esses números podem ser cruzados posteriormente para tentarmos analisar friamente qual foi o impacto desse momento. O que achas? HAndrade (WMF) (discussão) 16h51min de 10 de abril de 2013 (UTC)Responder
Acho que quanto menor for o período analisado, e ao que parece o captcha vai voltar a qualquer momento, pior será tentar traçar qualquer conclusão. O teste dos reversores bloqueado vândalos durou 3 meses e não foi possível elaborar um resultado contundente para concluirmos algo.OTAVIO1981 (discussão) 17h10min de 10 de abril de 2013 (UTC)Responder
Otavio, concordo que um período pequeno de tempo não nos permitirá tirar conclusões, mas poderá apontar indícios para futuras análises. HAndrade (WMF) (discussão) 20h21min de 10 de abril de 2013 (UTC)Responder
Não concordo mas fique à vontade para analisar o que achar pertinente. Ou a premissa foi analisada corretamente e gera um resultado confiável ou não foi e usar esta informação duvidosa é terrível para a gestão de iniciativas futuras. Lembre-se que a comunidade é muito resistente à mudanças ainda mais esta que está passando por um atrito no momento. Abraço, OTAVIO1981 (discussão) 20h58min de 10 de abril de 2013 (UTC)Responder

Informações de interação na anglófona sobre retenção de editores[editar código-fonte]

O Phelps246 iniciou uma conversa na esplanada da anglófona e surgiram algumas informações e sugestões interessantes: segue o link, para quem tiver interesse.OTAVIO1981 (discussão) 18h58min de 29 de maio de 2013 (UTC)Responder

Muito interessante mesmo o debate, Otavio. Eu nunca havia reparado no link para Wikipédia:Informe um erro no menu lateral. Cliquei lá agora e vi que ele tem algum uso (apenas no olhômetro percebo mais de 20 edições por dia). Você acha que essa ferarmenta merece ter dados destrinchados? HAndrade (WMF) (discussão) 21h43min de 29 de maio de 2013 (UTC)Responder
Não sei mas com certeza merece um debate. ;) Depois que o colega anglófono levantou a bola fiquei pensando mais sobre o recurso e se de fato está tirando a audácia dos leitores/potenciais editores de corrigir os erros por conta própria. Embora alguns informes sejam legítimos, pelo que constatei a grande maioria fica sem resposta e quando existe, pode ser algo do tipo como "faça você mesmo". Numa contagem que fiz ontem foram arquivados 328 informes e pouco mais de 33% tinha uma resposta então num chute aproximado 17% dos informes foram efetivamente respondidos e corrigidos. Não custava nada repensar o formulário para ser mais intuitivo e explicativo para incentivar o leitor a corrigir por conta própria. No momento existe um link para "Editar a página e corrigir o erro" mas não explica nada como fazê-lo. Seria legal dali ir para um outro form explicando como proceder (achar o erro, editar informação, salvar) e a página a ser corrigida abrir numa outra aba para não atrapalhar a leitura do tutorial e a correção em si. Tudo isso, é claro, com pontos de monitoramento. ;) OTAVIO1981 (discussão) 15h52min de 30 de maio de 2013 (UTC)Responder
Legal sua ideia, Otavio. Será que esse recurso não seria uma aplicação para a extensão de "visitas guiadas"? O que acha de levarmos esse debate para outra página com mais visibilidade, e caso o debate aponte para uma pesquisa voltamos para cá? HAndrade (WMF) (discussão) 08h05min de 4 de junho de 2013 (UTC)Responder
Henrique, não precisa da autorização do Otavio para levar a discussão para um lugar com mais visibilidade. Seja audaz. ;) --ezalvarenga (discussão) 13h04min de 4 de junho de 2013 (UTC)Responder
Indiferente ao que será feito pois não tenho mais interesse pelo assunto. Faço votos que levem adiante. OTAVIO1981 (discussão) 19h33min de 4 de junho de 2013 (UTC)Responder

Interação na russófona sobre a retenção de novos editores[editar código-fonte]

Há muito tempo atrás a Oona havia falado que os russos tinham feito algo diferente a respeito do assunto. Eu repeti isso duas vezes (uma na tarefa do novo coordenador, pelo menos) para ressaltar aspectos de comunicação deficiente entre projetos. Bem, apurei um pouco melhor a questão e entrei em contato com o Samal (russo) e a conversa está aqui.OTAVIO1981 (discussão) 23h51min de 5 de junho de 2013 (UTC)Responder

Parabéns pela pró-atividade, Otavio. Eu ouço sobre a Wikipédia russa há séculos, antes de começarem com essa história de catalisador. Curioso não terem ainda ido a fundo nisso. --ezalvarenga (discussão) 01h12min de 6 de junho de 2013 (UTC)Responder
Em tempo, vale a pena ler esse tópico que criei há certo tempo na esplanada, Artigos do projeto Wikipédia na Universidade, incubadora de artigos e pequenos exercícios para novos editores. --ezalvarenga (discussão) 01h16min de 6 de junho de 2013 (UTC)Responder
Não é exatamente curioso. Existe má vontade pela idéia por ser associada ao Quintinense. E este link só me fez notar que já passou mais de um ano que estamos nessa de projeto educação. :S OTAVIO1981 (discussão) 10h22min de 6 de junho de 2013 (UTC)Responder
O tempo voa. E o mundo muda. Mas alguns locais continuam na mesma. ;) --ezalvarenga (discussão) 11h37min de 6 de junho de 2013 (UTC)Responder
Pessoas raramente mudam. Este eh o problema.OTAVIO1981 (discussão) 13h34min de 6 de junho de 2013 (UTC)Responder
Não é tão ruim as pessoas não mudarem. Um problema maior é serem herméticas para que a diferença surja. E se não houver confronto de ideias de maneira salutar, a mediocridade reina. --ezalvarenga (discussão) 15h05min de 6 de junho de 2013 (UTC)Responder

Estatísticas de eliminação de páginas[editar código-fonte]

Olá. Um usuário me disse uma vez que um número bem grande de páginas são eliminadas diariamente (um bem maior do que eu já sabia, e sem mesmo que eu participasse). Eu gostaria que houvesse um gráfico de pizza mostrando quantas são eliminadas por PE, quantas por ESR e quantas por ER, para permitir aos editores terem melhor visão do sistema de eliminação (que vários demonizam, mas que é tão natural), talvez inserindo-o nos textos sobre esses métodos de eliminação. Alguém daqui da central de pesquisas se interessa, ou por acaso (sei lá) já estaria desenvolvendo isso? Se não, quando tiver tempo vou ver se tenho como coletar essas informações não sendo eliminador, e fazer com informações relativas a um mês que não seja férias.--Mister Sanderson (discussão) 00h29min de 11 de setembro de 2013 (UTC)Responder

Vi em algum lugar uma pesquisa do Danilo.mac listando os sumários de eliminação mais usados. Como tem um motivo padrão para ESR e PE, as eliminações por esses 2 modos devem seguir esse sumário, e o resto todo é ER. Não lembro onde vi, talvez café dos eliminadores. Rjclaudio msg 02h04min de 11 de setembro de 2013 (UTC)Responder
ESR e PEs tem sumários de edição padronizados? O que garante isso?--Mister Sanderson (discussão) 02h09min de 11 de setembro de 2013 (UTC)Responder
Tem um motivo na lista, de "eliminação por ESR" ou algo do tipo, e nas PEs tb e tem o script então mais provável que usem o sumário. Para ESR não sei, talvez alguns eliminadores coloquem o motivo em si da eliminação, mas como a maioria que elimina ESR elimina vários, o mais fácil para eliminar é usar o sumário de 'eliminado por ESR'..
Bem, é o único modo que eu conheço para as ESRs, melhor que isso só se tiver acesso ao histórico eliminado para consultar a última versão pra saber se era ER ou ESR. Pras PEs ainda dá para fazer a contagem pelo arquivo de eliminadas, e o que sobrar só pode ser ER ou ESR.
Ou VDA, que já tava esquecendo que tinha. Rjclaudio msg 02h26min de 11 de setembro de 2013 (UTC)Responder
Com o registro de eliminações não registrando qual foi o método empregado, a situação fica ruim pra mim, teria que deduzir, como você disse. O resultado seria mais imprecisão.--Mister Sanderson (discussão) 02h29min de 11 de setembro de 2013 (UTC)Responder