Wikipédia:Robôs/Pedidos de aprovação/ChicoBot/2

Origem: Wikipédia, a enciclopédia livre.

pedidoediçõescontadorlogsblock userblock logflag logflag botSUL util
Pedidos de tarefas: 1, 2

Operator: Chicocvenancio

Automatic or manually assisted: Automatico

Programming language(s): Python (pywikibot PAWS/Toolforge)

Function summary: Retirar links para sites com reportagens circulares conforme Wikipédia:Esplanada/propostas/Proibir reportagem circular na Wikipédia (5out2017)

Edit period(s) (e.g. continuous, daily, one time run): Uma vez para cada página no domínio principal da lista de páginas com links para os sites

Edit rate requested: negociável (máximo de 3 por minuto)

Already has a bot flag (Y/N): Y Function details:

  1. Listar as páginas do domínio principal com links para o site a ser retirado (manter lista em uma subpágina para registro)
  2. Retirar os links das páginas (se forem parte de uma referência retirar a referência)
  3. Verificar se as páginas mantém alguma referência após a retirada, caso não, listar a página em uma supágina

Discussion[editar código-fonte]

Identificar se uma página da internet tem como fonte a Wikipédia me parece uma tarefa complicada e propensa a falsos positivos. A tarefa inicial vai se concentrar na questão da Infoescola tratada no tópico da esplanada? Tem algum código pronto para fazer essa identificação? Se já tiver pode gerar a subpágina com a lista, assim poderemos avaliar a precisão da busca. Danilo.mac(discussão) 01h49min de 6 de novembro de 2017 (UTC)[responder]

Danilo.mac Sim, tarefa inicial somente Infoescola. Para listar as páginas é razoavelmente trivial, um pagegenerators.LinksearchPageGenerator("www.infoescola.com", namespaces=[0], site=site, protocol='http') já busca a lista corretamente (50 por vez, mas pode ser ajustado com total=). O código que ainda não escrevi é sobre retirar o link com a referência e contar as referências no início e no fim, mas penso que é algo relativamente simples.
Penso que devemos adotar isso como prática posteriormente, se encontrarmos manualmente outros sites semelhantes. Chico Venancio (discussão) 11h31min de 6 de novembro de 2017 (UTC)[responder]

Contra Desculpem lá, mas aquilo a que o bot se propõe não faz nenhum sentido nem houve qualquer consenso para tal ação. A única discussão que houve apenas considerou a "infoescola" uma fonte sem garantias de fiabilidade. Nada contra retirar os links para o site da secção de "ligações externas". Por outro lado, vamos com calma quanto a remover automaticamente as referências dos artigos. Se o conteúdo foi escrito com base nesse site, o único procedimento a adotar é incluir uma predefinição de fonte não fidedigna junto à referência para que possa ser observada/corrigida no futuro. JMagalhães (discussão) 11h55min de 6 de novembro de 2017 (UTC)[responder]

Que perseguição agradável. Toda a discussão na esplanada sobre isso calado, eu adoto a tarefa e lá vem... Chico Venancio (discussão) 12h15min de 6 de novembro de 2017 (UTC)[responder]

Pode apontar exatamente onde é que foi aprovado remover referências existentes? JMagalhães (discussão) 12h21min de 6 de novembro de 2017 (UTC)[responder]

@Chico Venancio Eu não tinha lido todo tópico da esplanada e tinha pensado que você pretendia remover todos os links que se enquadram como circulares, ou seja, que o robô iria ler a página da Infoescola e verificar se a fonte indicada lá é a Wikipédia... agora li o tópico inteiro. O entendimento lá, se compreendi corretamente, é classificar a Infoescola como fonte não fiável, porém sem incluí-la na blacklist. Portanto os links para a Infoescola só devem ser removidos quando estiverem sendo usados como referências, do contrário podem ser mantidos. As discussões no tópico apontam para isso porém não está claro que todos tiveram esse entendimento ao concordarem, tanto que acima o JMagalhães teve um entendimento totalmente oposto (remover tudo exceto fontes). Portanto peço que deixem claro lá no tópico da esplanada (e não aqui) de que parte do artigo os links podem ser removidos (fontes ou ligações externas) antes de dar prosseguimento ao pedido. Danilo.mac(discussão) 14h25min de 6 de novembro de 2017 (UTC)[responder]

JMagalhães Qual é essa predefinição? Eu me recordo apenas de {{verificar credibilidade}}, e não é o caso de verificar nada aqui, já foi acordado na esplanada que a fonte não é fiável se por sua vez utiliza a wiki como fonte, e são justamente esses os casos que o Chicocvenancio se propôs a remover. Concordo que nada se falou sobre links em ligações externas, apesar de eu não saber qual é o valor que eles teriam, mas se foi determinado que a fonte não é fiável que sentido tem mantê-la? Saturnalia0 (discussão) 23h43min de 6 de novembro de 2017 (UTC)[responder]

A fonte é o que foi usado para escrever o conteúdo. Qual é a lógica de eliminar a referência mantendo o conteúdo? JMagalhães (discussão) 23h48min de 6 de novembro de 2017 (UTC)[responder]
Por favor discutam isso no tópico da esplanada, página de pedido de robô é para questões técnicas. Danilo.mac(discussão) 23h52min de 6 de novembro de 2017 (UTC)[responder]