Wikipédia:Filtro de edições/Solicitações

Origem: Wikipédia, a enciclopédia livre.

Último comentário: 14 de fevereiro de 2022 de Natalia.de.Araujo no tópico Não consigo publicar tradução
Página principal (discussão) Instruções Análise e estatísticas Bloqueios Etiquetas Arquivo Gestão: Filtro   Etiquetas
Filtros por assunto

Remoção

String

Ofensas

Páginas novas

Erros

Fora do escopo do projeto

PN Mínima

Código wiki inadequado

Texto em local suspeito

Spam

Bloqueios (verifica usuário)

Proteção (verifica página ou conteúdo)

Domínios não-conteúdo

Discussões e votações

Página de usuário

Outros

Acompanhamento / Estatística

Links rápidos

Filtros de remoção de conteúdo

Filtro 1 - Remoção de proposta de eliminação

Remoção de proposta de eliminação
Status
Avisando (aviso) e etiquetando ("retirada tag eliminação")
Manutenção
Baixa. Requer atualizações somente em caso de novas predefinições de eliminação serem implementadas.
Resumo
Originalmente, o filtro era focado na remoção de predefinições de votação mas foi fundido com outros filtros de mesma função. Atualmente, não pode ser utilizado no modo desautorizar em função de remoções válidas da predefinição, no caso dos problemas apontados serem resolvidos.
Ferramentas
Falsos positivos
Total 8
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
indefinido

Fusão

Temos três filtros para remoção de predef de eliminação: 22 ER, 24 ESR e 01 PE. A ação dos três é igual, e os critérios são praticamente os mesmos. Funde os três? Rjclaudio msg 17h00min de 25 de julho de 2013 (UTC)Responder

Tem o meu apoio.OTAVIO1981 (discussão) 18h48min de 25 de julho de 2013 (UTC)Responder

Para comparação:

Condições Aviso Etiqueta
01

! 'autoconfirmed' in user_groups
& old_wikitext rlike '\{\{apagar2'
& ! new_wikitext rlike '\{\{apagar2'

abusefilter-warning-eliminação:

Atenção: remover a marcação de eliminação rápida, semirrápida ou por votação de uma página não impede a comunidade de se pronunciar sobre o assunto. Se você não concorda com a marcação, pode falar com o editor que enviou este artigo para eliminação (quem foi?). Você está autorizado, no entanto, a melhorar o conteúdo desta página, contanto que não retire a marcação. Para saber se é possível evitar a eliminação da página, e como fazer isso, leia essa página. Entretanto, se você leu a página e acredita que remover a marcação está de acordo com as regras (se, por exemplo, já foram corrigidos os problemas indicados em uma proposta de eliminação semirrápida), pode pressionar novamente o botão "Gravar página" para confirmar a edição. Se este aviso estiver aparecendo sem que nenhuma marcação de eliminação tenha sido removida, por favor avise-nos nesta página para corrigirmos este problema.

Retirada proposta de eliminação por votação.
22

pred := '\{\{(?:er(?:1|20)?|spam|lixo|impróprio|delete|usuário:salebot/impróprio)[\|\}]';

user_editcount < 50
& ! article_namespace == 2
& lcase( removed_lines ) rlike pred
& ! lcase( added_lines ) rlike pred

Retirada tag eliminação
24

! 'autoconfirmed' in user_groups
& lcase( removed_lines ) rlike '{{esr2?\|'
& ! lcase( added_lines ) rlike '{{esr2?\|'

Há algum motivo especial para a existência de uma etiqueta exclusiva para o filtro 1? Ela deveria ser desativada em favor da etiqueta utilizada pelos demais? O fato de termos estas duas etiquetas distintas para identificar edições que são essencialmente de um único tipo me deixa com a impressão de que ninguém usa ambas (se usasse, por que iria querer ter que filtrar as mudanças recentes duas vezes, uma com cada etiqueta?). Não seria o caso de parar de etiquetar também?

Quanto à fusão dos filtros, qual seria o critério único a ser utilizado pelo novo filtro? Helder 20h41min de 25 de julho de 2013 (UTC)Responder

Sugestão seria:

pred := '\{\{(?:er(?:1|20)?|spam|lixo|impróprio|delete|usuário:salebot/impróprio|esr2?|apagar2?)[\|\}]';

! 'confirmed' in user_groups & removed_lines irlike pred & ! added_lines irlike pred

E expandir a lista de predefs para incluir VDA?

Sobre a etiqueta, como saber que ninguém usa? Apenas exibir a etiqueta já me parece útil, pois seria um complemento 'automático' para o sumário de edição, vendo a tag na MR ou Vigiadas já saberia o que é, e se seria útil dar mais atenção aquela edição. Então eu deixaria, não vejo problema em manter, mas deixaria só uma, a "retirada tag eliminação" que é mais genérica.

Rjclaudio msg 00h25min de 29 de julho de 2013 (UTC)Responder

Feito Fundido usando o código acima. Usei a etiqueta "Retirada tag eliminação" por ser a mais genérica. Rjclaudio msg 16h51min de 12 de agosto de 2013 (UTC)Responder

Usuários

O filtro só detecta usuários não-confirmados. Antes da fusão, o filtro de ER detectava usuários com menos de 50 edições. Acho válido usarmos esses 50 edições ao invés de ser confirmado (para ER, ESR e PE). Rjclaudio msg 01h40min de 19 de agosto de 2013 (UTC)Responder

Porque 50 edições?OTAVIO1981 (discussão) 12h04min de 19 de agosto de 2013 (UTC)Responder
Ver também WP:Filtro de edições/22#Número de edições e WP:Coordenação robótica#ESR. Helder 12h51min de 19 de agosto de 2013 (UTC)Responder
Ver também Wikipédia:Filtro de edições/Solicitações#Conta confirmada ou autorrevisor.
50 edições pq era o valor anterior. Poderia também colocar 300 edições, que é o necessário pro direito a voto, ou 100, que é o valor antigo do direito a voto. Fora esses 3, qualquer outro valor é 'aleatório'. Mas pra muitos casos dos filtros que não são vandalismo explícito / intencional, apenas ser confirmado é pouco. Rjclaudio msg 14h01min de 19 de agosto de 2013 (UTC)Responder

Falsos positivos

Tenho notado que o filtro é acionado por qualquer edição em que haja remoção de conteúdo em artigos marcados para ER, e não só quando a predefinição {{ER}} é removida deles. Será que existe alguma forma de corrigir isso?--Leon saudanha (discussão) 16h30min de 24 de abril de 2015 (UTC)Responder

@Leon saudanha: Não vi essa situação em nenhum dos registros deste filtro, e o código dele também não parece ter qualquer erro que permita a ocorrência de tais falsos positivos. Poderia fornecer o link para o log onde percebeu o problema? Acho mais fácil que esse filtro tenha problemas de falsos negativos do tipo "inserção de X quando já tem Y"... Helder 19h13min de 28 de abril de 2015 (UTC)Responder
@Helder Eu vi isso várias vezes, só não forneço o log por que não lembro :P, mas da próxima vez que eu ver um, eu te mostro...--Leon saudanha (discussão) 22h48min de 28 de abril de 2015 (UTC)Responder
@Helder enfim entendi esse "falso positivo": é que o filtro 1 etiqueta edições como "retirada da marca de eliminação" mesmo que um usuário que tentou retirar a marcação desista de fazer isso, ao receber o aviso que o filtro manda, e faça outra edição qualquer na página. Mas será q isso era realmente para acontecer?--Leon saudanha (discussão) 15h49min de 27 de maio de 2015 (UTC)Responder
@Leon saudanha: tem um exemplo? Helder 16h14min de 27 de maio de 2015 (UTC)Responder
@Helder sim. Veja o caso do artigo Lygia Moura Rassi. Embora o usuário tenha, de fato, tentado retirar a marcação de ER durante a edição em questão, como indica esse registro do filtro de edições ele desistiu de isso após ter sido avisado pelo filtro, como pode ser visto nesse diff. Porém, como você pode ver pelo diff, mesmo assim a edição foi etiquetada como "retirada de marcação de eliminação".--Leon saudanha (discussão) 16h36min de 27 de maio de 2015 (UTC)Responder
Reportei no Phabricator: phab:T100530. Helder 16h50min de 27 de maio de 2015 (UTC)Responder
@Helder certo, vou acompanhar. Faz quase um ano que percebi esse bug, e já o vi ocorrer várias vezes. Provávelmente, ele existe desde a criação do filtro, e ninguém tinha se dado conta dele.--Leon saudanha (discussão) 17h28min de 27 de maio de 2015 (UTC)Responder
@Helder mais um exemplo do bug, veja aqui e aqui--Leon saudanha (discussão) 21h34min de 21 de agosto de 2015 (UTC)Responder

Filtro 8 - Remoção de referências

Remoção de referências
Status
Etiquetando ("Remoção de referências")
Manutenção
Baixa
Resumo
Filtro aparentemente operacional sem histórico de falsos positivos. Possivelmente pode ser desmembrado em outro para quebra de referências que pode ser avisado. Não é recomendado mudá-lo para modo aviso análise prévia de falsos positivos.
Ferramentas
Falsos positivos
Total 13
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
Requer revisão/atualização

Filtro 20 - Remoção de todas as cats

Remoção de todas as categorias
Status
Avisando e etiquetando
Manutenção
Baixa, apenas se for modificado os parâmetros do filtro 3
Resumo
Remoção de todas as predefinições do artigo, desde que a remoção de conteúdo não seja grande (filtro de remoção de conteúdo)
Ferramentas
Falsos positivos
Total 4
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

A versão anglófona (en:Special:AbuseFilter/132) foi otimizado posteriormente a nossa última atualização. Seria bom atualizar? OTAVIO1981 (discussão) 17h16min de 24 de junho de 2013 (UTC)Responder

Sugiro atualizar para a seguinte versão (baseada na versão atual da wiki em inglês, traduzindo o que achei necessário):
article_namespace == 0 &
!"autoconfirmed" in user_groups &
edit_delta > -2000 &
lcase(removed_lines) rlike "\[\[\w?category" &
!lcase(new_wikitext) rlike "\[\[\w?category|#\w?redire(ct|cionamento)|esboço\w?}}|{{\w?sem ?cat|{{\w?d[ei]sambig" &
new_size > 40
Não achei equivalentes para as predefinições db-attack, db-g10 e wi, então removi estas excessões. O "new_size > 20" foi colocado pelo Rjclaudio, mas não sei se precisamos disso.
Helder 18h47min de 24 de junho de 2013 (UTC)Responder
Também não achei os equivalentes se é que existem. Sobre o parâmetro "new_size", se eu estou entendendo alguma coisa, é para não entrar em conflito com um filtro de branqueamento de página. Mas a pergunta é: existe conflito de filtros? OTAVIO1981 (discussão) 18h59min de 24 de junho de 2013 (UTC)Responder
Não exatamente: o que pode ocorrer é que ambos detectem uma mesma edição, e neste caso acho que só estaríamos desperdiçando recursos, por submeter um mesmo problema a duas análises diferentes feitas pela extensão AbuseFilter. Helder 19h09min de 24 de junho de 2013 (UTC)Responder
Então pode subir este parâmetro para 40, equiparando com o filtro de branqueamento que também está desatualizado.OTAVIO1981 (discussão) 19h14min de 24 de junho de 2013 (UTC)Responder

edit_delta

O valor do edit_delta está em >-2000, e nos comentários a justificativa era para pular o filtro de remoção de conteúdo (valores da wiki.en). Como o nosso filtro de remoção usa edit_delta <-300, proponho seguirmos o mesmo valor para cá. Rjclaudio msg 13h28min de 4 de setembro de 2013 (UTC)Responder

Mudei para editdelta 300. Rjclaudio msg 13h15min de 12 de novembro de 2013 (UTC)Responder

Proposta de nova configuração

Este filtro está bem estabelecido e não precisamos mais testar o new_size>40 por "entrar em conflito" com o 66 pois não existe conflito entre filtros. E também não precisamos testar o edit_delta pois alguns vandalismos podem ser acréscimo de texto ou remoção de pouco texto junto com a categoria. Minha nova proposta de configuração é:

texto := '(?:\[\[Categoria:)';

(article_namespace == 0 | article_namespace == 102) &

! 'confirmed' in user_groups

& old_wikitext irlike texto

& !new_wikitext irlike texto

& !lcase(new_wikitext) contains "#redirec"

Testei com a regressão e continuar detectando os casos antigos.OTAVIO1981 (discussão) 15h39min de 12 de novembro de 2013 (UTC)Responder

Filtro 51 - Retirada de predefinição

Remoção de predefinição
Status
Etiquetando
Manutenção
Baixa, apenas com a modificação nas predefinições importantes e alteração nos parâmetros dos filtros relacionados
Resumo
Remoção de predefinições importantes para artigos, que geralmente não são removidas, desde que a remoção não gere um artigo mínimo (filtro de branqueamento) nem seja uma remoção significativa de conteúdo (filtro de remoção)
Ferramentas
Falsos positivos
Total 4
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
Buscar predefinições importantes, análise de possível falso-positivo para geocoordenadas e commonscat

Tem como melhorar esse filtro 51 (predefinições) para quando remove a Infocaixa, taxocaixa e outras predefinições do tipo que ficam no topo à direita? Geralmente não há motivo nenhum para remover essas predefinições inteiras, então quando fazem isso é provavelmente vandalismo, teria como configurar para impedir a ação em https://pt.wikipedia.org/wiki/Especial:Filtro_de_abusos/51 ? Vulcan (discussão) 21h10min de 12 de julho de 2013 (UTC)Responder

É preciso analisar o histórico e reportar os falsos positivos para ver se o filtro está funcionando bem para primeiramente passar ao modo avisar e posteriormente ao modo desautorizar.OTAVIO1981 (discussão) 21h22min de 12 de julho de 2013 (UTC)Responder

Pensei em remover as predefs da parte do fim e deixar só a remoção das predefs do topo, pq na maioria dos casos qnd se remove {Portal} ou {Defaultsort} e similares o usuário está removendo todo o conteúdo abaixo de um determinado ponto, e aí é detectado em outros filtros também (como remoção de todas as cats, ou remoção da seção de refs).

Ou então separar esse filtro em dois, predefs de topo e predefs de fim, e juntando as predefs de fim com as outras coisas, do tipo 'removeu 3 itens do tipo 'predef de fim' ou 'cat' ou 'referências' ou 'iw' e aí disparava o aviso, mas se só remover uma coisa (só uma predef, ou só uma cat) não dispararia pq tem chances da remoção estar correta. Rjclaudio msg 15h04min de 19 de julho de 2013 (UTC)Responder

Expandir as predefs do fim para incluir {Portal- (padrão antigo), {Caixa de sucessão} , {Bloco de navegação}. Rjclaudio msg 15h08min de 19 de julho de 2013 (UTC)Responder

Filtro 56 - Branqueamento por novo editor

Branqueamento por novo editor
Status
Desautorizando (aviso).
Manutenção
Média. Requer acompanhamento até 11/2013 pois em algumas situações o editor acrescenta pouca informação num artigo que é muito pequeno (exemplo). No futuro, o parâmetro new_size pode ser aumentado mediante evolução na quantidade de kb dos artigos mínimos.
Resumo
O filtro evoluiu de ação nenhuma até desautorizar num campo diversificado de opções ao incluir todas as contas, desconsiderar o parâmetro old_size (detectando assim todo tipo de redução) e desconsiderando se houve edição recente pelo editor (evitando o "vandalismo continuado").
Ferramentas
Falsos positivos
Total 7
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
indefinido

Ao me deparar com este vandalismo que não foi detectado pelo filtro 56 (<40 new_size era maior que 40) me ocorreu que este filtro ainda pode ser melhorado com o incremento do parâmetro new_size. Estava pensando que os parâmetros sendo trabalhados pelos filtros 66, 53 e 67 poderiam ser utilizados aqui. Ora, se artigos com menos de 40 bytes são avisados e etiquetados a mesma analogia se aplica aqui, isto é, converter um artigo com mais de 500 para menor que 40. Acho que podemos subir o valor de new_size para 50 quando o filtro 53 ser atualizado ou deixar este como está caso seja deixado no modo desautorizar o que estaria alinhado com o filtro 66. OTAVIO1981 (discussão) 12h49min de 30 de julho de 2013 (UTC)Responder

Acho que esse filtro é o mesmo que o filtro 03 - Conta nova removendo conteúdo, a diferença é que este tem menos exceções, e só funciona com remoção de mais de 460 bytes (o outro é pra 300 bytes) e só quando o artigo final é pequeno (o outro é pra qualquer tamanho final de artigo). Rjclaudio msg 17h39min de 14 de agosto de 2013 (UTC)Responder

Sim, concordo que os filtros são para a mesma coisa. O porém é que uma remoção de 300 bytes em um artigo de 90000 pode ser perfeitamente válida (vamos supor que fez uma revisão do texto e calhou de retirar 300 bytes) enquanto a redução para um tamanho em que já estamos desautorizando a criação (por não achar nada "aproveitável" tem toda a cara de vandalismo. Entendo que o caminho é o filtro 56 ficar no modo desautorizar, enquanto o 3 ainda dá o benefício da dúvida justamente por ignorar o tamanho final do artigo. Não me oponho, aplicar o mesmo edit_delta neste filtro 56, isto é, remoção de texto superior a 300 no qual o artigo final tem menos de 50 bytes (o 66 atual). Enfim, o ideal é analisar a fundo o filtro 3 para ver se a taxa de falso positivos é baixa. No momento, estou focado em outros filtros mas posso dar uma olhada amostral neste também.OTAVIO1981 (discussão) 20h50min de 14 de agosto de 2013 (UTC)Responder
Entendi a diferença, concordo então. Aumentei o new_size para 50 (igual ao PN mínima 1) e diminui o old_size para 350 (igual ao filtro 3 de remoção de conteúdo). Vou começar a analisar esse filtro para depois aumentarmos para impedimento. Rjclaudio msg 18h02min de 15 de agosto de 2013 (UTC)Responder
Analisei agora o que falta. Todos os últimos 500 registros do filtro foram corretos. Agora é esperar uns dias até acumular registros dos novos parametros.
Eu to pensando agora se não é melhor voltar o filtro pro parametro anterior e já mudar para impedimento (500 registros em 1 mes e meio, é suficiente) e criar um outro filtro para testarmos o novo parametro. E assim teriamos uma lista só com os registros com o novo parametro, sem misturar com os antigos, facilitando a análise.
Até pq estou pensando se não deviamos aumentar um pouco mais o new_size, pq diferente de um artigo novo, há uma grande remoção, então um <50 é pouco, queria testar com <80 (PN mínima com etiqueta), ou mesmo <100, <150 (PN mínima em teste). Rjclaudio msg 18h55min de 15 de agosto de 2013 (UTC)Responder
Concordo em passar o filtro para o modo desautorizar com os parâmetros antigos. Desde que passou para o modo avisar, foram feitos 78 salvamentos que foram posteriormente revertidos, representando 30% do conjunto de ações (avisar+salvar). Em relação a criar um novo filtro para aumentar o limite deste, concordo e como o filtro inicialmente só vai assinalar no registro acho que podemos testar com 150 e mudar eventualmente se houver muitos falsos positivos (o que duvido muito).OTAVIO1981 (discussão) 20h10min de 15 de agosto de 2013 (UTC)Responder
OTAVIO1981, o filtro 56 registrou 332 ações desde que passou a enviar avisos até o momento do seu comentário. Aparecem 73 "diff" na lista de registros, então são cerca de 22% (ou os 30% se referem a outra coisa?), apenas uma ação no domínio anexo.
Que versão anterior concorda em usar para impedir edições? Concordo em retornar para a versão de 9 de agosto de 2013 e ativar o impedimento das edições que forem detectadas.
Rjclaudio, entre os últimos 500 registros que citou, há o 1338948 que foi marcado como falso positivo. Helder 22h04min de 15 de agosto de 2013 (UTC)Responder
Feito, reverti pra edição do dia 9 que o Helder falou, passei o filtro para impedimento, e criei o Filtro 119, com new_size<150 e old_size>350. Rjclaudio msg 03h03min de 16 de agosto de 2013 (UTC)Responder
Helder, considerando os seus números foram 259 ações de aviso das quais 73 foram salvas. Isto dá algo em torno de 28% de ações convertidas. Avaliar a eficiência com 73/332 (número de salvamentos sobre o total) causa uma distorção quando o aviso torna-se ineficiente. Exemplo, 100 avisos com 100 salvamentos daria 100% de ações convertidas pelo meu cálculo, isto é, o aviso não valeu de nada e pelo seu cálculo seria 50% de conversão. Uma vez que o desejável é ter uma baixa taxa de salvamentos somente com o aviso, acho que meu cálculo reflete isto melhor.OTAVIO1981 (discussão) 11h52min de 16 de agosto de 2013 (UTC)Responder

Parâmetro de usuários

Porque usamos exceções para 'confirmed' in user_groups e user_name in article_recent_contributors. Existe alguma situação em que um admin vai converter qualquer conteúdo do domínio principal para algo menor do que 40 bytes? redirects não conta porque já são exceções. O editor ter contribuído recentemente no artigo dá direito de branqueá-lo? Este exemplo do Rjclaudio não foi detectado por conta disso e é uma "brecha" que pode ser explorada pelo vândalo. Supondo que ele faz uma alteração maléfica que não é detectada, pode tentar fazer outra edição maléfica que é apagar todas as informações e irá conseguir por conta da brecha. Quanto mais eu analiso o filtro percebo que os únicos parâmetros que interessam são os tamanhos iniciais e finais e as exceções de redirect e domínio principal. Vocês conseguem ilustram um possível artigo com menos de 40 bytes?OTAVIO1981 (discussão) 13h59min de 30 de agosto de 2013 (UTC)Responder

Concordo em remover essas exceções. A ideia do recent_contributors era o usuário adicionar conteúdo ao artigo, mas depois remover por algum motivo. Mas aí depois de remover o artigo teria menos de 40 bytes seria inútil, então errado, e deve ser evitado. No aviso poderia ser explicado pro usuário enviar para ER caso ele tenha sido o criador do artigo, pois novatos tendem a criar artigo e branquear depois ao invés de ER. Pro !confirmed, mesma coisa, sem situações que sirva um artigo com <40 bytes.
A ideia é aumentar esse valor, com os parametros do filtro de Branqueamento (2). Aí ainda seria válido? Lá já não há o !confirmed , então podiamos tirar daqui. Se formos tirar o recent_contributors, bom tirar logo por lá que ainda não tem nenhuma ação. Rjclaudio msg 14h10min de 30 de agosto de 2013 (UTC)Responder
Você mencionando ERs me fez pensar se não seriam exceções também. Principalmente se formos excluir o parâmetro confirmados. [ver exemplo que seria impedido. Tem alguns editores que apagam todo o texto e deixam só a TAG aí seriam impedidos. Até já falamos sobre isso que não é regulado ainda. Então para retirar estes dois parâmetros acho que deveríamos incluir exceções para ERs. Acho que podemos tirar o recente_contributors do 119 até para monitorar melhor as possibilidades a medida que formos ampliando os parâmetros. OTAVIO1981 (discussão) 14h47min de 30 de agosto de 2013 (UTC)Responder

Falsos positivos e a questão do parâmetro confirmed

Rjclaudio, novamente a questão do "vandalismo continuado" aqui que permite passar pelo filtro. Outro ponto: o filtro precisa ignorar quando é feita uma conversão de um texto numa desambiguação. Ontem ocorreu um falso positivo de uma desambiguação que foi editada e não foi possível reverter à versão original. Se fosse um vandalismo só seria possível removê-lo fazendo uma pequena edição (entrando para o article_recent_contributors) primeiro. Deste modo, a proposta que tenho para o filtro é:

action='edit'

& new_size < 150

& old_size > 350

& (article_namespace == 0 | article_namespace == 102)

& ! user_name in article_recent_contributors

& ! new_wikitext irlike '#redirec|disambig|{{(subst:)?(vda|er[\|}[0-9])'

Lembrando que estamos admitindo falsos positivos nos artigos menores que 150. Seria possível usar o AWB para remover as desambiguações desta lista? Acho que vale a pena um esforço de ampliá-los e retirar esta possibilidade de FP. OTAVIO1981 (discussão) 11h55min de 9 de setembro de 2013 (UTC)Responder

Fiz a diferença entre a lista de páginas que têm até 149 bytes (copiada da página especial que indicou) e de páginas que transcluem a Predefinição:Desambiguação e obtive estes 672 resultados (só não sei porque algumas desambiguações ainda ficaram na lista). Helder 19h55min de 5 de outubro de 2013 (UTC)Responder

Novato?

O texto seguinte foi movido de: Wikipédia Discussão:Filtro de edições#Novato?

Fui marcar este lixo como SPAM e fui impedido várias vezes por um dos filtros. Mensagem: Citação: "Esta ação foi identificada automaticamente como prejudicial, e foi consequentemente bloqueada. Se você crê que a sua edição foi construtiva, por favor informe-nos o que você estava a tentar fazer. Nós vamos analisar o problema e informar a causa, ou vamos corrigir o sistema para que tal mensagem não apareça novamente, se for necessário. Uma breve descrição da regra com a qual a sua ação coincidiu é: "Branqueamento por novo editor." Se não for pedir muito, um pouco de atenção e não colocar contas que tem milhares de edições na mesma vala comum de contas novas; não pretendo perder tempo pedindo autorização, para marcar lixo como lixo. Fabiano msg 03h22min de 11 de setembro de 2013 (UTC)Responder

O texto acima foi movido de: Wikipédia Discussão:Filtro de edições#Novato?

Proposta de nova configuração

O filtro de teste 119 está com poucos disparos então proponho a configuração abaixo que seria uma "fusão" e testar quantos são os casos de vandalismos continuados, isto é, o vandalo edita a página e depois branqueia.

action == 'edit'

& new_size < 150

& ( article_namespace == 0 | article_namespace == 102 )

& user_name in article_recent_contributors

& ! new_wikitext irlike '#redirec|{{(?:subst:|msg:)?(?:vda|er[\|}0-9]|d[ei]sambig)'

coments? OTAVIO1981 (discussão) 16h10min de 5 de outubro de 2013 (UTC)Responder

Se o filtro 119 estivesse com o código sugerido, ele não teria detectado certos registros (em que o usuário não estava entre os últimos editores da página), como por exemplo: 1415421, 1414896, 1414768, 1414034 e 1413773. Helder 20h47min de 5 de outubro de 2013 (UTC)Responder
Acho que não expliquei corretamente minha proposta. O 56 está utilizando o parâmetro "& !user_name in article_recent_contributors" então ele detecta estes casos que mencionou. A minha idéia aqui é medir quantos fazem o dito "vandalismo continuado" de forma complementar ao 56, isto é, lá detecta quem tentou branquear "de primeira" e aqui quem contribuiu e tentou branquear "de segunda". Caso não haja FP, a idéia então é simplesmente remover "& !user_name in article_recent_contributors" do 56 então ele detectara tanto de 1ª quanto de 2ª. Sds, OTAVIO1981 (discussão) 22h00min de 5 de outubro de 2013 (UTC)Responder
Testei a configuração acima (atualizada), que pretendo implementar no 56, com o script de regressão e todos os últimos 200 casos seriam disparados normalmente. Então, assumindo que todas os casos típicos de conversão de um texto grande para um pequeno estão cobertos (marcação de ER/VDA com branqueamento, reversão de vandalismo em desambiguações (notar que variei esta detecção pois temos 2 redirs)) acho que não haverá falsos-positivos. Vou acompanhar de perto por uns dias para ver se está tudo bem. OTAVIO1981 (discussão) 16h39min de 9 de outubro de 2013 (UTC)Responder
FeitoAtualizado! Aproveitei e melhorei o aviso. OTAVIO1981 (discussão) 17h07min de 9 de outubro de 2013 (UTC)Responder

Helder.wiki e Rjclaudio, o parâmetro new_size está alto e provocando alguns falsos positivos. Pode ocorrer do editor criar um artigo pequeno (new_size > 70) e fazer uma edição logo em seguida disparando este filtro como branqueando quando podia estar até aumentando o texto para algo entre 70 e 150. Se o limite mínimo para criação é 70, acho que estes filtros devem ficar alinhados porém este valor de 70 já precisa de um update e na outra discussão comento mais. Para o momento, gostaria de saber se vcs concordam com o alinhamento pois aí quando atualizar faço os 2 filtros. Sds, OTAVIO1981 (discussão) 14h20min de 18 de outubro de 2013 (UTC)Responder

Citação: podia estar até aumentando o texto - O & edit_delta < 0 não garante que há uma remoção de conteúdo? Estamos usando ele no filtro de teste 119, pq mesmo não usamos nesse filtro ativo de impedimento? Rjclaudio msg 14h30min de 18 de outubro de 2013 (UTC)Responder
Estamos usando o old_size >0 para garantir que o artigo já existia. Não tem problema de usar neste filtro também pelo que entendo.OTAVIO1981 (discussão) 16h49min de 18 de outubro de 2013 (UTC)Responder

Impedido de branquear página

O texto seguinte foi movido de: WP:Filtro de edições/Solicitações#Impedido de branquear página

Olá. Fui utilizar a nova marcação {{ESR-VDA}} na página Johnnas Oliva, porém o FastButtons falhou. Tentei manualmente e não salvou. Achei que fosse o link que havia citado, modifiquei e mesmo assim não passou. A explicação logo após isso era que por estar branqueando a página, possivelmente um vandalismo. Isso nunca aconteceu antes e creio que o filtro é aplicado somente a usuários não-confirmados e IPs. • L‘éditeur? 14h00min de 24 de outubro de 2016 (UTC)Responder

O filtro 56 se aplica a todos, sem exceção (ver WP:Filtro de edições/56#Parâmetro de usuários). Helder 15h06min de 24 de outubro de 2016 (UTC)Responder
@He7d3r: isso não acontecida com a atinga marcação de {{VDA}}. Já removi com ela muito mais bytes sem problema algum. Não há um tipo de restrição do filtro para algumas situações, como em marcações de eliminação? • L‘éditeur? 15h37min de 24 de outubro de 2016 (UTC)Responder
Sim, o filtro teria que levar em conta no mínimo essa predefinição, pois ela deve apagar todo o conteúdo da página, já que VDA não pode permanecer de jeito nenhum. !Silent (discussão) 15h41min de 24 de outubro de 2016 (UTC)Responder
O texto acima foi movido de: WP:Filtro de edições/Solicitações#Impedido de branquear página
Na verdade, quem propõe eliminação semirrápida não deve apagar o conteúdo do artigo, mas sim adicionar a predefinição no início da página. Então acredito que a configuração atual do filtro esteja correta. Helder 17h44min de 24 de outubro de 2016 (UTC)Responder
@He7d3r: houve um consenso aqui em extinguir a atinga marcação de {{VDA}} e incluí-la no sistema de ESR, criando então a {{ESR-VDA}}. Todo conteúdo que violar os direitos autorais deve ser removido, e é isso que tanto a marcação antiga quanto a nova fazem. No entanto, o filtro só começou a barrar com o novo template. • L‘éditeur? 18h20min de 24 de outubro de 2016 (UTC)Responder
Exato. VDA é VDA e não deve permanecer na página. O que essa predefinição faz é exatamente o mesmo que as outras que foram fundidas a ela faziam. !Silent (discussão) 18h33min de 24 de outubro de 2016 (UTC)Responder
Então também falta atualizar a página da política e a documentação da predefinição, pois nenhuma delas menciona essa remoção... Helder 19h44min de 24 de outubro de 2016 (UTC)Responder
Em WP:VDA é mencionado que "Se todo o conteúdo de uma página for suspeito de infração de direito de autor, então o conteúdo do artigo deve ser substituído pela nota padrão {{VDA}}". !Silent (discussão) 19h48min de 24 de outubro de 2016 (UTC)Responder
Se entendi bem a proposta aprovada na Esplanada, passamos a ter duas ações independentes:
  • VDA flagrante, isto é, inequívoco, provado: ER (regra 13), que resulta em eliminação imediata
  • VDA suspeito, isto é, uma desconfiança para a qual não existe prova explícita: ESR-VDA, que resulta em uma espera de prova de que não é VDA ou solicitação de permissão à OTRS.
Assim, indicação para ESR deve, sim permanecer na página, uma vez que a possível VDA é apenas uma suspeita, não algo inequívoco. Kleiner msg 19h49min de 24 de outubro de 2016 (UTC)Responder
Não somente para casos suspeitos, como de confirmados. Porém, nem todos os casos confirmados são casos de ER#13 devido a possibilidade de OTRS. • L‘éditeur? 19h52min de 24 de outubro de 2016 (UTC)Responder
??? Se o VDA é confirmado, o que faz alguém deixar de usar ER pra usar ESR? Como assim, possibilidade de OTRS para VDA confirmado? Kleiner msg 19h56min de 24 de outubro de 2016 (UTC)Responder
Textos VDA potencialmente enciclopédicos podem ser mantidos caso o autor permita. Leia mais em WP:OTRS. • L‘éditeur? 20h00min de 24 de outubro de 2016 (UTC)Responder
hahaha, amigo, leia WP:DA. Se o autor permitiu, segundo a licença aceita aqui, não é VDA, não há violação. Não existe VDA mantida, se foi mantida é porque não é mais Violação de Direitos Autorais. Outra coisa, não existe "possibilidade de OTRS". Se foi feito um pedido à OTRS, tem que esperar o resultado do pedido, não é caso de eliminação. Se não foi feito pedido algum, não tem porque deixar de marcar ER pra marcar ESR, esperar um pedido que provavelente nunca virá. Kleiner msg 20h14min de 24 de outubro de 2016 (UTC)Responder
Me referia à página da política de eliminação semirrápida que citei acima. Helder 20h07min de 24 de outubro de 2016 (UTC)Responder

A questão me parece muito simples:

  • VDA provado sem pedido à OTRS: ER (branqueando ou não, não importa).
  • Suspeita de VDA sem pedido à OTRS: ESR sem branqueamento.
  • VDA provado ou suspeito com OTRS em andamento: ESR com prorrogação de até 15 dias para esperar o resultado do ticket, também sem branqueamento.

Kleiner msg 20h18min de 24 de outubro de 2016 (UTC)Responder

Não percebo seus motivos de graça. Somente pode averiguar se há pedidos de OTRS em aberto os seus voluntários. Nós, meros editores da Wikipédia, temos apenas de esperar eles emitirem o ticket. Não temos bola de cristal. A marcação antiga de VDA dava 30 dias (com o conteúdo removido) para esperar o OTRS. O consenso foi integrá-lo a ESR e diminuir esse tempo que era exagerado. Talvez esteja estranhando o processo por não estar familiarizado com a politica de eliminação nem ter participado da discussão. • L‘éditeur? 20h34min de 24 de outubro de 2016 (UTC)Responder
Acho engraçado esse seu paternalismo de vir colocar link pra documentação como quem diz: "vá aprender mais". Eu já encontrava, discutia, marcava e apagava VDA antes mesmo de você ter conta aqui. Se você tivesse lido mais em WP:OTRS, veria que não é preciso ter bola de cristal; existe predef pra marcar páginas com ticket pendente (algo colocado por quem fez o pedido ou por quem assumiu o ticket). A proposta na Esplanada foi simplificar o processo de eliminação de VDA que era conflitante, já que não havia padronização entre a ER13 e as 3 ou 4 marcações de VDA distintas, cada uma com uma documentação. O consenso alcançado na esplanada (que já li e reli, não preciso participar da discussão pra ler seu resultado) foi exatamente o que já expus e repito novamente: VDA provado >> ER13, VDA suspeito >> ESR-VDA. A dúvida que está causando essa discussão é tão somente se o texto em ESR-VDA deve ser removido ou deixado no artigo. Eu argumento que deve ser mantido, já que suspeita não é prova, e temos que assumir a boa-fé sempre que possível. Kleiner msg 23h14min de 24 de outubro de 2016 (UTC)Responder
Já marcava antes de eu ter conta? Ora, as coisas mudaram muito de lá pra cá e aparentemente andas sumido da área pois não o vejo. Além disso, parece também não saber o que é um VDA impróprio da regra ER#13. Então você quer eliminar um VDA antes mesmo de dar a opotunidade do autor enviar para OTRS? Pois este não é procedimento atual, se quiser mudar, fique livre a criar uma proposta na esplanada. • L‘éditeur? 23h25min de 24 de outubro de 2016 (UTC)Responder
Você quer qualquer outra coisa, menos discutir o assunto chave aqui (apagar ou não texto suspeito de VDA sob ESR). O Silent fez uma nova proposta onde, explicita e inequivocamente propôs usar ESR-VDA pra casos suspeitos e ER13 pra casos de VDA confirmados, proposta essa aprovada por MachoCarioca, Bia, Luk3, Darwin, Stegop, Papa Christus, Wikifer e, vejam só, até um usuário chamado "L'editeur" concordou mais de uma vez. Ponto final. Querer negar isso é querer negar que 1+1=2. Nunca disse que antigamente se fazia assim ou assado (até porque, se procurar todo meu histórico, jamais encontrará edição minha usando ER13), estou falando do agora, do decidido por consenso na Esplanada (por você mesmo e outros, sem eu ter metido o bedelho em nada). Kleiner msg 00h24min de 25 de outubro de 2016 (UTC)Responder
O assunto é o mesmo ainda: esse filtro está impedindo {{ESR-VDA}} de funcionar corretamente. Será que tive um lapso enorme ou ainda não entendeu a proposta? Jamais suspeita de VDA deve ser removida de qualquer artigo sem que apresente evidências concretas da suspeit). A {{ESR-VDA}} remove justamente porque são VDAS confirmados e deu-se o periodo de 7 dias para que o autor envie OTRS (E adivinha quem criou o template assim? Ele mesmo! O proponente !Silent). Após o ticket de em andamento, a marcação pode até ser removida. Mas parece somente está contra as novas regras e sequer participou da discussão da esplanada. • L‘éditeur? 00h36min de 25 de outubro de 2016 (UTC)Responder
Na verdade, como pode ver no teste da predef e na página da proposta, o que se ficou decidido foi justamente o que Kleiner disse: ER#13 para casos flagrantes e ESR-VDA para casos suspeitos. Então, esclarecida a dúvida, farei com que o FastButtons não apague mais o conteúdo inteiro da página. !Silent (discussão) 01h10min de 25 de outubro de 2016 (UTC)Responder

Filtro 62 - Remoção seção ref

Apesar de poucas ocorrências, esse filtro me parece bem objetivo e pouca chance de falso-positivo, poderiamos melhorá-lo pra depois mudar para desautorizar.

Rjclaudio msg 17h53min de 29 de julho de 2013 (UTC)Responder

Acho que há um falso-positivo aí: remover seção de ref quando o artigo tem notas e seção de notas mas nenhuma ref (ou seja, <ref group=notas> ... </ref> está sendo contado como referências, mas é uma nota). Não cheguei a ver nenhum caso desses, mas em teoria é possível. Não achei um modo fácil de arrumar isso. Rjclaudio msg 14h20min de 12 de novembro de 2013 (UTC)Responder

Remoção de conteúdo - domínio não-conteúdo

Nossos filtros de remoção de conteúdo só estão ativos para o domínio principal+anexo, por que? Não faltam exemplos disso em páginas do domínio Wikipédia e Ajuda e em páginas de discussão, especialmente em páginas de pedidos a adms (bloqueio / proteção). Há poucos motivos para um não-autorrevisor remover muito conteúdo de páginas do domínio WP e Ajuda, e talvez até de páginas de discussão (já que raramente se arquiva, mas podemos colocar exceção caso tenha '/Arquivo' no corpo da página). Rjclaudio msg 15h19min de 10 de julho de 2013 (UTC)Responder

Filtros sobre strings

Filtro 5 - Uso excessivo de maiúsculas

Uso excessivo de maiúsculas
Status
Impedindo
Manutenção
Nula
Resumo
Adição de linhas que tenham apenas letras maiúsculas e símbolos, sem letras minúsculas, e o total de caracteres adicionados seja maior que 12.
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

O filtro não detecta caracteres como !@#$%¨&*()?: o que diminui o seu potencial. Sugiro aprimorar a string de REGEX para incluir, pelo menos !@*=+-? que são de uso comum no wikicódigo. Algo como ^[A-Z0-9\s\pP!@*=+-?]*?[A-Z]{5}[A-Z0-9\s\pP]*$ deve resolver segundo o rubular.OTAVIO1981 (discussão) 12h37min de 24 de junho de 2013 (UTC)Responder

P.S.:Opcionalmente, a ^[A-Z0-9\s\pP\S]*?[A-Z]{5}[A-Z0-9\s\pP\S]*$ funciona para um número mais amplo de caracteres.OTAVIO1981 (discussão) 13h05min de 24 de junho de 2013 (UTC)Responder
Para facilitar a análise, a regex atual, idêntica a uma usada na wiki em inglês, é esta: ^[A-Z0-9\s\pP]*?[A-Z]{5}[A-Z0-9\s\pP]*$.
Conforme Unicode Character Properties,

\p{P} or \p{Punctuation}: any kind of punctuation character.

O rubular pode estar sujeito a limitações do JavaScript ou algo assim, então fui conferir direto na b:Especial:Filtro de abusos/tools, e os únicos caracteres da sua lista que não são detectados por [A-Z0-9\s\pP] são "+" e "=" (caracteres que, por sinal, aparecem no código wiki das tabelas e no título das seções). Então sua proposta se resumiria à inclusão de "+" e "=", mas por enquanto não acho que seja boa ideia, pois acho que pode dar falsos positivos. O que o filtro deveria detectar e atualmente não detecta? (teria algum link de exemplo?)
Eu preferiria que fosse atualizado para a versão atual do en:Special:AbuseFilter/50, pois as condições usadas no nosso filtro 5 foram copiadas (e permanecem idênticas às) da versão de abril de 2009, que já recebeu várias correções desde então. Helder 13h28min de 24 de junho de 2013 (UTC)Responder
Sim, a edição que não foi filtrada foi esta conforme este registro. O rubular indicou que o filtro atual não é capaz de detectar este vandalismo pela inserção do asterisco no início. Se tivesse uma interrogação, também não seria detectado. Não consegui usar o recurso do books para ver como fica. Comparando com a anglófona, lá o vandalismo seria detectado pelo parâmetro extra !(removed_lines rlike "[A-Z0-9\s\pP]*?[A-Z]{5}[A-Z0-9\s\pP]") que aqui não tem. Atualizar o código me parece suficiente.OTAVIO1981 (discussão) 13h59min de 24 de junho de 2013 (UTC)Responder
Não foi por isso. Conforme a b:Especial:Filtro de abusos/test, um filtro que tenha o código
added_lines rlike "^[A-Z0-9\s\pP]*?[A-Z]{5}[A-Z0-9\s\pP]*$"
detecta esta edição, mas um que tenha o código
length(added_lines) > 15
não, o que acho muito estranho. Helder 14h53min de 24 de junho de 2013 (UTC)Responder
Postei um exemplo (sem conteúdo ofensivo) no bugzilla:50107. Helder 15h42min de 24 de junho de 2013 (UTC)Responder
Outro exemplo que não foi pego. OTAVIO1981 (discussão) 18h34min de 24 de junho de 2013 (UTC)Responder
Neste caso, também foi culpa do teste "length(added_lines) > 15". A edição é detectada normalmente se esse código é removido, ou trocado por length(added_lines) = 1. Helder 11h48min de 3 de julho de 2013 (UTC)Responder
outro exemplo que não foi detectado.OTAVIO1981 (discussão) 11h38min de 22 de julho de 2013 (UTC)Responder
A expressão regular foi escolhida de modo que só detecte edições em que a "added_lines" inteira não tenha uma letra minúscula sequer (compare [1] e [2]), provavelmente para evitar falsos positivos. Helder 12h46min de 22 de julho de 2013 (UTC)Responder

Olhei as últimas 100 edições (de fevereiro pra frente) e só vi 2 falso-positivos: Redirecionamento (só tinha exceção para Redirect, já arrumei), e wikificação (parcial) de texto já existente que era todo em maiúscula. Pra esse segundo caso, acho q podemos colocar uma exceção pros casos das linhas removidas terem maiúsculas em excesso. Diminui um pouco o falso-positivo, e não acho que deixará de detectar nada de significativo. Proponho mudar tb para desautorizar a edição. Rjclaudio msg 18h07min de 10 de julho de 2013 (UTC)Responder

Modifiquei novamente para deixá-lo mais parecido com o original da wiki em inglês (agora o problema das maiúsculas no trecho removido não deverá mais ocorrer). Helder 18h55min de 10 de julho de 2013 (UTC)Responder

Avaliei 150 registros, de hoje até o dia 15 de julho, e os únicos possíveis falso-positivos são itens em uma lista de obras, para uma obra que é toda em maiúscula. Porém os casos que vi, a obra na verdade era em minúscula, e escrever em maiúscula estava errado. Há algum modo de pesquisar quais nossos artigos que a simples inclusão dele na lista dispararia o filtro? Se quiserem mais preciso, excluir da análise as linhas que começam com * (item de lista). Mas mesmo tendo esses raros casos, eu acho que vale a pena mudar para impedir a edição. Rjclaudio msg 16h54min de 29 de julho de 2013 (UTC)Responder

Agora que eu vi, teve 200 registros em 20 dias (desde a alteração do dia 10), e antes disso eram 200 registros em 6 meses (desde o início do ano). O filtro mudou tanto assim? Rjclaudio msg 18h03min de 29 de julho de 2013 (UTC)Responder
Com o meu olhar leigo, só vi remoção de parênteses e diferenciação no método de detectar Redirs mas felizmente o filtro me parece funcionar corretamente.OTAVIO1981 (discussão) 16h49min de 30 de julho de 2013 (UTC)Responder
Sim, mudou!
A alteração mais significativa foi a troca de
length(added_lines) > 15
por
length(rmwhitespace(added_lines)) > 12
principalmente levando em conta o bugzilla:50107, e o fato de que a versão anterior não convertia added_lines para uma string ante de verificar o tamanho, então ele só detectava edições em que apareciam mais de 15 sinais de igual (+) no lado direito do dif (nesta edição por exemplo, length(added_lines) === 49), o que não é muito comum. Helder 21h34min de 4 de agosto de 2013 (UTC)Responder

Fiz uma nova verificação com os registros salvos desde o dia 15 e alguns impedidos e não houve falsos positivos. Admito que existe a possibilidade dos falsos positivos que o Cláudio mencionou em listas mas neste caso a recomendação seria converter tudo para minúsculas e não deixar as maiúsculas. Portanto, de modo a possibilitar que o filtro passe ao modo impedimento, proponho um aviso personalizado para esta questão em específico:

Atenção: o sistema identificou automaticamente que a edição adicionou uma quantidade excessiva de caracteres em caixa alta ou maiúsculas, geralmente significando erros na edição.

Caso seja uma edição de boa-fé, veja o nosso guia de edição. Ou mais especificamente, para o caso a seguir:

  • Ao adicionar itens em uma lista que contém entradas com caixa alta, por favor rescreva todas as entradas utilizando minúsculas para poder gravar sua edição. Obrigado!

Caso acredite que tenha resolvido o problema mas ainda assim não conseguiu salvar a edição, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Uma breve descrição da regra de abuso com a qual a sua acção coincidiu é: $1

O que acham?OTAVIO1981 (discussão) 19h16min de 23 de agosto de 2013 (UTC)Responder

Concordo, o aviso está bom. São mesmo poucos casos (se aparecer algum), então não é impedimento o suficiente. Mudei o aviso e o filtro, e retirei a etiqueta por não ser mais necessária. Rjclaudio msg 15h24min de 25 de agosto de 2013 (UTC)Responder

O added_lines está com >12, o número foi escolhido "aleatoriamente" né? Vale testar para valores mais baixos? Rjclaudio msg 15h25min de 25 de agosto de 2013 (UTC)Responder

Acho possível que valores menores causem falsos positivos com siglas, mas nada nos impede de criarmos um filtro apenas para registrar essas ocorrências com valores menores, para confirmar ou refutar essa hipótese... Helder 15h40min de 25 de agosto de 2013 (UTC)Responder
Fiquei curioso e fui pesquisar um pouco pela net. Siglas maiores que 6 e 8 foram raras e a maior que encontrei foi ARISTOTELES. Acho que não tem necessidade de criar o filtro por enquanto. Talvez inverter a lógica e analisar a frequência dos casos que estão passando para ver se vale a pena reduzir.OTAVIO1981 (discussão) 19h55min de 26 de agosto de 2013 (UTC)Responder

Filtro 17 - Espaços excessivos

Espaços excessivos
Status
Etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 19
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Acho que podemos mudar ao menos para aviso. Colocaria três exceções:

  • Edição no domínio Usuário, muito usada para testes, e na própria PU a pessoa usa tanto espaço quanto quiser. ( Feito)
  • Espaço para facilitar a leitura do código-fonte em tabelas (1362676) e infobox (falta exemplo). -> podemos colocar exceção para |!= após / antes da sequência de espaços. ( Feito)
  • Registro de abusos/1362173 - subst em {{páginas curtas}} -> exceção também (ver se tem link para Especial:Páginas curtas)? Como ficou as desambigs nas páginas especiais, já conseguiram filtrar? Se sim acho até que podemos acabar com essa predef, perdeu boa parte da função. ( Feito)

E no aviso, instruções para edições de boa-fé por erro de formatação: parágrafo (1361568), texto destacado / subtítulo (1361535), tabela (1361185) - algo como "para fazer um parágrafo, use duas quebras de linha, para destaque, use ''' para negrito ou == para seção. Para mais ajuda, consulte xxx" No caso, uma página de ajuda mais específica para quem vem desse filtro, com essas três situações que falei.

Rjclaudio msg 17h36min de 29 de julho de 2013 (UTC)Responder

Sobre as páginas especiais e as desambiguações, estaria se referindo ao (ainda não resolvido) bugzilla:51110 ou a algum outro? Se não estiver informado no Bugzilla, seria bom criar um pedido lá... O que houve recentemente foi a instalação da mw:Extension:Disambiguator (bugzilla:50174). De qualquer modo, isso deveria ser discutido em uma outra página, para não desviarmos muito do assunto. Helder 18h53min de 10 de agosto de 2013 (UTC)Responder

Aviso

Sugestão pro texto do aviso.

Atenção: o sistema identificou automaticamente que a edição adicionou uma quantidade excessiva de espaços em branco, geralmente significando erros na edição.

Caso seja uma edição de boa-fé, veja o nosso guia de edição. Ou mais especificamente, para os casos a seguir:

Se considera que não houve erros na edição, pode pressionar novamente o botão "Gravar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Rjclaudio msg 16h10min de 9 de agosto de 2013 (UTC)Responder

Ordem das operações

Reparou que o filtro não dispara desde o dia 29 tendo sido atualizado no dia 30? Tô achando estranho. Se puder conferir as MR com o código antigo para confirmar que o filtro não está quebrado, seria bom.OTAVIO1981 (discussão) 16h43min de 9 de agosto de 2013 (UTC)Responder

Não tinha reparado. Vendo as alterações não deveria ter quebrado nada. Como faz para conferir isso? Pelo Especial:Filtro de abusos/test? Ali só aparece as últimas 100 edições feitas, e por ali nenhuma edição dispararia o filtro antigo. Rjclaudio msg 16h54min de 9 de agosto de 2013 (UTC)Responder
Testei agora de novo, só um disparo pelo filtro antigo, mas que não deveria ser reconhecido (e não é reconhecido no filtro atual). Esse, por espaçamento antes de campo de predef, algo muito comum em infobox. Rjclaudio msg 12h12min de 10 de agosto de 2013 (UTC)Responder
Eu fiz um pedido no Bugzilla, para que aumentem o número de edições para 500. Helder 20h15min de 19 de agosto de 2013 (UTC)Responder

Passei o filtro para modo aviso, criando o aviso com o texto acima. Rjclaudio msg 19h19min de 12 de agosto de 2013 (UTC)Responder

O filtro não voltou a disparar portanto insisto que tem algo errado. Acredito que o problema seja em "!article_namespace == 2" que deveria ser "! article_namespace == 2" conforme é o padrão que observei em outros filtros.OTAVIO1981 (discussão) 14h33min de 19 de agosto de 2013 (UTC)Responder

o espaço entre o ! e article_namespace é dispensável. Bem, não encontrei nenhum erro no filtro, mas como está a um bom tempo (20 dias) sem nenhum registro, voltei para a versão de 17jul, antes da alteração de 29jul q colocou a exceção pra PU. Se pegar alguma coisa, vemos se foi correto ou não, e comparamos se a versão que estávamos usando detectaria ou não a edição. Rjclaudio msg 15h19min de 19 de agosto de 2013 (UTC)Responder
O filtro voltou a disparar, vou incluí-lo no meu acompanhamento diário.OTAVIO1981 (discussão) 16h48min de 19 de agosto de 2013 (UTC)Responder
Não é que vc estava certo? Achei o erro, faltava parenteses. Como a comparação é com == , precisa de parenteses quando se testa a negação dele, diferente da comparação por rlike, contains e outros. Voltei a versão que estavamos usando, corrigi esse erro, testei o filtro nas três edições salvas, e funcionou. Vamos ver como está. Rjclaudio msg 17h56min de 19 de agosto de 2013 (UTC)Responder
Eu havia colocado mais detalhes sobre uma situação análoga em outra página: WP:Filtro de edições/117#Ordem das operações. Para negar o teste "article_namespace == 2" pode-se economizar condições usando "article_namespace != 2" em vez de "! (article_namespace == 2)". Helder 20h15min de 19 de agosto de 2013 (UTC)Responder

Espaços no início de parágrafo

O Otavio mencionou na análise de um dos registros que os espaços no início de parágrafo podem ser de boa fé. Eu concordo, e imagino que na maioria das vezes é de boa fé mesmo. Quando esbocei o #Aviso acima até coloquei os parágrafos como um dos erros de boa fé.

Mantemos esses espaços de parágrafo pro filtro detectar com essa menção no aviso, ou retira das regras de detecção?

Por mim mantém, pelo menos enquanto o filtro ficar só no aviso ao invés de impedir, pois certamente se o usuário salvar a edição ele logo depois vai ver que a edição não ficou como ele queria e vai editar para arrumar, então melhor já avisar a ele do erro. A menos que o aviso afaste o usuário, claro. Rjclaudio msg 15h32min de 25 de agosto de 2013 (UTC)Responder

OTAVIO1981, comentários? Como o filtro atualmente só está na etiqueta, qualquer coisa colocamos exceção para início de parágrafo para podermos aumentar para aviso. Rjclaudio msg 13h31min de 4 de setembro de 2013 (UTC)Responder
Feito a exceção. Rjclaudio msg 14h37min de 5 de setembro de 2013 (UTC)Responder
De acordo.OTAVIO1981 (discussão) 16h45min de 5 de setembro de 2013 (UTC)Responder

Filtro 18 - Conteúdo impróprio

Conteúdo ofensivo
Status
Desautorizando (mensagem padrão exibida).
Manutenção
Alta. Requer atualização constante através da pesquisa de edições revertidas ou reportadas em expressões problemáticas para incluir novos casos ou tendências.
Resumo
Existem 5 filtros de conteúdo ofensivo de modo a evitar uma desativação automática de filtros. Filtro 7 (verbos e expressões), filtro 18 (substantivos) e filtro 70 (corpo humano) estão no modo desautorizar e a priori não tem falsos positivos identificados. O filtro 68 (palavras com contexto não ofensivo) está configurado para avisar (aviso) e etiquetar (Conteúdo possivelmente ofensivo!) e não pode ser passado ao modo desautorizar pois lida com edições de boa fé. O filtro 112 (sem ação) é utilizado para testes no qual as palavras são movidas aos filtros específicos.
Ferramentas
Falsos positivos
Total 27
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
Reavaliar filtro 68 em função da baixa eficiência (~68%)


Falso positivo?

Alguém sabe explicar porque esta edição foi detectada por este filtro? Kleiner msg 18h56min de 3 de agosto de 2010 (UTC)Responder

Foi porque havia um "|" na lista de caracteres que seriam detectados após o "c": o código deveria ser apenas [uú], mas foi usado [u|ú]. Helder 19h30min de 14 de agosto de 2013 (UTC)Responder

Ponto na expressão regular

Favor editar o filtro 18 retirando o ponto final em "pu.ta", que está casando qualquer palavra iniciada com "pu" e terminando com "ta", como por exemplo, em Punta del Leste. Também será conveniente fazer o mesmo com os termos "p.o.r.r.a" e "m.e.r.d.a".

O ponto final em regex é um símbolo curinga. Se a intenção é realmente casar o próprio sinal de pontuação, deve-se indicá-lo colocando uam contrabarra, por exemplo: "m\.e\.r\.d\.a". Kleiner msg 14h48min de 18 de setembro de 2012 (UTC)Responder

(Já foi feito pelo Nelson Teixeira.) – Opraco (discussão), às 02h37min de 2 de janeiro de 2013 (UTC)Responder

Início e fim de página

Acredito que o referido filtro não detectou este e este pelo mesmo motivo que o tópico anterior não funcionava. Testei a string no rubular e ela não detecta a ofensa no final do parágrafo.OTAVIO1981 (discussão) 21h32min de 15 de julho de 2013 (UTC)Responder

Update: Dois casos 1348399 e 1349098 que poderão ser detectados se o filtro for atualizado conforme o tópico anterior.OTAVIO1981 (discussão) 21h36min de 15 de julho de 2013 (UTC)Responder
Modifiquei como no outro filtro. No entanto, todas essas edições continuam não sendo detectadas pois o filtro está configurado com "old_size > 0" (isto é, só testa páginas que já tinham algum conteúdo). Helder 22h00min de 15 de julho de 2013 (UTC) PS: sugeri uma nova melhoria na extensão ao testar isso: bugzilla:51402.Responder
PS2: a melhoria que sugeri já está disponível. Helder 18h54min de 5 de agosto de 2013 (UTC)Responder

Filtro 7

Quase todas as detecções daqui também são detectadas pelo 7. Só há duas diferenças:

  • (filtro 7) f[ou]d[eê][ru ] | (filtro 18) fod(?:ão|ões|a)|fudido
  • (filtro 7) v[ãaá][oi]\s+t[ei]

O primeiro pode ir pra 18, é tudo variação da mesma palavra. O segundo me parece possível de falso-positivo, não sei, vai que tem título de obra assim, por isso queria olhar mais eles, deixaria no 7 só esse segundo caso, pra eu analisar os registros.

Engraçado que uma hora juntamos o filtro, outra hora separamos, e quando menos percebemos, já está duplicado (duplicado = fundido mas separado). Se precisar separar, preferia separar com algum critério mais fácil de manter a separação dos termos, algo como "corpo humano (órgãos) para um filtro, o resto para outro". Rjclaudio msg 16h09min de 30 de agosto de 2013 (UTC)Responder

O Kleiner incluiu uma nota sobre desativação automática relacionada ao filtro 7. Concordo com a especificação como critério de inclusão de termos. Temos o filtro 70 que lida com uma parte do corpo humano. Não vi o código de lá mas poderíamos incorporar as outras variantes e partes do corpo. Pensei em separar uma categoria de ofensas relacionadas a verbos o que incluiria o "vai se" que fica por aqui. Acho que tem outros verbos a serem incluídos, também.OTAVIO1981 (discussão) 16h34min de 30 de agosto de 2013 (UTC)Responder
Pode ser, usamos o 70 para corpo humano, o 7 para as expressões ('vai se'), e o 18 como genérico. Rjclaudio msg 16h37min de 30 de agosto de 2013 (UTC)Responder

Outra coisa: os filtros só estão detectando edições em páginas existentes. A ideia era detectar em qualquer tipo de página (existente, ou criada). Precisa testar as expressões para as páginas criadas, ou podemos só remover o teste de página existente? Rjclaudio msg 16h37min de 30 de agosto de 2013 (UTC)Responder

Acho que pode remover pois ainda não consegui vir uma justificativa contrária. Pode testar o filtro sem este parâmetro contra as MR's e ver se dá algum galho?OTAVIO1981 (discussão) 16h56min de 30 de agosto de 2013 (UTC)Responder
O 7 seria para verbos? Aí colocariamos as (várias) conjugações verbais, ou só o radical? Rjclaudio msg 19h06min de 30 de agosto de 2013 (UTC)Responder
Não sei. Que tal colocarmos 3 verbos com o radical e só ampliar quando tivermos confiança que está funcionando bem?OTAVIO1981 (discussão) 23h44min de 30 de agosto de 2013 (UTC)Responder

Filtro 68

O filtro 68 só detecta se for no início do parágrafo e na forma "'\n'vocês são umas 'ofensa'". Todas as ofensas do 68 também são detectadas pelo 18, o 68 é mais restrito, e está em um nível menor (aviso). Proponho então desabilitar esse 68. Rjclaudio msg 16h09min de 30 de agosto de 2013 (UTC)Responder

Se todos os casos são detectados pelo 18 realmente não tem porque deixá-lo habilitado no momento.OTAVIO1981 (discussão) 16h35min de 30 de agosto de 2013 (UTC)Responder

Este filtro lida com uma situação peculiar de ter uma quantidade razoável falsos positivos que precisamos mensurar o impacto para tirar ou não determinada palavra. Minha proposta é a seguinte: edições de boa fé que foram etiquetadas são corretas. Edições de má fé que foram etiquetadas são incorretas. Edições de boa fé que não foram etiquetadas (parou no aviso) são incorretas. Edições de má fé que não foram etiquetadas são corretas. Em todos vamos sinalizar a palavra e se foi ofensivo ou não. Deste modo podemos montar uma base de emprego da palavra em cada contexto e o quanto é perdido de boas edições.OTAVIO1981 (discussão) 12h52min de 5 de setembro de 2013 (UTC)Responder
Melhor fazer com uma tabela para facilitar entendimento:
Tipo Ação Resultado Justificativa
boa fé Etiquetada positivo O filtro cumpriu seu papel de avisar e o editor prosseguiu.
boa fé Avisada(sem salvamento) falso positivo O filtro impediu uma edição boa.
má fé etiquetada falso positivo O filtro não impediu um vandalismo
má fé avisada (sem salvamento) positivo O filtro impediu um vandalismo

O que acham?OTAVIO1981 (discussão) 17h24min de 5 de setembro de 2013 (UTC)Responder

Prezados, acabei de fazer uma análise de 50 registros do filtro (salvos externamente para ganhar tempo) e eis o resultado: 25 edições de má fé pararam no aviso, 7 má fé etiquetaram, 3 boa fé pararam no aviso e 4 de boa fé etiqueram. Segundo meus cálculos a eficiência do filtro então é de aproximadamente 75%. Todavia, devemos levar em conta que muitas das edições de má fé podem ter sido impedidas por outros filtros. Como só perdemos 3 edições de boa fé de 7 vou analisar um pouco mais o filtro mas gostaria de saber se vocês tem idéias para reduzir a interferência dos outros filtros que desautorizam neste aqui.OTAVIO1981 (discussão) 20h02min de 11 de novembro de 2013 (UTC)Responder
Uma opção mais 'pesada' é colocar uma exceção pro filtro para as edições que tem palavras ofensivas. Ou seja, não disparar se a edição tiver qualquer uma das palavras do filtro 18 e 7 *(duplicar a regex deles). Algo similar ao que fizemos no filtro 113 na parte /* Não detectar ações detectadas por outros filtros */ . É útil quando se está testando o filtro, mas depois fica ruim de manter atualizado e deixa o filtro pesado 'desnecessariamente'. Rjclaudio msg 00h47min de 12 de novembro de 2013 (UTC)Responder

Reserva (marca)

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#Reserva (marca)

Estou tentando criar o conteúdo institucional da marca e diz estar com conteúdo ofensivo. Não pus nada ofensivo, pelo contrário, adicionei diversas referências. comentário não assinado de 186.229.64.132 (discussão • contrib) 19h50min de 25 de fevereiro de 2015 (UTC)Responder

Conteúdo institucional? Na Wikipédia? Isso provavelmente não é adequado ao escopo ao projeto...
Pelos registros do filtro para o IP em questão, o aviso que recebe deve ter sido causado pelo sobrenome do Luis Roberto. Helder 09h11min de 10 de março de 2015 (UTC)Responder

O texto acima foi movido de: Wikipédia:Filtro de edições/Solicitações#Reserva (marca)

Termo "pinto"

Notei certa taxa de falsos positivos envolvendo o termo "pinto", pois tal termo, apesar de poder ser tratado como ofensivo, é usado como sobrenome, será que há alguma maneira de amenizar isso?--Leon saudanha (discussão) 21h19min de 11 de abril de 2015 (UTC)Responder

Filtro 112

O filtro 112 tem os mesmos parâmetros que esse, só tem algumas outras expressões que estavam em teste. Mas já analisei todos os 300+ registros e não teve nenhum falso-positivo, por isso tinha aumentado logo aquele filtro para aviso. Proponho fundir o 112 aqui para que essas expressões passem para impedimento, e deixar o 112 desabilitado (por hora) para ser usado como testes para outras expressões. Rjclaudio msg 16h13min de 30 de agosto de 2013 (UTC)Responder

Concordo. Pensei em deixar o 112 para os casos em que existe real possibilidade de falsos positivos e após termos uma base concreta de quais são os falsos positivos decidir o que fazer (avisar ou não).OTAVIO1981 (discussão) 16h38min de 30 de agosto de 2013 (UTC)Responder

Filtro 112 quebrou!

Rjclaudio, esta alteração quebrou o filtro que não dispara desde ontem.OTAVIO1981 (discussão) 12h43min de 5 de setembro de 2013 (UTC)Responder

É, não entendi como usa essa função ccnorm. Só pedindo ajuda pro Helder. Rjclaudio msg 13h38min de 5 de setembro de 2013 (UTC)Responder
Rjclaudio, veja o comentário 5 no bug relacionado ao ccnorm. Talvez seja a solução. Se vc estiver on-line podemos fazer a alteração e simular algumas tentativas.OTAVIO1981 (discussão) 14h13min de 5 de setembro de 2013 (UTC)Responder
É isso que tentei fazer, mas ao invés de usar o contains usei o rlike pq tem uma expressão regular. Só que não deu. Rjclaudio msg 14h23min de 5 de setembro de 2013 (UTC)Responder
A ccnorm converte "|" para "1", mas o "|" é um caractere especial em expressões regulares, então a nova regex produzida pela ccnorm não funciona como a antiga.

──── Para poder comparar a regex com o resultado da aplicação de ccnorm às linhas adicionadas, seria preciso o código do filtro 18 teria que ser trocado por algo do seguinte tipo (não é muito legível, mas deve funcionar):


ofensas := '(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|^)(?:AR[O0]MBAD[AO0]|F[O0U]D(?:[I1ï]D[O0]|[Eê][RU]|A[O0]|õE5|A)|BA[I1ï]T[O0][L1]A|B[I1ï]CHA|PUTAR[I1ï]A|V[I1ï]AD(?:[O0]|A[O0]|[I1ï]NH[O0])?|GAYUCH[O0]|CAG(?:AR|[O0]NA|A[O0]|UE[I1ï]|A[L1]H(?:A[O0]|õE5))|PUT(?:[AO0]|[I1ï]NHA)|[O0]TAR[I1ï][O0]|FDP|MERD[EA]|B[O0]5T(?:[I1ï]NH)?A|P[O0]RA|PANE[L1]E[I1ï]?R[O0])5?(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|$)';

! 'confirmed' in user_groups
& ccnorm(rmdoubles(added_lines)) irlike ofensas
& ! ccnorm(rmdoubles(removed_lines)) irlike ofensas

Talvez também seja possível otimizar um pouco essa regex. Mas é bom testar com vários registros antes de implementar (pode-se usar aquele novo script para isso ) Helder 00h10min de 7 de outubro de 2013 (UTC)Responder

Foi exatamente isso que passei a tarde fazendo, Helder.wiki e funciona sim! esta regex pode ser otimizada sim pq quando aplicamos a ccnorm em added lines ele converte todos os LIOS ou lios em 1105 então a regex não precisa ter estas letras assim como caracteres especiais õãé.
(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|^)(?:ARR0MBAD[A0]|F[0U]D(?:[1]D0|[E][RU]|A0|OE5|A)|BA1T01A|B1CHA|PUTAR1A|V1AD(?:0|A0|1NH0)?|GAYUCH0|CAG(?:AR|0NA|A0|UE1|A1H(?:A0|OE5))|PUT(?:[A0]|1NHA)|0TAR10|FDP|MERD[EA]|B05T(?:1NH)?A|P0RRA|PANE1E1?R0)5?(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|$)
Usei tb o rmdoubles então não pega mais dígrafos. Vou usar o filtro 60 para os testes. talvez tenha FP em códigos hexadecimais. Vai saber, né?OTAVIO1981 (discussão) 00h39min de 7 de outubro de 2013 (UTC)Responder
[conflito de edições] OTAVIO1981, de acordo com o script de regressões, esse novo código que coloquei acima continuaria detectando cada um dos últimos 400 registros do filtro (ou seja, não pioraria o filtro). Note que troquei "RR" por "R" na regex. Helder 00h51min de 7 de outubro de 2013 (UTC)Responder

Helder.wiki, pode testar este código com uma regex sem as letras OLIS e as especias convertidas para O e E? Eu testei assim e também detectou.OTAVIO1981 (discussão) 00h59min de 7 de outubro de 2013 (UTC)Responder

O problema é justamente o que informei no bugzilla:27987bugzilla:25619#c7. Confira o resultado de ccnorm( 'óï' ) na Especial:Filtro de abusos/tools. Helder 01h10min de 7 de outubro de 2013 (UTC)Responder
Ah tá. Podemos deixar estes dois então enquanto não atualizam a tabela. E em relação ao LS? OTAVIO1981 (discussão) 01h39min de 7 de outubro de 2013 (UTC)Responder
Eu tinha colocado o link errado. Teste ccnorm( "ìíîïĩļǐīĭḷĿї!ľį₤ĺľḷĿΛЛљóòôöõǒōŏǫőόὸὀὁὄὂὅὃọ$śŝşšṣσ" ). Helder 12h38min de 7 de outubro de 2013 (UTC)Responder
Helder.wiki, não estou seguro que esta falta de conversão de caracteres seja uma deficiência significativa para nós porque são caracteres de pouquíssimo uso pela maioria dos nossos falantes. Destes caracteres o mais significativo é o "ó" que é de uso regular. Pensei melhor no assunto e acredito que podemos testar diretamente no filtro 18. Acho que devemos excluir o "P0RA" e tratar a ofensa no 60 pois a função converterá Porã em P0RA então teremos falsos positivos. O AR0BAD[0A] pode ficar pois não detectei possíveis falsos positivos. Depois vou avaliar o filtro 70 e 68 para ver se já podemos implementar ou se alguma palavra deve ser retirada devido a conversão do ccnorm com rmdoubles. OTAVIO1981 (discussão) 13h23min de 7 de outubro de 2013 (UTC)Responder
Talvez... Em todo caso, também poderíamos usar um código como o seguinte:

E := '[Eê]';
I := '[1ìíîïĩǐīĭį]';
L := '[1ļḷĿĺľḷĿ]';
O2 := '0óòôöõǒōŏǫőόὸὀὁὄὂὅὃọ';
O := '[' + O2 + ']';
S := '[5$śŝşšṣ]';
ofensas := '(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|^)(?:' +
'AR'+O+'MBAD[A'+O2+']|' +
'F['+O2+'U]D(?:'+I+'D'+O+'|'+E+'[RU]|A'+O+'|õ'+E+S+'|A)|' +
'BA'+I+'T'+O+L+'A|' +
'B'+I+'CHA|' +
'PUTAR'+I+'A|' +
'V'+I+'AD(?:'+O+'|A'+O+'|'+I+'NH'+O+')?|GAYUCH'+O+'|' +
'CAG(?:AR|'+O+'NA|A'+O+'|U'+E+I+'|A'+L+'H(?:A'+O+'|'+O+E+S+'))|' +
'PUT(?:[A'+O2+']|'+I+'NHA)|' +
O+'TAR'+I+O+'|' +
'FDP|' +
'M'+E+'RDA|' +
'B'+O+S+'T(?:'+I+'NH)?A|' +
'P'+O+'RA|' +
'PAN'+E+L+E+I+'?R'+O +
')'+S+'?(?:[^A-ZÁÀÂÃÇÉêÊẼíÍóóòôõÓÒÔÕQ̃ÚŰÜŨ01ïÏ5]|$)';

! 'confirmed' in user_groups
& ccnorm(rmdoubles(added_lines)) irlike ofensas
& ! ccnorm(rmdoubles(removed_lines)) irlike ofensas

(ele continua detectando os 400 últimos registros do filtro 18). Helder 13h45min de 7 de outubro de 2013 (UTC)Responder
Ficou mais legível mas não vai consumir muitas condições? OTAVIO1981 (discussão) 14h35min de 7 de outubro de 2013 (UTC)Responder
Bom, fiz um teste e a diferença entre declarar apenas uma variável "ofensas" e declarar tanto ela quanto as 6 variáveis auxiliares é que:
  • Com o código que está em uso, edições (por contas confirmadas ou não) consomem 4 condições;
  • Com o código acima, que usa 7 variáveis, edições por contas não confirmadas consomem 14 condições, e por contas confirmadas consomem 10.
  • Por outro lado, se mantivéssemos os ccnorm(rmdoubles(...))s mas utilizássemos apenas uma variável (menos legível, por não usar as variáveis auxiliares), edições por contas não confirmadas consumiriam 8 condições, e por contas confirmadas seriam 4;
A concatenação de strings não faz diferença, então poderíamos optar por não usar variáveis mas colocar strings separadas para cada palavra/variação (digamos uma por linha, como no exemplo acima). Ou ainda, podemos mudar a distribuição de condições consumidas (nas edições por usuários confirmados e não confirmados) utilizando parêntesis:

! 'confirmed' in user_groups
& (
  E := '[Eê]';
  (...)
  S := '[5$śŝşšṣ]';
  ofensas := (...);

      ccnorm(rmdoubles(added_lines)) irlike ofensas
  & ! ccnorm(rmdoubles(removed_lines)) irlike ofensas
)

Assim, as edições de usuários confirmados consumiriam 2 condições (em vez de 4), mas as dos demais usuários consumiriam 15 (em vez de 14). Helder 15h49min de 7 de outubro de 2013 (UTC)Responder
Acho melhor o código que consome menos condições (8 para NC e 4 para C). A legibilidade não chega a ser um problema mas será necessário documentar melhor o que estamos fazendo para que outros possam atualizar no futuro.OTAVIO1981 (discussão) 16h53min de 7 de outubro de 2013 (UTC)Responder
OTAVIO1981 Têm ocorrido falsos positivos com "Porã", como em Special:Diff/39685783. Helder.wiki (discussão) 22h07min de 28 de julho de 2014 (UTC)Responder
Helder.wiki, removi a palavra do filtro 18 e inclui no 70 a respectiva ofensa sem conversão ccnorm e rmdoubles.OTAVIO1981 (discussão) 12h19min de 29 de julho de 2014 (UTC)Responder

Feito Rjclaudio e Helder.wiki. Implementei o ccnorm e rmdoubles no filtro 118. Testei os últimos 600 disparos do filtro e somente 3 casos deixaram de ser detectados. 2 eu consegui identificar a razão, a palavra da regex estava seguida de I que é convertido em i então a detecção falha. O outro caso não conseguir o motivo. A versão anterior da regex tinha um erro que fez disparar indevidamente uma edição no artigo "Favelamusic" onde foi inserido BNegão e na regex negão estava dentro do subgrupo de palavras iniciadas por B, então fica positivo. Pretendo implementar estas funções no filtro 70 nos próximos dias. Sds, OTAVIO1981 (discussão) 19h47min de 23 de outubro de 2013 (UTC)Responder

No log 1424836, depois da aplicação de ccnorm(rmdoubles(...)), entre as linhas adicionadas aparece a palavra "PUTA" e entre as removidas há "P0NTA-P0RA", ou seja, caímos na situação que descrevi no Wikipédia:Filtro de edições/98#Falsos negativos do tipo "inserção de X quando já tem Y". Helder 21h00min de 23 de outubro de 2013 (UTC)Responder

Feito Implementei o ccnorm e rmdoubles nos filtros 7, 70 e 112. Aproveitei e reorganizei os principais verbos no 7, e inclui novas palavras no 112. Falta só o 68 mas este vou ter que ver a eficiência antes. OTAVIO1981 (discussão) 00h22min de 28 de outubro de 2013 (UTC)Responder

Atualização do filtro 112

Rjclaudio e Helder.wiki. Já analisei um bocado dos registros do 112 e acho que está suficiente para ser atualizado. isto é, palavras com alta incidência serem movidas para os respectivos filtros desautorizadores e novas palavras serem inseridas. Coloquei em Wikipédia:Projetos/AntiVandalismo/Expressões_problemáticas algumas palavras que podem ser inseridas. OTAVIO1981 (discussão) 16h07min de 24 de setembro de 2013 (UTC) Feito fui audaz e fiz por conta própria. Vou seguir na análise de registros antigos e dos novos.OTAVIO1981 (discussão) 13h13min de 4 de outubro de 2013 (UTC)Responder


Remoção do termo "comer"

Notei vários falsos positivos desse filtro com relação ao termo "comer" e proponho a remoção dele do filtro 12, uma vez que na maioria dos casos em que ele tem caráter ofensivo, está associado a algum outro termo ofensivo já listado no filtro, o que torna sua inclusão desnecessária e sujeita a alto indice de falsos positivos--Leon saudanha (discussão) 21h26min de 11 de abril de 2015 (UTC)Responder

Falso-negativos

Abaixo uma lista de falso-negativos que foram verificados e é necessário avaliar melhor como adicioná-los ao filtro. Adicionar novos casos no final da seção.

Geral: [3] [4] [5] [6] [7] [8] [9] [10]

Corpo humano: [11]

Verbo: [12] [13] [14] (o verbo botar não é muito enciclopédico)

Variações de ofensas já detectadas: [15] [16] [17] [18] [19] [20] [21]

Potencial: [22] [23] [24]


Feito

Rjclaudio msg 19h06min de 30 de agosto de 2013 (UTC)Responder

Movendo as ofensas de 'Solicitações#Sale':

Feito

Rjclaudio msg 19h16min de 30 de agosto de 2013 (UTC)Responder

Mais alguns:

Feito

Acho válido remover os exemplos daqui a medida que os filtros serem atualizados para detectar os casos. Não necessariamente todas as possibilidades precisam ser incluídas, somente as mais frequentes.OTAVIO1981 (discussão) 20h21min de 30 de agosto de 2013 (UTC)Responder

Mais alguns (2):

Feito

Novamente, peguei as últimas 50 do salebot apenas para gerar uma base de palavras que podem eventualmente serem implementadas nos filtros.OTAVIO1981 (discussão) 12h40min de 3 de setembro de 2013 (UTC)Responder

Melhor reativar o 112 como teste, ficando apenas para registro (ou apenas etiqueta? assim sabemos pelo diff se ativou algum filtro), para colocarmos os casos acima (e limpamos essa lista que tende a crescer) para irmos acompanhando e vendo os falso-positivos, e depois decidimos se passa apenas para aviso ou vai para algum dos filtros de impedimento. Rjclaudio msg 14h27min de 3 de setembro de 2013 (UTC)Responder

Concordo, pois está alinhado com a proposta que fiz na seção anterior. Embora considere que alguns casos aí em cima como este dificilmente terão falsos positivos, podemos fazer como propõe e mover para os filtros mais específicos quando houver base de dados. O 112, neste caso, ficaria sempre etiquetando (?) e com funcionamento similar ao 119 isto é, como laboratório para preparar o código para os filtros que desautorizam.OTAVIO1981 (discussão) 17h21min de 3 de setembro de 2013 (UTC)Responder
  • Estou começando a remover os casos que já estão sendo detectados pelo 112 e deixo abaixo os que foi filtrado pelo 18 também:
  1. [25]

Para o momento, é só.OTAVIO1981 (discussão) 21h00min de 3 de setembro de 2013 (UTC)Responder

  • Mais uma rodada de falsos-negativos. Desta vez extraído do histórico de alguns reversores:

Feito

Acho que já é hora de lançar uma campanha para os reversores muito ativos reportarem estes casos de ofensas por conta própria ou pelo menos assinarem uma lista de "muito ativos" para facilitar encontrar que está com disposição e revertendo bastante. Eu vou lembrando das pessoas mas às vezes não estão muito ativos na reversão.OTAVIO1981 (discussão) 18h01min de 5 de setembro de 2013 (UTC)Responder

Atualizando, tirei as já detectadas, e adicionei mais casos pro 112. Deixei os que não estão sendo detectados na lista, para discutirmos melhor como fazer. Rjclaudio msg 13h08min de 7 de setembro de 2013 (UTC)Responder

Falso-positivo

O que se faz quando uma edição é desautorizada mas é válida? [26] Posso simplesmente criar o artigo e ficar com os créditos? Rjclaudio msg 20h49min de 30 de agosto de 2013 (UTC)Responder

Não consegui ver porque foi desautorizado. só porque utilizou gay? melhor então passar então este para um de ofensas que só avise. Vamos monitorar mais um pouco. A respeito da sua pergunta. Não sei responder.OTAVIO1981 (discussão) 23h38min de 30 de agosto de 2013 (UTC)Responder
Sim, o que foi detectado foi a palavra "gay". Helder 18h17min de 6 de outubro de 2013 (UTC)Responder
Uma possibilidade é salvar a edição indicando o autor original no sumário, com link, e avisá-lo em sua página de discussão que completou a edição para ele. Helder 18h17min de 6 de outubro de 2013 (UTC)Responder

Melhorias requeridas

Helder.wiki e Rjclaudio, passado o final de semana já dá para ver que alguns ajustes são necessários. Minha proposta é reativar o 68 e deixar os casos duvidosos lá, por enquanto. Pinto e gay são os primeiros candidatos porém pênis e vagina também podem ser elegíveis. Existem 5 municípios com Pau no nome então vai ser rotina de falsos positivos desautorizados. Estou pensando em um aviso novo para lidar com estas situações. Tratando estas situações, resta resolver o problema do Pikachu e do Pica-Pau que são falsos positivos daqui (filtro 70) mesmo, isto é, não era para terem sido detectados. Ainda tem o caso da url inserida com .cu/ que também não era para detectar por aqui. Quando finalizar a proposta de aviso, publico. Abs, OTAVIO1981 (discussão) 12h55min de 2 de setembro de 2013 (UTC)Responder

Balão de ensaio:

Atenção: Em função da alta quantidade de vandalismos associados à algumas palavras, o sistema identificou automaticamente que sua edição tem o conteúdo potencialmente ofensivo.

Por favor, se considera que o conteúdo é adequado a uma enciclopédia, pressione novamente o botão "Gravar página" para salvar sua edição. Tenha em vista que sua edição será verificada por outros editores e prontamente revertida se for constatada como sendo um vandalismo.

Optei por não entregar quais são as palavras para não facilitar a vida do vândalo em outras variações. Acho que vale a pena etiquetar todas as edições.OTAVIO1981 (discussão) 13h18min de 2 de setembro de 2013 (UTC)Responder

Concordo com colocar essas quatro palavras no filtro 68 para casos duvidosos mostrando apenas o aviso+etiqueta, sem impedir a edição. Se essas quatro palavras realmente estiverem sendo usadas em um contexto ofensivo, ainda podem ser detectadas por outra parte da edição, ou com o tempo podemos detectar as expressões mais usadas ao invés de apenas a palavra.
Pikachu não deveria ser detectado, pois tem um '([^a-záâãéêíóôõúç]|$)' no final da detecção. Não foi um falso-positivo antigo, antes da atualização dos filtros?
Pica-pau, talvez expandir essa lista ali em cima para incluir exceção para - , acho que tem poucos vandalos que usam -ofensa ou ofensa-
Da url não sei. Poderia colocar o / nas exceções, como acima, mas ainda assim teria urls cmo xxx.cu . Exceção para ponto antes não sei, não acho que seja raro colocarem uma ofensa logo depois do final de uma frase válida. Podiamos colocar uma exceção para não detectar se tiver no formato 'www.xxx.ofensa', e não acho que os vandalos usariam esse formato qnd vandalizassem.
Rjclaudio msg 14h01min de 2 de setembro de 2013 (UTC)Responder
Cláudio, acha que vale a pena mover "pau" para o 68 também? Em relação ao pikachu, foi um erro meu. Na verdade o que fez detectar foi um "pica-la" no meio do texto então, resolvido. Fica então na mesma situação do Pica-pau onde devemos decidir se o - configura ou não uma exceção. Acho que pode tirar o hífen deixando como exceção (é isso?), pelo que acompanhei até agora de vandalismos é uma exceção mesmo. Para a url acho que colocar a barra no final pode ajudar a resolver provisoriamente até termos um monitoramento melhor. A maioria das urls vai ter alguma coisa depois do .cu que vai começar com a barra. São poucos os casos de referências que o sítio principal é apontado (tipo www.algumacoisa.com.br )OTAVIO1981 (discussão) 14h43min de 2 de setembro de 2013 (UTC)Responder
Sobre o aviso, nós já temos MediaWiki:Abusefilter-warning-ofensa. Esse texto está bom, ou usamos o que vc fez?
Pau também, há pau como madeira, do tipo "bateu nela com um pedaço de pau". Vale separar, qualquer coisa trazemos de volta.
Feito. Reativei o Filtro 68 com o texto de aviso atual e com as cinco palavras sugeridas (e removi elas dos outros filtros). E mudei o filtro 70 para fazer exceção a - antes e depois da ofensa, e a / depois.
Rjclaudio msg 15h02min de 2 de setembro de 2013 (UTC)Responder
Acho que a diferença entre os avisos é que o "Abusefilter-warning-ofensa" já dá a edição como não-construtiva enquanto o texto que propus explica que potencialmente é e que será verificada por outro editor. Em outras palavras, o texto existente é muito incisivo sobre a má fé do texto enquanto o segundo dá o benefício da dúvida que de fato existe.OTAVIO1981 (discussão) 16h35min de 2 de setembro de 2013 (UTC)Responder
Aviso alterado. Rjclaudio msg 17h06min de 2 de setembro de 2013 (UTC)Responder
Só para registrar, gostei mais da abordagem desse novo texto. Helder 23h22min de 6 de outubro de 2013 (UTC)Responder

Analisando de 10 em 10 enquanto a análise em massa não é implementada

Tive uma idéia simples para resolver o nosso problema da análise em massa enquanto outro recurso não é implementado. Vamos analisar todas as edições em um grupo mas só registrar a décima de cada analisada e todos os falsos positivos no intervalo. Por exemplo, acabei de fazer o filtro 18 e analisei 100 edições em 9 minutos mas reportei só de dez em dez. Acho que para os filtros ou disparam muito (ofensas, principalmente) é um adianto tremendo e embora os cálculos e estatísticas fiquem um pouco prejudicados o mais importante é que o filtro está funcionando bem. Também desisti de arquivar os registros antigos pois reportando em pacotes serão menos edições então não vai sobrecarregar muito. O que acha Rjclaudio e Helder.wiki ?OTAVIO1981 (discussão) 16h04min de 25 de outubro de 2013 (UTC)Responder

Estou conseguindo manter os filtros de ofensas 100% verificados com este recurso.OTAVIO1981 (discussão) 18h29min de 28 de outubro de 2013 (UTC)Responder

Filtro 7 demorando mais do que o normal

Pode ser cedo para levantar a bola, mas o filtro 7 começou a demorar mais do que o normal após esta alteração ontem. Vou continuar acompanhando mas ao que parece a regex afetou um bocado o filtro.OTAVIO1981 (discussão) 13h00min de 28 de outubro de 2013 (UTC)Responder

Bom, a nova regex é mais complexa, e abrange mais casos, então é natural que leve mais tempo para ser processada. Mas parte do aumento no tempo de processamento também pode vir da remoção de duplicatas e normalização do conteúdo dos diffs (principalmente nos casos em que são grandes). Helder 13h22min de 28 de outubro de 2013 (UTC)Responder
Acabei de conferir novamente e o tempo estava em 1,92 ms que é próximo dos outros filtros de ofensa. Talvez eu tenha visto em dois momentos "ruins" do filtro onde precisou converter grandes trechos. Isso me faz pensar que precisamos começar a sistematizar a coleta destes tempos de execução para podermos ter uma base de melhorias.OTAVIO1981 (discussão) 17h55min de 28 de outubro de 2013 (UTC)Responder
Pois é. É praticamente impossível identificar mudanças com um impacto negativo sem algo automatizado como aquelas tabelas (hoje inativas) da wiki em inglês, com dados das últimas horas, dias semanas, etc. Talvez o HAndrade (WMF) possa ajudar nisso? Helder 19h48min de 28 de outubro de 2013 (UTC)Responder
Fiz uma pequena redução da regex e uma simplificação mas não adiantou nada. O valor máximo que notei foi 14 ms mas normalmente está na faixa de 8 a 9 ms. Acho que estas regexes de verbos estão complicando porque temos 7 radicais com 7 conjugações. Se reparar no guia de manutenção é a maior lista de análise. Se formos incluir mais verbos talvez valha a pena desmembrar este filtro em dois deixando em um só os verbos e nos outros as variações.OTAVIO1981 (discussão) 18h22min de 31 de outubro de 2013 (UTC)Responder

Filtro de conteúdo ofensivos sem ccnorm

O texto seguinte foi movido de: Wikipédia:Filtro_de_edições/Solicitações#Filtro de conteúdo ofensivos sem ccnorm

Pessoal, estou rascunhando em Usuário(a):OTAVIO1981/Filtros as regexes para os filtros 70 e 112 com ccnorm e o que acontece é que algumas palavras tem alta incidência de vandalismo sem acentuação mas quando escritas corretamente tem falsos positivos. Portanto, para podermos usá-las precisariamos de um filtro só para elas sem o uso da função ccnorm. O que acham? Talvez depois possamos complementar com outras palavras para melhorar a eficiência do filtro. OTAVIO1981 (discussão) 21h59min de 25 de outubro de 2013 (UTC)Responder

Precisaria de outro filtro? Não é só colocar num mesmo filtro uma vandalismo1 que usaria ccnorm, e outra vandalismo2 que não usaria a ccnorm? Acho que deixar junto facilita na hora de encontrar qual filtro que tem uma certa palavra (se é que tem), e deixa mais claro que aquelas palavras tem falso-positivo se usar o ccnorm. Rjclaudio msg 23h11min de 25 de outubro de 2013 (UTC)Responder
Teria alguns exemplos, OTAVIO1981?
Se possível, eu tentaria manter tudo no mesmo filtro (pelo que o Rjclaudio disse), e usar parêntesis estrategicamente para tentar minimizar o uso de condições.
A propósito, pelo visto o sistema usado pela ccnorm estará funcionando um pouco melhor: gerrit:92057 e gerrit:92154. Só temos que ficar de olho na data em que a correção será feita, para atualizar os filtros que usam gambiarras para contornar aquele bug. Helder 09h53min de 26 de outubro de 2013 (UTC)Responder
Se este jeito não vai consumir muito mais condições por mim não tem problema algum. Aliás, como fazemos para medir estas quantidades de condições no filtro, Helder.wiki? O tamanho e complexidade da regex influi na quantidade de condições? Os exemplos, por enquanto, são ânus e pênis em que damos o benefício da dúvida no 68 mas sem o acento é considerado ofensa no 70. Tem também porra que é convertido para pora e é um falso positivo para porã. Podem haver outros a medida que a lista de palavras desautorizadas crescer. Se o tamanho e complexidade da regex não influenciar nas condições acho que só mais 1 filtro para "protestos e fuleragens" do tipo "não colabore com a wiki" e "jura?", etc é suficiente. OTAVIO1981 (discussão) 15h19min de 26 de outubro de 2013 (UTC)Responder
OTAVIO1981, a complexidade da expressão regular Y que aparece em uma condição X (i)rlike Y não muda o número de condições utilizadas, só influencia o tempo gasto para a execução do filtro (aquele que aparece em ms na linha de estatísticas de cada filtro). Helder 15h58min de 26 de outubro de 2013 (UTC)Responder
O filtro pode falhar se o tempo de execução for muito alto?OTAVIO1981 (discussão) 16h06min de 26 de outubro de 2013 (UTC)Responder
Não exatamente. O tempo de execução de cada filtro tem impacto no tempo que as edições levam para ser salvas (só são salvas depois que a AbuseFilter termina de testar os filtros, então se eles demoram, a edição demora para salvar). Mas pelo que eu lembro não tem nenhuma variável configurando um limite em milisegundos... Helder 19h07min de 26 de outubro de 2013 (UTC)Responder
Aliás, esse é um dos motivos de eu não gostar da ideia de usar a extensão para o que se faz com o filtro 77 (o filtro que parece gastar mais tempo, conforme as estatísticas). Helder 19h11min de 26 de outubro de 2013 (UTC)Responder
Bom, podemos trabalhar com um limite total dos tempos de execução inferior a 200 ms e estabelecer uma "investigação" quando um filtro exceder com frequência o limite de 5 ms. Isto enquanto um número arbitrário melhor não surgir...OTAVIO1981 (discussão) 00h46min de 28 de outubro de 2013 (UTC)Responder
Só que o filtro 77 já passou dos 5 ms há tempos... Helder 10h03min de 28 de outubro de 2013 (UTC)Responder
Investigação iniciada.OTAVIO1981 (discussão) 11h12min de 28 de outubro de 2013 (UTC)Responder

Voltando a vaca fria das ofensas sem ccnorm, implementei no mesmo filtro e peço que vejam como ficou. Vou tentar ficar atento ao tempo de execução superior já que praticamente são 2 filtros em 1.OTAVIO1981 (discussão) 17h10min de 28 de outubro de 2013 (UTC)Responder

Reorganizei um pouco as condições. Helder 21h23min de 28 de outubro de 2013 (UTC)Responder

Tá certo isso? Com ccnorm(rmdoubles(added_lines)) irlike ofensas eu entendi que ccnorm (added_lines) ia transformar toda a added_lines em uma só opção, ou seja, C[Uú][5Z]A[O0] seria só uma palavra. Precisa comparar isso (uma única palavra) com uma regex (várias opções de palavras)? Isso não deixa o filtro mais pesado desnecessariamente? Rjclaudio msg 14h41min de 12 de novembro de 2013 (UTC)Responder

Rjclaudio, não consegui entender a pergunta. Helder 15h55min de 12 de novembro de 2013 (UTC)Responder
Cláudio, talvez você esteja confundindo a ccnorm com a norm. A ccnorm só transforma os caracteres (S em 5 por exemplo). A norm remove os caracteres duplicados (rmdoubles), remove o espaçamento em branco (rmwhitespace?) e faz esta transformação. O único passo extra possível para os filtros é tentar implementar a norm no lugar dessas duas mas acho que deve ter muitos FPs se removermos o espaçamento. É até interessante pegar casos como t e s t e só não sei se vale a pena.OTAVIO1981 (discussão) 16h22min de 12 de novembro de 2013 (UTC)Responder
Não confundi. Eu digo, uma edição que adicione CUZAO a ccnorm vai transformar em CU540 (? se não for, serve de exemplo). Então bastaria comparar ccnorm (added_lines) com CU540, ao invés de comparar com C[Uú][5Z]A[O0].
Ou seja, estamos transformando a palavra adicionada x, y e z, todas em x, para depois comparar se o resultado dessa transformação é igual a x, a y ou a z. Mas aí a transformação de tudo em x perde o sentido. Rjclaudio msg 16h28min de 12 de novembro de 2013 (UTC)Responder
Hum... vc está chando estranho ter [Uú], [O0] e [I1ï] no código? Bom é que a ccnorm não está no momento fazendo todas as conversões que precisamos. Ver comentários do Helder nesta discussão que relata o bug associado.OTAVIO1981 (discussão) 16h42min de 12 de novembro de 2013 (UTC)Responder
Ah tá, se for isso ok. Estranho não converter 0O e o I1, sendo tão parecidos.
Aproveitando, seria útil mover essa discussão lá pro filtro 18 e com um link no topo para a seção q tb falada da ccnorm. Rjclaudio msg 16h50min de 12 de novembro de 2013 (UTC)Responder
A lista de conversões feitas está aqui. Pessoalmente, não acho que os caracteres que deixam de ser convertidos tenham impacto pra gente. Nunca vi escreverem com "ł" mas se não tem impacto na execução do filtro fico indiferente.OTAVIO1981 (discussão) 17h07min de 12 de novembro de 2013 (UTC)Responder

O texto acima foi movido de: Wikipédia:Filtro_de_edições/Solicitações#Filtro de conteúdo ofensivos sem ccnorm

Filtro 18 foi desativado automaticamente?

Acabei de fazer uma alteração na regex deste filtro e bem do lado de sinalizações tinha o seguinte aviso:"Este filtro foi desativado automaticamente por medida de segurança por ter atingido 5%" (ou algo próximo). Salvei a alteração imaginando que o aviso ia ficar lá e pensando que o filtro estava mesmo desativado. Porém o aviso sumiu e o filtro aparentemente não foi desativado. Sabem o que pode ter acontecido, Helder.wiki e Rjclaudio?OTAVIO1981 (discussão) 19h46min de 13 de novembro de 2013 (UTC)Responder

Isso parece ser o bugzilla:52525. Helder 19h51min de 13 de novembro de 2013 (UTC)Responder

Aplicar o norm

Tenho pensado em utilizar o filtro 112 para testar uma aplicação da função norm durante um dia para verificar se existem muitos falsos positivos. Minha intenção é fazer a substituição por somente 1 ou 2 dias no máximo dependendo das quantidades de falsos positivos que podem pipocar. Depois disso eu voltaria o 112 ao código atual. O que acha, Rjclaudio?OTAVIO1981 (discussão) 20h23min de 21 de novembro de 2013 (UTC)Responder

Se ajudar, tudo certo. Contanto que o filtro não tenha nenhuma ação, pode ficar um pouco mais de tempo, mas é bom só ativar quando tiver disponível para olhar os problemas no início.
Não daria para usar a busca que o Danilo fez pra saber se tem ocorrência nos nossos artigos atuais?.
Rjclaudio msg 01h56min de 22 de novembro de 2013 (UTC)Responder
Rjclaudio, ontem encontrei o Danilo.mac no IRC e ele conseguiu fazer exatamente isto. Testou os filtros 7, 18, 70 e 112 em 2% do dump e foram poucas as palavras que tiveram falsos positivos. Pretendo então na semana que vem usar o 112 para testar as palavras do 18 já retirando a palavra que causou falsos positivos. Existem duas alternativas para tratar estas possíveis palavras que causam falsos positivos: usar uma estrutura semelhante ao filtro 70 ou juntar num novo filtro (incluindo estes casos do 70). Qual te parece melhor? Muito obrigado pela ajuda, Danilo!OTAVIO1981 (discussão) 13h59min de 23 de novembro de 2013 (UTC)Responder

Tentando adicionar tradução de seção em artigo

O texto seguinte foi movido de: WP:Filtro de edições/Solicitações#Tentando adicionar tradução de seção em artigo

Estava tentando inserir a tradução da seção "Biography", da Wiki inglesa, no artigo da Nina Simone, mas o filtro rejeitou a inserção por algum motivo (não há conteúdos ofensivos nem falta de fontes fiáveis - e o que tinha antes no artigo não foi excluído, só consertado, como informações e traduções erradas). Tentei fazer em partes a inserção, e consegui até a seção "Maturidade", a qual tentei colocar sem pensar, aqui para que fosse analisada, mas que foi, obviamente, filtrada por ter sido novamente identificada como "prejudicial". Peço para, por favor, analisarem meu pedido. Obrigado.--Juliothren (discussão) 18h27min de 13 de agosto de 2014 (UTC)Responder

--ATUALIZAÇÃO--

Após revisar o parágrafo "problemático" frase por frase, acabei descobrindo que o problema estava numa das fontes, uma resenha fazendo referência ao nome de um álbum, Fo(dois Ds)er on My Wings (que foi citado no artigo e na discografia sem problemas - provavelmente um filtro pra evitar referências de vândalos a imagens obscenas). Ou seja, tive essa problemada toda graças ao fato da palavra "forragem" em inglês ser semelhante a um "verbo obsceno" em português - seria cômico se não fosse trágico.

Definitivamente alguns filtros precisam ser revistos, principalmente porque há muitas fontes fiáveis em inglês e muitas traduções de bons artigos ingleses. Não tenho acesso às palavras obscenas, mas recomendaria a quem o tem (e tem o direito de alterá-las) a conferir se alguma das variações de alguma "obscenidade" coincide com alguma palavra em outro idioma.--Juliothren (discussão) 19h43min de 13 de agosto de 2014 (UTC)Responder

Observação: Embora você não possa alterar a programação do filtro, seu conteúdo é público, veja aqui. Lechatjaune msg 19h49min de 13 de agosto de 2014 (UTC)Responder

O texto acima foi movido de: WP:Filtro de edições/Solicitações#Tentando adicionar tradução de seção em artigo

Lechatjaune: para que essa expressão não seja detectada, a alteração era em outro trecho do código. Helder 23h45min de 13 de agosto de 2014 (UTC)Responder

Não consigo publicar tradução

Realizei a tradução do artigo Mutagenesis (molecular biology technique), gastando uma média de 1h40 com tradução, edição e pesquisas. Mesmo com todas as mudanças e edições do texto, a plataforma de edição/tradução acusa que o texto está 99% sem modificações. Alguns trechos eu realmente mantive, pois estão corretos e não precisam de edição, mas tenho plena certeza de que fiz bem mais de 1% de alterações. A tradução automática repetia o mesmo termo errado em praticamente todos os parágrafos e legendas das fotos, só isso já deveria contar como mais de 1% de edição... Como proceder? Devo alterar o texto mesmo sem necessidade para que fique diferente? --Natalia.de.Araujo (discussão) 14h11min de 31 de janeiro de 2022 (UTC)Responder

@Natalia.de.Araujo: Nesse contexto, sugiro tratar apenas das alegações de palavras ofensivas, que é um erro que impede a publicação da tradução. A falta de modificação no texto é um alerta que não impede a publicação, podendo ser contornada includindo caracteres extra (p.ex., "..."), a serem removidos imediatamente após a publicação. Fgnievinski (discussão) 16h33min de 31 de janeiro de 2022 (UTC)Responder
Olá, novamente não consigo publicar outra tradução por conta do aviso: "A sua tradução não pode ser publicada porque contém demasiado texto não modificado". Apenas 2 trechos pequenos estão 100% sem modificação, pois não há necessidade, o restante está abaixo de 99%. Não sei mais o que fazer para tirar esse aviso. Natalia.de.Araujo (discussão) 13h26min de 14 de fevereiro de 2022 (UTC)Responder

Filtro 38 - Sequência longa sem espaços

Sequência longa sem espaços
Status
Etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 33
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Mais um filtro desatualizado em relação a versão anglófona en:Special:AbuseFilter/135. O atual não conseguiu detectar este vandalismo. Minha sugestão é atualizar o código, monitorar e eventualmente no futuro acionar um aviso.OTAVIO1981 (discussão) 18h45min de 24 de junho de 2013 (UTC)Responder

Neste exemplo o que aconteceu foi que a regex "[^ \,\n\|\/\-]{50,}" não detecta "== Níveis tróficos ==vfghgkfhksdyghvhkneaknc" pois há no máximo 25 caracteres consecutivos (bem menos do que 50) satisfazendo a condição indicada. Helder 16h30min de 25 de junho de 2013 (UTC)Responder
No entanto, o filtro original é o en:Special:AbuseFilter/231 (no spaces) não o en:Special:AbuseFilter/135 (repeating characters). Helder 16h38min de 25 de junho de 2013 (UTC)Responder
O filtro anglófono consegue detectar este vandalismo? O código (old_size > 0) & daqui me parece desnecessário pois sempre será um valor positivo. Talvez atualizar já seja o suficiente. Se após um período de testes ficar bem, podemos deixar no modo avisar.OTAVIO1981 (discussão) 17h24min de 25 de junho de 2013 (UTC)Responder
Este filtro tem uma boa quantidade de disparos e está configurado para fazer nada. Acredito que deveria ser o próximo a ser atualizado para monitorar e alterar. Já fiz a primeira amostragem dele, focando nos salvamentos visto que em alguns casos o editor não prossegue salvando visto que ele tem um conflito com o filtro 3 e 10.OTAVIO1981 (discussão) 17h32min de 10 de julho de 2013 (UTC)Responder
  • 1352325 detectou o cabeçalho da tabela, feito sem espaço, provavelmente copiado de outro lugar !Part.!!Goles!!Part.!!Goles!!Part.!!Goles!!Part.!!Goles (cabeçalho, sem espaço). Talvez uma exceção para linhas que começam com ! ou com | ? Ou para edições que adicionam uma linha {| (início tabela) para não detectar ocorrências em linhas começando com ! e |  ? Rjclaudio msg 13h37min de 19 de julho de 2013 (UTC)Responder
Eu preferiria utilizar uma "lista explicita das letras e números" ([a-záâãéêíóôõúçA-ZÁÂÃÉÊÍÓÔÕÚÇ0-9]), como na wiki em inglês em vez de "negar que sejam símbolos especiais" ([^ \,\n\|\/\-]). Caso contrário, pode não ficar confiável o bastante para passar a avisar os editores. Helder 14h22min de 19 de julho de 2013 (UTC)Responder
Enquanto não se decide se usamos uma lista explícita ou não, mudei o filtro para ignorar o _ para evitar casos como o abaixo (e outros que achei). Rjclaudio msg 14h22min de 28 de julho de 2013 (UTC)Responder
Feito, exceção para ! na sequencia de caracteres. Vai deixar de detectar alguns vandalismos, mas ao menos não vai detectar essas edições válidas. Rjclaudio msg 13h49min de 15 de agosto de 2013 (UTC)Responder
Feito, não conta _ na sequencia. Rjclaudio msg 13h49min de 15 de agosto de 2013 (UTC)Responder
Feito, exceção para edições que adicionem a tag <code>br</code> Rjclaudio msg 13h49min de 15 de agosto de 2013 (UTC)Responder
Feito, exceção para edições que adicionem <code>nbsp</code> Rjclaudio msg 13h49min de 15 de agosto de 2013 (UTC)Responder

Exceção para outros filtros

A maior parte das ocorrências também são detectadas pelo Filtro 39 - Sequência de pontuação ou pelo Filtro 10 - Caracteres repetidos. Então coloquei no código uma exceção para não detectar os casos que já são pegos por esses dois filtros. Ao menos para os testes, isso deve limpar um pouco os registros e melhorar a nossa análise do filtro. Depois que o filtro aumentar de nível retiramos isso. Rjclaudio msg 14h24min de 18 de agosto de 2013 (UTC)Responder

Interessante este recurso. Significa que dá para estruturar os filtros numa ordem específica. Por exemplo, podemos colocar o de remoção de predefinição para disparar somente quando o branqueamento (2) não for disparado. E se colocarmos esta exceção como a primeira condição, as aumenta o tempo de execução do filtro pois as incidências são poucas para o branqueamento (2), por exemplo.OTAVIO1981 (discussão) 13h32min de 30 de agosto de 2013 (UTC)Responder
De certa forma eu já fazia isso, alguns filtros tinham um new_size>40. A ideia é voltar a usar isso? Só colocar o new_size>40, ou um ! (new_size < 40 & old_size > 500)? Colocaria isso em todos (?) os filtros de remoção e de strings? Mts casos de ofensas / strings aleatórias, também são branqueamento. Rjclaudio msg 16h19min de 30 de agosto de 2013 (UTC)Responder
Vou precisar de mais tempo para amadurecer a idéia de como podemos tirar proveito disso. Por enquanto estou só processando a novidade. 17h vou entrar no IRC, se quiser conversar disso vai ser muito bom.OTAVIO1981 (discussão) 17h34min de 30 de agosto de 2013 (UTC)Responder

Unused variable

@!Silent:

(Apologize for using English. I don't know how to write Portuguese.)

Hello! My tool discovers that Special:AbuseFilter/38 creates a variable sequence_counterFP but does not actually use it. There are two possibilities why this could happen: either sequence_counterFP is not needed, and it could be safely removed, or the filter is buggy, and it should be corrected. Please let me know if you need any additional information. --Nullzero (discussão) 05h49min de 7 de novembro de 2019 (UTC)Responder

Filtro 39 - Sequência de pontuação

Sequência de pontuação
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 8
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Comecei a analisar e reportei em Wikipédia:Filtro de edições/Análise/Filtro 39 os casos onde os artigos não estavam eliminados. É um bom candidato a passar para o modo avisar, pelo menos. Aproveito e reporto o Especial:Registro_de_abusos/1348239 que deveria ter sido detectado por outro filtro mas não foi. Abs, OTAVIO1981 (discussão) 22h01min de 19 de julho de 2013 (UTC)Responder

O filtro já está bem avaliado. Os únicos falso-positivos são ..... em lista (especialmente de Elenco) que coloquei exceção (..... quando tem * na linha, indicando lista), e reticencias no final de citação (coloquei exceção para ..."). Acho que podemos mudar para aviso. Rjclaudio msg 15h54min de 28 de julho de 2013 (UTC)Responder

Sugestões para o texto do aviso a ser usado? Rjclaudio msg 14h08min de 9 de agosto de 2013 (UTC)Responder

Atenção: o sistema identificou automaticamente que a edição adicionou uma quantidade excessiva de sinais diacríticos ou de pontuação, geralmente significando erros na edição.

Se considera que não houve erros na edição, pode pressionar novamente o botão "Gravar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Balão de ensaio bem simples. Não consegui identificar qual tipo de erro de boa fé é mais comum para sinalizar prontamente como corrigir nem a documentação específica para isto pois o uso correto trata-se da prática de boa escrita.OTAVIO1981 (discussão) 14h34min de 13 de agosto de 2013 (UTC)Responder

Aumentei o filtro para aviso, colocando esse texto que sugeriu. Rjclaudio msg 18h10min de 14 de agosto de 2013 (UTC)Responder

Filtro 70 - Conteúdo ofensivo

Conteúdo ofensivo
Status
Desautorizando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 130
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
indefinido

Falsos positivos

A expressão "Cu" tem causado alguns falsos positivos, em especial em fórmulas químicas envolvendo cobre. Entretanto essa palavra é um dos vandalismos mais comuns.

Por isso estou retirando a detecção de vandalismos com esse termo dos filtros 7 e 18 (filtros anti-ofensas comuns) e colocando num filtro específico. Isso permitirá fazer uma análise mais detalhada para aprimorar o novo filtro. Até que mais observações sejam feitas, julgo apropriado deixá-lo apenas no modo de aviso, por isso é provável que haja um leve aumento no número de vandalismos do tipo. Kleiner msg 18h20min de 6 de junho de 2011 (UTC)Responder

É o filtro 70. Kleiner msg 21h55min de 6 de junho de 2011 (UTC)Responder

Que tal incluir a condição de que a página não pode conter a palavra "cobre"? Lechatjaune msg 14h41min de 14 de julho de 2013 (UTC)Responder

Conferi alguns dos falsos positivos e confirmei qual foi a causa: Peru, Pinto, PAL e pica. Helder 19h05min de 14 de setembro de 2013 (UTC)Responder

Sítio do Pica Pau Amarelo

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#Eu estava tentando CRIAR meu assunto

Não entendi porque foi bloqueado, não tem palavrão, não tem ofensa, não tem material pornografico, não tem nada que seja errado.

Poxa, não entendi.... O pessoal entra nas páginas e avacalha com a vida de todo mundo, eu tento colocar coisa úteis, e sou bloqueado...comentário não assinado de José Maria Gobbo (discussão • contrib) (data/hora não informada)

  • Está tentando colocar algum texto na sua página de usuário que aciona os filtros 68 e 70, basicamente "Inclusão de palavras ofensivas/impróprias". Não tenho acesso ao texto mas é só modificar um pouco as palavras potencialmente ofensivas.Jo Loribd 14h18min de 10 de agosto de 2014 (UTC)Responder
Imagino que o problema tenha sido a adição da palavra "pica" aqui. O filtro 70 só evita a adição dessa palavra por usuários não confirmados. Assim, em breve o usuário poderá escrever sobre o "Sítio do Pica Pau Amarelo" sem problemas. Porém, independente dessa questão, sugiro ao José Maria Gobbo a leitura da página com instruções sobre como editar uma página de usuário. Provavelmente a edição que ele tentou fazer, mesmo que não fosse impedida pelos filtros, seria revertida por não respeitar algumas regras e usar incorretamente a wiki sintaxe. Crang115 (discussão) 17h40min de 10 de agosto de 2014 (UTC)Responder

O texto acima foi movido de: Wikipédia:Filtro de edições/Solicitações#Eu estava tentando CRIAR meu assunto

Preferência temporal

Tentei gravar a página de criação do artigo acerca do termo "Preferência temporal", em economia, mas fui impedido pelo filtro automático de "conteúdo ofensivo". Trata-se de um engano. O conteúdo do artigo que escrevi é eminentemente técnico, nada tendo de ofensivo. comentário não assinado de Carvalag (discussão • contrib) 15h45min de 5 de novembro de 2016‎ (UTC)Responder

O problema surgiu na revisão mais recente deste filtro. Helder 16h24min de 5 de novembro de 2016 (UTC)Responder
Resolvido.
A maioria (165 de 257) das ocorrências desde aquela edição (provavelmente) eram falsos positivos (eram detectadas pela versão com problema e deixaram de ser detectadas pela versão corrigida). Helder 16h39min de 5 de novembro de 2016 (UTC)Responder

Psiconeuroimunologia

Acabei de solucionar o problema, mas acho relevante pontuá-lo aqui. Fiz a tradução de um artigo em inglês sobre psiconeuroimunologia, mas o filtro barrou a minha publicação com o aviso de conteúdo ofensivo. Acabei de me tornar um usuário confirmado e acredito que seja isso que estava disparando o filtro. De qualquer forma, não consegui identificar a palavra que acionou o filtro. Alguém teria alguma ideia? Helder? Obrigada. BMNeuroMat (discussão) 21h30min de 24 de abril de 2018 (UTC)Responder

Falsos negativos

Gostaria de chamar a atenção para este filtro que não disparou para a seguinte tentativa de edição Especial:Registro de abusos/1347733. Já me deparei com outros casos em que este filtro não foi disparado. Nem sequer havia notado sua existência ainda. Favor quem seguir analisando filtros atentar para casos em que este não foi disparado.OTAVIO1981 (discussão) 20h16min de 15 de julho de 2013 (UTC)Responder

resolvi este problema (testei o novo código contra essa edição que mencionou e funciona). Helder 20h34min de 15 de julho de 2013 (UTC)Responder
Muito bom! Fiz análise dos últimos 50 disparos e o filtro é versátil na variedade que consegue detectar. Estarei atento a outras incidências não-detectadas.OTAVIO1981 (discussão) 20h40min de 15 de julho de 2013 (UTC)Responder
Só para constar: não sei quando foi, nem se teve alguma relação com a mudança que fiz, mas a página do filtro informa que ele foi desativado, e no entanto ele continua a detectar edições (como informei no bugzilla:52525). Helder 18h53min de 5 de agosto de 2013 (UTC)Responder

Acabei de constatar que o filtro não está detectando este padrão de mal uso. Tem também este caso.OTAVIO1981 (discussão) 13h49min de 6 de agosto de 2013 (UTC)Responder

Acrescentei essa variação na regex (passou a funcionar com a 40847377 e com a 40847449). Observei também que outro filtro possui uma outra expressão similar, e acredito que ambas deveriam estar em um único filtro. Helder 23h07min de 6 de agosto de 2013 (UTC)Responder
Sou favorável a centralizar neste filtro todas as tentativas de detectar o calão, isto é, remover de todos os outros filtros os parâmetros que tentam filtrar esta palavra (incluindo o termo científico para a palavra). Acredito que isto facilitará e simplificará o trabalho.OTAVIO1981 (discussão) 11h32min de 12 de agosto de 2013 (UTC)Responder
Os três primeiros já estão sendo detectados após a reorganização dos filtros de ofensas. Rjclaudio msg 19h05min de 30 de agosto de 2013 (UTC)Responder

Pros casos em que o termo é o mais 'enciclopédico' para se referir a parte, fazemos o impedimento ou apenas o aviso? Pq haveria casos válidos. Vandalismos: [32], [33], [34]. Rjclaudio msg 19h05min de 30 de agosto de 2013 (UTC)Responder

Eu acho válido pois infelizmente é uma realidade que terá muito mais vandalismos do que edições de boa fé nestas situações. Pesando o falsos-positivos e um aviso explicativo de como proceder, acho que vai impedir parte dos vandalismo que hoje sequer é filtrado.OTAVIO1981 (discussão) 20h00min de 30 de agosto de 2013 (UTC)Responder

Fiz uma edição no artigo Irmandade Muçulmana. Esta foi considerada prejudicial e descrita como adição de conteúdo ofensivo. Apenas fiz ligações internas, adicionei portais e duas novas seções: "Ver também" e "Bibliografia". Não compreendi qual o erro cometi nesta edição. Por favor, gostaria de uma orientação sobre o que fazer. Obrigado. 189.48.232.55 (discussão) 14h45min de 15 de setembro de 2013 (UTC)Responder

Sites impróprios

@!Silent, OTAVIO1981: não acho boa ideia incluir nomes/URLs de sites impróprios no meio da lista de expressões ofensivas, pois os usuários afetados receberão avisos pelo motivo errado. Helder 11h35min de 20 de novembro de 2016 (UTC)Responder

Também não acho uma boa ideia. Inclusive, acho que deveríamos mexer menos nos filtros consolidados e irmos criando novos conforme necessidade. Talvez a cada 30 novas palavras, partir para um filtro novo. Isso vai ser importante principalmente se a gente quiser levar adiante a ideia dos bloqueios. OTAVIO1981 (discussão) 14h12min de 20 de novembro de 2016 (UTC)Responder
De fato. Então, moverei de volta a expressão para o filtro 139. E quanto a criar um novo filtro e manter esses do jeito que estão, também sou favorável. !Silent (discussão) 18h58min de 20 de novembro de 2016 (UTC)Responder
Criado o filtro 141. !Silent (discussão) 18h59min de 24 de novembro de 2016 (UTC)Responder

Lixo

@!Silent: uma parte das expressões relacionadas a "lixo" foi incluída no filtro 18 e posteriormente mais algumas expressões foram colocadas no filtro 70. Há algum motivo especial para a separação? Como ambos os filtros impedem contas não confirmadas de fazer as edições detectadas, imagino que não tenha a ver com a possibilidade de uma delas ter mais falsos positivos/negativos do que a outra. Então qual é o critério? Helder 17h33min de 20 de novembro de 2016 (UTC)Responder

@He7d3r É porque na verdade, no filtro 18 a ocorrência de [EÈÉÊẼê]H? (?:UM )?LIXO) só é verdadeira se precedida de ES[ST]E S[IÌÍÏ]T(?:E|IO)) , enquanto que no filtro 70 vale para qualquer caso. Se deixar somente a regex [EÈÉÊẼê]H? UM LIXO no filtro 70 e remover do filtro 18 a expressão equivalente, uma entrada como "esse site e lixo" não seria pega por ele. E caso colocasse no filtro 70 a mesma regex que está atualmente no filtro 18, poderiam ocorrer falsos positivos com "e lixo" por exemplo.
Sugere alguma coisa melhor? !Silent (discussão) 18h54min de 20 de novembro de 2016 (UTC)Responder
Mas porque não colocar todas em um único filtro? Acredito que facilitaria a manutenção, por exemplo, ao analisar quais variações estão sendo detectadas. Helder 19h12min de 20 de novembro de 2016 (UTC)Responder
Eu preferi colocar no filtro 70 a regex [EÈÉÊẼê]H? UM LIXO devido ao fato do filtro 18 já está com muitos termos, mas também não me oponho a colocar todas num único filtro, acho que ficaria melhor mesmo. !Silent (discussão) 20h03min de 20 de novembro de 2016 (UTC)Responder

Moção?

@!Silent, OTAVIO1981: há intenção de mover a expressão "MEU PAU" do filtro 112 para o filtro 70 ou o contrário? Atualmente, ambos detectam essa string, mas seria bom remover de um deles... Helder 18h38min de 20 de novembro de 2016 (UTC)Responder

Deve-se remover do filtro 112, pois não consigo imaginar em qual circunstância a expressão "meu pau" poderia ser usada de maneira válida numa página, logo, não muito provavelmente não existem falsos positivos com essa expressão. !Silent (discussão) 18h46min de 20 de novembro de 2016 (UTC)Responder

Falso positivo não evidente

Caros, estou tentando criar um artigo em português referente ao Motor Recíproco, porém estou sendo acusado de Conteúdo ofensivo relativo a partes do corpo humano (termos). Já revisei o texto e não encontro nenhum caso que se enquadre. Por gentileza, como devo proceder? Segue abaixo o artigo: Obs.: o trecho seguinte está "compactado" de modo a despoluir visualmente o contexto da página toda.

Resumo O motor recíproco tem como objetivo realizar trabalho a partir da conversão de energia químico-física para energia mecânica por meio de mecanismos mecânicos e elétricos.   Motor Reciprocante e seus impactos na Revolução Industrial Introdução

 O motor recíproco ou alternativo, utiliza ao menos um pistão para converter pressão em movimento de rotação e é mais comumente utilizado em motores de calor, mas também pode ser utilizado em motores hidráulicos e pneumáticos. A máquina a vapor, foi o primeiro tipo de motor a utilizar um mecanismo recíproco, e devido à simplicidade e eficiência as máquinas recíprocas a vapor foram de extrema importância para a Primeira Revolução Industrial. Mas além das tradicionais máquinas a vapor de ciclo aberto, o sistema recíproco também é utilizado em motores de ciclo fechado como o Stirling e Brayton.
  Maquinas recíprocas também foram de fundamental importância para a Segunda Revolução Industrial, pois desde o final do século XIX os principais motores de combustão interna utilizam essa tecnologia. Embora utilizado para geração de energia elétrica, propulsão de aviões, dirigíveis e navios, o principal mercado para motores alternativos de combustão interna é a indústria automobilística. 
 Motores de combustão interna necessitam de um combustível de trabalho (os carbonetos mais comuns são a gasolina, diesel, etanol, querosene, GNV, entre outros), e existem duas classificações desses motores: SI, em que a ignição é dada por uma faísca (por meio de uma vela) e CI, no qual a ignição é feita por compressão do ar, pois ao ser comprimido o ar é aquecido e inflama o combustível injetado (muito comum a utilização do diesel).

  Características e funcionamento geral Recuros comuns em todos os tipos: Pistões, bielas, virabrequins, Os pistões são acoplados dentro de um cilindro, onde ao receberem pressão dos gases quentes, são deslocados linearmente transferindo movimento e força para a biela.

No caso de um motor de combustão interna, é injetada um fluído de trabalho (idealmente, 50% combustível e 50% oxigênio) e por meio da ignição por faísca ou por compressão, essa mistura entra em combustão e o aumento de pressão empurra o pistão para o Figura 1       nível mais baixo do cilindro (ponto morto inferior, volume máximo do cilindro), depois devido a força de inércia do virabrequim, esse pistão é empurrado no sentido contrário até atingir o ponto morto superior (volume mínimo do cilindro). 
 O motor Stirling que é um motor de ciclo regenerativo fechado, também utiliza o movimento linear do pistão, porém não existe queima de combustível, esses motores podem utilizar dois pistões alinhados no mesmo cilindro ou em cilindros diferentes. No caso dos motores a vapor, que parte do mesmo princípio, o gás (vapor d’água) é introduzido no pistão já sob certa pressão pois nesse caso, não há nenhum tipo de ignição dentro do cilindro, já que se trata de um sistema de combustão externa. Quando o pistão atinge o nível mais baixo, ele retorna ao seu ponto inicial por meio de um volante liberando a mistura de trabalho nas válvulas de escape (exceto o motor Stirling, já que sua mistura é retornada e arrefecida, mantendo a mesma quantidade de gás selada) e assim, de forma cíclica, o motor vai transformando energia térmica (proveniente dos combustíveis) em trabalho mecânico usual (para locomoção, geração de energia, entre outros).
 A biela é responsável por fazer a transmissão de energia mecânica do pistão (êmbolo) para o virabrequim (transformando o movimento linear do êmbolo em rotação), garantindo também o tempo perfeito para a combustão (motores de dois ou mais pistões), já que a válvula de combustível e a válvula de escape tem como referência o movimento rotacional do virabrequim. Um volante costuma ser utilizado para suavizar a rotação e também é responsável por armazenar energia mecânica e transportar para setores não-motorizados do ciclo. Vale lembrar que quanto maior o número de pistões com o mesmo tamanho relativo, menor será a perda de energia por vibração, melhorando ainda mais a sua eficiência e aumentando                    Figura 2

sua potência (proporcional a soma do volume máximo de todos os pistões). Classificação de motores É comum classificar os motores pelo número de cilindros e sua disposição (pode ser em linha, de forma longitudinal ou transversal ou ainda de forma radial, comum em aeronaves), assimilando ainda com o volume total de deslocamento dos pistões (cm³, cilindradas=cc, litros=L ou polegadas cúbicas= cu in). Por exemplo, motores de combustão interna de um ou dois cilindros são comuns em veículos menores, como motocicletas variando geralmente de 0,5 litros à 1,6 litros. Para veículos de passeio, geralmente o motor é equipado entre três e seis cilindros, variando de 1,0 litros até 3,0 litros. Coupés e carros de competição podem ter até 12 cilindros, ultrapassando 6,2 litros, como é o caso da Ferrari LaFerrari 2014. Navios e grandes locomotivas superam esse valor, chegando a mil litros ou mais. A taxa de compressão afeta o desempenho na maioria dos tipos de motores recíprocos. É a relação entre o volume total do cilindro, quando o pistão está no ponto morto inferior, e o volume quando o pistão está no ponto morto superior. Além de olhar para a potência que o motor pode produzir, a pressão média efetiva (MEP), também pode ser usada na comparação da potência de saída e desempenho de motores recíprocos do mesmo tamanho. A pressão efetiva média é a pressão fictícia que produziria a mesma quantidade de trabalho líquido que foi produzida durante o ciclo de força motriz, ou seja, qualquer motor com o maior valor de MEP produz mais trabalho líquido por ciclo e o executa mais eficientemente.

MEP = W líquido / Volume de deslocamento Tipos de motores reciprocantes de combustão interna Nas máquinas a vapor o ponto no ciclo do pistão em que a válvula de entrada de vapor fecha pode muitas vezes ser controlado para ajustar o torque fornecido pelo motor e melhorar a eficiência. Como os motores de combustão interna admitem e removem gases ciclicamente, foram criados alguns padrões que dependem do número de cursos para completar um ciclo. São eles: • Motor de 2 tempos: ocorre um ciclo de admissão, compressão, expansão e exaustão de gases a cada volta do eixo, havendo admissão e exaustão de gases simultaneamente. Esses motores possuem maior potência se comparados com os motores de quatro tempos, porém a baixa qualidade da queima de combustíveis resulta em uma maior emissão de poluentes e maior consumo de combustível (cerca de 30% se comparados). É o tipo de motor utilizado nos motosserras e também na motocicleta Kawasaki H2 750 Mach IV e no carro Isetta;

Figura 3 • Motor de 4 tempos: é o tipo de motor mais utilizado em automóveis no cotidiano. Suas etapas de admissão, compressão, expansão e exaustão de gases a cada volta do eixo são demarcadas, ou seja, a cada ¼ de volta, o cilindro apresenta uma etapa diferente, partindo da admissão. Esses motores não necessitam de lubrificantes adicionados ao combustível (como no caso dos motores de dois tempos) e apresentam um melhor rendimento se comparados, porém sua manutenção é menos rentável e duradoura, devido a sua complexidade;

Figura 4 • Motor de 6 tempos: foi desenvolvido para diminuir a complexidade do motor de quatro tempos, aumentando a eficiência e diminuindo a emissão de gases poluentes. Esse motor não possui válvulas (seu controle é feito pelo carregador de pistão), eliminando perdas de misturas combustíveis, propiciando tal fato. As etapas são marcas, respectivamente, por aspiração, pré-compressão, transferência de gás, compressão, ignição e ejeção.

Figura 5  Contexto histórico do motor a vapor, Ciência e impactos sociais

As primeiras utilizações, no qual envolvem mudanças de eixos de trabalho, ou seja, dado um movimento rotativo e por meio de mecanismos mecânicos tem-se uma transformação para um movimento linear, data-se do século XIII D.C. no dispositivo de serra romana, do qual o movimento rotativo da roda d’água num percurso hídrico era transformado em linear por meio de eixos, hastes e engrenagens de madeiras ou ligas, tornando possível o ato de serrar horizontalmente de forma contínua, determinados artefatos. Porém a civilização humana foi muito além. Como esse movimento é o pilar de um motor reciprocante, sua utilização está presente em diversas áreas cotidianas para diversos fins simultâneos.

O período pré-Revolução Industrial foi marcado por trabalho mecânico utilizando, acima de tudo, força humana, animal, gravitacional (escoamento de água para níveis mais baixos em rios, princípio de funcionamento de hidrelétricas como por exemplo) e eólica (moedores de capim e mandioca), também havia a utilização do vapor em minas da Inglaterra (em 1698 por Thomas Savery). Nesse período, demarcado por grande comércio e explorações em navegações, não era possível a produção em massa, sendo assim, a vida de cada indivíduo sempre se passava no mesmo vilarejo, já que havia a necessidade de possuir tudo propício à sociedade por ali perto (com exceção apenas dos navegadores, porém estes, enfrentavam longas jornadas com diversas restrições, pois os veleiros eram muito grandes e possuíam uma navegação lenta, que dependia da direção do vento).

Com o invento e aprimoramento do motor reciprocante a vapor, pilar da Revolução, “a humanidade pôde se unificar num só mundo”, já que com a construção de locomotivas a vapor e linhas férreas (primeiro percurso entre Stockton e Darlington, no ano de 1825), tornou-se possível a locomoção de cargas e pessoas por toda a Inglaterra, assim, vilarejos do extremo sul

                                                                                                           Figura 6

recebiam visitantes, mercadorias e alimentos frescos todos os dias vindas do extremo norte, com alta precisão de partida e chegada (horário), que no caso, mudou para sempre a sociedade. Pensando em linhas férreas e estações de trem, houve a necessidade de comunicação entre base e trem que fosse mais rápida que o próprio trem, assim foi criado o telégrafo (sistema que logo mais tarde foi aprimorado pelo norte-americano Dr. Samuel Morse), que funcionava com uma bateria elétrica e por meio de cabos de cobre (ou ferro) que corriam paralelamente a linha Figura 7 férrea, dissimulando a informação de estação em estação. Nesse período, com o invento da imprensa a vapor na Alemanha, assimilada a alta capacidade de carga e velocidade dos trens, foi possível criar um jornal nacional com baixo custo, já que a notícia pôde chegar a todos os cidadãos em poucas horas. O rápido conflito entre França e Prússia (1870-1871) também foi bastante influenciado pelo trem.

As fábricas não eram mais as mesmas. O vapor foi introduzido em todas as maquinarias possíveis e se deu início a exploração do trabalho humano (mais uma vez) em chão de fábrica, com produção em massa (com ausência de leis, crianças eram as mais exploradas, tendo uma jornada de trabalho superior a 14 horas diárias).

Maquinários também dominaram as lavouras, reduzindo bastante o trabalho braçal rural (aumento significativo de produção alimentícia).

O vapor levou mais tempo para transformar os mares do que as terras. Porém, com o invento do barco a vapor, houve uma drástica redução temporal nas navegações, já que como os barcos não dependiam mais do vento e seu tamanho relativo decresceu muito, criaram-se canais, que encurtaram ainda mais o espaço entre partida e destino, fora sua velocidade média, que foi aumentada devido à potência do motor.

Com essa Revolução, a qualidade de vida aumentou drasticamente, era rara a escassez de alimentos (tão comuns nos meados de 1750). A população aumentou mais rapidamente, cerca de 80% entre 1750 e 1850. Pragas eram mais raras e o conhecimento do combate às doenças era cada vez maior. Houve a criação de centros urbanos e redes de esgoto, porém estes eram despejados em rios, poluindo e espalhando doenças mortais. O cólera, por exemplo, apareceu pela primeira vez em meados de 1823, na Rússia e cerca de 10 anos mais tarde em Nova York.

Por outro lado, engenheiros construíam reservatórios de água e melhoravam o saneamento básico, que por hora, era precário. Esse fato, aliado aos avanços da Medicina, fez com que a taxa de mortalidade caísse. Em meados de 1870, o bacteriologista alemão Robert Koch realizou a descoberta de que as bactérias são causadoras de doenças, e elas se alojam em milhões numa única gota de saliva. Em 1882, em Berlim, Koch anunciou a descoberta da bactéria causadora da tuberculose, uma doença descoberta por Hipócrates na Grécia Antiga.

Como havia facilidade de viagens e dissipação de informação na era do vapor, descobertas na Medicina eram, cada vez mais divulgadas. Em 1883, na Índia, Koch descobriu o bacilo que transmitia a cólera. Ronald Ross, descobriu que a malária era transmitida por um mosquito, quinze anos mais tarde, também na Índia.

Como reflexo deste século, invenções modelaram o mundo, abrindo um leque ainda maior para o conhecimento com as novas tecnologias, possibilitando um estudo mais aprofundado em menor tempo (em destaque, para os avanços da Medicina).

comentário não assinado de Rafael de Carvalho Barroca (discussão • contrib) 12h57min de 13 de maio de 2017 (UTC)Responder

@Rafael de Carvalho Barroca O problema é devido ao termo cu encontrado no texto do artigo. De todo modo, te aconselho a rever seu texto, de maneira que ele fique formatado de acordo com o Livro de estilo (esse link poderá ajudar) e acrescentar fontes, pois do contrário ele poderá acabar sendo apagado. !Silent (discussão) 16h14min de 13 de maio de 2017 (UTC)Responder

Falso positivo do símbolo do cobre

Estou atualmente traduzindo a página sobre o composto químico "Dióxido de enxofre" e esse filtro está bloqueando o símbolo do elemento químico Cobre, presente em algumas reações químicas pertinentes. Há alguma forma de adicionar uma exceção? Faço uso do editor visual e não tenho muito conhecimento em programação. Na área da química em inúmeras páginas esse tipo de filtro pode vir a causar problemas futuros, porém entendo que o termo é inconveniente por causa do duplo sentido.ChEMister21 (discussão) 18h45min de 2 de junho de 2021 (UTC)Responder

@ChEMister21 Pus você no grupo de usuários confirmados e agora não sofrerá mais o impedimento do filtro. Com relação aos falsos positivos na área de química, irei verificar assim que possível. !Silent (discussão) 00h08min de 3 de junho de 2021 (UTC)Responder
@!Silent Certo, obrigado pela rápida resposta! ChEMister21 (discussão) 13h16min de 3 de junho de 2021 (UTC)Responder

Filtro 98 - Palavras a evitar

Palavras a evitar
Status
Etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 2
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Novo código

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo código para o 98 (palavras a evitar)

Estou trabalhando no código tentando flexibilizar as palavras e melhorando a regex. Testei aqui e está pegando 96% do que o filtro atual consegue. Como não consegui achar os 4%, deixo o código para alguém dê uma força:

evitar := '(?:[^a-záâãéêíóôõúç]|^)((?:lendári|visionári|extraordinári|prestigios|respeitad|virtuos|maravilhos|famos)(?:[ao])s?|(?:pro)(eminente)s?|(?:célebre|fascinante)s?|última linha|líder|nível mundial|(?:incríve|notáve)(?:l|eis))(?:[^a-záâãéêíóôõúç]|$)';

(article_namespace == 0 | article_namespace == 102) &

! 'confirmed' in user_groups

& added_lines irlike evitar

& ! removed_lines irlike evitar

Sds, OTAVIO1981 (discussão) 18h38min de 8 de outubro de 2013 (UTC)Responder

O texto acima foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo código para o 98 (palavras a evitar)

Das últimas 200 ocorrências, só faltava detectar os seguintes casos: virtuosidade, virtuose, respeitado e desrrespeitados, eminente.
Uma versão aprimorada da regex acima seria a seguinte:
(?:[^a-záâãéêíóôõúç]|^)((?:lendári|visionári|extraordinári|prestigios|(?:desr)?respeitad|maravilhos|famos)(?:[ao])s?|virtuos(?:idade|(?:[aeo])s?)|(?:pro)?(?:eminente)s?|(?:célebr|fascinant)es?|última linha|líder|nível mundial|(?:incrí|notá)ve(?:l|eis))(?:[^a-záâãéêíóôõúç]|$)
Já as edições que inseriam "visionário", "Notável" e lendários deixaram de ser detectadas porque no texto removido aparece "famoso" (que não consta no código atual do filtro). Em termos da estratégia para fazer a atualização, teria sido mais fácil identificar a causa exata destas 3 regressões se primeiro fosse apenas realizada a conversão para regex, e só em uma mudança posterior incluísse um novo termo. Helder 15h44min de 9 de outubro de 2013 (UTC)Responder
Valeu, Helder.wiki! Obrigado por aprimorar a regex. Aos poucos eu chego lá! ;) Entendi a questão de incluir novas palavras e aprimorar ao mesmo tempo.OTAVIO1981 (discussão) 16h23min de 9 de outubro de 2013 (UTC) P.S.:Atualizei o filtro. OTAVIO1981 (discussão) 16h23min de 9 de outubro de 2013 (UTC)Responder

Falsos negativos do tipo "inserção de X quando já tem Y"

A propósito, os falsos negativos do tipo "inserção de X em uma página que já tem Y, se X e Y são palavras a evitar" tendem a ficar mais frequentes conforme a lista for aumentando. Se houver intenção de garantir que a detecção também ocorra nestes casos, um caminho é usar algo deste tipo:

evitar := [
'(?:[^a-záâãéêíóôõúç]|^)lendári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)',
'(?:[^a-záâãéêíóôõúç]|^)visionári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)',
'(?:[^a-záâãéêíóôõúç]|^)extraordinári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)'
/* , E assim por diante... */
];

( article_namespace == 0 | article_namespace == 102 )
& ! 'confirmed' in user_groups
& (
  ( added_lines irlike evitar[0] & ! removed_lines irlike evitar[0] )
| ( added_lines irlike evitar[1] & ! removed_lines irlike evitar[1] )
| ( added_lines irlike evitar[2] & ! removed_lines irlike evitar[2] )
/* ... */
)

A desvantagem é que isso aumentaria o número de condições consumidas pelo filtro. Helder 16h52min de 9 de outubro de 2013 (UTC)Responder

Me ocorreu uma outra solução: utilizar um lookahead positivo de um jeito bem específico. Atualizei o filtro depois de ter testado o novo código com as últimas 600 detecções do filtro 98 (isso inclui todas de outubro e quase 100 de setembro) e todas continuarão sendo detectadas pela nova versão acima. Espero que não seja (muito) ineficiente, pois talvez essa estratégia também seja útil em outros filtros. Helder 22h22min de 20 de outubro de 2013 (UTC)Responder
Fiz um pequeno ajuste na regex, para não tratar as linhas removidas como se fossem as adicionadas (10 (possíveis) falsos positivos recentes não teriam acontecido na nova versão). Helder 12h34min de 21 de outubro de 2013 (UTC)Responder

Advérbios

O texto seguinte foi movido de: Wikipédia Discussão:Filtro de edições/98

@He7d3r:@OTAVIO1981:É possível incluir advérbios de modo nas condições do filtro? A exemplo de felizmente, infelizmente(posso buscar outros e listá-los, se sim). Obs! Marquei vocês dois pois deduzi que são conhecedores do assunto. Caçador de Palavras (discussão) 22h46min de 9 de fevereiro de 2016 (UTC)Responder

O texto acima foi movido de: Wikipédia Discussão:Filtro de edições/98

Poderíamos fazer uma troca como esta:
  • Remover: (?:pro)?(?:eminente)s?
  • Inserir: (?:pro)?eminentes?|(?:extrema|(?:in)?feliz|terrivel)mente
Helder 22h54min de 9 de fevereiro de 2016 (UTC)Responder
Pode-se adicionar terrivelmente e extremamente? Caçador de Palavras (discussão) 05h40min de 10 de fevereiro de 2016 (UTC)Responder
Atualizei o exemplo acima. O que acham? Helder 16h40min de 10 de fevereiro de 2016 (UTC)Responder
Não sei de script mas li as palavras... Se eu assimilar que mais alguma esteja de acordo com este filtro, venho aqui lhe perturbar, ok Helder? Um abraço, Caçador de Palavras (discussão) 04h36min de 11 de fevereiro de 2016 (UTC)Responder
Alterei o filtro conforme indicado acima. Helder 12h48min de 11 de fevereiro de 2016 (UTC)Responder

Xingamentos e palavras de baixo calão em sumários de edição

Gostaria de propor que xingamentos e palavras de baixo calão em sumários de edição fossem proibidos, ou seja a pessoa seja impossibilitada de gravar a página quando coloca um palavrão no sumário de edição, para evitar casos como esse: diff. Um bloqueio, se possível automático, temporário do usuário de pelo menos algumas horas para a pessoa que tenta escrever esse tipo de coisa seria bem desejável também, para a pessoa se acalmar. Vulcan (discussão) 09h40min de 23 de maio de 2013 (UTC)Responder

Baixo calão

Vi usarem variações de caracteres para palavras de baixo calão, como 0 ao invés de O. Dá para alterar os nossos filtros para pegar essas variações? Rjclaudio msg 15h20min de 10 de julho de 2013 (UTC)Responder

Acredito que sim. Atualmente temos estes:
Provavelmente deveríamos utilizar a função "ccnorm" para esse tipo de melhoria. Também seria bom reavaliar a necessidade (técnica?) de haver a separação em vários filtros. Helder 15h29min de 10 de julho de 2013 (UTC)Responder

Filtros 06, 07, 18, 68 - Ofensas

Temos Filtro 06 - Artigo fora de escopo do projeto (aviso), Filtro 07 - Conteúdo ofensivo (desautorizar) e Filtro 68 - Ofensivo 2 (nada). Não é melhor fundir? Exceto expressões genéricas que podem ser válidas (tipo "vocês são umas" que pode ser título de algum filme/livro/música/etc), conteúdo obviamente ofensivo terá poucos falso-positivos, e não faz diferença se a edição é em um artigo novo (filtro 6) ou em um artigo existente (filtro 7 e 68). E juntando fica mais fácil de atualizar a lista de expressões ofensivas (a lista de ofensas do filtro 6 está maior que a dos outros dois). Rjclaudio msg 15h06min de 25 de julho de 2013 (UTC)Responder

Achei tb o Filtro 18 (desautorizar). Rjclaudio msg 15h31min de 25 de julho de 2013 (UTC)Responder

Tem também o 112 (sem ação). Ontem estava conversando com o danilo no IRC e minha idéia era juntar todos os filtros de xingamentos no modo desautorizar para ser a primeira barreira de vandalismos. Estes filtros não deveriam fazer distinção de domínios ou se é uma PN ou não. O que acha?OTAVIO1981 (discussão) 19h08min de 25 de julho de 2013 (UTC)Responder
Sobre separar/fundir filtros, seria bom verificarem se isto que relatei ocorre hoje, isto é, se ainda há problema com filtro sendo desativado por atingir mais de 5% de ocorrências em relação ao total de ações analisadas. Se esse problema ainda existe, vale a pena deixar o filtro preocupado apenas com os artigos, para diminuir a razão ocorrências/total de ações. 187.64.33.208 (discussão) 06h54min de 27 de julho de 2013 (UTC)Responder
Deveria ocorrer, mas já reportei alguns bugs (#52525 e #51294) que podem fazer com que não ocorra. Se por aqui for comum que um filtro com (quase) nenhum falso positivo seja desativado automaticamente, podemos coletar os dados necessários para justificar uma alteração das configurações $wgAbuseFilterEmergencyDisable*** da extensão, para que não seja tão restritiva. Helder 19h20min de 5 de agosto de 2013 (UTC)Responder
Porque o filtro 60 (Ofensivo 1) está oculto da visualização pública?OTAVIO1981 (discussão) 14h24min de 14 de agosto de 2013 (UTC)Responder

Maiores palavras

Ver Maiores palavras da língua portuguesa e Anexo:Lista das maiores palavras de cada língua.

Poderia ter um filtro de caracteres máximos de uma palavra. Aí barra quem segura uma tecla no teclado por exemplo "aeeeeeeooooooooooooooooooooooooooooooooooooooooooo" ou aperta várias, "ajcbkadjvnslkvmsfjknshbvbvshbhbhvbsfbvhjhfh". Vulcan (discussão) 16h57min de 10 de julho de 2013 (UTC)Responder

Já existe o filtro 38, copiado da Wikipédia em inglês. Ambas as versões sofreram alterações desde a cópia:
Helder 17h08min de 10 de julho de 2013 (UTC)Responder

Filtros de criação de página

Filtro 2 - Criação de artigo com indicação de ER

Página nova com indicação de ER
Status
Impedindo
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Tanto o filtro 02 quanto o 49 servem para a mesma coisa. Precisamos fundir. O 02 é antigo e desatualizado, mas está desautorizando a edição, o 49 tem mais variações mas só está avisando. Rjclaudio msg 16h48min de 25 de julho de 2013 (UTC)Responder

Tem o meu apoio.OTAVIO1981 (discussão) 18h55min de 25 de julho de 2013 (UTC)Responder
Qual o motivo para impedir apenas as páginas que tenham mais de 30 bytes?
Provavelmente a última coisa a testar deveria ser o "sysop", pois a maioria das páginas é criada por quem não é administrador.
Se for feita a fusão, sugiro que o código final fique no número 2 (início da lista de filtros).
Helder 21h14min de 26 de julho de 2013 (UTC)Responder
O tamanho >30 era para não entrar em conflito com o filtro de PN mínima. Rjclaudio msg 00h40min de 29 de julho de 2013 (UTC)Responder
Rjclaudio, quando diz "entrar em conflito" se refere a algum problema que ocorre se dois filtros detectarem a mesma edição? Helder 19h20min de 5 de agosto de 2013 (UTC)Responder
Tinha pensado como fica caso filtros de diferentes níveis (desautorizar / avisar / etiquetar) são ativados, principalmente em relação a qual aviso/etiqueta mostrar. Rjclaudio msg 03h00min de 9 de agosto de 2013 (UTC)Responder

O filtro 2 tem um limitador na velocidade de edição (1 a cada 10 horas), precisa disso mesmo quando o filtro está desautorizando a edição? O filtro após a fusão vai desautorizar + aviso + velocidade? Rjclaudio msg 03h00min de 9 de agosto de 2013 (UTC)Responder

Filtro 52 - Página nova sem espaço

Página nova sem espaço
Status
Impedindo
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 40
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
A discussão a seguir está marcada como respondida (atualizado). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

1351618 - O Sale disparou o filtro? Pq? Erro do filtro ou do Sale? Rjclaudio msg 14h14min de 25 de julho de 2013 (UTC)Responder

Acredito que não foi erro de ninguém: provavelmente só aconteceu porque tudo foi muito rápido:
  • 2013-07-17T01:04:16: 177.100.5.230 criou a página
  • 2013-07-17T01:04:33: Vitor Mazuco sugeriu a eliminação
  • 2013-07-17T01:05:31: PauloEduardo eliminou a página
  • 2013-07-17T01:05:44: a marcação de eliminação do Salebot foi salva (provavelmente ele "viu" antes de ser eliminada mas o salvamento demorou mais do que a eliminação)
Helder 18h55min de 25 de julho de 2013 (UTC)Responder

250 ocorrências desde início do ano, sem alterações significativas no filtro. Todos os artigos criados foram eliminados. Podemos mudar para impedir a edição? Rjclaudio msg 18h13min de 29 de julho de 2013 (UTC)Responder

Sem comentários? Como já passou uma semana, se ninguém se opor, na quarta mudo o filtro para impedir a criação da página. Rjclaudio msg 19h56min de 5 de agosto de 2013 (UTC)Responder

Sim, acho que podemos passar para o modo desautorizar. Acho também que o parâmetro new_size > 30 pode ser removido ou alterado para continuar "alinhado" com o filtro 66, isto é, passar para 50. Acredito que simplesmente remover o parâmetro seja uma possibilidade viável pois já impedimos a criação de qualquer coisa menor que 50 então, ao remover o parâmetro, o que acontecerá é que um artigo criado com 5 caracteres será disparado por este filtro e o 66 ao invés de somente o 66 e com uma condição a menos. Para o momento, fica bom simplesmente alterar e subir o parâmetro mas gostaria de discutir o custo-benefício de remover o parâmetro new_size.OTAVIO1981 (discussão) 10h59min de 6 de agosto de 2013 (UTC)Responder
Concordo em passar a desautorizar a criação de páginas novas sem espaços, mesmo sem qualquer restrição em relação ao new_size (imagino que o tempo gasto para testar se há um espaço na variável added_lines, cresce conforme aumenta o número de caracteres que não são um espaço. E quanto mais desses caracteres aparecerem, mais chance de ser uma edição indevida, então o impacto negativo seria justamente sobre os editores que tentassem acrescentar muito conteúdo sem espaço).
Há mais algumas coisas que talvez façam diferença em termos de eficiência:
  1. Usar ' ' in added_lines em vez de added_lines rlike ' ' (por não ter que criar uma expressão regular)
  2. Usar added_lines irlike '#redirec' em vez de lcase( added_lines ) rlike '#redirec' (para reduzir o número de condições consumidas pelo filtro)
Apesar de não termos ferramentas adequadas para medir a diferença de eficiência, acredito que tais mudanças não deixariam o filtro menos eficiente. Helder 12h23min de 6 de agosto de 2013 (UTC)Responder
As sugestões acima foram aplicadas, e mudei para desautorizar a edição. Rjclaudio msg 02h56min de 9 de agosto de 2013 (UTC)Responder

Removi a etiqueta, pois não tem efeito agora que o filtro impede as edições. Helder 12h31min de 9 de agosto de 2013 (UTC)Responder

Redireccionamentos

O texto seguinte foi movido de: WP:Filtro de edições/Solicitações#Redireccionamentos

Olá. Está-me a dar erro ao criar redireccionamentos, não autorizando as edições. Isto com o uso do botão de redireccionamento acima da caixa de edição e também com inserção do texto de redireccionamento que está na opção "código wiki" abaixo da caixa de edição.

Exemplo:

  • 20h00min de 21 de outubro de 2014: Lijealso (Discussão | contribs | bloquear) desencadeou o filtro filtro 66 ao executar a operação "edit" em Harlandia. Ações tomadas: Não autorizar; Descrição do filtro: Criação de artigo muito curto (1) (detalhes | examinar)
  • 20h00min de 21 de outubro de 2014: Lijealso (Discussão | contribs | bloquear) desencadeou o filtro filtro 52 ao executar a operação "edit" em Harlandia. Ações tomadas: Não autorizar; Descrição do filtro: Página nova sem espaço (detalhes | examinar)

Lijealso (discussão) 19h07min de 21 de outubro de 2014 (UTC)Responder

O texto acima foi movido de: WP:Filtro de edições/Solicitações#Redireccionamentos
Vou conferir os registros relacionados. Helder 19h10min de 21 de outubro de 2014 (UTC)Responder
@Lijealso: parece que o software sofreu alguma alteração. Informei o problema no bugzilla:72329. Helder 19h40min de 21 de outubro de 2014 (UTC)Responder
Ok, obrigado. Já estou a seguir o bug. Lijealso (discussão) 19h45min de 21 de outubro de 2014 (UTC)Responder
@Lijealso: confira se o problema continua depois desta alteração que acabei de fazer. Helder 19h58min de 21 de outubro de 2014 (UTC)Responder
@Helder - Está inconstante, umas vezes consigo à primeira, outras só à segunda ou mesmo à terceira. Mas parece ser só devido ao filtro 66. Lijealso (discussão) 20h04min de 21 de outubro de 2014 (UTC)Responder
Em tempo: este filtro não deveria ser desabilitado ou alterado para aceitar pelo menos as palavras ("redirecionamento" ou "redirect" + variantes maisculas/minusculas) até que se acerte mais essa trapalhada? José Luiz disc 10h37min de 22 de outubro de 2014 (UTC)Responder
@José Luiz: Ele está configurado para ignorar redirecionamentos. O problema é que essa informação deixou de estar disponível para ele na variável added_lines que ele utilizava (e já troquei por outra em que ainda está disponível, new_wikitext). Sua conta não aparece em nenhum dos registros desse filtro, mas aparece nos registros do filtro 66 (deve estar usando a mesma variável). Helder 13h30min de 22 de outubro de 2014 (UTC)Responder

Filtro 64 - PN em maiúscula


Nenhuma das últimas 500 edições foram salvas (ou desistiram, ou arrumaram, ou foram impedidos por outro filtro). Olhando mais pra trás, as 500 edições antes disso, todas as que foram salvas foram eliminadas depois. Nenhum dos artigos que existem atualmente foram por causa das edições daqui.

Os únicos falso-positivos que tem é quando o texto resultante não possui nenhum ... texto. Digo, há apenas um ficheiro, ou uma url. Até aí ok. Mas também acontece de ter uma tag aberta que não fecha, como uma tag gallery, e aí a página fica sem texto exibido, apesar de ter texto no código fonte. Mas pra isso basta melhorar o aviso do filtro. Coloquei "É possível que sua edição não esteja exibindo nenhum texto, por exemplo, por ter uma tag html aberta no início sem estar fechada corretamente. Verifique o seu texto." no texto do aviso.

Proponho então aumentar o filtro para impedir a edição. Rjclaudio msg 15h52min de 12 de agosto de 2013 (UTC)Responder

Mudei o filtro para impedir a edição, considerando que isso já havia sido falado em 16jul e teve apoio do Otavio. Rjclaudio msg 18h36min de 14 de agosto de 2013 (UTC)Responder

new_text

É intencional o uso de new_text em vez de new_wikitext? Helder.wiki (discussão) 17h52min de 21 de agosto de 2013 (UTC)Responder

Qual a diferença? Rjclaudio msg 17h55min de 21 de agosto de 2013 (UTC)Responder
Rjclaudio, eu já ia dizer que new_text é o novo HTML da página, mas acabo de ver que há também new_html. Segundo a (pouca) documentação a new_text é o "novo texto da página, sem qualquer formatação". Compare as variáveis no registro 1380064. Helder.wiki (discussão) 18h15min de 21 de agosto de 2013 (UTC)Responder
Então, o ideal não é usar o new_text mesmo? Assim se tiver só uma url sem nada, com new_text vai dizer que não há letra minúscula, mas com o new_wikitext vai dizer que há. O mesmo para imagem, um artigo só com uma imagem e todo o resto do texto escrito em maiúscula vai dizer que há letra minúscula, quando não há, só há uma imagem mesmo.
Vai causar alguns poucos problemas, como uma tag 'gallery' aberta no início sem fechar, que deixa o new_text vazio mas o new_wikitext vai aparecer todo o texto escrito. Rjclaudio msg 18h24min de 21 de agosto de 2013 (UTC)Responder
Rjclaudio, veja por exemplo este registro do filtro 113 (de páginas novas sem fontes. Se copiar o conteúdo de new_wikitext para a página de testes e mostrar a previsão, verá que aparece conteúdo. No entanto a variável new_text nem sequer está definida (consequentemente, aquela edição não é deixou de ser detectada pela versão atual do filtro 113). Outros exemplos similares: 1390325 e 1390276. Helder 13h22min de 16 de outubro de 2013 (UTC)Responder

Filtro 88 - PN em Categoria Discussão

Página nova em Categoria Discussão
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 4
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
A discussão a seguir está marcada como respondida (Adicionado aviso e etiqueta). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Esse filtro está bem objetivo, e vi as páginas que ainda existem que foram criadas de abril pra frente procurando falso-positivos. Podemos mudar para um aviso? Algo do tipo:

Atenção: o sistema identificou automaticamente que a edição inseriu um comentário em uma página de discussão de uma categoria.

Poucos usuários vigiam páginas de categorias, e por isso é provável que o seu comentário não seja visto e fique sem resposta. Sugerimos que coloque seus comentários no Café dos categorizadores que possui mais visibilidade.

Se considera que o comentário está no local mais indicado, pode pressionar novamente o botão "Gravar/Salvar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

E escrevendo esse aviso, pensei que podiamos ampliar o conceito para outras páginas, por exemplo, discussão de predef e discussão de livros, que poucos vigiam. Rjclaudio msg 14h27min de 11 de agosto de 2013 (UTC)Responder

Concordo com o aviso e com a idéia de expandir o conceito para outros domínios. A priori, tudo que não está no domínio principal e anexo é pouco vigiado.OTAVIO1981 (discussão) 12h02min de 12 de agosto de 2013 (UTC)Responder
Feito Aqui. Aviso + Etiqueta. Rjclaudio msg 15h25min de 13 de agosto de 2013 (UTC)Responder

Filtro 113 - Página nova sem referências

Página nova possivelmente sem referências
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 32
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas


Padrões que (não) devem ser detectados

Esse filtro não deveria detectar também Ligações externas e bibliografia? Talvez "livro" ou isbn. Muitos novatos não vão criar o artigo do zero já com uma seção de referências, e as vezes as referências estão nas ligações externas, nesses casos fica difícil tomar alguma ação mais 'forte'. Se não há ref nem ligações externas nem bibliografia é uma coisa (daria para avisar), mas se não há ref mas há ligações externas é outra coisa (eu colocaria só uma etiqueta). Quem sabe dividir em dois filtros, para separar em duas prioridades / urgências. Rjclaudio msg 14h25min de 19 de julho de 2013 (UTC)Responder

E também a url pura, pois acontece do novato adicionar a url no final do artigo. Talvez tb detectar "Fonte". Rjclaudio msg 14h29min de 19 de julho de 2013 (UTC)Responder
Quanto ao filtro propriamente dito, eu mesmo não gosto muito da ideia, mas criei essa versão inicial para que os interessados (vide Wikipédia Discussão:Projetos/AntiVandalismo#Artigos criados sem referências) possam analisar se é viável/vale a pena...
Em relação ao etiquetamento, na verdade acho que precisamos até fazer uma consulta com os que patrulham as mudanças recentes para ver se e quais etiquetas estão sendo usadas, pois suspeito que estejamos criando etiquetas à toa. Se ninguém tiver a intenção de patrulhar somente edições de um tipo X, não vejo necessidade de ter uma etiqueta X. Helder 14h42min de 19 de julho de 2013 (UTC)Responder
Essa regex que sugeri é a que uso no script que faz a avaliação automática, mas olhando melhor e vendo as predefinições da categoria:!Predefinições para referências, acho que poderíamos deixar o filtro mais flexível colocando Predefinição:Cód, e no que ele não pode ter para ser acionado Predefinição:Cód (baseado na categoria:!Predefinições para desambiguações). O "\{\{Ref" consegue pegar a maioria das predefinições para referências, acho que o "https?" consegue pegar as ligações externas. Danilo.mac(discussão) 16h26min de 19 de julho de 2013 (UTC)Responder
Alterei a expressão regular com base na sua sugestão:
  • Era assim: \{\{(?:[Rr]ef(?:er[eê]ncias|-?section|list)|[Rr]odapé referências)|==.*?[Rr]eferências.*?==
  • Mudou para: \{\{(?:[Rr]ef|[Nn]otas|ISBN)|==.*?(?:[Rr]eferência|[Bb]ibliografia).*?==|https?://
Não usei "(?:[Nn]otas e )?(?:[Rr]ef|ISBN)" porque não há nenhuma predefinição cujo nome começa com "Notas e ISBN". Helder 12h55min de 23 de julho de 2013 (UTC)Responder
Eu veria também o texto puro sem ser predef. Mais fácil o novato escrever == Notas == ou == Referências == (as vezes até sem a seção, só escrevendo em negrito) que usar a {{Referências}}. Rjclaudio msg 13h02min de 23 de julho de 2013 (UTC)Responder

─────────────── Acho que seria bem vinda uma lista (tão completa quanto possível) de strings que deveriam ser tratadas como se fossem uma indicação de que há referências, para podermos fazer uma regex otimizada para tal lista. Vejam este exemplo que mostra o que é detectado (e o que não é) pela versão atual. Helder 13h37min de 23 de julho de 2013 (UTC)Responder

Acho que só o "http" já pega a grande maioria das referências, o que pode talvez ficar de fora disso são alguma referência para livro que não comece por "{ref" ou "{ISBN" ou predefinições que já incluem um endereço sem precisar passá-lo como parâmetro, e para essas, essa regex já pega praticamente todos tipos mais comuns de seção de referências. Dentro de todo {{citar web}}, por exemplo, existe um "http" e existe uma seção de referências na página, então mesmo que o filtro não detecte essa predefinição ele pegará esses outros elementos geralmente associados a ela. Acho que o que poderíamos adicionar para garantir uma maior redundância e evitar falsos positivos é "<ref" e "{{[Cc]it[ae]" e tornar essa regex case-insensitive. Olhei os últimos 50 registros do filtro e não encontrei falsos positivos, em breve olharei uma amostra maior.Danilo.mac(discussão) 20h16min de 23 de julho de 2013 (UTC)Responder

Eu acho errado que o filtro detecte "bibliografia" como o faz agora, bem como que passe a detectar "ligações externas". Bibliografia é leitura adicional recomendada, assim como as ligações externas. Podem ser material utilizável para expandir o artigo no futuro, mas não são as fontes usadas para a escrita do artigo até então. Em uma votação recente sobre verificabilidade, foi mostrado que não há consenso sobre referências, bibliografia e ligações externas serem sinônimos. Também, não vejo sentido em não se incluir "fonte(s)" para detecção, pois estas sim, a menos que seja VDA (o que é errado), é sinônimo de referências.--Mister Sanderson (discussão) 20h41min de 26 de julho de 2013 (UTC)Responder

Adicionei o domínio anexo nas regras do filtro. Rjclaudio msg 20h43min de 31 de julho de 2013 (UTC)Responder

  • Especial:Registro de abusos/1370312 estava escrito no final "Fontes de informaçao- www.[site omitido].com.br" . Mudei o filtro para detectar também o "www." como indicador de site pois as vezes não se coloca o http:// na url. Pensei em colocar também a detecção por "fonte", talvez quando escrita no início da linha (ou em uma lista), para pegar casos que falam no final do artigo "Fonte: Revista xxx" , que só poderia ser detectado buscando "fonte". Rjclaudio msg 15h40min de 8 de agosto de 2013 (UTC)Responder
Feito adicionei no filtro a detecção de "fonte". Rjclaudio msg 03h11min de 15 de agosto de 2013 (UTC)Responder

Ainda não analisei o filtro profundamente. Entendo que deveria ser a última barreira de edição a ser implementada. O filtro dispara com praticamente todas as páginas criadas que incluem disparates óbvios e até tentativas de salvamento do filtro 66, por exemplo. Fica complicado analisar a eficiência do filtro perante edições boas diante de tantas edições ruins. Meu entendimento é que precisamos mensurar o impacto do filtro numa relação de "páginas válidas sem ref" (isto é, não dispararam outros filtros) pelo total de "páginas válidas com ref" criadas por IPs e não-confirmados. O que acham?OTAVIO1981 (discussão) 17h21min de 8 de agosto de 2013 (UTC)Responder

Concordo que esse filtro deveria ser a última barreira.
Eu só removeria da avaliação as edições que dispararam filtros que desabilitam a edição. Afinal, temos alguns filtros do tipo "página possivelmente fora do escopo do projeto" que apenas exibem um aviso e essas páginas criadas são importantes para a análise desse filtro de refs.
Rjclaudio msg 17h40min de 8 de agosto de 2013 (UTC)Responder
Mudei o filtro para não ativar em páginas com menos de 70 bytes, justamente para nossa lista ter menos "páginas não-válidas e sem ref" e facilitar a análise (menos coisa para ver) ficando mais precisa (analisar só o que precisa ser analisado).
Por mim até aumentaria esse valor para 100, ou 150 (o nosso filtro de teste de PN mínima é até 150), pra separar a análise pra apenas artigos com conteúdo razoável
Rjclaudio msg 03h11min de 15 de agosto de 2013 (UTC)Responder

Falsos positivos

Acho que estão sendo rigorosos demais com a análise do filtro.

Acredito que os únicos erros dessa lista são o primeiro (redirect) e o último (desambiguação). O caso da desambiguação não é o único realmente difícil de resolver? Qual o período que o filtro precisa passar por análise para ser considerado seguro, caso os erros detectados sejam resolvidos? Diga Sério Comendador (discussão) 23h26min de 5 de agosto de 2013 (UTC) SOCK. TheVulcan (discussão) 16h19min de 23 de agosto de 2013 (UTC)Responder

Nos casos em dúvida, melhor marcar como falso positivo do que negativo. Para mim, não basta dizer que o filtro detecta correctamente uma página nova sem referências, mas também que não interfere com o processo normal de edição de um artigo. Por exemplo, se alguém quiser começar uma tradução e só depois (num tempo razoável) incluir as referências, deve ser impedido de o fazer? --GoEThe (discussão) 09h24min de 7 de agosto de 2013 (UTC)Responder
Na minha opinião, sim. Talvez pareça meio tirânico exigir de um voluntário que faça o serviço completo, mas quem sabe fazer uma tradução e acrescentar nela as referências, se for impedido de gravar sem referências da primeira vez, vai se habituar a traduzir já com referências (o que não é tão difícil). A prática tem mostrado que pelo contrário, a maioria das traduções começa sem fonte e elas nunca são acrescentadas, o que faz com que a categoria dos sem fontes nunca esvazie. Eu acho que esse filtro no final das contas será educativo, as pessoas vão se acostumar a criar artigos já com fontes. Diga Sério Comendador (discussão) 01h29min de 8 de agosto de 2013 (UTC) SOCK. TheVulcan (discussão) 16h19min de 23 de agosto de 2013 (UTC)Responder
Falei em traduções, mas poderia ser um artigo escrito de raiz. Porque não posso inserir as fontes todas quando acabar de escrever o artigo em 10 minutos. Diz que "A prática tem mostrado que (...) a maioria das traduções começa sem fonte e elas nunca são acrescentadas", por isso é que é importante marcar os casos quando um artigo começa sem fonte, mas rapidamente as recebe, para sabermos qual a percentagem dessa maioria e termos ideia de quantos editores bem intencionados e cumpridores estaríamos a importunar com avisos e restrições que não se aplicam a eles. Não acho que devemos obrigar editores cumpridores a mudarem o seu método de trabalho por causa de outros que não cumprem, principalmente se for fácil contornar o filtro incluindo um url ou algo do género. GoEThe (discussão) 11h37min de 8 de agosto de 2013 (UTC)Responder
Não precisaria inserir as fontes todas, bastaria inserir apenas uma. Teremos casos de páginas irrelevantes que serão "validadas" com um link qualquer, mas pra isso existe o patrulhamento. E nesse caso sou pelo pró-Wikipédia, o que for melhor pra comunidade deve ser feito. Se vamos mudar um pouco o método de trabalho para alguns editores (mas não é nada absurdo, afinal, por que ele precisa salvar logo o artigo sem fontes? Não tem bloco de notas? Não pode salvar como esboço?) mas vamos beneficiar o trabalho dos que patrulham e dar a eles mais tempo livre para escreverem mais artigos novos, isso no final vai resultar num ganho enorme pra todos.
Mas ainda temos esta alternativa sugerida pelo Argenti que parece que resolve o seu problema. Diga Sério Comendador (discussão) 21h20min de 8 de agosto de 2013 (UTC) SOCK. TheVulcan (discussão) 16h19min de 23 de agosto de 2013 (UTC)Responder

Filtro pode tomar outra ação?

Peço que respondam esta minha dúvida aqui. Diga Sério Comendador (discussão) 23h35min de 5 de agosto de 2013 (UTC)Responder

Fui respondido pelo Otavio. Diga Sério Comendador (discussão) 21h39min de 8 de agosto de 2013 (UTC) SOCK. TheVulcan (discussão) 16h24min de 23 de agosto de 2013 (UTC)Responder

Análise do filtro

Está meio impossível de analisar o filtro porque ele dispara com todo tipo de tentativa de criação de artigo. Talvez fosse o caso de deixar uma condição de ele só rodar se não tiver disparado os outros filtros de criação.OTAVIO1981 (discussão) 20h41min de 1 de setembro de 2013 (UTC)Responder

Coloquei exceção para PN em maiúscula, sem espaço e autobiografia. Não sei quais seriam as outras exceções a colocar pois fica difícil replicar toda a regex dos outros filtros, deixaria esse filtro com muitas condições (pesado). Rjclaudio msg 13h52min de 4 de setembro de 2013 (UTC)Responder
Vou ser bem sincero. Achei que outros editores iriam se interessar em acompanhar pelo menos este filtro e, quem sabe, participar na discussão de outros assim aumentando a participação na tarefa mas obviamente me enganei. O que ocorre é que ele está fazendo exatamente isso: consumindo condições. Só vou olhar para ele quando os outros estiverem rodando bem. OTAVIO1981 (discussão) 15h38min de 4 de setembro de 2013 (UTC)Responder
Se ninguém estiver interessado em olhar melhor desabilitar ele, e quando aparecer interessado habilitar de novo. Não será nada difícil achar novas detecções assim que reativarmos. Rjclaudio msg 15h58min de 4 de setembro de 2013 (UTC)Responder
Desabilitei. Rjclaudio msg 01h57min de 5 de setembro de 2013 (UTC)Responder

Acrescentei o registro de abusos com o filtro 113 e vou ajudar a monitorar o comportamento do filtro.Sampayu 16h57min de 16 de outubro de 2013 (UTC)Responder

Parece-me que o filtro está impedindo os usuários registrados de criarem a página de usuário deles, caso eles não incluam uma referência na página. Ao meu ver, isso não faz sentido, já que o usuário é a fonte primária das informações que ele insere a respeito dele mesmo. Alguém viu isso?Sampayu 17h11min de 16 de outubro de 2013 (UTC)Responder

O filtro não está configurado para impedir ações (veja as opções marcadas em "Ações tomadas quando correspondido" no código do filtro) e somente assinala a edição no registro. E o que está percebendo não é possível pois o filtro atua somente no domíno principal (0) e anexo (102). Se existe alguma edição não sendo salva é porque disparou em conjunto com outro filtro configurado para tal. Este é exatamente um dos problemas do filtro: dispara com muitos outros e é complicado eliminar este ruído. Não podemos dar o mesmo tratamento de um artigo novo claramente ofensivo com uma edição de boa fé.OTAVIO1981 (discussão) 17h20min de 16 de outubro de 2013 (UTC)Responder
Mmm, agora entendi.Sampayu 18h16min de 16 de outubro de 2013 (UTC)Responder

Após analisar alguns casos por amostragem, deparei-me com o primeiro caso (que eu vi) de usuário dando "golpe" para burlar o filtro 113:

  1. O usuário (IP) tentou criar o artigo Amizade que virou amor mas foi barrado pelo filtro.
  2. Daí o mesmo usuário (IP) criou o artigo Amizade que virou amor só que incluiu uma tag ref e com isto conseguiu criar o artigo.

Infelizmente, esse tipo de atitude (burla) é mais difícil de pegar. Que raiva que dá quando vejo essas pessoas inserindo esse tipo de conteúdo na Wikipédia, grrr! Falta do que fazer.Grr...Sampayu 18h14min de 16 de outubro de 2013 (UTC)Responder

Citação: Sampayo escreveu: «foi barrado pelo filtro» - Novamente, o filtro não está impedindo nada, ver a página do registro "Ações tomadas: nenhuma"). Deixa ele quieto (sem ação) por uns dias só para confirmar que não teve nenhuma regressão (como teve a pouco tempo) e depois aumentamos o nível. Rjclaudio msg 18h29min de 16 de outubro de 2013 (UTC)Responder
Dois minutos após ter registrado este comentário, li o comentário do Otavio e respondi com aquele Mmm, agora entendi. Enfim: agora eu entendi. AlegreSampayu 20h04min de 16 de outubro de 2013 (UTC)Responder

Sampayu, se você for no histórico do artigo verá um link para "registro do filtro de edições" e lá poderá verificar se outro filtro disparou em conjunto e impediu a edição. Neste caso, disparou com o 98 mas o editor não foi sequer avisado.OTAVIO1981 (discussão) 18h44min de 16 de outubro de 2013 (UTC)Responder

Entendi. Obrigado.muito bom !Sampayu 20h04min de 16 de outubro de 2013 (UTC)Responder
  • Uma vez constatado que o filtro é capaz de detectar o que se propõe a fazer será passado ao modo aviso e precisamos decidir que tipo de artigo vai contar para a eficiência dele. Explico, este caso, por exemplo, foi feito de má fé então se o editor incluisse uma ref falsa não detectando na segunda instância geraria trabalho do mesmo jeito para a comunidade. O filtro será bastante capaz de detectar uma grande variedade de outros problemas mas isto não pode ser tomado em consideração se o propósito é que se inclua refs. Dito isso, meu entendimento é que só devemos analisar quando passar ao modo aviso os artigos em que é a boa fé é presumida e o único problema do artigo é a falta de fontes. O que acham?OTAVIO1981 (discussão) 14h14min de 17 de outubro de 2013 (UTC)Responder
    • Não sei se entendi sua proposta. O que você sugere é que sejam analisados somente os artigos - incluídos ou editados por usuários registrados - em que o único problema seja a falta de refs? E que nos demais casos o filtro automaticamente adicione o aviso? É isso?Sampayu 14h52min de 17 de outubro de 2013 (UTC)Responder
      • Ele está falando da análise da eficiência do filtro, e não das ações do filtro. A ideia do filtro é afetar as edições de boa-fé, então devemos considerar as edições de má-fé na nossa análise? Um usuário que crie uma página só com xingamento vai ativar o filtro e receber um aviso, e pode ser que ele desista de criar a página (ou não), devemos também considerar esses casos? Eu acho que sim, se ele desistir da edição de má fé será algo bom, se não desistir será neutro, então até nesses casos o filtro seria útil. Podemos até colocar menos peso nessa análise (uma análise secundária / a parte), mas é útil. Rjclaudio msg 15h17min de 17 de outubro de 2013 (UTC)Responder
        • Ah, agora entendi. É, também acho importante observar as edições de má fé. Esse tipo de informação é útil para se analisar tanto a eficiência quanto a eficácia geral do filtro.Sampayu 16h22min de 17 de outubro de 2013 (UTC)Responder
          • Acho que fazer a análise considerando as duas possibilidades é o melhor caminho. Vamos então ter seis combinações:
Edição ação resultado
Má fé não salvou Simpositivo
má fé salvou sem fontes Não negativo
má fé salvou com fontes Não negativo
boa fé não salvou Nãonegativo
boa fé salvou sem fontes Não negativo
boa fé salvou com fontes Sim positivo

Sampayu, recomendo ativar o script que ajuda a fazer a análise, daí combinamos os comentários para fazer durante a análise facilitando a contabilização posterior.OTAVIO1981 (discussão) 16h36min de 17 de outubro de 2013 (UTC)Responder

Obrigado. Ativei os scripts. Dúvida: quando eu fizer a análise, coloco nas observações um texto de acordo com a tabela acima? Vide este exemplo e também este outro exemplo.Sampayu 21h09min de 17 de outubro de 2013 (UTC)Responder
Adendo: pelo que já se pode observar, um caso típico de "boa fé, salvou sem fontes" será aquele em que o editor estiver começando a traduzir um artigo de outra Wikipédia mas ainda não tenha chegado à parte em que surge(m) referência(s) e/ou menção/menções a ela(s).Sampayu 21h55min de 17 de outubro de 2013 (UTC)Responder

Já passou um tempinho (estamos no 3º dia com o filtro avisando), e com +250 registros, ou seja, pelo menos 125 tentativas de criar um artigo. Como já temos algumas análises, como está o resultado parcial?

Eu considerei como boa fé algumas biografias / bandas / empresas que mesmo não tendo relevância, percebe-se que havia um interesse em criar um artigo válido para a wikipédia, o usuário 'apenas' não sabia dos 'limites' das nossas regras (não é sobre tudo), e não chegou a fazer um spam explícito, e para decidir se o artigo era válido ou não era necessário um olhar humano. Então algumas ER-Bio, ER-Spam (q não é spam, é só empresa sem notoreidade), ESR-BSRE, ESR-Banda que foram eliminadas, eu considerei como de boa fé.

Então, pelo o que eu vi:

  • má fé, não salvou: há alguns poucos casos em que é má fé e o usuário desiste de salvar
  • má fé, salvou, com fonte (falsa): vi poucos artigos desses (digo 'má fé', e não 'sem relevância')
  • má fé, salvou, sem fontes: muitos artigos, mas que caso o filtro mude para impedimento eles seriam impedidos e seria benefício.
  • boa fé, salvou, com fonte, artigo eliminado: há alguns casos de boa fé que o usuário adiciona fontes, mas o artigo é impróprio e é eliminado por ER / ESR. Não é o ideal (o melhor seria ele não ter criado), mas aí já é questão de notoriedade, e está um nível acima. Ao menos isso ajuda para avaliar a notoriedade, ao ver que a 'melhor' fonte adicionada foi uma fonte 'fraca'
  • boa fé, não salvou, orientação: tem casos que o usuário não salva, mas o aviso serve de orientação, por exemplo, 1429783 (detalhes | examinar): detecção correta, que ele não salvou o artigo mas pouco depois criou outro artigo e dessa vez com fonte.
  • boa fé, salvou, sem fontes, adicionando depois: só vi 1 caso que o usuário criou sem fontes e adicionou as fontes depois, na maioria das vezes que o artigo tinha fonte, elas foram adicionadas logo na primeira vez quando o usuário viu o aviso. Então parece que um filtro com impedimento não atrapalhar muito os usuários com boa fé
  • boa fé, salvou, sem fontes: há vários casos, mas quase todos eles tem informações específicas / desenvolvidas que não dá para escrever de memória e o autor se baseou em alguma fonte mas ele não adicionou essa fonte, talvez por ser um blog ou alguma fonte não fiável.

Acho que testar apenas com um aviso e permitindo o salvamento não vai dar muitos resultados para o teste, pois temos que saber se o usuário iria desistir de criar o artigo ou se iria adicionar a fonte, e pra isso o aviso tem muito pouco efeito (tem algum, mas pouco).

Rjclaudio msg 15h22min de 23 de outubro de 2013 (UTC)Responder

  • autorrevisores e falso-positivo: vi 3 artigos criados pelo Kaktus Kid que estavam sem fontes mas usavam a {{Normdaten}} para linkar para fontes fiáveis, exemplo Alexander Tselikov. Seria necessário adicionar essa predef (e outras do tipo) nas nossas exceções do filtro? E o mais importante, o usuário nem notificou o 'erro' do filtro para arrumarmos, reforço que precisamos de uma campanha de conscientização principalmente para os usuários experientes ajudarem no filtro. Rjclaudio msg 15h25min de 23 de outubro de 2013 (UTC)Responder
    • Rjclaudio, podemos mudar para o modo desautorizar daqui a dois dias e depois de 5 retiramos os avisos para discutir a eficiência do assunto. O volume de disparos é muito alto dá para testar as duas possibilidades (só avisando e avisando/desautorizando) em dez dias. Sobre a Normdaten, aquilo não é uma fonte. Sds, OTAVIO1981 (discussão) 16h08min de 23 de outubro de 2013 (UTC)Responder
      • Vi que o OTAVIO1981 efetuou esta inclusão e a marcou como um Não falso positivo. A análise refere-se a esta inclusão, que diz respeito à criação, a meu ver de má fé (era publicidade evidente e o rodapé do artigo foi "assinado" com o nome do autor do livro), de um artigo novo, sem fontes, que fala a respeito de um livro que existe e do autor dele, que também existe.
      • Fiquei sem entender por que que ele marcou como "falso positivo": se se trata de uma página nova criada sem referências e a análise do filtro apresentou corretamente a pergunta Foi correto classificar esta ação como "Página nova possivelmente sem referências"?, então a resposta só pode ser Sim "sim", portanto a detecção deve ser marcada como Sim correta: o filtro 113 corretamente detectou uma tentativa de inclusão de uma página sem fontes. O que não significa, é claro, que o resultado final dessa inclusão tenha sido positivo: o resultado final, esse sim, foi Não negativo, já que o autor mesmo assim criou o artigo, e sem mencionar fontes (o que, conforme a tabela acima, que contém as seis combinações possíveis, enquadra-se em um dos 4 resultados indesejáveis).
      • Afinal: estamos avaliando a capacidade de o filtro 113 detectar edições realizadas sem a inclusão de fontes ou estamos avaliando a qualidade do resultado final disso? Porque a pergunta que é feita na página de análise do filtro 113 induz-me a considerar a primeira possibilidade (apenas julgar se o filtro foi ou não capaz de detectar a presença ou ausência de referências), para que, em um segundo momento, seja feita a tabulação dos dados dessa análise para julgar se os resultados finais obtidos foram ou não os esperados/desejados.Sampayu 02h15min de 24 de outubro de 2013 (UTC)Responder
Estamos avaliando o resultado final. A pergunta que aparece pelo script é a pergunta padrão, que é útil para quase todos os outros filtros que estamos testando, mas não para esse, que o que queremos é saber se vale a pena um filtro desses e não se o filtro está tecnicamente funcionando. Embora eu já tenha comentado alguma vez no passado esse 'problema' de não poder separar problema técnico do filtro que deve ser corrigido, com problema de eficiência do filtro que deve ser analisado.
Um bom exemplo é o filtro de ofensas, que o filtro detecta corretamente uma palavra (parte técnica) mas a palavra não está em um contexto de ofensa (parte de eficiência) que estamos colocando como falso-positivo, tinha que separar as duas situações, e as situações que o filtro detecta indevidamente a palavra (parte técnica) que também é falso-positivo quando essa situação deveria ter mais destaque e ser corrigida com mais urgencia. Rjclaudio msg 12h33min de 24 de outubro de 2013 (UTC)Responder
Pois é, eu concordo com essa lógica de que se deve separar os dois tipos de análise. Mas entendi o argumento: a análise técnica já foi feita e a eficácia técnica já foi constatada, restando avaliar a eficácia qualitativa, contextual. Ok. muito bom !Sampayu 16h10min de 24 de outubro de 2013 (UTC)Responder
Acho que o Cláudio explicou bem a questão. Uma vez que a regex de detecção esteja pronta o filtro sempre irá disparar quando ela surgir e aí resta avaliar se o caso está no contexto que se deseja filtrar ou não. Em outras palavras, o filtro está funcionando do ponto de vista técnico pois todos os artigos que apareceram não tinham fontes mas a sua eficiência está atrelada a uma inclusão no segundo momento que é a função que estamos dando a ele. A condição ótima aqui é ter um aviso ao editor e não haver um segundo disparo (a etiqueta) mas o artigo ter sido salvo com fontes. Se a regex está correta, o filtro sempre vai detectar a palavra que estamos procurando ou que não queremos encontrar. Idealmente, a etapa correta seria o filtro somente etiquetar e a comunidade reportar todos os casos em que o artigo não tem fontes e não foi etiquetado para melhorarmos a regex mas esta etapa foi pulada porque considerou-se a regex correta. Podem haver ainda casos em que o artigo é criado sem fontes mas o filtro não está disparando. OTAVIO1981 (discussão) 15h16min de 24 de outubro de 2013 (UTC)Responder
Entendi. Ok, vou corrigir meus checks, então.Sampayu 15h49min de 24 de outubro de 2013 (UTC) Feito! SimSampayu 16h10min de 24 de outubro de 2013 (UTC)Responder

favorito O filtro 113 não está detectando as fontes que são incluídas por intermédio da predefinição {{IMDb título}}. Essa predefinição faz parte de todo um universo de predefinições de ligações externas que aparentemente não estão sendo detectadas pelo filtro 113.Sampayu 03h57min de 24 de outubro de 2013 (UTC)Responder

IMDb não é fonte. Concordo que não esteja pegando essas predefs, mas elas sempre são adicionadas na seção =Ligações externas= então se o filtro detectar essa seção já seria suficiente. Só teria 'problema' em algumas infoboxes que tem isso. Rjclaudio msg 12h33min de 24 de outubro de 2013 (UTC)Responder
Essa é uma questão controversa, pelo fato de o IMDB ser uma fonte (e ser verificável), porém não ser 100% fiável (e é aí que reside a controvérsia). Como consta no próprio website do IMDB, eles possuem uma equipe administrativa que verifica, uma a uma, as inclusões dos colaboradores (internautas). Essas verificações são feitas junto aos estúdios e diretores, por isto o conteúdo ganha bastante fiabilidade. Eu mesmo sou um dos contribuidores do IMDB e já vi contribuição minha demorar literalmente meses para ser incluída, justamente porque eles estavam verificando a consistência e veracidade da minha inclusão. O problema é que nenhum processo de verificação é perfeito e infalível, então há erros, sim, no IMDB. Mas o IMDB é o banco de dados mais fiável atualmente disponível, a respeito de filmes. Daí ser questionável afirmar que o IMDB não pode ser usado como fonte. Mas enfim: para não saírmos do foco, independentemente de IMDB poder ou não ser usado como fonte, aqui na Wikipédia, é fato que vários wikipedistas incluem fontes somente na seção "ligações externas", mas daí a o filtro 113 detectar as fontes são outros 500. Principalmente porque pode haver fontes legítimas e outras não. É muito subjetivo e neste caso só uma análise humana pode sanar a questão.
É por esta e outras que eu não me sinto confortável com a ideia de o filtro impedir a criação de um artigo, por exemplo. Essa discussão é muito filosófica e talvez jamais cheguemos a um consenso a respeito disso, aqui na Wikipédia, hehe.Sampayu 15h49min de 24 de outubro de 2013 (UTC)Responder
Citação: Sampayu escreveu: «é fato que vários wikipedistas incluem fontes somente na seção "ligações externas", mas daí a o filtro 113 detectar as fontes são outros 500» -> Repetindo: Citação: rjclaudio. Acha suficiente? Vale o filtro passar a buscar isso também?
Na prática serão poucos os artigos que terão uma seção de ligações externas mas não terão uma url (que o filtro detectaria), então serviria mais para as ligações externas que usam predef. Aí acabamos não aceitando uma ligação externa do tipo {{imdb|xxx}} mas aceitariamos uma ligação externa no tipo [http://www.imdb.xxx].
Haveria algum falso positivo com artigos que usam {{correlatos}} e similares pois alguns usuários criam uma seção de Ligações externas só para colocar essas predefs, mas se o usuário sabe usar essa predef ele sabe colocar fonte ou ao menos uma url, então não esses erros terão pouco peso. Rjclaudio msg 21h19min de 24 de outubro de 2013 (UTC)Responder
Há diferentes tipos de fonte:
  • Referências: aquelas que foram consultadas pelo autor para, baseando-se nelas, elaborar o texto.
  • Citações: aquelas cujos trechos são transcritos, geralmente entre aspas, dentro do corpo do artigo.
  • Bibliografias: livros que servem de leitura recomendada para complementar, aprofundar e/ou expandir conhecimentos a respeito do tema do artigo.
  • Ligações externas: aquelas que não são bibliografias mas estão disponíveis em formato digital e, embora não tenham sido utilizadas para a composição do artigo, a leitura delas permite compreender melhor ou mesmo ampliar conhecimentos a respeito do tema, ou seja, surtem no leitor um "efeito cognitivo" similar ao das bibliografias.
Entendo que todos esses tipos de fontes devam ser consideradas "fontes" (genericamente), embora somente as "referências" e as "citações" sejam usadas no corpo do artigo (elas são usadas para respaldar as afirmações que são feitas ao longo do texto do artigo), daí a importância de detectá-las. Mas não sou programador e não sei quão complexo pode ser adaptar o filtro a isso. E "referências" é uma palavra genérica, também: se eu me basear em uma ligação externa ou em uma bibliografia para elaborar o texto do artigo, então essa fonte passa também a ser do tipo "referência".
Se for possível o filtro também considerar como "contendo fonte" todo artigo que contenha ao menos uma predefinição de ligação externa, talvez no fim das contas isso facilite o trabalho e elimine alguns falsos positivos. Dei uma olhada na categoria predefinições de ligações externas e vi que há muitas predefinições dentro dessa categoria. Mas eu posso fazer um "pente fino", averiguar quais dessas predefinições são de fato utilizadas para apontar para fontes, e daí crio então uma subcategoria (intitulada "Filtro113", por exemplo) dentro daquela categoria e adiciono essas predefinições à tal subcategoria Filtro113. Daí basta colocar o filtro 113 para também considerar como "contendo fonte" o artigo que possuir alguma predefinição que pertença à tal subcategoria. O que acha(m)? Isso seria tecnicamente viável?Sampayu 22h51min de 24 de outubro de 2013 (UTC)Responder

Vou marcar como falso-positivo os artigos que iriam para ESR-Bio/Banda ou ER-BSRE/Spam mas o usuário desistiu de criar o artigo, assumindo que há 'vontade' do usuário criar um artigo que ele acredita ser útil para a Wikipédia (vontade de ajudar, boa fé), mas que o filtro possa não ter orientado corretamente o usuário (afinal, é só colocar 'alguma' fonte, qualquer uma, até o site pessoal, o blog pessoal, até o facebook, quem quer criar adiciona qualquer link). Apesar de ter uma chance do usuário ter lido o link sobre fontes, e percebido que o artigo não teria fontes fiáveis adequadas para mostrar notoriedade, prefiro assumir que teve 'erro' de orientação, e o filtro pode estar 'afastando' usuários. Ao menos se o usuário buscasse ajuda, por exemplo, pelo WP:FALE ou WP:Café dos novatos, esse quesito 'orientação' aumentaria. Rjclaudio msg 19h30min de 9 de novembro de 2013 (UTC)Responder

Regressão

Rjclaudio, as alterações que fez recentemente causaram uma grande regressão (conferi com o novo script na Especial:Filtro de abusos/test), pois havia erros de lógica no código. Acredito que agora está certo. Helder 12h27min de 16 de outubro de 2013 (UTC)Responder

Aviso

O texto seguinte foi movido de: Wikipédia:Esplanada/propostas/Resposta à votação sobre a Reforma da Verificabilidade (31jul2013)#Balão de ensaio para o aviso a ser exibido

Atenção: o sistema identificou automaticamente que a edição não incluiu fontes ou referências no artigo, deste modo prejudicando a verificabilidade.

Por favor, insira fontes fiáveis antes de continuar. Acrescente a referência entre estas<ref>duas chaves</ref> e no final do texto acrescente a tag {{referências}}.

Caso seja uma edição de boa-fé, veja o nosso livro de estilo sobre como adicionar corretamente as referências.

Se considera que incluiu as devidas fontes, pode pressionar novamente o botão "Gravar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Uma breve descrição da regra com a qual a sua acção coincidiu é: $1

Discordo de utilizar a cor vermelha. Acho que não está de acordo com os padrões de acessibilidade mas como foi sugerido deixei para o debate. O aviso, quando concluído, deve ser salvo em MediaWiki:Abusefilter-warning-fontes para posterior inclusão no filtro.OTAVIO1981 (discussão) 12h55min de 16 de outubro de 2013 (UTC)Responder

A última linha é desnecessária, pois o nome da regra não acrescentará qualquer informação à mensagem. Também discordo do vermelho que, além de inadequado (pois para dar ênfase existem tags semânticas <em> e <strong>), não tem contraste adequado com o fundo branco.
Mas essa seção deveria ser movida para a página de discussão desse filtro em particular. Helder 13h03min de 16 de outubro de 2013 (UTC)Responder
O texto acima foi movido de: Wikipédia:Esplanada/propostas/Resposta à votação sobre a Reforma da Verificabilidade (31jul2013)#Balão de ensaio para o aviso a ser exibido

Sim Apliquei as sugestões do Helder e do Otávio. E. Feld fala 18h09min de 20 de outubro de 2013 (UTC)Responder

Sim Ativei o filtro, conforme consenso. E. Feld fala 18h09min de 20 de outubro de 2013 (UTC)Responder

Isso foi precipitado. O filtro ainda nem foi testado com a configuração de "apenas avisar". Não dá para ficar pulando as etapas desse jeito...
A configuração foi alterada para que o editor seja apenas avisado. Helder 09h28min de 21 de outubro de 2013 (UTC)Responder

Etiqueta

Se o filtro só age em páginas novas, e nas mudanças recentes, históricos, contribuições etc há indicação de quais páginas são novas, talvez "Página nova sem referências" possa ser simplificado para "sem referências". Helder 09h28min de 21 de outubro de 2013 (UTC)Responder

Concordo, simplificar. Rjclaudio msg 13h58min de 23 de outubro de 2013 (UTC)Responder

Parâmetros de análise

Na minha opinião os parâmetros da análise do filtro estão equivocados. Em primeiro, é preciso separar as primeiras análises (quando as configurações do filtro ainda não estavam completas) da análise que começou neste dia 20.

Se editor salva sem fontes, a edição não pode ser marcada como "falso positivo", pelo contrário, o filtro funcionou, só que não foi suficiente, sendo um indício a favor de avançarmos para a próxima etapa, ou seja, o teste no modo impedir gravação. Se o editor colocou uma fonte que não demonstra notoriedade, isso não cabe ao filtro detectar. Quando o período de testes acabar e o filtro tiver que ser rediscutido na Esplanada, um usuário menos atento vai achar que essa análise indica um mecanismo ineficiente, com vários erros, que deve ser descartado. Mas, ao contrário, o suposto mal funcionamento, indica simplemente que o modo atual ainda é insuficiente e que a atuação do filtro deve ser expandida.

Temos que separar na análise do filtro essas duas situações: na primeira, o o filtro "falha" por não impedir a gravação (casos de má-fé principalmente); na segunda, o filtro realmente falha, por impedir a gravação de algo que não deveria ter impedido. Essa última situação a meu ver é a única realmente problemática e ainda não percebi que tenha ocorrido. E. Feld fala 23h52min de 24 de outubro de 2013 (UTC)Responder

O nosso script de análise não tem opção de Sim, Não, Talvez, Quem Sabe, Não funcionou mas x, Não funcionou mas y. Só temos Sim / Não. E é pra isso que usamos os comentários, para explicitar esses detalhes. "Não" é pra tudo que o filtro não obteve o resultado ideal, e nos comentários explicamos se era, por exemplo, "boa fé e não salvou". Quem fizer qualquer comentário olhando apenas o Sim / Não vai ser um comentário supérfulo e indevido (errado), e desconsiderado. Pode olhar lá em cima em #Análise do filtro que qualquer análise vai considerar todas as várias situações, inclusive a minha análise tem umas 7 situações a considerar. Rjclaudio msg 02h44min de 25 de outubro de 2013 (UTC)Responder
Efeld, repare na tabela que está na seção indicada pelo Cláudio. O que propõe já está sendo feito mas a categorização específica de qual situação ocorreu só poderá ser contabilizada posteriormente. Não é intuito apresentar somente a contagem de Sim / Não à comunidade.OTAVIO1981 (discussão) 12h28min de 25 de outubro de 2013 (UTC)Responder

Ver Wikipédia:Esplanada/geral/Filtro 113 após período de testes (30out2013). E. Feld fala 05h22min de 30 de outubro de 2013 (UTC)Responder

Como é que "[...] salvou sem fontes" é falso positivo? E como é que se pode classificar de "boa fé" coisas como [35], só para dar um exemplo ao acaso? Se coisas dessas são para deixar passar, então para que vai servir o filtro? --Stego (discussão) 06h48min de 30 de outubro de 2013 (UTC)Responder

Se o objetivo do filtro é fazer o usuário adicionar fontes, se ele salvou o artigo sem fontes então o filtro não fez o devido papel dele.
Do mesmo modo, o objetivo do filtro é fazer o usuário adicionar fonte, para com essa fonte ficar mais fácil decidir a notoriedade do assunto. Então pelo o que entendi a ideia é separar vandalismos e coisas obviamente falsas, de páginas que poderiam ser válidas mesmo que seja uma BSRE, uma autobiografia, ou um curriculo.
Rjclaudio msg 10h55min de 30 de outubro de 2013 (UTC)Responder
Mas então, se o filtro deixou (ou deixaria) gravar sem fontes não é falso positivo, mas sim falso negativo. Se não permitiu gravar, então não é falso positivo, pois é suposto não deixar gravar sem fontes. Ou estou a ver mal? E qual é o critério de "boa fé" tão comum nas análises dos ditos "falsos positivos"? --Stego (discussão) 16h38min de 30 de outubro de 2013 (UTC)Responder
É verdade, tem um erro na terminologia utilizada. Artigos salvos sem as fontes são falsos negativos mas é possível pelo texto aplicado nos comentários separar cada situação. E o critério de boa fé vai variar para cada um. Provavelmente o que viria a ser marcado para ESR seria boa fé e o para ER má fé mas é uma situação subjetiva de qualquer modo. O ideal é que vários editores fizessem um pouquinho da avaliação. OTAVIO1981 (discussão) 16h59min de 30 de outubro de 2013 (UTC)Responder

Falso-negativo

Mudei a regex para [Ff]ontes?[^s\}] . Assim não reconhece Fontes} nem Fonte} . Pela busca que fiz na categoria de predefs sobre fontes, não achei nenhuma predef que termine com Fonte} que seja válida para indicar a existência de fonte, então não deve gerar falso-positivo. Embora tenha risco de existir algum redirect válido, acho que o risco é bem pequeno, e compensa para detectar as burlas com {sem fontes}. Rjclaudio msg 20h49min de 9 de novembro de 2013 (UTC)Responder

Análises antigas

Arquivei as análises antigas, para dar mais destaque pra esse teste de impedimento, facilitar a análise (buscar na página por "má fé", "ESR" e coisas similares, só dar resultado pro teste de impedimento). Sei que estávamos discutindo isso, sobre como arquivar, mas fiz logo isso aqui, qualquer coisa depois dos testes reverte o arquivamento. Rjclaudio msg 19h38min de 9 de novembro de 2013 (UTC)Responder

Orientação no aviso

Seria uma boa adicionar link pro WP:Café dos novatos / WP:FALE, pro usuário poder ter mais orientação? Pq o link pra Filtro/Solicitação é mais para 'erro da ferramenta', e o link pra página de ajuda não dá feedback pra gente se o usuário buscou ajuda ou não. Rjclaudio msg 19h30min de 9 de novembro de 2013 (UTC)Responder

E link pro Guia de criação de artigos? Vi um caso que o usuário depois foi criou outro artigo usando esse guia. (E alias, impressão que o guia adiciona automaticamente a predef de refs, e por isso todos os artigos criados ali vão automaticamente passar pelo filtro mesmo se não tiver ref) Rjclaudio msg 19h59min de 9 de novembro de 2013 (UTC)Responder

Concordo. Como resolver isso e o problema de cima enquanto o teste do filtro ainda está no início? Matheus diga✍ 20h19min de 9 de novembro de 2013 (UTC)Responder
Adicionei o link pro Guia de criação de artigos e pro Café dos novatos, não adicionei do Fale por ser redundante com o café. Depois temos que melhorar o nosso Guia de criação de artigos. Rjclaudio msg 20h56min de 9 de novembro de 2013 (UTC)Responder
Perguntei sobre quem está burlando o filtro com a {{sem-fontes}}. Como fazer com que isso não aconteça mais? Eduardofeld sabe? Descobri outra malandragem. Deixo o diff, mas como vou propor ER, então é melhor explicar aqui: o usuário redireciona um artigo para outro e depois desfaz o redirecionamento, criando o artigo sem fontes. É algo tão engenhoso que eu duvido que seja um novato fazendo isso, e tão trabalhoso que seria melhor citar logo a fonte. Isso não tira o mérito do filtro, por ser um caso pontual, mas se tivéssemos uma forma de impedir também essa burla, seria bom. Matheus diga✍ 22h04min de 10 de novembro de 2013 (UTC)Responder
Sobre a {Sem-fontes}, respondi acima #Falso-negativo, imagino que resolvido.
Pro redirect, não vejo um modo fácil de arrumar, até posso pensar em algo mais não será tão simples e sendo um caso pontual (ou mesmo só poucos casos) não vale a pena mexer. Sempre vai ter vários modos de burlar o filtro, eu mesmo posso pensar em vários, não tem como evitar, para um filtro 100% a prova de falhas vai ficar mais complexo e pesado.
Além do mais, se provavelmente é um usuário experiente fazendo isso, então ele realmente não quer colocar fonte, e qualquer melhoria no filtro ele vai simplesmente adicionar uma tag de ref qualquer com uma fonte qualquer e depois apagar. O filtro deve ser mais voltado para novatos, para orientá-los e barrar edições impulsivas indevidas, usuários experientes já tem experiência suficiente para burlar qualquer coisa.
Rjclaudio msg 22h38min de 10 de novembro de 2013 (UTC)Responder
Santa engenhosidade, Batman! Com o Cláudio: o filtro é uma ferramenta que pode ser burlada com facilidade tanto por novatos quanto por experientes. Os filtros de ofensas já demonstram isso com clareza. OTAVIO1981 (discussão) 22h52min de 10 de novembro de 2013 (UTC)Responder

Término do segundo teste no modo impedir gravação

Eu acabei desativando o filtro sem querer, mas já reativei. Observei no histórico que o filtro funcionou do dia 9 ao dia 16, às 12h40min UTC no modo impedir gravação. Há muitos registros ainda, portanto pergunto, em quanto tempo vocês acham que conseguirão terminar a análise? Citei o filtro num tópico da Esplanada. Estando ok, podemos propor a ativação final, tudo bem? Matheus diga✍ 17h27min de 16 de novembro de 2013 (UTC)Responder

Cheguei de viagem hoje, vou dar uma olhada essa semana, vendo também outras coisas mais macros: se os experientes que ativaram o filtro mudaram a rotina na criação de páginas, se as páginas de ajuda tiveram mais acesso, se o guia de criação de páginas foi mais usado, coisas do tipo.
Mas repetindo o que falei pro Otavio antes de viajar: Pelo o que vi até agora o filtro não causou nenhum dano aparente / óbvio para os experientes (passaram a colocar ref ao invés de desistir de criar artigo) nem para os novatos (fácil adicionar ref [mesmo ref inválida], o aviso parece claro, e parece mais amigável que criar artigo sem ref e depois ser "mal-tratado" por usuários marcando ER), e teve alguns benefícios (alguns usuários adicionando fontes, quando não teriam adicionado sem o filtro). Tem vários artigos burlando o filtro, como era esperado, mas não vejo como negativo.
Rjclaudio msg 17h02min de 18 de novembro de 2013 (UTC)Responder
Outra coisa. O filtro é uma ferramenta para ajudar a fomentar verificabilidade, mas não uma proibição da comunidade para criar artigos sem fontes. Se quiserem proibir é preciso discutir e pensar em outras ferramentas/políticas. Estou certo em relação a isto?OTAVIO1981 (discussão) 18h25min de 18 de novembro de 2013 (UTC)Responder
Por hora não é uma proibição, mas a comunidade pode decidir assim. Se o filtro for só para avisar, então é só um incentivo a verificabilidade e não uma proibição. Se o filtro for para impedimento, aí já está bem próximo da proibição e é possível que casos que passem pelo filtro (contorno de filtro, pelas brechas) passem a ser eliminados por ER/ESR, se a comunidade assim desejar. Mas também pode ficar no meio termo, com o impedimento mas sem fazer nada de diferente do normal caso contornem o filtro, aí é um incentivo mas sem proibição.
O ideal seria não ter nenhuma regra de ER por um tempo, até vermos os efeitos do filtro no médio prazo, e se as regras normais de ER e ESR são o suficiente. Rjclaudio msg 12h17min de 19 de novembro de 2013 (UTC)Responder

Consenso sobre manter o modo avisar

OTAVIO1981, depois do segundo teste você voltou o filtro para a opção apenas etiquetar. Mas eu tive a impressão que na primeira discussão já havia consenso para implantar o filtro definitivamente no modo avisar. Não? Matheus diga✍ 23h57min de 22 de dezembro de 2013 (UTC)Responder

Não tive esta impressão. Pra mim, foram feitos dois testes para ver a reação do editor às configurações do filtro. Tanto é que após o término do primeiro período o filtro o Efeld desativou o mesmo.OTAVIO1981 (discussão) 11h08min de 23 de dezembro de 2013 (UTC)Responder
Como eu disse em Wikipédia:Esplanada/propostas/Aprovar o filtro 113 em definitivo (20nov2013) o Sampayu e o Argenti, tentando encontrar consenso, propuseram que fosse aplicado definitivamente apenas o modo avisar, mas depois aceitaram o teste no modo impedir gravação. Mar França (discussão) 14h42min de 24 de dezembro de 2013 (UTC)Responder

690 a.C.

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#690 a.C..

Por Zeus, o que é isso?
Fui impedida de criar a página referente ao ano 690 a.C.por não incluir "fontes ou referências no artigo, deste modo prejudicando a verificabilidade." Algum especialista poderia me indicar fontes que provem que aquele fatídico ano existiu? Seria necessário providenciar um calendário da época? --Yone (discussão) 01h01min de 13 de julho de 2014 (UTC)Responder

Yone: as referências servem para comprovar as informações, mas como criou a página sem informação alguma (só colocou um cabeçalho), propus a eliminação. Helder.wiki (discussão) 01h12min de 13 de julho de 2014 (UTC)Responder
@Helder.wiki: considerando a natureza da página, fiz o cabeçalho (que dá mais trabalho) primeiro.
Não imaginei que houvesse tanta pressa em eliminá-la, já que é uma página de simples referência temporal.
Dá para esperar alguns minutos, para que eu possa providenciar os conteúdos? Obrigada. --Yone (discussão) 01h31min de 13 de julho de 2014 (UTC)Responder
Yone Fernandes creio que sim. Helder.wiki (discussão) 01h35min de 13 de julho de 2014 (UTC)Responder
@Helder.wiki:Muita gentileza sua. Sds.--Yone (discussão) 01h37min de 13 de julho de 2014 (UTC)Responder
Yone Fernandes: uma sugestão, se for trabalhar nos anos: pode ser mais interessante investir o tempo em preencher os itens do Wikidata com propriedades referentes a esses anos. No caso do 690 a.C., o item associado está bem menos completo do que, digamos, o item correspondente ao ano 1 a.C. ou ao ano de 2014. Helder.wiki (discussão) 01h45min de 13 de julho de 2014 (UTC)Responder

Filtro 6 - Artigo fora de escopo do projeto

Página nova fora do escopo do projeto
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 2
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

O referido filtro, que no momento está programado somente para avisar, teve somente 5 falsos positivos nas últimas 1000 ações. Na verdade, inclusive alguns destes falsos positivos foi inclusive um vandalismo continuado vide Jaime I da Inglaterra. Outro caso, a primeira versão foi eliminada mas foi recriado posteriormente. Cada ação do filtro é, N ações de eliminador fora o que não foi marcado pelos bots então acho que é hora de passar o filtro para o modo desautorizar. Talvez seja importante dar uma olhada no aviso e encaminhar o editor para uma página de testes.OTAVIO1981 (discussão) 14h18min de 26 de junho de 2013 (UTC)Responder

Analisei as 250 contribuições entre 22h24min de 15 de junho de 2013 e 09h21min de 3 de julho de 2013 e pelo que contei aproximadamente 61 foram salvas porém somente 2 mantidas. A mensagem de instrução do filtro é boa mas pela insistência não custava estender a análise para desautorizar.OTAVIO1981 (discussão) 13h43min de 3 de julho de 2013 (UTC)Responder
Desde 15 de junho, todas eliminadas. Se ninguém se opor até domingo, mudo para impedimento. Rjclaudio msg 12h15min de 10 de agosto de 2013 (UTC)Responder
Concordo, pelo já analisado. Porém, se o léxico de xingamentos vem de outro filtro que já desautoriza, aqui ele é desnecessário. Talvez o filtro funcione só com as strings "Vcs são" ou similares.OTAVIO1981 (discussão) 17h07min de 12 de agosto de 2013 (UTC)Responder

Acho que falei disso em alguma outra discussão sobre esse tema. Preferia separar em 'spam' (clique aqui), mensagem e opinativo (eu adoro, te amo, gostosa, me adiciona, tchau), perguntas (não achei, não sei, o que são, o que significa, quero saber, qual é), disparate (haha, kkkk, !!, ?!, !?, @) e ofensivo (não precisa de exemplos). Separando em cinco melhor para acompanhar que tipo de artigo que está disparando o filtro, analisar os falso positivos, e expandir as listas de detecções. E melhor para colocar uma mensagem de aviso mais específica (principalmente pras perguntas e spam). Rjclaudio msg 17h29min de 12 de agosto de 2013 (UTC)Responder

Bom, para já acho que ficava bom retirar o conteúdo ofensivo daqui pelo exposto e separar este filtro com um de perguntas que é bem fácil de bolar as strings de identificação. Quando ficar bom podemos separar o disparate que também é fácil e depois o spam que provavelmente requer trabalho. No final aqui só ficaria o conteúdo de mensagem e opinativo. Acho que seria interessante anunciar na esplanada quando criarmos este filtro de perguntas para que os reversores passem a reportar os casos que estão passando pelo filtro (não só este, todos os filtros na verdade) porque sinto falta deste feedback de quem monitora as MRs. Não tenho tido tempo de analisar as reversões e só tenho relatado os casos das minhas páginas vigiadas.OTAVIO1981 (discussão) 12h09min de 13 de agosto de 2013 (UTC)Responder
Dos seis filtros que envolvem ofensas, só esse filtro 6 que lida com páginas novas, o 7, 17 e 112 são para páginas já existentes, e o 68 que é para ambos está apenas registrando sem ação. Então não há correspondência em outros filtros. Teria que criar um filtro novo. Rjclaudio msg 13h56min de 13 de agosto de 2013 (UTC)Responder
Pergunta de leigo: os filtros precisam diferenciar se é uma página nova ou não para disparar? OTAVIO1981 (discussão) 14h15min de 13 de agosto de 2013 (UTC)Responder

Temos também o filtro 61 - PN Primeira pessoa, que já faz parte do papel das 'mensagem e opinativo'. Temos que analisar melhor esse 61, aumentar para aviso, e passar parte daqui para lá. Rjclaudio msg 14h02min de 13 de agosto de 2013 (UTC)Responder

Concordo que o 61 se encaixa em 'mensagem e opinativo'. Deixaríamos aqui então os disparates?OTAVIO1981 (discussão) 14h15min de 13 de agosto de 2013 (UTC)Responder
O filtro 61 só detectaria a primeira pessoa (ou ampliamos para 'tu', 'você', 'nós' e 'vós'?), veria as edições pelo autor da mensagem (não sei, quero saber, eu sou linda, somos a turma 101). Outros filtros veriam a edição pelo conteúdo da mensagem (como faz, por que é assim, onde fica, fulana é linda, a turma 101 passou por aqui). Nenhum dos dois pegaria todos os casos, eles funcionariam em paralelo, seriam complementos.
Fica como vc falou, deixa aqui mensagem / opinativo, separa logo o ofensivo (já temos vários), e o de spam (tb acho que temos vários). Faz um novo de perguntas, e outro de disparate (precisa? seria oq? já temos caracteres repetidos, espaços, maiúscula, etc).
Rjclaudio msg 14h35min de 13 de agosto de 2013 (UTC)Responder

Criei o Filtro 115 - Página nova com conteúdo ofensivo e passei para lá as ofensas. Rjclaudio msg 15h38min de 13 de agosto de 2013 (UTC)Responder

Cláudio, repare que o filtro 70 dispara tanto em páginas novas quanto em artigos já criados. Talvez seja o caso de atualizar todos os filtros de ofensa para funcionar deste modo. A divisão na lista ficou boa. Vou priorizar a análise daqueles filtros para ver como ficou o desmembramento. OTAVIO1981 (discussão) 12h19min de 14 de agosto de 2013 (UTC)Responder

Filtro 85 - Página nova com pergunta

Página nova com pergunta
Status
Registrando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 7
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas


Há alguns falso-positivos por ser título de obra. Sugeriram colocar exceção quando tiver 'música' no título. Pensei em fazer a exceção pra quando tiver 'é uma música' no corpo da página. O 'é uma' é pra evitar coisas como 'como se chama a música ...'. É uma música, uma canção, composição, álbum, filme, livro, jogo. A lista vai tender a crescer um pouco. Rjclaudio msg 13h20min de 14 de agosto de 2013 (UTC)Responder

Esse filtro está analisando apenas o título da página. Queria um filtro para analisar o texto, pois pode ter um título válido mas o único conteúdo ser uma pergunta. Cria um novo filtro ou usa esse mesmo? Rjclaudio msg 18h27min de 14 de agosto de 2013 (UTC)Responder

Acho que podemos começar com a inclusão de 'é uma música' neste filtro aqui mesmo. A medida que formos detectando outros falsos positivos podemos pensar em mais exceções. Ainda não sei dizer se é melhor desmembrar o título em título e corpo. Vou pensar e depois respondo.OTAVIO1981 (discussão) 12h49min de 16 de agosto de 2013 (UTC)Responder
Feito pro 'é uma música'. Também coloquei exceção para new_size>50, tirando os casos de PN Mínima (1) da lista de registros. Rjclaudio msg 14h50min de 16 de agosto de 2013 (UTC)Responder
Fiz alguns ajustes e mudei a exceção para tamanhos >= 50, pois a versão atual do filtro 66 só detecta até 49 bytes.
Dica: quando precisar agrupar um trecho da expressão regular com parêntesis, utilize a forma (?:alguma regex), a não ser que realmente precise capturar o que é detectado pelo grupo que seria criado se utilizasse apenas (alguma regex). Helder 12h43min de 19 de agosto de 2013 (UTC)Responder
Pelo o que já vi do filtro 6 (que a ideia é separar e trazer as 'perguntas' de lá) buscar no texto não dá uma grande confiança, menos que a busca no título. Então deve ser melhor deixar em filtros separados mesmo. Rjclaudio msg 14h58min de 16 de agosto de 2013 (UTC)Responder


Páginas novas com conteúdo suspeito

Pros filtros 52 Página nova sem espaço e 64 PN em maiúscula, quase todas as ocorrências desse ano (+-700) as páginas não existem mais (foram eliminadas / não foram criadas), e as que existem foram recriadas com conteúdo válido. Os dois estão como aviso, por mim muda para desautorizar.

O filtro 49 PN com ER na maioria dos casos é recriação de ER/ESR exatamente com o mesmo conteúdo, ou marcação falsa de ER. Por mim tb desautoriza (talvez com um aviso pro caso de ser boa fé remover a marcação de ER).

Rjclaudio msg 17h49min de 10 de julho de 2013 (UTC)Responder

Acabei de analisar o filtro 52 e 64. Nem todos foram salvos e o aviso foi suficiente. Os avisos interromperam80% das tentativas de salvar. Todavia, os outros 20% foram salvos e posteriormente eliminados. Também acho que dê para desautorizar.OTAVIO1981 (discussão) 21h01min de 16 de julho de 2013 (UTC)Responder

Teste para página nova

Temos filtros usando article_recent_contributors == '' e outros usando article_articleid == 0 . Há diferença? Qual é melhor? Qual usamos? Rjclaudio msg 17h04min de 9 de agosto de 2013 (UTC)Responder

Não sei dizer se as duas condições são equivalentes a "criou uma página", nem qual seria a forma mais eficiente (mas suponho que a comparação de números seja mais rápida do que a de strings). Talvez seja o caso de perguntar a algum editor de outras wikis (o Hoo man?)... Helder 19h56min de 10 de agosto de 2013 (UTC)Responder

Filtros de código wiki inadequado

Filtro 59 - Redirect em local errado

Redirect em local errado
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 23
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Falso positivo

Falso positivo "Código wiki errado" do filtro 59 (Redirect em local errado) com um comentário:

'''Virtanen''' (ou '''Wirtanen<!--#REDIRECT-->''') é um sobrenome ...

(Corrigido no Virtanen pela remoção # [37]) -- 62.147.24.102 (discussão) 21h11min de 13 de março de 2010 (UTC)Responder

Continua errado do mesmo jeito. Não tem pq colocar isso no código. Não é necessário indicar que o outro nome redireciona para essa desambig. Editei a página retirando isso. Rjclaudio msg 21h25min de 13 de março de 2010 (UTC)Responder

Avisar?

Entre casos de vandalismo e erros de boa fé por quem não sabe usar bem o recurso, acho útil passar o filtro para o modo aviso. Concordam? Alguma sugestão para o texto do aviso para cobrir os dois casos? Rjclaudio msg 01h29min de 29 de julho de 2013 (UTC)Responder

Um erro de novato que encontrei foi usar o redirect no lugar da simples ligação interna, provavelmente clicando no botão de redirect. Teria que colocar isso no texto do aviso, um link para página de ajuda sobre como colocar ligações internas. Rjclaudio msg 14h31min de 9 de agosto de 2013 (UTC)Responder

Há um falso-positivo: o redirect funciona mesmo se o redirect não estiver na primeira linha, basta ter apenas quebras de linha antes sem nenhum caractere. exemplo. Como faz para arrumar isso no filtro? Rjclaudio msg 14h29min de 9 de agosto de 2013 (UTC)Responder

Não sei como faz para arrumar. Mas se forem poucos casos acho que vale a pena o aviso do mesmo jeito. Nem sei como gerei aquele falso positivo...OTAVIO1981 (discussão) 12h41min de 16 de agosto de 2013 (UTC)Responder
Ok, então fica com esse falso-positivo mesmo. E o texto do aviso? Otavio, você que já está especialista nisso, manda o seu balão de ensaio. Rjclaudio msg 13h55min de 4 de setembro de 2013 (UTC)Responder
Não fui notificado de novo, Rjclaudio. Segue proposta:

Atenção: o sistema identificou automaticamente que a edição adicionou um redirecionamento em um local incorreto, geralmente significando erros na edição.

Por favor, consulte como fazer um redirecionamento em nosso guia de edição em caso dúvidas.

Se considera que não houve erros na edição, pode pressionar novamente o botão "Gravar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Uma breve descrição da regra de abuso com a qual a sua acção coincidiu é: $1

Acho que não tem como explicar em uma linha como fazer o redirect então fiz o apontamento para o guia. O filtro tem poucos disparos mas talvez valesse uma orientação sobre como fazer ligações internas.OTAVIO1981 (discussão) 15h33min de 4 de setembro de 2013 (UTC)Responder
Feito aviso criado. Rjclaudio msg 16h01min de 4 de setembro de 2013 (UTC)Responder

Filtro 40 - Link para página de usuário

Link para página de usuário
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas
A discussão a seguir está marcada como respondida (Aumentado para aviso). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Creio que esse filtro pode passar a avisar. A única exceção que vi são ligações para usuários em páginas relacionadas a Wikipédia, mas acho que são poucos casos e um mero aviso não impediria de salvarem a edição. Acham necessário colocar exceção? Algo como não ter "Wikipédia" nas categorias do artigo? Rjclaudio msg 01h24min de 29 de julho de 2013 (UTC)Responder

Por ora coloquei etiqueta. Pro aviso, pensei em:

Atenção: o sistema identificou automaticamente que a edição adicionou uma ligação para uma página de usuário ou página de discussão de usuário.

Não assine as suas edições nos artigos, elas ficam salvas no histórico juntamente com o seu nome de usuário.

Se a ligação estiver correto, pode pressionar novamente o botão "Gravar/Salvar página" para confirmá-la. Neste caso, você pode também nos avisar aqui, para que tal mensagem não apareça novamente.

Rjclaudio msg 14h44min de 9 de agosto de 2013 (UTC)Responder

Feito, criei o aviso com o texto acima. Rjclaudio msg 18h51min de 14 de agosto de 2013 (UTC)Responder

Outro ponto, nos registros de 13 de fevereiro até 11 de março teve 50 ocorrências na página API, só que nenhuma delas foi salva e nem consta no histórico. Impedidas por outro filtro? Acho difícil já que temos poucos filtros que impedem ações de usuários confirmados, e tem esses ali no meio também. Algum erro? Rjclaudio msg 01h24min de 29 de julho de 2013 (UTC)Responder

O registro de ações detectadas com o título "API" mostra outros filtros além do 40 (o do WikiLove aparece frequentemente) e parece que também houve um aumento nas ocorrências na wiki em inglês.
Suspeito que tenha algo a ver com o fato de que, por padrão, o título usado pela API do MediaWiki é justamente "API". Talvez exista alguma "coisa nova" utilizando a API sem definir um título (quando talvez deveria), ou houve alguma mudança na extensão WikiLove. Helder 14h58min de 9 de agosto de 2013 (UTC)Responder

Filtros de conteúdo suspeito

Filtro 69 - Texto após cat


A discussão a seguir está marcada como respondida (atualizado). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Este filtro atualmente não tem ação nenhuma e está desatualizado em relação ao anglófono. Recomendo pelo menos atualizar o código conforme abaixo para monitorar impactos e posteriormente ativar as etiquetas (o correspondente anglófono é en:Special:AbuseFilter/351.

action == 'edit' &! 'autoconfirmed' in user_groups &
(article_namespace == 0 | article_namespace == 14) &
removed_lines rlike '^\[\[([a-z]{2,3}|Categor(?:y|ia)):.*\]\] *$' &
strpos(added_lines, removed_lines) == 0 &
(
  add := substr(added_lines, length(removed_lines));
  substr(new_wikitext, length(new_wikitext)+1-length(add)) + '\n' == add
  &! contains_any(add,'{{','[[')
)
& !(rcount("(^|\n)\s*\S",added_lines) = rcount("(^|\n)\[\[",added_lines))

O que acham?OTAVIO1981 (discussão) 17h09min de 24 de junho de 2013 (UTC)Responder

Concordo, mas atualizei o código que colocou acima, para detectar tanto "Category" quanto "Categoria". Será preciso observar no campo de comentários que o filtro é uma adaptação tanto de en:Special:AbuseFilter/351 quanto de ru:Special:AbuseFilter/74. Helder 18h10min de 24 de junho de 2013 (UTC)Responder
Sim, esqueci destes importantes detalhes. Agora como devemos proceder? pedimos aos administradores em WP:Pedidos/Outros?OTAVIO1981 (discussão) 18h25min de 24 de junho de 2013 (UTC)Responder
Acredito que é só pedir lá mesmo. Helder 18h49min de 24 de junho de 2013 (UTC)Responder
feito.—Teles«fale comigo» 07h59min de 2 de julho de 2013 (UTC)Responder

Acho que o filtro não está mais funcionando, vejam.OTAVIO1981 (discussão) 12h30min de 1 de agosto de 2013 (UTC)Responder

A primeira condição do filtro que é falsa naquela revisão é "removed_lines rlike '^\[\[([a-z]{2,3}|Categor(?:y|ia)):.*\]\] *$'" pois, como se pode ver ao examinar a revisão, string(removed_lines) === ''. Helder 20h33min de 4 de agosto de 2013 (UTC)Responder
não detectou este caso OTAVIO1981 (discussão) 13h51min de 6 de agosto de 2013 (UTC)Responder
Ao examinar a revisão vi que o motivo foi o mesmo do exemplo anterior: a lista de linhas removidas estava vazia. Helder 22h37min de 6 de agosto de 2013 (UTC)Responder
Mais um caso não detectado.OTAVIO1981 (discussão) 11h27min de 8 de agosto de 2013 (UTC)Responder

────────── Em cada um dos três exemplos acima, a detecção não ocorre porque nem todos os testes são verdadeiros:

Condição Explicação informal Log 40153503 Log 40847377 Log 40877578 Log 40885295
removed_lines rlike '^\[\[([a-z]{2,3}|Categor(?:y|ia)):.*\]\] *$' A primeira linha da lista de removidas é uma categoria ou interwiki Não Não Não Não
strpos(added_lines, removed_lines) == 0 Todas as linhas removidas aparecem no início da lista de linhas adicionadas Não Não Não Não
add := substr(added_lines, length(removed_lines)); Nos dois testes a seguir, ignore as primeiras linhas adicionadas, pois pelo teste anterior coincidem com as removidas Sim Sim Sim Sim
substr(new_wikitext, length(new_wikitext)+1-length(add)) + '\n' == add As linhas que sobraram são as últimas da página
! contains_any(add,'{{','[[') Tais linhas não contém links nem predefinições
!(rcount("(^|\n)\s*\S",added_lines) = rcount("(^|\n)\[\[",added_lines)) Entre as linhas adicionadas, há tantas linhas começando com "[[" quantas forem as linhas contendo algo além de espaço(s) Sim Sim Sim Sim

Note, no entanto, que segundo o autor do código:

The code has to be this complicated because of the way the filter works when text is appended to the end, see mediazilla:20310, my comment #4. The last unchanged line is included in both removed_lines and added_lines, for example see this edit (Log 40885295) and these variables in the filter.

Helder 12h42min de 8 de agosto de 2013 (UTC)Responder


Me deparei com este vandalismo (examinar) que não foi detectado pelo filtro.OTAVIO1981 (discussão) 20h43min de 19 de julho de 2013 (UTC)Responder

A detecção falha no teste
strpos( added_lines, removed_lines ) == 0
e acredito que isso ocorre porque antes de testar se o segundo parâmetro é uma substring do primeiro a função strpos converte ambos para strings. Na revisão que citou, os seguintes testes são verdadeiros (note que o "\n" não aparece após o "]" na primeira string):
  1. string( added_lines )   === '[[Categoria:Municípios de São Paulo]] Brasil\n'
  2. string( removed_lines ) === '[[Categoria:Municípios de São Paulo]]\n'
Helder 18h42min de 25 de julho de 2013 (UTC)Responder

Alguém traduz pra mim como esse filtro funciona? Tem alguns falso-positivos antigos, mas não sei se também seriam falso-positivos para essa versão. Rjclaudio msg 13h49min de 14 de agosto de 2013 (UTC)Responder

Acrescentei uma descrição do que cada teste detecta. Isso ajuda? Helder 18h49min de 14 de agosto de 2013 (UTC)Responder
Ajuda. Pq precisa do primeiro teste? Aí não reconhece os casos que se edita uma linha qualquer no texto e também adiciona texto no final do artigo. Se entendi direito.
Pela descrição e pela explicação logo depois (a do autor do código), não entendi pq o teste não é verdadeiro. Se 'a última linha não modificada' é adicionada na lista de linhas removidas (e adicionadas), então a primeira linha da lista de removidas deveria ser aquela linha com a categoria. O que há de errado?
Testei duas ocorrências do filtro, essa e essa lá na Wikipédia:Página de testes/1, e testei com o filtro atual. Não detectou nenhuma das duas. Tenho impressão que não detectaria as outras tb (a maioria). Tem certeza que o filtro está funcionando? Pode fazer um teste de uma situação que o filtro detectaria? Pq até agora só temos exemplos de casos que não detectaram. Ou talvez manter os dois códigos funcionando como complemento, pq pra um filtro que detectava praticamente 2 caso por dia ficar um mês e meio sem nada é bem estranho.
Rjclaudio msg 19h16min de 14 de agosto de 2013 (UTC)Responder
Assim como nos dois primeiros exemplos citados pelo Otávio, a lista de linhas removidas na (minha réplica da) edição citada pelo autor está vazia, pelo menos na versão atual da extensão AbuseFilter. Suspeito que algo possa ter mudado na extensão desde que o autor criou o código desse filtro e, para variar, a alteração não foi documentada nem houve testes de regressão. A última detecção feita pelo filtro análogo da wiki em inglês foi em 11 de fevereiro.
Os dois testes que fez não foram detectados porque a categoria não estava na primeira linha removida. Helder 20h34min de 14 de agosto de 2013 (UTC)Responder
Isso que pensei, esse filtro só funcionaria se a categoria estivesse na primeira linha. Então o código antigo funciona para casos que esse código novo não funciona. E vice-versa. Melhor manter dois filtros com os dois códigos, um com o novo e outro com o velho. Rjclaudio msg 01h18min de 15 de agosto de 2013 (UTC)Responder
Eu ainda estou boiando no que se passa e vou levar tempo para entender. Pelo menos trago para conhecimento este caso que não foi disparado.OTAVIO1981 (discussão) 14h14min de 15 de agosto de 2013 (UTC)Responder
Resumindo a situação: o código copiado da wiki.en funcionava, até +- fevereiro desse ano quando mudaram alguma coisa na extensão do Filtro de abusos, e aí o código quebrou. Como nós copiamos de lá, o nosso código também ficou quebrado.
Como vai ficar quebrado por um tempo, melhor reverter e voltarmos ao nosso código anterior, que não era perfeito mas ao menos funcionava. Rjclaudio msg 14h25min de 15 de agosto de 2013 (UTC)Responder
Informei o problema na Wikipédia em inglês, pois talvez alguém saiba resolver (ou descubra como antes de nós). Helder 20h14min de 1 de setembro de 2013 (UTC)Responder

Reverti para a versão de mar2010, já que o filtro não estava detectando nenhuma ocorrência. Como falei acima, os dois códigos (o nosso, e o importado da wiki.en) seriam complementos, então mesmo que arrumem o bug do código da wiki.en é melhor criar um outro filtro para isso. Rjclaudio msg 14h34min de 18 de agosto de 2013 (UTC)Responder

Filtro 81 - Texto após cabeçalho


Único falso-positivo que vi foi texto oculto após o cabeçalho, que não tira a formatação da seção, um aviso para quem editar aquela seção, e por ser oculto indica alguma experiência do usuário, e geralmente é uma edição válida. (off: Até podiamos colocar um filtro só para detectar texto oculto) Coloco exceção para texto oculto? Rjclaudio msg 14h21min de 14 de agosto de 2013 (UTC)Responder

Outro falso-positivo é tabulação após o cabeçalho. Não quebra a seção, é igual ao espaço, mas o filtro atual não reconhece. E não sei como detecta isso. Rjclaudio msg 14h13min de 15 de agosto de 2013 (UTC)Responder

O caractere
	
é representado por "\t", mas se a intenção é detectar espaçamento em geral, utiliza-se "\s", que também detecta o " " e as quebras de linha (por exemplo, o teste "\t \n\r" rlike "\s{4}" é verdadeiro). Helder 14h44min de 15 de agosto de 2013 (UTC)Responder
Feito usando \s Rjclaudio msg 15h02min de 15 de agosto de 2013 (UTC)Responder

Entre vandalismos e erros de boa fé, todas as edições precisam ser revistas e corrigidas, incluindo os erros de boa fé por retirarem a formatação do cabeçalho (fica como texto simples). Podemos aumentar pelo menos para etiqueta? Seria a mesma etiqueta do Filtro 63 Texto após iw: Código wiki errado , que por mim até podiamos usar uma mais específica (texto em local inadequado). Rjclaudio msg 14h21min de 14 de agosto de 2013 (UTC)Responder

Sim, vamos começar a etiquetar enquanto pensamos num aviso específico que inclua os principais erros de boa fé que acontecem.OTAVIO1981 (discussão) 19h25min de 27 de agosto de 2013 (UTC)Responder
Feito etiqueta inserida. Falta pensarmos no aviso. Rjclaudio msg 19h36min de 27 de agosto de 2013 (UTC)Responder

Balão de ensaio:

Atenção: o sistema identificou automaticamente que a edição adicionou código wiki incorreto. Alguns erros comuns são:

  • Inserir texto imediatamente após os marcadores da seção.
  • Aplicar outra formatação (e.g. negrito) em torno do cabeçalho da seção, e não somente no título da seção. Veja um exemplo aqui.

Para mais informações, veja o guia de edição para formatação de seções.

Caso a edição esteja correta, ainda poderá salvar a edição ao pressionar o botão "Salvar página" abaixo. Por favor, nos avise aqui, para que tal mensagem não apareça novamente.

Uma breve descrição da regra de abuso com a qual a sua acção coincidiu é: $1

Inclui os dois últimos falsos positivos que vi. Pode haver outros. É um pouquinho diferente do último aviso que fiz pois comecei apresentando os casos mais comuns e depois a documentação. Aviso só serve para etiquetagem. Faltou incluir a predefinição que gera o texto de "salvar página" conforme variante do pt.OTAVIO1981 (discussão) 20h12min de 27 de agosto de 2013 (UTC)Responder

Feito já tinha até esquecido disso. Rjclaudio msg 19h01min de 27 de setembro de 2013 (UTC)Responder

Filtros de bloqueios e proteções

Filtro 4 - Inserção de nomes indevidos em páginas de data

Inserção de nomes indevidos em páginas de data
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 9
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas


Para a maioria dos casos será difícil o filtro identificar a relevância do biografado para fazer alguma coisa que não seja etiquetar. Ou então nós exibimos sempre um aviso de 'só adicione se o biografado tiver artigo' mas no caso seria melhor colocar isso no editnotice dali. Então, não seria melhor esse filtro e deixar para os bots antivandalismo, que podem ser configurados para verificar ao menos se o biografado possui artigo na wiki? Rjclaudio msg 14h11min de 19 de julho de 2013 (UTC)Responder

Não sei se um aviso ao editar seria muito efetivo, nem como funcionarão esses robôs dos quais falou. Uma possível desvantagem é que, se alguém estiver usando a etiqueta "Provável inclusão de nome irrelevante" para filtrar as mudanças recentes, não terá mais essa possibilidade. Helder 18h58min de 5 de agosto de 2013 (UTC)Responder

O OTAVIO1981 disse aqui que a Citação: OTAVIO1981 escreveu: «"Provável inclusão de nome irrelevante" está configurado somente para as páginas de dias do ano, e não dos anos.», tem algum jeito/método de aprimora-la para ambos os dois, artigos-datas e anos? Seria de grande ajuda aos reversores e, creio eu, os editores que, como eu, combatem vandalismo. --Zoldyick (discussão) 13h52min de 16 de dezembro de 2013 (UTC)Responder

Zoldyick, se são inseridos muitos nomes irrelevantes pós 1980, talvez seja melhor proteger todas as páginas de anos até 2013 para contas não confirmadas. Tem várias sutilezas que precisamos entender antes para tentar estabelecer um padrão que seja filtrável. Primeiro, são incluídos os colchetes como um título? É inserida uma profissão irrelevante (e.g. estudante)? Se a maioria dos casos de edição nestas páginas for algo como "20 de agosto - João das Neves" receio que o filtro precise ser muito complexo e "caro" (do ponto de vista de consumo de recursos do sistema) para ser implementado. Assim, uma semiproteção é mais econômica e, embora prejudique edições de boa fé, uma solução "menos pior" para todos. Sds, OTAVIO1981 (discussão) 15h06min de 16 de dezembro de 2013 (UTC)Responder
Coitado dos IPs, só lamento por eles... é triste, mas se é pra ser assim, que seja. Obrigado. --Zoldyick (discussão) 15h10min de 16 de dezembro de 2013 (UTC)Responder
Ser "assim" como? Helder.wiki (discussão) 15h34min de 16 de dezembro de 2013 (UTC)Responder
Já foi considerado utilizar validação de páginas nesses casos? Helder.wiki (discussão) 15h34min de 16 de dezembro de 2013 (UTC)Responder
@Rjclaudio, Zoldyick e OTAVIO1981: vejam também a proposta de proteger todas as páginas de datas. Helder 15h44min de 18 de setembro de 2014 (UTC)Responder
Já vi e dou o meu apoio. Acredito que proteger a Wiki é também uma prioridade, como podemos melhorar os artigos que temos se estamos tão atarefados limpando a bagunça chamada vandalismo? --Zoldyick (Discussão) 19h10min de 18 de setembro de 2014 (UTC)Responder

Filtros de domínio não-conteúdo

Filtro 12 - Edição em página de usuário alheia

Edição em página de usuário alheia
Status
Impedindo
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 1
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Apagar página de usuário

13h43min de 30 de abril de 2009: Daimore (discussão | contribs) despoletou um filtro de abuso, executando a ação "delete" em Usuário:Editora ovação?. Ações tomadas: nenhum; Descrição do filtro: Edição em página de usuário alheia
13h38min de 30 de abril de 2009: Davemustaine (discussão | contribs) despoletou um filtro de abuso, executando a ação "delete" em Usuário:Blingee?. Ações tomadas: nenhum; Descrição do filtro: Edição em página de usuário alheia

Creio que as ações "delete" não deveriam ser incluídas no filtro. Como só adms podem faze-la, não deve ser vandalismo (espero). ⇒ Rjclaudio msg 18h12min de 30 de abril de 2009 (UTC)Responder

Sim, sim, veja que o filtro que está em modo teste. Nenhuma ação é tomada. Na verdade, eu ainda não achei um jeito de separar edições corretas de edições abusivas ali. Lechatjaune msg 18h13min de 30 de abril de 2009 (UTC)Responder
Esse erro também ocorreu comigo. Tem como ser corrigido? (Pergunta sem tom de crítica, é que eu não entendo nada dessas coisas) Se sim, quando for corrigido esse registro desaparece? Filipe Ribeiro Msg 17h25min de 22 de junho de 2009 (UTC)Responder
Alterei o filtro, ele só vai disparar se ação for feito por usuário não-autoconfirmado (contas novas e anônimos). Mas suponho que vocês não tenham recebido qualquer mensagem de aviso, pelo que o filtro está em modo teste. Lechatjaune msg 17h35min de 22 de junho de 2009 (UTC)Responder

Desautorizar?

Esse filtro atualmente só avisa, poderia passar a desautorizar. Imagino que a quantidade de edições válidas seria mt pequena em relação a quantidade de edições impedidas. Uma boa parte das edições são usuários editando a própria PU só que deslogado, então é mais um motivo para impedir (para não deixar público o ip). Rjclaudio msg 21h05min de 19 de julho de 2013 (UTC)Responder

Concordo, mas poderia melhorar a etiqueta incluindo o link para Especial:Entrar e que a edição está desautorizada por questão de privacidade do IP do dono da conta.OTAVIO1981 (discussão) 21h28min de 19 de julho de 2013 (UTC)Responder

Ficaria como o aviso? "A edição está desautorizada por questão de privacidade do IP do dono da conta. Caso você seja o usuário, faça login no sistema para poder editar a página." ? Eu removeria "As edições não construtivas serão revertidas rapidamente, e a repetição destas edições resultará no bloqueio da sua conta ou do seu computador", acho desnecessário (ao menos para esse filtro) já que isso raramente vai impedir o usuário de vandalizar e antes do bloqueio (quase) sempre se envia um aviso que tem essa mesma mensagem. Rjclaudio msg 15h17min de 25 de julho de 2013 (UTC)Responder

Isto mesmo! Vai ficar bom!OTAVIO1981 (discussão) 19h41min de 25 de julho de 2013 (UTC)Responder

Se bem que tem casos de um usuário editando a PU de outro usuário (como esse), aí o "desautorizada por privacidade do IP" perde o sentido. Talvez mudar a ordem. "Caso você seja o usuário, faça o login ... porque a edição está desautorizada por privacidade ... . \n Caso você não seja o usuário mas deseje modificar alguma coisa nessa página, faça um pedido aos administradores explicando o motivo." Aí os 'falso-positivos' são orientados sobre o que fazer. Rjclaudio msg 19h51min de 25 de julho de 2013 (UTC)Responder

Alterado para desautorizar. Rjclaudio msg 17h17min de 26 de julho de 2013 (UTC)Responder

Já que todas edições serão impedidas, não seria possível fazer uma alteração maior, com mesmo resultado, mas que proibisse edição em vez de filtrar? Algo como é feito com subpáginas individuais .css e .js, em que só o próprio usuário pode editar ou administradores. Assim como é feito com a opção de mover as PU, permitindo, entretanto, a edição por confirmados. Existe essa possibilidade/interesse?—Teles«fale comigo» 17h55min de 26 de julho de 2013 (UTC)Responder
Acho que não precisa ser tão restritivo para limitar a administradores. Muitos editores se organizam para fazer algo editando na PU de um único editor e seria atrapalhados.OTAVIO1981 (discussão) 20h19min de 26 de julho de 2013 (UTC)Responder
Sim. A restrição seria apenas pra quem não é confirmado.—Teles«fale comigo» 20h33min de 26 de julho de 2013 (UTC)Responder
Imagino que alguém saiba fazer uma alteração em MediaWiki:Common.css pra isso. Deve ser possível impedir edição da PU por não confirmados, mas talvez não seja tão simples permitir edição da PU para o próprio usuário.—Teles«fale comigo» 20h46min de 26 de julho de 2013 (UTC)Responder
Não entendi o que o CSS tem a ver com isso. Poderia explicar melhor? Helder 20h58min de 26 de julho de 2013 (UTC)Responder

Hoje de manhã teve quatro registros seguidos de um ip tentando salvar uma edição em uma PU. Quase todos os registros são em par (tenta salvar, recebe o aviso, tenta salvar de novo). Começo a pensar se alguém lê esses avisos. Rjclaudio msg 01h40min de 29 de julho de 2013 (UTC)Responder

Falsos negativos

Foi sim: detalhes. Helder 12h32min de 18 de agosto de 2013 (UTC)Responder
Sim, eu vi por ali, no filtro 82, mas to falando desse filtro 12. É um usuário (Wiki14032000) editando a PU de outro usuário (Alexanderps), e esse filtro 12 deveria impedir esse tipo de edição. Rjclaudio msg 13h25min de 18 de agosto de 2013 (UTC)Responder
Ah, só percebi isso agora. Ao examinar a edição, vi que foi porque ele já está no grupo "autoconfirmed". Helder 13h36min de 18 de agosto de 2013 (UTC)Responder

Filtro 57 - Moção de página de usuário

Moção de página de usuário
Status
Desativado
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Situação do filtro

Esse filtro não dispara desde 2011. Tem algo errado nele? Serve para alguma coisa ou podemos eliminar esse filtro? Rjclaudio msg 17h20min de 25 de julho de 2013 (UTC)Responder

Interessante... Ao examinar este e este registros de movimentações que fiz, vi que a variável "moved_to_namespace" não foi definida. Por outro lado, em uma movimentação antiga que havia sido detectada pelo filtro, essa variável aparecia. Pode ter sido feita alguma alteração no MediaWiki ou na extensão que fez com que a variável deixasse de ser preenchida. Acredito que isso não deve ter sido intencional, então informei no bugzilla:52053. Helder 20h18min de 25 de julho de 2013 (UTC)Responder

Se usar moved_to_prefixedtext ao invés de moved_to_namespace adianta? Rjclaudio msg 17h56min de 14 de agosto de 2013 (UTC)Responder

Essa variável também não aparece naqueles dois registros (na verdade nenhuma variável do tipo "moved_to..." está sendo definida). Helder 00h29min de 17 de agosto de 2013 (UTC)Responder

Se o filtro não está funcionando, melhor desativar ele, pois está consumindo recursos desnecessariamente. Rjclaudio msg 17h56min de 14 de agosto de 2013 (UTC)Responder

Talvez desativar até o bug ser corrigido. Pode demorar...OTAVIO1981 (discussão) 12h40min de 16 de agosto de 2013 (UTC)Responder
Concordo e já desativei o filtro. Helder 00h29min de 17 de agosto de 2013 (UTC)Responder

Reativei o filtro pois o bug parece estar corrigido. Helder.wiki (discussão) 12h14min de 20 de janeiro de 2014 (UTC)Responder

Filtro 82 - Spam em PU

Spam em PU
Status
Registrando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 17
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Critérios para definir Spam em PU

As coisas que descubro por acaso. Parece que sou uma spammer. Este é um bug conhecido? PatríciaR (discussão) 15h37min de 19 de janeiro de 2012 (UTC)Responder

Acredito que as marcações foram feitas pelo filtro 82.
Olhei a lista de expressões que estão no código-fonte e acredito que devem haver muitos outros falsos positivos por aí, já que há termos muito genéricos. Não sei se isso reflete as políticas em vigor por aqui, no que diz respeito às páginas de usuário, mas me parece muito exagerado considerar um abuso a maior parte do que está na lista atualmente... Helder 15h51min de 19 de janeiro de 2012 (UTC)Responder
Bom, eu entendo mais ou menos nada de filtros, porque sou muito idosa para entender essas coisas, mas se está muito geral é inútil e se é inútil deveria ser desactivado, porque só dá trabalho a quem tem de verificar (se é que alguém verifica estas coisas, eu não sei). Obrigada pela ajuda. PatríciaR (discussão) 18h25min de 19 de janeiro de 2012 (UTC)Responder
Então... Em termos simples, aquele filtro está programado para marcar toda edição do domínio "Usuário(a)" que tiver (pelo menos) uma dessas expressões:
  • empresa
  • banda
  • biografia
  • site
  • web
  • perfil
  • meus sites
  • meus websites
  • diretor d
  • publicitário
  • nascido em
  • bibliografia
  • currículo
  • curriculum
  • vitae
  • técnico em
  • atelier
  • graduado
  • doutorando
  • formado
  • cursou
  • localiza
  • telefone
  • e-mail
  • fundador
  • criador
  • msn
  • twitter
  • orkut
  • skype
  • blog
  • flick
  • página pessoal
  • e-book
  • em [[9999]][1]
  • mais informações
  • meiores informações[2]
  • nickname
  • username
Não vejo motivo para não poder dizer em sua página de usuário que "cursou" algo, ou que tem uma conta em determinada rede social (ou isso só é permitido se for usada uma userbox?), etc...
Helder 18h55min de 19 de janeiro de 2012 (UTC)Responder
  1. ou um link para qualquer outro número de 4 dígitos
  2. aqui provavelmente era para ser "maiores"

Primeiro, quero só tranquilizar PatríciaR que o filtro está hoje apenas no modo de registro, e por isso só pessoas que sabem acessar os registros do filtro os veem. Além disso, é um registro que não quer dizer nada, nem que houve SPAM, nem que não houve, ele serve justamente para permitir uma análise posteiror do que foi detectado corretamente ou não. Até por isso, você tem toda a razão quando diz "se está muito geral é inútil e se é inútil deveria ser desactivado".

Embora tenha sido eu quem o tenha reativado, no início de 2011, não o acompanho. O fiz a pedido de Yanguas, mas não sei dizer se hoje o filtro tem para ele alguma utilidade, isto é, se ele acompanha os registros. Se ele acompanha atualmente, o filtro tem sua utilidade. Caso contrário, concordo que deva ser desativado. Por isso, sugiro perguntar a ele, o único interessado no filtro que eu tenho conhecimento.

Sobre a eficácia e a escolha das palavras usadas, isso é algo que pode ser aperfeiçoado (se houver interesse). Basta sugerir qual mudança deve ser feita para melhorá-lo (se houver interesse nisso). Não olhei os registros recentes, mas essa questão do possível mau uso da PU é bem polêmica. Kleiner msg 21h27min de 25 de janeiro de 2012 (UTC)Responder

Excessões

Vendo 1359064 e 1359205, podiamos colocar algumas exceções no filtro, para detectar se o usuário está adicionando conteúdo útil relacionado à Wikipédia, nesse caso o texto detectado como spam seria apenas uma 'mini autobiografia' ou algum dado pequeno e que não teria problema. Ao menos reduziria os falso-positivos. Rjclaudio msg 14h29min de 25 de julho de 2013 (UTC)Responder

Userbox, formatação html como a tag div , "artigos/anexos destacados/bons", artigos/páginas criados, dias de registro, link para documentação interna [[WP: [[Wikipédia, [[Ajuda , coisas do tipo. Rjclaudio msg 14h33min de 25 de julho de 2013 (UTC)Responder

Feito para conteúdo destacado e link para página de documentação. Rjclaudio msg 18h17min de 29 de julho de 2013 (UTC)Responder

Ou separar o filtro em dois, um para termos relacionados a biografia (que pode ser válido), e outro para empresas, produtos e serviços (mais chances de ser spam). Rjclaudio msg 14h34min de 25 de julho de 2013 (UTC)Responder

E removeria os autorrevisores do filtro, está detectando a criação de subpáginas de usuários experientes. Rjclaudio msg 14h37min de 25 de julho de 2013 (UTC)Responder
Não dá para remover os autorrevisores. Rjclaudio msg 14h09min de 11 de agosto de 2013 (UTC)Responder

Vejo muitas ocorrências em subpáginas de usuário que são válidas (esboço de um artigo). Vale a pena manter isso no filtro? Mantendo, o filtro nunca poderia aumentar para aviso. Se for importante manter isso, podiamos separar o filtro em dois, um específico para subpáginas, que teria muitos falso-positivos, e outro só para a Página de usuário, que teria mais spam. Rjclaudio msg 14h09min de 11 de agosto de 2013 (UTC) Feito, separei em dois filtros, criando Especial:Filtro_de_abusos/116. Rjclaudio msg 14h32min de 15 de agosto de 2013 (UTC)Responder

Filtro 97 - Novato editando documentação

Novato editando documentação
Status
Registrando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas


Toda página de documentação interna está protegida a confirmados (poderia até ser para autorrevisores). Esse filtro é inútil, melhor desativar. Rjclaudio msg 16h20min de 13 de agosto de 2013 (UTC)Responder

Ele só serve para sinalizar alguma página foi esquecida, ou venha a ser criada, seja editada. Mas se não há acompanhamento dos casos "fora da bacia" é melhor desativar mesmo. Tem o meu apoio.OTAVIO1981 (discussão) 16h42min de 13 de agosto de 2013 (UTC)Responder
Só pra ter certeza (e divulgar a prática), já que não temos uma política de proteção e WP:Proteção não fala nada: Wikipédia:Esplanada/propostas/Proteção de documentação interna (13ago2013). Rjclaudio msg 16h55min de 13 de agosto de 2013 (UTC)Responder

Filtro 36 - Proteção a páginas internas do projeto

Proteção a páginas internas do projeto
Status
Impedindo
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 0
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Alguém me explica o que seria aquela proteção a tópicos da esplanada / votações? Não entendi direito, muito parênteses e variáveis. É para protegermos os tópicos / votações? Ampliamos então para proteger todos os tópicos antigos e votações encerradas a x meses? Rjclaudio msg 17h50min de 13 de agosto de 2013 (UTC)Responder

Removi a proteção para esses tópicos da esplanada / votações, por ser desnecessário, sem consenso (acho), e ser apenas para essas páginas (se fosse válido seria para todas). Rjclaudio msg 13h48min de 26 de agosto de 2013 (UTC)Responder

Vi que WP:Pedidos a verificadores/Arquivo está protegido no filtro, útil ampliar a proteção para todas as páginas de arquivo? Rjclaudio msg 17h50min de 13 de agosto de 2013 (UTC)Responder

RJ, se possível, na minha opinião os filtros da Aleth manteriam-se em separado, isto porque há diversas nuances envolvidas, e convém ter conhecimento de como o bot funciona, caso contrário mesmo alterações atentas e de boa fé podem trazer erros inesperados. Na fusão com o filtro genérico, por exemplo, não foi contemplada a permissão de a Aleth bot editar a página, e deu problemas porque apesar de a edição não ter sido salva, o bot entendeu-a como efectuada, e continuou a enviar novos avisos em loop. Alchimista Fala comigo! 12h56min de 16 de agosto de 2013 (UTC)Responder

hã.... Desfez-se um dos mistérios de filtros ocultos. OTAVIO1981 (discussão) 13h00min de 16 de agosto de 2013 (UTC)Responder
[off topic] Talvez seja o caso de criar um aviso para colocar no topo das subpáginas /N relacionadas aos filtros que se pretende manter ocultos, para (tentar) evitar que o conteúdo desses filtros seja revelado sem querer... Helder 01h13min de 17 de agosto de 2013 (UTC)Responder

É preciso repensar esse filtro, pois ele costuma ser um dos que mais consome condições. Notei por exemplo que as últimas detecções relacionadas a esta, esta e esta páginas foram em 2011 (e a segunda é desnecessária), no entanto isso ainda tem sido testado em todas as edições! Helder 14h11min de 26 de agosto de 2013 (UTC)Responder

Concordo em remover esses três. Se acontecer de alguém vandalizar essas páginas, só deixar um bot para reverter, ou usuários vigiando, ou mesmo colocar uma proteção normal nível confirmados (ou autorrevisores). Rjclaudio msg 14h53min de 27 de agosto de 2013 (UTC)Responder

Editei o filtro agrupando por domínio, e colocando um teste de domínio no início de cada um. Imagino que vai diminuir os testes, pois se a edição não for do domínio WP nem Usuário, só fará dois testes, se for do domínio WP fará um testes a mais mas pulará os 4 testes de Usuário, e vice-versa. Rjclaudio msg 14h54min de 27 de agosto de 2013 (UTC)Responder

Rjclaudio, devido ao bugzilla:41693 não tenho certeza de que o número de condições gastas vá diminuir.
Note também que, como o & e o | possuem a mesma precedência, "A & B | C" é interpretado como "(A & B) | C", que não é equivalente a A & (B | C). Portanto, se a intenção é obter algo do segundo tipo, é preciso inserir parêntesis (que também consumirão uma condição). Helder 16h10min de 27 de agosto de 2013 (UTC)Responder

Escolha do Artigo Destacado

Lembro de terem sugerido a um tempo uma proteção para não se criar EADs por usuários que não são autorrevisores. Dá para fazer isso com o filtro, certo? Mesmo que o filtro fique 'não-autorrevisor & não-administrador & não-burocrata', acho que vale a pena, se esses testes do estatuto ficarem por último vão ser testados menos vezes, primeiro testa 'é subpágina de EAD', depois 'é uma página nova'. Rjclaudio msg 14h56min de 27 de agosto de 2013 (UTC)Responder

A incidência de propostas indevidas tem sido alta?OTAVIO1981 (discussão) 16h25min de 27 de agosto de 2013 (UTC)Responder

Outros filtros

Filtro 30 - Inserção de imagem externa

Imagem externa em ficheiro ou predef
Status
Avisando e etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 7
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Impedir esses casos que a pessoa coloca o site aonde está a foto: Especial:Registro de abusos/1364058

Ele tentou fazer isso: [[Ficheiro:Https://fbcdn-sphotos-b-a.akamaihd.net/hphotos-ak-frc1/1013570 508093652597213 636540323 n.jpg|miniaturadaimagem]]

No caso a pessoa em questão colou o link de uma foto do Facebook(esse prefixo /fbcdn-sphotos-b- ) na hora que foi inserir uma imagem. Vulcan (discussão) 22h11min de 1 de agosto de 2013 (UTC)Responder


Esse filtro está precisando de uma tradução, tem um "external ?(media|image|audio|video)' e um {cite' (que não reconhece a nossa predef citar). Não mexo ali pq achei mais complicado pra mim (nunca mexi com esse rcount, e muito parenteses pra mim). Rjclaudio msg 00h22min de 11 de agosto de 2013 (UTC)Responder

Aproveitando, esse filtro me parece muito genérico, pra detectar url para imagem externa inserida em qualquer lugar do artigo, e por isso dificilmente vai poder impedir a edição (sempre é possível ter algo válido). Vendo as últimas 15 edições salvas, foram todas em campo de infobox, e 1 do tipo [Ficheiro:http://xxx.jpg]. Nos últimos 30 dias foram 150 edições salvas, imagino que quase todas as salvas entram nesses dois casos, então vale a pena criar um filtro mais específico pra esses dois e impedir a edição? Se criarmos, esse filtro 30 ficaria como está ou mudariamos para só detectar url entre colchetes (tipo [http://xxx.jpg]) ? Rjclaudio msg 00h38min de 11 de agosto de 2013 (UTC)Responder

Feito, criei Especial:Filtro_de_abusos/117 para os casos de url pura, e deixei esse 30 para ficheiro: e campo de predef, por serem os mais comuns e os mais confiáveis (menos falso positivo). Depois de um tempo analisando, proponho aumentar esse filtro para impedir a edição. Rjclaudio msg 15h46min de 15 de agosto de 2013 (UTC)Responder
Os filtros 30 e 117 estão disparando muitos casos em conjunto. Só para confirmar: este aqui é limitado a detecção em predefinições (incluindo urls) e o outro para imagens externas com urls em todo o resto do artigo?OTAVIO1981 (discussão) 12h04min de 22 de agosto de 2013 (UTC)Responder
A ideia é pegarem casos separados. Url em ficheiro e predef fica no filtro 30, outras urls ficam no 117. Tava deixando duplicado enquanto o 30 ainda estava em teste (sem aviso), agora q já tem aviso tem q tirar esses casos lá do filtro 117, acho que esqueci de fazer, na hora não pensei num modo fácil de fazer isso. Depois minha ideia é aumentar o filtro 30 para impedimento, pois sempre vai estar errado, o filtro 117 pode ter casos válidos. Rjclaudio msg 12h21min de 22 de agosto de 2013 (UTC)Responder

Inserir ligação no aviso

Seria útil ao novato uma ligação para a página de instruções: Ajuda:Guia de edição/Como usar imagens. TheVulcan (discussão) 17h21min de 5 de novembro de 2013 (UTC)Responder

Feito. Veja aqui se ficou bom e proponha novas melhorias se tiver. Grato!OTAVIO1981 (discussão) 17h33min de 5 de novembro de 2013 (UTC)Responder
Boa, pelo que vi aqui a parte o botão "Enviar" trocar por "Gravar página", que é o padrão para quem edita via IP. Ou fazer como a forma que vejo o Helder fazendo em texto de botões que é uma predefinição que já deixa correto de acordo com a configuração de idioma escolhida, não sei exatamente o código da predefinição, mas de qualquer forma se deixar Gravar página todos entenderão. TheVulcan (discussão) 17h49min de 5 de novembro de 2013 (UTC)Responder
A predefinição se chama {{int:savearticle}}.OTAVIO1981 (discussão) 17h57min de 5 de novembro de 2013 (UTC)Responder

Filtro 75 - Salvamento sucessivo

Salvamento sucessivo
Status
Registrando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 1
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Não seria melhor implementar o filtro pelo menos para contas não-confirmadas de modo a medir melhor os impactos?OTAVIO1981 (discussão) 18h02min de 22 de julho de 2013 (UTC)Responder

Mas ele já se aplica a qualquer conta que não seja um robô (em particular, para as que não foram confirmadas). Ou entendi errado? Helder 18h19min de 22 de julho de 2013 (UTC)Responder
não é por nada, mas acho que alguma coisa está mal com este filtro. 1) Ele considera edições intercaladas com outras em intervalos de dias, conforme falso positivo relatado. 2) Desde que foi atualizado no dia 20, não disparou mais. 3)Uma vez que não faz distinção de grupos de usuários estas edições deveriam ter disparado. A minha idéia era separar os não-confirmados para incluir um aviso de usar o mostrar previsão.OTAVIO1981 (discussão) 14h37min de 23 de julho de 2013 (UTC)Responder
Acredito que esta alteração corrige o problema que introduzi na mudança do dia 20, pois o teste
! user_name == 'CommonsDelinker'
que eu tinha inserido é sempre falso, pois
! user_name
sempre será igual a false, que é diferente da string 'CommonsDelinker'.
Quanto ao agrupamento/contagem de edições, não sei bem como funciona. Talvez não tenhamos entendido direito alguma coisa? Ou talvez seja um bug na extensão? Helder 15h19min de 23 de julho de 2013 (UTC)Responder
Teoricamente, 4 edições em 4 minutos disparam o filtro mas olhando o histórico deste artigo não foi isso que aconteceu. Era para ter 5 disparos mas houve somente 2 e no mesmo horário. Vou tentar fazer um levantamento durante a semana deste e ver o que aparece.OTAVIO1981 (discussão) 16h52min de 23 de julho de 2013 (UTC)Responder
Por hora coloquei exceção para 'script' no sumário.
Se o objetivo for 'ajudar novatos que estão com dificuldade na edição', então é válido para qualquer domínio exceto Wikipédia e Ajuda. Talvez tirar as páginas de discussão, mas talvez elas sejam úteis, e teriamos poucas ocorrências mesmo. Acho q tirar WP e Ajuda é um bom começo. Rjclaudio msg 15h12min de 18 de agosto de 2013 (UTC)Responder

Discussões gerais

Tempo de monitoramento e domínios

Qual tempo que se considera mínimo antes de se passar de "nenhuma ação" para "avisar"? Acho que pelo menos 1 mês está mais do que suficiente para estes filtros que já existem versões em outras pédias funcionando. Se for um totalmente novo acho que o prazo deve ser maior mas por enquanto pelo visto vai ser somente atualizar o que existe. Também tenho notado que a maioria dos filtros anglófonos é limitado domínio principal mas aqui temos o domínio anexo que também é conteúdo. Acho que deveriamos incluir, na medida do possível.OTAVIO1981 (discussão) 19h08min de 24 de junho de 2013 (UTC)Responder

Considero que um mês é o bastante, não apenas quando a parte relevante do código já é usada em outras wikis, mas também para os demais, desde que haja consenso de que a taxa de falsos positivos é muito baixa (deve-se ponderar o incômodo que um aviso invido causaria e a seriedade do problema que ele tenta prevenir).
Em geral, também apoio a inclusão do domínio anexo (a não ser que haja alguma especificidade a considerar em algum filtro). Helder 19h13min de 24 de junho de 2013 (UTC)Responder


Domínio anexo

A discussão a seguir está marcada como respondida (alterado). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

A maioria dos filtros só detecta o domínio principal (ou o contrário, só excluem o domínio principal). Acho que todos esses tb poderiam detectar o domínio anexo.

Rjclaudio msg 18h22min de 10 de julho de 2013 (UTC)Responder

Pode ser revisto sim a questão dos domínios. Os filtros de xingamentos não precisam desta restrição, com certeza mas acho melhor analisar individualmente pois o 40 deveria permitir ligações para páginas de usuários pois existem as listas de participantes. OTAVIO1981 (discussão) 18h58min de 10 de julho de 2013 (UTC)Responder
Faltou incluir o 56 (Branqueamento por conta nova) nesta lista que está restrito ao domínio principal.OTAVIO1981 (discussão) 20h21min de 12 de julho de 2013 (UTC)Responder
Indiquei na lista acima os filtros que já foram modificados. Helder 18h36min de 5 de agosto de 2013 (UTC)Responder
Alterei os filtros que faltavam. Rjclaudio msg 02h53min de 9 de agosto de 2013 (UTC)Responder
Só para constar, esta consulta à API pode ser útil para analisar o código de vários filtros de uma só vez (procurando coisas que deveriam ser corrigidas em vários deles). Por exemplo, procure por "article_namespace" no link anterior, para ver os filtros que analisam o domínio. Helder 13h34min de 19 de julho de 2013 (UTC)Responder

Domínio portal

Como é o vandalismo no domínio portal? Vale a pena incluir esse domínio nos filtros? Quase todos os da lista acima (para incluir anexo) tb poderiam servir para portal (exceto 47 e 55), e tem os outros q atualmente já incluem os anexos e que eu esqueci de olhar se servia para portal tb. Rjclaudio msg 18h24min de 10 de julho de 2013 (UTC)Responder

Portais tem pouquíssima vigilância, e uma das mais baixas taxas de edições patrulhadas, o pior é o domínio anexo, veja as tabelas que o Danilo.mac fez e colocou no projeto antivandalismo, [38] e [39]. Vulcan (discussão) 18h33min de 10 de julho de 2013 (UTC)Responder

lcase e irlike

A discussão a seguir está marcada como respondida (alterado). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Muitos dos nossos filtros usam a estrutura lcase( new_wikitext ) rlike, e agora que vi que existe irlike que ignora maiúscula / minúscula. Então seria melhor trocar essas coisas por new_wikitext irlike ? Rjclaudio msg 14h09min de 19 de julho de 2013 (UTC)Responder

Eu estava pensando nisso para reduzir o número de condições, já que:
  • A extensão considera que new_wikitext irlike 'texto' é apenas 1 condição;
  • A extensão considera que lcase( new_wikitext ) rlike 'texto' corresponde a 3 condições.
O que me incomoda é que ainda não dispomos de uma ferramenta para comparar a eficiência de duas versões de um filtro para decidir qual é mais rápida (para ver se será preciso ponderar a redução das condições com um aumento no tempo de processamento). Helder 15h09min de 19 de julho de 2013 (UTC)Responder
Fiz a alteração no filtro 77 (que parece ser o mais ineficiente que temos atualmente). Vamos ver como fica o tempo de execução médio depois disso (apesar de que p bugzilla:51294 me deixa na dúvida se esse número é confiável). Helder 15h20min de 19 de julho de 2013 (UTC)Responder

Está certa essa estatística? Passou de tempo 21.12 e condições 30 (dia 18, antes de você mudar) para tempo 22.98 e condições 553 (hoje). Piorou o tempo, mas o mais importante, aumentou bastante as condições. Rjclaudio msg 17h13min de 26 de julho de 2013 (UTC)Responder

Não leve muito ao pé da letra essas estatísticas que a AbuseFilter fornece sobre a média de condições que cada filtro gastou nas últimas X ações, pois atualmente está quebrada. E a média variar conforme o tipo de edição que estiver sendo feita nas páginas da wiki.
De qualquer modo, com a nova versão, a cada vez que esse teste precisar ser realizado, gastará só 1 condição (em vez de 3). Veja também a seção que incluí aqui: mw:Extension:AbuseFilter/Rules format#Conditions. Helder 17h37min de 26 de julho de 2013 (UTC)Responder
Troquei por irlike nos filtros que consegui mudar. Rjclaudio msg 15h35min de 9 de agosto de 2013 (UTC)Responder

Abaixo a tirania

A discussão a seguir está marcada como respondida (Feito). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Favor considerar a criação de um filtro que possa bloquear a frase inserida nos seguintes diffs: [40] / [41] / [42] / [43] / [44] / [45] / [46]. Grato, --viniciusmc (discussão) 17h09min de 19 de julho de 2013 (UTC)Responder

Eu lembro que costumava separar um filtro apenas para atender pedidos desse tipo (uma pessoa só (com várias contas/IPs), usando a mesma frase em um ou vários artigos). Não sei se continua assim. (Kleiner) 187.64.33.208 (discussão) 07h06min de 27 de julho de 2013 (UTC)Responder
Feito Filtro 109 Edições indevidas de conta ou IP de faixas diversas (diff). Rjclaudio msg 17h00min de 13 de agosto de 2013 (UTC)Responder

Lista de avisos

Filtros 05, 38, 52, 64 - Filtro específico para página nova?

Há vantagem em ter dois filtros diferentes, com regras diferentes e ações diferentes, "apenas" porque a edição é em uma página existente ou está criando uma? Rjclaudio msg 16h56min de 25 de julho de 2013 (UTC)Responder

Imaginei que esta diferenciação é para fazer uma triagem melhor dos falsos positivos. O 38 está recheado de falsos positivos então fundir com o 52 que está funcionando bem até o momento não me parece prudente.OTAVIO1981 (discussão) 18h51min de 25 de julho de 2013 (UTC)Responder
Sobre separar/fundir filtros, seria bom verificarem se isto que relatei ocorre hoje, isto é, se ainda há problema com filtro sendo desativado por atingir mais de 5% de ocorrências em relação ao total de ações analisadas. 187.64.33.208 (discussão) 06h54min de 27 de julho de 2013 (UTC)Responder
Quanto a isso, respondi no outro tópico: #Filtros 06, 07, 18, 68 - Ofensas. Helder 19h20min de 5 de agosto de 2013 (UTC)Responder

Edição patrulhada

Tem como marcar no registro dos filtros se a edição que foi salva já foi patrulhada por alguém? Quando vejo alguns filtros que tem várias edições potencialmente indevidas que foram salvas, meio chato abrir os diffs para ver se já foram revertidas. As vezes faço uma amostragem e acho algo que não foi revertido, então imagino que tem vários casos que estão passando. Rjclaudio msg 17h17min de 25 de julho de 2013 (UTC)Responder

Inicialmente, concordo que seria interessante sinalizar no Registros de abuso de um determinado filtro se a tal edição foi patrulhada ou não porém para dar completo apoio preciso entender melhor para que isto. Primeiro, que estar patrulhada significa que alguém já viu aquela edição e não necessariamente que foi boa ou não. Então, numa série de edições do mesmo editor no mesmo artigo todas estarem patrulhadas significa o que, se foi vista 1 ou 2? Queria entender melhor isto. Outra, é que além do patrulhamento estar baixo (só ver o filtro na ptwiki) os filtros também disparam em tentativas de salvamento então uma série de disparos de filtros do mesmo editor no mesmo artigo não significa que são salvamentos mesmo que o filtro não tenha ação nenhuma. E se não tem salvamento, não tem como patrulhar. Queria que explicasse melhor, Cláudio. Abs, OTAVIO1981 (discussão) 19h05min de 25 de julho de 2013 (UTC)Responder
Patrulhamento, o mesmo funcionamento do ! nas mudanças recentes e páginas vigiadas. Patrulhar significa que a edição foi verificada e as devidas ações foram tomadas (reversão, marcação de eliminação, ajuste, ou nada foi feito por estar ok). É diferente de analisar o filtro (detecção correta, falso-positivo, correto mas não era edição imprópria).
Por exemplo, temos um filtro "spam em PU". Tem PU que existe a página, isso significa que não era spam, que era spam e já enviaram para eliminação mas ainda não eliminaram, ou que é spam mas ninguém percebeu?
Eu não tenho costume de ficar nas MRs, mas até posso olhar os registros do filtro para ver se precisa reverter algo aproveitando que eu já estou olhando os falso-positivos. Se tivesse como ver se a edição foi patrulhada ou não, aí eu olharia com mais frequência os registros procurando vandalismos que passaram despercebidos pela MR, mas sem isso seria muito trabalho duplicado, especialmente pq uma mesma edição já verificada pode disparar vários filtros.
Rjclaudio msg 19h28min de 25 de julho de 2013 (UTC)Responder
Provavelmente não vou utilizar mas não me oponho que seja implementado. OTAVIO1981 (discussão) 19h49min de 25 de julho de 2013 (UTC)Responder

Oração / simpatia / macumba de São Cipriano

A discussão a seguir está marcada como respondida (Feito). Se quiser acrescentar mais algum comentário, coloque-o logo abaixo desta caixa.

Mais um exemplo de texto pronto impróprio que poderia ser considerado para um filtro: [47] / [48] / [49] / [50] / [51] / [52]. --viniciusmc (discussão) 05h49min de 26 de julho de 2013 (UTC)Responder

Feito Filtro 109 Edições indevidas de conta ou IP de faixas diversas (diff). Rjclaudio msg 17h00min de 13 de agosto de 2013 (UTC)Responder

Conta confirmada ou autorrevisor

A maioria dos filtros tem exceção para contas autoconfirmadas (aos poucos alterando para 'confirmadas'). Melhor mudar para não-autorrevisor? No mínimo os filtros que fazem apenas o registro, ou apenas uma etiqueta poderiam ser assim. Rjclaudio msg 17h36min de 26 de julho de 2013 (UTC)Responder

Acho que devemos deixar o 113 de fora desta exceção de contas pois se editores experientes estão criando artigos sem fontes devem ser tomadas providências. Para os outros casos, concordo que não-autorrevisor (IP+confirmadas+autoconfirmadas?) ficaria bom.OTAVIO1981 (discussão) 21h17min de 26 de julho de 2013 (UTC)Responder
Pra colocar no filtro seria ! 'autorrevisor' in user_groups ? Ou é o nome em inglês? Como é o nome em inglês? Rjclaudio msg 23h15min de 27 de julho de 2013 (UTC)Responder
Por aqui há uma mania de remover desnecessariamente os editores de um grupo quando são incluídos em outro: como pode ver ao examinar o registro de uma de suas edições, você (e os demais administradores, eliminadores, burocratas, robôs...) não faz parte do grupo "autoreviewer": a variável user_groups mostra apenas "sysop", "*", "user" e "autoconfirmed". Por outro lado, o Otavio está incluído nos grupos "autoreviewer", "*", "user" e "autoconfirmed".
Uma das vantagens do teste
'confirmed' in user_groups
é utilizar menos condições do que o teste
'confirmed' in user_groups | 'autoconfirmed' in user_groups
(atualmente os dois são equivalentes, porque os únicos grupos cujos nome contém a string "confirmed" são o "autoconfirmed" e o próprio "confirmed"). Talvez seja inviável trocar o teste atual (que é bem simples), por um que gasta muitas condições, como
'autoreviewer' in user_groups | 'bot' in user_groups | 'bureaucrat' in user_groups | 'eliminator' in user_groups | 'sysop' in user_groups
ou por um teste mais demorado (já que usa uma expressão regular), como
user_groups rlike 'autoreviewer|bot|bureaucrat|eliminator|sysop'
Helder 18h45min de 4 de agosto de 2013 (UTC)Responder
"Por aqui" = maioria discrepante dos grandes projetos da WMF.—Teles«fale comigo» 19h18min de 4 de agosto de 2013 (UTC)Responder
Faz uma semana que leio o comentário do Teles e não compreendo o que se passa. Se existe uma vantagem e nenhum impedimento técnico de não removermos um editor de um grupo, acho que devemos pensar seriamente deixar de fazer esta remoção mesmo se formos a única wiki a fazer isto.OTAVIO1981 (discussão) 11h42min de 12 de agosto de 2013 (UTC)Responder

Uma outra opção é ver a quantidade de edições do usuário, no caso, usuários sem direito a voto. Usuários com menos de 300 edições. Vai pegar também usuários um pouco experientes mas já é algo. Ou então baixar para 100 edições, ou 50. Rjclaudio msg 15h21min de 14 de agosto de 2013 (UTC)Responder

ER e FastButtons

Existe no FastButtons:

  • ER10 - Namespaces que não existem
  • ER18 - Discussão cujos artigos não existem
  • U2 - Página de usuário criada por outro usuário

Poderia desautorizar a criação de todos que forem esses casos. Vulcan (discussão) 11h32min de 27 de julho de 2013 (UTC)Responder

  • Difícil detecção automática pela possibilidade do título do artigo ser válido e apenas tem um  : no meio. Um filtro para os casos 'mais comuns' também não sei se compensa porque ainda seriam poucos casos.
  • Possível mas vale a pena? Acho que há mt pouca página de discussão criada sem uma página principal que já existe, na maioria dos casos a página principal foi eliminada / movida e aí elimina a discussão, então o filtro não deve apanhar quase nada. Testamos para ver se vale a pena?
  • Feito, ver #Filtro 12 - Edição em página de usuário alheia.

Rjclaudio msg 01h35min de 29 de julho de 2013 (UTC)Responder

Filtros para aumentar de nível

Muitas seções, muitas discussões, melhor uma lista dos filtros que estamos avaliando aumentar de nível.

Rjclaudio msg 18h20min de 29 de julho de 2013 (UTC)Responder

Como assim mudar o filtro 62 que não teve nenhuma análise? E o 17 com duas verificações tendo havido 204 salvamentos? Sinceramente não entendi.OTAVIO1981 (discussão) 23h00min de 29 de julho de 2013 (UTC)Responder
62-Nenhuma não, já tinha feito algumas análises (10?), e percebi que o filtro é objetivo e específico o suficiente para não precisar de tantas análises. Afinal, que situaçao que justifica a remoção da seção de ref? Apenas se não tivesse ref no artigo, ou se a seção de ref estivesse duplicada. E é isso que o filtro avalia. Precisa de centenas de análises?
17-Algo similar, espaço excessivo quase sempre está errado, tinha analisado umas 20, as poucas exceções que apareceram e que eu imaginei já coloquei ali. O mesmo que o outro, me parece ter pouco risco, e ainda mais que é apenas para avisar, não achei necessário muitas análises.
Mas se quiser posso ficar analisando, quantas análises vc recomenda? Rjclaudio msg 13h47min de 30 de julho de 2013 (UTC)Responder
O que eu recomendo é adotarmos a mesma prática para seguir melhorando os filtros: Analisar, propor, alterar e monitorar continuamente (PDCA). Desculpa mas as conclusões a respeito do filtro 62 fornecidas ontem não tinham embasamento nenhum. Que remover seção de refs é vandalismo todo mundo sabe mas o filtro estava realizando corretamente o que era suposto fazer? Eu não tinha como saber pela mensagem e dados gerados. O filtro 17, idem e incluir estes dois filtros num resumo (que é muito necessário, aliás) como se já estivesse sendo debatido faz dias foi precipitado na minha opinião. Pode ser muito claro para você que as alterações são necessárias e foram corretas mas nem todo mundo tem o mesmo feeling para perceber estas coisas e acompanhar a sua proposta.OTAVIO1981 (discussão) 14h51min de 30 de julho de 2013 (UTC)Responder
Para já, concordo em configurar o filtro 5 para impedir as edições, pois não vi nenhum falso positivo para a versão atual. Mas seria bom criar um aviso mais específico, não? Helder 21h30min de 8 de agosto de 2013 (UTC)Responder

Inclui o Filtro 6 - Artigo fora de escopo do projeto, Filtro 64 - PN em maiúscula e Filtro 49 - PN com ER na lista acima. Rjclaudio msg 16h34min de 9 de agosto de 2013 (UTC)Responder

Organização do espaço

Seguindo um ponto importante que o Cláudio fez duas seções acima, está começando a ficar difícil de acompanhar as discussões e melhorias que estão sendo implementadas no que diz respeito aos filtros. Gostaria de saber se outros tem a mesma impressão e o que podemos fazer para melhorar isso. Seria ótimo se Wikipedia:Filtro de edições/lista tivesse os respectivos links para onde a discussão do filtro está acontecendo e qual a proposta atual sendo debatida, semelhante ao pequeno resumo já criado acima mas com todos os filtros. Imaginei em deixar em itálico o que tem debate acontecendo e em negrito o que requer atenção rápida. Acho que também é oportuno desmembrarmos as discussões de cada filtro nas páginas de discussão quando movermos das subpáginas de "Falso positivo" para "Análise" (se vier a ser este o nome escolhido). O que acham?OTAVIO1981 (discussão) 17h04min de 30 de julho de 2013 (UTC)Responder

Também acho difícil acompanhar. Uso muito o script do Helder para discussões (colapsa seções que não tem comentários a x dias), facilita saber o que está em atividade. Mas ainda assim demora. Uma maior frequencia no arquivamento ajudaria um pouco. Discordo de passarmos a discutir nas Páginas de discussão de 'Análise/Filtro xx' por ficar difícil vigiar a página (dependendo do filtro, fica cheio de edições de análise dos registros). Poderia até ser para arquivar.
Eu senti falta de saber quais filtros que tem potencial para aumentar de nível, e quais que estão precisando de mais análise. Estava com tempo livre para analisar os registros e não sabia por onde começar. Por isso que criei o resumo acima. Acho que algo desse tipo já estava bom, um filtros com potencial (analisar para aumentar o nível), modificados recentemente (análise 'intensiva' por pouco tempo pro caso de ter falso-positivo), e novos filtros (novidade precisa de ideia para as regras do filtro). Acho assim melhor do que colocar um 'status da discussão' ao lado de cada filtro, porque a tendência é a maioria dos filtros não terem muita coisa.
Rjclaudio msg 14h54min de 1 de agosto de 2013 (UTC)Responder
Sobre deixar as discussões por aqui não me oponho mas persiste o problema de um comentário justamente sobre o filtro que o colaborador está analisando passar despercebido em meio a muitos outros. E o mesmo problema ocorre comigo: estou com algum tempo para analisar mas não sei o que é prioridade para vocês (Rjclaudio e Helder) para eventualmente ser alterado. Já teve alguma discussão para o 66, 53 e 67 mas pelo que me consta não foi alterado então fico sem saber se falta mais análise ou se falta tempo para mexer neles e reiniciar a análise num novo nível. Minha proposta então é utilizar a Wikipedia:Filtro de edições/lista com os títulos que tem potencial para mudar de nível em negrito e aí quem tiver interesse pelo filtro procura na discussão o tópico para debater e deixar um (+) do lado dos filtros que estão precisando de mais análise e são prioritários. O que acham?OTAVIO1981 (discussão) 12h38min de 2 de agosto de 2013 (UTC)Responder
Acho que seria útil dispor de uma subpágina específica para a discussão de cada filtro (como se fosse uma Especial Discussão:AbuseFilter/N, que o software não oferece), na qual poderíamos organizar as propostas de aprimoramento daquele filtro por meio de (sub)seções. Para manter a simplicidade, poderíamos usar nomes do tipo "WP:Filtro de edições/N" (ou "WP:Filtro de edições/Filtro N"), trocando "N" pelo número que identifica cada filtro. Se isso fosse implementado, poderíamos mover as discussões antigas sobre o filtro X para uma "#Seção sobre o assunto" de cada etapa de aprimoramento que foi discutida para cada filtro. Com subpáginas, também teríamos títulos padronizados para os quais poderíamos inserir links nas páginas relevantes (por exemplo, na interface da página em que se vê o código de cada filtro, etc...). A proposta mais recente relacionada a cada filtro geralmente estaria em "WP:Filtro de edições/N#footer" (salvo casos em que exista mais de um assunto em discussão para um certo filtro, quando duas ou mais seções teriam comentários recentes). Páginas individuais também permitiriam categorizar essas páginas (talvez com predefinições do tipo {{filtro precisando de atenção}}, Categoria:Filtros que poderiam tomar outras ações, etc, a decidir posteriormente), de modo que pudéssemos, por exemplo, gerar listas dinâmicas que os editores interessados em filtros poderiam consultar para escolher algo em que ajudar. Helder 20h45min de 10 de agosto de 2013 (UTC)Responder
Se for uma subpágina só para a discussão do filtro, até concordo. Mas manteria essa página aqui para discussões que abrangem mais de um filtro, como a discussão sobre os três filtros de páginas curtas, que são dependentes um do outro. Rjclaudio msg 14h37min de 11 de agosto de 2013 (UTC)Responder
Tem alguma preferência quanto ao nome a ser adotado para as subpáginas em que cada filtro será discutido? Pode ser "WP:Filtro de edições/N" mesmo?
Concordo que seria útil centralizar algumas discussões mais gerais em uma única página, só não sei bem qual. Talvez poderíamos simplesmente escolher um dos filtros envolvidos, e fazer o mesmo que faz com algumas discussões da esplanada que falam sobre políticas e projetos específicos, ou usar Labeled Section Transclusion para transcluir o conteúdo relevante nas outras. Esta página aqui (ou a própria WP:Filtro de edições) poderia ficar apenas com os links para aos filtros, e para as subpáginas de discussão, de análise, etc... (talvez organizando por meio de listas por assunto, ou com uma tabela). Helder 15h25min de 11 de agosto de 2013 (UTC)Responder
Pensei em mover as discussões de cada filtro para as páginas onde estamos analisando eles. Aliás, não tinhamos a idéia de mover os filtros em subpáginas de Wikipédia:Filtro de edições/Falsos positivos para outra? Acho que assim fica legal de centralizar pois suponho que já estamos vigiando estas páginas ao realizar a análise. Com isto, não estamos estaríamos deixando de ver nada pois são páginas que já vigiamos não? Concordo que para alguns filtros fica melhor centralizar, talvez em Wikipédia Discussão:Filtro de edições/Falsos positivos ou até Wikipédia Discussão:Filtro de edições. A idéia do Helder também é muito boa. As fusões já funcionam de modo parecido no qual a discussão centralizada é transcluída nas discussões dos artigos. Acho que funciona bem assim. OTAVIO1981 (discussão) 11h58min de 12 de agosto de 2013 (UTC)Responder
Na verdade eu acrescentei o parâmetro "watchlist: 'nochange'" ao código que edita a página de registros por meio da API, para que a lista de páginas vigiadas não fosse alterada (por aparecer muita coisa na lista de páginas vigiadas, como foi apontado pelo Rjclaudio), e em troca incluí na página de estatísticas o link para as mudanças recentes em tais páginas, para permitir que pudéssemos ver o que foi analisado recentemente (sem ter que ver isso a toda hora).
Talvez um dia finalmente tenhamos como criar grupos de páginas vigiadas...
Helder 12h23min de 12 de agosto de 2013 (UTC)Responder
Com essa mudança no script não há mais nenhum impedimento para usarmos as subpáginas dos falso positivos. Concordo com isso. Podemos começar as moções? Rjclaudio msg 12h46min de 12 de agosto de 2013 (UTC)Responder
Acho que o que eu disse pode não ter ficado claro: com "watchlist: 'nochange'", o script não edita sua lista de páginas vigiadas (ou seja, se alguém que não vigia a página "WP:Filtro de edições/Análise/Filtro N" analisar o filtro N, continuará não vigiando essa página, e se alguém optou por vigiá-la, continuará vigiando-a).
Não há como vigiar "Wikipédia Discussão:Filtro de edições/Análise/Filtro N" sem vigiar também "WP:Filtro de edições/Análise/Filtro N", e isso é o que nos impede de usar essas páginas de discussão para discutir sobre cada filtro sem inundar nossa Especial:Watchlist com as análises. Helder 13h10min de 12 de agosto de 2013 (UTC)Responder
Bem, não sei se o script sempre funcionou deste modo mas o que acontece é que estou vigiando quase todas as páginas de análise. Aqui não fica muito inundado pois só aparece mesmo a última edição. Pior é no modo mobile onde todas as edições do mesmo filtro aparecem aí é impossível acompanhar. Eu diria que a "inundação" das páginas vigiadas é um custo que estou disposto a pagar. Porém, se outro espaço for elencado para desmembrar a discussão também não vejo problemas. OTAVIO1981 (discussão) 13h19min de 12 de agosto de 2013 (UTC)Responder
Nas minhas vigiadas eu deixei aparecendo todas as edições e não apenas a última, então a inundação pra mim é demais e não me deixa vigiar a discussão. Helder, pelo visto entendi errado. Fico com a opção de criar uma página específica para a discussão de cada filtro. Rjclaudio msg 13h47min de 12 de agosto de 2013 (UTC)Responder
Isso. O que aparece depende das preferências. Helder 13h51min de 12 de agosto de 2013 (UTC)Responder

Que título preferem? "WP:Filtro de edições/N", "WP:Filtro de edições/Filtro N", ou alguma outra coisa? A princípio, prefiro "/N" mas aceito qualquer uma das duas opções. Helder 13h51min de 12 de agosto de 2013 (UTC)Responder

/N é menor e mais simples, minha preferencia, mas aceito qualquer um dos dois. Rjclaudio msg 14h01min de 12 de agosto de 2013 (UTC)Responder
/N, então. Vamos incluir este espaço no cabeçalho com que título geral? Tudo indica que será ánalise mas não custa perguntar...hehehe OTAVIO1981 (discussão) 14h09min de 12 de agosto de 2013 (UTC)Responder
Hmm... Acabei usando "Análise e estatísticas" para a (nova) WP:Filtro de edições/Análise. Como "Discussão sobre os filtros existentes" ficaria longo demais, talvez esta "/Solicitações" pudesse virar "/Discussão", e transcluir tanto as /N dos filtros que estiverem em discussão (os demais ficam "arquivados", isto é, sem transclusão), quanto tópicos gerais como alguns dos que hoje estão na Wikipédia Discussão:Filtro de edições.
Algo que já podemos começar é a movimentação das discussões sobre filtros específicos que já estão por aqui, para as páginas /N, já que concordamos com este nome (aí já podemos acompanhar melhor o que está sendo discutido). Helder 14h36min de 12 de agosto de 2013 (UTC)Responder
Criei a {{Discussão do filtro de edições}} para testar a migração. Está aceitável? Helder 14h53min de 12 de agosto de 2013 (UTC)Responder
Está bom. Rjclaudio msg 15h01min de 12 de agosto de 2013 (UTC)Responder

Teremos nessa página seções de texto transcluído e seções próprias dessa página? Vai ficar meio bagunçado não? Rjclaudio msg 15h08min de 12 de agosto de 2013 (UTC)Responder

Talvez não fique bagunçado. Pensei em colocar os tópicos das páginas de discussão no início da página (ordenando pelo número de identificação do filtro?) e as demais no final desta página (podendo ser movida posteriormente para uma subpágina, caso seja uma discussão que dê origem a um novo filtro). As duas partes poderiam ser separadas por meio da criação de duas seções (assumindo que esta página passe a ter o nome "/Discussão", faria sentido ter uma seção para "Discussões sobre cada filtro" e outra para "Discussões gerais"). Helder 16h55min de 12 de agosto de 2013 (UTC)Responder
Quando estava movendo pro topo as discussões de cada filtro, acabei por separar por tema. Achei mais fácil de comparar discussões sobre o mesmo assunto. E de certa forma parece útil pras discussões que envolvem vários filtros (sobre um mesmo tema). Rjclaudio msg 17h31min de 12 de agosto de 2013 (UTC)Responder
Acham que isso faz com que seja desnecessário manter a Wikipedia:Filtro de edições/lista à direita? Helder 17h53min de 12 de agosto de 2013 (UTC)Responder
Podiamos passar o conteúdo dessa lista para as seções aqui da discussão. Na seção '3 Filtros sobre strings' colocava a lista de filtros desse tema, e talvez até alguma breve descrição (tipo, aplicável a páginas novas curtas / páginas já existentes / todas as páginas, todos os domínios, termos específicos, novo / em teste). Nós temos 5 filtros de ofensas mas só pela lista ali do lado não dá para diferenciar entre eles. Rjclaudio msg 13h51min de 13 de agosto de 2013 (UTC)Responder

Senti falta de um link na página de discussão para a página de análises e para a página do filtro. E um link para essa página daqui também, pro caso de surgir alguma discussão mais geral. E as categorias. Então ficamos como, faz uma predef pra colocar no topo dessas páginas dos filtros? Rjclaudio msg 16h15min de 12 de agosto de 2013 (UTC)Responder

Acho que uma predefinição no cabeçalho pode resolver todos este problemas indicados, Cláudio. Vou tentar fazer uma por aqui ainda hoje!OTAVIO1981 (discussão) 16h53min de 12 de agosto de 2013 (UTC)Responder
Acredito que será útil colocar uma predefinição no topo das páginas de discussão de cada filtro, com esses links que sugeriu. Helder 16h55min de 12 de agosto de 2013 (UTC)Responder
Fiz um rascunho da predefinição e podem ver funcionando aqui. Este modelo inicial é para os casos em que os filtros são desmembrados. Pensei em fazer parecido com a esplanada mas talvez seja melhor um modelo parecido com as de usuário tipo {{Usuário4}}, por exemplo. O que acham? Sugestões e melhorias são bem-vindas!OTAVIO1981 (discussão) 17h17min de 13 de agosto de 2013 (UTC)Responder

Criei Usuário:Rjclaudio/Filtro pra tentar me organizar, pq já estava ficando perdido de novo. Ao invés de transcluir as discussões nessa página daqui, só deixar resumindo o andamento das coisas e um link pra onde está a discussão relacionada. Rjclaudio msg 19h54min de 14 de agosto de 2013 (UTC)Responder

Acredito que a extensão Labeled Section Transclusion também pode ser útil nesse sentido (de produzir uma visão geral resumida do que está sendo feito). A parte desta página que lida com filtros específicos poderia ser gerada de forma similar a:
Helder 20h11min de 14 de agosto de 2013 (UTC)Responder
Este recurso parece ser exatamente o que estamos precisando. Vai ficar bom deixar as discussões nas respectivas páginas e aqui um resumo. Por enquanto, vou vigiando a página do Cláudio...rsrs OTAVIO1981 (discussão) 11h58min de 15 de agosto de 2013 (UTC)Responder
O Helder já havia melhorado a predefinição de cabeçalho e agora a pouco fiz outra melhoria. Aqui nesta página temos os links principais do filtro. Vejam na primeira seção, por exemplo, e digam o que acharam. Ficou poluído?OTAVIO1981 (discussão) 13h12min de 15 de agosto de 2013 (UTC)Responder

Especial:Filtro de abusos/test: "modificações" ou "alterações"

Na lista de opções temos

  • Modificações pelo usuário:
  • Alterações feitas depois:
  • Modificações feitas antes de:
  • Alterações à página:

Por que essa alternância entre "modificações" e "alterações"? Rjclaudio msg 16h55min de 9 de agosto de 2013 (UTC)Responder

Acredito que seja o resultado de uma tradução feita colaborativamente, mas sem a interação entre os colaboradores... :-)
Alterei para "alterações" no Translatewiki, levando em conta que "modificações" aparece com bem menos frequência nos arquivos de traduções do MediaWiki para o português:
  • pt:
    • modificações: 5
    • mudanças: 41
    • alterações: 32
  • pt-BR:
    • modificações: 6
    • mudanças: 27
    • alterações: 40
Helder 19h38min de 10 de agosto de 2013 (UTC)Responder

new_size

Alguns filtros usam o new_size , já falamos sobre isso em alguns deles, ora removendo, ora equiparando com o PN mínima 1 (50), ora equiparando com o Branqueamento por novo editor (40). Como ficamos? Tiramos tudo, passa tudo para 40, ou passa para 50? Rjclaudio msg 17h03min de 9 de agosto de 2013 (UTC)Responder

Conferir o novo tamanho da página pode ser importante no caso de filtros que comparem uma expressão regular com o novo código wiki da página, para evitar esse tipo de teste se a página em questão for muito grande. Helder 19h43min de 10 de agosto de 2013 (UTC)Responder

Tenho 'medo' de alguns dos nossos filtros de PNs estarem registrando artigos novos mt pequenos que já são impedidos / avisados pelos filtros de PN mínima, e ter apenas alguns poucos casos em que o filtro realmente faz alguma diferença (ele mostra avisa quando os filtros de PN mínima não mostrariam). Posso colocar new_size>70 em todos os filtros de páginas novas? Rjclaudio msg 18h31min de 14 de agosto de 2013 (UTC)Responder

Acho que vai depender de cada situação. Para o filtro 52 nós retiramos e me pareceu uma boa decisão pois já tínhamos um histórico de como o filtro estava funcionando para o que pretendia. Ao removermos o new_size deste, o número de disparos certamente aumentou mas como já tínhamos analisado não tem problema agora estar "em conflito" com o filtro 66. Então a minha conclusão é de deixarmos os filtros que estamos analisando alinhados com os filtros de PN para tentar "isolar" o filtro durante a análise. Quando estiver segurança no funcionamento correto, analisamos se o parâmetro new_size é realmente necessário e removemos em caso negativo para diminuir o número de expressões.OTAVIO1981 (discussão) 12h14min de 15 de agosto de 2013 (UTC)Responder

Texto de bloqueio nos avisos do filtro

Acho que todos os nossos filtros tem o texto que fala "edições não construtivas serão revertidas rapidamente, e se insistir poderá ser bloqueado". Esse texto é importante? Imagino que usuários com más intenções não vão se dar ao trabalho de ler o texto dos avisos, e os que tem boas intenções não precisam desse texto pois não querem insistir nas edições ruins, e de todo modo já tem avisos do tipo em outros lugares. Quanto mais texto, menos gente lê os avisos. Proponho remover esses trechos. Rjclaudio msg 00h57min de 11 de agosto de 2013 (UTC)Responder

Concordo com a simplificação.OTAVIO1981 (discussão) 12h00min de 12 de agosto de 2013 (UTC)Responder
Feito, removido a menção a bloqueios em todos os avisos. Rjclaudio msg 15h02min de 3 de setembro de 2013 (UTC)Responder

Não-confirmados e filtros em teste

Pros filtros em teste, não seria melhor retirar essa exceção às contas confirmadas? Assim teriamos uma ideia melhor de falso-positivos, já que aumenta a quantidade de ações analisadas e veriamos também as edições de usuários 'experientes' e que tem mais chances de serem corretas. Rjclaudio msg 14h04min de 13 de agosto de 2013 (UTC)Responder

Filtros eliminados

O que fazer com os vários filtros eliminados? Substituimos eles por outros ao invés de criar um filtro novo, como já vi acontecer? Ou deixa eles quietos? Rjclaudio msg 13h13min de 14 de agosto de 2013 (UTC)Responder

Se não houver impedimento técnico ou desvantagem, fico inclinado a realizar a substituição. Acredito que é importante mantermos o ambiente organizado e uma lista com menos itens é mais fácil de ler/utilizar/atualizar do que uma com muitos itens dos quais alguns elementos só estão ocupando espaço (os inativados). A esta altura já requer paciência saber em que pé estão os filtros e acompanhar tudo o que se passa. OTAVIO1981 (discussão) 14h22min de 14 de agosto de 2013 (UTC)Responder
A opção "Ocultar filtros eliminados" da Especial:Filtro de abusos é ativada por padrão, então a lista não fica com mais itens por causa destes filtros a não ser que o usuário tenha intenção de vê-los (por exemplo, para ver o tipo de filtro que já se tentou criar no passado, e que não deu certo?). De forma análoga ao procedimento adotado no Wikidata, de não se reaproveitar o número de identificação de um item apagado para criar um item diferente, não vejo porque deveríamos criar um filtro diferente reutilizando o número que identificava um filtro antigo.
E qual é o critério que utilizaremos para eliminar um filtro em vez de simplesmente desativá-lo? (notem que na página também há a opção "Ocultar filtros desativados"). Qual é o critério em outras wikis? Helder 14h25min de 15 de agosto de 2013 (UTC)Responder
Cláudio, só para te informar. Hoje de manhã estava conversando com o Helder no IRC e talvez exista uma vantagem de aproveitar os filtros eliminados. Ao que parece, os filtros têm 1000 ações para executar num limite de tempo então, numa lista de 119 filtros se os primeiros 100 gastarem todas as ações os outros 19 filtros não seriam executados. Dito isto, é vantajoso termos os filtros em ordem crescente de quantidades de ações gastar por filtro pois deste modo podemos maximizar a quantidade de filtros e uma maneira de por alguma ordem é reaproveitar os espaços de filtros já eliminados. Felizmente, ao que parece, ainda estamos longe de consumir todas as ações e na verdade precisamos entender melhor como funciona isso para decidir se reutilizamos ou não. Só passando para te atualizar da informação. OTAVIO1981 (discussão) 22h01min de 17 de agosto de 2013 (UTC)Responder
Otávio, acredito que o tempo não tem qualquer relação com o limite de 1000 condições ($wgAbuseFilterConditionLimit) que podem ser utilizadas ao processar cada edição. Quanto a reaproveitar os filtros, é o tipo de coisa que eu preferiria não fazer, a não ser que um dos desenvolvedores comfirmasse esse palpite de que os últimos filtros da lista (os com maior número de identificação) podem ser prejudicados por causa dos primeiros. Helder.wiki (discussão) 01h30min de 24 de agosto de 2013 (UTC)Responder
Sim, enquanto não termos certeza do palpite não há necessidade deste reaproveitamento até porque não há indícios de os filtros estejam estourando o limite né?OTAVIO1981 (discussão) 18h33min de 25 de agosto de 2013 (UTC)Responder
Movido para uma nova seção. Helder 13h49min de 26 de agosto de 2013 (UTC)Responder

Desempenho dos filtros

Mais ou menos, Otávio. Só porque você falou nisso, fui olhar a Especial:Filtro de abusos e estava assim: "Das últimas 5 311 ações, 3 (0,06%) atingiram a condição limite de 1 000"comentário não assinado de Helder.wiki (discussão • contrib)

Ops, acabei de ver também Das últimas 2 175 ações, 17 (0,78%) atingiram a condição limite de 1 000, e 122 (5,61%) corresponderam a um dos filtros neste momento ativos. então precisamos acertar o nosso palpite de vez. Outra coisa, não recebi a notificação desta sua mensagem, Usuário:Helder.wiki. Abs, OTAVIO1981 (discussão) 12h08min de 26 de agosto de 2013 (UTC)Responder
Sobre a notificação, é porque aqui não é uma página de discussão (de usuário?). Helder 12h48min de 26 de agosto de 2013 (UTC)Responder
A primeira notificação eu recebi. Por isso achei estranho não receber a segunda. Voltando ao tópico, será que tem como fazer um script só para coletar esta informação pois assim poderíamos na medida do possível executá-lo ao longo do dia para tentar monitorar. Ok, copy-paste também funciona e aceito esta opção...rsrsrs OTAVIO1981 (discussão) 12h59min de 26 de agosto de 2013 (UTC)Responder
Ah, então não foi notificado porque eu esqueci de assinar...
Seria preciso baixar a página Especial:Filtro de abusos e extrair a informação do HTML, como é feito em WP:Filtro de edições/Análise#Tempo de execução dos filtros (o que é ruim, pois idealmente deveria ser utilizada a API, mas ela não fornece essa informação). Acabo de atualizar aquela seção de estatísticas, e também colei manualmente essa linha extra no início. Helder 13h28min de 26 de agosto de 2013 (UTC)Responder
O que precisamos mesmo é de um robô que atualize uma tabela de desempenho a cada meia hora, pois os números de condições flutuam demais para conseguirmos dizer alguma coisa com base em verificações manuais (enquanto eu preparava um comentário sobre o filtro 36, que consumiu 615 condições de acordo com a última atualização, o número caiu para 91). Helder 13h46min de 26 de agosto de 2013 (UTC)Responder
Otávio, note como o filtro 36 passa de 128 para 620 condições em menos de 4 minutos (passando da terceira à primeira posição na tabela, se ordenamos os filtros pelo número de condições que consomem). Helder 14h01min de 26 de agosto de 2013 (UTC)Responder

Falso-positivos e Boa fé

Não sei quanto a vocês, mas eu estou sempre marcando como falso-positivos quando o filtro detecta corretamente a edição mas ela é uma edição de boa fé. Assim essa ação fica mais destacada na lista de análises, e ajuda na hora de decidir aumentar o nível e fazer o texto do aviso. Faço certo? Se não for, o script até podia ter uma opção de 'boa fé' para além do 'sim' e 'não'. Rjclaudio msg 14h02min de 14 de agosto de 2013 (UTC)Responder

Também marco como falso positivo edições em que é possível avaliar que houve boa fé do editor. Aí sempre faço um comentário explicando o motivo da marcação. OTAVIO1981 (discussão) 14h13min de 14 de agosto de 2013 (UTC)Responder

Nome da etiqueta para remoção de conteúdo

Acredito que é melhor desativar a etiqueta denominada "Remoção conteúdo válido" (usada pelos filtros 3, 51, 54 e 62) pois ela assume demais sobre a capacidade dos filtros que a utilizam: nem sempre um conteúdo removido é válido, e não é o filtro que vai determinar isso, mas sim uma análise humana. Seria preferível usar simplesmente "Remoção de conteúdo". Helder 11h58min de 13 de novembro de 2012 (UTC)Responder

Aliás, também seria bom remover o " válida" do nome do filtro 51. Helder 11h59min de 13 de novembro de 2012 (UTC)Responder
Tentei mudar o nome da "Remoção conteúdo válido", mas parece que as edições antigas já etiquetadas não mudam, pelo que desfiz a alteração. Mas fiz a segunda parte. – Opraco (discussão), às 02h35min de 2 de janeiro de 2013 (UTC)Responder
Isso é normal (devido ao bugzilla:18908), e o quanto antes for corrigido, melhor! Helder 22h48min de 6 de março de 2013 (UTC)Responder
A propósito, agora que os interwikis vêm do Wikidata, os filtros 54 e 3 podem ter que ser desativados se começarem a surgir muitos falsos positivos. Helder 22h48min de 6 de março de 2013 (UTC)Responder
Sugiro desativar o filtro 54 e adicionar ao filtro 3 um "and not <código do filtro 54>"... Kleiner msg 06h21min de 7 de março de 2013 (UTC)Responder
O nome da etiqueta não muda, o que pode mudar é o que será colado no histórico da edição, e mesmo assim para as novas edições apenas... O melhor é perguntar novamente nas discussões que agregam editores dedicados a combater vandalismo sugestões de melhorias para as etiquetas (provavelmente algumas delas são descartáveis, outras certamente não são)... Kleiner msg 06h24min de 7 de março de 2013 (UTC)Responder
Muda sim: exemplo no Wikilivros. Helder 13h33min de 21 de junho de 2013 (UTC)Responder
Ao mudar no filtro, o que acaba acontecendo é a criação de uma nova etiqueta. A etiqueta anterior continua existindo como "registro histórico", embora não seja mais usada: Etiquetas do Wikilivros. Kleiner msg 22h13min de 25 de julho de 2013 (UTC)Responder
Sim, mas foi o que eu disse no pedido inicial: desativar a etiqueta. O fato de não ser possível remover o nome antigo é um motivo a mais para que deixemos de utilizá-lo o quanto antes, principalmente agora que elas também aparecem nos diffs (ou seja, ficaram ainda mais visíveis). Tanto no Wikilivros quanto na Wikipédia em inglês há etiquetas que foram desativadas por terem recebido um nome que não era o mais adequado no momento em que foram criadas...
Mas realmente acho que a lista de etiquetas existentes precisa de uma reforma. Helder 14h46min de 26 de julho de 2013 (UTC)Responder
A minha primeira resposta foi ao Opraco, que tentou mudar (em vez de desativar e criar outra) e não conseguiu. Quando você respondeu "muda sim", deu a entender que dava pra alterar os registros já existentes... =)
Alguns anso atrás abri um tópico na Esplanada pedindo para dizerem quais etiquetas eram usadas ou não, pra fazer uma manutenção. Mas se não me engano, disseram que quase todas eram úteis e tal, aí deixei pra me preocupar com isso novamente em outra ocasião. Até tomei a liberdade de alterar a redação de diversos rótulos, mas foi só. 187.64.33.208 (discussão) 06h59min de 27 de julho de 2013 (UTC)Responder

Info/Filtros de edição

Estava pensando se não seria bom transformar a {{Discussão de filtros (cabeçalho)}} em uma caixa lateral (do tipo infobox) e incluir também uma seção com uma lista (automática) com links para os últimos (5?) falsos positivos registrados (por meio de algo como o que o Danilo fez em WP:Café dos programadores#Gerar lista de portais com Lua e parte do código do Módulo:Filtros). Helder 15h46min de 25 de agosto de 2013 (UTC)Responder

Estava pensando em colorir o cabeçalho e sinalizar melhor o que está parado, o que tem proposta ou requer atenção mais facilmente. Concordo pois me parece que a idéia tem o mesmo objetivo (facilitar o acompanhamento).OTAVIO1981 (discussão) 14h02min de 26 de agosto de 2013 (UTC)Responder

Marcar registros com exemplos de expressões problemáticas

O que acham de possibilitar a inclusão de um parâmetro do tipo "tags=ofensas" na {{Ação}} (que é usada ao registrar falsos positivos), e ter uma caixa de verificação do tipo

perto dos botões gerados pelo script que utilizamos para a análise?

Pensei no parâmetro "tags" para que futuramente pudéssemos ampliar a lista de tags suportadas (por exemplo, "tags=ofensa,pergunta"), se houver interesse/necessidade (eventualmente, seria possível criar códigos em Lua ou JS para coletar/gerar estatísticas ou listas com essas tags). Helder 16h04min de 25 de agosto de 2013 (UTC)Responder

Acho ótimo. Sempre que possível verifico se determinada edição deixou de disparar outro filtro e sinalizo no comentário.OTAVIO1981 (discussão) 14h00min de 26 de agosto de 2013 (UTC)Responder

Impedir criação de artigos até ser autoconfirmado

Ver [53]. TheVulcan (discussão) 18h18min de 26 de agosto de 2013 (UTC)Responder

Possível, só ter a aprovação da comunidade. Rjclaudio msg 18h29min de 26 de agosto de 2013 (UTC)Responder
E de anexos?--Mister Sanderson (discussão) 21h25min de 26 de agosto de 2013 (UTC)Responder
Isso seria muito mais ineficiente do que remover a permissão create do grupo autoconfirmed (e possivelmente o tal filtro seria desabilitado automaticamente por passar dos limites que os administradores de sistema definiram como sendo aceitáveis). Helder 00h33min de 27 de agosto de 2013 (UTC)Responder
Pelo que entendi o grupo de autoconfirmados é que teria a permissão, e os não-autoconfirmados é que perderiam.--Mister Sanderson (discussão) 00h36min de 27 de agosto de 2013 (UTC)Responder
Isso. Me confundi. Helder 00h59min de 27 de agosto de 2013 (UTC)Responder

Impacto das melhorias realizadas.

Prezados, Helder.wiki e Rjclaudio. Após muito refletir não consegui pensar numa metodologia pela qual seja possível medir o impacto das modificações que temos realizados nos filtros de combate ao vandalismo. A explicação é bem simples: a quantidade de vandalismos varia ao longo do ano conforme o número de edições (julho, foi um mês baixo e estamos numa ascendência de edições até outubro) e é variável se os filtros irão ou não barrar mais vandalismos pois depende do tipo de edição que está sendo feita. Se vocês tiverem idéias de como medir este impacto, gostaria de ler. Porém, acredito ser possível pelo menos medir a evolução do trabalho em si de atualizar os filtros. Para começar, foram 337 alterações de filtro em somente dois meses desde a atualização feita pelo Teles a meu pedido até hoje. Para comparativo, o mesmo número de alterações levou 2 anos para ser atingido antes do trabalho ser reiniciado. Alterar um filtro, teoricamente, não significa nada pois pode ser uma alteração somente da descrição ou typo do histórico. As mudanças que efetivamente tem impacto para um filtro são as alterações para o modo mais restrito. Abaixo, registrei o histórico de alterações realizadas nos últimos dois meses:

  • Em 16 de julho filtro 56 passou a avisar;
  • Em 26 de julho filtro 12 passou a desautorizar;
  • Em 8 de agosto filtro 52 passou a desautorizar;
  • Em 9 de agosto filtro 9 passo a etiquetar;
  • Em 12 de agosto filtro 17 passou a avisar;
  • Em 13 de agosto filtro 88 passou a avisar e etiquetar;
  • Em 13 de agosto filtro 115 criado já no modo avisar;
  • Em 13 de agosto filtro 77 passou a avisar;
  • Em 14 de agosto filtro 39 passou a avisar;
  • Em 14 de agosto filtro 64 passou a avisar;
  • Em 14 de agosto filtro 40 passou a avisar;
  • Em 15 de agosto filtro 117 criado já no modo avisar;
  • Em 15 de agosto filtro 56 passou a desautorizar;
  • Em 19 de agosto filtro 17 deixou de avisar por não estar disparando;
  • Em 20 de agosto filtro 30 passou a avisar;
  • Em 25 de agosto filtro 5 passou a desautorizar;
  • Em 27 de agosto filtro 81 passou a etiquetar.

Foram 17 alterações de nível e novamente, para efeito comparativo, as últimas 17 anteriores foram durante os últimos 2 anos. Os filtros evoluíram 2 anos em 2 meses por assim dizer. Dito tudo isso, a conclusão que cheguei é que o ideal é termos todos os filtros pelo menos etiquetando e pelo que contei faltam 17. Temos 21 filtros desautorizando, 28 avisando, 1 limitando a quantidade de ações e 15 somente etiquetando dos 82 filtros ativos. Dito isso, é provável que metade dos filtros que não tinha ação agora fazem pelo menos a etiqueta. OTAVIO1981 (discussão) 18h29min de 28 de agosto de 2013 (UTC)Responder

Um outro tipo de modificação que pode ter certo impacto são aquelas em que se amplia o número de situações que serão detectadas por certo filtro (por exemplo, a inclusão do domínio anexo, ou de novos termos em listas de ofensas, ou a redução das exceções de algum filtro). Houve várias tentativas de reduzir o número de condições gastas, mas o efeito prático disso no combate ao vandalismo é pequeno: acho que no máximo o que poderia acontecer é que certo filtro que seria desabilitado porque outros gastaram as condições disponíveis deixarão de ser, pois em geral eles estão consumindo menos condições.
Quanto às etiquetas, OTAVIO1981, continuo com a sensação de que poucos editores fazem uso delas. Já notou como os nomes ("internos") atuais são inconsistentes? Não há um padrão quanto a usar ou não pontuação no fim do nome ("." ou "!"), a usar ou não "de" ou "-" entre as palavras, usar siglas, maiúsculas, quantidade de palavras (frases?) etc... Por isso imagino que seja difícil para quem patrulha as mudanças recentes lembrar o nome das tags para digitar no campo Especial:Mudanças recentes (até que o bugzilla:25909 seja corrigido). Mas seria bom ouvir de quem mais vigia as MR se as tags existentes tem sido úteis...
Conforme o número de filtros que avisam ou impedem aumenta, também poderemos analisar os logs em busca de quantas boas edições foram perdidas devido a falsos positivos. Helder 19h05min de 28 de agosto de 2013 (UTC)Responder
Ah, talvez o Henrique e o Danilo também tenha algo a dizer sobre esse assunto? Helder 19h13min de 28 de agosto de 2013 (UTC)Responder
Com certeza a mudança das regex dos filtros tem impacto na quantidade de vandalismos detectados pelo mesmo. Mas fica o mesmo problema de medir a eficácia da alteração. Por exemplo, supondo que o 56 (branqueamento) era restrito ao domínio principal e agora inclui todos os outros. É de se supor que aumente a quantidade de vandalismos porém isso é impossível de se verificar, mesmo em termos percentuais, se no período avaliado a tendência deste tipo de vandalismos não for constante. E a sazonalidade das edições com picos e vales torna impraticável (até o momento) verificar e eficiência em termos de redução de vandalismo. Minha experiência neste ponto é que seria necessário um período mínimo de 6 meses para ser possível estimar esta eficiência e mesmo assim recorrendo a técnicas estatísticas mandrakes. Também concordo que a diminuição de condições é uma variável interessante para medir o quanto melhoramos os filtros: se gastávamos 500 condições e houve redução significa que podemos ter mais um filtro para outra coisa. Tem como fazer esta contagem? Deve dar um trabalho danado...hehehe
Também concordo que as etiquetas precisam ser reavaliadas pois se a comunidade não está usando não serve de nada. Talvez seja o momento de perguntar ao coletivo se existe alguém usando ou se o recurso pode ser incorporado facilmente as ferramentas de combate ao vandalismo existentes (huggle ?).
Sim, não podemos esquecer os filtros que avisam e desautorizam pois podem haver falsos positivos no meio. O ideal é que seja zero, mas sendo o ideal inatingível acho aceitável até 2% de falsos positivos. Talvez o JXavier (WMF) também tenha algo a dizer.OTAVIO1981 (discussão) 20h29min de 28 de agosto de 2013 (UTC)Responder
O objetivo dos filtros é diminuir o vandalismo = diminuir as reversões realizadas. Se nós temos qntd de avisos / edições desautorizadas, e temos o total de vandalismo no período, não dá para medirmos quantos vandalismos foram impedidos pelo filtro e não precisaram ser revertidos por humanos?
Tá certo que nem toda edição que passaria pelo filtro vai precisar ser revertida, e as vezes é caso de ER, e alguns vandalos vão tentar vandalizar dez vezes e serão impedidos dez vezes pelo filtro, e se não tivesse filtro seria só uma edição e uma reversão.
E me parece que isso 'independe' da sazonalidade, pois vamos medir filtro do período / vandalismo do período, e a sazonalidade do tipo de vandalismo deve ser diluida um pouco pela quantidade / variação de casos.
Não é algo perfeito, mas é algo aproximado, acho válido, se for fácil de ver. temos o "total de reversão" em algum lugar por aí?
Se fosse possível tb separar os vandalismos revertidos por bots, poderemos comparar os dois e ver o quanto de vandalismo óbvio (revertido por bot) que está passando pelo filtro.
Rjclaudio msg 20h45min de 28 de agosto de 2013 (UTC)Responder
Os dados mais recentes estão nesta pesquisa. Sim, concordo que é possível sabermos o percentual de ações impedidas pelos filtros frente ao total de vandalismos no período. Acho até um dado interessante para sabermos a ordem de magnitude da importância dos filtros. O único problema é comparar um período com o outro. Podemos pegar o total revertido em agosto e o total filtrado (desautorizado, desistiu no aviso) em agosto e dizer que o filtro reduziu 20% do que seria vandalizado mas este número é incomparável com qualquer outro, conforme já expliquei. Vendo os números desta pesquisa que apontei, nos últimos 3 meses os bots reverteram 5% das edições de IPs então este é o "potencial" de melhoria do filtro (embora muitas ações dos filtros sejam revertidas por humanos também).OTAVIO1981 (discussão) 21h01min de 28 de agosto de 2013 (UTC)Responder
Demorei? Eis os números que consolidei: foram registrados 27351 disparos em julho, com 12607 "ação usuário" identificadas das quais 7384 foram "não salvas". Na minha sistemática, se o mesmo artigo é disparado no mesmo "momento" (hora, minuto, dia e artigo) conta como uma "ação usuário" podendo ser "salva", isto é, nenhum dos N disparos do filtro foi desautorizar ou avisar ou "salva", isto é as ações foram etiquetar ou nenhuma. Nesta sistemática, se um usuário foi avisado e conseguiu salvar (o filtro permite) no mesmo "momento" a edição dele conta como "não salva". Se foi no "momento" seguinte já vai contar como uma ação diferente podendo ter sido salva ou não. Evidentemente que dá para aprimorar a sistemática tentando verificar se duas "ação usuário" no mesmo minuto foi salva ou não ou se duas "ação usuário" num intervalo próximo tratam da mesma edição (podendo ter sido salva ou não). Aguardo sugestões. A extração dos dados retornou algumas coisas interessantes, também: o artigo Akihito foi atacado no dia 25 às 16h28min com 69 disparos de filtro sendo 20 desautorizações. Bizarro...hehehe OTAVIO1981 (discussão) 13h27min de 29 de agosto de 2013 (UTC)Responder

Script para facilitar a busca de "regressões" antes de atualizar filtros

────────── Uma coisa interessante seria dispor de uma página análoga à Especial:Filtro de abusos/test, cuja finalidade seria testar o código fornecido (que poderia estar sendo proposto para atualizar certo filtro) contra a lista de detecções anteriores do filtro (ou talvez contra os seus falsos positivos), e indicar se cada uma continuaria ou não sendo detectada. Isso ajudaria a prevenir "regressões" indesejadas (por exemplo, tornar um filtro muito menos eficiente ao tentar corrigir/aprimorar uma regex). Talvez seja possível fazer um script para isso com a ação "abusefiltercheckmatch" da API (acho que o Otávio não conseguirá ver, devido às permissões, mas a consulta retorna essencialmente "verdadeiro" ou "falso" para dizer se o filtro detecta ou não tal ação). Helder 21h29min de 28 de agosto de 2013 (UTC)Responder

Isso realmente seria útil, teve o filtro 17 - Espaços excessivos (meu erro com a negação do namespace), e filtro 69 - Texto após cat (que ficamos um tempão com uma versão bugada importada da wiki.en que não disparava nunca). Com esse script esses casos não aconteceriam. Rjclaudio msg 01h30min de 29 de agosto de 2013 (UTC)Responder
Embora não poderei usar, concordo que seria muito útil. Estou pensando em realizar o comparativo sugerido para o mês de julho e agosto. Quando tiver algum resultado, retorno.OTAVIO1981 (discussão) 11h50min de 29 de agosto de 2013 (UTC)Responder

OTAVIO1981 e Rjclaudio (e alguém mais?), se quiserem já dá para testar uma primeira versão do script que mencionei. Usuário(a):Helder.wiki/JS Ele acrescenta um campo extra na Special:AbuseFilter/test, para informar o número de um filtro (em vez dos outros campos). Quando usado, o botão "Testar" consultará os últimos 100 registros do filtro que tem esse número e testará cada um com o código que estiver na caixa de texto. Os itens que forem marcados com um ícone vermelho não são detectados pelo código fornecido. Helder 20h31min de 5 de outubro de 2013 (UTC)Responder

Sensacional, Helder.wiki! Fiz o primeiro uso aqui e funcionou perfeitamente. O uso do rmdoubles no 18 reduz a sua eficiência porque algumas ofensas possuem dígrafos e isto foi verificado com esta sua ferramenta. Penso inclusive em reativar o 60 (Ofensas) só para deixar lá estas ofensas e ampliar nos outros de ofensas com o uso desta função. Aliás, estou tentando aplicar a ccnorm também! ;) OTAVIO1981 (discussão) 17h42min de 6 de outubro de 2013 (UTC)Responder

Reversões do Sale

Não sei bem onde colocar isso, já que temos n filtros sobre ofensas, e alguns casos também incluem outros filtros.

Vendo as últimas 100 reversões do Sale, as que eu acho que daria para entrar no filtro de algum jeito, mas que não foram detectadas (a edição não teve nenhuma etiqueta, logo não ativou nenhum filtro com alguma função). Tem +- 50, ou seja, metade.

Maiuscula
  1. [54]
  2. [55]
  3. [56]
Assinatura
  1. [57]
  2. [58]
Oi fulano
  1. [59]
  2. [60]
  3. [61]
  4. [62]
  5. [63]
  6. [64]
Risos
  1. [65]
  2. [66]
Código de exemplo
  1. [67]
  2. [68]
Remoção
  1. [69]
  2. [70]
Sequencia de caracteres
  1. [71]
  2. [72]

Rjclaudio msg 16h17min de 29 de agosto de 2013 (UTC)Responder

Este tópico é muito oportuno pois já estava para escrever para vocês sobre a "Fase 2" dos filtros. Infelizmente não existe uma prática estabelecida de reportar os casos óbvios que poderiam ser filtrados e isso tende a reduzir a eficiência dos filtros ao longo do tempo. Esta pequena amostragem do Cláudio é uma das provas disso. Olhando rapidamente a parte de ofensas, acho que seria interessante termos um filtro para "Palavras a evitar potencialmente ofensivas" que poderia ser configurado pelo menos para avisar e incluiria todas as palavras que podem ser usadas num contexto correto. Não é muito difícil de implementar, e estando filtro 112 configurado para não fazer nada poderíamos até aproveitá-lo para isto. Acho que seria interessante repensar esta lista do cláudio de modo que pudéssemos comentar e eventualmente até atualizar os filtros. Minha sugestão é mover pelo menos a parte de ofensas para debate em Wikipédia:Filtro de edições/7 que é o filtro de menor número que debate o assunto.OTAVIO1981 (discussão) 16h44min de 29 de agosto de 2013 (UTC)Responder
A Wikipédia:Projetos/AntiVandalismo/Expressões problemáticas também poderá ser usada. Helder 16h50min de 29 de agosto de 2013 (UTC)Responder
Tinha pensado nessa página, mas tinha entendido que era só para casos não revertidos pelos bots, e como eu estava vendo as reversões do Sale, não era ali. Mas concordo em ampliar o uso daquela página para incluir edições não detectadas pelo filtro. Rjclaudio msg 21h08min de 29 de agosto de 2013 (UTC)Responder
Acho melhor usarmos as próprias discussões dos filtros. Quem sabe discutindo em uma seção separada os casos não detectados. São muitos filtros e casos a debater. Se usarmos a página indicada pelo Helder daqui a pouco estaremos replicando uma estrutura semelhante a que implantamos aqui para discutir cada filtro. Podemos até colocar lá na página os links para as discussões de filtros.OTAVIO1981 (discussão) 13h34min de 30 de agosto de 2013 (UTC)Responder
É, pode ser melhor deixar apenas os links lá, pois o filtro age antes que outras ferramentas precisem tomar alguma providência (reversão/aviso). Então é melhor que os filtros estejam mais atualizados do que as demais, e para isso é inevitável que haja discussão nas páginas específicas de cada filtro. Helder 13h57min de 30 de agosto de 2013 (UTC)Responder

Vi todos os 300+ registros do 112, todos estão corretos. Aumentei logo o nível do filtro para aviso (+etiqueta), para já ter efeito enquanto não decidimos onde ficar as coisas, pois já teve novos registros enquanto eu olhava os antigos. Rjclaudio msg 21h08min de 29 de agosto de 2013 (UTC)Responder

Impedimento e aviso

Nunca fiz o teste, mas o que acontece quando uma edição é desautorizada por um filtro? Aparece alguma mensagem pro usuário? Vendo um ip tentando vandalizar um mesmo artigo 15 vezes ([73]) sem sucesso (impedido pelo filtro), com essa insistência imagino que nossos filtros de impedimento precisam de um aviso, pelo menos para falar "sua edição foi identificada automaticamente como tendo conteúdo ofensivo e não poderá ser salva. Desista de vandalizar com palavrões, nunca vai conseguir. Ao menos mude a ofensa, seja criativo." (tá, tira esse final). Rjclaudio msg 21h22min de 29 de agosto de 2013 (UTC)Responder

Aparece esta mensagem.OTAVIO1981 (discussão) 12h38min de 30 de agosto de 2013 (UTC)Responder

Inserção de fontes inocentes são consideradas ofensivas

Estou querendo inserir texto seguido de fontes nesta página/artigo, mas por incrível que pareça, algum mecanismo desse site, achou ofensivo esse texto (tentei fazer "nowiki" aqui, mas não aceitou):
O fato gerou una forte condenação por parte da maioria dos países sul-americanos, incluindo a Argentina, Belize, Brasil, Nicarágua, Uruguai e Venezuela.(5 fontes censuradas)
Diz seguinte frase:
Esta ação foi identificada automaticamente como prejudicial, e foi consequentemente bloqueada.
Se você crê que a sua edição foi construtiva, por favor informe-nos o que você estava a tentar fazer. Nós vamos analisar o problema e informar a causa, ou vamos corrigir o sistema para que tal mensagem não apareça novamente, se for necessário.
Uma breve descrição da regra com a qual a sua ação coincidiu é: Conteúdo ofensivo.
.

Como resolver isso, se nem é ofensivo? É estranho acontecer isso. 179.234.144.186 (discussão) 20h00min de 31 de agosto de 2013 (UTC)Responder

Realmente, alguns filtros registraram suas tentativas de edição. O problema do filtro de conteúdo ofensivo é que ele "não gostou" do link para http://www.prensa-latina.cu/.... Helder 21h10min de 31 de agosto de 2013 (UTC)Responder

Páginas revertidas com frequência

Analisar o histórico dessas páginas provavelmente ajudará em algo:

TheVulcan (discussão) 21h11min de 4 de setembro de 2013 (UTC)Responder

E pelo que vi costuma despoletar vários filtros nessas páginas. TheVulcan (discussão) 21h14min de 4 de setembro de 2013 (UTC)Responder

Métodos de monitorar o aumento das edições disparadas

Prezados Rjclaudio e Helder.wiki, conforme sabem é importante não perdemos de vista as informações de tempos de execução dos filtros e a quantidade de edições que atingiram o limite de 1000 condições. O ideal é que existisse um bot para fazer esta tarefa numa frequência razoável porém, enquanto o recurso não chega, comecei a fazer o registro manual e a rodar a tabela de estatísticas uma vez ao dia. Se tiverem proposta de um formato melhor para as informações, vamos mudar!OTAVIO1981 (discussão) 21h38min de 4 de setembro de 2013 (UTC)Responder

Uma sugestão: quando for realizar uma atualização, se notar que a amostra ainda está pequeno (digamos, com menos de 5000 ações) e for ficar online por mais um tempo, pode ser interessante esperar para pegar a informação com a maior amostra possível (seriam 10000?). Helder 12h39min de 6 de setembro de 2013 (UTC)Responder
Uma informação interessante. Ontem estava fazendo exatamente isto pelo celular e lá pelas 20h50min estava por volta de 8000 ações. Infelizmente não anotei o resultado pois imaginava que ia chegar até 10000 e não ia dormir tão cedo. Quando fui olhar novamente lá pelas 21h30min havia somente 500 ações! Suspeito que o contador zere todo dia às 00h00min UTC. E fazendo uma estimativa de que temos uma 240 mil ações por mês, dá uma média 8000 por dia e dificilmente vamos zerar o contador durante o dia pois assumindo generosamente que a média diária é próxima, implicaria em quase 300 mil edições de editores. Dito tudo isso, se pegarmos o resultado por volta das 20h50min vai ser o maior resultado possível no dia. Se tiver zerado, significa que batemos os 10 mil no dia.OTAVIO1981 (discussão) 12h47min de 6 de setembro de 2013 (UTC)Responder

Mais falsos negativos

Rjclaudio e Helder.wiki,

coloquei lá no projeto antivandalismo mais uma lista de falsos-positivos e como to sem tempo de separar por filtros, peço que deem uma olhada e movam na medida do possível. To vendo uma incidencia de vandalismo do tipo "TEEEESSSSSSTTTTEEEEE" e descobri que tem a função "rmdoubles" (removes repeated characters in the argument, and returns the result) que de repente pode ser usada para fazer a detecção. Deixo para analisarem. Novamente, nem todos são para incluir mas vale a pena ir pensando e montando a base. Abs, OTAVIO1981 (discussão) 23h55min de 6 de setembro de 2013 (UTC)Responder

Ver ideia

de filtro em Wikipédia:Esplanada/geral/WP:EAD (16set2013), está em negrito, dá um Ctrl+F Filtro de edição .TheVulcan (discussão) 23h34min de 17 de setembro de 2013 (UTC)Responder

Demonstrando o pedido de desbloqueio de usuário manifestante preso e deletado desde 2005.

A Wikipédia me pediu para eu demonstrar o pedido de bloqueio de um usuário bloqueado desde o início de Setembro de 2005. Esse usuário usou um nome de usuário feio e ofensivo em protesto contra o Rei da Astúrias e ministro da defesa do mesmo país Nuno Tavares e contra os escândalos reais de homossexualidade ocorridos em meados dos dias 12 de Agosto de 2005 até 28 de Novembro de 2005 e foi bloqueado com o motivo de difamação á membros da Wikipédia. Na verdade ele não estava difamando ninguém e sim protestando contra esse rei e contra os escândalos reais da família real asturiana de finais de Agosto e início de Setembro de 2005. Os administradores HVL e Belanidia são responsáveis pelo desbloqueio e mudança do nome do usuário para António Martín de los Santos. O usuário com nome terível e ofensivo está bloqueado há 18 anos e 242 dias. Eu demonstrei claro o pedido de desbloqueio que estou tentando fazer referente a página [74]

186.220.142.129 (discussão) 02h48min de 21 de setembro de 2013 (UTC)Responder

O nome de usuário em questão é uma ofensa grave a um usuário e atesta contra sua boa fé. Não crie o pedido de desbloqueio, pois terá que usar o nome novamente. Se criar o pedido ou repetir o nome em qualquer lugar da Wikipédia, será bloqueado sem aviso e o pedido será apagado.—Teles«fale comigo» 03h08min de 21 de setembro de 2013 (UTC)Responder

Tá bom Teles, eu concordo que ele tem que ficar bloqueado para sempre porque o nome do usuário é monstruoso e ofensivo e criado em protesto contra os escândalos da família real de 2005 nas Astúrias. Então ele tem que ficar bloqueado para sempre para que eu não seja bloqueado e o meu computador não seja bloqueado da Wikipédia. Então, se não pode desbloqueá-lo então vocês tem que eliminá-lo da Wikipédia, pois se não a cadeia de usuários da Wikipédia ficará superlotada de contas antigas e transformando os depósitos de usuários bloqueados da Wikipédia em um verdadeiro lixão. Tentem eliminá-o da Wikipédia. - 186.220.142.129 (discussão) 03h42min de 21 de setembro de 2013 (UTC)Responder

Histórico dos filtros que quebraram

Vou começar a montar aqui uma lista dos filtros que quebraram recentemente.

  • 112: deixou de funcionar entre 10h37min de 5 de setembro e 10h08min de 7 de setembro
  • 56: deixou de funcionar entre 22h50min de 4 de setembro e 10h17min de 6 de setembro
  • 81: deixou de funcionar entre 12h13min de 15 de agosto e 00h30min de 16 de agosto
  • 83: disparou ação accountcreate entre 17h56min de 15 de julho e 08h51min de 16 de julho (214 registros)

Se lembrarem de outros, avisem que eu pesquiso os períodos e o que ocorreu. comentário não assinado de OTAVIO1981 (discussão • contrib) 23h56min de 27 de setembro de 2013 (UTC)Responder

+1: Wikipédia:Filtro de edições/113#Regressão. Helder 17h06min de 16 de outubro de 2013 (UTC)Responder

Novo filtro para "internetês" ou "miguxês"

Acho que existe um bom potencial para detectar e etiquetar edições de baixa qualidade com escrita abreviada ou de testes. Palavras como "pq, vc[s], nao, naum, n ou ñ (no lugar de não), oi[e], aki, palavras terminadas com cao (e deveria ser ção ou cão), etc, bom dia, noiz, xD, *-*, . Pretendo desenvolver uma regex mais variada e iniciar os testes em breve. O que acham? OTAVIO1981 (discussão) 16h59min de 16 de outubro de 2013 (UTC)Responder

A primeira vista, parece boa ideia... Helder 17h07min de 16 de outubro de 2013 (UTC)Responder
Também me parece bom, e acho que tem alguma demanda para isso, apesar da maioria se enquadrar em PN mínima / ofensa / remoção. Rjclaudio msg 17h32min de 16 de outubro de 2013 (UTC)Responder
A idéia me ocorreu ao monitorar as edições revertidas dos mais ativos. Os principais casos para este filtro que foram salvos e revertidos estão em Wikipédia:Projetos/AntiVandalismo/Expressões problemáticas e estou tentando atualizar os filtros com este subsídio.OTAVIO1981 (discussão) 17h53min de 16 de outubro de 2013 (UTC)Responder
Feito Filtro 120 criado. Sugestões de melhoria da regex são muito bem vindas! Vou tentar atualizar com mais palavras a medida que pesquisar reversões.OTAVIO1981 (discussão) 01h50min de 17 de outubro de 2013 (UTC)Responder