Wikipédia:Filtro de edições/98

Origem: Wikipédia, a enciclopédia livre.

Palavras a evitar
Status
Etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 2
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas

Novo código[editar código-fonte]

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo código para o 98 (palavras a evitar)

Estou trabalhando no código tentando flexibilizar as palavras e melhorando a regex. Testei aqui e está pegando 96% do que o filtro atual consegue. Como não consegui achar os 4%, deixo o código para alguém dê uma força:

evitar := '(?:[^a-záâãéêíóôõúç]|^)((?:lendári|visionári|extraordinári|prestigios|respeitad|virtuos|maravilhos|famos)(?:[ao])s?|(?:pro)(eminente)s?|(?:célebre|fascinante)s?|última linha|líder|nível mundial|(?:incríve|notáve)(?:l|eis))(?:[^a-záâãéêíóôõúç]|$)';

(article_namespace == 0 | article_namespace == 102) &

! 'confirmed' in user_groups

& added_lines irlike evitar

& ! removed_lines irlike evitar

Sds, OTAVIO1981 (discussão) 18h38min de 8 de outubro de 2013 (UTC)[responder]

O texto acima foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo código para o 98 (palavras a evitar)

Das últimas 200 ocorrências, só faltava detectar os seguintes casos: virtuosidade, virtuose, respeitado e desrrespeitados, eminente.
Uma versão aprimorada da regex acima seria a seguinte:
(?:[^a-záâãéêíóôõúç]|^)((?:lendári|visionári|extraordinári|prestigios|(?:desr)?respeitad|maravilhos|famos)(?:[ao])s?|virtuos(?:idade|(?:[aeo])s?)|(?:pro)?(?:eminente)s?|(?:célebr|fascinant)es?|última linha|líder|nível mundial|(?:incrí|notá)ve(?:l|eis))(?:[^a-záâãéêíóôõúç]|$)
Já as edições que inseriam "visionário", "Notável" e lendários deixaram de ser detectadas porque no texto removido aparece "famoso" (que não consta no código atual do filtro). Em termos da estratégia para fazer a atualização, teria sido mais fácil identificar a causa exata destas 3 regressões se primeiro fosse apenas realizada a conversão para regex, e só em uma mudança posterior incluísse um novo termo. Helder 15h44min de 9 de outubro de 2013 (UTC)[responder]
Valeu, Helder.wiki! Obrigado por aprimorar a regex. Aos poucos eu chego lá! ;) Entendi a questão de incluir novas palavras e aprimorar ao mesmo tempo.OTAVIO1981 (discussão) 16h23min de 9 de outubro de 2013 (UTC) P.S.:Atualizei o filtro. OTAVIO1981 (discussão) 16h23min de 9 de outubro de 2013 (UTC)[responder]

Falsos negativos do tipo "inserção de X quando já tem Y"[editar código-fonte]

A propósito, os falsos negativos do tipo "inserção de X em uma página que já tem Y, se X e Y são palavras a evitar" tendem a ficar mais frequentes conforme a lista for aumentando. Se houver intenção de garantir que a detecção também ocorra nestes casos, um caminho é usar algo deste tipo:

evitar := [
'(?:[^a-záâãéêíóôõúç]|^)lendári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)',
'(?:[^a-záâãéêíóôõúç]|^)visionári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)',
'(?:[^a-záâãéêíóôõúç]|^)extraordinári(?:[ao])s?(?:[^a-záâãéêíóôõúç]|$)'
/* , E assim por diante... */
];

( article_namespace == 0 | article_namespace == 102 )
& ! 'confirmed' in user_groups
& (
  ( added_lines irlike evitar[0] & ! removed_lines irlike evitar[0] )
| ( added_lines irlike evitar[1] & ! removed_lines irlike evitar[1] )
| ( added_lines irlike evitar[2] & ! removed_lines irlike evitar[2] )
/* ... */
)

A desvantagem é que isso aumentaria o número de condições consumidas pelo filtro. Helder 16h52min de 9 de outubro de 2013 (UTC)[responder]

Me ocorreu uma outra solução: utilizar um lookahead positivo de um jeito bem específico. Atualizei o filtro depois de ter testado o novo código com as últimas 600 detecções do filtro 98 (isso inclui todas de outubro e quase 100 de setembro) e todas continuarão sendo detectadas pela nova versão acima. Espero que não seja (muito) ineficiente, pois talvez essa estratégia também seja útil em outros filtros. Helder 22h22min de 20 de outubro de 2013 (UTC)[responder]
Fiz um pequeno ajuste na regex, para não tratar as linhas removidas como se fossem as adicionadas (10 (possíveis) falsos positivos recentes não teriam acontecido na nova versão). Helder 12h34min de 21 de outubro de 2013 (UTC)[responder]

O texto seguinte foi movido de: Wikipédia Discussão:Filtro de edições/98

@He7d3r:@OTAVIO1981:É possível incluir advérbios de modo nas condições do filtro? A exemplo de felizmente, infelizmente(posso buscar outros e listá-los, se sim). Obs! Marquei vocês dois pois deduzi que são conhecedores do assunto. Caçador de Palavras (discussão) 22h46min de 9 de fevereiro de 2016 (UTC)[responder]

O texto acima foi movido de: Wikipédia Discussão:Filtro de edições/98

Poderíamos fazer uma troca como esta:
  • Remover: (?:pro)?(?:eminente)s?
  • Inserir: (?:pro)?eminentes?|(?:extrema|(?:in)?feliz|terrivel)mente
Helder 22h54min de 9 de fevereiro de 2016 (UTC)[responder]
Pode-se adicionar terrivelmente e extremamente? Caçador de Palavras (discussão) 05h40min de 10 de fevereiro de 2016 (UTC)[responder]
Atualizei o exemplo acima. O que acham? Helder 16h40min de 10 de fevereiro de 2016 (UTC)[responder]
Não sei de script mas li as palavras... Se eu assimilar que mais alguma esteja de acordo com este filtro, venho aqui lhe perturbar, ok Helder? Um abraço, Caçador de Palavras (discussão) 04h36min de 11 de fevereiro de 2016 (UTC)[responder]
Alterei o filtro conforme indicado acima. Helder 12h48min de 11 de fevereiro de 2016 (UTC)[responder]