Wikipédia:Filtro de edições/120

Origem: Wikipédia, a enciclopédia livre.

Internetês ou miguxês
Status
Etiquetando
Manutenção
Resumo
Ferramentas
Falsos positivos
Total 76
Lista Lista filtrada (com gadget)
(PS: futuramente, poderíamos ver os 5 mais recentes aqui mesmo)
Tarefas


Proposta[editar código-fonte]

O texto seguinte foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo filtro para "internetês" ou "miguxês"

Acho que existe um bom potencial para detectar e etiquetar edições de baixa qualidade com escrita abreviada ou de testes. Palavras como "pq, vc[s], nao, naum, n ou ñ (no lugar de não), oi[e], aki, palavras terminadas com cao (e deveria ser ção ou cão), etc, bom dia, noiz, xD, *-*, . Pretendo desenvolver uma regex mais variada e iniciar os testes em breve. O que acham? OTAVIO1981 (discussão) 16h59min de 16 de outubro de 2013 (UTC)[responder]

A primeira vista, parece boa ideia... Helder 17h07min de 16 de outubro de 2013 (UTC)[responder]
Também me parece bom, e acho que tem alguma demanda para isso, apesar da maioria se enquadrar em PN mínima / ofensa / remoção. Rjclaudio msg 17h32min de 16 de outubro de 2013 (UTC)[responder]
A idéia me ocorreu ao monitorar as edições revertidas dos mais ativos. Os principais casos para este filtro que foram salvos e revertidos estão em Wikipédia:Projetos/AntiVandalismo/Expressões problemáticas e estou tentando atualizar os filtros com este subsídio.OTAVIO1981 (discussão) 17h53min de 16 de outubro de 2013 (UTC)[responder]
Feito Filtro 120 criado. Sugestões de melhoria da regex são muito bem vindas! Vou tentar atualizar com mais palavras a medida que pesquisar reversões.OTAVIO1981 (discussão) 01h50min de 17 de outubro de 2013 (UTC)[responder]

O texto acima foi movido de: Wikipédia:Filtro de edições/Solicitações#Novo filtro para "internetês" ou "miguxês"

aproveitando, vi a alteração na regex e fique na dúvida: vai continuar detectando, oi e oie e vc e vcs? OTAVIO1981 (discussão) 20h31min de 17 de outubro de 2013 (UTC)[responder]
Não vai detectar, mas antes também não detectava. Os colchetes não significam que o que está dentro é "opcional". Eles servem para definir uma lista de caracteres que podem aparecer naquela posição (como em "bonit[ao]"). Para definir que algo é opcional, utiliza-se o ponto de interrogação (como em "exemplos?" ou "faz(?:em)?"). Helder 22h44min de 17 de outubro de 2013 (UTC)[responder]
E um dos falsos positivos era por causa do {{N/A}} (bastou ativar a opção "case insensitive" colocando um "i" no segundo campo do rubular). Helder 22h50min de 17 de outubro de 2013 (UTC)[responder]

Título de obra[editar código-fonte]

Vendo Especial:Registro_de_abusos/1425680 que detrectou Bom Dia São Paulo ('Bom Dia' como parte do título de obra) vale colocar exceção para [[ antes da expressão suspeita? Isso mostraria que é um artigo (provavelmente válido), e se for de má fé (em outro contexto) poucas vezes vão colocar o colchetes. Rjclaudio msg 21h44min de 18 de outubro de 2013 (UTC)[responder]

Se for possível, acho interessante. Embora estas palavra incluí de memória pois lembro de já ter visto mas não sei dizer se são frequentes. Tem um engraçadinho colocando receita de miojo que vi mais de uma vez...:S OTAVIO1981 (discussão) 21h55min de 18 de outubro de 2013 (UTC)[responder]
Testando nos últimos 500 registros, só um caso de falso-positivo não seria detectado (ou seja, bom), e não gerou nenhum falso-negativo (bom também). Mas 1 em 500 ... vale a pena? Rjclaudio msg 14h02min de 5 de novembro de 2013 (UTC)[responder]

Pelo o que vi, vai ter vários falso-positivos com título que não dá para evitar então o filtro nunca vai poder passar pra impedimento. Rjclaudio msg 14h02min de 5 de novembro de 2013 (UTC)[responder]

Sim, o filtro só vai poder ficar no modo aviso explicando os erros cometidos.OTAVIO1981 (discussão) 15h35min de 5 de novembro de 2013 (UTC)[responder]

Domínios[editar código-fonte]

Válido só para artigo e anexo? E categoria (exemplo)? Rjclaudio msg 13h02min de 5 de novembro de 2013 (UTC)[responder]

Idealmente, seria para todos os domínios não-discussão exceto o wikipédia por causa da esplanada.~~

Dentro de string[editar código-fonte]

Pelo rubular, está detectando s2 dentro de ref name="US200" e ref name="AUS-C-S2" (registro e rubular). Erro do nosso filtro, é característica das regex, ou o rubular trabalha diferente do nosso filtro de edições? Rjclaudio msg 14h02min de 5 de novembro de 2013 (UTC)[responder]

O ref name="US200" só é detectado no rubular se não ativar a opção "i" (análoga ao nosso "irlike"). Helder 19h05min de 5 de novembro de 2013 (UTC)[responder]
Então o que ativou o filtro foi o -S2" em ref name="AUS-C-S2" ? Pq só tem essas duas ocorrências no robular. Nesse caso o S2 também não estaria dentro de uma string? Ou só conta como parte de palavra se tiver letra/número antes/depois? Rjclaudio msg 16h02min de 8 de novembro de 2013 (UTC)[responder]
Sim, Rjclaudio, foi o -S2", porque os caracteres que estão antes e depois de "S2" não pertencem à lista [a-záâãéêíóôõúç] (que são os que poderiam vir a formar uma palavra). Helder 16h45min de 8 de novembro de 2013 (UTC)[responder]

Url[editar código-fonte]

Vi alguns casos detectando em url, especialmente o nao por não ter o til e muitas urls usarem o título da página sem acentos e til e trocando espaço por - . Exemplo Especial:Registro_de_abusos/1438691 em [http://www.bahianoticias.com.br/principal/noticia/132550-para-mpf-039-nao-resta-duvida-039-de-participacao-de-mauro-ricardo-em-suposto-desvio-na-funasa.html Link da noticia] . Podiamos mudar para não detectar se tiver um - antes ou depois do termo.

Vai evitar os falso-positivos em: url; em alguns erros de formatação ao usar - para separar título de obra de algum dado em tabela (vi um ou dois casos desses, do tipo s2-42min no formato obra-duração); e em algumas siglas (DVB-S2).

Dos últimos 500 registros não vi nenhum falso-negativo com essa exceção do - antes e depois. Podemos mudar? Rjclaudio msg 14h02min de 5 de novembro de 2013 (UTC)[responder]

Quando perguntou se podemos mudar, se refere somente a implementação do hífen ou também ao nível do filtro? De qualquer modo fiz o balão de ensaio para o futuro aviso.OTAVIO1981 (discussão) 17h25min de 8 de novembro de 2013 (UTC)[responder]
Eu tava falando de aplicar a exceção do hifen. Mas pode ser também pro nível do filtro. Não vi mais nada na estrutura do filtro que possamos mudar, e não podemos fazer nada com o problema dos títulos. Acho que não precisa de mais tempo de teste, o resto só na prática (vendo as edições salvas, já que analisar tudo dá trabalho, é muita ocorrência). Rjclaudio msg 17h50min de 8 de novembro de 2013 (UTC)[responder]
Você ou o Helder.wiki conseguem implementar esta exceção até segunda? se sim, posso mudar o filtro na segunda e acompanhar de perto durante a semana para em caso de emergência fazer alguma alteração. Acho que consigo implementar a exceção. Só não sei se vai ser a solução mais eficiente.OTAVIO1981 (discussão) 20h44min de 8 de novembro de 2013 (UTC)[responder]
Já coloquei. Exceção para - ou + , antes ou depois. Rjclaudio msg 21h18min de 8 de novembro de 2013 (UTC)[responder]

Teste com etiqueta[editar código-fonte]

@!Silent: só para constar: eu fui fazer um teste com o filtro, para tentar descobrir se teria como atualizar as ocorrências da nova etiqueta que criou (com letra minúscula onde antes havia uma maiúscula), mas aparentemente não tenho como desfazer meu teste para retornar à sua nova etiqueta (reportei isso no phab:T183784). Não sei se isso trará alguma inconveniência adicional... Helder 16h16min de 29 de dezembro de 2017 (UTC)[responder]

@He7d3r Acho que não gera problema não. O importante é etiquetar normalmente as edições. !Silent (discussão) 23h07min de 29 de dezembro de 2017 (UTC)[responder]