Administração do filtro de abusos

Diferenças entre versões

EntradaVersão de 11h41min de 19 de janeiro de 2017 por !SilentVersão de 16h03min de 23 de janeiro de 2017 por !Silent
Informações básicas
Notas:
Descrição: filtro referente ao bloqueio de termos de cunho ofensivo. Apenas termos ofensivos soltos e que não tenham a ver com partes do corpo humano (estes devem ser inseridos no filtro 70). Expressões devem ser colocadas no filtro 7. Termos e expressões relativos a times de futebol devem ser colocados no filtro 143 e relacionados ao projeto no filtro 144.
Descrição: filtro referente ao bloqueio de termos de cunho ofensivo. Apenas termos ofensivos soltos e que não tenham a ver com partes do corpo humano (estes devem ser inseridos no filtro 70). Expressões devem ser colocadas no filtro 7. Termos e expressões relativos a times de futebol devem ser colocados no filtro 143 e relacionados ao projeto no filtro 144.
Análogo ao filtro 141.
Análogo ao filtro 141.


* Possui o mesmo objetivo do filtro 7, que possui código ligeiramente diverso, para evitar problemas de desativação automática. Explicação detalhada em "Wikipedia Discussão:Filtro de edições". --Kleiner
* Possui o mesmo objetivo do filtro 7, que possui código ligeiramente diverso, para evitar problemas de desativação automática. Explicação detalhada em "Wikipedia Discussão:Filtro de edições". --Kleiner
* Realizando primeiros testes para possível divisão do filtro 7, pelos motivos explicados em "Wikipedia Discussão:Filtro de edições". Modo de registro apenas. --Kleiner
* Realizando primeiros testes para possível divisão do filtro 7, pelos motivos explicados em "Wikipedia Discussão:Filtro de edições". Modo de registro apenas. --Kleiner
* Teste realizado com sucesso! Ativando modo de impedimento. --Kleiner
* Teste realizado com sucesso! Ativando modo de impedimento. --Kleiner
* Evitar falso positivo com "cuíca", e termos semelhantes. --Kleiner
* Evitar falso positivo com "cuíca", e termos semelhantes. --Kleiner
* Tirando pipe que causava falsos positivos. --Kleiner
* Tirando pipe que causava falsos positivos. --Kleiner
* Utilizando variável específica para reunir o código de detecção de palavras ofensivas sob o identificador "palavrao". --Kleiner
* Utilizando variável específica para reunir o código de detecção de palavras ofensivas sob o identificador "palavrao". --Kleiner
* "Bambi" já teve mais de um falso positivo identificado. Precisa entrar em algum outro tipo de filtro, talvez um específico para futebol. --Kleiner
* "Bambi" já teve mais de um falso positivo identificado. Precisa entrar em algum outro tipo de filtro, talvez um específico para futebol. --Kleiner
* Retirando termo "cu" da detecção para fazê-la em filtro específico, dado os diversos falsos positivos registrados. --Kleiner
* Retirando termo "cu" da detecção para fazê-la em filtro específico, dado os diversos falsos positivos registrados. --Kleiner
* Mais palavrões coletados nos registros de Wikipédia:Pedidos/Supressão --viniciusmc
* Mais palavrões coletados nos registros de Wikipédia:Pedidos/Supressão --viniciusmc
* Remoção de parêntesis supérfluos, para consumir menos condições. -- Helder
* Remoção de parêntesis supérfluos, para consumir menos condições. -- Helder
* Otimização da expressão regular. -- Helder
* Otimização da expressão regular. -- Helder
* Remoção de "action='edit'", pois "added_lines" nem está definido nas outras ações. --Helder
* Remoção de "action='edit'", pois "added_lines" nem está definido nas outras ações. --Helder
* Remoção de 'auto' para ignorar também as contas confirmadas manualmente. --Helder
* Remoção de 'auto' para ignorar também as contas confirmadas manualmente. --Helder
* Aprimoramento da expressão regular, para detectar também o início e o fim do artigo. --Helder
* Aprimoramento da expressão regular, para detectar também o início e o fim do artigo. --Helder
* Otimizando regex (irlike) --rjclaudio
* Otimizando regex (irlike) --rjclaudio
* Reorganizando filtros 7/18/68/70/112/115 (ver discussão do filtro 18) --rjclaudio
* Reorganizando filtros 7/18/68/70/112/115 (ver discussão do filtro 18) --rjclaudio
* Novas palavras, testadas no 112 e variantes.--Otavio
* Novas palavras, testadas no 112 e variantes.--Otavio
* Mais palavras, testadas no 112 e variantes.--Otavio
* Mais palavras, testadas no 112 e variantes.--Otavio
* Mais palavras reportadas em expressões problemáticas.--Otavio
* Mais palavras reportadas em expressões problemáticas.--Otavio
* Implementando ccnorm e rmdoubles. Teste com regressão OK.--Otavio
* Implementando ccnorm e rmdoubles. Teste com regressão OK.--Otavio
* Movendo verbos para específico, incluindo novas palavras.--Otavio
* Movendo verbos para específico, incluindo novas palavras.--Otavio
* Mais palavras, testadas no 112.--Otavio
* Mais palavras, testadas no 112.--Otavio
* Ajuste na regex.--Otavio
* Ajuste na regex.--Otavio
* Porã tem causado FP.--Otavio
* Porã tem causado FP.--Otavio
* A palavra fodder existe em inglês. --Lechat
* A palavra fodder existe em inglês. --Lechat
* Reduce condition count, usage of ccnorm still needs updating per https://phabricator.wikimedia.org/T29987 ~MusikAnimal 2016.08.18
* Reduce condition count, usage of ccnorm still needs updating per https://phabricator.wikimedia.org/T29987 ~MusikAnimal 2016.08.18
* Atualização (ver T29987). --Helder
* Atualização (ver T29987). --Helder
* Inclusão de frase. --!Silent (28/oct/2016)
* Inclusão de frase. --!Silent (28/oct/2016)
* Inclusão de frase e ajuste na indentação. --!Silent (01/nov/2016)
* Inclusão de frase e ajuste na indentação. --!Silent (01/nov/2016)
* Inclusão de novos termos. --!Silent (02/nov/2016)
* Inclusão de novos termos. --!Silent (02/nov/2016)
* Correção da regex. --Helder
* Correção da regex. --Helder
* Inclusão de novo termo. --!Silent (03/nov/2016)
* Inclusão de novo termo. --!Silent (03/nov/2016)
* Adicionando duas novas frases e ajuste na regex. --!Silent (07/nov/2016)
* Adicionando duas novas frases e ajuste na regex. --!Silent (07/nov/2016)
* Ajuste na regex e adição de novo termo. --!Silent (08/nov/2016)
* Ajuste na regex e adição de novo termo. --!Silent (08/nov/2016)
* Adicionando novos termos. --!Silent (09/nov/2016)
* Adicionando novos termos. --!Silent (09/nov/2016)
* Ajuste na regex e mais um termo novo. --!Silent (10/nov/2016)
* Ajuste na regex e mais um termo novo. --!Silent (10/nov/2016)
* Movendo expressões do filtro 139. --!Silent (12/nov/2016)
* Movendo expressões do filtro 139. --!Silent (12/nov/2016)
* Ajustes na regex e movendo termo pro filtro 112. --!Silent (13/nov/2016)
* Ajustes na regex e movendo termo pro filtro 112. --!Silent (13/nov/2016)
* Ajustes na regex. (14/nov/2016)
* Ajustes na regex. (14/nov/2016)
* Ajustes na regex e inclusão de novos termos. --!Silent (15/nov/2016)
* Ajustes na regex e inclusão de novos termos. --!Silent (15/nov/2016)
* Ajuste na regex e adicionando termo. --!Silent (16/nov/2016)
* Ajuste na regex e adicionando termo. --!Silent (16/nov/2016)
* Movendo termo pro filtro 112, devido ao fato de causar muitos falsos positivos e ajustes na regex. --!Silent (17/nov/2016)
* Movendo termo pro filtro 112, devido ao fato de causar muitos falsos positivos e ajustes na regex. --!Silent (17/nov/2016)
* Ajustes na regex para barrar mais casos. --!Silent (18/nov/2016)
* Ajustes na regex para barrar mais casos. --!Silent (18/nov/2016)
* Revisão geral. --Helder
* Revisão geral. --Helder
* Removendo termo já tratado no 7 (verbos ofensivos). --Otavio
* Removendo termo já tratado no 7 (verbos ofensivos). --Otavio
* Simplificando a regex, adicionando mais possibilidades de ocorrências, movendo expressão do e pro filtro 70 e movendo termo em inglês pro filtro 112 devido ao excesso de falsos positivos. --!Silent (26/nov/2016)
* Simplificando a regex, adicionando mais possibilidades de ocorrências, movendo expressão do e pro filtro 70 e movendo termo em inglês pro filtro 112 devido ao excesso de falsos positivos. --!Silent (26/nov/2016)
* Reestruturando o filtro. --!Silent (28/nov/2016)
* Reestruturando o filtro. --!Silent (28/nov/2016)
* Movendo termo do filtro 70 e ajuste na regex. --!Silent (30/nov/2016)
* Movendo termo do filtro 70 e ajuste na regex. --!Silent (30/nov/2016)
* Movendo expressão pro filtro 143 e ajuste na regex. --!Silent (01/dez/2016)
* Movendo expressão pro filtro 143 e ajuste na regex. --!Silent (01/dez/2016)
* Ocultando o filtro do visionamento público, trazendo expressões de outros filtros e exportando expressões deste para outros, afim de condizer com o seu propósito (bloqueio de termos genéricos apenas). --!Silent (04/dez/2016)
* Ocultando o filtro do visionamento público, trazendo expressões de outros filtros e exportando expressões deste para outros, afim de condizer com o seu propósito (bloqueio de termos genéricos apenas). --!Silent (04/dez/2016)
* Adicionando variação de um termo. --!Silent (05/dez/2016)
* Adicionando variação de um termo. --!Silent (05/dez/2016)
* Adicionando mais variações de um termo. --!Silent (06/dez/2016)
* Adicionando mais variações de um termo. --!Silent (06/dez/2016)
* Ajustes no código da regex. --!Silent (11/dez/2016)
* Ajustes no código da regex. --!Silent (11/dez/2016)
* Adicionando termo e corrigindo erro na regex. --!Silent (13/dez/2016)
* Adicionando termo e corrigindo erro na regex. --!Silent (13/dez/2016)
* Ajuste na regex e adicionando mais uma variação. --!Silent (16/dez/2016)
* Ajuste na regex e adicionando mais uma variação. --!Silent (16/dez/2016)
* Mais uma variação. --!Silent (21/dez/2016)
* Mais uma variação. --!Silent (21/dez/2016)
* Ajuste na regex para evitar falsos positivos com "Canal do Otário". --!Silent (24/dez/2016)
* Ajuste na regex para evitar falsos positivos com "Canal do Otário". --!Silent (24/dez/2016)
* Mais um termo. --!Silent (26/dez/2016)
* Mais um termo. --!Silent (26/dez/2016)
* Mais variações e migrando um termo do filtro 7. --!Silent (28/dez/2016)
* Mais variações e migrando um termo do filtro 7. --!Silent (28/dez/2016)
* Mais termos. --!Silent (01/jan/2017)
* Mais termos. --!Silent (01/jan/2017)
* Mais um termo. --!Silent (10/jan/2017)
* Mais um termo. --!Silent (10/jan/2017)
* Mais termos. --!Silent (11/jan/2017)
* Mais termos. --!Silent (11/jan/2017)
* Mais variação. --!Silent (12/jan/2017)
* Mais variação. --!Silent (12/jan/2017)
* Mais um termo. --!Silent (12/jan/2017)
* Mais um termo. --!Silent (12/jan/2017)
* Mais um termo. --!Silent (19/jan/2017)
* Mais um termo. --!Silent (19/jan/2017)
* Criando uma nova condição, afim de evitar falsos positivos. --!Silent (23/jan/2017)
Condições do filtro
Condições:
(ajuda | discussão)
!'confirmed' in user_groups & ( (
!'confirmed' in user_groups & ( (
ofensas := '(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|^)(?:(?:[A@]ROMB[A@]D[A@O]O?|A?(?:BOIOL(?:[A@](?:D[A@O]|O)?|INH[A@])|VI[A@]D(?:O|[A@](?:D[A@O]|O)?|INHO))|B(?:[A@]?ITOL(?:[A@](?:D[A@O])?|[A@]O|INH[A@])|R[A@]N(?:K|QU)EL[A@O]|RONH(?:[A@]|EIRO|UD[A@O])|I(?:CH|[BX])(?:[A@]|INH[A@]|ON[A@])|OST(?:INH)?[A@]O?|O(?:K|QU)ETE(?:IR[A@O])?)|CHUPINGOLE|DEFE(?:K|QU)EI|DEFE[CK]ADO(?:R|R[A@E]S?)?|F[OU]D(?:ID(?:[A@O](?:CO|O)?|OES|ON[A@])|E(?:R|U|NDO|DORES)?|[A@O](?:O|U[MN])?|OES|I[A@]O)|FDP|G[A@]YUCHO|KENG[A@]|L[A@][SZ][A@]RENT[A@O]|L[A@]S[CK][A@]DO(?:R|R[A@E]S?)?|LIX(?:[A@]O|OS[A@O])|(?:MI){3,}|MI?ERD(?:[A@]O?|INH[A@])|MIJ[A@]R|NEG[A@]O|(?<!CANAL[ _]DO[ _])OT[A@]RI[A@O]|P[A@]NELEI?R[A@O]|PI[MN](?:B[A@]D[A@]|GUC[A@O])|PUT(?:[A@O]O?|INH[A@O]|[A@]RI[A@]|ON[A@]|I[A@]NE)|V[A@]DI[A@O])S?|(?:BI(?:RL|L[A@]D[A@])|BOLSOMITO(?:2018)?|COCÔ|JUREG|PUM|SEI ?L[A@]|TROS?L(?:[A@]R?|EI|[A@]NDO|[A@]D(?:[A@O](?:R|RES)?|INH[A@O]))|VSF|VTNC|X[A@]BL[A@]U|XIXI))(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|$)';
ofensas := '(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|^)(?:(?:[A@]ROMB[A@]D[A@O]O?|A?(?:BOIOL(?:[A@](?:D[A@O]|O)?|INH[A@])|VI[A@]D(?:O|[A@](?:D[A@O]|O)?|INHO))|B(?:[A@]?ITOL(?:[A@](?:D[A@O])?|[A@]O|INH[A@])|R[A@]N(?:K|QU)EL[A@O]|RONH(?:[A@]|EIRO|UD[A@O])|OST(?:INH)?[A@]O?|O(?:K|QU)ETE(?:IR[A@O])?)|CHUPINGOLE|DEFE(?:K|QU)EI|DEFE[CK]ADO(?:R|R[A@E]S?)?|F[OU]D(?:ID(?:[A@O](?:CO|O)?|OES|ON[A@])|E(?:R|U|NDO|DORES)?|[A@O](?:O|U[MN])?|OES|I[A@]O)|FDP|G[A@]YUCHO|KENG[A@]|L[A@][SZ][A@]RENT[A@O]|L[A@]S[CK][A@]DO(?:R|R[A@E]S?)?|LIX(?:[A@]O|OS[A@O])|(?:MI){3,}|MI?ERD(?:[A@]O?|INH[A@])|MIJ[A@]R|NEG[A@]O|(?<!CANAL[ _]DO[ _])OT[A@]RI[A@O]|P[A@]NELEI?R[A@O]|PI[MN](?:B[A@]D[A@]|GUC[A@O])|PUT(?:[A@O]O?|INH[A@O]|[A@]RI[A@]|ON[A@]|I[A@]NE)|V[A@]DI[A@O])S?|(?:BI(?:RL|L[A@]D[A@])|BOLSOMITO(?:2018)?|COCÔ|JUREG|PUM|SEI ?L[A@]|TROS?L(?:[A@]R?|EI|[A@]NDO|[A@]D(?:[A@O](?:R|RES)?|INH[A@O]))|VSF|VTNC|X[A@]BL[A@]U|XIXI))(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|$)';


ccnorm( rmdoubles( added_lines ) ) irlike ofensas
ccnorm( rmdoubles( added_lines ) ) irlike ofensas
& !ccnorm( rmdoubles( removed_lines ) ) irlike ofensas
& !ccnorm( rmdoubles( removed_lines ) ) irlike ofensas
) | (
) | (
ofensas2 := '(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|^)(?:LADRAO|PORNO|SLÁ)(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|$)';
ofensas2 := '(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|^)(?:LADRAO|PORNO|SLÁ)(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|$)';


rmdoubles( added_lines ) irlike ofensas2 & !rmdoubles( removed_lines ) irlike ofensas2
rmdoubles( added_lines ) irlike ofensas2  
& !rmdoubles( removed_lines ) irlike ofensas2
) | (
/* Evitar falsos positivos */
ofensas3 := '(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|^)(?:BI(?:CH|[BX])(?:[A@]|INH[A@]|ON[A@]))(?:[^A-ZÃÂÁÀÄ@ÇÈÉÊẼêÌÍÏÓÒÔÕQ̃ÚŰÜŨ]|$)';
!( article_text irlike 'bixa' )
& ( ccnorm( rmdoubles( added_lines ) ) irlike ofensas3 & !ccnorm( rmdoubles( removed_lines ) ) irlike ofensas3 )
) )
) )