Usuário(a) Discussão:Salebot/Config

O conteúdo da página não é suportado noutras línguas.
Origem: Wikipédia, a enciclopédia livre.

Instruções[editar código-fonte]

Instruções da página Usuário:Salebot/Config
Código Opções / exemplos Definição
Cabeçalho de cada secção - estes códigos aplicam-se às expressões regulares que se seguem até que haja outro cabeçalho que modifique as definições do anterior.
[ignore-case= ] [ignore-case=0] O "0" corresponde a "não", ou seja, não ignora a casa, sendo sensível a maiúsculas e minúsculas
[ignore-case=1] O "1" corresponde a "sim", ou seja, ignora a casa, não sendo sensível a maiúsculas e minúsculas
[message=XPTO] várias Mensagem utilizada no aviso que o Salebot dá ao usuário que "vandalizou", utilizando a predefinição de aviso Usuário:Salebot/Aviso vandalismo ou Usuário:Salebot/Aviso erro. Neste caso o texto "XPTO" aparece na caixa cinzenta a seguir a "A detecção compreendia os seguintes erros:" Caso uma das expressões detetadas tenha um comentário (#), esse comentário tem precedência sobre esta mensagem apenas esse comentário é usado no aviso.
[namespace=0] várias Número de domínio ao qual se aplica. Neste exemplo, "0" aplica-se apenas a páginas do domínio principal (artigos enciclopédicos).
[category=XPTO] várias
Texto de cada secção
# -1 /não/ # comentário O texto que se segue a #, na mesma linha, é utilizado na mensagem de aviso do Salebot ao vândalo. Este comentário tem precedência sobre o código de cabeçalho [message=mensagemXPTO] anteriormente referido.

Ou seja, no seguinte código:

[message=mensagemXPTO]
-1 /\btu\b/
-1 /\beu li\b/ # erro 32

Se o Salebot detetar a primeira expressão "-1 /\btu\b/" usa "mensagemXPTO" no aviso. Se detetar a segunda usa "erro 32".

Recomendações:

  • regra geral não se deve usar a definição completa do que detetou, principalmente em casos de vandalismos flagrantes, caso contrário está-se a fornecer uma pista ao vândalo do que fez detetar o vandalismo.
  • no caso de erros, como quando adicionam [[Ficheiro:Exemplo.jpg]], deve-se fornecer uma explicação detalhada para que o usuário, que seja avisado pelo Salebot, possa saber o que fez de errado e possa corrigir posteriormente.
# -1 /não/ A expressão é ignorada totalmente pelo Salebot e não é utilizada no aviso a usuários porque não tem uma expressão regular antes de #

Não é necessário introduzir expressões regulares que considerem acentos, pois são ignorados pelo Salebot, como por exemplo "n[ãa]o" que tem o mesmo resultado de "não" ou "nao"


Os códigos nos cabeçalhos não precisam estar necessariamente seguidos ou repetidos. Por exemplo, em:

[category=mistake]
[message=erro3]
-1 /não/
[namespace=0]
-1 /sim/

O código "[category=mistake]" e "[message=erro3]" aplica-se às expressões "não" e "sim", enquanto que o código "[namespace=0]" aplica-se apenas à expressão "sim"

Ver também



Para que servem os números antes das expressões regulares? Também não sei o que significa:

  • [ignore-case=1]
  • [message=mensagem pessoal num artigo enciclopédico]

A única forma de verificar se as expressões regulares estão bem construídas (se não aparecem muitos ou nenhum caso positivo/não sejam vandalismos) é ver as edições do bot? Ou melhor, na página Usuário:Salebot/Jornal/2008-09-27 e similares conforme a data uma vez que o bot ainda não reverte vandalismos?

Já existe uma página com expressões regulares que pode servir para alguma coisa em [1] (não é a última edição porque foi preciso usar o script do anti-vandal tool antigo que não funcionava com estas expressões regulares). Mosca (discussão) 16h44min de 27 de Setembro de 2008 (UTC)

Olá Mosca, [ignore-case] indica a sensibilidade do robô de ignorar 1 caractere (maiúsculo ou minisculo) diferente daquele encontrado na biblioteca. E message, é a mensagem que será incluída no aviso ao IP ou usuário recém-inscrito. Já adicionei a base de dados do avtool, estou trabalhando agora seu algoritmo: ainda estou na letra "b", mas o robô já acerta a maioria das reversões, o que é um bom sinal. Como o código esta grande, fica difícil por vezes encontrar os erros. Quando tiver mais tempo descreverei o funcionamento do robô na página. Mas esconder os detalhes de funcionamento também é importante para podere dificultar a vida dos vândalos em contornar o bot. Kim richard correio 20h00min de 27 de Setembro de 2008 (UTC)
ignore-case is to handle upper-case and lower-case the same way. message is used to report the vandalism/error type to the user in the template. If a regex has a comment (# ...), that is used instead of the message. --Gribeco (discussão) 00h24min de 28 de Setembro de 2008 (UTC)

Pedido para adicionar[editar código-fonte]

Como ainda não me dediquei a perceber esta lista e as RegExp peço que adicionem por favor:

  • gladiatus.com/game
  • gladiatus.com.pt/game

Os domínios não são bloqueados pois são colocados como texto e não o URL completo que já está bloqueado na MediaWiki:Spam-blacklist. Exemplo de diff. Como estão constantemente a adicionar à página pode-se colocar na lista do bot. Se não estou em erro, acho que se pode colocar no score máximo nestes casos pois não parece haver excepções (incluindo o coração). As URL adicionadas à lista do bot pode ser uma boa alternativa após terem sido bloqueadas e mesmo assim colocam o endereço. Desta forma evita-se a protecção da página (o que não resolveria o problema, pois mal desprotegessem adicionariam de novo). Quando se trata de referral linking os spammers são mesmo teimosos conforme se vê no histórico da Gladiatus. Mosca (discussão) 17h10min de 21 de Outubro de 2008 (UTC)

ok. feito Kim richard correio 17h17min de 21 de Outubro de 2008 (UTC)

As expressões como

-25 /\b{{DEFAULTSORT:}}\b/ # 980

provavelmente deviam ser:

-25 /\b\{\{DEFAULTSORT:\}\}\b/ # 980

Existem 3 assim na lista. Em fr:Utilisateur:Salebot/Config têm as seguintes:

-25 /{{Modele ou page a inclure}}/
+2 /\{\{.+\}\}/ # ajout de modèle
+5 /\{\{[Ss]uppression\}\}/ # bandeau "suppression"
+5 /\{\{[Pp]ortail/ # bandeau "portail"
+3 /\{\{Ébauche/ # bandeau "ébauche"
+5 /\{\{À supprimer/ # bandeau "à supprimer"
+10 /\{\{[Ii]nfobox/

A primeira deve ser um engano tal como aqui, não? Mosca (discussão) 17h58min de 10 de Dezembro de 2008 (UTC)

Acho que não tem feito nenhuma diferença mas o correto seria com as barras Kim richard correio 20h22min de 10 de Dezembro de 2008 (UTC)

Limite mínimo[editar código-fonte]

Qual é o limite mínimo (número antes das expressões regulares) para o salebot reverter uma edição? Convém colocar nesta página para se poder definir um número correto ao adicionar mais expressões regulares. Por exemplo, acho que -3 /\brameir[ao]\b/ # 517 #### está bastante baixo, pois a palavra "rameir*" aparece em meia dúzia de páginas. Se o limite mínimo for 20, acho que se deve colocar nessa expressão "-19", para evitar reverter edições legítimas (apesar de ser muito pouco provável) mas ao mesmo tempo permitir reverter caso o editor adicione outra palavra que esteja na lista. Está correto este raciocínio? Mosca (discussão) 19h37min de 18 de fevereiro de 2010 (UTC)[responder]

"-20" é o limiar. Mas 3 detecções com "-3 ou menos" passa automaticamente para -20.
raciocínio correto! Kim ®i©hard correio 22h44min de 5 de junho de 2010 (UTC)[responder]

Alterações à organização[editar código-fonte]

Sugiro fazer algumas alterações na organização da lista. Devíamos tirar as "secções de comentários" como as seguintes:

#
# Boa chance de vandalismo
#


#
# Vandalismo flagrante
#

E agrupar expressões regulares sobre as mesmas palavras, com pouca ou muita chance de vandalismo juntas, pois isso pode-se ver pelo número onde começam:

#puta, putedo, putinha, puteiro, putisse, p-u-t-a, piuta
-30 /\bputt?(aria|inha|i[sc]s?e|eiro|edo)s?/ # 752
-30 /putt?(ao?|[ao]na)s?\b/ # 779 (falsos positivos?)
-30 /put@/ 779b
-9 /\bp.?u.?t.?a\b/ # 779c (falsos positivos?)
-15 /\bputa [qk]u?e? par/ # 779d

Desta forma até se pode descobrir onde está determinada palavra facilmente e não é necessário mostrar as vândalos qual a palavra detetada nos avisos que o Salebot dá. Também se podia ordenar dentro da mesma palavra detetada por variações do código conforme se pode ver "779", "779b", etc. pois é sobre a mesma palavra.

Não estou a sugerir colocar em tudo:

#exemplo
-30 /\bexemplo/ # 752
#outro
-30 /\boutro/ # 753

Apenas onde existem várias e/ou principalmente aquelas difíceis de encontrar devido à complexidade da ExpReg como esta: -10 /\bam([ou]|ei)[- ]?(te?|ele|t[ou]do|[aou]s?)\b/ # 116

Só convém ter atenção de não mudar de secção as expressões, senão o Salebot vai considerá-las de forma diferente (alterando por exemplo uma de "Expressões no ns-0 somente" para outra secção, altera o funcionamento).

Já fiz algumas alterações e encontrei 2 expressões duplicadas. Vai dar trabalho organizar a lista, mas aos poucos chega-se lá. Se não concordarem pode-se reverter a minha alteração que eu introduzo depois as expressões que acrescentei na mesma edição. Mosca (discussão) 11h57min de 8 de julho de 2011 (UTC)[responder]

esta edição legítima em que se adicionou apenas

[[Ficheiro:D.Antônio.jpg.jpg|thumb|Príncipe D.Bertrand de Orléans-Bragança]]

detetou os erros (ver Usuário_Discussão:Neon_Balroom):

Os erros detectados pelo bot estão listados a seguir: 70c ":D" ; 989 ; Reversão anterior feita por humanos.

Ou seja chamou as ExpReg:

-10 /\b\:D\b/ # 70c ":D"
+100 /([Ee][Rr]1?|[Ee][Ss][Rr]|[Ii]mpróprio|[Ss]pam|[Dd]elete)/ # 989

Não entendo como é que a primeira \b\:D\b é chamada já que tem \b no início. Podia detetar ficheiro :D mas não ficheiro:D certo? Já a segunda não entendo bem para que serve uma vez que tem +100 antes. Desconfio que terá algo a haver com marcações para eliminação rápida legítimas, mas se for esse o caso a parte [Ee][Rr]1?|[Ee][Ss][Rr] pode englobar muito texto ilegítimo. Mosca (discussão) 13h49min de 8 de julho de 2011 (UTC)[responder]

A edição foi detectada pela segunda expressão regular por causa do "er". Acho que isso não ocorrerá mais após incluir o prefixo "{{" que deve existir caso se trate de uma predefinição.
A primeira regex também detecta essa edição, pois "\b" representa a fronteira entre uma "palavra" e uma "não palavra". Como ":" não é um caractere que forma palavras, mas "o" é, há uma fronteira ali. Geralmente as letras de "a" a "z" são consideradas como sendo parte de palavras, e dependendo, da linguagem de programação, as letras acentuadas são ou não consideradas. O bot parece não entender que o cedilha é usado em algumas palavras (por isso fiz esta alteração, mas não sei se resolverá o falso positivo). Helder 19h50min de 6 de dezembro de 2011 (UTC)[responder]
Quanto tempo o bot leva para começar a usar as novas regexes? Ele marcou essa edição como se tivesse uma predefinição de eliminação, sendo que a regex já foi corrigida há uma semana. Helder 14h44min de 12 de dezembro de 2011 (UTC)[responder]

Reorganização geral[editar código-fonte]

Proponho fazer uma reorganização geral nesse código. Opiniões para a melhor forma de fazê-lo?

Proponho também passar diversos vandalismos evidentes à categoria temporário para que quando de uma detecção, ative-se a reversão sistemática de um IP/user. Desvantagem : se uma outra pessoa editar com o mesmo IP pouco tempo após, também terá suas edições revocadas, ainda que construtivas. Opiniões ? Kim ®i©hard correio 18h48min de 26 de junho de 2012 (UTC)[responder]

Ver também a seção mais acima, #Alterações à organização. Helder 19h15min de 26 de junho de 2012 (UTC)[responder]

Ferramenta para analisar pontuação do Salebot[editar código-fonte]

Ver Wikipédia Discussão:Projetos/AntiVandalismo#Ferramenta para analisar pontuação do Salebot. Helder 20h55min de 14 de fevereiro de 2017 (UTC)[responder]