Wikipédia Discussão:Projetos/AWB/Arquivo/1

O conteúdo da página não é suportado noutras línguas.
Origem: Wikipédia, a enciclopédia livre.

Não sabia bem como falar com todo mundo (ainda nem sei quem é todo mundo), então vou usar aqui. Pode? Ou melhor passar a página com o link de atualização pra outro lugar, e deixar aqui só pra discussão? Rjclaudio msg 22h33min de 14 de fevereiro de 2010 (UTC)

Grupos de teste[editar código-fonte]

Já que agora tem mais pessoas ajudando, e estamos chegando numa versão mais estável, já dá pra separar um pouco o trabalho criando listas de artigos focados em grupos de regras. Assim dá pra saber onde focar a atenção na hora de verificar a edição.

Escolher um dos grupos abaixo, colocar o nome (pra não ter duas pessoas fazendo os mesmos testes) e ... testar. Não precisa testar tudo. Testa um pouco (o q vc achar suficiente) de cada uma. O importante é passar por todos os itens do grupo.

  • Checkwiki

Pros erros do checkwiki, coloca a url indicada no awb, clica em "Make list". Em alguns casos não vai dar certo na primeira tentativa. Não desiste, vai tentando. Qnd acabar os 100 desse erro, ou passa pra outro item, ou muda o número no final da url para algo maior, e retira da lista os q vc já corrigiu.

Rjclaudio msg 22h33min de 14 de fevereiro de 2010 (UTC)

Referências[editar código-fonte]

  1. {{Ref-section}}
  2. {{Reflist}}
  3. Checkwiki 3 - Artigo com Ref mas sem seção de referências
  4. Checkwiki 81 - Tag de ref duplicada
Usuário fazendo os testes: Rjclaudio D​ C​ E​ F - Feito

Links externos[editar código-fonte]

  1. {{en}}, {{es}}, etc (começando por qualquer uma)
  • Testar aplicação da {{Link}}
  • Essas regras tem margem pra melhoria. Mas vai continuar tendo alguns casos que não tem como pegar.
Usuário fazendo os testes:

Infobox e biografias[editar código-fonte]

  1. {{nascimento e idade}} -> {{dni}}
  • Infobox - Ver se não afeta a info (tipo, inserir negrito em algum campo)
  • Defaultsort - defaultsort pessoa estrangeira (sobrenome, nome) está funcionando
Usuário fazendo os testes:
  1. Lépton D​ C​ E​ F, usando: QuarkAWB D​ C​ E​ F

Listas e tabelas[editar código-fonte]

  1. {{Curiosidades}} (listas)
  2. {{Col-begin}} (com sorte, listas e tabelas)
  3. Checkwiki 31 - Tabela usando elemento de html
  • Não achei modo melhor de fazer isso.
  • Não tem dado problema, depois de retirar a regra de criação de lista. Mas bom testar.
  • Teve alguns pequenos problemas com tabelas. E novas regras q não foram mt testadas.
  • Margem de melhora para Tabelas.
  • O script não corrige o check 31, mas não sei se vai dar algum problema com esse tipo de marcação diferente.
Usuário fazendo os testes:

Imagens[editar código-fonte]

  1. Checkwiki 30 - Imagem sem descrição
  2. Checkwiki 77 - Small em parte da legenda de imagem (mesma dica de cima)
  3. {{Flagicon}}, {{Bandera}}
  4. {{BRAb}}, {{PORb}} (baixa prioridade, não produz um bom grupo de teste)
  • Certificar que não tem problema nas regras de imagem, caso não tenha descrição
  • Marcação correta do final do ficheiro
  • Eliminação correta do small
  • Regras de Flagicon. Possível que tenha casos que podem ser melhorados.
Usuário fazendo os testes:

<small>[editar código-fonte]

  1. Checkwiki 63 - Small em ref/sup/sub
  • Se o script elimina corretamente o small.
  • Um dos erros anteriores era o script colocar o small pra dentro das refs, mas não apagar, ou colocar só o small inicial pra dentro e não apagar o final
Usuário fazendo os testes: Rjclaudio D​ C​ E​ F

Erro em colchetes e chaves (mais trabalhoso)[editar código-fonte]

  1. Checkwiki 10 - Colchetes incorretos
  2. Checkwiki 46 - Colchetes não começam direito
  3. Checkwiki 80 - Ligação externa com quebra de linha
  4. Checkwiki 43 - Predefinição não acaba direito
  5. Checkwiki 47 - Predefinição não começa direito
  • Trabalhar pegando onde o checkwiki achou o erro (tabela, na interface nova) e verificando o artigo
  • Não sei quão bem o script funciona se tiver problemas graves com ligações internas e predefinições.
  • Se quiser corrigir o erro, é correção manual.
  • Alguns casos óbvios o script corrige. Verificar tb se estão certos. Se tiver algum falso-positivo, provavelmente vou desabilitar a regra (as regras estão bem simples e boas, se tiver algum erro então fica complicado de testar bem, e mt arriscado para usar bot)
Usuário fazendo os testes:

Defaultsort[editar código-fonte]

  1. [1]
  2. Checkwiki 37 - Artigo com caracteres especiais e sem defaultsort
  • Testar inserção do Defaultsort
  • Se tem algum caractere especial que não está coberto pelo script
Usuário fazendo os testes:
  1. --- Darwin Alô? 20h08min de 24 de fevereiro de 2010 (UTC)

Texto oculto[editar código-fonte]

  1. Checkwiki 56 - Seta em ASCII
  • Identificação de texto oculto
  • Diferenciação da Seta pela marcação de Texto oculto
  • Conferir se não muda ordem, exibindo conteúdo que está invisível
Usuário fazendo os testes:Rjclaudio D​ C​ E​ F - Feito

Exceções pras regras[editar código-fonte]

  1. <math> - Matemática
  2. {{Quim}} - Química
  3. <code><source> - Computação (principalmente Linguagem de programação / Software)
  4. <poem> - talvez Literatura, poetas, hinos, música, não sei, difícil pegar uma boa lista.
  5. <quote> e {(Citação}} - afluentes da {{Citação}}. Pra "quote", talvez biografias.
  6. {{Desambiguação}}

Regras de espaçamento e quebra de linha (e outras) não são aplicadas caso o artigo tenha algum dos códigos a seguir: <blockquote|code|gallery|math|timeline|pre|poem|nowiki|quote|source> e {{Citação|Quim}}

Preciso testar o awb em uma lista de artigos (mais extensa que nos outros grupos de teste) desses assuntos. Talvez tenha alguma outra regra que precise de exceção. Ou pior (mais difícil de acharmos), algum novo código de exceção.

Usuário fazendo os testes:

Comentários[editar código-fonte]

Só consigo pensar nesses grupos de teste. Quem tiver outra sugestão, pode colocar.

Depois desses testes finalizados, passamos pra etapa 2 dos testes - ir pros ADs (ABs, EADs, etc), q são maiores e mais complexos (pegando casos q normalmente não seriam pegos), e maior visibilidade (mais fácil de alguém achar erro no script, se tiver. Aí sim finaliza. Rjclaudio msg 22h33min de 14 de fevereiro de 2010 (UTC)

Antes de pensar em fazer 'Links externos', seria melhor pensar em fundir todas as {{link}} em uma só, só que melhorando a coisa, tipo não precisar de N parâmetros para os idiomas, mas só vírgula (pt,en,es,ca,nl,ja,ch...), e não precisar de vários parâmetros para a data de acesso, só um: 23 de agosto de 2010, por exemplo. Se é que é necessário data de acesso nas LEs, eu acho que não precisa...
E já não era hora de criar Usuário Discussão:Rjclaudio/AWB/Reportes, deixando sua disc livre somente para contatos com vc, separando as coisas?--Lépton 07h04min de 15 de fevereiro de 2010 (UTC)

Também acho melhor separar as coisas. Deixamos aqui para discussão mesmo.
Eu tenho um "pedido" e dois pequenos ajustes:
  • Ajustes
  1. Peso, ou melhor, valores e kg. Ocorreu que a situação "98Kg" não foi substituída, mas "98 Kg" sim. Acho que seria só tratar esse espaço como opcional
  2. Tanto {{dnibr}} quanto {{dni}} já tratam os meses em minúsculo (pois usam a "palavras mágica" para o mês). Podemos trocar {{dnibr}} por {{dni}} direto ou vamos esperar a padronização?
  • "Pedido": Tem como disponibilizar um "update" da v1.9.3.1 para a v1.10? Isso porque estou varrendo os futebolistas e para fazer isso, preciso compara os XMLs e rever os ajustes feitos. Se for simples, beleza. Senão, pensemos nisso depois.
Abraços Mwaldeck msg 16h12min de 16 de fevereiro de 2010 (UTC)
  • Deixemos o grupo dos 'Links externos' pra depois. Pelo menos já fica aí o grupo de teste pro futuro.
  • Arrumado Kg. "\bKgs?\b" -> "([ 0-9])Kgs?([^a-z])". Não lembro se o awb vê isso, mas precisa de espaço entre o nº e o kg?
  • Pelo o que entendi, a ideia era ter as 2 predefs, uma para versão pt outra para br. Atualmente não tem isso, então tem algo errado. Uma opção é voltar a {{Dni}} para usar inicial maiúscula (com {{#ucfirst) e manter a dnibr como está. Ou passar a Dni para Dnipt, com maiuscula, arrumando afluente, e deixar passar a dnibr para dni, com a predef padrão dni usando AO.
  • As mudanças q eu lembro (provavelmente as mais significativas) eu já coloqueiem Usuário:Rjclaudio/AWB#Atualizações. Posso abrir as duas versões, lado a lado, e comparando posso ver as novas regras adicionadas. Mas mudanças nas regras antigas já fica difícil de ver. Poderia colocar os dois códigos xml em alguma subpágina, depois usar o dif pra comparar. Mas duas edições com mais de 2 megas cada uma, a longo prazom possivelmente mts versões de mts megas, não é viável. Se alguém conhecer um programa de comparação de textos posso usar. Pro futuro, posso listar num arquivo todas as mudanças que vou fazendo, é a melhor opção, mas a mais trabalhosa pra mim.
  • Rjclaudio msg 17h13min de 16 de fevereiro de 2010 (UTC)

Rj, deixa como tá, só pelo amor de deus, o mais rápido possível modifique a dni para letra maiúscula antes os portugueses percebam, pra não dar confusão... mas deixa como tá, dni em maiúscula e dnibr em minúscula, se bem que pra mim bastaria um parâmetro na dni para indicar letra minúscula.--Lépton 17h30min de 16 de fevereiro de 2010 (UTC)

Feito. {{Dni}} já aceitava parâmetro |lang= para pt/br, coloquei pt como padrão. Por mim, nova regra: {dni} -> {dni|lang=pt}, {dnibr} -> {dni|lang=br}. Vou trabalhar nisso. Mas discussões de padronização, vamos fazer no projeto. Aqui fica as conclusões de lá, e como aplicar as regras. Só se a padronização for óbvia. Rjclaudio msg 17h49min de 16 de fevereiro de 2010 (UTC)
Sou português e não me incomoda nada a data em minúsculas. Raios, temos tantos problemas graves e complicamos só por um nome começar por minúscula ou maiúscula. Eu estou a colocar nos artigos feitos por mim, a letra minúscula. Ai de quem reverta !! --João Carvalho deixar mensagem 22h45min de 25 de fevereiro de 2010 (UTC)

Que tal se incluíssemos alguns ajustes referentes ao Wikipedia:Projetos/Futebol/Livro de estilo (na Info/Futebolista) que eu preciso ficar ajustando a cada nova versão sua? Você prefere que eu inclua a parte do XML ou os itens de forma pontual? Abraços Mwaldeck msg 23h56min de 16 de fevereiro de 2010 (UTC)

Me passa por XML. Coloco nas regras temáticas, então só serão aplicadas caso o artigo seja de futebol, não afetando o desempenho pro resto dos artigos. Seria tão bom termos umas regras dessas para cada Livro de Estilo que nós temos ... quem sabe um dia. Rjclaudio msg 00h01min de 17 de fevereiro de 2010 (UTC)
Claudio, criei a subpágina Usuário Discussão:Rjclaudio/AWB/LE futebol com a parte do XML que tenho. Só há um f.. de um problema que não consegui resolver. Acho que você mata rapidinho. O código \|( *|)posição( *|)=( *|)(\[\[|)(A|a)tacante(\]\]|^\))( *|) faz o favor de trocar o [[Atacante (futebol)|atacante]] por [[Atacante (futebol)|atacante]] (futebol)|atacante]]. Isso faz todo o sentido da forma como está a regex. Você se incomodaria de matar essa? Abraços Mwaldeck msg 16h31min de 20 de fevereiro de 2010 (UTC)
Sim, o último item (empréstimo) não terminei. Ainda existem alguns detalhes a incluir ("passando" a bola):
  • Substituir "→" por {{seta fut}}
  • Após do nome do clube, em casos de empréstimo podemos ter "(E)" que deveria ser substituído por {{emp fut}}
  • Substituir o "-" (hífem) por "–" (& ndash;) nos períodos dos clubes
  • Substituir "-atual", "-atualmente" e "-presente" apenas por "–" (& ndash;)
Se você puder dar uma olhada no LE e verificar se dá para automatizar mais algum item. Abraços Mwaldeck msg 17h03min de 20 de fevereiro de 2010 (UTC)

Continuemos as discussões sobre LE Futebol em Usuário Discussão:Rjclaudio/AWB/LE futebol. Penso em fazer uma subpágina para cada LE que estivermos criando regras. Assim daria pra chamar especialistas do tema para opinar, sem eles ficarem embolados em outras discussões. Rjclaudio msg 18h34min de 20 de fevereiro de 2010 (UTC)

Ok, estou indo lá (espero ser um dos especialistas ). Abraços Mwaldeck msg 19h13min de 20 de fevereiro de 2010 (UTC)
  • Nem sei bem onde colocar isto, por isso vai aqui mesmo. É só para avisar que não vou usar o código AWB do Rjclaudio directamente daqui, por isso não coloquei o nome na lista, mas vou tentar incluir o máximo desse código no que já tenho, por isso acaba quase por ir dar ao mesmo. --- Darwin Alô? 11h31min de 24 de fevereiro de 2010 (UTC)

Tenho andado a fazer a lista do Erro 83, e tenho código regexp para resolve-lo de uma forma básica. Se alguém estiver interessado, a expressão a usar é: (^.*?)(?<!(.*\n\=\=[\s\w].*))\=\=\=+?([^\=]*?)\=\=\=+ que é substituída por $1==$3== . Isto acerta o título da 1ª secção de === para ==, sempre que ela não seja precedida de uma secção de nível 2. Claro que muitas vezes isso só não chega, por isso devem sempre confirmar se o resultado final está bem. --- Darwin Alô? 11h37min de 24 de fevereiro de 2010 (UTC)

É verdade, o código acima deve ser usado com a opção singleline seleccionada.--- Darwin Alô? 11h39min de 24 de fevereiro de 2010 (UTC)

Fiz uns testes, e como deu certo pensei em ampliar pra usar na minha regra q marca a primeira seção do artigo. De início eu fiquei maravilhado por vc fazer em 1 regra o que eu fiz em 3. Mas fui ver pelo tempo, e não vale a pena.

Vamos fazer um teste. Vai no "AWB Regex Tester" (onde vc edita a regra, no botão "Test") e veja qnt tempo demora para rodar essa regra em Usuário:Rjclaudio/Temp (cópia de Astronomia, com primeira seção para nível 3). Aqui no meu pc demora cerca de 830 ms. Usando meu conjunto de 3 regras, cada uma delas demora de 1 a 6 ms, totalizando 20 ms.

Veja a grande diferença de tempo. 800 ms podem não ser mt coisa (pode ser maior, dependendo do pc) qnd só tem essa regra, mas num conjunto maior 800 ms é bem vindo.

Mas vlw pela regra. Nunca usei o (?<!) nem o (^.*?). Não sei pq. Eu devia estar mais acostumado com as regras mais fáceis e acabei não olhando mais pra isso. Qnd tiver a versão estável preciso tirar um tempo para aprender esses 2 recursos e testar pra ver como usá-los melhorar minhas regras atuais. Rjclaudio msg 12h33min de 24 de fevereiro de 2010 (UTC)

Ehehehe Nunca usou o primeiro desses truques porque geralmente ele não faz parte da documentação de regexp. Eu matei a cabeça para descobrir como se fazia pesquisa de substrings, porque sempre pensei que dava para fazer, e achei a resposta nuns forums. Mas você tem razão, a regra é lenta, embora penso que há algo ali que pode ser alterado para torna-la mais rápida. Vou ver como você fez, e se achar uma solução que seja mais elegante (mais rápida é difícil) que os três passos, eu lhe direi. :) --- Darwin Alô? 13h27min de 24 de fevereiro de 2010 (UTC)

Checkwiki 37[editar código-fonte]

Comecei agora a fazer o teste, e ele não colocou o DEFAULTSORT logo no primeiro... Possívelmente porque faltam os caracteres бг. Vou tentar encontrar o sítio do script onde colocar isso...--- Darwin Alô? 20h15min de 24 de fevereiro de 2010 (UTC)

  • Padrão/Parte inf/DEFAULTSORT 2/Arruma DEFAULTSORT/Caracteres especiais.
  • Deve ter vários caracteres q não estão ali. Vai fazendo uma lista dos caracteres q não estão sendo detectados, e para qual caractere deve ser substituído, e depois me passa. De tempos em tempos tenho q passar nesse erro e atualizar essa parte do script. б -> б e г -> r é isso? Rjclaudio msg 20h32min de 24 de fevereiro de 2010 (UTC)
Sinceramente nem sei se nesse caso se deve colocar defaultsort... Letras gregas não têm substituição em português, talvez deva ficar assim mesmo... Agora outra coisa, reparei que ele está colocando "À Beira do Tejo" como "Beira Tejo, A". Isso é suposto ser assim mesmo, fazer essa troca? --- Darwin Alô? 20h38min de 24 de fevereiro de 2010 (UTC)
  • Ah, isso é letra de outro alfabeto? Letra grega melhor não mexer com awb. Não sei como ficaria isso pro defaultsort. Mas como são casos específicos não vale colocar no awb.
  • Sim. Sempre q começar com A|O|The, coloca o artigo pro final. Não sei se está nas regras de categorização. Nem sei qnd foi q coloquei isso nas regras. Mas como eu via isso ser mt utilizado, coloquei nas regras. Aproveitando, podemos criar uma página explicativa sobre Defaultsort e índice de categorias, reunir tudo em uma página só. Ou uma seção em Ajuda:Guia de edição/Categorizar, essa página explicativa não ajuda mt nesse ponto.
  • Rjclaudio msg 21h01min de 24 de fevereiro de 2010 (UTC)
É que neste caso não é "A", mas sim "À". É semelhante a colocar "Em busca do templo perdido" como "Busca Templo Perdido, Em". De certeza que isso está bem? É que não me parece muito intuitivo... --- Darwin Alô? 21h13min de 24 de fevereiro de 2010 (UTC)

... tem razão. Vou pensar como arrumar isso. Ou desabilito, ou faço uma regra extra pra isso. Usaria detector de título (inserir ╩%%title%%╩, usar ╩ para detectar, e depois apagar isso), q já tinha pensado em usar a um tempo atrás (não lembro mais pra q eu queria, droga), e só fazer a troca do A|O|... if not contain "╩À". É a única forma q penso pra manter a troca para os casos de artigo, e não trocar para casos de caractere especial. Preferem desse modo, ou apenas desabilitar? Rjclaudio msg 21h34min de 24 de fevereiro de 2010 (UTC)

Parece-me que é útil a troca quando se trata de um artigo e não de uma preposição. Essa solução do ╩ não será a ideal, mas funciona de certeza e não estou a ver que dê falsos positivos. --- Darwin Alô? 22h25min de 24 de fevereiro de 2010 (UTC)

Pode escrever o símbolo pra versão captalizada de ă ? Não sei como fazer. Pode olhar essas regras de caracteres especiais? Tem alguns q só estão na regra em minúscula e não na maiúscula, ou ao contrário, pq não sabia como escrever o caractere. Rjclaudio msg 17h32min de 26 de fevereiro de 2010 (UTC)

Links sem título mas com notas[editar código-fonte]

Encontrei um caso[2] em que o código quando cria o {{link}} não preencheu o campo Título (3), e colocou o título nas notas (4). Fiz um código tapa-buracos para dar um jeito na coisa provisoriamente, mas talvez isso deva ser visto. --- Darwin Alô? 22h17min de 24 de fevereiro de 2010 (UTC)

  • Copiei a página antes da sua edição para minha subpágina, mas não consegui reproduzir o erro. Usei minha versão atual e nada, e usei a versão 1.11 e tb colocou o |4=. Estava usando uma versão anterior? Teria como colocar o numero da versão nos seus sumários? Isso ajuda nos testes, pra qnd acharem um erro no futuro sabermos de qual versão q é. Pelo menos por enquanto, nos testes. Rjclaudio msg 22h30min de 24 de fevereiro de 2010 (UTC)
É a 1.1, a que estou a usar... Puxei o código daí da página há umas horas apenas... --- Darwin Alô? 22h36min de 24 de fevereiro de 2010 (UTC)
Alterei a tua subpágina desactivando o meu "código tapa-buracos", para que reproduzisse o resultado. Ele preenche o 4 em vez do 3. --- Darwin Alô? 22h41min de 24 de fevereiro de 2010 (UTC)

Oh sim, agora entendi. Qnd não tiver o 3= preenchido, usar o 4= no lugar do 3=. Sim, talvez. Isso seria válido para todos os casos? Se tiver {{Link||2=url |3= |4=[[xxx]]}} daria xxx. Isso mesmo? Rjclaudio msg 22h54min de 24 de fevereiro de 2010 (UTC)

Há pouco quando andava a vasculhar pela documentação e discussões da anglófona sobre links externos e AWB, parece-me ter lido numa das discussões alguém a sugerir que quando não houvesse título, se usasse as notas como título, que creio que é este caso. Não percebi bem o exemplo que deste, mas seria algo do género, se ele preenche o 4 sem preencher o 3, então é porque devia ter preenchido o 3 e não o 4. Não sei se fui claro. :S --- Darwin Alô? 23h02min de 24 de fevereiro de 2010 (UTC)

O problema é o 3 ter uma ligação interna, ou uma predef, imagem, um [ | ] , ou qualquer coisa similar q atrapalhe em algo. No meu exemplo, as notas (4) começavam com ligação interna, e o resultado não ficou mt bom. Dá pra trabalhar no awb/predef, mas o resultado não seria sempre perfeito.

Pelo menos pra mim, ao invés de ter "«no» (em inglês). imdb " (preenchendo 3= com "no") prefiro "«título ainda não informado» (em inglês). no imdb ". Rjclaudio msg 23h10min de 24 de fevereiro de 2010 (UTC)

As LEs para o imdb não são o melhor exemplo, pois essas têm as suas próprias predefs. Se pudesses criar uma subpágina com o link em bruto para eu passar lá com o AWB e ver como ficaria o resultado, seria óptimo. --- Darwin Alô? 23h18min de 24 de fevereiro de 2010 (UTC)

imdb foi exemplo, troque imdb por google, ou qualquer outra coisa. Coloquei em Usuário:Rjclaudio/Temp todos os casos q pensei q podem dar erro. Pode passar o awb. Rjclaudio msg 23h44min de 24 de fevereiro de 2010 (UTC)

Não me entendi bem com o modo como crias os links, por isso fiz um código à parte, mas creio que consegui resolver todas as situações:
  1. \[(http.*?)\]( +?([^ ].*)|) --> {{link|2=$1|3=$3}}
  2. (\{\{link.*?3\=)(no |\| |\[ )?(.*?)(( \|| \])\}\}\n|\}\}\n) --> $1$3}}\n
  3. ([^\]])\]\} --> $1}
Era algo assim? --- Darwin Alô? 01h58min de 25 de fevereiro de 2010 (UTC)

Amanhã testo isso. Mt símbolo junto pro meu cérebro com sono. Rjclaudio msg 02h33min de 25 de fevereiro de 2010 (UTC)

Link sem idioma não aparece[editar código-fonte]

Outro problema com o {{link}} - quando não tem língua definida ele não mostra nada. Exemplo: [3] (o "de" fui eu que coloquei à mão). O problema aqui deve ser do código da predef, e não do AWB. --- Darwin Alô? 22h58min de 24 de fevereiro de 2010 (UTC)

Falei com o Daemorris, q fez a alteração na {{Link}} q pedi, pro campo título ficar opcional. Na edição ele deve ter feito algo errado. Se quiser pode olhar a predef. Não sei se tb tem esse erro, mas a {{Link2}} teve edição parecida. Já está fora do alcance do AWB. Rjclaudio msg 23h02min de 24 de fevereiro de 2010 (UTC)

O problema é aquele {{#if:{{{1|}}} que ali está. Já agora, é impressão minha ou ele está escrevendo a tal coisa de "Título não preenchido, favor adicionar" quando não tem título? Pelo menos isso ainda está lá no código... --- Darwin Alô? 23h13min de 24 de fevereiro de 2010 (UTC)

A ideia é essa, colocar o Título não (...). Ver a discussão no Wikipedia Discussão:Projetos/Padronização visual. Me baseei na discussão sobre deixar título opcional para a {{Citar web}}, e fiz o mesmo para a {{Link}}. Rjclaudio msg 23h27min de 24 de fevereiro de 2010 (UTC)

Ah, ok, então eu percebi mal essa outra discussão. Pensei que o preenchimento do campo Título com algo iria no futuro atrapalhar os bots, mas agora vejo que isso era só sobre os primeiros 40 caracteres da URL. --- Darwin Alô? 23h34min de 24 de fevereiro de 2010 (UTC)

Sim, preencher o campo título com um aviso atrapalha o bot q preenche o título sozinho, a menos q tenha um ajuste no bot para ele reconhecer o aviso como campo vazio. Por isso mudei o script e a predef, e estou colocando nova regra para retirar os avisos q já tinha posto. Rjclaudio msg 23h38min de 24 de fevereiro de 2010 (UTC)

Ah, sim, agora percebi, vemos o aviso na mesma, mas ele é dado pela predef e de facto não está lá. (Já agora, estive à procura desse bot e não encontrei, vou falar com o Alch a ver se ele sabe de alguma coisa). --- Darwin Alô? 23h42min de 24 de fevereiro de 2010 (UTC)

Inserção de portais[editar código-fonte]

O código tentou inserir o Portal Brasil neste artigo, certamente por causa da categoria. Dá-me a ideia que esse método gerará uma grande quantidade de falsos positivos, e muitos artigos que não estão primariamente relacionados com esses portais acabarão sendo marcados. Não haverá um meio de afinar isso? --- Darwin Alô? 22h35min de 24 de fevereiro de 2010 (UTC)

Já agora, coloquei o código para inserir o Portal da Alemanha quando apanha um artigo com a predef Info/Cidade da Alemanha. Penso que seria interessante fazer o mesmo para as comunas, municípios, etc. --- Darwin Alô? 22h52min de 24 de fevereiro de 2010 (UTC)
Sim, aí as predefs são certinhas, a menos que alguém vá usar a predef da Alemanha noutro país. Confesso que já fiz isso - por não ter pachorra de criar uma predef nova para bairros italianos, em Quinto al Mare usei uma de um bairro brasileiro. :S
Isso de inserir os portais automaticamente é fantástico, mas requer algum fine tuning. Se quiserem eu depois posso ir testando essas regras. --- Darwin Alô? 23h07min de 24 de fevereiro de 2010 (UTC)

Se quiser ajudar fala com o Thiago e divide o trabalho, ou fica vc com isso e o Thiago faz outra coisa. Precisa de uma revisão das regras atuais de Portal3 (estou desabilitando Países por cat), com testes temáticos (passar em artigos sobre o tema, incluindo artigos não tão próximos ao tema) e ver se está fazendo certo. É um teste longo. Não sei se coloco a Portal3 para a primeira versão dos bots, deve demorar mais um tempo para ficar sem falso-positivos. Rjclaudio msg 23h25min de 24 de fevereiro de 2010 (UTC)

Link de download[editar código-fonte]

Passei o link de download para Usuário:Rjclaudio/AWB/Download. Fiz o movimento da página atual para lá e depois editei, para tentar manter a página na lista de vigiados de vcs (não sei se deu certo, alguém diz aí). Assim quem não quiser participar das discussões mas quiser ter o awb sempre atualizado pode só vigiar a página com o link. Rjclaudio msg 23h46min de 24 de fevereiro de 2010 (UTC)

Deu certo. :) --- Darwin Alô? 23h50min de 24 de fevereiro de 2010 (UTC)
Tive de acrescentar aos vigiados, porque a que estava vigiando era Usuário Discussão:Rjclaudio --João Carvalho deixar mensagem 23h53min de 24 de fevereiro de 2010 (UTC)

Esta predefinição é tão mal utilizada neste projecto, que eu no meu código do AWB tenho uma opção para retira-la dos artigos sempre, já que são muito raros os falsos positivos, e esses eu anulo à mão. Genericamente, ela nunca deveria constar de artigos de temática brasileira ou portuguesa, pois não se espera que já exista um artigo igual criado noutras wikis nesses casos. Infelizmente o seu mau uso generalizou-se a tal ponto que neste momento a predef é quase inútil para servir o fim para o qual foi criada. Em princípio ela deveria ser sempre removida, excepto em artigos de temática estrangeira que ainda não tenham iws. --- Darwin Alô? 23h50min de 24 de fevereiro de 2010 (UTC)

  • Como regra geral, se não há consenso (ou pior, vai contra consenso anterior), ou já teve alguma discordância passada, ou alguém usa desse modo, então não é um assunto para nós discutirmos aqui. Aqui fica só a aplicação das regras / políticas / padrões / etc. Se não tem consenso ou não é algo óbvio q será melhor então prefiro ter antes uma discussão na esplanada / projeto padronização visual / qualquer outro lugar.
  • Tinha regra pra add sem-fontes, tirei pq não tinha consenso claro. tirei tb a regra pra + sem-notas, e pra trocar sem-fontes por sem-notas, e algumas outras de tag de manutenção. Manutenção é um assunto q precisa de consenso.
  • Poderia criar uma regra para tirar a predef de alguns casos, mas como vc mesmo disse tem alguns falso-positivos q vc evitaria editando a mão, mas como a ideia é usar o código em bots, as regras não podem ter nenhum falso-positivo, e as q não tem consenso claro devem ter discussão antes.
  • Até tendo a concordar em retirar de temas lusófonos, mas prefiro deixar comentários para a discussão em outro local.
  • Rjclaudio msg 00h11min de 25 de fevereiro de 2010 (UTC)
A discussão está lá, na página da predef. A predef foi criada para marcar artigos que não existem em outras línguas, para facilitar a sua posterior ligação. Ora, é muito pouco provável que o artigo Jardim Central venha algum dia a ser criado noutra língua sem que esteja ligado a esta. De qualquer modo, como se vê da mesma discussão, já existe a Especial:Withoutinterwiki que lista todas as páginas sem iw. O único objectivo actual dessa predef é facilitar a ligação de iw óbvios, que infelizmente não pode ser conseguido devido ao mau hábito de muitos utilizadores de colocar constantemente o "semiw" em tudo quanto é artigo de bairro, escola de samba, etc., tornando essa predef totalmente inútil. Este não é um assunto polémico, é apenas um mau hábito e uma má utilização da predef que é necessário corrigir nos artigos, por isso continuo achando que deve ser removida via AWB em todos os casos em que a utilização é incorrecta, que são a esmagadora maioria. --- Darwin Alô? 02h11min de 25 de fevereiro de 2010 (UTC)
Isto nunca seria regra para bots, é para ser usado em AWB assistido. E, tanto quanto sei, não vai contra consenso anterior, muito pelo contrário. Quem coloca essa predef nos artigos geralmente faz por ignorância, ou porque vê noutros ou porque percebeu mal o sentido da predef. Eu no início também punha. :) --- Darwin Alô? 02h13min de 25 de fevereiro de 2010 (UTC)
  • Essa discussão é antiga, e mesmo naquela época tinha gente q não via problema em usar a predef em temas lusófonos, assim como há pessoas atualmente q não vêem problema. Pode não ser polêmico, mas não é consenso na medida q tem pessoas q não apoiam isso e fazem o oposto. Como toda página especial, ela só mostra os 5 mil primeiros, então ainda há uma grande vantagem na semiw.
  • Posso criar um conjunto de regras logo após "Temáticos" chamado "AWB Assistido", desabilitado por padrão (cada um habilita e usa por conta própria) com regras opcionais (exclusão / adição de tags de manutenção, como semiw, sem-fontes, sem-notas) e em teste para erros de checkwiki específicos (como regras em teste para correção de colchetes/chaves). Vou fazer isso na outra atualização (acabei de fazer um upload, e já vou dormir)
  • Rjclaudio msg 02h22min de 25 de fevereiro de 2010 (UTC)
Eu nunca vi ninguém apoiando usar aquilo em tudo, mas se tu dizes que sim, eu acredito que seja verdade, pois és bem mais antigo que eu cá dentro. E também não conheço ninguém que use a lista gerada por aquela predef, talvez porque da última vez que olhei para ela já ia quase em 50.000 afluentes. De qualquer maneira isso seria sempre um script opcional, como sugeres, desabilitado por defeito, pois é sempre necessário verificar manualmente se o semiw estava a ser usado incorrectamente ou não. --- Darwin Alô? 02h38min de 25 de fevereiro de 2010 (UTC)

Este aviso está a aparecer abaixo do portal, quando parece que deveria estar acima. Já há algo definido sobre isto? Creio que houve uma discussão na esplanada sobre o assunto há uns dias. Se deveria estar acima, talvez fosse boa ideia incluir isso no código do AWB. --- Darwin Alô? 00h03min de 25 de fevereiro de 2010 (UTC)

Sempre via essas predefs no final, por isso mantive no final. Depois das discussões, sim, vou passar todas de Categoria:!Predefinições para infobox em falta para o topo. Rjclaudio msg 00h33min de 25 de fevereiro de 2010 (UTC)

DEFAULTSORT para maiúscula[editar código-fonte]

Toda a secção "DEFAULTSORT para maiúscula" (assim como a "para minúscula") parece que poderia ser resumida a um caso só, usando as magic words {{uc:string}} e {{lc:string}}. --- Darwin Alô? 00h09min de 25 de fevereiro de 2010 (UTC)

  • No início estava usando assim, mas mudei, não lembro exatamente o pq. Atualmente, penso q depende se o awb usa o defaultsort para outra coisa, em algum outro momento.
  • Acabei de mudar para só testar as 26 regras se o defaultsort tiver alguma letra minúscula q precisa mudar para maiúscula. Então no caso geral só testaria 1 regra, e só se precisasse testaria as 26.
  • Mts regras usam {{DEFAULTSORT:.*}}, teria q mudar todas essas regras pra incluir essa mudança. Com minha mudança só vai testar as 26 se precisar, mas com a sua proposta as outras regras teriam q testar a possibilidade do {{lc:}} sempre. Não sei se compensa. Minha intuição diz q não, mas não sei exatamente como testar isso.
  • Dá pra fazer melhorias no código em relação à velocidade, mas ainda não é minha prioridade. Por enquanto só quero tirar os erros e fazer a versão estável (v 2.0) pra depois trabalhar no desempenho (v 2.5). Podemos ir discutindo, mas não vou quebrar mt a cabeça pra aplicar as mudanças nas regras nesse momento.
  • Rjclaudio msg 00h21min de 25 de fevereiro de 2010 (UTC)
Para evitar mexer com as outras regras, bastaria fazer esse teste da capitalização no fim, aí não haveria problema. --- Darwin Alô? 02h15min de 25 de fevereiro de 2010 (UTC)

Pode ser. Lembrei agora pq tinha desistido dessa regra no início da criação do script: dava erro nos casos de precisar aplicar a regra mais de uma vez. Vou ver o que dá pra fazer. Rjclaudio msg 02h28min de 25 de fevereiro de 2010 (UTC)

Ordenando cat/iw[editar código-fonte]

Mudei os códigos, e desabilitei o "Apply General Fixes", para o awb não corrigir automaticamente a ordem do cat/iw. Fiz por 2 motivos:

1- Não mudar a ordem do {{sem iw}}, {{Bom artigo}}, e similares, q estava mudando automaticamente, seguindo discussão na esplanada.

2- Sem revisão, essa correção automática iria colocar para dentro do corpo do artigo coisas como spam (url - Link externo), vandalismo, subst em predef, VDA, fusão mal feita, etc.

Essa foi uma mudança necessária para podermos usar bots sem perigo de estarmos a esconder (não apareceriam mais no checkwiki) problemas ao invés de corrigi-los.

Quem estiver revisando suas edições e achar q não vai ter os problemas descritos acima, só remarcar o "Apply General Fixes". Mas de agora em diante (as próximas edições) pretendo manter desmarcado por padrão).

Lembrando q é missão de todos com AWB manter os erros 51/52/53 do checkwiki sempre zerados, q são os q lidam com esse tipo de problema.

Rjclaudio msg 02h48min de 25 de fevereiro de 2010 (UTC)

É impressão minha, ou esta última versão ficou significativamente mais lenta que a outra? --- Darwin Alô? 11h41min de 25 de fevereiro de 2010 (UTC)

Lenta para processar a página, ou para carregar as regras no awb? Ela deve ficar mais lenta q o normal qnd o artigo tiver {{BRA}} e similares. Talvez eu retire todas essas regras do script. Rjclaudio msg 11h50min de 25 de fevereiro de 2010 (UTC)

De regras complexas do tipo [^x], q usa alguma marcação, q são as que eu acho q demoram mais de testar, fiz a regra q troca {{Cite web}} por {{Citar web}}, e a q coloca a {{Sem-infobox}} para o topo. Cite web, Sem-infobox, e BRA (e flagicon e similares), essas 3 predefs q podem estar fazendo a diferença nesse update de agora. Não vejo grandes mudanças no resto. Rjclaudio msg 12h03min de 25 de fevereiro de 2010 (UTC)
Eu só testei em Anger (Alemanha), mas pareceu-me bastante mais lento que na outra cidade alemã que vi ontem, a processar a página. Quanto às bandeiras, basta ter o teste para verificar apenas quando tiver escrito flagicon e os outros termos chave (acho que já tem isso, né?). --- Darwin Alô? 12h17min de 25 de fevereiro de 2010 (UTC)

Sim, tem. Mas a lerdeza maior é qnd a página tem Flagicon, q está testando várias regras. Se tiver vários flagicons diferentes então, vai testar quase todas as 300. Enfim, não sei onde está o problema, mais tarde vejo isso. Sei q uma hora vamos atingir um limite, mas espero ainda não ter chegado nele. Rjclaudio msg 12h37min de 25 de fevereiro de 2010 (UTC)

Ajuda na regra q retira Defaultsort[editar código-fonte]

Estou com um problema na regra q retira o Defaultsort se ele for igual ao título. Em Anger (Alemanha) está sendo adicionado Defaultsort igual ao título, e não consigo colocar pra retirar. Pediria ajuda, e pediria q não coloquem manualmente o defaultsort ali, pq esse tipo de regra q usa o título só pode ser testada no domínio principal.

Pode ser problema da regra (acho q não): Find "{{DEFAULTSORT:%%title%%}}\r?\n" me parece bem seguro. Como o erro não está aí, e essa é a única regra q retira defaultsort, e esse foi o primeiro caso q deu esse erro, não sei qual o problema. Minha única teoria é o awb não estar retirando se o título tiver ( ) e não precisar de ajustes.

Preciso de uma mãozinha nesse ponto, estou desde ontem pensando e até agora nada. Rjclaudio msg 02h53min de 25 de fevereiro de 2010 (UTC)

Rjclaudio, creio que topei qual é o problema. O %%title%% não está fazendo escape aos "(" e ")" que p título dessa página contém, que interferem depois com a correcta detecção do título da página. Não estou habituado ao %%title%%, por isso não sei como resolver isso, mas à partida parece possível de remediar. --- Darwin Alô? 11h40min de 25 de fevereiro de 2010 (UTC)
Tb acho q é isso. Só q não sei como resolver. O único modo q vejo pra comparar com o título é com %%title%%, não tem outra forma. Rjclaudio msg 11h48min de 25 de fevereiro de 2010 (UTC)
Eu penso que sei como dar a volta nisso, mas deve ter um método bem mais simples, pois os anglófonos de certeza q têm esse mesmo problema com o %%title%%. Estou à procura nas discussões deles de algo que elucide, se não encontrar vou usar o truque que sei, depois coloco aqui o código.--- Darwin Alô? 12h19min de 25 de fevereiro de 2010 (UTC)
ACHEI! O %%title%% só funciona correctamente se não for usado em regexp. Se for usado como texto normal a operação corre bem. Pensoq ue é necessário rever a utilização do %%title%% no código todo, por causa disso. --- Darwin Alô? 15h14min de 25 de fevereiro de 2010 (UTC)

Vou rever todo o código, onde tiver %%title%% eu vejo um modo de retirar o regex ou retirar a regra em si. Rjclaudio msg 14h56min de 26 de fevereiro de 2010 (UTC)

Aquele truque que estás a usar de meter o %%title%% no início da página e depois usar como variável local é muito útil, e pode ser desenvolvido para várias outras variáveis que sejam necessárias usar ao longo dos testes. Eu já estou a usar algo parecido com isso para algumas coisas. --- Darwin Alô? 15h21min de 26 de fevereiro de 2010 (UTC)
Só dá pra colocar "Case sensitive" se tiver "Regex". O jeito é usar variável pro título. Rjclaudio msg 20h36min de 26 de fevereiro de 2010 (UTC)
Não, no Find dá para usar sem RegExp... Eu estou a usar agora mesmo dessa maneira, e está a funcionar. --- Darwin Alô? 20h39min de 26 de fevereiro de 2010 (UTC)
Não ligues, eu não queria dizer Find, mas sim If. O {{DEFAULTSORT:%%title%%}} com "case sensitive" deve ficar no If.--- Darwin Alô? 20h41min de 26 de fevereiro de 2010 (UTC)

Mas aí ele nunca vai retirar caso o título tenha (). Rjclaudio msg 20h45min de 26 de fevereiro de 2010 (UTC)

Porque não? Acho que quando é igual ele retira sim, pelo menos ainda não notei que não fizesse isso. --- Darwin Alô? 20h56min de 26 de fevereiro de 2010 (UTC)
Mas o problema todo desde o início não era justamente detectar DEFAULTSORT:%%title%% qnd o título tiver () ? Agora voltamos exatamente para o mesmo caso. Quer verificar se o defaultsort é igual ao título, mas o título tem (), mesmo caso Anger (Alemanha), testei e não pegou. Aproveitando, achei outro caso: Bob’s. Rjclaudio msg 21h00min de 26 de fevereiro de 2010 (UTC)
Tem razão. Estava a ver mal a coisa aqui. Testei de novo em Alto de los Quebrachos e ele não tentou retirar o DEFAULTSORT, menos não tendo o If preenchido. Esqueça o que eu falei, e desculpe a confusão. Realmente quando se activa o If ele parece entrar em modo regexp, mesmo não estando marcado. --- Darwin Alô? 21h55min de 26 de fevereiro de 2010 (UTC)

Problemas com DEFAULTSORT[editar código-fonte]

  • Detectei um outro problema(?) com esta regra. Se o título do artigo levar algo acentuado entre parentisis (ex. desambiguação, província) ele coloca o Defaultsort na mesma, pois aí o texto que ele compara já é diferente de %%title%%. Não sei se haveria necessidade de levar defaultsort nesses casos. --- Darwin Alô? 17h26min de 25 de fevereiro de 2010 (UTC)
Está, todas as palavras devem começar com letra maiúscula, senão interfere na categorização, o que gera mais um erro de checkwiki.--Lépton 19h43min de 25 de fevereiro de 2010 (UTC)
Lépton, eu devia ter-me explicado melhor. O que me faz confusão não é a capitalização, mas sim as partículas de ligação. Parece-me que algo que se chama "Bandeiras do Dakota" devia estar catalogado como "Bandeiras Dakota" para ficar no sítio certo, caso contrário ficará indevidamente acima de "Bandeiras da Dinamarca", por exemplo. --- Darwin Alô? 20h18min de 25 de fevereiro de 2010 (UTC)
  • Pensando bem, o DEFAULTSORT nunca deve levar aquilo que está entre parêntesis, pois isso interfere com a ordenação. Vou fazer um código tapa-buracos para retirar isso e passar nos artigos onde passei e ele colocou isso.--- Darwin Alô? 19h07min de 25 de fevereiro de 2010 (UTC)


  1. Pelo Checkwiki, se tiver caractere especial em qualquer parte do título, mesmo na parte dos parenteses, tem q ser arrumado. Talvez não afete tanto em casos normais, mas coisas como "xxx (Álbum)" | "xxx (Single)" | "xxx (Turnê)" ficariam fora de ordem da categoria.
  2. Arcahaie arrumado.
  3. Arica (comuna) - o mesmo do primeiro. não importa onde estiver a correção, ele vai fazer.
  4. Sobre o "de" como ligação entre palavras, não sei dizer. Não tem nenhuma regra sobre isso, e seria um novo padrão nosso. O problema é detectar qnd o "de" deve ser retirado e quando não deve. Pode fazer parte de uma palavra estrangeira ou um nome de pessoa, ou o de servir como outro propósito (ex: " do qual"). mt difícil pro awb perceber essas sutilezas.
  5. Atualmente o awb só consegue comparar com o título. o awb em si, com regex, não consegue fazer nenhuma comparação entre trechos do mesmo artigo. Pra isso seria necessário programação C# ou VB.net. Como ainda teria q aprender a fazer isso, fica só em versões posteriores.
  6. Não há consenso sobre retirada dos parênteses, e não sei se é o ideal. Conforme o exemplo q dei no início, pode ter vários artigos com o mesmo nome (álbum, single, turnê) q ficariam na cat do cantor, e sem o defaultsort não sei como seria a ordenação (vai ordenar pelo () do mesmo jeito?) mas com certeza não seria a correta (álbum após single/turnê).
  7. Rjclaudio msg 14h55min de 26 de fevereiro de 2010 (UTC)
  • Sobre o "de", eu também cheguei à conclusão que não é fácil decidir quando deve ser retirado, por isso na dúvida realmente é melhor deixar.
  • Sobre a comparação de trechos dentro do artigo, eu consigo e estou a fazer isso para limpar o que vai à frente do "|" nas categorias quando é igual ao DEFAULTSORT. Se quiseres eu mostro como estou a fazer.
  • Sobre o DEFAULTSORT com parêntesis, inicialmente estava convencido que os parêntesis deviam mesmo ser removidos pois, como disse, isso poderia interferir com a ordenação. No entanto, olhando as precedências dos caracteres, noto que o "(" está quase logo depois do espaço, pelo que essa interferência me parece totalmente irrelevante, e tem a agravante de realmente não colocar pela ordem correcta os artigos na categoria, se não for usado DEFAULTSORT, como bem notaste. Neste momento estou convencido que realmente deve levar DEFAULTSORT com parêntesis.
--- Darwin Alô? 15h11min de 26 de fevereiro de 2010 (UTC)

Me mostra como vc faz a comparação entre trechos. Já tentei algumas vezes e não soube fazer. Isso pode abrir várias possibilidades. Rjclaudio msg 15h50min de 26 de fevereiro de 2010 (UTC)

Há pelo menos duas maneiras:
  1. .*?coisa_que_você_quer_procurar(texto).*?coisa_que_você_quer_encontrar\1, em que o número em \1 corresponde à posição do texto que vai entre () e que vce quer usar como referência.
  2. Alternativamente, pode expandir o que já faz com o %%title%% no início do artigo, que é a única forma para situações mais complexas. Num passo coloca lá uma variável que leva o texto a ser trabalhado, e depois trabalha esse texto ou usa como referência durante os testes.
Se quiser eu posso colocar aqui um exemplo concreto.--- Darwin Alô? 16h04min de 26 de fevereiro de 2010 (UTC)
  • Nunca tinha visto esse \1. Vai mudar bastante coisa agora.
  • Não devo usar mts variáveis globais, mas se usar penso em fazer uma lista delas no final do artigo, após a marcação de End of File, com uma variável em cada linha. Depois vou fazer alguns testes com isso.
  • Rjclaudio msg 17h27min de 26 de fevereiro de 2010 (UTC)

Commonscat duplicada[editar código-fonte]

Seria útil colocar uma regra para que o AWB removesse casos em que há commonscat duplicada. Exemplo: [4]--- Darwin Alô? 15h49min de 25 de fevereiro de 2010 (UTC)

Por mim acabava com {{commons1}} e similares, correlatos deve ficar só na tabela da direita com {{correlatos}}, e não como texto normal nas LE. Aí faria uma regra para apagar essa predef, enquanto não arruma os afluentes e elimina ela. Rjclaudio msg 14h58min de 26 de fevereiro de 2010 (UTC)
À partida, concordo. Seria bom incluir a regra na próxima versão, para que já se fosse testando. Por falar nisso, já tenho uma série de casos para inserção de portais de países via predefs, que já podiam ser incluídos nessa versão. --- Darwin Alô? 15h19min de 26 de fevereiro de 2010 (UTC)

Cria uma subpágina sua, ou usa alguma das minhas (Usuário:Rjclaudio/AWB/Temp1, criei agora). Vai colocando ali as regras conforme vc for as criando e estiverem boas, e eu vou colocando no script. Rjclaudio msg 16h00min de 26 de fevereiro de 2010 (UTC)

Coloquei lá agora as regras que já criei. Quando tiver mais algumas volto a actualizar. --- Darwin Alô? 16h10min de 26 de fevereiro de 2010 (UTC)

O código tá colocando "Abisko╦" no início do artigo... Ver Abisko. --- Darwin Alô? 16h09min de 25 de fevereiro de 2010 (UTC)

Falando nisso, esse aviso parece muito intrusivo, dificulta a leitura do verbete... :S Aqui por exemplo: Aldea Santa María. --- Darwin Alô? 17h15min de 25 de fevereiro de 2010 (UTC)
  1. Arrumado primeiro problema. A regra q retira detecta "╦\n", mas a q sem-info adiciona ╦{{Sem. Faltou um \n ali.
  2. Faltam vários casos para colocar aí. Essa é uma predef relativamente recente. O ideal seria talvez passar essa regra para parte temática, pelo desempenho, e colocar o parâmetro da predef (qual infobox deve ser inserida). Fica mais pra frente.
  3. Aí já é com a predef. A odem está certa. Podemos mudar o layout, ou deixá-la invisível (sou a favor do invisível). Infobox não é algo q afete a validade do artigo, e um novato / leitor ocasional não saberia preenchê-la, ela serve mais para manutenção interna, e igual ao semiw deveria ser invisível. Mas ela é super necessária, em versão posterior do awb pretendo fazê-lo adicionar algumas infoboxes e preenchê-las, então já é um adianto ir colocando a predef.
  4. Nesses casos o "sem-infobox" deveria ser um "revisão|predef". Mas não achei nenhum código ali q só possa ser usado pela infobox pra poder inserir a "revisão". Vou mudar a regra pra só colocar a "sem-infobox" se não tiver a "revisão", já pularia alguns casos óbvios. Mas não vai ficar 100%. Leia "sem-infobox" como "sem a predef de infobox" e não "sem a tabela de infobox".
  5. Castro (cidade) me parece um caso válido q poderia ter uma infobox. Existe a {{Info/Assentamentos}}, q é válida para todo tipo de localidade. Então, em teoria, todo artigo de localidade pode ter infobox, e deveria ter uma.
  6. Cidade é falso positivo. Vou colocar uma exceção para a categoria q tem o identificador não terminar com "| ]]", pq isso mostra q é um artigo sobre o assunto (nunca tem infobox), e não um artigo que faz parte do assunto (teria infobox).
  7. Temos a {{Info/Biografia}}, então toda biografia pode ter infobox. Nesse caso, uso o detector == Biografia == para saber que é uma pessoa, e q pode ter infobox. Como é uma infobox simples de preencher (quase tudo deveria estar na introdução), deve ser uma das primeiras que vou fazer a regra para inserir/preencher. Toda biografia deve ter a {{Info/Biografia}}, embora algumas possam ter uma infobox mais específica.
  8. Teremos alguns falso-positivos até q todas as infoboxes sejam movidas para o nome padronizado, e as regras para correção sejam inseridas na correção de redirects. Vou colocar umas regras para detectar campos comuns da infobox, como |nome, |título, |nascimento, |país, |local, essas coisas, pra tentar pegar os casos q não estão padronizados. Mas ainda deve sobrar alguns poucos falso-positivos.
  9. Rjclaudio msg 15h13min de 26 de fevereiro de 2010 (UTC)
  • Sim, a predef é da maior utilidade, mas ela de facto deveria estar invisível, igual à sem-imagem, pois atrapalha na leitura e é mero um detalhe técnico, tal como dizes. Penso que não haverá contestação se for adoptado um formato semelhante à sem-imagem nessa aí.
  • de resto, concordo com tudo, e também que deveria ser colocado um aviso específico, diferente deste, nos casos em que há infobox não padronizada, como no Berabevú. --- Darwin Alô? 15h28min de 26 de fevereiro de 2010 (UTC)

O problema é o awb reconhecer q tem uma infobox não padronizada. Daria pra verificar se o artigo começa com {|, mas isso poderia ser uma tabela qualquer e não uma infobox. Rjclaudio msg 15h45min de 26 de fevereiro de 2010 (UTC)

Sim, tem razão... Então nesses casos deve levar o {{sem-infobox}} na mesma, certo? Vou ver se consigo alterar essa predef para que não fique tão visível no artigo. --- Darwin Alô? 16h17min de 26 de fevereiro de 2010 (UTC)

Problema com bandeiras[editar código-fonte]

Em Batalha de Cateau a substituição das bandeiras estava destruindo o layout da Infobox, aparentemente por colocar um espaço a mais. Mesmo retirando o espaço, o resultado final ficou diferente do anterior, deslocado para a direita, não percebo porquê. --- Darwin Alô? 18h34min de 25 de fevereiro de 2010 (UTC)

A única diferença que eu vi foi que na predef tem um "|border" no código da imagem. Isso talvez coloque um espaçamento após a bandeira. Mas estranhamente trocando {{IAb}} por {{FRAb}} fica normal. Talvez a IAb seja mais larga. Mas se fosse isso, daria o mesmo problema qnd só tinha o código direto da imagem. Nem imagino o que seja. Mas não é da regra. Pedindo ajuda ao café dos ... não sei, talvez programadores? Rjclaudio msg 15h26min de 26 de fevereiro de 2010 (UTC)
E o espaço a mais que ele estava colocando? --- Darwin Alô? 15h34min de 26 de fevereiro de 2010 (UTC)

O Giro720 arrumou a quebra de linha q a predef estava adicionando. Agora já está tudo certo. Rjclaudio msg 15h48min de 26 de fevereiro de 2010 (UTC)

Problemas com Portais[editar código-fonte]

  1. O awb está inserindo Arte sempre q é artigo de ator. Não dá pra reconhecer se o ator trabalhou só na Televisão, ou só no Cinema, ou nos dois, então não está inserindo o portal específico, mas o mais geral. Vc colocou Cinema, qnd deveria ter posto Televisão. Dá pra tentar alguma coisa, tentando reconhecer == Séries ==, == Novelas ==, == Televisão ==, == Filmes ==. Nesse teste deu certo.
  2. Na versão 1.11.1 desabilitei as regras de portal3 para localidades, usando cat. Passei agora o awb e não adicionou.
  3. Rjclaudio msg 15h37min de 26 de fevereiro de 2010 (UTC)

Problemas de posicionamento de secções[editar código-fonte]

  • Seria um If not ==(\r?\n)*{{Reflist  ?
  • Há o perigo da reflist estar dentro de uma seção, mas não estar no início da seção. Como um
== Fontes gerais ==
* Referência geral 1
* Livro usado 2
* Baseado no site 3

{{Reflist}}

== Ligações externas ==

Nesse caso ficaria com duas seções de referências. Faz a troca nesses casos tb?

Rjclaudio msg 15h44min de 26 de fevereiro de 2010 (UTC)

Nesse caso ele deveria substituir isso tudo por {{referências}} com o restante texto separado das refs propriamente ditas por uma linha em branco ou algo assim, e com letra small igual à das refs. --- Darwin Alô? 16h13min de 26 de fevereiro de 2010 (UTC)
Precisaria identificar corretamente o início da seção de refs. Tem tantas variações de cabeçalhos pra isso. Uma regra anterior pra padronizar o nome da seção (usar "Referências" mesmo certo?), e uma regra para isso (identificar cabeçalho -> xxx -> Reflist, trocar por {{Referências}} \n {{refbegin}} \n xxx \n {{refend}}. Vou ver a regra. Rjclaudio msg 17h23min de 26 de fevereiro de 2010 (UTC)
Sim, é isso mesmo. Há tantas variações de nome para esse cabeçalho, que era bom o pessoal ir colocando aqui os casos que vai encontrando e que não estão cobertos pelas regras deste script de AWB. --- Darwin Alô? 17h51min de 26 de fevereiro de 2010 (UTC)

Help: Referências transclusas por predef[editar código-fonte]

O AWB não detecta qnd uma predef adiciona, por ela mesma, uma referência, e com isso pode retirar a reflist por engano. Temos uma lista das predefs q fazem isso em aqui. Penso em colocar como exceção. A maioria dali só é usada por 1 ou 2 artigos, então pensei em não colocar exceção pra essas. Mas colocar exceção para as predefs mt usadas como {{Info/Freguesia da Madeira}}.

Mas mesmo assim o código precisaria ser atualizado de tempos em tempos, o que não é o ideal.

Outra opção é desabilitar essa regra q retira a {{Referências}}, deixando isso apenas para trabalhar no erro do checkwiki.

O que acham? Rjclaudio msg 18h32min de 26 de fevereiro de 2010 (UTC)

Essa ref transclusa nas freguesias da Madeira é mea culpa. Também não sei como resolver isso, sinceramente... O ideal seria uma excepção para todos os casos, não vá o AWB passar no único artigo que usa isso... O melhor, por enquanto, talvez seja deixar isso para ser resolvido via checkwiki, com AWB assistido, como dizes, e colocar essa regra como desabilitada. Se essas regras para edição assistida tivessem uma secção própria seria o ideal... --- Darwin Alô? 20h38min de 26 de fevereiro de 2010 (UTC)

Reporte de bugs[editar código-fonte]

Qnd acharem bugs, façam reporte em Usuário:Rjclaudio/AWB/Bugs, dentro da seção correspondente à versão que está sendo utilizada, e manter em ordem cronológica. Qnd eu arrumar, respondo junto a cada reporte, e crio uma nova subseção para me ajudar a organizar as coisas.

A cada nova atualização, todos os bugs dali estarão corrigidos, então já sabemos onde as regras foram mudadas. Rjclaudio msg 01h22min de 27 de fevereiro de 2010 (UTC)

Detectar gentílico[editar código-fonte]

Alguma ideia de como detectar gentílico? Trocar [[Brasil|brasileiros]] por [[brasileiros]], apenas na introdução de biografias. Uma regra genérica, pq não dá pra fazer para cada país e cada subdivisão.

Talvez com um subst em predef, se for possível, para detectar que é um país. Usando {{predef|Brasil|brasileiros}}. Se "Brasil" é um país/gentílico, então trocar por [[brasileiros]]. caso contrário manter. Só não sei se isso é viável para uma predef fazer. Sei q tem limitação pro uso do {{#switch:.

Outra opção é uma regra genérica q detecta ês]], eiros]], etc, pra saber que é gentílico. essa pode ser mais viável. Alguma ideia se isso teria falso positivo?

Dependendo da solução, se for fácil, implementamos logo, mas se for mais complexa e exigir mt teste vai ficar pra depois da versão estável.

Rjclaudio msg 02h18min de 28 de fevereiro de 2010 (UTC)

Não. Brasileiros é um artigo mesmo. ThiagoRuiz msg 02h58min de 28 de fevereiro de 2010 (UTC)

(conflito) Brasileiros tem artigo próprio. E se brasileiros tem artigo, todas as nacionalidades podem ter, então não devem ser redirect (é esconder link vermelho / dificultar criação de artigo). Se nacionalidade tem, talvez gentílicos de modo geral tb possam ter artigo próprio, ou ao menos constar em desambig. Paulista é citado na desambig, enquanto Carioca tem uma boa introdução para o termo. Rjclaudio msg 03h00min de 28 de fevereiro de 2010 (UTC)

  • Loucura isso, acho que vai dar uma bronca de todo o tamanho. Imagina trocar Défice [[brasil|eiro]] , por exemplo, pelo link para o gentílico, ficaria totalmente errado. Acho que não se deveria estar mexendo com isso, é coisa para ser feita à mão. --- Darwin Alô? 04h06min de 28 de fevereiro de 2010 (UTC)
Isso seria feito apenas no primeiro parágrafo, apenas em biografias (seja qual for o identificador), e podemos restringir para coisas como "é um [[país|nacionalidade]]" ou "é um [[profissão]] [[país|nacionalidade]]". Ou qualquer outra regra mais restritiva ainda (início do parágrafo, até o primeiro é, depois começa "é um"). Haverá uma etapa antes para padronizar a introdução, e depois fazemos esse ajuste. É possível sim fazer sem falso-positivos, se for possível identificar nacionalidade. Rjclaudio msg 15h45min de 28 de fevereiro de 2010 (UTC)
Sendo bastante restrito sim, mas andar pelo parágrafo todo da introdução não, isso gerará muitos falsos positivos.--- Darwin Alô? 15h51min de 28 de fevereiro de 2010 (UTC)

Qual dos dois métodos vc acha válido? Ou uma nova sugestão? Rjclaudio msg 16h14min de 28 de fevereiro de 2010 (UTC)

  • O Caso Paula Oliveira, que tem a predef info/Biografia, não começa, mas poderia perfeitamente começar como "é um caso de tribunal brasileiro" ou algo assim. Tenho a certeza que muitas outras situações haverão, essa é só uma que me lembro de cor. Claro que se for "é um brasileiro" penso que a substituição pode ser automatizada, caso contrário so deve ser feita em modo assistido. --- Darwin Alô? 16h39min de 28 de fevereiro de 2010 (UTC)

Vou mostrar meu esquema para a criação de regras complexas e/ou que usem recursos que ainda não são usados. Sempre que discutirmos uma nova regra complexa eu sigo esse esquema.

  1. vemos se é possível - se temos os recursos tecnológicos com o awb, com predef, com marcação, com regex, com linguagem de programação criando plugin super personalizado, etc.
  2. vemos se é viável - vale o trabalho, ficará mt pesado pro awb, terá falso-positivos que não poderão ser corrigidos de jeito nenhum, pega um conjunto grande o suficiente de casos para o benefício compensar o custo, etc.
  3. Versão teórica da regra - pensamos como a regra funcionaria, na teoria.
  4. Testar, melhorar, testar, etc.
  5. Testamos extensivamente, seguindo a ordem: com awb revisado, awb com pouca revisão, awb sem revisão mas bem limitado o número, bot revisado, bot sem revisão mas limitado o nº, tudo finalmente livre.

Nesse momento estamos na primeira parte, do é possível?. Depois disso resolvido, vamos para o é viável?.

Nesse exemplo não seria detectado se a regra só pegar "xxx é brasileiro", pq tem "caso de tribunal" no meio. Sempre dá pra restringir. Teria uma regra antes pra tentar padronizar, e várias outras coisas. Essas regras de introdução serão (bem) complexas e cansativas de testar, e por isso ainda não comecei nem os testes direito, mas te garanto que dá pra fazer sem ter nenhum falso-positivo. Dá pra fazer, nem que só detecte um único tipo de estrutura bem fixa e padronizada, como

'''%%title%%''' ([[localnasc]], [[datanasc]] - [[localmorte]], [[datamorte]]) é um [[brasileiro]].

Mais todo o "if contain" + "if not contain". Nem que isso só seja aplicado para um tipo bem específico de artigo (apenas futebolistas, se estiverem padronizados conforme Wikipedia:Projetos/Futebol/Livro de estilo#Futebolista, com todas as informações que ali constam). Esse caso dificilmente (arrisco um nunca) terá falso-positivo.

Mas deixemos o desenvolvimento da regra e todo o tratamento de erros para o futuro, queria saber primeiro se é possível ter o identificador. Se nem isso puder ser feito nem vou me preocupar com a parte complexa. Pergunto de novo, "é possível?" (e não "é viável")

Rjclaudio msg 17h10min de 28 de fevereiro de 2010 (UTC)

Sim, isso acho que sim, pelo menos para a maioria dos casos. Isso será útil, nem que seja para edição assistida. No entanto, sinceramente, penso que seria mais útil para já fazer aquelas substituições no idioma, tipo a que o Castelo quer fazer nos verbetes do Haiti. Acho que você já tinha falado nisso também. --- Darwin Alô? 18h12min de 28 de fevereiro de 2010 (UTC)

V 1.13 - testes em bots[editar código-fonte]

Reorganizei as regras para preparar os testes com bots. Assim fica mais fácil de passar de um modo (teste) para outro (bot), bastando de 1 a 3 cliques. Não devo mexer mais nos grupos principais.

  • Grupo 1 - Modo bot - as regras que estão 100% (ou quase). O atual "Padrão" + "Temáticos" antigos - as regras q tem erros ou são novas
  • Grupo 2 - Modo personalizado - regras sem consenso (na maioria, tags de manutenção)
  • Grupo 3 - Modo revisão - regras que nunca ficarão 100% (aquela q retira a ref-section), e regras usadas em modo auxiliar (marca alguma coisa e coloca instrução do que precisa ser feito --> futuro, em especial para EAD)
  • Grupo 4 - Modo teste - nosso caso. testar as novas regras que acabaram de ser criadas ou receberam um reporte de bug recentemente.
  • Grupo 5 - Finalizando - finalizar as edições e auxiliar na criação de regras. Desmarcando, Ícones Usados (preciso atualizar essa lista), Regras antigas e futuras

De hoje até terça/quarta serve pra detectar algum problema com essa reorganização. Se estiver tudo ok, quarta/quinta começamos os testes com os bots. Minha ideia é trabalhar com algum interessado em algum assunto. O bot passa de madrugada em 100 artigos, e o usuário interessado no assunto revisa as 100 edições, faz o reporte. se tiver erro, arruma, tira a regra do modo bot, e continua. se estiver ok, faz + 100 no dia seguinte. Até que possamos aumentar de 100 para 200, 300, e finalmente retirar os limites.

Rjclaudio msg 16h36min de 28 de fevereiro de 2010 (UTC)

Pelo que pude perceber hoje, algumas regras implementam o Acordo Ortográfico de 1990 (idéia->ideia, trema), que pelo que me disseram no canal do IRC, não devem ser usadas nas porções já existentes de artigos, só ao adicionar informações, ou na criação de novos artigos. Não seria melhor remover estas regras? Daemorris discussão 18h10min de 1 de março de 2010 (UTC)

Estava mesmo agora a falar com a Beria no MSN, que me disse o mesmo, mas tenho a sensação que essas mudanças são mesmo para serem implementadas em todos os artigos a partir de Janeiro passado, como continuação da aplicação do AO aqui na Wiki. Vou tentar encontrar a documentação relevante, mas sei que o caso foi falado na Esplanada. --- Darwin Alô? 18h37min de 1 de março de 2010 (UTC)
  • Achei, está aqui: Ortografia/Tentativa de consenso 2009. Se alguém disse isso, certamente foi por desconhecimento. Na verdade, todos os bots já deviam estar a trabalhar nessas alterações, a última das quais ficou efectiva a partir de hoje. Se o script do Rjclaudio ainda não muda vôo para voo, a partir de hoje já pode mudar. O trema está abolido desde 5 de Janeiro, e o idéia desde 1 de Fevereiro, já. --- Darwin Alô? 18h43min de 1 de março de 2010 (UTC)
  • A sua implementação — a ser gerida, acima de tudo, com o recurso a robôs -> não deixa margens para dúvidas. A alteração é para ser generalizada, não apenas em novos artigos ou na adição de novo conteúdo. --- Darwin Alô? 18h46min de 1 de março de 2010 (UTC)

Pode haver alguns problemas com a substituição, ao fazer a troca em links e nomes próprios, em imagens, url, etc. Ainda tenho q melhorar a regra antes de expandir ainda mais para pegar outros casos. Rjclaudio msg 22h00min de 1 de março de 2010 (UTC)

Minha única dúvida era quanto à validade de utilizar as novas regras, já estou verificando cada alteração em busca de pequenos erros. Obrigado pelos esclarecimentos. Daemorris discussão 22h16min de 1 de março de 2010 (UTC)
A implementação da nova fase foi lembrada ainda há pouco na E/A[5], mas eu já tinha visto a nota anterior sobre o mesmo assunto, e só voltei aqui à Wiki aí por dia 15. Acho estranho terem dito isso no IRC, certamente alguém pouco informado. --- Darwin Alô? 23h13min de 1 de março de 2010 (UTC)

LE futebol (2)[editar código-fonte]

Cláudio, ninguém se manifestou, por mim podemos (você!) implementar conforme meus comentários lá no lugar específico. O que der para fazer será ótimo. Será um grande avanço. Tenho feito alguns ajustes de categoria manualmente, mas poderiam ser feitos via AWB. Inclui lá este detalhe, se puder adicioná-lo também. Abraços Mwaldeck msg 00h25min de 2 de março de 2010 (UTC)

predef sem-infobox[editar código-fonte]

Na versão 1.14, ele troca {{Sem-infobox}} por {{Sem infocaixaSem-infobox}} Bitolado (discussão) 22h17min de 2 de março de 2010 (UTC)

  • Corrigido

Comecei a usar o awb em modo bot pós-revisão. Fiz 500 edições na madrugada e revisei todas elas agora. Não tive praticamente nenhum problema. Agora não usarei mais o "modo teste", apenas o "modo bot" para testar essas regras e liberar pros bots.

Rjclaudio msg 13h01min de 7 de março de 2010 (UTC)

Predefinições de bandeiras[editar código-fonte]

O script está aplicando as predefs de bandeiras apenas nas imagens que tem tamanho até 39px, escolhido por mim aleatoriamente (20 acima e abaixo do tamanho da predef, 20px).

Qual limite vocês preferem? 40px? 50px? 80px?

Rjclaudio msg 14h56min de 13 de março de 2010 (UTC)

Versão estável x versão testes[editar código-fonte]

Lançando atualização para confirmar se não fiz nenhuma mudança desastrosa no modo bot. Se até domingo não tivermos problemas, lanço a versão 2.0

Vou dividir a página de download em 2, uma para a versão estável e outra para a versão de testes. Assim quem usar apenas a estável pode vigiar só esse link sem se preocupar com as atualizações para os testes.

As versões 2.1, 2.2, 2.3, etc, serão sempre correções do modo bot, sendo atualizado os dois links de download. Se não tiver atualização no modo bot, as atualizações serão 2.0.1, 2.0.2, 2.0.3, etc, qnd for nova regra ou mudança , e 2.0.0.1, 2.0.0.2, 2.0.0.3 qnd for ajustes menores.

Criei o "modo semi-bot", que são as regras estáveis mas que não tivemos tanto tempo assim de testes então não dá pra garantir passar para o modo bot.

Rjclaudio msg 15h18min de 19 de março de 2010 (UTC)

Erro do script em predefinições[editar código-fonte]

Cláudio, achei esse erro no script. Você poderia verificar? Reverti e avisei o João, mas mantive os ajustes "corretos" do AWB. Abraços Mwaldeck msg 01h27min de 25 de março de 2010 (UTC)

O script não está 100% para páginas sem ser artigo/anexo. Coloquei algumas exceções, mas faltou algumas, como a regra de retirar tudo que estiver dentro de noinclude. Estou arrumando agora. Mas peço que ao editar páginas sem ser artigo que revejam a edição. Rjclaudio msg 04h11min de 25 de março de 2010 (UTC)
Thanks! Abraços Mwaldeck msg 04h16min de 25 de março de 2010 (UTC)
Eu iria além Rj. Digo que seu script não deve jamais ser passado em qq predef, sempre que isto aconteceu comigo foi desastroso. Nunca deixei gravar, sempre desativava as regras e fazia a modificação que eu queria. Não recomendo este script em predefs.--Lépton 10h05min de 25 de março de 2010 (UTC)
No caso citado e já não é a primeira vez em casos semelhante o script faz isso, mas a culpa principal neste caso, foi minha, porque já sabia desse problema e mesmo assim não o vi. Tenho que não usar o script quando estou com sono e provavelmente mudar as lentes dos óculos. hehe. --João Carvalho deixar mensagem 10h56min de 25 de março de 2010 (UTC)
  • O caso mais fácil é colocar a marcação de título como primeira regra de todas, num grupo só pra ela, e depois em todos os modo bot, modo teste, etc, colocar exceção usando essa marcação, se tiver nome de domínio então não executa as regras. Assim não vai ser aplicada regra nenhuma.
  • Mas aí o awb não arrumaria casos como os redirects de bandeiras. Basta ver quais as regras estão dando problema e colocar exceção pra esse grupo.
  • Por mim vemos os erros desse tipo que estão acontecendo e arrumamos as regras. Não tem pq não usar já q tem regra útil.
  • Rjclaudio msg 13h49min de 25 de março de 2010 (UTC)

Secções vazias escondidas[editar código-fonte]

Não sei se será boa política esconder as secções vazias, utilizando <!-- --> ! Estou preocupado com os novatos, que ainda percebem menos disto do que eu, e não sabem o que fazer quando encontram coisas destas. Percebo que esteticamente uma secção vazia, devia estar escondida, mas não sei se no fundo não vai trazer mais problemas do que vantagens. --João Carvalho deixar mensagem 22h31min de 26 de março de 2010 (UTC)

tendo a concordar.--Lépton 23h09min de 26 de março de 2010 (UTC)

Em Wikipedia Discussão:Projetos/Check Wikipedia#Erro 084 (Seções sem conteúdo) chegamos a discutir (tentamos) isso. Visualmente o melhor é esconder. Geralmente sou contra até a existência delas. Comentários sobre a edição do artigo e quais conteúdos devem ser adicionados (incluindo aí qual seção está faltando) deveriam estar na discussão do artigo. Caso contrário os artigos novos sobre localidades teriam metade do tamanho apenas com seções invisíveis, já que o que não falta é seção para colocar no artigo. Rjclaudio msg 20h25min de 2 de abril de 2010 (UTC)

Datas de predefs[editar código-fonte]

Esta é de menor importância, mas aqui vai (v.2.0.0):

No original:
{{Sem-notas|Dezembro de 2008}}

Alteração do AWB:
{{Sem-notas|data=Dezembro de 2008|data={{subst:CURRENTMONTHNAME}} de {{subst:CURRENTYEAR}}}} --Stegop (discussão) 06h47min de 28 de março de 2010 (UTC)

Já corrigido. No próximo bug, use Wikipedia:Projetos/AWB/Bugs, senão ele pode não ser visto (como agora). Rjclaudio msg 15h55min de 6 de abril de 2010 (UTC)

AWB e Wikificação[editar código-fonte]

Comentários para a proposta Wikipedia:Esplanada/propostas/Data da tag wikificar (6abr2010). Rjclaudio msg 16h15min de 6 de abril de 2010 (UTC)

WP:Checkwiki[editar código-fonte]

Olá, fui alertado pelo Lépton que a discussão do Rjbot deve ocorrer aqui, mas acontece que o bot aponta para o projeto WP:Checkwiki em seus sumários, por isso acabei criando um tópico lá. Os interessados, por favor acompanhem a discussão naquele tópico: [6]. —capmo 17h07min de 12 de abril de 2010 (UTC)

Predefs para substituir[editar código-fonte]

Redirects a corrigir

Alguém pode dizer o que faz o parametro |df= e |mf=? TÔ achando eles na predef data de morte e idade. Fiz testes mas não vi nenhuma diferença. Pode tirar?

--Lépton msg 19h12min de 12 de abril de 2010 (UTC)

Aqui parece que esses parâmetros não fazem absolutamente nada. Na anglófona serve para escolher se o dia ou o mês aparece antes, mas deve ter sido resto de uma má tradução, já que em pt o dia vem sempre primeiro. Acho que é isso, mas não tenho certeza. – Opraco (discussão) 20h09min de 13 de abril de 2010 (UTC)

Vlw a resposta, deve de ser isto msm, o povo tem mania de traduzir tudo que tem na en, só que se esquecem de adaptar direitinho pra nossa realidade.--Lépton msg 21h52min de 13 de abril de 2010 (UTC)

Rj, agora os listados podem ser adicionados ao código, tem mtos afluentes, já tirei todos que dava. Se atente aos parâmetros a adicionar e tirar. Fiz um teste e não dá pra adicionar eles no começo da predef, tem que ser no fim senão dá erro.--Lépton msg 19h20min de 14 de abril de 2010 (UTC)

Links em datas[editar código-fonte]

Sugiro que sejam "deslinkadas" as datas em {{Citar web}} e afins. --Stegop (discussão) 06h35min de 15 de abril de 2010 (UTC)

Stegop, penso que é o que se tem feito ultimamente. --João Carvalho deixar mensagem 18h40min de 15 de abril de 2010 (UTC)
Sim, mas o que eu queria dizer era que acho desejável que a script do RJC inclua essas regras. --Stegop (discussão) 20h02min de 15 de abril de 2010 (UTC)
OK --João Carvalho deixar mensagem 20h22min de 15 de abril de 2010 (UTC)
Melhor ir com calma, dps nego reclama... desarquivem Wikipedia:Esplanada/geral/datas (4mar2010) e vejam o que conseguem.--Lépton msg 21h12min de 15 de abril de 2010 (UTC)
Eu lembro-me dessa discussão. Eu aqui só estou a sugerir "deslinkar" datas de documentos, páginas, etc. e a data em que foram acessados. Se a generalidade de quem participou naquela discussão até concordava que só as datas relevantes deviam ser linkadas, suponho que é seguro esperar que essas pessoas não só não se oporiam como até apoiariam a eliminação de links em tais datas, que, indiscutivelmente nada teem a ver com o tema dos artigos. --Stegop (discussão) 21h38min de 15 de abril de 2010 (UTC)
Eu tbm concordo com a eliminação dos links, e acho que mta gente tbm concorda, mas lembro tbm que vc tirou o link de uma data e te reverteram... imagina um bot programado pra isto. é disto que falo.--Lépton msg 21h41min de 15 de abril de 2010 (UTC)
Olhe que eu limpo imensos links nas minhas sessões de "limpeza" e AWB assistido e é muito raro alguém reclamar... Mas por sinal, nem me lembrava que o script pode ser usado em modo bot... Não é suposto não se fazer isso com o de teste? Que tal se experimentássemos com esse? --Stegop (discussão) 21h48min de 15 de abril de 2010 (UTC)

Reflist / Referências[editar código-fonte]

O Daemorris fez uma alteração na predefinição {{Referências}}, que já permite substituir a {{Reflist}} em casos que não funcionava a substituição. Exemplo: Fraccionismo. Será possível fazer uma regra para estes casos ? --João Carvalho deixar mensagem 23h18min de 18 de abril de 2010 (UTC)

Por pura curiosidade: pelo menos no caso do Fraccionismo, usar <references /> não era a mesma coisa? --Stegop (discussão) 00h15min de 19 de abril de 2010 (UTC)
Quase, as refs não ficariam com o tamanho da fonte menor.--Lépton msg 01h09min de 19 de abril de 2010 (UTC)

Subpágina pra sugestões[editar código-fonte]

não era melhor criar Wikipedia:Projetos/AWB/Sugestões onde, como o nome ja diz, dariamos sugestões de adições ao código? Esta página devia ser só sobre o projeto própriamente, e a de bugs só para os problemas.--Lépton msg 06h04min de 23 de abril de 2010 (UTC)

Tentei fazer uma fusão de {{Artigos principais}} e {{Principal}} na mais utilizada {{Artigo principal}}, e também simplificar o uso. Quando se usava para um único artigo, como em {{Artigo principal|[[Artigo]]}}, basta agora {{Artigo principal|Artigo}} e, quando eram mais e se usava {{Artigos principais|[[1]], [[2]] e [[3]]}}, pode ser {{Artigo principal|1|2|3}}. Achei melhor pedir para adicionar nas regras daqui em vez de em WP:CR, porque não é de urgência. Dá pra fazer isso? Abraço, – Opraco (discussão) 01h41min de 29 de abril de 2010 (UTC)

A ideia parece-me excelente! Só que, ao que sei #ifexists é bem pesado para os servidores e, salvo erro, ao contrário das transclusões que preocupam tanta gente, há algures uma recomendação no sentido de ter algum cuidado na sua utilização. Ora, como essa predef tem imensos afluentes, talvez convenha tirar isso a limpo. Por outro lado, se percebi bem, o uso de #ifexists é o que está a impedir de criar os links vermelhos. Mas porque não usa #ifexists só no 1º argumento, já que é o único que existia até agora e que, por isso, precisa desse teste enquanto os bots não corrigem? --Stegop (discussão) 02h59min de 29 de abril de 2010 (UTC)
Não sabia do sobrecarregamento causado pelos #ifexists, que parece ser algo a se considerar. Mas o que me preocupa no uso dele só no primeiro parâmetro é alguma confusão que isso pode causar, pois assim, se fosse necessário um piped link, se usaria [[Artigo|Nome]] se estiver no primeiro, e nos outros seria necessário usar a {{!}} ou alguma outra forma. Uma solução que vejo é passar o código à {{Principal}}, que tem nome mais curto e é utilizada sem os colchetes, enquanto se corrigem os afluentes de {{Artigo principal}}, ou então usar a função da versão da wiki-en, com os parâmetros l1, l2, l3 etc., apesar de não gostar muito de copiar coisas de lá. – Opraco (discussão) 20h06min de 29 de abril de 2010 (UTC)
Por acaso acho que os piped links darem erro até é bom, é da forma que se "obriga" a usar o verdadeiro título do artigo. Os piped links muito úteis para o texto em geral, mas só causam confusão noutros locais. Não sei qual é a melhor forma de se fazer uma "mudança de paradigma" como este em predef.s com muitos afluentes. Assim de repente parece-me que a melhor solução é usar um novo nome e marcar {{Artigo principal}} como depreciada. --Stegop (discussão) 20h34min de 29 de abril de 2010 (UTC)

Não me atirem pedras se eu estiver falando bobagem, mas um simples {{{1}}}, {{{2}}}, {{{3}}}, etc não resolveriam sem ter que usar os colchetes e o #ifexists? Aliás, é uma surpresa saber que estes códigos tbm consomem do servidor, eu achava que não fazem nada por supor que falassem direto ao software.--Lépton msg 19h13min de 30 de abril de 2010 (UTC)

Eu estava testando nas minhas páginas de teste e consegui fazer funcionar, mas tem um problema: fica fixo o 'Ver artigo principal'. Tinha que ter um comando que fizesse isso: se especificado mais de um parâmetro, mostrar 'Ver artigos principais'. Mas aí já fica complicado pra quem não sabe usar estes comandos.--Lépton msg 20h25min de 30 de abril de 2010 (UTC)

Após a alteração, a predef já muda "artigo principal" para "artigos principais" se o segundo parâmetro for especificado. Acho que dá para tirar os ifexists do segundo ao décimo, mas pode ser melhor em vez disso mudá-la para {{principal}}, onde não seria necessário nenhum ifexist. – Opraco (discussão) 16h44min de 3 de maio de 2010 (UTC)

Ligações externas[editar código-fonte]

Tenho encontrado algumas LE da forma {{en}}-[http://www.fidh.org FIDH - Página oficial] e o script não transforma em {{Link|en|2=http://www.fidh.org FIDH|3=Página oficial}}, como ele faz quando não há o traço. Você poderia ajustar, se possível, para a próxima versão? Abraços Mwaldeck msg 03h54min de 3 de maio de 2010 (UTC)

Sugestões para bots ({{Sem fontes}} e {{Ver desambig}}[editar código-fonte]

Sugiro que sejam criadas regras para substituir:

{{Sem fontes}} está redirecionada para {{Carece de fontes}} e confunde-se facilmente com {{Sem-fontes}}
{{Ver desambig| {{{2}}}| {{{3}}}| este={{{1}}}}}
{{Ver desambig|| {{{2}}}| este={{{1}}}}}
{{#if: {{{1|}}} |{{Ver desambig||{{{1}}}}}|{{Ver desambig}}}}
{{Ver desambig |redir={{{1|}}}|1={{{2|}}}|2={{#if: {{{3|}}} |{{{3|}}}|{{{1}}} (desambiguação)}}}}
{{#if: {{{4|}}} |{{Ver desambig| {{{2}}}| {{{3}}}| este={{{1}}}| ou={{{4}}}}}|{{Ver desambig| {{{2}}}| {{{3}}}| este={{{1}}}}}}}
{{Ver desambig |1=outros significados de {{ #if: {{{1|}}} |{{{1}}}|{{PAGENAME}}}}|2={{#if: {{{2|}}} |{{{2}}}|{{#if: {{{1|}}} |{{{1}}}|{{PAGENAME}}}} (desambiguação)}}}}
{{Ver desambig |prefixo=Se procura|{{{1}}}|{{{2}}}|{{{3|}}}|{{{4|}}}|{{{5|}}}|{{{6|}}}}}

A ideia é poder acabar-se com todas as predefs.s depreciadas por {{Ver desambig}}. Espero que percebam a ideia do código. Exemplo: {{Desambigexplicada|X|Y}} é para ser substituída por: {{Ver desambig|| Y| este=X}}

--Stegop (discussão) 06h59min de 6 de maio de 2010 (UTC)
Já existe regra pra {{sem fontes}.--Lépton msg 15h34min de 6 de maio de 2010 (UTC)

Mensagem de erro no script[editar código-fonte]

O awb está exibindo uma mensagem de erro sempre que você carrega o nosso script? Seus problemas se acabaram. Pra arrumar, Menu Tools -> Make Module, coloca o código abaixo, botão Make Module.

        public string ProcessArticle(string ArticleText, string ArticleTitle, int wikiNamespace, out string Summary, out bool Skip)
        {
            Skip = false;
            Summary = "test";
            ArticleText = "░" + ArticleText;
            return ArticleText;
        }

Aconselho também que desabilitem o "general fix" pq tá dando algum erro com "destacado" e "artigo bom".

Rjclaudio msg 23h17min de 23 de janeiro de 2011 (UTC)

O erro com o destacado e artigo bom já foi resolvido há algum tempo. Já tentou baixar uma nova versão? Fabiano Tatsch 23h26min de 23 de janeiro de 2011 (UTC)

Ao que sei estou com a última versão (5.2.0.0) e tinha problemas com as predefs para os destaque e AB's noutras wikis. Depois de fazer a alteração proposta pelo RJ acima ainda não conferi se o problema se mantém. --Stegop (discussão) 23h31min de 23 de janeiro de 2011 (UTC)

Eu to com a 5.2.0.0, e se desabilitar o modulo, as regras Find and replance (ou seja, desabilita tudo, fica novinho de fábrica) e habilitar o general fix o erro se mantém. Só posso supor q seja do general fix. Passa em um artigo destacado sem salvar, se não der erro me fala q eu testo tb. Rjclaudio msg 23h36min de 23 de janeiro de 2011 (UTC)

A 5.2.0.0 ainda dá problema com os destacados. Sugiro que baixem o snapshot mais recente daqui. – Opraco (discussão) 00h07min de 24 de janeiro de 2011 (UTC)

Ah, agora sim. Vlw pelo toque. Qnd tiver uma atualização q arrume um bug desses não deixa de avisar a gente. Rjclaudio msg 00h18min de 24 de janeiro de 2011 (UTC)

Ainda estou com erro com a {{Link FA}} em Abdurrahman Wahid. Rjclaudio msg 11h53min de 24 de janeiro de 2011 (UTC)

Pode relatar o erro em en:Wikipedia talk:AutoWikiBrowser/Bugs. Fabiano Tatsch 14h23min de 24 de janeiro de 2011 (UTC)

Provavelmente é porque voltou a usar a versão antiga do AWB, já que sumiu o (7522) do sumário. O snapshot não sobrepõe a versão que tem do AWB como uma atualização normal, é necessário iniciá-lo de onde baixou. – Opraco (discussão) 23h02min de 24 de janeiro de 2011 (UTC)

Bug nas Categorias[editar código-fonte]

Usando a versão Estável: 2.2 - http://www.megaupload.com/?d=IYOQOEQR (06/04/2010) produz o seguinte erro nas categorias que começam por "banda" em minusculas, p. ex.:

  • Artigo The Amboy Dukes
  • A linha: [[Categoria:bandas de rock]]
  • Produz: [[Categoria:{{subst:ucfirst:b}}andas de rock]]

(Obs: Não salvei a alteração para poderem verificar)--JotaCartas (discussão) 09h45min de 20 de abril de 2011 (UTC)

Não é bug, é isso mesmo. É regra pra primeira letra da categoria ficar sempre maiúscula. Quando salvar vai ficar [[Categoria:Bandas de rock]]. Rjclaudio msg 14h09min de 20 de abril de 2011 (UTC)
Oops! Obrigado. --JotaCartas (discussão) 16h34min de 20 de abril de 2011 (UTC)

Alguém sabe onde é que se encontra documentação minimamente decente e útil para trabalhar com isso? Queria apenas criar uma lista com todos os artigos com "Pasha" no título, mas quando clico em "start" diz-me que tenho que abrir uma "Pages XML".

PS: Por sinal, não é só a documentação dos dumps que é miserável... Se alguém souber de algum sítio onde haja documentação ou dicas de utilização, agradeço. --Stegop (discussão) 00h28min de 27 de agosto de 2011 (UTC)

en:Wikipedia:Database download#Other languages. Faz o download de toda a wiki.pt (quase meio giga). Nunca usei isso, precisar baixar meio giga pra fazer uma busca de 800.000 títulos é um alto custo / benefício. Possivelmente exista uma ferramenta de busca de título no toolserver que dê a lista em um arquivo que vc pode usar pro o awb. Rjclaudio msg 01h16min de 27 de agosto de 2011 (UTC)

Obrigado. --Stegop (discussão) 01h35min de 27 de agosto de 2011 (UTC)
Talvez não precise baixar um dos maiores dos arquivos de dump. Esta página lista algumas opções de dumps com apenas parte das informações, por exemplo o "all-titles-in-ns0.gz", que só ocupa 6.7 MB, contendo apenas os títulos das páginas. Helder 02h16min de 29 de agosto de 2011 (UTC)

Olá editores! Fiz esta proposta no dia 23, avisei na esplanada no dia 24, mas até agora não houve participação alguma. Por isto, venho aqui convidá-los a participar. --Mister Sanderson 00h41min de 29 de setembro de 2011 (UTC)