Wikipédia Discussão:Esplanada/propostas/Conversor de idiomas para as variantes do português (30mai2010)

O conteúdo da página não é suportado noutras línguas.
Adicionar tópico
Origem: Wikipédia, a enciclopédia livre.
Último comentário: 11 de março de 2023 de Uma pergunta no tópico O que é feito disto?

Discussão[editar código-fonte]

  • Devo dizer que concordo com a proposta, e estou certo que algo assim melhoraria imenso o ambiente aqui dentro, agradando a Gregos e Troianos, e até aos Espartanos que não gostarem do sistema, que podem continuar a ver como antes. Ao tempo da discussão dos títulos de filmes, livros e obras de arte chegou a ser sugerido a aplicação de algo assim para resolver os problemas entre versões, mas infelizmente não teve continuidade. Gostaria de saber, no entanto, se é possível incluir uma terceira versão, o pt-AO vs. pt-pt, que também é causa de algum conflito, e, hipoteticamente, outras versões relacionadas com países lusófonos que actualmente têm pouca expressão no projecto, situação que pode bem mudar no futuro.--- Darwin Ahoy! 16h50min de 30 de maio de 2010 (UTC)Responder
Tenho uma consideração e duas perguntas:
  1. Citação: Tim Starling escreveu: «(...) It's only differences in grammar, such as word order, that would give it trouble.» As diferenças entre as versões da língua portuguesa não se limitam a ortografia, mas também aparecem na forma de escrever as frases (uso e colocação de pronomes, conjugação verbal e outros detalhes), de modo que, se eu entendi direito, essa alteração não vai resolver todas as diferenças entre pt-pt e pt-br.
  2. Para usar esse sistema, será preciso digitar, na janela de edição, as duas formas de escrita ou o sistema detectará automaticamente todas as palavras divergentes?
  3. Se o sistema for ativado, como serão encaradas alterações de grafia dentro de um artigo? Continuarão sendo passíveis de bloqueio?
Filipe Ribeiro Msg 18h03min de 30 de maio de 2010 (UTC)Responder
  • Então... Ainda há varias coisas para aprendermos sobre o sistema, e conforme formos aprendendo, podemos ir moldando a dinâmica de uso do mesmo... (inclusive tomando como base as páginas da Wikipédia chinesa que documentam o conversor, onde se fazem pedidos, etc... Exemplo: zh:分类:維基字詞轉換 é a categoria que reúne as páginas da Wikipédia chinesa relativas à conversão de idiomas (tradução do Google) )
  • Até onde pude ver, teoricamente é possível tratar expressões que sejam escritas de forma diferente entre as variantes, pois perguntei ao PhiLiP (da Wikipédia chinesa) se é possível ou não colocar espaços nas regras de conversão e obtive a seguinte resposta: Citação: Philip escreveu: «It's possible to use spaces inside a string. Except prefix/postfix spaces due to we have used trim() to strip the spaces.»[1]. No entanto, acredito que podemos começar com cautela, e incluir somente palavras nas tabelas (por ser mais difícil de errar), e tratar as expressões (que são mais complicadas) com a marcação manual nos artigos (onde for essencial, e não houver jeito de usar um texto neutro que não precise de conversão). Os chineses usam o recurso para duas finalidades distintas:
    1. A conversão entre os conjuntos de caracteres do chinês simplificado e do chinês tradicional (não é o nosso caso, pois o alfabeto é o mesmo entre os países);
    2. A conversão entre termos locais, que variam conforme o país (é o análogo do que podemos fazer por aqui);
  • Há essencialmente duas formas de indicar para o sistema que uma conversão deve ser feita:
    1. Conversão automática (global): Através das tabelas de conversão personalizáveis (/pt-br e /pt-pt) que ficam no espaço nominal MediaWiki, que devem listar as conversões que sempre devem acontecer (ou pelo menos na grande maioria das vezes) ao passar de uma variante para outra;
    2. Conversão "manual" (nos artigos): Diretamente no código wiki usando a marcação -{pt-pt:versão portuguesa; pt-br:versão brasileira; pt-mz:versão moçambicana; etc:...}-, que permite tratar tanto os casos mais complexos encontrados em artigos específicos, quanto indicar eventuais exceções às regras gerais colocadas nas tabelas do MediaWiki;
  • A ideia das tabelas de conversão personalizáveis é que sejam criadas e mantidas segundo o próprio modelo wiki: a partir da colaboração de todos. Haverá uma página onde a comunidade poderá fazer as solicitações de acréscimos/remoções de regras às tabelas (que são editadas apenas por administradores). A Wikipédia chinesa adota um procedimento desta natureza, e podemos nos inspirar nas páginas deles. Esta dinâmica de tratar as regras caso a caso é natural, e já está surgindo espontaneamente na discussão (/pt-br e /pt-pt) das regras esboçadas nas tabelas;
  • Na wikitech alguém já havia questionado a aplicabilidade deste sistema à língua inglesa, apontando que "as diferenças entre o inglês americano e o britânico não se limitam à ortografia e ao vocabulário".[2] Este é um caso típico em que a marcação manual nos artigos seria a melhor escolha[3]. Se em determinado artigo é conveniente que determinada frase em português brasileiro seja convertida para uma frase específica do português europeu, bastaria colocar ambas dentro da sintaxe de conversão manual do Conversor de Idiomas. Em geral, os autores devem optar pela escolha de palavras, expressões e frases relativamente "neutras", no sentido de serem bem aceitas em quaisquer variantes e, nos casos em que isso seja difícil, basta incluir duas ou mais variantes para o trecho em que isso é necessário, usando -{}- para que continue podendo ser lido nas variantes preferidas pelos leitores. Podemos perguntar aos desenvolvedores se seria (provavelmente é!) prejudicial ao desempenho do sistema irmos acrescentando às tabelas do MediaWiki as "frases" (curtas?) mais comuns que sempre são convertidas de uma variante para outra. Caso isso não seja realmente um problema, conforme a comunidade fosse identificando tais frases que merecem ser sempre convertidas, as mesmas seriam adicionadas aos poucos às tabelas.
  • Sobre sua segunda pergunta, a impressão que tenho é que o código wiki das páginas pode ter quaisquer palavras (em pt-pt, pt-br, ou qualquer outra variante), como já é feito atualmente, e se a tabela de conversão do MediaWiki correspondente à variante escolhida pelo leitor possuir uma regra para converter algumas daquelas palavras, elas serão convertidas. Só seria preciso escrever em duas variantes aquilo que não fosse convertido automaticamente com base nas tabelas.
  • A princípio, não vejo problema em um editor trocar uma palavra (projeto) pela correspondente na outra variante (projecto), mas não seria construtivo se alguém trocasse uma marcação correta do tipo "-{pt:versão européia; pt-br:versão brasileira}-", por um código wiki como, por exemplo, "versão brasileira", no qual a conversão deixaria de ser feita. Helder14h16min de 31 de maio de 2010 (UTC)Responder
Mas nós usamos aqui pelo menos três variantes de português (pt-pt AO e sem AO, e pt-br). É possível usar o sistema com essas três variantes?--- Darwin Ahoy! 14h28min de 31 de maio de 2010 (UTC)Responder
  • A princípio, acho bom pensarmos nesta conversa como um brainstorm e talvez supor que "tudo é possível" até que identifiquemos aquilo que é desejável, o que é essencial, o que pode ficar para depois, e também o que os desenvolvedores não recomendam que seja feito... Digo isso pois mesmo após um consenso sobre o que queremos, é preciso que isso seja viável para que haja chance de sermos atendidos ao fazer um pedido no bugzilla:.
  • Eu perguntei mais umas coisinhas para o Philip, e depois de obter resposta dele espero que possamos entender melhor alguns detalhes para ver a melhor forma de lidarmos com o Acordo Ortográfico no caso de Portugal. Por hora:
    1. as conversões para pt-br é simples: tanto as palavras "pt-pt com AO" quanto as "pt-pt sem AO" podem ser convertidas para "pt-br" (com AO, já que no Brasil está valendo), bastando que ambos os tipos de regras sejam inseridas na tabela /pt-br (as que já estavam no Wikicionário eu já coloquei no primeiro esboço da tabela, mas pode haver outras). Aliás, pode ser útil (ou não, o que acham?) separarmos a tabela de conversões para pt-br em seções que identifiquem quais são as regras "pt-pt (Conforme o AO) => pt-br" e quais são as "pt-pt (Antes do AO) => pt-br", para facilitar a manutenção. Notem que os chineses separam as regras em seções e subseções segundo vários critérios: exemplo (tradução do Google).
    2. No caso das conversões para pt-pt (tabela /pt), pode-se simplesmente omitir as regras que fariam mudanças do tipo "pt-pt (Antes do AO => pt-pt (Conforme o AO)", pelo menos até que o AO esteja em vigor também em Portugal. Isto seria algo razoável? Helder15h12min de 31 de maio de 2010 (UTC)Responder
  • Para a nossa conveniência, separei a tabela de conversões para pt-pt, de modo que por enquanto as regras do AO de 1945 sejam aplicadas para quem selecionar pt-pt.

Não quero concordar com algo assim. O que tá sendo discutido em Wikipedia Discussão:Versões da língua portuguesa/Tentativa de consenso serve pra que msm? Será que os lusófonos são tão imaturos que não conseguem conviver com a mínima diferença? É o que parece, qq problema já pensam em 'se separar', ou neste caso, evitar conviver com o que é diferente. A TdC que apontei resolverá o problema, cada variante será respeitada, e não acredito que precisaremos disto.--Lépton msg 03h30min de 1 de junho de 2010 (UTC)Responder

Lépton, o problema não é assim tão simples, e não se resume à proposta do Manuel (que continua valendo, obviamente). Títulos de filmes, livros e obras de arte, e vocabulário técnico e científico, são dois casos em que vejo uma óbvia utilidade na utilização deste sistema. De resto, uma coisa é conviver com a diferença, outra é ser-se forçado a tomar para nós próprios essa diferença, que é o que acaba por acontecer aqui. Acho muito interessante que no Brasil chamem ácidos graxos aos ácidos gordos e Moscou a Moscovo, mas é cansativo, desagradável e desgastante estar constantemente a fazer uma ginástica mental para alternar entre as variantes nos artigos e tentar perceber o significado de termos diferentes entre versões, forçando muitas vezes buscas adicionais que distraem do objectivo primeiro da leitura. Se isso puder ser minimizado para quem o desejar - quem não gostar continua como antes, como já foi dito - só vejo pontos positivos.--- Darwin Ahoy! 04h14min de 1 de junho de 2010 (UTC)Responder

Gosto do ponto de vista do Tetraktys[4]: Citação: Tetraktys escreveu: «permitir a opção livre pela variante que o editor estiver acostumado dá uma diversidade interessante à wiki e não favorece paroquialismos». Seria algo bom (?) se por padrão

  1. Os artigos exibissem aos leitores o texto com toda essa diversidade resultante da variedade de nacionalidades contribuindo na wiki, ao mesmo tempo em que
  2. Fosse possível que os interessados vissem as mesmas páginas exlusivamente em pt-pt ou pt-br, sem ter que alterar o conteúdo do artigo?

No momento, eu tenho a impressão de que sim, e é este o tipo de possibilidade (benefício?) que o Conversor de Idiomas pode nos trazer.

Ainda poderia considerar que:

  • Qualquer edição que se limitasse a alterar a grafia de uma variante para a outra, seria desconstrutiva (e dígna de reversão, como se faz atualmente); mas
  • Qualquer edição que aprimore o conteúdo, alterando ou não a grafia do trecho aprimorado conforme sua necessidade pessoal ao escrever, seria construtiva (e sem razão para ser revertida, mesmo parcialmente).

Isso me parece correto pois, no fim das contas, o português encontrado pelos leitores dos artigos lusófonos seria:

  • "Misto" para quem não fizesse questão de escolher entre uma variante ou outra (por não se sentir incomodo ao se deparar com as pequenas diferenças durante a leitura?);
  • "Uniforme" (exclusivamente em uma das variantes) para quem quisesse ou precisasse ler o texto usando termos de uma determinada variante (talvez para facilitar a leitura, ou para a criação de um trabalho derivado, ou por outros motivos), e que para isso fizesse sua escolha ao interagir com a página (fosse na página de preferências ou através de um link);

O que pensam sobre isso? Helder22h14min de 2 de junho de 2010 (UTC)Responder

Isto é muito bonito e muito pratico... Se funcionar. Mas o problema das diferenças não é só nos Cs e companhias é muito mais do que isso, como já foi dito acima Citação: Filipe Ribeiro escreveu: «As diferenças entre as versões da língua portuguesa não se limitam a ortografia, mas também aparecem na forma de escrever as frases (uso e colocação de pronomes, conjugação verbal e outros detalhes)», eu acrescento ainda, termos e expressões, também. Ou seja, as palavras tais como agouce/talho aeromoça/hospedeira cuecas/calcinha (sem contar que os brasileiros também usam o termo cuecas o que dificultaria a tradução), terno/fato (o que complica com o fato-br que por Portugal é facto), e assim por diante. Ou seja é muito mais complicado, pois teríamos que criar um tradutor inteligente que decidisse se uma determinada alteração está certa ou não. Em relação à variante Angolana (pt-ao), que também seria muito prática, devo dizer que ela é um pouco uma mistura da variante pt-br com a pt-eu, ou seja, de forma geral segue a pt-eu na forma gramatical, mas nem sempre, à situações em que a conjugação verbal é semelhante ao pt-br, e depois claro está o uso de K, W e Y, em algumas palavras e palavras que se dizem de forma diferente como favela/bairro da lata/musseque ou ônibus/autocarro/maxibombo e pior do que tudo isso, as expressões idiomáticas que essas ninguém as entende e muitas vezes nem existe termo de comparação. Pelo Poder do Z Alaf Ogimoc 03h33min de 3 de junho de 2010 (UTC)Responder

Concordo com a proposta e vou acompanhar seu desenvolvimento. Acredito que vale a pena investir na tecnologia de uma tabela de conversão do MediaWiki de modo a incluir ao máximo as variações de idioma. Pelo que entendi a conversão é flexível podendo ou não incluir algumas palavras de modo a enriquecer o texto mostrando ao leitor as variantes existentes para estas palavras. De um modo geral, a proposta resolve muito mais problemas do que cria. Entretanto, minha preocupação é em relação a inclusão futura de uma terceira variante, no caso a angolana. Quanto mais rápido tivermos uma resposta a respeito dessa possibilidade melhor. Abraço lusófono! AbçOTAVIO1981 (discussão) 12h49min de 3 de junho de 2010 (UTC)Responder

  • Tenho uma dúvida: é possível que as conversões sejam feitas na janela de edição também? É que imagino que seria desconcertante para os editores lerem um trecho de um artigo que pretendam melhorar, e depararem-se com texto diferente na aba de edição. A versão do wikitexto a gravar após uma edição seria a versão anterior (não convertida) mais os trechos novos/alterados (diff), possivelmente incluindo palavras em grafia diferente. Outra alternativa (talvez mais simples) seria converter sempre o texto automaticamente para pt-AO antes de gravar. O que acham? --Waldir msg 14h15min de 3 de junho de 2010 (UTC)Responder
Excelente ideia. Sugiro só que as variações respeitantes ao acordo ortográfico não sejam incluídas por enquanto. Não vale estarmos a preocupar-no logo com o C de "projecto", quando ele está prestes a desaparecer. Dá para começar com só uma meia dúzia de palavras para ver se resulta?JF (discussão) 21h36min de 3 de junho de 2010 (UTC)Responder
Também acho uma excelente ideia! Vou acompanhar a evolução deste projeto com atenção. Um abraço, -- Manuel de Sousa msg 16h32min de 4 de junho de 2010 (UTC)Responder
  • Japf, embora as tabelas de conversão esboçadas já incluam um bocado de regras (pois era relativamente fácil converter as tabelas do Wikicionário para o a sintaxe adequada), parece-me que quando as tabelas fossem criadas no (ou movidas para o) espaço nominal MediaWiki, poderíamos ser prudentes e ir acrescentando regras aos poucos até nos acostumarmos com o funcionamento. Conforme adquirirmos maior segurança, e identificarmos melhor os casos em que o sistema funciona bem, adicionam-se outras regras (provisoriamente ou não) e o conversor vai se tornando mais preciso com o tempo. Assim como o OTAVIO1981, acredito que as tabelas de conversão são bastante flexíveis, e este é um ponto importante para que a utilidade e a eficiência do conversor seja crescente com o tempo, a partir da própria participação da comunidade.
  • Waldir, acho que é bom tentarmos fazer um teste diretamente na Wikipédia chinesa, para entendermos melhor o funcionamento do sistema na prática. Por exemplo, podemos procurar a página de testes deles e copiar uns dois parágrafos de um artigo que seria escrito diferentemente conforme as variantes, e usarmos a marcação -{pt-pt:versão portuguesa; pt-br:versão brasileira; pt-mz:versão moçambicana}- para indicar as diferenças. Como tais variantes ainda não existem no MediaWiki, podemos assumir momentaneamente que "pt-pt" seja representado por "zh-hans", "pt-br" por "zh-hant", e assim por diante. Pode ser uma experiência instrutiva para entendermos melhor o funcionamento (Atualizando: fiz um teste aqui, caso queriam conferir). Ah, Waldir, um outro comentário na wikitech parece indicar que atualmente não é feita a conversão do conteúdo da caixa de edição. Mas isso pode não ser desconcertante (realmente não sei), pois, por exemplo, se (1) o texto misto é o exibido para os leitores que não escolhem uma variante específica e (2) o mesmo leitor resolve editar, então o que ele encontra é o texto que estava lendo, eventualmente com alguns trechos inseridos na marcação -{pt-pt:<isso>; pt-br:<aquilo>; etc:...}-, que é por si só auto explicativa. O comentário do link também pode significar que, caso fosse muito desejado, seria possível implementar algo que também fizesse a caixa de edição receber conversão automática... Mas se com a experiência percebermos que algo assim nos seria útil, é melhor nos informarmos melhor la na lista :-).
  • JF, podemos separar as regras que são específicas para as mudanças feitas por causa do Acordo Ortográfico, e não incluí-las por enquanto. Eu não fiz a separação ainda pois as tabelas foram convertidas praticamente de forma automática a partir do Wikicionário, mas assim que alguém tiver um tempinho, isso pode ser feito.
  • Outro ponto que considero importante é que o conversor pode ser pensado como algo complementar ao que já é feito na Wikipédia. Então, para aqueles problemas que ele resolve melhor do que quaisquer regras ou recomendações que possamos ter ou vir a criar, que ele seja usado. E para os problemas que se mostrarem intratáveis por um sistema automatizado baseado em tabelas (unidirecionais e bidirecionais) de conversão, adotam-se as opções que já existiam tradicionalmente (bom senso, recomendações, regras, políticas, ...). Por enquanto vejo mais vantagens do que problemas, por isso acho que vale a pena experimentarmos. Se nossa conversa mostrar o contrário, continuaremos sempre buscando novas opções, repensando as possibilidades, etc... Helder13h05min de 7 de junho de 2010 (UTC)Responder
Citação: Helder escreveu: «algo complementar ao que já é feito na Wikipédia.» Perfeito Helder! Não devemos encarar o conversor como uma ferramenta definitiva para solucionar os impasses a respeito da variante a ser utilizada num artigo. OTAVIO1981 (discussão) 13h16min de 7 de junho de 2010 (UTC)Responder
Sabe... Acho que essa é uma daquelas coisas que só se resolve com experimentação pratica. Não é nem de longe uma solução definitiva, no entanto quanto mais próximo do vocabulário local a texto estiver melhor será, pois menos pessoas tentarão corrigir o texto e assim será possível focar nas modificações que forem de fato controversas, como tantas que foram citadas acima.
Raylton P. Sousaoi 15h51min de 11 de junho de 2010 (UTC)Responder


Provavelmente o Conversor de Idiomas não se torne uma "solução para todos os problemas", então seria demais esperar isso do recurso, antes mesmo da comunidade adquirir maior familiaridade com ele. Sendo assim, estou dividindo a proposta em subitens, para tentar facilitar uma aceitação progressiva dos mesmos, através de discussões intermediárias durante a passagem de uma para a outra. Uma ordem que me parece natural no momento é a seguinte:

  1. Ao mesmo tempo:
    1. Realizar a configuração do Conversor de Idiomas para as variantes do português: como o MediaWiki é utilizado não só pela Wikipédia, mas também por outras wikis da Wikimedia Foundation, e wikis externas em geral, esta etapa consite de definirmos as configurações gerais do sistema, para que se possa criar (em PHP) a classe LanguagePt que habilitaria o uso das tabelas de conversão e da sintaxe manual de conversão pelas wikis que assim desejarem. O conversor é habilitado por padrão e, uma vez configurado para tratar as variantes do português, ele não faria nada até que fossem criadas efetivamente as páginas do espaço nominal MediaWiki com tabelas de conversão ou fosse adicionada alguma marcação manual nas páginas, ou mesmo em predefinições (como as infoboxes);
    2. Ampliar os esboços das tabelas de conversão já esboçadas e criar as demais para outras variantes;
  2. Criar as tabelas no espaço nominal MediaWiki (onde produzem algum efeito), através da inclusão progressiva (ou remoção) de regras de conversão globais sugeridas pela comunidade, ao mesmo tempo em que a sintaxe seria permitida para tratar casos mais simples (a definir o que significam). Poderia passar a ser usada, por exemplo, em algumas predefinições (como infoboxes, e outras onde apareçam pequenas expressões que podem ser covertidas sem problema). Esta etapa também inclui o refinamento das tabelas globais, pois pode acontecer de adicionarmos regras que tenham muitos falsos positivos e tais regras atrapalhariam mais do que ajudariam. Com o tempo, as tabelas convergem para uma versão mais estável, e pode-se passar a uma terceira etapa;
  3. Movimentação de regras que sejam válidas para as wikis em geral diretamente para o código fonte (eu vi que nos outros idiomas: há tabelas definidas diretamente no código fonte), para que outras wikis não precisem recriá-las. Isto também deixaria mais limpas as nossas tabelas locais. Helder20h39min de 11 de junho de 2010 (UTC)Responder

Alterações gramaticais[editar código-fonte]

Perguntas que não se calam na minha mente:

1. como se vai evitar os erros de construção gramatical? Porque a regência e concordancia das orações é diferente em alguns casos.
2. O que se vai fazer com o gerúndio (praticamente inexistente em pt-pt)? Béria Lima msg 17h33min de 4 de junho de 2010 (UTC)Responder

Beria escusa de falar no assunto, porque é mais do que óbvio que estão todos a ignorar esses problemas, basta ver a falta de respostas ao que eu disse, e ao que também foi dito anteriormente sobre o assunto. Pura e simplesmente estão a passar uma borracha sob o assunto, pois já perceberam que não tem solução e por isso varrem o problema para baixo do tapete. Pelo Poder do Z Alaf Ogimoc 19h04min de 4 de junho de 2010 (UTC)Responder

É evidente que essas diferenças só se resolveriam se fossem feitos dois (ou mais) textos alternativos. A minha opinião é de que um português brasileiro bem escrito não é diferente de um português europeu escrito com o mesmo cuidado. O grande problema é que se escreve muito mal. Um mau português europeu parece outra língua quando comparado com um mau português do Brasil.
O conversor de idiomas só poderá servir para palavras ou expressões curtas, contribuindo para atenuar diferenças tais com diferenças na acentuação (gênero/género), a palavra "secção/seção" que aparece em todo o lado, o modo diferente de articular certas preposições (até o fim/até ao fim) ou mesmo a completa divergência da nomenclatura química (íon/ião).JF (discussão) 21h25min de 4 de junho de 2010 (UTC)Responder
O uso do gerúndio faz parte da língua portuguesa e não é considerado erro por ninguém. Já a regência e concordância, mesmo correctamente usada pode provocar estranheza, mas deve ser considerado grave. Muito graves são erros comprovados, mas muito correntes como "à ele", "que apresenta-se" ou "apresentar-mos", mas este é outro problema.JF (discussão) 21h38min de 4 de junho de 2010 (UTC)Responder

Meu caro lá por o gerúndio estar correcto gramaticalmente, não quer dizer que se use e como tal que não seja uma total aberração em português europeu, mais se acha que esta frase, "os angolenhos se recuperaram de um gol tomado no início do jogo e no finalzinho da segunda etapa, um golaço de Kader Keita deixou a torcida sem esperança de o seu time ir à copa do mundo mesmo que o zagueiro tenha deixado empatar nos descontos" é dizer o mesmo que "os angolanos recuperanram-se de um golo marcado no inicio do jogo e bem perto do final da segunda parte um golão de Kader Keita deixou os adeptos sem esperança para que a sua equipe possa ir ao campeonato do mundo apesar de o guarda-redes ter permitido o empate no prolongamneto", então meu caro, você não precebe patavina (traduzindo: não percebe nada) das diferenças das variantes linguisticas. Se calhar para você "cutucar a onça com vara curta", deve ser igual a "picar a onça com vara curta", em ves de ser "quem semeia ventos colhe tempestades". Mas enfim... Por aqui ve-se de tudo.

PS: Sem contar com estas diferenças: "Salazar era amigo de Cerejeira" - "Salazar era amigo do Cardeal Cerejeira", "Bosco foi um grande missionário" - "Dom Bosco foi um grande missionário", "o rei João II" - "El Rei Don JoãoII", etc. São estes pequenos nadas que tornam este programa impraticável.

O que eu tenho visto aqui é a tentativa de criar um programa que apenas corrija erros gramaticais entre as variantes e para isso não é preciso porque já existe um o AWB. Pelo Poder do Z Alaf Ogimoc 22h52min de 4 de junho de 2010 (UTC)Responder

Zorglub, todas estas diferenças seriam facilmente pontuadas e alteradas com esta ferramenta. Palavras como Gol/golo, goleiro/guarda-redes, copa do mundo/campeonato do mundo, torcida/adeptos já fariam parte da tabela de conversão do MediaWiki enquanto casos mais complicados como descontos/prolongamneto deveria ser incluídos nos próprios artigos. A vantagem, é que todos os artigos diretamente relacionados ao futebol já teriam as principais palavras alteradas automaticamente, além dos acentos e algumas expressões. Acho que vale a pena investir na idéia pois irá deixar todos os artigos mais acessíveis aos leitores. Abç OTAVIO1981 (discussão) 11h14min de 5 de junho de 2010 (UTC)Responder

O problema é mesmo falta de compreensão, será que vocês sabem mesmo ler? Não percebem que o maior problema não são nem os Cs, nem as palavras diferentes (as quais se podem construir links para melhor entendimento), é a estrutura gramatical das frases que é completamente diferente? Ainda não perceberam que os brasileiros escrevem de maneira completamente diferente do resto da lusofonia? Como é possível haver entendimento entre os leitores do lado de lá do atlântico e os do lado de cá, se os próprios editores da wiki, que convivem diariamente com isso, não entendem?

A ferramenta será uma boa ferramenta sim, mas para permitir mais facilmente adaptar uma variante linguística a um determinado artigo, ou seja, como ferramenta para os editores, mas pura e simplesmente não serve nem nunca servirá para fazer uma tradução automática para os leitores.

A comparação, absurda por sinal, que li mais acima sobre "se os chineses conseguem, porque é que nós não" demonstra um total desconhecimento do que é o "chinês vs chinês simplificado" e do que são as diferenças na lusofonia. São coisas completamente distintas e que não têm a mínima comparação. Pelo Poder do Z Alaf Ogimoc 11h36min de 5 de junho de 2010 (UTC)Responder

Caro Zorglub

O exemplo os angolenhos .... é um exemplo do mau português que existe na wikipédia. Isto não é português brasileiro escrito, é a transcrição literal do português falado no Brasil, e qualquer pessoa instruída reconhece que "angolenhos", "finalzinho", "golão" e uma frase tão grande sem pontuação não é correcto. O conversor de idiomas talvez o ajudasse a compreender que foi o defesa e não o guarda-redes que deixou empatar o jogo. As sugestões do Octávio1981 são perfeitamente adequadas ao conversor de idiomas.

"Cutucar a onça com vara curta" e "quem semeia ventos colhe tempestades" embora correctos são provérbios que devem ser evitados numa enciclopédia. "El rei D. João II" é já um arcaísmo em Portugal, por isso "O rei D. João II" não choca ninguém. Quanto a títulos nobiliárquicos veja o artigo Dom, onde me parece que as regras do Brasil são as mesmas que as portuguesas, como o artigo sobre Odilo Scherer parece exemplificar. Assim, mais uma vez você citou erros e não variantes da língua. Volto a afirmar que um português bem escrito é aceitável em qualquer versão. O conversor de idiomas servirá em princípio para diferenças entre palavras e obviamente não terá e não deverá ter como função mascarar completamente a diferença entre as variantes da língua. Os erros ortográficos e gramaticais não fazem parte do objectivo do conversor de idiomas.JF (discussão) 12h29min de 5 de junho de 2010 (UTC)Responder

Quer dizer que no Brasil se fala "angolenhos"? Isso é um dos maiores disparates que já ouvi neste projeto (e olha que concorrentes à altura não faltam...). "Angolenhos" é tão errado aqui quanto em Angola ou Portugal. RafaAzevedo disc 13h01min de 5 de junho de 2010 (UTC)Responder

Como sempre, em vez de se focarem no plano global, focam-se em pormenores sem importância, e meus caro, em Portugal Rei é sempre com letra grande da mesma forma que se usa o Dom e o Cardeal nos nomes, são formas de respeito que tem a ver com a cultura e não com a língua (algo que pelo visto não tem no Brasil) e o facto de se utilizar um arcaísmo como El, para vocês significa que os portugueses é que têm que mudar porque não choca ninguém, mas o facto de no Brasil se usarem arcaísmos, como açogue ou plantilha, entre outros, já não precisam mudar, porque ficavam ofendidos. Como sempre, dois pesos, duas medidas. "O maior cego é aquele que não quer ver", por isso não vale a pena vir aqui dar mais opiniões ou fazer comentários. Passar bem Pelo Poder do Z Alaf Ogimoc 14h23min de 5 de junho de 2010 (UTC)Responder

Se é para vir aqui dar palpites insólitos como este da "plantilha" (palavra que nem mesmo é listada pelo Dicionário Houaiss), ou despejar mais da sua recorrente xenofobia ("algo que pelo visto não tem no Brasil"), o melhor é nem vir aqui mesmo... RafaAzevedo disc 14h31min de 5 de junho de 2010 (UTC)Responder

Você gosta mesmo de provocar né? Vou só responder-lhe desta vez e ignoro-o a partir daqui porque não estou para entrar em conflitos.

  1. Se vocês escrevem mal a culpa não é minha, eu aprendi palavras como "angolenho", "plantilha" entre outras, com os carisimos editores brasileiros da Wikipédia, pois nunca estive no Brasil e conheço poucos brasileiros pessoalmente.
  2. Quem aqui é xenófobo são aqueles que têm a mania que sabem tudo e chamam os outros de xenófobos, por não admitirem que os outros têm razão. Nunca na vida fui xenófobo e apenas o sou na boca de incompetentes que nem sabem o que a palavra significa e a ficam a usar de maneira abusiva, sempre que alguém refere as diferenças linguísticas entre o Brasil e a restante lusofonia e pelos vistos o hábito pega-se e todos começam a usar a palavra.
  3. O maior problema que graça aqui na wiki, são os brasileiros com "complexo de Vasco da Gama" (que caso não saiba é o termo usado para os brasileiros que se sentem inferiorizados perante o antigo colonizador, algo de que felizmente os angolanos não sofrem), com a mania que são reis e senhores e que tudo sabem, mas que a única coisa que fazem é mandar bocas infantis em vez de dizerem algo produtivo.

Para finalizar, Como já estou farto de aturar situações destas pura e simplesmente vou começar a ignorar estas pessoas sempre que se puserem com afirmações baratas com o único intuito de provocar os outros. Quanto a si caro Rafa, não o consigo entender, pois parece sofrer de dupla personalidade, pois tantas vezes é um editor competente e compreensivo, como rapidamente vira um provocador barato, dá-me a ideia às vezes que RafaAzevedo é de facto mais do que um utilizador que apenas utilizam o mesmo nome de usuário (outra palavra que aprendi aqui), mas enfim, é apenas a minha modesta opinião que não sou ninguém por aqui, mesmo quando falo de factos relevantes no intuito de tentar ajudar. Atenciosamente (e colocando ponto final, parágrafo na conversa) Pelo Poder do Z Alaf Ogimoc 15h36min de 5 de junho de 2010 (UTC)Responder

Como eu disse antes, se é pra vir aqui fazer esse papelão era melhor nem ter vindo mesmo... RafaAzevedo disc 15h41min de 5 de junho de 2010 (UTC)Responder

Este conversor de idiomas possui o objetivo de trazer informação na variante em que o usuário utiliza, evitando edições desnecessárias e inclusive brigas por causa da linguagem. E só a acrescentar, no Brasil utiliza-se Dom, Cardeal e Rei em letra maiúscula. Mário Júnior (discussão) 19h32min de 18 de junho de 2010 (UTC)Responder

Tipos mais comuns de correções[editar código-fonte]

Alguém sabe dizer qual o "tipo" mais comum de alteração entre variantes aqui na Wikipédia? No Wikilivros a mudança de frases ou parágrafos inteiros é incomum, mas as "correções" que colocam ou tiram um "c", ou que mudam o acento em uma ou duas palavras são bem mais comuns. Estes últimos tipos de edição (que talvez seja a maioria?) provavelmente não aconteceria com tanta frequência com o sistema em funcionamento, pois pelo menos a correspondência entre as palavras cuja ortografia é diferente entre as variantes é fácil de se incluir nas tabelas de conversão (e uma boa parte já está feita). Então se, de fato, este é o tipo de alteração mais comum de uma variante para a outra, aqueles que as fazem teriam menos motivação para fazê-las, já que os artigos já estariam sendo lidos na variante que a pessoa prefere. É claro que eu posso estar enganado, mas é o meu palpite... Helder14h16min de 31 de maio de 2010 (UTC)Responder

Mais uma vez, não devemos incluir como primeiras tarefas palavras que vão deixar de ter dupla grafia depois da adopção do AO1990, como projecto/projeto ou ideia/idéia.
Sei por experiência própria que as palavras que mais confusão fazem são os nomes de cidades e países, mas geram tanta polémica que é melhor não começarmos por aí.
Tirando os tipos de palavras dos parágrafos anteriores sugiro as seguintes:
  • género/gênero e todas as com diferente acentuação
  • secção/seção
  • mil milhões/bilhões
  • utilizador/usuário
  • canadiano/canadense
  • israelita/israelense
  • húmido/úmido
  • golo/gol

JF (discussão) 20h56min de 11 de junho de 2010 (UTC)Responder

Só para constar, apesar de eu ter colocado inclusive as regras que não terão utilidade depois do acordo (como o caso das palavras que deixarão de possuir grafia dupla), isso foi aconteceu apenas para evitar ter de fazer a tabela manualmente: os primeiros esboços são praticamente as tabelas do wikcionário, em outra sintaxe (pois usei localizar e substituir, com expressões regulares, para trocar o código wiki das tabelas por setas, por exemplo).
Eu tentei separar as regras que já estão lá, para que fique fácil remover as que não terão uso por causa do AO, mas posso ter deixado passar alguma coisa. É bom revisar.
Tendo esclarecido isso, eu Concordo que as regras que não serão úteis depois da adoção do AO não são prioridade.
PS: Hipoteticamente, o que se usaria (atualmente, sem conversor nem nada) nos artigos da Wikipédia sobre futebol se fosse preciso usar o plural de gol (gols, goles, golos ou gois), e o artigo precisasse usar a variante brasileira? E se precisasse estar na variante portuguesa? Se a resposta a uma das perguntas for uma só palavra, esta pode ser inserida numa regra global para conversões para aquela variante (não necessariamente para as demais, pois as tabelas de conversão não precisam ser simétricas). Mas se em ambos os casos há mais de uma opção, provavelmente é melhor não inserir uma regra global. Helder21h48min de 11 de junho de 2010 (UTC)Responder
A palavra "gols" é uma aberração (de facto, impronunciável para quem não vocaliza o "l", pronuncia o s final como ch e se recusa a recorrer a vogais epentéticas), mas faz parte da versão brasileira da língua portuguesa, portanto é legítima. A regra de conversão ptbr->ptpt será gol-> golo, gols->golos e gois->golos sem problema nenhum. "goles" e "gois" não deverão ser modificados, porque poderão cair em falsos positivos.JF (discussão) 22h57min de 11 de junho de 2010 (UTC)Responder
Ah! Falta a conversão inversa, de ptpt para ptbr. Finalmente entendi a sua dúvida. Já que "gol" tem 4 plurais, qual deverá corresponder a "golos"-ptpt? Este de facto, não deve entrar nos primeiros exemplos.JF (discussão) 23h03min de 11 de junho de 2010 (UTC)Responder
Obrigado por esclarecer minha dúvida! =D Adicionei "gols => golos" lá na tabela. Fique a vontade para adicionar outras regras...
Tenho outra questão: onde se usa "gois" (com g minúsculo) sem ser plural de gol? Helder02h57min de 12 de junho de 2010 (UTC)Responder
Imagine que alguém escreva o apelido Góis sem acento.JF (discussão) 05h25min de 12 de junho de 2010 (UTC)Responder

Uma opinião (pouco técnica)[editar código-fonte]

Li e tentei assimilar tanto quanto possível a complexidade do problema/solução e achando uma ideia válida, irei segui-la com toda a atenção. No entanto gostaria de focar alguns pontos:

  1. O problema com o português não se aproxima nem de perto nem de longe da complexidade/importância do problema com o chinês ...
  2. ... nem sequer das grandes diferenças das variantes do inglês que são bem maiores do que as nossas (digo eu) ...
  3. ... que eles parece terem resolvido com duas ou três regras bastante simples;
  4. acredito na tecnologia, e que esta pode resolver muitas coisas (fui informático toda a vida), mas quando as pessoas não querem ... nada se pode fazer.

Assim, creio ser necessário que toda a comunidade pt.wikipedia aceite algumas regras (ainda que simples e defeituosas) como a que está em discussão e a partir daí todo contributo da tecnologia será benéfico e aproveitado ao máximo. Tem todo o meu apoio. --JotaCartas (discussão) 03h28min de 18 de junho de 2010 (UTC)Responder

Obrigado por comentar! Alegre
A proposta é de certo modo uma iniciativa no sentido de ampliar o uso do conversor de idiomas entre as demais línguas, que ainda parece ser subutilizado por desconhecimento do seu potencial/flexibilidade. Se quiser, veja também a proposta sobre wikis em vários dialetos, na wiki de planejamento estratégico da Wikimedia. Helder19h04min de 19 de junho de 2010 (UTC)Responder

Conversor e o AO[editar código-fonte]

É assinalado como desvantagem do conversor a possível inconsistência de algumas variantes. Não vejo porquê, pois o AO foi adoptado, e o papel do conversor é complementa-lo para as expressões que têm variantes em diferentes países ou comunidades. Segundo o AO, "econômico", "económico", "gererenciamento", "gestão", "contábil" e "contabilístico" estão todos correctos. Mas algumas destas palavras não são familiares a leitores pt-pt ou a leitores pt-br. As actuais regras para as variantes não conseguem resolver o problema de inconsistência nos termos usados em conjuntos de artigos dentro de uma categoria.

Não vejo que o AO constitua algum problema ou ponto fraco para o conversor. Tudo o que já li leva-me a crer que o conversor será uma ferramenta fundamental, e que os possíveis problemas que possa ter são muito inferiores aos da actual situação. Quando podemos começar? Dreispt (discussão) 17h26min de 19 de junho de 2010 (UTC)Responder

Entendo seu ponto de vista...
Talvez o AO nem seja mesmo algo problemático, pois a forma de lidarmos com ele praticamente independe dos recursos que o conversor fornece: a comunidade é quem decide quais regras colocar nas tabelas de conversão para cada variante. Então se os falantes de determinada variante preferirem adotar o AO, é só colocar regras que o levem em consideração, senão, basta usar regras que reflitam a norma anterior ao AO.
Coloquei uma seção mais abaixo para comentar o que podemos ir fazendo para acelerar a implementação. Helder19h04min de 19 de junho de 2010 (UTC)Responder

Depois do AO estiver em vigor, não haverá qualquer problema. Durante o período de transição é que devemos ter cuidado. Por exemplo "eletrônico" em pt-br deverá mudar para "electrónico" (antes do AO) ou para "eletrónico" (depois do AO). Enquanto estivermos no período de transição ambas são possíveis, mas acho que não vale a pena mudar para "electrónico" para depois um ano depois mudar para "eletrónico". Ou seja é melhor evitar palavras que mudem com o acordo por enquanto. Quanto a podermos começar, acho que se deve colocar a proposta o mais depressa possível, porque apesar de uma boa ideia não me parece que ela seja aceite. Por isso, quanto mais cedo a proposta for feita, melhor, para evitar trabalho desnecessário.JF (discussão) 18h45min de 19 de junho de 2010 (UTC)Responder

Qual é o procedimento para "oficializar a proposta" por assim dizer? Deve ser colocada em algum lugar específico? Aberta votação? (desculpe pela pergunta de novato...) Helder19h04min de 19 de junho de 2010 (UTC)Responder
JF - é ignorância minha mas não sabia que o AO prescreve que "eletrônico" passará a "eletrónico"! Estou com esse problema com as palavras "econômico" e "económico". Os validadores do AO dozem-me que ambas as ortogtafias são AO-correctas. Pode confirmar se "económico" será a forma a utilizar com o AO? Obrigado. Dreispt (discussão) 09h53min de 21 de junho de 2010 (UTC)Responder

Implementação[editar código-fonte]

Respondendo a pergunta que o Eduardo me fez, e a pergunta do Dreispt na seção anterior, gostaria de acrescentar que quem implementa efetivamente o recurso são os desenvolvedores do MediaWiki (os que geralmente trocam ideias na lista de discussão wikitech), depois de realizarmos o pedido no bugzilla:. Eu só estou tentando dar uma ajudinha com o que sei sobre o conversor... Alegre

Como parece haver um bom apoio da comunidade, resta definir algumas configurações do conversor (parte técnica), e para isso o que falta é confirmar alguns aspectos do funcionamento dele para ter certeza do que tem que ser pedido aos desenvolvedores. Como comentei na discussão do OTAVIO1981, estou aguardando que um colaborador da wiki chinesa (que também desenvolve partes do MediaWiki) me esclareça certas dúvidas (algumas delas listadas no final da página da proposta).

Acho que também seria bom se antes do pedido ser feito já dispuséssemos de uma página "oficial" de ajuda sobre como usar o conversor, e também uma página para lidar com os pedidos de adição ou remoção de regras, tira dúvidas, etc... Isso por enquanto está sendo feito na discussão das tabelas esboçadas, mas deveria possuir página própria (seguindo exemplo da wiki chinesa). Para isso podemos tomar como base parte do que já está documentado na própria proposta juntamente com o conteúdo das páginas de ajuda que existem na Wikipédia chinesa e no Meta (listadas no fim da proposta). Qualquer ajuda neste sentido será bem vinda! Haha Helder19h04min de 19 de junho de 2010 (UTC)Responder

Bom apoio onde? Há dias que há pessoas a fazer perguntas sobre o caso (as minhas por acaso ainda não foram respondidas). Ignorar críticas não é responde-las, portanto não vejo o "bom apoio" que dizes. E não vais conseguir implementar um elemento do MediaWiki aqui sem uma votação que confirme que a comunidade tem consenso sobre o asssunto. Béria Lima msg 11h22min de 20 de junho de 2010 (UTC)Responder

Faço minhas as palavras da Beria, não só não responderam às minhas duvidas, como ainda fui enxovalhado e insultado, por isso me retirei da discussão, e acrescento veemente, pelo menos o meu apoio não têm. Pelo Poder do Z Alaf Ogimoc 14h40min de 20 de junho de 2010 (UTC)Responder

Béria.

Se precisa tanto de repostas aqui vão: De modo algum poder-se-à criar um plataforma automática que lide com todas as diferenças gramaticais (incluindo diferente uso do gerúndio) entre as duas versões do português. É demasiado complicado, e esse não é o principal objectivo deste projecto. Aliás, diferenças gramaticais, embora importantes, não são a diferença que mais estranheza provocam. Para mim, "se poderá" ou "poder-se-à" significam o mesmo, mas "zagueiro", "goleiro" ou "beque" só me faz vir o pensamento de "que é isto" à cabeça. Não posso dizer que fases até onde poderá chegar este projecto se ele for avante, mas acho que ao menos deveríamos dar-lhe uma oportunidade de poder ser testado.

E claro, concordo consigo quando diz que este projecto não tem tido grande apoio. Está na hora de arranjar um modo de divulgar este projecto à comunidade. JF (discussão) 17h53min de 20 de junho de 2010 (UTC)Responder

O conversor não eliminará todas as diferenças entre variantes mas poderá atenuar uma parcela. Com o avanço da informatica, é possível que no futuro mais condições possam ser incluídas e a ferramenta se tornará mais compatível ainda. O que podemos afirmar no momento, é que uma grande quantidade de palavras será convertida e se for o desejo da comunidade até algumas condições gramaticais, pois a conversão de "se poderá" para "poder-se-á" é possível. Segundo o Helder, tabelas com menos de 50kb funcionam perfeitamente a nossa no momento tem 11kb, se não estou enganado.ABç OTAVIO1981 (discussão) 23h13min de 20 de junho de 2010 (UTC)Responder
Japf, se não elimina gerundio, e não corrige concordancia e regência, esse projecto serve para que mesmo? Para os casos obvios de "António/Antônio", "gol/golo" e etc? Não vejo vantagem numa emenda que fica pior que o soneto. E Otavio, não é uma questão de avanço de informática, é simplesmente que o programa não vai conseguir perceber a regência e concordancia das coisas para corrigir. Ou quando deve corrigir o gerúndio ou não. Já agora, em casos de nome próprio, acento não muda coisa alguma: Se alguém nasceu "António" é antónio tanto em portugal quanto no Brasil. Já pensaram como o programa vai saber que aquela palavra deve ficar na forma original? Béria Lima msg 00h24min de 21 de junho de 2010 (UTC)Responder
Béria, o conversor fará o que nós mandarmos ele fazer. Num primeiro momento só os casos mais óbvios fariam parte da tabela do MediaWiki e boa parte dos ajustes de de regência e concordância provavelmente serão feitos manualmente. A experiência na utilização do recurso e os avanços da informática possibilitarão sim que mais recursos sejam convertidos automaticamente ao invés do método manual. E mesmo assim, se o conversor corrigir uma palavra automaticamente de modo incorreto, pode-se incluir uma marcação manual para a palavra correta ser exibida e estes casos devem ser analisados para tentar melhorar a lógica do programa. Claro, tudo isso dá trabalho e não será da noite pro dia que o programa funcionará perfeitamente. Mas a vantagem do leitor visualizar o artigo na variante preferida de modo perfeito é inegável, basta ter boa vontade de trabalhar com o conversor no modo manual. Abç OTAVIO1981 (discussão) 01h10min de 21 de junho de 2010 (UTC)Responder
Béria, há certas frases em pt-br que tenho que pensar bem o que significam. Imagine uma máquina fazer isso. Mas coisas simples como palavras que são completamente diferentes nas duas versões como "goleiro"/"guarda-redes" poderiam ser facilmente resolvidas.

Se acha que está tudo bem como está, tem todo o direito de ter a sua opinião.JF (discussão) 10h10min de 21 de junho de 2010 (UTC)Responder

Citação: OTAVIO1981 escreveu: «Tabelas com menos de 50kb funcionam perfeitamente a nossa no momento tem 11kb, se não estou enganado». Na verdade a estimativa dada pelo Tim Starling foi de que a versão atual do programa funciona bem com algo da ordem de 50000 pares de conversão (do tipo "original => convertido"), e que se for preciso o código pode ser otimizado para lidar com milhões de pares. As regras esboçadas até agora não chegam nem a 800.

Me parece que uma coisa não está muito clara: o Conversor de Idiomas é apenas a parte do MediaWiki responsável por interpretar a sintaxe wiki usada nas tabelas globais de conversão e na marcação manual dos artigos. As conversões que ele faz ou deixa de fazer são escolhidas pela comunidade de cada wiki, de cada idioma e cada variante. Em outras palavras, o programa não faz nada se não o mandarmos fazer:

  1. Se não o habilitarmos, a parte da sintaxe wiki que é interpretada pelo conversor (-{}-, por exemplo) não terá (como nunca teve) qualquer significado nesta wiki.
  2. Se o habilitarmos, mas não o mandarmos fazer coisa alguma, tudo ainda continuará como está atualmente, com as políticas, recomendações e procedimentos atuais, até que se deseje testar a sua aplicação em algum caso real, com tabelas reais (no espaço nominal MediaWiki).
  3. Se o mandarmos converter algo cuja associação entre variantes é obvia (ortografia, por exemplo), ele fará a correção e tal caso óbvio deixará de ser um problema.
  4. Se o mandarmos converter entre expressões mais complexas (concordância, gerúndio, expressões, ...), ele o fará, mas somente depois que alguém sugerir tais conversões.
  5. Se percebermos que determinada regra de conversão pode ter muitas exceções, opta-se entre:
    1. Indicar as exceções nos (poucos) artigos onde for necessário;
    2. Remover tal regra da tabela (se for repleta de exceções), ou não colocá-la caso as exceções sejam percebidas durante o pedido da comunidade.
    3. Criar predefinições como a zh:Template:CGroup ou a zh:Template:NoteTA (não lembro qual das duas), para usar em grupos artigos de uma área específica na qual determinados termos tem significado especial ("rato" em informática é uma coisa, em biologia é outra)
  6. Se depois de meses e anos refinando e aprimorando as tabelas o sistema de conversão estiver impecável, ótimo. Se não, sempre há espaço para continuar melhorando-as, ou para sugerir aos desenvolvedores a implementação de novos recursos mais adequados a comunidade lusófona...

Esta proposta está focada essencialmente nos dois primeiros itens desta lista (que valem para wikis em geral). Os restantes são colocados em prática em um ciclo contínuo conforme as vontades de cada comunidade onde o conversor esteja habilitado. Assim, o conversor (pelo que já foi colocado) não piora nada, e melhora a situação daqueles casos que a comunidade incluir nas tabelas e nos artigos. Mas sem tê-lo funcionando, não há como testar e aprimorar regras de conversão, e consequentemente fica mais difícil de imaginar quão bom ou ruim ele pode vir a ser para determinada wiki.

As tabelas que foram começadas são apenas um esboço, para exemplificar a forma de criar tais tabelas e o tipo mais básico de regras que podem ser adicionadas às mesmas. Qualquer um pode editar aqueles esboços, inclusive incluindo regras mais complexas do que os casos óbvios que importei do Wikcionário, e removendo as que não são boas regras de conversão (e que por isso não deviam ter sido importadas). O tempo disponível só nos permitiu esboçar as regras mais simples até agora (essencialmente os ajustes na ortografia e a conversão de alguns vocabulários específicos - digamos, os que causam "mais estranheza"). Se começássemos pelo mais complicado, provavelmente demoraria mais até que aparecessem alguma regra esboçada. Em todo caso, a criação e aprimoramento das tabelas que dão funcionalidade ao software é algo que funciona melhor na prática, como o Raylton falou lá em cima.

Quem quiser testar o recurso antecipadamente, pode simplesmente instalar o MediaWiki em seu computador pessoal, e configurar o conversor colocando o código PHP já esboçado nos lugares adequados, enquanto não houver consenso sobre habilitá-lo por aqui.

Citação: Béria escreveu: «A regência e concordancia das orações é diferente em alguns casos.» Poderia apresentar um exemplo do que descreveu? PS:Agradeço o esclarecimento sobre o consenso.

Alguém (preferivelmente quem vê mais problemas com na proposta) poderia me fornecer um exemplo típico de artigo que parece intratável com o conversor, por diferir demais entre duas variantes do português, para que eu possa compreender melhor os aspectos mais problemáticos da ideia?

Ahh, me desculpem por não saber contar (quantos estavam contra), e por demorar a responder algumas vezes (época de provas na universidade), se os ignorei não foi por mal... A resposta para algumas das perguntas também depende de maior familiaridade com o sistema, e com o nosso próprio idioma, e com as críticas que tem sido feitas.

Helder22h52min de 21 de junho de 2010 (UTC)Responder

Esta análise de artigos intratáveis é especialmente importante para localizar as exceções das regras e tentar localizar as melhores alternativas de solução. Abç OTAVIO1981 (discussão) 17h40min de 22 de junho de 2010 (UTC)Responder
O que parece é que a dificuldade principal é quando uma expressão numa versão pode resultar em duas noutra dependendo do contexto. Por exemplo, aproveitando a minha frase anterior, em pt-br escreve-se "em um", mas em pt-pt tanto se pode escrever "em um" como "num". Outros exemplos pode ser "meu"->"meu" ou "o meu"; "até o"-> "até o" ou "até ao"; "falar"->"dizer" ou "falar". JF (discussão) 17h53min de 22 de junho de 2010 (UTC)Responder
JF, não entendi nada dos seus exemplos. Gostaria que me explicasse o seguinte: Citação: JF escreveu: «tanto se pode escrever "em um" como "num"», ora se tanto faz um quanto o outro creio que este não seja o melhor exemplo de diferença de variantes. Foi falado em algum canto das discussoes recentes, por exemplo, que em Portugal não se utiliza o gerúndio, embora gramaticalmente possa estar correto. Deixo a pergunta aos falantes do pt-pt: Existe alguma situação onde o gerúndio é utilizado? Qual?
Abç OTAVIO1981 (discussão) 18h34min de 22 de junho de 2010 (UTC)Responder
OK! Explico-lhe na sua página de discussão.JF (discussão) 12h04min de 23 de junho de 2010 (UTC)Responder
Eu próprio faço mau uso do gerúndio, por isso deixo uma dica do ciberdúvidas.[5]
Além disso, o mais provável é que a comunidade não vá querer adicionar regras globais de conversão para palavras cuja "tradução" em outra variante tenha duas (ou mais) possibilidades. Se for desejável fazer a correspondência nestes casos, utiliza-se a marcação manual nos artigos onde onde isso for necessário. E se determinada conversão manual é adequada em vários artigos de sobre um mesmo tema, basta seguir o mesmo procedimento usado pelos chineses e criar uma predefinição para este grupo de artigos, como citado na página de discussão de uma das tabelas. Em geral as tabelas globais fazem mais sentido para regras que não possuem exceção. Helder19h53min de 22 de junho de 2010 (UTC)Responder

Estive a ver página de discussão e começou logo bem. Mônica vs Mónica, com esta pérola fabulosa, Mônica é Mônica tanto em Portugal como no Brasil, por isso os nomes não se traduzem. Verdade mas... O problema é que os nossos caros colegas brasileiros, quando editam temas sobre os outros países lusófonos, estão-se pouco importando que os nomes não se escrevam como eles estão habituados, o que significa (e é fácil de verificarem isso) que nos artigos sobre outros países lusófonos os nomes estejam escritos de forma abrasileirada. Aqui está mais uma situação em que o conversor se demonstra completamente falho e inútil. Pelo Poder do Z Alaf Ogimoc 20h11min de 22 de junho de 2010 (UTC)Responder

Nota: "Mônica" só apareceu na tabela de exemplo pois o conteúdo inicial foi importado do Wikicionário, onde consta a correspondência. O que deve ser feito é conferir aquela lista, para ir removendo o que não faz sentido, e adicionando o que faz. Uma vez observado que não se muda o nome de pessoas só porque se mudou de variante, tal regra não seria inserida nas tabelas globais de conversão, e isso não seria um problema. Por outro lado, se em algum momento acharem que faz sentido em algum caso particular fazer a conversão de um nome, usa-se a marcação manual no artigo onde isso é adequado, sem que a marcação afete qualquer outro caso em qualquer outro artigo. Helder20h36min de 22 de junho de 2010 (UTC)Responder
Duas observações:1)Zorglub, caso não tenha reparado já foi observado na página de discussão que o conversor de idiomas não deverá ser aplicado a nomes de pessoas. O nome de localidades está sendo analisado pois acredita-se que seria útil para alterar alguns nomes como Moscou // Moscovo. 2)O conversor não será utilizado para "consertar artigos", é mandatório que o artigo esteja escrito corretamente para que as regras de conversão (principalmente as gramaticais) possam ser utilizadas. Abç OTAVIO1981 (discussão) 11h31min de 23 de junho de 2010 (UTC)Responder

Otavio, por acaso você leu o que escrevi ou só passou os olhos por cima? Foi exactamente isso que refutei, o terem decidido que não seria usado para nomes, partindo do principio, completamente errado, que os nossos caros colegas brasileiros, não abrasileiraram os nomes portugueses, o que uma leitura rápida por alguns artigos prova o contrario, ou seja, ou se põem os nomes a serem traduzidos automaticamente ou, resumindo, todos os nomes tem que ser revistos manualmente. É claro que seria muito mais fácil se o programa consegui-se reconhecer a origem dos artigos, mas isso é pedir muito... Pelo Poder do Z Alaf Ogimoc 15h05min de 23 de junho de 2010 (UTC)Responder

Talvez não seja pedir muito, Zorglub. Poderia me explicar o que quis dizer com "reconhecer a origem dos artigos"? Helder13h16min de 24 de junho de 2010 (UTC)Responder
Zorglub, se o sujeito se chama Luís de Camões deve ser escrito como tal e não devem ser admitidas variantes como Luis de Camões, Luiz de Camões, Luíz de Camões. Portanto, se existe artigos em que o nome próprio foi "abrasileirado" convém apresentar fonte fiável do biografado e realizar a troca. Abç OTAVIO1981 (discussão) 13h24min de 24 de junho de 2010 (UTC)Responder

Res, non verba[editar código-fonte]

Ou, como costuma dizer em Portugal, "muita parra e pouca uva". Vem nos Lusíadas o conhecido episódio dos "velhos do Restelo", que anunciavam que a viagem de Vasco da Gama para Índia iria cair em desgraça ainda esta não tinha começado.

A conclusão da discussão até ao momento, é que os argumentos contra têm sobretudo a ver com o pormenor da execução. Sobre o concetualmente fazer sentido uma ferramenta de conversão (abstraindo da dificuldade ou possibilidade da implementação), pareceu que a maioria não é contra; ou, pelo menos, não vi argumentos convincentes contra..

Se não for é assim tão claro, então que se discuta se a ferramenta faz sentido e se se deve avançar para um beta, mas a discussão não deve entrar nos pormenores técnicos. Deve restringir-se ao fazer sentido ou não.

Mas se parecer claro que, por princípio, não há objecção maioritária a um projecto de teste em beta, que não afecte o site principal, então que se implemente o conversor em beta, e se discuta nessa sede as dificuldades e soluções. Depois que seja levado a discussão geral se o projecto está apto para sair do beta. Dreispt (discussão) 08h09min de 24 de junho de 2010 (UTC)Responder

Acho uma idéia interessante utilizar a ferramenta num período de testes. Isto facilitaria os testes e tornaria os argumentos para uma eventual aprovação mais sólidos. Da utilidade da ferramenta, gostaria de ressaltar os seguintes pontos:
  • O conversor não solucionará em definitivo os problemas dos textos mistos, com duas ou mais variantes. A intenção é que seja mais uma ferramenta disponível para o editor atenuar as diferenças existentes, criando um texto flexível a todos os leitores.
  • Não será de nenhum modo obrigatório o uso do conversor. Assim como qualquer outra ferramenta, quem não quiser, não precisa utilizar.
  • As dificuldades técnicas para utilização sempre existirão. Somente com o aprendizado será possível tornar a ferramenta mais amigável aos editores menos experientes.
Acho que as vantagens já estão bastantes claras e vale a pena tentar. Abç OTAVIO1981 (discussão) 11h10min de 24 de junho de 2010 (UTC)Responder
Apoiado. Muitas dúvidas poderão ser esclarecidas num teste em "beta."JF (discussão) 12h45min de 24 de junho de 2010 (UTC)Responder
Ter o recurso disponível para testes na prática também me parece interessante (mas esta minha opinião é inevitavelmente parcial =P)
Uma opção para permitir os tais testes seria habilitá-lo aqui na Wikipédia com uma política ou recomendação inicial de que
  1. Ninguém é obrigado a adicionar conteúdo em mais de uma variante (isso é algo que possivelmente não mudaria nunca, independente de estar em teste ou não)
  2. Seja usado apenas onde for essencial para a compreensão de um artigo em determinada variante (isso pode ou não ser provisório)
  3. Seja usado inicialmente para tratar a mudança de vocabulário (que engloba os casos mais simples de conversão). Isso não impede que quem quiser faça testes mais elaborados em sua subpágina de usuário;
  4. Adicionar (via javascript) ao menu de seleção de variantes que aparece no topo das páginas um link extra apontando para uma página de ajuda (a criar), cujo texto poderia ser algo como "Sobre a conversão entre variantes (beta)". Isso permitiria que os leitores experimentassem as versões convertidas e possam opinar sobre como aprimorar o sistema, pois o feedback e a participação coletiva é essencial para que ele fique cada vez melhor, ou que se mostre inadequado ao nosso idioma;
A habilitação do recurso não afeta o "site principal" no sentido de que quem (1) não clica no menu de seleção de variantes nem (2) seleciona uma variante específica nas preferências, continua vendo o texto das páginas como estão atualmente, mesmo que outros colaboradores já estejam testando a adição de código wiki adicional em alguns artigos e já estejam tentando aprimorar tabelas globais de conversão.
Alguém imagina outras possibilidades para que o recurso pudesse ser testado sem ser muito intrusivo durante uma fase beta? Tem novas críticas? Helder13h11min de 24 de junho de 2010 (UTC)Responder


Gostaria muito de começar. Por exemplo, dentro da categoria de Economia e Negócios temos uns artigos com "econômico";"gerenciamento", e outros com "económico";"gestão". Estava até tentado a fundir os artigos num do tipo "Pensamento econômico ou económico";"Gestão ou gerenciamento de projectos". Mas julgo que a solução do conversor seria muito superior. Que passos seguintes são necessários? Dreispt (discussão) 14h12min de 24 de junho de 2010 (UTC)Responder

Dúvida[editar código-fonte]

Será necessário fazer a conversão de títulos de filmes, livros e games em inglês? Ex: Finding Nemo => Procurando Nemo (pt-br) - Á Procura de Nemo (pt-pt). Harry Potter and the Chamber of Secrets => Harry Potter e a Câmara Secreta (pt-br) - Harry Potter e a Câmara dos Segredos (pt-pt). After the Thin Man => A comédia dos acusados (pt-br) e O homem sombra (pt-pt). Ou não precisa? Será que é muito complexo esse tema? Edward Henrique (discussão) 23h06min de 19 de junho de 2010 (UTC)Responder

Edward, os títulos dos artigos permanecem no original. Na introdução do artigo serão apresentadas as traduções existentes e ao longo do artigo pode ser feita uma conversão manual do título para adequar a versão do leitor. Abç OTAVIO1981 (discussão) 15h06min de 20 de junho de 2010 (UTC)Responder

Exemplos[editar código-fonte]

Peço que aqui os colegas editores coloquem exemplos de frases de artigos em pt-br ou pt-pt para que possa ser analisado como serão feitas as conversões. Trago, como exemplo, uma guerra de edições bem recente que poderia ser facilmente evitada com o conversor pois a palavra objetivo / objectivo, fruto da guerra de edições, poderia perfeitamente fazer parte da tabela do mediawiki. Abç OTAVIO1981 (discussão) 11h46min de 23 de junho de 2010 (UTC)Responder

Pequeno comentário. Essa guerra de edições era injustificada, visto que prevalece sempre a versão original.JF (discussão) 12h35min de 23 de junho de 2010 (UTC)Responder
Concordo com você. Nem sequer me dei ao trabalho de verificar qual seria a primeira versão pois isso não convém ao caso aqui. O exemplo torna-se importante apenas para ilustrar a utilidade do conversor. Abç OTAVIO1981 (discussão) 13h00min de 23 de junho de 2010 (UTC)Responder
Ainda não achei um artigo contendo alguma frase que não possa ser tratada com a nova sintaxe -{pt-br:palavra ou expressão brasileira; pt-mz:palavra ou expressão moçambicana; etc:...}-.
Alguém poderia me ajudar com algum(ns) exemplo(s)? (melhor ainda se for com um diff entre as versões) Helder13h22min de 23 de junho de 2010 (UTC)Responder
Uma palavra tão simples como rato (pt-pt). Em pt-br será rato, mouse ou camundongo?
Em qual contexto/artigo? O editor que for realizar a marcação de um artigo com -{}- estará lendo a frase na qual a palavra rato está inserida, e saberá que pode colocar
"O -{pt-pt| rato:pt-br; mouse:}- óptico não é uma invenção tão moderna quanto parece" no artigo Rato (informática)
mas que não tem porque colocar
"Os -{pt-pt| ratos:pt-br; mouses:}- são conhecidos especialmente pelo risco à saúde", no artigo Rato (animal)
Este é o tipo de coisa que se faz nos artigos, e não nas tabelas globais.
Uma analogia, talvez não muito boa: tentar colocar coisas assim (que dependem fortemente do contexto) nas tabelas globais seria como tentar criar uma tabela que adivinhasse quando determinadas palavras devem aparecer em negrito em um artigo: seria difícil de fazer funcionar direito!
São os editores (e não o MediaWiki) que sabem identificar quando a palavra deve estar em negrito (e que colocam '''este código''' onde necessário, para dizer ao MediaWiki o que negritar), e serão os mesmos editores que saberão quando uma palavra deve ser convertida ao mudar de uma variante para a outra e para qual palavra da outra variante deve ser feita a conversão (e que colocarão -{pt-pt| português:pt-br; brasileiro:}- onde for necessário, para dizer ao MediaWiki quando e onde converter).
As tabelas globais serão aprimoradas continuamente pela comunidade, conforme os editores percebam que estão fazendo vez após outra certas marcações manuais de conversão em muitos artigos (o que sugeriria que a regra poderia ser global, para não precisar ser repetida em outros artigos, e que -{eventuais exceções seriam colocadas assim}-).
Isso deixa as coisas mais claras? Há outros exemplos que não poderiam ser tratados desta maneira? Helder14h18min de 23 de junho de 2010 (UTC)Responder

Que tal uma frase bem simples? Já que estamos no mundial aqui fica:

  • (pt-br) Quatro classificados para as oitavas de final da Copa do Mundo da FIFA 2010 serão conhecidos nesta terça-feira.
  • (pt-br trd pt-eu) Quatro classificados para as oitavos de final da Mundial de Futebol FIFA 2010 serão conhecidos nesta terça-feira
  • (pt-eu) Os quatro classificados para os oitavos de final do Mundial de Futebol FIFA 2010 serão conhecidos esta terça-feira.

A tradução fica bonita não fica? Pelo Poder do Z Alaf Ogimoc 15h16min de 23 de junho de 2010 (UTC)Responder

Trata-se claramente de um caso a ser tratado como exceção, ou seja, não fará parte da tabela do MediaWiki. Para esta situação, a wiki chinesa tem uma predefinição que funciona como um pacote de palavras, que será incluido aqui por tema (Futebol, Química, Harry Potter, etc) onde seria possível realizar flexões de gênero. Em relação a supressão do artigo "Os" no início da frase em pt-br acredito que seja um erro, pois acho que a norma culta da língua indica que deve ser utilizado. Quanto a isso, melhor deixar um professor de português explicar. O que posso dizer do tal pacote é que seria possível incluir -{pt-pt| os oitavos de final:pt-br; as oitavas de final:pt-ao; os oitavos-de-final:}- em artigos de futebol, o que resolveria o exemplo citado. Abç OTAVIO1981 (discussão) 17h21min de 23 de junho de 2010 (UTC)Responder
(conflito de edição 2x)
Muito obrigado pelo exemplo, Zorglub!
Para facilitar a visualização das diferenças, vou adicionar alguns espaços adicionais ao seu exemplo:
(pt-br)    Quatro classificados para as oitavas de final da Copa do Mundo da   FIFA 2010 serão conhecidos nesta terça-feira.
(pt-pt) Os quatro classificados para os oitavos de final do Mundial de Futebol FIFA 2010 serão conhecidos  esta terça-feira.
A indicação da conversão em um artigo onde esta frase aparecesse poderia ser feita assim:
-{pt-br:Quatro; pt-pt:Os quatro}- classificados para -{pt-br:as oitavas; pt-pt:os oitavos}-
de final -{pt-br:da Copa do Mundo da; pt-pt:do Mundial de Futebol}- FIFA 2010
serão conhecidos -{pt-br:esta; pt-pt:nesta}- terça-feira.
ou ainda, deste jeito:
-{pt-br:Q; pt-pt:Os q}-uatro classificados para -{pt-br:a; pt-pt:o}-s
oitav-{pt-br:a; pt-pt:o}-s de final d-{pt-br:a Copa do Mundo da; pt-pt:o Mundial de Futebol}-
FIFA 2010 serão conhecidos -{pt-br:<nowiki></nowiki>; pt-pt:n}-esta terça-feira.
Além disso, se em geral
  • A expressão "a Copa do Mundo" é convertida para "o Mundial de Futebol", e
  • A expressão "as oitavas de final" é convertida para "os oitavos de final",
então pode-se sugerir a inclusão dessas expressões nas tabelas globais, ou na predefinição que reúne conversões manuais comuns aos artigos sobre futebol, permitindo que o código wiki fosse simplificado para:
-{pt-br:Quatro; pt-pt:Os quatro}- classificados para as oitavas de final
do Mundial de Futebol -{pt-br:da; pt-pt:<nowiki></nowiki>}- FIFA 2010
serão conhecidos -{pt-br:esta; pt-pt:nesta}- terça-feira.
Obviamente, aqui está sendo supondo que todas as variações indicadas seriam essenciais para que o artigo em questão fosse bem aceito pelos leitores de cada variante.
Na prática, os editores devem usar o bom senso para decidir quando marcar um trecho do texto para que seja o conversor exiba o artigo da forma mais adequada a um leitor. Por exemplo, sendo mais familiarizado com a variante brasileira, eu não veria qualquer problema em ler a frase do exemplo se ela usasse "Quatro" em vez de "Os quatro", e "esta" em vez de "nesta" (algum brasileiro discorda?). Por outro lado, a minha impressão é de que a conversão entre Copa do Mundo e Mundial de Futebol vale a pena ser indicada, pois é uma diferença mais significativa entre as variantes (por usar um vocabulário que pode ser desconhecido a alguns leitores). Assim, se a frase tivesse sido escrita originalmente por um português:
  • Os quatro classificados para os oitavos de final do Mundial de Futebol FIFA 2010 serão conhecidos esta terça-feira.
e alguém fizesse a "correção"
  • Os quatro classificados para os oitavos de final do Mundial de Futebol da Copa do Mundo da FIFA 2010 serão conhecidos esta terça-feira.
o editor seguinte poderia, em vez de reverter a edição, aprimorar o artigo adicionando ambas as informações:
  • Os quatro classificados para os oitavos de final -{pt-br:da Copa do Mundo da; pt-pt:do Mundial de Futebol}- FIFA 2010 serão conhecidos esta terça-feira.
Se posteriormente a diferença entre "Os quatro" e "Quatro" fosse motivo de uma briga de edições, ambas poderiam ser incluídas, e assim por diante...
O ponto é que a habilitação do recurso não converterá magicamente todos os artigos de uma hora para a outra entre as variantes, usando regras arbitrárias. A ativação do conversor só garantirá que possamos passar indicar ambas as variantes onde atualmente se é obrigado a escolher apenas uma, e que se definam (continuamente) regras globais para expressões que em geral mudam da mesma forma entre as variantes.
Novas ideias? Reflexões? Críticas?
Helder17h56min de 23 de junho de 2010 (UTC)Responder

Helder, você estava a pedir que lhe apresentasse um caso onde a conversão automática fosse difícil. O exemplo do rato é um caso que em primeira aproximação não é resolúvel automaticamente. Numa versão mais evoluída do conversor, este poderá ser distinguido pelo contexto, foi bom você esclarecer isso, mas não na fase inicial. Evidentemente que um ser humano consegue resolver todas essas dificuldades usando a predefinição -{}-. Parece-me que talvez poderá haver diferenças de opinião na aceitação das duas situações - pode haver utilizadores que sentem que uma conversão automática pode vir a resultar em muitos falsos positivos e estarem contra, mas estarem dispostos a aceitar a intervenção humana através de -{}-. A apresentação da proposta deve separar as duas vertentes, porque pode ser possível que uma seja aceita e outra não.JF (discussão) 17h53min de 23 de junho de 2010 (UTC)Responder

A impressão que eu tenho é que as tabelas que hoje existem para o idioma chinês foram criadas bem lentamente desde 2005, a partir da identificação dos usos mais comuns da marcação manual nos artigos. Neste sentido, a tabela global é a última coisa que "tomará forma", pois será construída colaborativamente a partir da prática de edição dos dos artigos pensando em mais de uma variante ao mesmo tempo.
Concordo que pode estar confuso o uso que tenho feito das expressões ao falar sobre esta parte do MediaWiki.
Aqui vai uma nova síntese: a classe LanguageConverter do MediaWiki faz a "conversão automática" que consiste no seguinte: ao exibir um artigo, a classe detecta a variante escolhida pelo leitor (por menus, url, ou preferências) e então analisa quais são as "regras de conversão" que a comunidade sugere ao sistema. Algumas destas são locais (feitas naquele artigo que está sendo exibida, usando -{}-), outras são globais e ficam guardadas no espaço nominal MediaWiki. A diferença entre os dois tipos é que as globais valem automaticamente para todos os artigos (e podem ser sobrescritas ou complementadas definindo manualmente as regras locais nos artigos). Tanto as regras globais quanto as locais não existem atualmente na Wikipédia, pois a sintaxe usada pelo conversor não foi habilitada para a língua portuguesa. Mesmo que seja habilitada, ainda assim não existirão regras de conversão (certas ou erradas) que façam o conversor servir para alguma coisa: será preciso que alguém use a sintaxe efetivamente, seja nos artigos ou sugerindo a criação de regras globais (que façam sentido globalmente). Isso deixa as coisas mais claras? Helder18h12min de 23 de junho de 2010 (UTC)Responder
PS: Neste sentido, o caso do rato não é "difícil", pois a "conversão automática" é feita com base na "marcação manual" em cada artigo(não através de uma regra "global"). Helder18h17min de 23 de junho de 2010 (UTC)Responder
Perfeito, pelo menos eu entendi e agora já sei dar nome aos bois. O que eu estava a dizer é que não pode ter por garantido que a proposta de conversão automática seja aceite pela comunidade. Depois, pode haver diferenças de aceitação entre a conversão global (automática e independente do utilizador, desde que existente nas tabelas de conversão) e a local (sempre dependente de quem escreve o artigo).JF (discussão) 18h27min de 23 de junho de 2010 (UTC)Responder

Por outras palavras, para usar a tabela em algo tão básico como o exemplo que dei (e podem ter a certeza que é bem básico, à situações bem mais complexas), passo um artigo de 100k para 400k e perco 5 vezes mais tempo a edita-lo, e isto usando apenas uma conversão, imagino o que será se lhe acrescentar-mos pelo menos a versão do pt-ago. Não muito obrigado, não contem comigo, tenho coisas muito mais importantes para fazer. Pelo Poder do Z Alaf Ogimoc 18h22min de 23 de junho de 2010 (UTC)Responder

A wikipédia existe para quem a consulta, não para quem a escreve.JF (discussão) 18h27min de 23 de junho de 2010 (UTC)Responder
Já foi explicado a conversão global do mediawiki e os pacotes de predefinição por temas. A utilização do recurso é completamente opcional, ninguém é obrigado a inserir as variações do texto quando escrever. Diante do que foi explicado, se ainda não viu nada de bom na proposta, melhor seguir com as coisas que são importantes para você. Até OTAVIO1981 (discussão) 18h31min de 23 de junho de 2010 (UTC)Responder
Às vezes tenho a sensação que o pessoal se esquece que está a fornecer um serviço gratuitamente à comunidade. Se mais trabalho nosso permitir que o serviço seja melhor, o caminho é fazer esse trabalho. A sua contribuição é mais do que benvinda, em especial por não ser nem português nem brasileiro. Mas se achar que dá muito trabalho, ninguém o obriga. A wikipédia não existe para os editores, existe para os leitores.JF (discussão) 18h36min de 23 de junho de 2010 (UTC)Responder
LOL Essas pagam direitos de autor, mas tens razão e eu seria o primeiro a dizer que sim se acha-se que valeria a pena, mas o prob é que não acredito (pelo menos pelo que vi até agora) que isto vá funcionar em condições e, a única coisa que vai fazer, é sobrecarregar o servidor e tornar a abertura de páginas mais lenta. Se remotamente acha-se que isto funcionaria em condições, até que leva-se mais de três horas a editar um artigo, bradaria aos céus de alegria. Pelo Poder do Z Alaf Ogimoc 21h05min de 23 de junho de 2010 (UTC)Responder
Quanto ao servidor, costumam utilizar armazenamento em cache para muitas coisas, justamente para evitar o desperdício de recursos a ponto de deixar as páginas lentas.
O que não percebi foi o motivo para o grande aumento no tempo gasto para editar um artigo. Me parece que escrever um parágrafo pensando nas outras variantes é algo da mesma ordem de dificuldade de escrevê-lo cuidando para que os fatos daquele trecho esteja bem referenciados (incluindo <ref></ref>) e devidamente formatado. Nem todos os editores gostam de fazer esse tipo de coisa. Há quem prefira revisar coisas que já estejam escritas, ou traduzir artigos de outros idiomas, ou acrescentar referências, ou cuidar de vandalismos... Cada qual pode fazer aquela parte da tarefa pela qual tem mais interesse. Se aintenção de alguém é apenas escrever, digamos para adicionar um parágrafo por exemplo, este editor não tem obrigação (nunca teve) de escrever de outra forma que não seja aquela variante que está acostumado a usar. Se depois de ter feito sua edição alguém notar que determinada passagem talvez não seja bem compreendida por falantes de outra variante, ou se alguém fizer uma edição do tipo que o Otavio mencionou, pode editar novamente a página, desta vez acrescentando o vocabulário específico desta outra variante com a marcação wiki que o sistema permite usar. Helder22h59min de 23 de junho de 2010 (UTC)Responder
Conforme a "quantidade de informação" disponível por artigo aumenta, é natural que o tamanho do código aumente. Esse aumento acontece toda vez que resolvemos formatar (para benefício do leitor) um artigo que foi escrito sem links, sem negritos, sem itálicos, sem interwikis, sem tabelas e infoboxes, sem referências, etc... No entanto, um artigo que possui todas essas informações adicionais também é naturalmente mais difícil de editar, e não é todo mundo que gosta de aprimorar os artigos adicionando tais informações, ou criando predefinições que ajudem a simplificar a vida dos editores: cada qual pode contribuir com aquilo que considera mais adequado. E o uso do código wiki que permite tais aprimoramentos aos artigos não costuma ser um problema entre os editores que possuem diferentes interesses ao colaborar. Além disso, o aumento do tamanho do código wiki resultante da possibilidade que o leitor terá de ler em o artigo usando preferencialmente as expressões de uso comum em sua variante não representará aumento no tamanho da página carregada para o leitor (que é o nosso público alvo).
Novamente fico em dúvida sobre as diferenças em relação as demais variantes: além do vocabulário específico, o que mais costuma ser diferente entre três (ou mais) das variantes? Por exemplo, na frase acima sobre o futebol, a escrita angolana seria diferente tanto da brasileira quanto da portuguesa? Este tipo de informação é importante para definir a variante fallback de cada variante. Helder19h03min de 23 de junho de 2010 (UTC)Responder
Para além do vocabulário específico não me parece que haja diferenças importantes entre as versões não brasileiras do português. JF (discussão) 19h18min de 23 de junho de 2010 (UTC)Responder

Ó meu caro ficaria admirado das diferenças que existem do pt-ago para o pt-eu e o pt-br, especialmente se for pessoal do centro, mas de forma geral, a grande confusão do pt-ago é que seguimos a norma europeia, mas usamos tanto o gerúndio como o infinitivo, depende muito da situação, e não existe uma norma definida, tem mais a ver com a localização cultural, ou seja, norte, centro, litoral, ou sul, e sem contar de facto que escrevemos de maneira diferente, usamos os K, W e Y e temos palavras que nem no português existe, apesar de muitas já terem sido importadas por vocês, como bunda, zoeira, bué etc... Por isso preparem-se que com o crescimento económico galopante de Angola, muito brevemente a inundação de Angolanos vai estar à porta. Pelo Poder do Z Alaf Ogimoc 21h15min de 23 de junho de 2010 (UTC)Responder

Talvez as coisas fiquem mais equilibradas então.JF (discussão) 10h31min de 24 de junho de 2010 (UTC)Responder

Caro Helder, não percebeu porque é que eu disse que levaria mais tempo? Francamente, será que você ao menos edita artigos, ou apenas se dedica a código? Pelos exemplos de introdução de código que aqui demonstrou, garanto-lhe que seria muito mais rápido escrever três versões diferentes da mesma página do que estar a inserir essa arrazoada em praticamente todas as palavras, pois se assim não for, a tradução vira uma treta pegada. Pelo Poder do Z Alaf Ogimoc 19h00min de 24 de junho de 2010 (UTC)Responder

Concordo. Mas não podemos fazer três versões diferentes do mesmo artigo.JF (discussão) 10h18min de 25 de junho de 2010 (UTC)Responder

Nem eu disse para o fazermos, isso era ir atrás dos fanáticos que querem separar a wiki. Para fazer isso mais valia criar a wiki brasileira a wiki portuguesa e a wiki angolana, e sou completamente contra. O que eu quis dizer foi, e volto a repetir o que disse mais acima, é que não contem comigo para o fazer esse tipo de edições, pois para mim é perda de tempo, sou a favor de usar tal sistema se ele for prático e eficaz, não assim, já o disse porque, e cada vez me convencem menos. Tal como já referi a língua portuguesa é muito mais complexa do que o chinês simplificado, para eles pode funcionar, connosco não, pois tinha que ser criado um tradutor inteligente e estamos ainda a muitos anos (?) de o conseguir fazer. Pelo Poder do Z Alaf Ogimoc 16h31min de 25 de junho de 2010 (UTC)Responder

Conforme mencionei anteriormente, Citação: «Os chineses usam o recurso para duas finalidades distintas:
  1. A conversão entre os conjuntos de caracteres do chinês simplificado e do chinês tradicional (não é o nosso caso, pois o alfabeto é o mesmo entre os países lusófonos);
  2. A conversão entre termos locais, que variam conforme o país (é o análogo do que podemos fazer por aqui);»
A aplicação para a língua portuguesa seria no estilo do segundo tipo, que não deixa de ser feito pelos chineses mesmo sendo o mais difícil dos dois. Quanto uso faremos do sistema deve ser discutido, e pode incluir ou não umas infoboxes, uns títulos cuja grafia é diferente, vocabulário que cause confusão aos que conhecem apenas uma variante, gerúndio, conjugação de verbos, plurais, concordância e casos mais complexos...
Só não acho que todos os usos do sistema sejam dispensáveis... Pode-se escolher uns, testa-lo para estes, e usar a página de testes para experimentar outros usos, naquilo em que ele se mostrar útil, não vejo motivo para não usar...
Em todo caso, sendo ou não aceita a proposta, ela foi feita porque imaginei que o sistema pode ter alguma utilidade aqui na Wikipédia (na verdade minhas colaborações com conteúdo são mais frequentes lá no Wikilivros - pois me identifico mais com a proposta daquele projeto).
Se os argumentos ou a prática mostrarem o contrário, pode-se não utiliar o sistema, ou ajudar a aprimorá-lo, ou o que for mais adequado...
Voltando aos exemplos, poderiam me indicar um artigo escrito essencialmente em portugues de portugal (um grande) para que eu pudesse sentir melhor as diferenças? Helder00h51min de 26 de junho de 2010 (UTC)Responder
Para fazer uns testes práticos, poderia ser adicionado um pequeno trecho de css para ocultar o menu que aparece no topo das páginas para restringir a visibilidade dos testes àqueles que estivessem logados e que tivessem selecionado uma das variantes (já que o texto das páginas não sofre conversão para quem não seleciona uma das variantes). Helder13h50min de 2 de julho de 2010 (UTC)Responder

Quer melhor exemplo do que o artigo sobre Lisboa? tem lá de tudo um pouco. Pelo Poder do Z Alaf Ogimoc 01h06min de 26 de junho de 2010 (UTC)Responder

Experimentei copiar o texto do artigo para uma instalação local do MediaWiki com o conversor habilitado e selecionar "pt-br". O resultado da conversão pelas regras que estão na MediaWiki:Conversiontable/pt-br no momento pode ser visto neste diff aqui. Helder22h40min de 26 de junho de 2010 (UTC)Responder
Nesse teu diff já tem um problema (e eu só passei o olho por cima, não verifiquei a fundo): O tradutor converte "eléctrico" para "elétrico", quando na verdade deveria converter para "bonde". Como diz o Zorgulb, isso vai criar ainda mais peso nos artigos e não há garantias que funcione (e se cham que o agurmento do tamanho é irrelevante, dêem uma olha no tamalho do artigo São Paulo ou do próprio artigo Lisboa). Béria Lima msg 09h21min de 25 de outubro de 2010 (UTC)Responder
Aquele diff foi bastante improvisado e ninguém havia revisado (alguém revisou?) os esboços de tabela(s) para remover este tipo de regra que não se aplica globalmente. Poderá ver uns resultados bem melhores no Wikisource (por exemplo, na s:Elementos de Arithmetica/Capítulo 1) onde há um javascript que faz algo parecido com o que o conversor do MediaWiki faria. Lá as tabelas de conversão ("modernização", para usar o termo que usamos lá) já foram revisadas com mais cuidado.
Observe ainda que além das tabelas globais e das marcações em pontos específicos de artigos específicos, há ainda os "grupos de conversão" que podem ser feitos com predefinições análogas às existentes da Wiki chinesa, e que reúnem regras de conversão que se aplicam a um grupo de artigos, mas não se aplicam globalmente (como o seu "eléctrico", cujo significado depende do contexto). Eu e o OTAVIO1981 trocamos algumas palavras sobre tais predefinições na discussão de uma das tabelas. As predefinições que tomaríamos como referência são:
Este é o tipo de estratégia que se usa para não ter que ficar enchendo o artigo com conversões manuais repetidas (que não poderiam ser colocadas na tabela global por não se aplicarem a todos os artigos).
Helder 20h02min de 25 de novembro de 2010 (UTC)Responder

Script to convert the entire contents of a page from American spelling to British spelling[editar código-fonte]

Descobri isto: Script to convert the entire contents of a page from American spelling to British spelling. Não sei se tem interesse para o nosso caso. Um abraço, -- Manuel de Sousa msg 14h14min de 1 de julho de 2010 (UTC)Responder

Interessante! Eu ainda não conhecia este... Obrigado por compartilhar =)
Parece que este script é focado nos editores, sendo usado para converter o código wiki de determinado artigo (quando se deseja que ele seja reescrito em uma das variantes) sem ter que mudar manualmente cada expressão de uma variante para a outra. O conversor do MediaWiki é focado nos leitores, e atua no texto exibido aos leitores, fazendo com que as expressões estipuladas sejam convertidas para as correspondentes na variante selecionada pelo leitor (indiferente de qual/quais variante(s) tenham sido usadas pelos editores que escreveram o artigo).
Ah Manuel, por acaso não gostaria de compartilhar sua opinião sobre a proposta (ou partes dela) agora que já foram feitas mais considerações a respeito? :-) Helder13h50min de 2 de julho de 2010 (UTC)Responder

Passando pra dizer que estou Neutro. A principio não gosto mto da ideia pq acho msm bacana aprender como a lusofonia escreve, e um texto é compreensível em qq variante. Seria a favor apenas p/ textos apresentam terminologia técnica. Mas não vou me opor, só cuidem bem para o conversor funcionar direitinho e não fazer bobagem!--Lépton msg 22h32min de 2 de julho de 2010 (UTC)Responder

Arquivamento[editar código-fonte]

Há alguma objeção quanto ao arquivamento desta proposta? CasteloBrancomsg 21h30min de 18 de outubro de 2010 (UTC)Responder
Era uma óptima ideia, mas pelo que parece não teve muita adesão.JF (discussão) 22h08min de 18 de outubro de 2010 (UTC)Responder
Acredito que o ideal é colocá-la em votação antes, já que sua ativação não traria prejuízos para quem não pretende usar ou se envolver e ainda assim permitiria aos demais ter acesso ao recurso. Em outras palavras: com o recurso a situação fica melhor ou igual a atual, então não há prejuízo.
Note que ninguém comentou a respeito da sugestão de formas para se colocar o recurso em testes para que a comunidade pudesse ter mais contato com o mesmo antes de decidir algo em caráter definitivo. Seriam favoráveis? Teriam outras sugestões?
Mesmo assim, apesar de não ter comentado mais nada por aqui, houve uma troca de ideias sobre o recurso também na wiki estratégica da Wikimedia e em seguida no Wikisource multilingual (sobre uma forma de permitir a "modernização automática" da ortografia de alguns textos antigos dos Wikisources). No processo, acabamos descobrindo um script que já estava sendo usado no Wikisource francês, e então ele já foi adaptado e instalado no Wikisource lusófono (podem notar um menu no topo da página s:Elementos_de_Arithmetica/Capítulo_1). A adaptação permitiu que ele pudesse ser usado em outros idiomas também (como o é o caso do norueguês). Para mais detalhes sobre o uso nos Wikisources, ver s:Wikisource:Modernização.
No entanto, usar o script não é o mesmo que usar o recurso que vem com o MediaWiki, então as características, desempenho, vantagens e limitações são diferentes entre eles. Mesmo assim, o Eduardo P tem usado o script aqui na Wikipédia e feito atualizações na tabela correspondente.
Como os dois sistemas não são tããão diferentes (do ponto de vista de um leitor), o Javascript poderia ser usado como forma de fornecer um "beta" ou "preview" do que seria o recurso (feito em PHP) do MediaWiki. A grande limitação/diferença seria que o Javascript não fornece nenhuma sintaxe especial para fazer marcações manuais em pontos específicos dos artigos de modo a complementar, corrigindo ou aperfeiçoando, as tabelas que reúnem regras globais de conversão. Helder23h07min de 18 de outubro de 2010 (UTC)Responder
Helder, noto que não respondi na altura ao teu comentário: "atualmente não é feita a conversão do conteúdo da caixa de edição. Mas isso pode não ser desconcertante (realmente não sei), pois, por exemplo, se (1) o texto misto é o exibido para os leitores que não escolhem uma variante específica e (2) o mesmo leitor resolve editar, então o que ele encontra é o texto que estava lendo, eventualmente com alguns trechos inseridos na marcação -{pt-pt:<isso>; pt-br:<aquilo>; etc:...}-, que é por si só auto explicativa." -- bem, tenho alguns comentários:
  1. certo, o texto misto (original) do artigo é mostrado caso o leitor não escolha uma preferência. Mas caso hajam marcações manuais, qual delas é mostrada? Usa-se localizaçãopor IP? A língua do browser? A língua do sistema? E nesse caso, porque não usar o mesmo mecanismo para escolher a versão a mostrar ao leitor (afinal, é provavelmente melhor o texto ser consistente do que misturar as duas variantes)
  2. ok, ao ver a fonte, as marcações manuais são auto-explicativas, mas estas são as exceções. Eu referia-me ao texto que é convertido automaticamente com base na tabela global. Nesse caso, o editor irá sim encontrar um texto difrente do que estava a ler e ficará, se não confuso, ao menos tentado a alterar "novamente" para a variante que estava a ler.
Em suma, creio que o problema se mantém, se fosse possível, como indicas na tua mensagem, implementar a conversão na caixa de edição, então seria a meu ver um requisito essencialpara o sistema funcionar bem (IMHO). --Waldir msg 07h11min de 25 de outubro de 2010 (UTC)Responder
Citação: Waldir escreveu: «caso hajam marcações manuais, qual delas é mostrada?»: o princípio que o MediaWiki usa é essencialmente este "use o texto da variante escolhida pelo leitor, se houver, caso contrário use o texto da variante fallback correspondente" (ver tabela de fallbacks sugerida inicialmente - carece de confirmação). Eu não havia colocado no exemplo anterior, mas é possível definir explicitamente o que será exibido por padrão para quem não faz qualquer escolha entre variantes: basta usar -{pt:<texto padrão>; pt-pt:<texto para portugueses>; pt-br:<texto para brasileiros>; etc:...}-.
Um exemplo prático: se o conversor estivesse em funcionamento, a {{PEPB}} poderia ser aprimorada (e também as outras do gênero) para que o código wiki {{PEPB|Ananás|Abacaxi}} exibisse, se assim desejássemos, um texto mais simples para os que definiram uma variante preferida:
Entendi o seu ponto (2). O que me ocorre agora é que, como as traduções podem não ser simétricas, ao fazer o caminho BR → PT → BR uma expressão pode voltar diferente da que era originalmente. Deve ser por isso que se optou por não fazer a conversão do conteúdo da caixa de edição. Helder 19h44min de 25 de novembro de 2010 (UTC)Responder
Ok, obrigado por esclarecer o ponto 1. Quanto ao ponto 2, não entendi a tua explicação. Entendo que BR → PT → BR possivelmente traria problemas, mas em que caso essa dupla conversão seria necessária? Clarificando, eu quando disse que deveria haver conversão na caixa de edição, não sugeri que a conversão fosse gravada com a edição feita; apenas as partes modificadas deveriam ser gravadas. Não sei se foi esta a assumpção que te levou a fazer esse comentário, mas achei que não faria mal jogar pelo seguro. Podes comentar? --Waldir msg 21h01min de 2 de dezembro de 2010 (UTC)Responder
Note: se ao abrir a caixa de edição o MediaWiki convertesse o conteúdo para determinada ortografia (ex: conteúdo original → PT), como ele poderia retornar à ortografia inicial (ex: PT → conteúdo original) que já estava na caixa de edição de modo a garantir que "apenas as partes modificadas deveriam ser gravadas"? Em outras palavras, como seria diferenciada (1) a modificação feita ao conteúdo salvo antes de exibir ao editor e (2) a modificação feita pelo editor? A possível falta de simetria (e pensando bem, de transitividade e de injetividade) nas conversões poderia tornar isso inviável, não? Helder 10h22min de 10 de dezembro de 2010 (UTC)Responder
Não vejo porquê. Repara, imagina que temos os pares ônibus←→autocarro, trem←→comboio e usuário←→utilizador. Tendo texto gravado como:
"Pesquisas recentes indicam que o uso de trem ultrapassou o de ônibus."
O editor em Portugal leria:
"Pesquisas recentes indicam que o uso de comboio ultrapassou o de autocarro."
E ao ir à janela de edição, o mesmo texto, também convertido, apareceria; imaginemos que ele editaria para:
"Pesquisas recentes indicam que o número de utilizadores de comboio ultrapassou o dos de autocarro."
Ao gravar, apenas as diferenças a negrito seriam integradas, ficando gravado:
"Pesquisas recentes indicam que o número de utilizadores de trem ultrapassou o dos de ônibus."
Ele continuaria a ler da mesma forma que escreveu (a frase acima, com os destaques em negrito), mas um leitor brasileiro leria:
"Pesquisas recentes indicam que o número de usuários de trem ultrapassou o dos de ônibus."
E assim por diante. Talvez haja uma falha neste esquema, mas assim à primeira vista parece-me algo que poderia funcionar. --Waldir msg 00h14min de 13 de dezembro de 2010 (UTC)Responder
Este é o ponto: a princípio, nem toda regras é (obrigatoriamente) simétrica como "ônibus←→autocarro". Por este mesmo motivo, o sistema usa tabelas independentes para realizar a conversão do texto para cada uma das variantes (na tabela pt-BR é colocado "autocarro =>ônibus", enquanto na pt-PT coloca-se "ônibus => autocarro").
Por outro lado, é claro que a comunidade pode optar por restringir as tabelas globais de conversão de modo que sejam adicionadas apenas as regras que em conjunto gerem um sistema simétrico e transitivo como o do exemplo que colocou acima, mas isso não é uma restrição imposta pelo conversor, e nem é algo assumido por ele por padrão para que possa converter também o conteúdo da caixa de texto. Helder 12h36min de 22 de dezembro de 2010 (UTC)Responder
Entendo, mas podes dar um exemplo de uma conversão entre pt-PT e pt-BR que se possa introduzir no dicionário (em vez de usando a marcação manual – ou seja, que aconteceria sempre) e que não seja simétrica? --Waldir msg 03h45min de 29 de dezembro de 2010 (UTC)Responder
Usando um script para comparar as tabelas de conversão para PT e para BR que o Gadget está usando no momento, o resultado foi essa lista de inconsistências ( e a versão correspondente para as conversiontables, que têm recebido menos edições). As situações típicas ali são:
  • Palavras com mais de duas grafias, como "electrónica/eletrônica/eletrónica", "Sismo/Terramoto/Terremoto" e "caractere/carácter/caráter".
  • Palavras que forem adicionadas a uma tabela mas não à outra (por esquecimento/falta de atenção/falta de tempo dos editores)
Além disso, cada tabela pode ter suas próprias regras do tipo que "faz nada" (como "pacta => pacta", que serviria para evitar que a regra "acta => ata" tivesse "compacta => compata" como falso positivo), e as que forem usadas em uma direção podem não ser suficientes (será?) para garantir que não haverá falsos positivos na direção oposta.
O problema ficaria maior quando fosse possível passar a usar expressões regulares (para sintetizar diversas regras em uma só, e para não precisar ficar colocando muitas dessas "regras vazias"). Aí sim não haveria qualquer simetria (pois de um lado haveria uma regex e do outro uma string normal).
Outra coisa: mesmo se as regras usadas puderem ser usadas para a conversão na caixa de texto, provavelmente algum dev teria que desenvolver o código necessário para isso acontecer (já que atualmente isso não é usado). Helder 13h43min de 4 de fevereiro de 2011 (UTC)Responder
Fair enough. Thanks pelos esclarecimentos. Continuo a achar que pode ser estranho ler um texto com grafias pt-pt e ao editar encontrar palavras pt-br (nas conversões que acontecerem de forma automática, digo). Mas creio que não custa experimentar. Até porque se os editores sobrevivem a encontrar no início da caixa de edição as prededfinições e tudo o resto em vez do primeiro paágrafo de texto, há boas chances de este incómodo ser ultrapassável. Na pior das hipóteses, pode-se usar apenas a conversão manual, de forma a que no código fonte estejam sempre explicitas as diferentes versões. --Waldir msg 17h49min de 4 de fevereiro de 2011 (UTC)Responder

Eu Concordo plenamente com o Helder. Em implementar o conversor em PHP para as variantes da língua portuguesa. Eduardo Pazos (discussão) 00h13min de 25 de outubro de 2010 (UTC)Responder

Eu só tomei conhecimento dessa proposta agora... Acredito que a discussão poderia ser revivida para que possa ser implantada.
Flávio, o Maddox (msg!contrib) 22h19min de 12 de novembro de 2010 (UTC)Responder
E que tal divulgar s:Elementos_de_Arithmetica/Capítulo_1 à comunidade como um exemplo extremo do que pode ser feito e abrir a votação para que a proposta seja testada em alguns artigos?JF (discussão) 13h18min de 13 de novembro de 2010 (UTC)Responder

Fui audaz e abri um pedido no bugzilla:26121 para habilitar o conversor em alguma wiki de testes onde a comunidade lusófona possa experimentá-lo na prática. Quanto ao script existente no Wikisource, vale lembrar que não se trata do mesmo recurso (embora do ponto de vista do leitor a funcionalidade possa parecer ser a mesma). A implementação do MediaWiki não é a mesma que a feita em Javascript (por exemplo, nem todos os leitores têm javascript habilitado no navegador - isso não seria um problema no caso do conversor do MediaWiki, mas é no caso do scritp do Wikisource). Helder 19h14min de 25 de novembro de 2010 (UTC)Responder

Para começar, acho que não é preciso fazer votação nenhuma, já que a ferramenta não altera em nada as edições, e por aqui à consenso em relação à sua utilização, em segundo acho que se deveria ter atenção ao titulo a colocar nas tabelas de tradução, já que são apenas alteradas palavras chaves e não a estrutura do texto (por outras palavras, um texto escrito em pt-pt, estará sempre escrito em pt-pt e um texto escrito em pt-br, estará escrito sempre em pt-br, apenas são alteradas as palavras que não são comuns) em terceiro, tem que se ter cuidado nas traduções, pois vi lá em cima um exemplo absurdo, o caso do Abacaxi = Ananás, o que é falso, já que abacaxi é um fruto, similar ao ananás, (não são sinónimos em pt-pt, a única diferença é que os brasileiros chamam de abacaxi ao ananás e chamam abacaxi ao abacaxi, ou seja não os destrinçam enquanto que em pt-pt, sim) e há outros exemplos semelhantes como palavras iguais com significados diferentes como por exemplo cuecas, camisola, fraque e outros, cujas palavras são iguais mas tem significados diferentes (este para mim é o maior problema do conversor). Pelo Poder do Z Alaf Ogimoc 14h39min de 22 de dezembro de 2010 (UTC)Responder

Gadget[editar código-fonte]

Enquanto esperamos pelos desenvolvedores, coloquei nos pedidos para administradores as instruições para habilitar o script do Wikisource em forma de gadget. Assim que instalarem, seria interessante que, quem puder, ajude a revisar as tabelas que o script usa(rá) (que foram criadas inicialmente por mim, com base em uma lista do Wikicionário, e depois editadas principalmente pelo Eduardo P). Aqui, "revisar" inclui tando a "adição" quanto a "remoção" de regras de conversão (principalmente as que não fizerem sentido ou que tiverem falsos positivos). Nos casos de dúvida, é só criar uma seção na página de discussão da tabela, para reunir comentários sobre determinada expressão em que tenha algum problema (controvérsias, bugs, etc...). O script consultará os dicionários nas páginas Wikipedia:Dicionário/<código da variante>.

Quem achar mais prático, pode acessar todos de uma só vez na página Wikipedia:Dicionário. Helder 22h16min de 24 de dezembro de 2010 (UTC)Responder

O gadget já foi instalado.
Se tudo correr bem, ele aparecerá (para quem habilitá-lo) ao abrir um artigo qualquer (e também ao abrir páginas dos domínios "Usuário", "Wikipédia" e "Categoria" - esta lista é configurável, caso alguém queira incluir mais domínios).
Abram por exemplo o artigo sobre o Palácio Heian, e deverá aparecer no topo da página um novo menu (como o que aparece na s:Imagem:Menu para modernização.png, do Wikisource). Então poderão escolher uma das opções disponíveis para que ele faça a conversão com base no dicionário correspondente. Depois que uma conversão for feita, aparecerá também a opção "Mostrar alterações", que destaca com um fundo verde as expressões que foram convertidas (útil para conferir as tabelas de conversão em busca de erros e falsos positivos), como na s:Imagem:Modernização da ortografia.png.
O gadget foi configurado para que ofereça também, em caráter mais experimental, a opção de converter palavras para a ortografia galega (que tem bem mais diferenças do que àquelas entre pt-BR e pt-PT), com base no Dicionário/gl. Há mais informações sobre isso na gl:Wikipedia:A Taberna (novas)#Novo Gadget na Wikipédia. Helder 16h06min de 25 de dezembro de 2010 (UTC)Responder

Notei na página Wikipedia:Dicionário que o pt-pt segue o AO1945. Estando oficialmente a vigorar o AO1990, faz sentido ser esta a norma. E porquê a subpágina para AO1990? Está a ser usada? Dreispt (discussão) 08h17min de 29 de dezembro de 2010 (UTC)Responder

Conforme mencionei, as tabelas precisam de revisão. Quanto mais gente olhar e revisar (acrescentar, comentar, questionar ou remover itens), melhor as tabelas ficarão!
A divisão entre as duas ortografias ainda está ali pois a tabela praticamente não foi modificada em relação à versão obtida do esboço que existe na "MediaWiki:Conversiontable/pt-pt". E esboço foi feito antes da vigência do AO1990 e por isso havia sido separado em seções conforme comentei acima com o JF. Agora é só questão de alguém ter tempo para revisar a tabela pt-PT (preferencialmente um português, que terá mais familiaridade com as conversões para aquela variante). Helder 11h41min de 29 de dezembro de 2010 (UTC)Responder

Divisionismo[editar código-fonte]

Duas perguntas muito pertinentes.

  1. Porque é que foi adicionada a opção da variante angolana, se o dicionário da mesma não existe.
  2. Porque é que o dicionário eu-br é 90% maior do que o br-eu.

Por outras palavras, supostamente este gadget é para eliminar as diferenças, mas a meu ver aumenta-as, facilitando a leitura aos brasileiros e depreciando os portugueses e ignorando os angolanos.

Agradecia uma resposta dos responsáveis. Pelo Poder do Z Alaf Ogimoc 04h02min de 29 de dezembro de 2010 (UTC)Responder


Parece haver trabalho a fazer. Mãos à obra então! Dreispt (discussão) 08h19min de 29 de dezembro de 2010 (UTC)Responder
  1. Foi adicionada a opção para que alguém possa criá-la (da mesma forma que o script de modernização do Wikisource foi habilitado antes mesmo de alguém começar a criar qualquer dicionário que pudesse ser usada para a tarefa). Conforme alguém for criando regras de conversão em um dos dicionários, a conversão para a variante correspondente passará a utilizá-las;
  2. Se olharem os históricos dos dicionários pt-PT e pt-BR (do Gadget em JavaScript), pt-PT e pt-BR (do conversor PHP do MediaWiki, baseados na wikt:Wikcionário:Versões_da_língua_portuguesa/Tabela, e nos quais foram baseados os dicionários do gadget), poderão notar que até agora não houve muita participação de não-brasileiros na melhoria das tabelas e que mesmo o número de brasileiros ainda é bem pequeno. Então, como Dreispt disse: mãos à obra!
Helder 11h41min de 29 de dezembro de 2010 (UTC)Responder

Pode-se saber, como é que posso trabalhar no dicionário de pt-ao? Pelo Poder do Z Alaf Ogimoc 00h55min de 30 de dezembro de 2010 (UTC)Responder

Pode saber sim =) Copio abaixo parte do que disse em outro lugar
É bem simples adicionar regras de conversão aos dicionários usados pelo gadget. Eles consistem de várias linhas (uma para cada regra/par de conversão) com a seguinte forma:
*expressão original: nova expressão//comentários ou <ref>s sobre a regra, se necessário
As linhas que não têm esta forma são ignoradas pelo script. Então, toda ajuda para melhorar as tabelas (seja adicionando novas regras, corrigindo as existentes, removendo aquelas que fizerem sentido, ou questionando-as na página de discussão do dicionário correspondente) será bem vinda!
A documentação ainda está "um pouco" espalhada (precisamos criar uma página de documentação para ele, juntando o que há espalhado "por aí"...), mas encontrará alguma informação nas seguintes páginas, se precisar:
PS: Zorglub, há uma pergunta pendente aqui.
Helder 12h03min de 29 de dezembro de 2010 (UTC)Responder

Já respondi à pergunta lá, mas transcrevo-a aqui.

Esqueci-me completamente de dizer qual era o erro, mas já foi rectificado. O que se passava era que quando se saltava de um dicionário para o outro aparecia uma página de erro, tinha que se fazer o rollback primeiro, ou seja, não se podia mudar por exp. de pt-br para pt-ao e depois para pt-eu, tinha que se regressar sempre primeiro ao texto original.
Em relação à pergunta. Isso era válido antes do AO, pois as palavras seguiam o AO 1945, agora já não, pois em Angola o AO não foi aprovado e não está em vigor (não faço a mínima ideia se será definitivo ou não, mas de momento ninguém fala no assunto), mas independentemente disso, apesar de muitas palavras da variante angolana terem sido assimiladas pela língua mãe (o caso de bué, por exemplo) existem muitas outras que são exclusivas de Angola e algumas que são iguais mas com significado diferente (passa-se o mesmo em relação ao Brasil) como por exemplo a palavra "maca" que em pt-eu (em pt-br não sei) é uma cama de hospital portátil e em Angola significa confusão. Pelo Poder do Z Alaf Ogimoc 17h34min de 30 de dezembro de 2010 (UTC)Responder
Acho que entendi e fiz o pedido para que um administrador atualize a configuração do script em que é informado o dicionário a ser usado durante a conversão para pt-AO. Helder 21h33min de 30 de dezembro de 2010 (UTC)Responder

Galego[editar código-fonte]

Porquê a possibilidade de converter para galego, se há a Galipédia? Aproveitando, criei a página Wikipedia:Conversor de idiomas. GoEThe (discussão) 10h31min de 1 de fevereiro de 2011 (UTC)Responder

GoEThe, acho que é para ai um erro qualquer, não existe razão para se traduzir para o Galego, mais sim para a variante portuguesa do Galego, que não é a mesma coisa. É uma variante pouco conhecida, falada na fronteira norte de Portugal, é uma mistura entre galego e português, e inclusive já fizeram o VOLP deles que contem cerca de 800 vocábulos diferentes e próprios da variante. Pelo Poder do Z Alaf Ogimoc 11h44min de 1 de fevereiro de 2011 (UTC)Responder
[conflito de edição] Em síntese: para incentivar a troca de informações e a colaboração entre as duas wikis.
Como foi mencionado mais acima, coloquei mais detalhes na esplanada da Galipédia sobre essa opção. Copio a mensagem abaixo, para facilitar o acesso:
Para ficar mais clara qual pode ser a utilidade disso, experimente adicionar momentaneamente isto aqui ao seu vector na Galipédia para ativar o script para fazer o contrário: acessar a Galipédia podendo usar o script papra converter de galego para português. Assim, fica mais fácil acompanhar o que acontece por lá se não tiver muita facilidade para ler os textos diretamente em galego (depois de configurado, experimente acessar a "Portada" convertida para português). O dicionário "gl->pt" está nesta subpágina (ele difere do "pt->gl" essencialmente pela ordem das palavras em cada regra de conversão).
Com os dicionários em mãos, deduzo (com base nisto e nisto) que é "relativamente fácil" para alguém fazer um robô que acrescente informações aos Wikcionários dos dois idiomas com base nos pares de palavras que forem definidos, beneficiando as duas comunidades.
Há também a possibilidade de agradar quem diz que "fala português da Galiza" e também de reutilizar os dicionários nos Wikisources em galego e em português, para lidar com a modernização de textos antigos para os dois idiomas. Enfim... a opção foi colocada ali para sugerir possibilidades. Mas se preferirem, podem ocultar o menu de conversão para galego colocando o seguinte no seu vector.css:
li#ca-conv-gl {
	display:none;
}
Helder 12h06min de 1 de fevereiro de 2011 (UTC)Responder
Compreendo as razões, mas acho que deve estar ocultado por default ou separada, uma vez que a variante galega não é permitida aqui, e tê-la incluída numa gadget "oficial" daria a entender que é. Pode também ter o efeito de desviar contribuidores da Wikipédia em galego, uma vez que teriam acesso a conteúdo "convertido". Também não veria com bons olhos se fosse optado por usar essa opção para o que o Zorglub chama de português da Galiza, que é uma língua híbrida de uso corrente nas zonas de fronteira, mas não formal. GoEThe (discussão) 12h37min de 1 de fevereiro de 2011 (UTC)Responder
GoEThe, pode ser uma língua híbrida mas que é formal à isso é sim senhor. É reconhecida oficialmente pelos estados português e espanhol, como uma variante linguística portuguesa, mais precisamente com o nome de galaico-português. Pelo Poder do Z Alaf Ogimoc 13h16min de 1 de fevereiro de 2011 (UTC)Responder
O Galaico-português é outra história, é a língua ancestral comum ao galego e ao português. Não tem nada a ver. É uma língua morta, que deixou descendência. GoEThe (discussão) 13h19min de 1 de fevereiro de 2011 (UTC)Responder
[conflito de edição] Só uma observação: pelo mesmo argumento que usou, "uma vez que não é permitida a conversão dos artigos de uma variante para a outra por aqui, tê-la incluída numa gadget "oficial" daria a entender que é". Eu acho que a frase "Esta grafia não é válida na Wikipédia de língua portuguesa" deve ser entendida como "não é válida para a escrita de artigos na Wikipédia de língua portuguesa".
Por outro lado, com a inclusão da opção galega no menu do script não quis sugerir que ela devesse aparecer para todo mundo quando o conversor do MediaWiki for habilitado...
Em todo caso, se a comunidade preferir ocultar do gadget também, isso é simples de fazer.
PS: atualizei a página de documentação que criou. Acha que já podemos pedir para um admin trocar o link de ajuda que aparece no menu para que aponte para a página em vez da página do Wikisource? Helder 13h31min de 1 de fevereiro de 2011 (UTC)Responder

Não é uma língua morta, continua a ser falada na fronteira. Existe grande controvérsia sobre o tema, pois alguns historiadores defendem-na como morta outros como activa, e à quem defenda que o galego é uma variante do Galaico-português, antigo e como tal deveria ser considerada variante do português, e à quem defenda que a língua falada na fronteira não é o Galaico-português moderno, mas sim o galego com a adição de palavras de português. O facto é que ambos os governos a consideram língua. Polémicas à parte, e o VOLP, escrito pelo Instituto de Línguas Galegas, baseia-se exactamente na língua (ou não) "Galaico-portuguesa" da fronteira. o Facto é que é apenas a terceira variante com VOLP feito e foi mesmo anterior ao Brasileiro e ao Português. Pelo Poder do Z Alaf Ogimoc 13h27min de 1 de fevereiro de 2011 (UTC)Responder

Devemos lembrar que o galego é um dialecto/língua que tem duas grafias distintas. A versão do galego que poderia ser usada na wikipédia lusófona seria a norma reintegracionista usada por quem defende que o galego é uma forma de português. A outra versão é demasiado distinta do português não galego para ser possível integrá-la na wikipédia lusófona, mas devemos lembrar-nos que é essa a oficial. Por outro lado, a integração do galego na wikipédia lusófona, mesmo que em condições especiais, deverá ser discutida noutras instâncias. Nesta secção devemos discutir a conversão entre as versões oficiais do português.JF (discussão) 22h32min de 1 de fevereiro de 2011 (UTC)Responder

Variante angolana legítima ou pretoguês?[editar código-fonte]

O texto que aqui estava foi movido para: Wikipédia Discussão:Dicionário/pt-AO

Ponto da situação[editar código-fonte]

Em que ponto a coisa está? Gostava de experimentar o novo sistema em bitola mista para me livrar daquelas predefinições pavorosas de pt-pt e pt-br, mas já vi que ainda não funciona. :\ --- Darwin Ahoy! 03h41min de 17 de julho de 2011 (UTC)Responder

O gadget já está em funcionamento desde dezembro de 2010 (conforme tópico mais acima) e tem funcionado bem. Pode ativar o conversor nas preferências e testar em páginas como Neptuno (planeta) (ou qualquer outra em que apareçam palavras cuja ortografia muda de um país para o outro e que já tenham sido colocadas nos dicionários). Já foram criadas algumas predefinições, como a {{Conversão}} (exemplo) e a {{Não converter}} (exemplo), para fazer modificações em artigos específicos nos casos em que os dicionários globais não forem adequados. Helder 02h25min de 21 de julho de 2011 (UTC)Responder
Hmm... Tenho que ver melhor isso, então.... Eu tinha tentado usar em via algaliada mas os sistema não reconheceu as predefs que eu coloquei no modelo que você mostrou (com os {- ).--- Darwin Ahoy! 02h29min de 21 de julho de 2011 (UTC)Responder
Ah... então, há dois conversores. Aquela sintaxe com os -{...}- é a do conversor do MediaWiki, em PHP (que foi pedido para os devs no bugzilla:26121 - aberto até hoje =/). O que temos a disposição via gadgets é o conversor feito em JavaScript, que foi baseado no script de modernização do Wikisource francês (mas que é bem razoável, e que pode ser aprimorado pelos admins da wiki, ao contrário do outro que depende dos devs, que muitas vezes não nos dão bola...).o comentário precedente deveria ter sido assinado por Helder.wiki (discussão • contrib) Eamaral (discussão) 03h08min de 21 de julho de 2011 (UTC)Responder
Que confusão! xD Ok, vou ver como esse outro conversor funciona, eu já devo ter isso activado faz tempo, pois há meses que vejo as bandeirinhas dos idiomas na lista da esquerda.--- Darwin Ahoy! 02h46min de 21 de julho de 2011 (UTC)Responder

Ótima idéia[editar código-fonte]

Excelente idéia! Quando começa a funcionar? É muito chato quando um editor bem intencionado muda as palavras para a variante dele e temos que reverter, ainda mais quando ele faz correções para além disso. Ariel C.M.K. (discussão) 09h37min de 18 de julho de 2011 (UTC)Responder

Sobre o funcionamento, vide tópico anterior.
Quanto aos editores bem intencionados, coloquei um link para a página que descreve o(s) conversor(es) de idiomas na {{Ortografia}}, que é usada para avisar os editores sobre este tipo de alteração. Helder 02h29min de 21 de julho de 2011 (UTC)Responder

pt-AO (Angola)[editar código-fonte]

Olá: 1) Qual a razão para que ao visitar Elétron em "versão" Português de Angola a conversão deste gadget não segue "o padrão ortográfico de Portugal" (ver Português de Angola#Ortografia), apresentando uma norma igual à PT-PT para termos como "Eletrão", "Ião", etc.. 2) O que fazer para corrigir isto? 3) De resto, não entendo a razão por que em "Tarefas pendentes" desta página, em "Variantes reservas" só para "pt-AO (Angola)" está colocada a ordem "pt-BR pt-PT" e não "pt-PT pt-BR" tal como os restantes casos similares. Qual a justificação para tal? Grato, FilipeFalcão (discussão) 09h43min de 28 de maio de 2016 (UTC)Responder

@FilipeFalcão: ver Especial:Diff/20577682 para o motivo de ter colocado pt-BR antes de pt-PT na tabela, e Wikipédia:Dicionário/pt-AO para atualizar a lista de conversões que o gadget utiliza. Helder 17h39min de 28 de maio de 2016 (UTC)Responder
@Helder: Concordo com forma que o Zorglub apresenta situação mas apenas na vertente da gramática (como na utilização de gerúndios, p.e.) e naturalmente na utilização de termos locais (como machimbombo, p.e.) para determinadas palavras. Não existe no PT-AO uma rigidez na estrutura tão agrilhoante como no PT-PT. Agora daí a colocar tudo em PT-BR depois daquilo que, na prática, foram centenas de anos de aculturação PT-PT é pedir muito. [Veja este regulamento] que encontrei numa busca rápida numa universidade de Angola (Faculdade de Ciências Sociais) e repare que, para além de se utilizar o acordo de 1945, são utilizados termos como "económico", "lectivos" ou "adaptações". Ou então [esta notícia da Agência Anogol Press] onde se pode encontrar "objectivo" ou "fenómeno". Ou ainda esta legislação oficial onde encontramos "actos", "indirecta", "genérico", "rectificações" ou "Assembleia". Tudo palavras PT-PT. Creio de esta compilação de caso que recolhi rapidamente dá para justificar que a situação seja alterada. Grato, FilipeFalcão (discussão) 20h34min de 28 de maio de 2016 (UTC)Responder
@He7d3r: Novidades? Contraditório? Devo ir a outro local?

:::Já agora, reparei que, só na página eletrão, não faz

  1. "síncrotron"->"sincrotrão"
  2. "positrônio"->"positrónio"
  3. "pósitron"->"positrão"
  4. "elétron-pósitron"->"eletrão-positrão"
  5. "magneton"->"magnetão"
  6. "betatron"->"betatrão"
  7. "eletrons"->"eletrões" (plurais)
  8. "fótons"->"fotões"
  9. "eletrons"->"eletrões"
  10. "leptons"->"leptões"
  11. "antiprótons" "antiprotões".
Txus, FilipeFalcão (discussão) 20h45min de 14 de julho de 2016 (UTC)Responder
É melhor utilizar a discussão específica para discutir eventuais inclusões e remoções nos dicionários usados pelo gadget.
(esta página aqui seria para uma meta-discussão - uma "discussão sobre a discussão" sobre o conversor). Helder 14h33min de 15 de julho de 2016 (UTC)Responder

O que é feito disto?[editar código-fonte]

O que aconteceu a isto? quando vai ser ativado? Uma pergunta (discussão) 19h07min de 11 de março de 2023 (UTC)Responder