Wikipédia Discussão:Projetos/Acordo ortográfico/Automatizar

O conteúdo da página não é suportado noutras línguas.
Origem: Wikipédia, a enciclopédia livre.
Arquivo: 1


Nova fase: eliminação de trema em 5 de janeiro[editar código-fonte]

Gostaria que todos os envolvidos nas diferentes fases do projeto sobre o Acordo Ortográfico 1990 ajudassem-nos a pensar a melhor forma de desenvolver o bot para trema, cuja mudança está prevista para ser começada já em 05/01.

Aqui há alguma discussão já encetada. Poderíamos aproveitar as sugestões ali colocadas. Cumprimentos. --tony :: jeff ¿ 01h06min de 2 de janeiro de 2010 (UTC)[responder]

Sugestão (pois de bots quase nada entendo): criar a regra geral para "güe", "qüe", "güi", "qüi" (não simplesmente para "ü") e os outros poucos casos (?) em que ocorra trema em língua portuguesa, e pensar nas raríssimas exceções estrangeiras que seriam afetadas para esses casos ("München", "Müller" e "Würtemberg", por exemplo, não entrariam, pois se trata aqui apenas de "güe", "qüe", "güi", "qüi" e afins). --tony :: jeff ¿ 01h19min de 2 de janeiro de 2010 (UTC)[responder]
No próprio AWB dá pra por as configurações para modificar o "güe", "qüe", "güi", "qüi", mas um bot é mais prático. É só adquirir o consenso aqui e falar com o pessoal da coordenação robótica. Gustavo Siqueira MSG 06h42min de 2 de janeiro de 2010 (UTC)[responder]
A opção de um bot para modificar os "güe", "qüe", "güi", "qüi" é a ideal, e simples e restrita o suficiente para não criar demasiados falsos positivos. Mesmo assim há problema com alguns nomes espanhóis como Güer Aike, e artigos que digam respeito à história dos acordos ortográficos, inclusive esta página de discussão.JF (discussão) 13h28min de 2 de janeiro de 2010 (UTC)[responder]
Ainda acho essa regra fraca demais. Só uma pesquisa pelo título de páginas q começam com Güe, tem Güejar Sierra - Güer Aike (departamento) - Güesa - Güevéjar - Güeñes. 5. Não tem como fazer uma lista das exceções, pq não tem como prever todos os nomes próprios que podem ter o trema, e deve ser mt maior que a lista de mudanças. O mais fácil e confiável mesmo é fazer a detecção completa da palavra. Rjclaudio msg 14h16min de 2 de janeiro de 2010 (UTC)[responder]
Concordo. Onde poderíamos desenvolver essa lista? --tony :: jeff ¿ 00h59min de 3 de janeiro de 2010 (UTC)[responder]

Todas as palavras da lista abaixo já foram adicionadas ao meu script do awb. Esperando outras. Rjclaudio msg 14h22min de 16 de fevereiro de 2010 (UTC)[responder]

Lista de palavras com trema a alterar[editar código-fonte]

(Em construção)

  • ágüe → águe
  • agüemos → aguemos
  • agüentar → aguentar
  • alcagüete → alcaguete
  • ambigüidade → ambiguidade
  • Anhangüera → Anhanguera
  • antigüidade → antiguidade
  • antiqüíssimo → antiquíssimo
  • apazigüemos → apaziguemos
  • apropinqüe → apropinque
  • aqüicultura → aquicultura
  • argüição → arguição
  • argüir → arguir
  • Barigüi → Barigui
  • Birigüi → Birigui
  • bilingüismo → bilinguismo
  • Cangüera → Canguera
  • cinqüenta → cinquenta
  • cinqüentenário → cinquentenário
  • cirigüela → ciriguela
  • conseqüência → consequência
  • contigüidade → contiguidade
  • delinqüem → delinquem
  • delinqüência → deliquência
  • delinqüir → delinquir
  • desmilingüir → desmiliguir
  • eloqüência → eloquência
  • eloqüente → eloquente
  • enxágüe → enxágue
  • eqüestre → equestre
  • eqüidistante → equidistante
  • eqüitativo → equitativo
  • exeqüível → exequível
  • freqüência → frequência
  • freqüentado → frequentado
  • freqüentar → frequentar
  • freqüente → frequente
  • Guaratingüetá → Guaratinguetá
  • grandiloqüência → grandiloquência
  • inexeqüível → inexequível
  • Inhangüera → Inhanguera
  • lingüiça → linguiça
  • lingüística → linguística
  • liqüidação → liquidação
  • liqüidar → liquidar
  • liqüidificador → liquidificador
  • líqüido → líquido
  • multilíngüe → multilíngue
  • obliqüidade → obliquidade
  • Pariqüera → Pariquera
  • Piaçagüera → Piaçaguera
  • pingüim → pinguim
  • qüestão → questão
  • qüestionamento → questionamento
  • qüestionar → questionar
  • qüestionário → questionário
  • qüestiúncula → questiúncula
  • qüindecágono → quindecágono
  • qüingentésimo → quingentésimo
  • qüinqüagésimo → quinquagésimo
  • qüinqüenal → quinquenal
  • qüinqüênio → quinquênio
  • qüinqüídio → quinquídio
  • qüiproquó → quiproquó
  • redargüir → redarguir
  • sagüi → sagui
  • sangüinário → sanguinário
  • sangüíneo → sanguíneo
  • sarigüéia → sarigueia
  • seqüela → sequela
  • seqüência → sequência
  • seqüestro → sequestro
  • seqüestrador → sequestrador
  • Tabatingüera → Tabatinguera
  • tranqüilidade → tranquilidade
  • tranqüilo → tranquilo
  • ubiqüidade → ubiquidade
  • ungüento → unguento

Lista de radicais com trema[editar código-fonte]

Para que a lista não se estenda ao infinito, acho que poderíamos identificar alguns radicais que dificilmente se repetirão noutra língua. Isso porque muitas palavras são meras variações de uma principal. --tony :: jeff ¿ 11h32min de 3 de janeiro de 2010 (UTC)[responder]

  • cinqüen
  • eqüi
  • freqü
  • güera
  • igüi
  • liqüi
  • qüest
  • qüin
  • sangüi
  • seqüestr
  • tranqüil

Nova fase: paroxítonas com ditongo tônico "ei" (fevereiro)[editar código-fonte]

Similar ao caso do trema, vamos montar uma lista de palavras com éi para os bots mudarem. Rjclaudio msg 14h22min de 16 de fevereiro de 2010 (UTC)[responder]

  • açotéia
  • alcatéia
  • aléia
  • altéia
  • amenorréia
  • amoréia
  • apnéia
  • arctogéia
  • aréia
  • arrotéia
  • assembléia
  • astrapéia
  • astréia
  • ataléia
  • atéia
  • atopomenorréia
  • azaléia
  • balanorréia
  • basiléia
  • batipnéia
  • bibliorréia
  • blenorréia
  • bobéia
  • boléia
  • bradimenorréia
  • bradipnéia
  • braquipnéia
  • bromomenorréia
  • bruguéia
  • buddléia
  • caldéia
  • cananéia
  • caribéia
  • cassiopéia
  • catléia
  • cefaléia
  • centopéia
  • circéia
  • cirenéia
  • colméia
  • combléia
  • Coréia
  • coriféia
  • coroidéia
  • corvéia
  • cotréia
  • criptomenorréia
  • dacriorréia
  • déia
  • diarréia
  • dionéia
  • dismenorréia
  • dispnéia
  • dragéia
  • dragontéia
  • dulcinéia
  • edéia
  • éia
  • enéias
  • epiquéia
  • epopéia
  • esclaréia
  • espermatorréia
  • esteatorréia
  • estréia
  • etnodicéia
  • etopéia
  • eubéia
  • eupnéia
  • européia
  • fariséia
  • farmacopéia
  • ferropéia
  • filistéia
  • galactorréia
  • galatéia
  • galiléia
  • garatéia
  • gastrorréia
  • geléia
  • gonorréia
  • graforréia
  • gragéia
  • grajéia
  • grangéia
  • granjéia
  • gratéia
  • griféia
  • hacanéia
  • hebréia
  • heliéia
  • hemitritéia
  • hepatorréia
  • hidrorréia
  • hiléia
  • hipermenorréia
  • hiperpnéia
  • hipopnéia
  • idéia
  • incréia
  • ipoméia
  • jacobéia
  • judéia
  • lampréia
  • lebréia
  • leréia
  • leucorréia
  • logorréia
  • mauricéia
  • medorréia
  • melanorréia
  • melopéia
  • menorréia
  • mesogléia
  • metrorréia
  • montéia
  • moréia
  • morféia
  • nabatéia
  • napéia
  • neogéia
  • ninféia
  • nopaléia
  • notogéia
  • odisséia
  • onomatopéia
  • ortopnéia
  • otorréia
  • panacéia
  • pangéia
  • paranéia
  • patuléia
  • paulicéia
  • péia
  • pigméia
  • piorréia
  • platéia
  • plebéia
  • pnéia
  • poliantéia
  • pompéia
  • pornéia
  • potéia
  • potentéia
  • potréia
  • prosopopéia
  • rafaméia
  • réia
  • rinorréia
  • ritmopéia
  • sabéia
  • saducéia
  • sariguéia
  • sarigüéia
  • seborréia
  • sialorréia
  • sotéia
  • surinéia
  • taquipnéia
  • teodicéia
  • tetéia
  • tirapéia
  • traquéia
  • tutaméia
  • uréia

Nova fase: hiato "ôo" (março)[editar código-fonte]

  • abençôo
  • côo
  • corôo
  • dôo
  • enjôo
  • magôo
  • môo
  • perdôo
  • povôo
  • vôo
  • zôo

Nova fase: "i" e "u" tônicos em paroxítonas quando precedidos de ditongo (março)[editar código-fonte]

  • apóio
  • baiúca
  • bocaiúva
  • boiúno
  • cheiínho
  • feiúme
  • feiúra
  • saiínha