Wikipédia:Esplanada/geral/Proliferação de categorias com poucos itens (30nov2021)

Origem: Wikipédia, a enciclopédia livre.

Proliferação de categorias com poucos itens (30nov2021)

Parte 1[editar código-fonte]

Após anos de experiência na Wikipédia, parece que sempre me encontro debatendo os mesmos temas com os mesmos utilizadores, o que me leva a acreditar que às vezes estou simplesmente perdendo meu tempo. Para este caso em específico, recordo-me do Luan, por exemplo.

Embora exista opiniões divergentes sobre algumas funções das categorias, o guia de edição elenca uma série de situações cuja a criação duma categoria não é recomendada, como poucos elementos desde que o criador saiba de antemão que já existem mais elementos que só faltam serem ligados. No entanto, observasse exatamente o oposto: uma proliferação de categorias com no máximo dois ou três itens. Para deteriorar a situação, essas categorias são criadas por utilizadores experientes e muitas vezes sem condições de manutenção já que não existem mais itens para ser categorizados. Posso citar dois exemplos, aproveitando para convidá-los já que ambos sempre se comprometem a dialogar: Hermógenes Teixeira Pinto Filho (este) e Eric Duff (este).

Pois bem, questiono: quais os motivos para essa quantidade elevada de categorias que desrespeitam um dos seis itens presentes no guia de edição? Quais os motivos disso acontecer com editores experientes? Termino a proposição ressaltando que ambos os utilizadores citados são meros exemplos dentre muitos, sendo que alguns criaram milhares de categorias passíveis de eliminações. Além do mais, este problema não é o único já que todos os seis itens do guia são desrespeitados com frequência. Edmond Dantès d'un message? 01h32min de 1 de dezembro de 2021 (UTC)[responder]

Observo que há categorias que começam com poucos itens, mas que tendem a ter mais itens, mas para isso é preciso criar os artigos, o que exige tempo.--Raimundo57br (discussão) 11h38min de 1 de dezembro de 2021 (UTC)[responder]

Como bem mencionado nos comentários iniciais, existem "opiniões divergentes" e "não é recomendado" mas não é impositivo a criação de categorias com poucos itens por não ser útil, vem a pergunta por que são criadas então? Pelo simples fato que muitas delas estão em links vermelhos pedindo criação e outras muitas fazem parte de séries datadas que demandam complementação, cuja inexistência mais complica do que ajuda, pois dá liberdade a "invenção" de novas categorias ou ainda a omissão pela não categorização. Regras são regras e por princípio devem ser seguidas, entretanto o bom senso deve prevalecer superando a métrica. Cabe também uma segunda pergunta: É melhor um link vermelho ou um artigo sem categoria do que uma categoria com poucos itens? No caso específico mencionado (com apenas 1 item), foi o resultado de um esforço de edição na tentativa de criar datas para eventos em todos os estados do Brasil, algo que era precário anteriormente, com a base criada eu acreditava que esse tipo de categorização pudesse ser incluída rotineiramente, algo que aconteceu com a categoria:Anos em Mato Grosso do Sul, mas não com Categoria:Fundações em Mato Grosso do Sul por ano, não dá para acertar em tudo. A premissa: Uma categoria com muito poucos elementos é muito pouco útil, a não ser que se saiba de antemão que existem já na Wikipédia mais elementos que só faltam serem ligados, ou seja, a não ser que se saiba que a categoria ficará com poucos elementos durante pouco tempo. não foi alcançada pois "Fundações por estado" ainda é ignorada pela maioria dos editores. Como em Wikipédia:Cinco pilares é mencionado "A Wikipédia não possui regras fixas" a recomendação de quantidade talvez deva ser revista e abandonada, mas Wikipédia:Seja audaz não, pois não partir para a criação de coisas novas significa ficar para atrás obedecendo apenas regras. HTPF (discussão) 12h30min de 1 de dezembro de 2021 (UTC)[responder]

@Hermógenes Teixeira Pinto Filho: sinceramente não me parece lógico proliferar categorias com poucos itens se a função do recurso é facilitar a navegação do leitor. Em outras palavas, seria uma lógica semelhante à aplicada para as predefinições de navegação. O exemplo que mencionei, a categoria "Fundações por estado", até pode ser uma tentativa válida e de boa-fé; contudo, questiono as milhares de categorias criadas entre 2016 e 2018, período que houve uma criação massiva de categorias. Portanto, os exemplos mencionados são meros exemplos. O problema está nas categorias que elenca igrejas duma cidade que possui no máximo duas igrejas ou que elenca os torneios de futebol dum estado brasileiro por ano, estado que somente teve um torneio disputado naquele ano. Edmond Dantès d'un message? 00h14min de 4 de dezembro de 2021 (UTC)[responder]
É provável que você tenha razão, categorias não são a melhor solução para ajudar na navegação entre artigos, uma barra de navegação quando possível, supera em muito uma categoria apesar de alguns editores acharem que uma barra de navegação polui visualmente um artigo. Categorias servem para agrupar, catalogar e classificar, concordo no exemplo citado, que o esforço para criar uma categoria de igrejas, (listada em Categorias inexistentes) de uma cidade com um ou dois itens é maior que o benefício, mas não vejo em que isso prejudica ou torna a Wikipédia pior ou mais desorganizada (respeitando a Árvore de categorias). Quanto as séries temporais ou se cria, ou vamos poluir os artigos com links vermelhos sempre sujeitos a serem apagados, ou pior ainda, deixamos de categorizar, ou ainda um editor criativo acrescenta uma nova categoria com um título fora do padrão em uso com a mesma finalidade. HTPF (discussão) 14h41min de 4 de dezembro de 2021 (UTC)[responder]

Olá Conde Edmond Dantès, tudo bem? O que eu observo são diferentes formas de abordagem do tema, sendo que umas são melhores que outras dependendo da situação... Há quem prefira encher uma categoria e, depois, reorganizar os artigos já existentes em sub-categorias, e há quem prefira criar logo as sub-categorias, o que faz com que vá existindo sub-categorias com dois ou três artigos... Honestamente já fiz ambas as coisas... não vejo nenhuma delas como errada... Por vezes dá mais gente fazer de uma forma ou de outra...
Mas, olhando para o ponto 1, onde diz "não ser que se saiba que a categoria ficará com poucos elementos durante pouco tempo", o que quer dizer "pouco tempo"? No ponto 2, onde diz "É mais fácil e mais eficaz decidir", dá a entender que só seguimos a facilidade e eficácia se quisermos, pois temos liberdade de ir por um caminho mais difícil...
Então... Podendo cada um de nós escolher a abordagem, onde está o problema? Luís Almeida "Tuga1143 12h40min de 1 de dezembro de 2021 (UTC)[responder]

Fiz uma contagem das categorias para ajudar na discussão, excluindo as categorias que começam com "!", 23111 estão vazias, 80017 têm somente uma página, 122121 têm entre 2 e 5 páginas, 47100 têm entre 6 e 10 páginas, 34267 têm entre 11 e 20 páginas e 37574 têm mais que 20. Dá para ver as categorias vazias por esta página especial. Me parecem muitas categorias vazias e com poucas páginas, mas não tenho opinião formada ainda quanto a isso ser um problema. Danilo.mac(discussão) 14h17min de 1 de dezembro de 2021 (UTC)[responder]

Das vazias, cerca de 15 mil são redirecionamentos de categoria. GoEThe (discussão) 23h32min de 3 de dezembro de 2021 (UTC)[responder]
Este era um dos meus questionamentos ao Danilo.mac já que existe muitas categorias de redirecionamentos que servem para evitar recriações. Por outro lado, acredito ser relevante ressaltar que muitos eliminadores esquecem de verificar as categorias das páginas eliminadas e isso fatalmente resultou em várias categorias vazias. Talvez seja necessário incluir as categorias nos afluentes ou criar uma ferramenta que verifica as categorias vazias como ocorre com as páginas de discussões órfãs. Edmond Dantès d'un message? 23h55min de 3 de dezembro de 2021 (UTC)[responder]
Têm razão, esqueci de excluir os redirecionamentos de categoria, fiz esta query adicionando a exclusão, e de fato ficou com 15 mil a menos nas vazias. Mesmo com a correção, 8 mil vazias e 80 mil com só uma página ainda me parece muito. Na minha opinião é um problema de baixa prioridade comparado com outros problemas de manutenção, mas se existir alguma solução simples pode valer a pena tentar resolver. Danilo.mac(discussão) 01h35min de 4 de dezembro de 2021 (UTC)[responder]
@Danilo.mac: embora "prioridade" seja subjetividade, esta situação incomoda-me mais do que deveria. Uma solução simples seria eliminar em massa as categorias vazias e usar um robô para recategorizar os "solitários"; contudo, vejo este caso como um icebergue. Como assim? Primeiro, o item seis do guia de edição continua sendo exaustivamente desrespeitado. Como exemplo, cito esta categoria, que somente não está tão ruim porque passei alguns meses organizando-a, mas antes da minha intervenção havia os principais campeonatos intercontinentais junto com um bando de campeonatos estaduais brasileiros que estavam categorizados em outras subcategorias. Há também exemplos de raízes precárias, como este. Enfim, esses exemplos se repetem... Edmond Dantès d'un message? 03h38min de 4 de dezembro de 2021 (UTC)[responder]
@Conde Edmond Dantès: Com prioridade baixa eu quis dizer que faz menos mal para os artigos do que por exemplo a falta de fontes. Eu me incomodo também com as categorias mal organizadas, o primeiro projeto que desenvolvi na Wikipédia foi o Projeto Categorias (há 12 anos atrás), e também fiz um script para identificar loops de categorias numa tentativa de eliminar os loops para deixar a árvore de categoria mais organizada, e nos dois casos as tarefas acabaram sendo abandonadas por falta de voluntários dispostos a realizá-las. Essas experiências me ensinaram que organizar categorias é um trabalho mais difícil do que aparenta ser no começo, e não é fácil de ser robotizado devido às subjetividades e à falta de padronização. Antes de usar robô é necessário um trabalho humano de identificação de padrões e criação de regras objetivas para o robô seguir, se conseguirmos criar essas regras talvez seja possível resolver o problema, ou pelo menos parte dele. Danilo.mac(discussão) 13h34min de 4 de dezembro de 2021 (UTC)[responder]
Minha experiência é que muitos editores da "turma do marketing" acreditam que ter uma categoria com o nome da empresa ajuda no SEO, então criam o artigo Empresa X e imediatamente a categoria Empresas X ou Empresas do Grupo X. A mesma ideia vale para artistas, jogadores, etc. A solução talvez seja impedir criação de categorias por novatos com menos de 500 edições ou que não sejam auto confirmados estendidos. Jo Loribd 18h50min de 1 de dezembro de 2021 (UTC)[responder]

Parte 2 (4-dez-2021)[editar código-fonte]

A questão fulcral nesta discussão é a seguinte: alguém acredita seriamente que uma árvore de categorias em que a maior parte dos seus membros tem 2 ou 3 artigos (mas o pior é que há imeeeensos caso em que só têm UM artigo) tem alguma utilidade?
Para mim é óbvio que quem ache tal coisa nunca se deu ao trabalho de tentar encontrar artigos com base em categorias! Nem tão pouco tentar encontrar todas as categorias existentes em que um artigo deve estar, pois para muitos editores, categorizar é encontrar uma categoria e já está, as outras que sejam os outros a procurá-las. Aliás suspeito que é este tipo de preguiça que está na base da criação de muitas categorias — "puxa, que chatice, a categoria X da EN não existe cá; bora aí criá-la; o quê? tem que se criar uma ávore com vários níveis; bora fazer isso..."
E, evidentemente que não é coincidência que muitos (não digo todos, mas a larga maioria) dos que gostam imenso de criar essas categorias sem artigos raramente se dão ao trabalho de procurar os artigos existentes que podem (devem!) estar nessas categorias. É a trapalhada do costume: cria-se uma categoria ao acaso ou copiada da EN, mete-se lá o artigo que se quer categorizar e, ala que se faz tarde, porque isso de categorizar dá um trabalhão imenso.
Será que não se dão conta que o trabalho que têm, em vez de ajudar a organizar só aumenta a barafunda, tornando completamente inúteis certas árvores de categorias??? Não percebem que é muito mais útil pegar numa árvore de categorias e fazer o trabalho do início ao fim, nomeadamente começando por ver quantos artigos há sobre o tema mais genérico e só depois decidir sobre quais as categorias que devem existir?
Veja-se por exemplo em que tropecei mesmo agora (que está longe de ser dos piores, pois há alguns casos em que tem que se percorrer 3 e 4 níveis de categorias para chegar a categorias com um ou dois artigos): Categoria:Arrondissements da Bélgica — há 4(!) páginas e 3 categorias!
Outro péssimo hábito recorrente é a criação de categorias para municípios para lá criar uma "Nascidos em", que em muítissimos caso só tem um ou dois artigos. Muitas vezes isso ocorre até em situações em que wikis com muito mais artigos sobre os municípios não têm categoria. --Stego (discussão) 00h34min de 4 de dezembro de 2021 (UTC)[responder]

E vale mencionar também que existem ferramentas como o PetScan e as queries SPARQL do Wikidata para fazer cruzamentos de dados, não dependemos de categorias tão específicas para encontrar quem nasceu em um determinado lugar ou para encontrar eventos específicos de um determinado ano. Poderíamos colocar predefinições com links para essas ferramentas em categorias mais amplas para ajudar quem quiser encontrar subconjuntos mais específico de artigos. Danilo.mac(discussão) 01h35min de 4 de dezembro de 2021 (UTC)[responder]
@Stego: interessante, eu não estava a considerar esta possibilidade. Pelo o que eu consegui observar, ocorreu uma preocupação maior em estruturar as raízes sem se preocuparem se haveria itens. No entanto, este cenário mencionado por você é muito provável. Edmond Dantès d'un message? 03h23min de 4 de dezembro de 2021 (UTC)[responder]
@Conde Edmond Dantès: com toda aquela conversa possivelmente acabei por não frisar o mais importante: quer-me parecer que há principalmente duas razões para a proliferação de categorias e, pior ainda, ramos de categorias, com pouquíssimos artigos. E ambas são provenientes de gente bem intencionada (mas vezes os bem intencionados são os que causam mais estragos).
Uma das razões é tentar (pré)criar uma estrutura coerente para ir enchendo.
A outra razão (esta mais trapalhona, mas talvez não mais danosa) é criar uma ou várias categorias para que um determinado artigo não fique em categorias muito genéricas.
Só que ambas as situações originam, em muitíssimos casos, ramos de categorias muito esparsas, com utilidade negativa (porque tornam os artigos mais difícies de encontrar do que se estivessem em categorias mais genéricas). É o que se chama construir a casa pelo telhado...
Categorias são um pouco como indíces, pelo que o detalhe deve ser o adequado à informação existente. Por exemplo, se num município brasileiro tem sentido haver uma dúzia de categorias porque há muitos artigos, para alguns países meia dúzia de categorias já são muitas devido a haver poucos artigos. Que sentido faz, por exemplo, haver n categorias e subcategorias para "Construções de Fimdomundolândia" quando só há 1 ou 2 artigos de cada tipo de construção em Fimdomundolândia? Qual é a utilidade de ter n categorias para "Ano Y no País Z" se os artigos que têm sentido categorizar em anos no País Z são poucos e distribuídos por vários anos? E neste último caso, possivelmente há vários níveis de categorias, do tipo "Ano Y na política do País Z", "Ano Y no cinema do País Z", etc...
Suspeito que quem cria as categorias pensa "se na EN (ou noutra grande wiki) têm esta categoria, então no futuro vamos precisar também". Nos meus primeiros anos eu daria algum crédito a isso, mas o facto é que há algumas áreas temáticas que na nossa wiki se expandem muitíssimo devagar e todos os dias tropeço em categorias que me lembro de ter questionado e pensado em fundir há vários anos (por vezes 10 ou mais). --Stego (discussão) 04h15min de 4 de dezembro de 2021 (UTC)[responder]
@Stego: desta vez concordamos então. Somente um adendo, no meu caso tropeço em categorias que me lembro de ter questionado e pensado em fundir há vários anos e ainda questiono a manutenção de inúmeros verbetes categorizados e não acabo fazendo nada. Edmond Dantès d'un message? 10h11min de 5 de dezembro de 2021 (UTC)[responder]
Faço um complemento: nos últimos meses comecei a editar alguns verbetes relacionados ao estado brasileiro de Mato Grosso do Sul. Dito isso, resolvi re-estruturar a categoria Década de 2010 em Mato Grosso do Sul adicionando itens das categorias de anos. No processo observei uma quantidade significativa de verbetes não categorizados, o que mudou completamente o contexto e precisei recriar algumas categorias.
Por conseguinte, questionei: i) quantos casos semelhantes a este existem na Wikipédia? ii) será que os criadores dessas categorias estão criando a árvore com o intuito de deixar os outros a tarefa de preenche-las? Edmond Dantès d'un message? 16h18min de 5 de dezembro de 2021 (UTC)[responder]

Mais uma query para ajudar na discussão. Essas são amostras de categorias vazias e com poucas páginas. Isso deve ajudar a criar regras do que não se deve fazer, e também ajudar a encontrar padrões para serem usado por robôs para reorganizar as categorias. Danilo.mac(discussão) 15h51min de 4 de dezembro de 2021 (UTC)[responder]

Quando o bot apagar uma categoria com 1 artigo, o artigo vai passar a pertencer à categoria da qual a categoria apagada era subcategoria?--Raimundo57br (discussão) 19h17min de 4 de dezembro de 2021 (UTC)[responder]
Não, quando uma categoria é eliminada os artigos continuam apontando para ela, e ela vai aparecer no rodapé do artigo como um link vermelho. Antes de eliminar uma categoria é preciso recategorizar todos os seus artigos, o que nem sempre é algo simples. Diferentes artigos podem precisar ser recategorizados em diferentes categorias, as vezes em uma categoria que não está diretamente acima da categoria que está sendo eliminada. Por exemplo, a categoria:1819 no jornalismo está nas categorias "1819" e "Jornalismo por ano", nenhuma dessas é adequada para recategorizar o único artigo dela 1819 no jornalismo, o correto seria ir para "Jornalismo". Essa é a principal dificuldade para criação de um robô que elimine categorias, ensinar o robô como recategorizar. Danilo.mac(discussão) 20h49min de 4 de dezembro de 2021 (UTC)[responder]
Pensando melhor sobre o problema, uma solução simples seria fazer o robô simplesmente remover a categoria do artigo, e deixar para que editores adicionem uma categoria mais adequada depois. O robô pode gerar uma lista das categorias com 0, 1 ou 2 páginas, um mês depois gera a mesma lista e compara com a anterior, as categorias que continuarem com um número igual ou menor de páginas são esvaziadas e eliminadas (diretamente ou colocando {ER|C1}). Esse mês de espera dá o tempo necessário para os que têm de fato intenção de encher a categoria, já aqueles que não tem essa intenção, só de saber que tem um robô que faz isso periodicamente já vai fazer eles pensem duas vezes antes de criar uma categoria com poucas ou nenhuma página. Danilo.mac(discussão) 00h21min de 5 de dezembro de 2021 (UTC)[responder]
@Danilo.mac: concordo que a tarefa de desenvolver um robô para este problema seja difícil devido às subjetividades e à falta de padronização; contudo, desconsidero manter a categoria inexistentes nos verbetes como uma situação benéfica já que pode incentivar recriações sob a lógica de "melhor (re)criar a categoria para o verbete não ficar com uma marca vermelha".
Sobre a segunda sugestão de gerar uma lista de categorias é uma iniciativa interessante já que vai criar um "sistema" (o robô) que marcará automaticamente tais categorias para eliminação. De todo modo alguns pontos precisam ser debatidos, como por exemplo se a quantidade de categorias indicadas para ER não vai sobrecarregar os eliminadores.
O correto mesmo exigir da comunidade, pelo menos, um trabalho humano de listagem. Como assim? Organizar as tarefas do robô, indicando as categorias que devem ser removidas ou inseridas nos verbetes.
Mesmo assim, não creio que seja algo unânime. Edmond Dantès d'un message? 10h44min de 5 de dezembro de 2021 (UTC)[responder]
Não seria melhor e mais produtivo revisar a Árvore de categorias, propondo para eliminação as que não fazem sentido, são redundantes ou de pouca ou nenhuma aplicação. Já que temos um número considerável de categorias vazias, uma força tarefa não poderia sistematizar a eliminação destas categorias.HTPF (discussão) 16h48min de 5 de dezembro de 2021 (UTC)[responder]
@Hermógenes Teixeira Pinto Filho: talvez concordamos com este ponto e essa "força tarefa" que menciona se assemelha a listagem citada por mim. Qual a sugestão? Edmond Dantès d'un message? 17h04min de 5 de dezembro de 2021 (UTC)[responder]
A lista que eu me refiro são as 8018 categorias vazias identificadas pelo editor @Danilo.mac: [1]. Acredito que ele consiga gerar uma lista nominal e talvez seja possível propor a eliminação por blocos, mesmo assim exigirá um trabalho braçal que eventualmente poderá ser ajudado por um bot. O primeiro passo é a lista com os nomes das categorias zeradas. Quanto as demais categorias (com 1 ou mais itens) trago a seguinte questão: 1 categoria com 1 item, que é uma subcategoria, e esta subcategoria tem vários itens. Pode ser que as subcategorais contidas por outras, mascarem as estatísticas e levem a conclusões erradas. Em outras palavras uma categoria com poucos itens que contenha uma outra categoria cumpre a sua finalidade. HTPF (discussão) 12h55min de 6 de dezembro de 2021 (UTC)[responder]
E qto às categorias como "nascidos em "cidade x"", esse tipo de categoria tende a crescer com o tempo, mas isso não deve ser exigido de imediato.--Raimundo57br (discussão) 16h52min de 5 de dezembro de 2021 (UTC)[responder]

Parte 3 (9-dez-2021)[editar código-fonte]

Criei a ferramenta Categorias para listar as categorias vazias, a lista é limitada a 2000 categorias. Eu percebi que aquela query que mostrava 8 mil categorias vazias estava incluindo categorias que já existiram mas foram eliminadas, excluindo essas eliminadas ficamos com 5 mil categorias vazias. Ao olhar a lista percebi que existem muitas categorias que podem estar vazias e não começam com "!" nem são redirecionamentos, como as "Itens candidatos à eliminação/...", uma ideia para lidar com isso é criar uma categoria:!Categorias que podem estar vazias (ou algum outro nome parecido) e categorizar essas categorias lá através das predefinições que são usadas nelas, com isso eu posso fazer a ferramenta excluir essas da lista também. Danilo.mac(discussão) 15h36min de 9 de dezembro de 2021 (UTC)[responder]

Tem muitas categorias do tipo Categoria:Itens candidatos à eliminação/12 de fevereiro que não devem ser apagadas mesmo (temporariamente) vazias. Há alguma predefinição para as marcar (e excluir desta ferramenta)? GoEThe (discussão) 16h30min de 9 de dezembro de 2021 (UTC)[responder]
Ups, não tinha lido a mensagem anterior até ao fim. GoEThe (discussão) 16h31min de 9 de dezembro de 2021 (UTC)[responder]
Mas respondendo à minha própria pergunta: {{Categoria possivelmente vazia}}. GoEThe (discussão) 16h33min de 9 de dezembro de 2021 (UTC)[responder]
muito bom ! Danilo. Obrigado. Ia escrever que as categorias que essa ferramenta apresenta são caso óbvios de WP:ER#C1, que nem vale a pena discutir, mas sendo isso verdade para a maioria delas ou até para todas (exceto desambigs e categorias de manutenção ou afins, que deveriam estar marcadas com {{Categoria possivelmente vazia}}), há casos, como Categoria:Planetóides que podem dar pistas para categorizações mal feitas.
Entretanto talvez fosse boa ideia se aproveitássemos esta discussão para chegar a um consenso do tipo: "categorias ou árvores de categorias que contenham menos de X artigos (onde o X pode começar por ser pequeno, por exemplo 3), podem ser eliminadas após os artigos respetivos e eventuais subcategorias envolvidas tenha sido recategorizados em categorias superiores; isto se se verificar previamente que não há artigos deveriam estar nessas categorias potencialmente candidatas a serem eliminadas".
Se houvesse consenso para uma coisa desse tipo, os editores que tivessem alento para reestruturar árvores de categorias com poucos artigos têm argumentos mais fortes para contestar quem venha reverter essas reestruturações. --Stego (discussão) 16h49min de 9 de dezembro de 2021 (UTC)[responder]
Eu coloquei agora a ferramenta para excluir as categorias que estão na categoria:!Categorias vazias que não devem ser eliminadas, que é adicionada pela {{Categoria possivelmente vazia}}. Com isso eu percebi que muitas categorias saíram da lista, mas algumas em que a predefinição foi adicionada recentemente, como as "Itens candidatos à eliminação/...", ainda estão listadas, acredito que deve ser uma questão de cache e que elas vão sair da lista em breve. Danilo.mac(discussão) 18h59min de 9 de dezembro de 2021 (UTC)[responder]
@Danilo.mac e Stego: creio que o primeiro passo poderia ser eliminar as categorias vazias que não sejam redirecionamentos. Posteriormente podemos discutir sobre a árvore. Uma boa solução seria discutir a estrutura das categorias por temas. Edmond Dantès d'un message? 16h16min de 12 de dezembro de 2021 (UTC)[responder]
muito bom ! --Stego (discussão) 16h48min de 12 de dezembro de 2021 (UTC)[responder]
Cabe observar que as árvores de subcategorias surgem para evitar que existam categorias muitos grandes, desse modo, surgem categorias do tipo "atributo "x" por país"--Raimundo57br (discussão) 16h53min de 12 de dezembro de 2021 (UTC)[responder]
Não há nada nas regras atuais que impede a existência de categorias com muitos itens. Portanto, vejo como enorme engano caso estejam criando árvores de subcategorias como forma de diminuir a quantidade de "categorias grandes". O que não podemos é tolerar má categorização. Edmond Dantès d'un message? 17h00min de 12 de dezembro de 2021 (UTC)[responder]
Ocorre que se costuma dividir categorias em subcategorias a partir do entendimento de que categorias com muitos itens também não não desejáveis.--Raimundo57br (discussão) 20h15min de 12 de dezembro de 2021 (UTC)[responder]
Não vejo lógica em prosseguir esta discussão já que desvia da pauta: categorias com poucos itens e vazias. Edmond Dantès d'un message? 20h18min de 12 de dezembro de 2021 (UTC)[responder]
Não há qualquer desvio, essa discussão surge para debater uma das causa da criação de categoria com poucos itens: a subdivisão de categoriais com muitos itens em subcategorias por "país".--Raimundo57br (discussão) 20h22min de 12 de dezembro de 2021 (UTC)[responder]
Eu concordo que a divisão de categorias muito grandes pode ter sido a razão que levou à criação de muitas categorias vazias, existe até a {{categoria grande}} para marcar essa necessidade. Mas o problema é quando a divisão é feita criando subdivisão que têm poucos ou nenhum artigo para colocar. O que deveríamos fazer na minha opinião é criar uma regra que defina como dividir categorias grandes sem criar categorias muito pequenas ou vazias no processo. Essa regra poderia recomendar por exemplo dividir em décadas em vez de anos, ou colocar em uma divisão por ano menos específica, por exemplo a Categoria:Lepidópteros descritos em 1768 pode ampliar a divisão de tempo para década ou a divisão taxonômica para insetos. Se tivéssemos uma regra ou recomendação dizendo de uma forma objetiva o que é uma categoria muito grande e uma muito pequena e como proceder a fusão e a divisão, isso nos ajudaria a corrigir o problema e a evitar que ele se repita. Danilo.mac(discussão) 18h49min de 15 de dezembro de 2021 (UTC)[responder]
Concordo com a sugestão acima, mas pelo que tenho visto desde há anos, "a razão que levou à criação de muitas categorias vazias" está longe de ser a principal.
Para mim as duas causas principais são: i) a cópia de outras wikis (suponho que geralmente da EN), sem ter em conta a adequação das estruturas lá usadas nem ao facto de, muitas vezes, haver categorias praticamente equivalentes; ii) uma lógica de "coerência" de ter todos os ramos similares com a mesma estrutura.
Um exemplo ao acaso, desta última situação, que está longe de ser dos "piores": Categoria:Estádios do Uzbequistão só tem uma subcategoria (Categoria:Estádios de futebol do Uzbequistão); possivelmente faria mais sentido a categoria-mãe não existir.
Em relação à primeira causa, o problema está em que noutras grandes wikis há muito mais artigos e ainda muitos mais devidamente categorizados, enquanto que por aqui provavelmente a maioria dos artigos não está em todas as categorias que devia estar e/ou está em categorias genéricas. --Stego (discussão) 19h51min de 15 de dezembro de 2021 (UTC)[responder]
Esse é o dilema, categoriais com muitos itens x criação de subcategorias com poucos itens.--Raimundo57br (discussão) 20h00min de 15 de dezembro de 2021 (UTC)[responder]
Não há qualquer dilema; basta que se criem as categorias conforme os artigos que existem para lá colocar. O problema é que muitos dos que criam as categorias não se dão ao trabalho de verificar que artigos existem nem antes nem depois de criarem a categoria. E com isto fazem com que a função dessas categorias seja exatamente a contrária de uma das principais funções das categorias: facilitar a busca de artigos relacionados com um tema. --Stego (discussão) 20h19min de 15 de dezembro de 2021 (UTC)[responder]
De fato, não há dilema, a não ser que alguém considere que uma categoria com 1000 artigos é grande e queira dividir em mais de 20 subcategorias, aí será muito provável que algumas subcategorias fiquem com menos de 10, pois é comum ir mais artigos para umas e menos para outras. Por isso é bom termos uma regra que diga explicitamente que categoria com 1000 artigos não é grande, pois se dermos margem a interpretação certamente aparecerá alguém dizendo o contrário. E concordo que a tentativa de criar "coerência" é também uma das razões das categorias pequenas. Por exemplo existem muitas categorias vazias do tipo "Nascidos em X" em que X é um ano menor que 1000, poucas pessoas notáveis nasceram em épocas tão antigas, elas deveriam ser categorizadas por século, e mesmo assim vai ter séculos muito antigos com poucos artigos. E algo muito semelhante acontece quando tentam criar divisões para países e regiões pequenas da mesma forma que é feito com os grandes e populosos. Concordo que o melhor seria criar uma subcategoria somente quando for constatado que existe um número grande de artigos para preenchê-la, e esse "número grande" deveria estar explícito em uma regra ou recomendação, na minha opinião poderia ser no mínimo 10. Danilo.mac(discussão) 23h18min de 15 de dezembro de 2021 (UTC)[responder]
Nunca categorizei nada com nascidos em ano "X", acho esse tipo de categoria bastante inútil. Mas é muito comum as supercategorias do tipo: "Jesuítas por país" que abrange várias subcategorias do tipo jesuítas do país "x". Nesse contexto, indago: como categorizar os jesuítas nascidos em um pequeno país nessa supercategoria sem criar uma subcategoria de único item?--Raimundo57br (discussão) 06h27min de 16 de dezembro de 2021 (UTC)[responder]
Deixando esses jesuítas na "supercategoria"... --Stego (discussão) 14h34min de 16 de dezembro de 2021 (UTC)[responder]

Parte 4 (16 de dezembro de 2021)[editar código-fonte]

Lembro de haver uma ferramenta há muitos anos que listava erros na árvore de categoria, como loops. Um dos mais frequentes eram categorias que apenas pertenciam a si própria, ou seja, a Categoria:Raciocínio_circular estava categorizada apenas em Categoria:Raciocínio_circular. Infelizmente não me lembro do nome da ferramenta, além de provavelmente já não funcionar. Será simples de detectar esses casos, pelo menos estes mais simples? GoEThe (discussão) 10h42min de 16 de dezembro de 2021 (UTC)[responder]

Salvo erro, o "Cat-a-lot" faz isso para uma categoria de cada vez. Mas esse não é o foco da discussão aqui, embora seja um assunto que, no caso desta discussão resultar em trabalhos de reestruturação de categorias, também se deva ter em conta, pois aproveita-se para deixar o trabalho mais completo. --Stego (discussão) 14h39min de 16 de dezembro de 2021 (UTC)[responder]
@GoEThe: É a página Usuário:Danilo.bot/Loops de categorias, estava sem atualizar desde 2019, eu reativei agora. Quando criei isso eu procurei por ferramentas parecidas, na enwiki eles tem uma lista que só mostra as categorias categorizadas em si mesmas, lembro que gerei uma lista completa dos loops deles e mostrei na esplanada deles, eles praticamente não viram problema nesses loops. Sei que estamos fugindo um pouco do assunto do tópico, mas é interessante ver que mesmo em outras wikis é difícil encontrar voluntários interessados na organização das categorias. Danilo.mac(discussão) 19h41min de 16 de dezembro de 2021 (UTC)[responder]
@Danilo.mac, era uma ferramenta externa, talvez activa em 2008-2010. Não conhecia essa página, mas é exactamente isso. Os loops mais profundos talvez não tenham muito problema, desde que não haja loops completamente isolados como são categorias só categorizadas em si mesmo. GoEThe (discussão) 10h52min de 17 de dezembro de 2021 (UTC)[responder]

Por mero acaso, acabei de deparar-me com uma dessas árvores de categorias praticamente vazias, em que o afã bem intencionado de criar categorias acaba por dificultar a pesquisa de artigos em vez de facilitar: Categoria:Unidades e formações navais da Alemanha. Veja-se, por exemplo, quantas categorias vazias ou só com um artigo e/ou categoria têm que se percorrer para chegar a esta categoria (com apenas um artigo) ou Categoria:Submarinos alemães Tipo X (com 4 artigos). Como essas há muitíssimas mais. Aliás, o criador desse ramo de categorias é dos campeões da criação de ramos de categorias com pouquíssimos artigos. --Stego (discussão) 20h38min de 16 de dezembro de 2021 (UTC)[responder]

@Stego: este exemplo é importante para ilustrar a problematização com as sub-categorias. Em suma, o leitor precisar percorrer n categorias para chegar numa realmente útil. Edmond Dantès d'un message? 23h40min de 16 de dezembro de 2021 (UTC)[responder]
Usei o código dos loops de categorias como base para criar a lista de ramos de categoria com poucas páginas, com isso vai ficar mais fácil encontrar esses ramos problemáticos. O Stego estava certo em dizer que haviam muitos, eu não pensei que teria tantos, vai dar bastante trabalho arrumar essa bagunça. Danilo.mac(discussão) 02h27min de 17 de dezembro de 2021 (UTC)[responder]
@Danilo.mac: é impressão minha ou com o decorrer desta discussão estamos encontrando vários problemas? Edmond Dantès d'un message? 02h55min de 17 de dezembro de 2021 (UTC)[responder]
Sim, quando eliminarmos uma categoria vazia em um ramo vazio, a categoria superior se torna vazia, então são categorias vazias escondidas por suas subcategorias vazias, o que as fazem ficar fora daquelas primeiras listas. O lado positivo é que fica difícil alguém tentar impedir uma solução dizendo que está bom do jeito que está. Danilo.mac(discussão) 16h26min de 17 de dezembro de 2021 (UTC)[responder]
@Danilo.mac: para ser sincero este fato apresentado não gera-me preocupações essencialmente pelo motivo mencionado por você. No entanto, a pauta geral causa-me desconforto é que todos os argumentos apresentados com as possíveis causas do problema são coerentes, o que me faz acreditar que a comunidade precisa corrigir várias "pontas soltas". Dessa forma, esses loops vem para coroar a problemática. Sobre isso, pretendo fazer um resumo de tudo que foi discutido em breve. Edmond Dantès d'un message? 06h39min de 19 de dezembro de 2021 (UTC)[responder]

Parte 5 (16 de dezembro de 2021)[editar código-fonte]

Peço licença para criar uma quinta parte nesta discussão com o intuito de exemplificar uma má-categorização. O exemplo? este! Observa-se que existe 22 subcategorias e 27 páginas. Na minha opinião, esta categoria deveria abranger somente 4 subcategorias: Competições de basquetebol feminino‎, Competições de basquetebol masculino‎, Competições de basquetebol por país‎ e Competições de basquetebol por continente, excluindo eventuais categorias para predefinições. Na condição atual, o exemplo supracitado oferece ao leitor uma mistureba de sub-categorias que integram a árvore com competições dos mais variados tipos. O resultado final é visível: 3 das 22 subcategorias possuem menos de dois itens e 13 poderiam ser recategorizadas. Praticamente os mesmos problemas são visíveis nas 27 páginas.

Por que estou usando este exemplo? Pois ilustra a falta de organização. Se um leitor procura uma informação específica, por exemplo uma competição de basquetebol do Uruguai, ele precisa verificar se o item não está no exemplo supracitado e procurá-lo em várias outras categorias, como esta, esta e esta. Cada categoria possui n sub-categorias... Enfim, ilustra a quantidade de categorias que o leitor precisa percorrer para encontrar o item sobre o Uruguai. Edmond Dantès d'un message? 00h15min de 17 de dezembro de 2021 (UTC)[responder]

Como mencionado ao @Danilo.mac:, considerei fazer um resumo sobre as pautas desta discussão, mas precisava fazer outras tarefas que já estava adiando-as. Pois bem, elencando os itens:
  1. Independentemente da boa-intenção dos utilizadores, a estruturação das categorias precisam ser revista já que a comunidade sofre com um elevado número de categorias vazias ou com poucos itens.
  2. Foram apresentados pelo menos três motivos razoáveis que contribuem para tal problemática. O correto seria expor os números e propor soluções para evitar a multiplicação do problema.
  3. Esta discussão é coroada com a problemática dos loops.
  4. Diferentemente das respostas dos demais, eu até concordo que possa existir eventuais "dilemas", mas não estamos nessa fase [ou talvez sim?] Afinal 20 itens é muito para uma categoria?. No entanto, observo a possibilidade de usar as ramificações das categorias para especificar e detalhar tudo que possível o que claramente terá poucos itens que se encaixam.
Então, quais são as soluções? Não sei onde começar porque identifiquei inúmeros outros pontos que precisam ser revistos. Como por exemplo as categorias de redirecionamentos. Tudo bem, considero extremamente razoável uma confusão entre [assunto x] do/no [país y]. No entanto, outros casos extrapolam o limite do razoável. O pior que as tags {{redirecionamento de categoria}} categoriza a categoria vazia na qual é usada! Outras são tão genéricas que praticamente tudo pode ser categorizado. Questiono: seria interessante criar parâmetros para categorias? Por que não pode ter um texto inicial avisando aos demais sobre o propósito daquela categoria? Edmond Dantès d'un message? 23h58min de 20 de dezembro de 2021 (UTC)[responder]
Vou ter que "digerir" as suas considerações, mas para já, só um detalhe: o culpado de {{redirecionamento de categoria}} categoriza a categoria vazia na qual é usada sou eu. Tenho ideia de que isso aconteceu no passado e há alguns dias dei-me conta que não o fazia. Adicionei essa categorização porque se isso não acontecer, quando a categoria redirecionada tem artigos (que ainda não foram movidos para a "nova"), esses artigos não são acessíveis a partir da categoria onde já deveriam estar. --Stego (discussão) 00h36min de 21 de dezembro de 2021 (UTC)[responder]
Não entendi qual é o problema do redirecionamento categorizar a categoria vazia. Sobre os problemas em geral, eu acho que uma boa abordagem é ir começando pelos problemas mais simples de resolver, há uns dias atrás fiz pedido no café dos eliminadores para eliminarem as categorias vazias, já dá para ver alguns links vermelhos na lista de ramos e também na lista de loops, e também fiz algumas recategorizações para resolver os loops maiores. Danilo.mac(discussão) 01h43min de 21 de dezembro de 2021 (UTC)[responder]
@Danilo.mac e Stego: em primeira instância, aparentou-me muito estranho categorizar uma categoria vazia de redirecionamento e até um pouco desnecessário. No entanto, reconsiderei e encontrei eventuais utilidades. Sobre o comentário do Danilo, acredito que tinha respondido ao próprio Stego que o primeiro passo seria efetuar uma limpeza nas categorias vazias. Por fim, gostaria de acrescentar ou esclarecer outros pontos:
  • Na minha opinião, a comunidade também sofre com um abuso de ramificações com o intuito de detalhar ou especificar todos os parâmetros. As evidências desta problemática já foram apresentadas por alguns dos participantes, como a necessidade de obrigar um leitor a passar por cinco ou seis níveis até encontrar uma ou duas páginas.
    • Esta problemática pode ser ilustrada facilmente. Por exemplo, a categorização duma competição esportiva precisa indicar o esporte e o eventual escalão/nível, podendo paralelamente serem categorizadas por países, obviamente dependendo das condições. No entanto, deparei-me com ramificações "rigorosas": esporte -> continente -> escalão -> modalidade feminina ou masculina -> clubes ou seleção. Outro exemplo ilustrativo seria pegar a categoria "filmes do Brasil" e dividi-la por gêneros. Enfim, os exemplos são numerosos.
  • Quando uma categoria é esvaziada porque as páginas foram eliminadas, a tendência é da mesma não ser eliminada. Tal problema ocorre por escassez de ferramentas que possibilitam a identificação dessas categorias e também a criação massiva de categorias com poucas páginas. Logo uma ou outra eliminação tem um efeito duplicado.
  • Creio que existe um nítido bom senso: a responsabilidade de preencher uma categoria fica a cargo de quem a criou. Isso já eliminaria as eventuais causas dos problemas aqui discutidos. Edmond Dantès d'un message? 10h05min de 22 de dezembro de 2021 (UTC)[responder]
Como já avisei em outro sítio, há uma ferramenta para mostrar adições e subtracções recentes a categorias. Não sei se haverá alguma para avisar os eliminadores quando uma categoria se torna vazia pela eliminação que se fez. Mas de qualquer modo, havendo a ferramenta de categorias vazias do Danilo, penso que basta se ir vigiando essa página para controlar a situação.
Penso que seria bom melhorar as recomendações sobre categorias. WP:Categorias tem um texto mínimo. Ajuda:Categoria ensina o que é categoria e como tecnicamente categorizar (penso que não será preciso alterar). WP:CAT e principalmente WP:CATESPEC já contem muitos dos aspectos que discutimos aqui, mas talvez nem todos e poderá não ser muito claro. GoEThe (discussão) 10h41min de 22 de dezembro de 2021 (UTC)[responder]
@GoEThe: provavelmente equivocou-se na indicação da ligação já que leva para uma edição da página cronógrafo. De todo modo, acredito que isso não seria um problema se não houvesse muitas categorias com poucas páginas. Enquanto isso, uma alternativa seria criar um robô com estatuto de eliminador para eliminar categorias vazias há um determinado período. Já a reformulação das recomendações é algo que precisa ser discutido. Poderia ser o segundo passo fruto desta discussão. Edmond Dantès d'un message? 12h40min de 22 de dezembro de 2021 (UTC)[responder]
Corrigido. GoEThe (discussão) 15h01min de 22 de dezembro de 2021 (UTC)[responder]
Eu concordo que a solução inclui uma reformulação dos guias sobre categorias, sem recomendações sobre como criar as categorias os editores vão simplesmente repetindo o padrão existente. E vou ver se crio uma página com estatísticas das categorias vazias e com poucas páginas para a gente conseguir acompanhar a evolução dos números. Danilo.mac(discussão) 19h57min de 22 de dezembro de 2021 (UTC)[responder]
Coloquei na ferramenta de categorias uma página com os números de categorias por número de página. Estamos com mais de 40 mil categorias com uma única página. A boa notícia é que as categorias vazias já foram eliminadas. Danilo.mac(discussão) 02h10min de 26 de dezembro de 2021 (UTC)[responder]

Percebi agora algo que pode nos ajudar muito, a {{Categorizar-ano-século-milénio}}, que cria aquelas categorias "Nascidos em..." e "Mortos em...", categoriza por ano só se a categoria de ano existir, se não existir ela faz o mesmo teste para século e depois para milênio, isso é ótimo porque nós podemos eliminar as categorias de anos mesmo se não estiverem vazias, pois os artigos vão ser automaticamente recategorizados para o século. Podemos criar predefinições com a mesma lógica para categorizar em regiões e outros tipos de divisões, talvez até já exista e eu não saiba. Depois podemos usar um robô para trocar as categorias muito específicas nos artigos por esse tipo de predefinição. Danilo.mac(discussão) 19h57min de 22 de dezembro de 2021 (UTC)[responder]

Criei a predefinição/módulo {{categorizar}} para ajudar nas categorizações, ela faz a função ano-década-século semelhante à predefinição que citei acima e também pode receber uma lista de categorias e colocar a página na primeira que existir. Então podemos colocar essa predefinição nos artigos ou predefinições que categorizam artigos que estão em categorias pequenas com as opções das categorias superiores, com isso ao eliminar as categorias eles serão recategorizados automaticamente. Danilo.mac(discussão) 21h58min de 31 de dezembro de 2021 (UTC)[responder]

Parte 6 (11 de janeiro de 2022)[editar código-fonte]

Em que ficamos? Idenpendentemente de tentarmos melhorar as regras, concordamos que, à luz de WP:CATESPEC, que nunca me lembro de ter sido contestada, e considerando que ninguém aqui se opôs a que tal se faça, podemos avançar para a "limpeza" de categorias com poucos elementos, passando os seus artigos para categorias mais genéricas?
Proponho que essas tarefas não sejam feitas, como é demasiado usual, "cegamente" e em massa, mas que em vez disso haja um trabalho prévio de verificar se as categorias têm poucos elementos porque há de facto poucos artigos para nelas serem categorizados ou se o que está a falhar é a categorização de muitos artigos. Em todo o caso, acho que é de longe preferível que sejam suprimidas categorias atualmente com poucos elementos devido a categorização deficiente do que a sua manutenção em nome da existência dum suposto potencial que todos sabemos que quase invariavelmente vão passar décadas até que se materialize. --Stego (discussão) 16h04min de 11 de janeiro de 2022 (UTC)[responder]

Nada deve ser feito "cegamente", mas também temos de cuidar pra não aumentar o bicho! -- Sete de Nove msg 16h19min de 11 de janeiro de 2022 (UTC)[responder]
Vale manter isso: canonizadas pelo papa Pio II, pelo papa João XV, pelo papa Clemente IX? -- Sete de Nove msg 16h47min de 11 de janeiro de 2022 (UTC)[responder]
Essas categorias com poucos itens, decorrem da existência de uma supercategoria pre existente. No caso, quando se cria uma subcategoria nesse tipo de supercategoria, é difícil determinar qtos itens terá: Categoria:Canonizações por papa.--Raimundo57br (discussão) 16h50min de 11 de janeiro de 2022 (UTC)[responder]
Mas deve ser criada a categoria antes de ter artigo pra categorizar? O problema é esse, criam a categoria e ficam esperando os artigos surgirem, mas nem sempre surgem! -- Sete de Nove msg 16h55min de 11 de janeiro de 2022 (UTC)[responder]
Coloque-se no lugar do editor que está tentando categorizar o artigo Catarina de Siena, estaria errado ele ao criar a Categoria:Pessoas canonizadas pelo papa Pio II?--Raimundo57br (discussão) 16h59min de 11 de janeiro de 2022 (UTC)[responder]
Definitivamente está errado, obviamente! A categorização só tem utilidade se estiver adaptada à quantidade de artigos a categorizar. Uma coisa que se pode fazer nesses casos, que dará imenso jeito àqueles (muito poucos) que um dia resolverem categorizar devidamente é, por exemplo, criar uma categoria do tipo "Santos não categorizados por papa que os canonizou". Quando essa categoria estiver com um número razoável de artigos fica muito mais fácil decidir quais as categorias que devem ser criadas. --Stego (discussão) 17h40min de 11 de janeiro de 2022 (UTC)[responder]
Eu estive pensando sobre esse problema das categorias pequenas e olhando a lista de categorias com apenas uma página, e acho que não tem mesmo como fugir do robô, são muitos artigos para recategorizar manualmente. E como algumas recategorizações podem ser muito complexas para um robô, nós poderíamos dividir as tarefas em recategorizações para serem feitas por robô e para serem feitas manualmente. Uma candidata para a lista de robô são os gêneros de seres vivos, são muitas categorias e a tarefa é simples, é só recategorizar para a categoria superior. Fazendo essa separação os voluntários que vão fazer as recategorizações manuais não perdem tempo com casos que podem ser deixados para os robô. Danilo.mac(discussão) 18h14min de 11 de janeiro de 2022 (UTC)[responder]
Qto a essa lista: categorias com apenas uma página, indago, se não seria possível listar apenas as categorias com apenas uma página que não têm interwikis? Pois, entendo, que as que não têm interwikis, são, em princípio, menos viáveis.--Raimundo57br (discussão) 19h08min de 11 de janeiro de 2022 (UTC)[responder]
Eu gerei a lista de categorias com uma página e sem interwiki no Quarry, é mais rápido do que modificar o código da ferramenta. Eu particularmente não acho que ter ou não interwiki faça diferença, muitas outras wikis provavelmente têm o mesmo problema que nós de categorias com poucas páginas, eu não acho que o fato de outras wikis ter uma categoria equivalente é sinal que pode ter sentido manter a categoria com somente uma página. Também gerei a lista de categorias com uma página e muitos interwikis para ver esse outro lado da questão, por exemplo a primeira categoria dessa lista (a que tem mais interwikis) é a Categoria:Nascidos em 76, é o caso que eu disse na seção anterior em que o artigo vai ser automaticamente recategorizado para o século se a categoria for eliminada, eu particularmente não vejo problema em eliminar essa categoria. Danilo.mac(discussão) 22h12min de 11 de janeiro de 2022 (UTC)[responder]
Considerando que algumas interwikis tem mais de um artigo em categorias que na wiki-pt tem apenas um artigo, creio que o processo de eliminação deve começar pelas que não tem interwikis. Outro ponto, a eliminação em princípio deve ocorrer por ESR, para dar tem para os interessados na manutenção das categorias que tem apenas um artigo tomarem providências saneadoras.--Raimundo57br (discussão) 01h44min de 12 de janeiro de 2022 (UTC)[responder]
A partir de sua lista, esvaziei Categoria:Lagoas do Uruguai, pois não tem interwiki na wiki es, portanto, Categoria:Lagoas do Uruguai já pode ser marcada para deleção.--Raimundo57br (discussão) 01h52min de 12 de janeiro de 2022 (UTC)[responder]
Observo que sua lista (lista de categorias com uma página e sem interwiki no Quarry) é falha, por exemplo: a Categoria:Álbuns de Moonspell tem vários interwikis.--Raimundo57br (discussão) 01h56min de 12 de janeiro de 2022 (UTC)[responder]
Corrigido. Danilo.mac(discussão) 02h27min de 12 de janeiro de 2022 (UTC)[responder]

@Danilo.mac: uma boa alternativa seria começar pelas categorias de taxonomia. Como exemplo, cito esta, que a maior parte das subcategorias possuem apenas um item. Casos assim devem ser robotizados e recategorizados para a categoria superior. Edmond Dantès d'un message? 02h01min de 12 de janeiro de 2022 (UTC)[responder]

Discordo: essa categoria: Categoria:Orchidaceae como está já tem um valor enciclopédico interessante, pois serve como lista das subfamílias da família Orchidaceae. Desconheço onde encontrar semelhante lista na wiki-pt.--Raimundo57br (discussão) 02h11min de 12 de janeiro de 2022 (UTC)[responder]
O Conde Edmond Dantès estava se referindo a passar todos artigos das subcategorias que tem somente uma página para a Categoria:Orchidaceae, e não eliminar a categoria. Essa é sim uma boa tarefa para um robô, falta agora desenvolver o código, vou trabalhar nisso, e se algum outro operador de robô tiver interesse na tarefa fique a vontade, trabalho para robô como esse é o que não falta. Danilo.mac(discussão) 02h27min de 12 de janeiro de 2022 (UTC)[responder]
Não compreendi em nada o raciocínio do argumento do Raimundo. Enfim, @Danilo.mac: esse problema vai reduzir bastante se trabalharmos nas categorias sobre taxonomia. Edmond Dantès d'un message? 02h39min de 12 de janeiro de 2022 (UTC)[responder]

O código do novo robô está quase pronto, minha ideia é fazer ele ler as tarefas a serem realizadas na página Usuário:RecatBot/Tarefas, onde nós colocamos as categorias depois de verificarmos que é seguro rodar o robô nela. Nós vamos ter que prestar atenção nas categorias antes de colocá-las na lista, a Categoria:Orchidaceae por exemplo tem a subcategoria:Orquidicultores que não deve ter seus artigos recategorizados, eu editei essa categoria e adicionei a categoria Agricultores nela, isso vai evitar a recategorização porque o robô não faz nada em categorias que tem mais de uma categoria superior. Estou em dúvida em uma questão importante para a configuração do robô, qual é o máximo de páginas em uma categoria que o robô vai considerar uma categoria pequena? Pensei inicialmente em 5 artigos ou menos, mas queria mais opiniões sobre isso antes de prosseguir. E fiquem livres para comentar o que mais quiserem sobre o funcionamento do robô. Danilo.mac(discussão) 03h36min de 15 de janeiro de 2022 (UTC)[responder]

Me parece que a quantidade de cinco artigos é mais do que exagerada. Um é pouco, dois é suficiente. Pergunta: O trabalho de recriar as categorias que receberem mais artigos será feito por um robot? Estamos em discussão para eliminar décadas dos artigos, o ano será recategorizado como século? Se sim, é algo inútil para quem utiliza categorias cronológicas, sendo preferível abrir outra discussão para eliminarmos todas e de vez as categorias temporais, que são consideradas inúteis por alguns colegas editores. HTPF (discussão) 13h44min de 15 de janeiro de 2022 (UTC)[responder]
@Danilo.mac: questiono se não seria interessante colocar o funcionamento do robô ligado às ferramentas de categorias criadas, como esta e esta. Uma segunda opção seria fazer uma lista igual à da Aleth Bot, possibilitando que o utilizador solicite uma recategorização específica. Sobre o número, eu sugeria começar com 4 artigos ou menos. No entanto, não vou me opor se decidirem por 5. Edmond Dantès d'un message? 13h51min de 15 de janeiro de 2022 (UTC)[responder]
@Conde Edmond Dantès: A página que eu mencionei é como a da Aleth Bot, a gente pode inserir categorias lá e o robô lê. Não dá para o robô pegar categorias diretamente da lista de categorias com uma página por causa dos erros de categorização que iria causar, como esse exemplo que dei dos orquidicultores que iriam passar para a categoria das orquídeas se eu não tivesse adicionado manualmente a categoria de agricultores. Danilo.mac(discussão) 17h53min de 15 de janeiro de 2022 (UTC)[responder]
Se querem eliminar categorias com poucos itens, comecem somente com as que tem um único item sem interwikis, para, depois, avaliarmos se se deve prosseguir.--Raimundo57br (discussão) 14h26min de 15 de janeiro de 2022 (UTC)[responder]
@Raimundo57br: Concordo em começar com somente uma página, quando a quantidade de categorias com uma única página estiver menor a gente avalia ampliar o número. Mas não entendo que diferença o interwiki faz em categorias. Em artigos é importante porque diz que existe conteúdo em outras línguas, mas no caso das categorias, as categorias em outras línguas podem ter também uma única página ou até estarem vazias, ou pode até terem muitos artigos que não temos aqui. Quando alguém perceber que existem uma quantidade significativa de artigos do assunto da categoria esvaziada alguém recria a categoria. Danilo.mac(discussão) 17h53min de 15 de janeiro de 2022 (UTC)[responder]
Eliminação sem análise humana e temerário. Categorias com 1 página já está disponível como mencionado, basta avaliar o item e encaminhar para eliminação se for o caso. HTPF (discussão) 15h15min de 15 de janeiro de 2022 (UTC)[responder]
@Hermógenes Teixeira Pinto Filho: Veja o número de categorias com uma única página, são mais de 40 mil, não acho que é possível lidar com isso somente de forma manual, por isso estamos recorrendo a ajuda de um robô. Mas se existirem voluntários dispostos a fazer esse trabalho manualmente nós cancelamos a ideia do robô, sem problema. Sobre as categorias de ano/década/século, eu não estou vendo isso ainda porque é um processo um pouco mais complicado, pois algumas dessas categorias são adicionadas por predefinições. Sobre recriar a categoria quando ela tiver mais artigos, é também um processo complicado pois o robô precisaria descobrir quais artigos poderiam ser incluídos na categoria, e para cada assunto pode ter uma forma diferente de fazer isso. Danilo.mac(discussão) 17h53min de 15 de janeiro de 2022 (UTC)[responder]
@Danilo.mac::Qdo há interwikis, em muitos casos, a categoria em língua estrangeira tem mais do que um artigo, logo tratam-se de categorias cuja a análise de viabilidade requer maior cuidado.--Raimundo57br (discussão) 17h57min de 15 de janeiro de 2022 (UTC)[responder]
@Hermógenes Teixeira Pinto Filho:: Considerando que vc chegou agora à discussão indago sua opinião sobre um ponto que levantei antes: entendo que as subfamílias, enquanto categorias concebidas por biólogos para categorizar espécies animais e vegetais (Taxonomia), são, em princípio, categorias com relevância enciclopédica independentemente do número de itens.--Raimundo57br (discussão) 20h20min de 15 de janeiro de 2022 (UTC)[responder]
@Raimundo57br: Talvez eu tenha entendido mal seu "discordo" de antes, você realmente acha que aquelas categorias com uma única página devem ser mantidas? Aquelas subcategorias são de gêneros e não de subfamílias, e não achei que alguém conseguiria ver utilidade para categorias de um único artigo, por isso não pensei que você estava dizendo isso. Mas se for isso então não podemos usar robô, pois robôs só podem ser usadas em tarefas consensuais. E se for isso mesmo então esse problemas das categorias pequenas dificilmente serão resolvidos, se tivermos dificuldade para ter consenso para eliminar categorias com uma única página dificilmente conseguiremos fazer alguma coisa com as que tem um pouco mais. Danilo.mac(discussão) 22h47min de 15 de janeiro de 2022 (UTC)[responder]
@Danilo.mac:: No caso específico da Categoria:Orchidaceae, temos uma categoria que corresponde a uma família, na qual boa parte das subcategorias são subfamílias (algumas subfamílias compreendem apenas uma espécie), a existência dessa categoria como está, já é útil para um editor que queira, por exemplo, fazer uma lista de espécies de orquídeas separando-as por subfamílias. Quanto às categorias pequenas, sugiro que comecemos pelas que não tem interwikis, pois isso também afastaria maior parte das categorias que correspondem a subfamílias da classificação biológica (Taxonomia).--Raimundo57br (discussão) 23h24min de 15 de janeiro de 2022 (UTC)[responder]
@Raimundo57br: Eu abri 10 subcategorias aleatórias da Categoria:Orchidaceae, e as 10 eram gêneros e tinham interwiki. Segundo o artigo Orquídea essa família tem 5 subfamílias, e a categoria tem 414 subcategorias, o que nos leva a concluir que a grande maioria são gêneros. Até dá para o robô selecionar só o que é gênero, o problema de adicionar esse tipo de regra é que assuntos diferentes têm regras diferentes, e nós vamos ter que encontrar um modo de organizar as regras de cada assunto. Não sou contra ter esse tipo de regra de recategorização, mas se formos seguir por esse caminho vou ter que pedir para me ajudarem a criar uma página organizando as regras de cada assunto. Danilo.mac(discussão) 00h48min de 16 de janeiro de 2022 (UTC)[responder]
Com risco de parafrasear o comentário inicial do Stegop, se a função das categorias é propiciar a navegação de páginas, então não convém levantar outras "utilidades" subjetivas que fogem desta lógica. Dessa forma, o que vejo aqui é uma clara tentativa de impedir ou obstruir que a comunidade faça valer uma regra já existente com argumentos nonsenses. Esta discussão, aliás, surge por causa da regra que não recomenda a existência de categorias com poucos itens. Neste sentindo, a pauta nessa discussão é automatizar a tarefa, que pode ser feita também de forma manual. Portanto, sem problemas se o objetivo é obstruir e forçar que os utilizadores fazem esta tarefa manualmente, mas não vou mais tolerar aquele argumento vagabundo de que a Wikipédia Lusófona não cresce. Edmond Dantès d'un message? 03h26min de 16 de janeiro de 2022 (UTC)[responder]
Sim, entendo que existam 40.000 categorias com apenas um item, e segundo critérios são inúteis. A minha colocação é sobre série temporal que fica sem nenhum sentido e utilidade para qualquer tipo de pesquisa que utilize categorias se for suprimido a unidade básica que é o ano menos que com apenas 1 item. Não é util procurar a informação de um ano específico sobre alguma coisa em um amontado de itens de uma década ou século. HTPF (discussão) 00h04min de 16 de janeiro de 2022 (UTC)[responder]
@Hermógenes Teixeira Pinto Filho: Uma solução para isso é manter o ano e ampliar o assunto. Veja por exemplo a Categoria:Fundações na Europa em 1713, tem 5 níveis de categorias para chegar em somente um artigo (tem mais exemplos como este aqui), poderíamos trocar todas essas categorias pela Categoria:Fundações em 1713, dessa forma ampliamos o assunto mas não o tempo. Para procurar depois algo mais específico fundado nesse ano teria que usar o PetScan para cruzar categorias, eu sei que não é uma ferramenta muito conhecida e alguns podem ter dificuldades de usar, mas nós podemos tentar fazer predefinições e um guia para tornar essa ferramenta mais acessível e conhecida. Danilo.mac(discussão) 00h48min de 16 de janeiro de 2022 (UTC)[responder]
O seu exemplo pega um continente e um ano sem muitas fundações talvez não seja um bom exemplo. Veja o caso de Categoria:Fundações em Santa Catarina por ano que eu estou categorizando no momento e ainda não cheguei na metade das cidades, ou Categoria:Fundações em São Paulo por ano, que está mais adiantado, a simplificação não seria justificável. A utilização do PetScan, útil sem dúvida para quem edita e tem conhecimento de informática, está muito distante de um usuário comum que consulta a Wikipédia em busca de informações e utiliza categoria como ferramenta de busca, aliás este usuário deveria ser o nosso foco. Em Usuário:Danilo.bot/Ramos de categorias com poucas páginas que você mencionou me parece que uma revisão na árvore de categorias, eliminando o que é supérfluo ajudaria e muito a eliminação de proliferação de categorias inúteis e encadeadas do tipo Mortos na Islândia, Religião em Ohio, Forças armadas na Flórida, Edifícios e estruturas terminadas em 1859, Ativismo anticorporativo, Agricultura na sociedade , Consumismo , História de Comores por tema, Vida intencional etc o trabalho seria de identificar, argumentar e propor a eliminação por consenso de todo ramo da árvore com estas categorias que fazem pouco sentido. HTPF (discussão) 01h23min de 16 de janeiro de 2022 (UTC)[responder]
Se não dá para ampliar o assunto nem o tempo nós ficamos com poucas opções. Uma opção pode ser não categorizar por data de fundação, e em vez disso criar uma lista, como a Lista de municípios de São Paulo por área, só que por data de fundação, isso facilitaria a busca sem usar categorias, dá até para pensar em um robô ou ferramenta para auxiliar na criação das listas. Tirando essa opção eu acho que só sobra a opção de deixar as categorias pequenas como estão. Pelo menos a eliminação dessas outras categorias que concordou como sendo inúteis já seria um avanço. Danilo.mac(discussão) 02h21min de 16 de janeiro de 2022 (UTC)[responder]
@Hermógenes Teixeira Pinto Filho: não acredito que haverá impactos significativos nas categorias de anos. Pelo o que andei a observar, tais categorias foram criadas sem um compromisso de ser devidamente categorizadas. Como assim? Criaram as categorias para categorizar um ou outro verbete, ignorando os demais. Sim, talvez não seja possível manter "Categoria:Futebol de 2020 no Acre", mas nada acontecerá com "Categoria:Futebol de 2020 no Brasil por estado" ou eventualmente analisar a possibilidade de se criar "Categoria:Esporte de 2020 no Acre" ou até que a primeira seja recriada futuramente. São ações que devem ser discutidas, o que esta sendo proposto por mim é iniciar a recategorização pelas categorias de taxonomias já que representam uma grande parte do problema. Edmond Dantès d'un message? 03h35min de 16 de janeiro de 2022 (UTC)[responder]
Não sei quem criou estas categorias nem com qual finalidade, mas é certo que para elas serem efetivas e valerem a pena é necessário um esforço de edição e não de eliminação, somar em vez de diminuir. No seu exemplo Categoria:Futebol de 2020 no Acre, eliminá-la, e quem quiser saber algo sobre, procurar em Categoria:Futebol de 2020 no Brasil por estado parece ser um retrocesso. Criar uma nova categoria como sua sugestão Categoria:Esporte de 2020 no Acre, pode ser um caminho, mas isto implica na revisão da árvore de categorias que parece que ninguém quer discutir por uma razão simples, vai dar trabalho, muita discussão e não existe solução simplista de aplicar um bot. Sou frontalmente contra a recategorização das categorias de taxonomias, pois elas não são um problema, pois não são inúteis como alguns podem pensar por abrigar apenas um item, elas são necessárias para quem entende e pesquisa sobre o assunto. Problema é manter categorias sem nenhum significado prático, possivelmente cópia de outras Wikipédias, como mencionei em comentário anterior, estas sim deveriam ser discutidas e eliminadas. HTPF (discussão) 13h05min de 16 de janeiro de 2022 (UTC)[responder]

Ainda sobre o assunto, quem estiver interessado em eliminar categorias inúteis acesse a lista preparada pelo Danilo Usuário:Danilo.bot/Ramos de categorias com poucas páginas, e no final dela vai encontra um sub-item "Redirecionamentos" com 300 categorias (x2) que são categorias direcionadas para elas mesmas. Aplicar C1 e encaminhar para ER.HTPF (discussão) 13h13min de 16 de janeiro de 2022 (UTC)[responder]

Olá Hermógenes Teixeira Pinto Filho, Danilo.mac, Conde Edmond Dantès; Conde, parabéns pela iniciativa, Danilo, parabéns por tentar criar solucoes técnicas; Hermógenes, entendo pelo que disse acima, "quem estiver interessado em eliminar [...] Aplicar C1 e encaminhar para ER."
que então a decisão está aceite? Pergunto, pois ao ler (meio à pressa) não percebi um momento na discussão onde fica claro que podemos avançar. De qualquer forma, venho sugerir que se inclua um texto no formato {{subst:void}} quando se criam novas categorias a avisar o criador a não criar categorias para uma página única ou que dificilmente terá inclusões posteriores. Algo como,

{{subst:void|<!-- NÃO CRIE CATEGORIAS PARA UMA PÁGINA ÚNICA. Ao criar esta categoria pense em outras páginas que poderão ser incluídas. Se não conseguir pensar em no mínimo quatro (4) páginas, não crie a categoria.-->}}.

A título de exemplo, Categoria:Noruegueses de ascendência brasileira. Talvez também incluir algo sobre artigos recém-criados, como é o caso da página na categoria supracitada, talvez

{{subst:void|<!-- NÃO CRIE CATEGORIAS PARA UMA PÁGINA ÚNICA. Ao criar esta categoria pense em outras páginas que poderão ser incluídas. Se não conseguir pensar em no mínimo quatro (4) páginas, não crie a categoria. Não inclua páginas recém-criadas que podem ser sujeitas a eliminação por não cumprirem os critérios de notoriedade. -->}}

Rui Gabriel Correia (discussão) 07h57min de 17 de janeiro de 2022 (UTC)[responder]
Será que o @Zdtrlik: tem acompanhado essa discussão? Ele tem criado várias categorias com a penas um artigo! Talvez tenha algo a contribuir nesta discussão, ou talvez nem saiba do problema que pode estar ajudando a criar! Sds -- Sete de Nove msg 11h11min de 17 de janeiro de 2022 (UTC)[responder]
Aplicar C1 e encaminhar para ER." que então a decisão está aceite? Deixando claro, a lista relaciona categorias vazias, sem artigos, redirecionadas para outras categorias vazias, que por sua vez redireciona para outras categorias (alguns redirecionamentos motivados por diferenças ortográficas entre pt-pt e pt-br, outras por utilização de títulos errados). Se queremos diminuir a quantidade de categorias, a revisão desta lista ajuda. HTPF (discussão) 13h34min de 17 de janeiro de 2022 (UTC)[responder]
Discordo do mínimo de 4 páginas, lembro que a criação de categorias com pelo menos duas páginas já ajuda a reduzir o número de artigos em categorias com muitas páginas. Além disso, devem haver exceções para categorias de taxonomia, situação na qual deve ser admitida a criação de categorias com um única página, pois se tratam de categorias que espelham categorias criadas por biólogos com base em critérios científicos tendo, portanto, valor enciclopédico. Outra situação é a de categorias que tem interwikis com mais de uma página.--Raimundo57br (discussão) 11h53min de 17 de janeiro de 2022 (UTC)[responder]
Pq aplicar ER? Considero mais prudente aplicar ESR, pois desse modo, haverá tempo hábil para que eventual interessado possa, eventualmente, sanear o problema na categoria marcada para deleção. Outro ponto, existe a orientação para quem apaga um subcategoria de recategorizar o artigo que estava na subcategoria para uma supercategoria?--Raimundo57br (discussão) 13h51min de 17 de janeiro de 2022 (UTC)[responder]
Não sou contra a existência de um bot que marque para eliminação ESR categorias com 1 item que não tem interwikis, desde de que exista uma limitação de marcações por vez e que existam as orientações de:
  1. Antes de apagar, tentar verificar se existe um interwiki para a categoria;
  2. recategorizar o artigo que estava na subcategoria apagada para uma supercategoria.--Raimundo57br (discussão) 14h00min de 17 de janeiro de 2022 (UTC)[responder]
Categoria:Orchidaceae é um exemplo paradigmático. A família contém talvez uma centena de milhar de taxa, e talvez 10% deles tenha artigo na Wikipédia em português. É possível que daqui a 20 anos tenha muitos mais, mas entretanto pode começar-se por ter apenas categorias para os géneros, e não para todos os níveis entre família e género. GoEThe (discussão) 15h05min de 17 de janeiro de 2022 (UTC)[responder]
Há cerca de 50 mil espécies de orquídea, 20 mil encontradas diretamente na natureza e outras 30 mil criadas em laboratório [2] é um número muito grande de espécies. Concordo que daqui a 20 anos tenha muito mais, espécies descritas e espero que artigos. O menor nível de categoria é o de "Gênero" que cobre toda a classificação científica (abaixo só especie, que não tem sentido ter categoria própria por ser única). Concordo que o nível "gênero" e adequado, desde que seja possível que uma categoria possa abrigar apenas um item, pois alguns "gêneros" possuem apenas uma única espécie, e a eliminação de uma categoria/gênero deixa todo o sistema classificatório esburacado e sem sentido. A questão passa a ser de algo considerado por muitos como inútil, para algo realmente inútil para quem procura um artigo tendo a classificação científica como base. HTPF (discussão) 14h28min de 24 de janeiro de 2022 (UTC)[responder]

Como não tem consenso para usar robô estou cancelando a ideia. E sobre os redirecionamentos, só agora percebi que a predefinição de redirecionamento categoriza também na categoria alvo do redirecionamento, pensei que categorizava só na "!Redirecionamentos de categorias" e a outra era adicionada por fora, então não faz sentido ter aquela seção dos redirecionamentos na lista de ramos com poucas páginas, vou remover essa seção na próxima atualização da lista. Danilo.mac(discussão) 15h24min de 18 de janeiro de 2022 (UTC)[responder]

Parte 7 (28 de agosto de 2023)[editar código-fonte]

@HTPF, Tuga1143, Danilo.mac, GoEThe, Jo Lorib, Stego, Stegop e 79a: Gostaria de retomar a discussão. Recentemente, elaborei artigos sobre duas revistas de heavy metal e, durante o processo de categorização, constatei que algumas categorias enfrentavam desafios semelhantes aos discutidos neste contexto. Além disso, notei que diversos artigos já existentes, aptos a serem enquadrados nessas categorias, ainda não haviam sido incluídos nelas. Devido a essa situação, considerei a possibilidade de sugerir a elaboração de um robô categorizador que empregue recursos como o PetScan e consultas SPARQL para cruzar informações, com o intuito de mitigar a questão mencionada anteriormente.

Originalmente, tinha a intenção de apresentar a ideia do robô aos usuário Danilo e Alberto, com o objetivo de iniciar uma conversa para discutir a proposta. No entanto, ao revisitar esta página, percebi que todos os debates realizados resultaram em futilidade devido à influência do Raimundo. Resumidamente, houve uma sugestão de eliminação em larga escala (automática) das categorias listadas na query do Danilo, porém Raimundo interferiu nesse processo. Além disso, a proposta de modificar a árvore de categorização de taxonomia também foi bloqueada por Raimundo. Quase todos os pontos levantados por Raimundo neste contexto foram contestados e refutados.

Recentemente, a comunidade resolveu banir o Raimundo do projeto, e considero minha insatisfação justificada, pois ele praticamente f... com o andamento do diálogo. Dessa forma, que tal retomar a discussão sobre esse tema? Podemos começar pela ideia do robô. Edmond Dantès d'un message? 23h24min de 28 de agosto de 2023 (UTC)[responder]

@Conde Edmond Dantès: O HTPF também foi contra o uso do robô, não foi só o Raimundo. Pelo que me lembro e pelo que pude reler agora as ideias sobre o robô era para recategorizar os artigos em categorias muito pequenas para a categoria superior, esvaziando e eliminando as categorias com poucas páginas, é essa ideia que quer retomar? Na discussão anterior não chegamos a um consenso sobre como lidar com categorias que misturam local e tempo. Também não tivemos consenso sobre as categorias taxinômicas, precisamos de uma regra que proíba categoria de um nível taxonômico quando não existem artigos suficientes para encher a categoria, sem essa regra é provável que apareça alguém reclamando das recategorizações. E tem também a questão de temas diferentes podem ter regras diferentes sobre como lidar com categorias pequenas, o que deixa essa tarefa mais complicada. Enfim, ainda têm várias questões complicadas que dificultam uma solução do problema. Danilo.mac(discussão) 01h08min de 29 de agosto de 2023 (UTC)[responder]
@Danilo.mac: Agradeço pelo retorno. Agora estou com dúvidas quanto à posição do HTPF, pois, em 6 de dezembro de 2021, ele mencionou a possibilidade de eliminar as categorias da query por blocos e destacou que o trabalho braçal poderia ser "auxiliado por um robô". Independentemente disso, a proposta do robô que estou sugerindo para retomar a discussão não se trata do robô de eliminação, mas sim da ideia de um robô categorizador que utiliza ferramentas como o PetScan e consultas SPARQL para cruzar informações e categorizar os artigos existentes em categorias igualmente existentes. Por exemplo, esta categoria possui uma correspondente com mais de 100 itens. Não é possível criar um robô para comparar esses itens no Wikidata com o objetivo de identificar quais possuem verbetes em português e depois categorizá-los? Edmond Dantès d'un message? 01h26min de 29 de agosto de 2023 (UTC)[responder]
@Conde Edmond Dantès: Tenho pouca experiência com SPARQL, mas com SQL seria algo assim, o robô teria que ir em cada um desses artigos que ainda não estão na categoria em português e adicionar a categoria. Isso é um pouco diferente do estava sendo discutido antes neste tópico, a ideia de encher as categorias olhando os interwikis é boa, mas não resolve todos os problemas, acho que categorias como essa que têm mais artigos para colocar são mais uma exceção do que uma regra, e alguém pode acabar querendo usar uma ferramenta como essa para criar categorias que ainda não existem aqui e que terão um ou dois artigos depois de criadas, o que pode piorar o problema. Danilo.mac(discussão) 02h09min de 29 de agosto de 2023 (UTC)[responder]
@Danilo.mac: O problema principal em questão é claramente identificável como sendo a desorganização da árvore de categorias em vigor. É evidente que muitos editores têm vindo a criar categorias com o mero propósito de "preencher" a estrutura hierárquica, sem a verdadeira intenção de categorizar de forma adequada os artigos. Pode-se considerar esta ação como uma adesão ao pensamento expresso pelo editor Raimundo, no sentido de que as categorias sempre terão utilidade para alguém, ou que, em algum momento futuro, alguém se encarregará de criar os artigos necessários para preencher essas categorias. É relevante mencionar que a alusão a Raimundo no comentário original da retomada foi motivada pela falta de colaboração por parte do mesmo. A análise dos poucos comentários provenientes do HTPF proporcionou abordagens instigantes, incluindo a sugestão de rever a estrutura da árvore de categorias.
Todavia, a resolução desse impasse não se mostra de fácil consecução. A sua solução requererá a condução de um enriquecedor debate. A questão que levanto é se não seria mais apropriado propor medidas para mitigar os sintomas em vez de buscar uma solução radical para a doença subjacente.
Poderíamos, por exemplo, empreender uma discussão acerca dos parâmetros de operação do robô proposto, a fim de instituir salvaguardas que previnam ocorrências de uso indevido. De fato, considerando o escopo do robô em mitigar o problema em questão, a utilização por parte de editores com o propósito de preencher indiscriminadamente as novas categorias sem conteúdo substancial deve ser considerada uma prática abusiva e um desvio de sua finalidade preconizada. Em minha perspectiva, tal abordagem representaria um ponto de partida mais frutífero. Contudo, caso haja preferência pela deliberação acerca da revisão da árvore, colocarei à disposição um repertório substancial de argumentos para serem considerados. :D Edmond Dantès d'un message? 04h02min de 29 de agosto de 2023 (UTC)[responder]
Na minha opinião, isto merece uma discussão sobre a actuação que vocês pretendem que o robot tenha. Digo isto porque: eu criei a categoria Categoria:Bispos nomeados pelo Papa Leão XI, e actualmente tem lá duas biografias. Passar esses dois artigos pra cima, seja para a Categoria:Bispos por nomeação do papa ou para a categoria Categoria:Papa Leão XI não faz sentido.
Tal como disse mais acima quando esta discussão foi iniciada, há casos e casos... Uma categoria como Categoria:Bispos por nomeação do papa, no meu ver, faz sentido e dá jeito para quem aceda a esta página, e vejo como algo natural que haja ali sub-categorias que vão acabar por ter apenas duas biografias...
Sei que há muitos casos que faz sentido implementar o que vocês estão a propor, mas acredito que também haja muitos casos em que não faz sentido... Luís Almeida "Tuga1143 09h44min de 29 de agosto de 2023 (UTC)[responder]
O robô teria que seguir alguma lógica para fazer as recategorizações, as duas lógicas mais comuns são a de tempo (ex: século>ano) e de hierarquia (ex: continente>país, família>gênero). Casos como esse que classificam pelo papa que nomeou o bispo não dá para recategorizar para uma categoria superior, o que o robô poderia fazer é criar uma lista de bispos com uma coluna indicando quem nomeou, colocar uma ligação para essa lista no artigo e remover o artigo da categoria. Essa estratégia de substituir a categoria por uma lista também pode funcionar para categorias de tempo e hierarquia, como eu já tinha proposto anteriormente nesta discussão de criar lista semelhante à Lista de municípios de São Paulo por área só que por ano de fundação. Uma lista com coluna ordenável tem praticamente a mesma utilidade que uma categoria. Danilo.mac(discussão) 18h38min de 30 de agosto de 2023 (UTC)[responder]
Inicialmente, minha intenção era apenas categorizar os artigos; no entanto, considero interessante a proposta de transformar algumas categorias em listas.
É crucial ressaltar que as categorias são abordagens relativas às perspectivas. Por exemplo, podemos organizar a categorização de bispos por séculos ou por nomeações. Qual dessas abordagens é a mais adequada? Tal questionamento não pode ser respondido nas atuais circunstâncias. Penso que a comunidade poderia (e deve) iniciar discussões para avaliar a relevância de determinadas categorias.
Deseja um outro exemplo? Por que existe uma categoria como "Água no Gabão", ou até mesmo, por que subdividir a categoria "Corpos de água do Gabão" em três subcategorias? Não seria mais eficiente categorizar todos os artigos sob "Corpos de água" e, posteriormente, incluir esta na categoria "Meio ambiente do Gabão"? Não obstante, qual a diferença entre Meio ambiente e Geografia? Não estaríamos propagando uma categoria redundante? Edmond Dantès d'un message? 20h33min de 30 de agosto de 2023 (UTC)[responder]