Wikipédia:Esplanada/geral/Problema: ligações de conteúdo patrocinado (28mar2021)

Origem: Wikipédia, a enciclopédia livre.

Bem, há um bom tempo que observo o aumento no uso de ligações de conteúdo patrocinado como fonte. Tais ligações, inclusive, estão sendo usadas como artimanha de spammers para suprir a verificabilidade, dificultando a análise dos voluntários e desrespeitando as políticas da Wikipédia. Posso facilmente citar alguns exemplos, como os currículos de italianos publicados há alguns meses e que tiveram defesas pela manutenção, mesmo sendo compostos por press-releases escandalosos. Ou também os casos de Jsmithn22 e Luca Moreira, o primeiro usa muito conteúdo patrocinado duma empresa de Portugal, enquanto o segundo é o conhecido caso, no qual novas evidências indicam a existência doutra empresa de divulgações relacionada.

Neste contexto, estou procurando tomar conhecimento da opinião da comunidade e levanto tais sugestões:

  • Formalizar uma política proibindo o uso dessas ligações, categorizando-as como não não confiáveis e parciais. Além de prever sanções para contas que insistirem na inclusão;
  • Inserir de forma massiva essas ligações na lista negra;
  • Criar uma lista informativa indicando quais ligações foram bloqueadas e mantê-la atualizada para que os editores possam verificar e propor o bloqueio de novas ligações;
  • Se possível, criar filtros que possam catalogar edições ou até mesmo impedi-las.

Pois bem, antes de mais nada faço algumas ressalvas: i) o objetivo seria criar uma política que pudesse proibir o uso de conteúdo patrocinado, seja uma política do zero ou até mesmo aproveitar o ensaio Wikipédia:Spam, reformular e transformar em recomendação. ii) obviamente não sairíamos adicionando qualquer url na blacklist, mas sim aquele com mais índice de visualizações externa e uso no projeto. Posso cintar o exemplo do subdomínio "terra.com.br/noticias/dino". iii) as duas últimas sugestões não precisariam ser efetivamente aplicadas, talvez não seja precisar criar a lista caso um filtro eficiente consiga criar um mecanismo de verificação. Por causa disso, notifico aqui: Albertoleoncio, Mr. Fulano e !Silent, editores da área de filtros.

Obviamente, o objetivo do tópico é "ouvir" sugestões.

Edmond Dantès d'un message? 11h21min de 28 de março de 2021 (UTC)[responder]

Comentário Eu há anos que reverto link farming; isto é, a inserção discreta de "referências" que na realidade não referenciam nada e só servem para ter uma ligação para um site comercial. É uma manha de SEO antiga. No entanto, não compreendo muito bem o que entende por conteúdo patrocinado. Pode dar um exemplo? Nvm, já percebi. JMagalhães (discussão) 13h40min de 28 de março de 2021 (UTC)[responder]

@JMagalhães: o termo conteúdo patrocinado é usado nos EUA para referir a todas as propagandas disfarçadas de notícias. Normalmente, publica-se sobre uma eventual obra numa rodovia, mas na verdade trata-se dum anúncio duma empresa de carros, por exemplo. Este método é bastante usado nos Estados Unidos, mas desconheço em outros países e acredito que tenha até variações.
Um exemplo prático que posso cintar é o "terra.com.br/noticias/dino/". O conceito é bem semelhante ao link farming, pois a empresa de divulgações fecha contratos com outros meios de comunicação e gera um endereço url específico dentro do domínio do parceiro. A empresa Dino, inclusive, possui mais de 100 parceiros comerciais que repassam as divulgações da Dino. Esta empresa é praticamente uma praga na Wikipédia, pois quase todos os spammers lusófonos usam as divulgações como referências. Até mesmo o domínio da Dino se encontra na lista negra, mas a prática farming burla a restrição.comentário não assinado de Conde Edmond Dantès (discussão • contrib) 11h29min de 28 de março de 2021 (UTC)[responder]
  • Já faz um ano que abri um tópico aqui pedindo o bloqueio do uso do portal Terra como referência em artigos, a maioria é matéria paga. Outros portais, como It mídia ou IT Fórum e Baguete só publicam anúncios disfarçados de notícia, a maioria só press releases. A preguiça é tanta que muitas vezes noto que o texto é o mesmo em todas as fontes, tenho rejeitado restaurar artigos assim mas tem muito editor que ainda se deixa enganar por elas. O problema maior é que parece que essas fontes são criadas especialmente para iludir a Wikipédia e um bloqueio muitas vezes só resulta na mudança do título da página. Muitos endereços que deveriam ser sérios, como o UOL e a Folha também tem seções de blogs, comunicacação empresarial ou publicidade disfarçada (verifiquem o link [1], reparem que ao lado do texto tem uma pequena citaçã:o "informe publicitário"). É preciso alertar a comunidade sobre isso e começar um combate violento contra elas, por isso apoio a proposta.Jo Loribd 14h10min de 28 de março de 2021 (UTC)[responder]
@Jo Lorib: para ser sincero, os portais como Terra, UOL e Sapo venderam suas "independências". Há um bom tempo que eles são domínios de sítios, perdendo fiabilidade. Durante as verificações de spammers, observei que o Observatório de Famosos (que é um belo exemplo de farming) e inúmeras colunas/blogues do Extra também publicam propagandas de forma descarada. Somente para ressaltar, nos Estados Unidos existe um conceito ainda pior! São os sítios wires, organizados por publicitários que criam "belíssimas notícias" sobre o assunto que você paga. Alguns ainda chegam a ser colaborativos. Edmond Dantès d'un message? 14h29min de 28 de março de 2021 (UTC)[responder]

Comentário Citação: como os currículos de italianos publicados há alguns meses e que tiveram defesas pela manutenção, mesmo sendo compostos por press-releases escandalosos Isto. O problema está sobretudo aqui. O problema é cultural, e não técnico. A tarefa de rever e detectar "fontes" que não passam de conteúdo pago já é por si só difícil. E quando se detecta, ainda se tem que lidar com editores inexperientes, ingénuos ou de má-fé para quem qualquer porcaria de link é uma "fonte". Basta ver a quantidade de gente que em PE aparece a defender notoriedade com base em "prémios" obscuros que mais não são que jogadas comerciais, ou com base em artigos de revistazecas em que todo o conteúdo é elaborado mediante pagamento. Mesmo quando simplesmente se reverte ou remove essa propaganda dos artigos, volta e meia aparece sempre um dos fanáticos do "está referenciado" para contestar a remoção, como se as fontes fossem todas iguais. Spammers haverá sempre, o que torna difícil o combate na pt.wiki são os que fazem o jogo deles. JMagalhães (discussão) 14h30min de 28 de março de 2021 (UTC)[responder]

@JMagalhães: considero válido o seu posicionamento e tratando de ingenuidade a Wikipédia Anglófona é muito maior já que eu precisei escrever letra por letra as indicações de conteúdo patrocinado nos currículos italianos. Inclusive, muitas traziam "source: press releases em inglês e tinha usuários da própria língua defendendo a manutenção! O ponto que acredito ser interessante seria oficializar essas "notícias", o que permitiria que o editor removesse as ligações dos artigos baseado na política. Acredito que isso deve diminuir a quantidade de artigos que vão para consenso. Edmond Dantès d'un message? 15h23min de 28 de março de 2021 (UTC)[responder]
  • A situação é realmente grave. Já é corrente a prática de comprar exposição midiática em jornais, blogues e youtubers e isso acaba comprometendo a qualidade do nosso conteúdo. Precisamos tomar uma postura sobretudo em artigos sobre pessoas vivas e empresas. Agora o cidadão compra press releases em meia dúzia de sites e já quer escrever um artigo na Wikipédia com seu armário de troféus. O uso da Wikipédia para angariar visibilidade e respeitabilidade é patente. Todo dia vejo artigo sobre empresas sendo criados com base em cobertura jornalística concentrada nos últimos poucos meses. Felizmente vão tudo para ER. Devemos estar atentos a essas firmas constituídas para dar golpes e vêm na Wikipédia para construir reputação. Concordo com o tom geral da proposta. Precisamos polir as políticas de fontes confiáveis (e por outras razões também) e critérios de inclusão. Lechatjaune msg 14h37min de 28 de março de 2021 (UTC)[responder]
Sim, Lechatjaune, eu observei que os artigos são criados no mesmo período da divulgação do conteúdo patrocinado. Alguns no mesmo mês, outros na mesma semana! Parece que eles oferecem a Wikipédia como parte do pacote. Edmond Dantès d'un message? 15h31min de 28 de março de 2021 (UTC)[responder]

Pergunta Conde Edmond Dantès você poderia, por favor, adicionar alguns diferenciais para eu compreender exatamente do que se trata via exemplos? Obrigado. --Felipe da Fonseca (discussão) 14h40min de 28 de março de 2021 (UTC)[responder]

@Felipe da Fonseca: ficarei devendo! Estou um pouco ocupado no momento, mas providenciarei alguns diffs assim que me desocupar. Desculpas. Edmond Dantès d'un message? 15h31min de 28 de março de 2021 (UTC)[responder]
Conde Edmond Dantès já que se comprometeu em trazer em momento futuro, fico na espera para comentar, mas antecipo que já entendi o problema. Esta questão passa pelo problema mais genérico de fiabilidade das fontes, inclusive lembrei e estou reativando um importante um projeto meu, ver: Usuário:Felipe da Fonseca/Testes5, o qual levarei adiante com bastante calma. Convido-o a participar.--Felipe da Fonseca (discussão) 15h48min de 28 de março de 2021 (UTC)[responder]

Comentário: primeiramente, notem que a questão dos comunicados de imprensa já é tratada aqui e a questão dos conteúdos patrocinados é mais ou menos abordada na seção que vem logo abaixo (embora ambas estejam numa página informativa e não exatamente numa política). De qualquer forma, conteúdos patrocinados, no meu entendimento, devem ser tratados como quaisquer outros conteúdos autopublicados, isto é, têm peso zero na determinação da notoriedade do assunto e podem ser usados, no máximo, para referenciar alguma informação não controversa que não tenha sido encontrada em outra fonte melhor. Victor LopesDiga!C 14h52min de 28 de março de 2021 (UTC)[responder]

@Victor Lopes: o problema é exatamente este, o spammer está pouco se lixando para a página informativa. O objetivo é transformar os comunicados de imprensa de "não independentes" para proibidos, o que devem ser removidos! Além disso, eu teria muito receio em usar conteúdo promocional como fonte, mesmo que seja algo besta como "a rua 20 fica em Florianópolis". Se esta informação estiver referenciada por um panfleto duma empresa que fica na mesma rua, pode significar a inclusão de spams. Edmond Dantès d'un message? 15h31min de 28 de março de 2021 (UTC)[responder]
Receio que proibir, simplesmente, seja uma medida radical. Eu mesmo já me utilizei de comunicados de imprensa para corroborar certas informações que não encontrei em fontes melhores. Eu edito muito em artigos sobre música, e a imprensa musical em geral virou uma multiplicadora de releases e posts em redes sociais, infelizmente. Essa questão exigiria uma política inteira explicando quando é razoável usar um conteúdo e quando não é, isso sem falar na impossibilidade de se manter uma visão romântica do Jornalismo nos tempos modernos. Aproveito para ressaltar que conteúdo de marca e comunicado de imprensa (press release) são materiais diferentes, produzidos por profissionais diferentes, com finalidades diferentes e a iniciativa de publicá-los ou não também nasce de motivações diferentes. Consequentemente, o tratamento deles aqui na Wikipédia também deve ser diferente. Victor LopesDiga!C 21h30min de 28 de março de 2021 (UTC)[responder]

Apoio a causa, podendo incluir tais fontes em WP:FNF. Também seria uma maneira de evitar muitos conflitos/GEs a respeito de acontecimentos polêmicos — principalmente de teor político-ideológico. Gabriel bier fala aew 16h25min de 28 de março de 2021 (UTC)[responder]

  • No caso de artigos sobre empresas acho que devíamos apertar a tarraxa sem a menor dó impondo um critério de notoriedade super rígido, tipo só aceitar empresas com ações na bolsa, é uma abuso sem tamanho o que fazem para melhorar o SEO.Jo Loribd 17h16min de 28 de março de 2021 (UTC)[responder]
Jo Lorib, isso seria muito restrivo e resultaria na eliminação de portais de notícias, canais no Youtube e provavelmente mais um monte de coisas relevantes. Lechatjaune msg 17h56min de 28 de março de 2021 (UTC)[responder]
Podia-se fazer como na en.wiki: pera empresas em atividade e biografias de pessoas vivas, só se aceitam os artigos se houver consenso pela manutenção. JMagalhães (discussão) 18h37min de 28 de março de 2021 (UTC)[responder]
Sem adentrar especificamente no tema aqui discutido, creio que se deve sempre ter certo equilíbrio. Por mais que venham me dizer que uma coisa não tem nada a ver com a outra, não é assim que eu vejo. Se somos muito permisssivos no caso de futebol, a aceitar jogadores da quarta divisão, porque devemos ser rígidos em outras áreas? Para mim não faz o menor sentido. --Felipe da Fonseca (discussão) 18h47min de 28 de março de 2021 (UTC)[responder]
(conflito de edição) Exato. E de forma que complemente o comentário do Lechatjaune, isso adentra um subtema: observar a questão das fontes primárias, que não ferem as políticas vigentes de WP:FCFP — SE utilizadas de forma correta —, pois muitos canais no YouTube também são usadas como fontes, caracterizando-se como primárias. Gabriel bier fala aew 18h52min de 28 de março de 2021 (UTC)[responder]
Gabriel bier, este é um assunto muito importante e que deve ser abordado. Criou-se um preconceito contra fontes primárias, como se elas não fossem as melhores em muitos casos. Fontes primárias não são más, mau é tirar conclusões delas ou usá-las para comprovar notoriedade. Mas isso abre uma seara de discussões enorme. Lechatjaune msg 21h30min de 28 de março de 2021 (UTC)[responder]
Só para lembrar e talvez conseguir que os senhores (as) percebam como as cosias não estão separadas em universos paralelos: os times de futebol são empressas e o maior patrimônio deles são os jogadores... ter jogadores lançados pela wikipédia é uma jogada de marketing igual ter um produto lançado aqui. Me parece que ou se é muito liberal e preza-se pela quantidade de artigo, ou rígido e preza-se pela qualidade... mas ser uma cosia em um caso e outra em outro é esquisofrenia. --Felipe da Fonseca (discussão) 19h06min de 28 de março de 2021 (UTC)[responder]
  • O tópico desviou um pouco do assunto proposto, e a culpa foi minha ao misturar fontes pagas com critérios de notoriedade, voltemos a fita e vamos falar apenas de uso de fontes pagas, como as já citadas Terra, UOL, It mídia e outras semelhantes, o que fazer com elas? Criar um alista, bloquear, ou aceitar sem restrição?Jo Loribd 12h59min de 29 de março de 2021 (UTC)[responder]

Comentário Se a matéria for explícita apontando o conteúdo publicitário, acredito que esta deveria ir para a lista negra. Já os portais no contexto geral (ainda mais se tratando da UOL, que é um domínio responsável por armazenar o conteúdo independente da Folha de S.Paulo) dependem do financiamento de seus assinantes para manterem seus trabalhos, afinal essa é uma das principais maneiras de veículos de imprensa ganharem dinheiro (assinantes e publicidade). O conteúdo independente a gente costuma analisar quando é reputado por jornalistas, historiadores, cientistas, pois eles dão reconhecimento a estes pares. Única exceção mesmo é se o conteúdo publicitário ocorrer, de forma explícita, numa determinada matéria, para fins de divulgação de um determinado produto, o que deve ser desconsiderado. WikiFer msg 13h34min de 29 de março de 2021 (UTC)[responder]

Comentário ainda não vi exatamente os casos concretos, mas já deu para entender o problema: eu não acredito que bloqueio seja a solução, as fontes primárias, mesmo que pagas, podem ser sim fontes de informação, porque não? Porém, o que elas não são e não podem ser, são índícios de notoriedade... Portanto, como afirma Conde Edmond Dantès elas não podem servir para manter páginas. Uma lista negra seria útil, desde que não se trata de filtro, mas de indicativos negativos para eliminação.--Felipe da Fonseca (discussão) 13h42min de 29 de março de 2021 (UTC)[responder]

Citação: fontes primárias, mesmo que pagas, podem ser sim fontes de informação, porque não? Porque não são independentes. JMagalhães (discussão) 16h11min de 29 de março de 2021 (UTC)[responder]
E? Toda informação passa pela interpretação, e não é diferente o que ocorre com a fonte primária, ela não deve ser recebida de forma inocente, acrítica. Deixaríamos então de avaliar os dados de caixa de uma empresa, p.ex. só porque são produzidos pela própria empresa? Tenho opinião diversa, neste caso.--Felipe da Fonseca (discussão) 16h15min de 29 de março de 2021 (UTC)[responder]
Esse exemplo não é propriamente a situação que estamos a discutir aqui. Um exemplo mais acertado: uma empresa paga uma notícia num jornal para se afirmar como a "empresa líder do setor" na região. Isso é válido como referência? Claro que não. JMagalhães (discussão) 16h18min de 29 de março de 2021 (UTC)[responder]
Claro que não, concordo. Mas colocar um filtro, entendo eu, é completamente errado, porque nesta reportagem podem estar informações como caixa da empresa, que é um dado objetivo, e outros. Foi exatamente isso que afirmei: em uma reportagem paga ao estilo que está sendo tratado aqui, geralmente fornece-se informações sobre a empresa e um julgamento (que é a propoaganda) deturpado, mas este julgamento pode ser deixado de lado. Simplesmente criar um filtro barraria a possibilidade de citar o site por dados objetivos... Dou um exemplo hipotético: digamos que uma editora pagou um site para fazer propaganda de seu livro... o site então fala que este livro é ótimo e, ao mesmo tempo, fornece informações sobre ele, como número de livros vendidos, traduções disponíveis, etc... estas dados objetivos podem ser usados, mesmo sendo uma fontes primária, ou uma fonte paga.--Felipe da Fonseca (discussão) 16h50min de 29 de março de 2021 (UTC)[responder]

Comentário conforme o tópico foi desviado e demorei um tempo para retornar na Wikipédia, tomei a liberdade de colocar um risco para separar as partes já que pretendo responder todos duma única vez.

Em primeiro lugar, @Victor Lopes:, comunicados de imprensas nem sempre são sinônimos de propagandas. Contudo, o termo começou a ser adotado para se referir aos conteúdos publicitários, acredito até memso como uma forma de criar uma falsa credibilidade. Então, o que estaria sendo proposto seria impedir a inclusão de ligações de empresas especializadas na divulgação de notícias promocionais, sendo assim haveria uma discussão prévia para saber quais das empresas vem "causando" mais problemas na Wikipédia. Adendo: obviamente existe pessoas que cobram dinheiro para divulgar tópicos na Wikipédia, mas não acho correto vincular as empresas sem evidências disso. Mesmo discordando da forma antiética delas atuarem, principalmente por sujar o jornalismo, os problemas estão sendo causado por editores!

@Felipe da Fonseca: um exemplo que posso citar é a página D'Alma (banda portuguesa), que parece ter sido pago um bom dinheiro para divulgar pois sempre surgiu spammers para recriá-la. Nesta versão, em específico, usaram a fonte Paivense, que parece ser um sítio que propaga publicidade da agência MF Press Global, muito usada pelo spammer Jsmithn22. A página ainda apresentou oito fontes: [https://observatoriodemusica.uol.com.br/noticia/dalma-banda-de-pop-rock-portuguesa-com-um-lado-brasileiro Observatório de Música] e Cartão de Visita usam o mesmo texto base. Aliás, esses sítios "Observatórios" se transformaram num repositório sem vergonha de divulgação, tanto que cheguei a bloquear as ligações. Em suma, 1/3 das fontes são propagandas da MF Press Global. Ainda assim, havia outras três fontes que o texto é praticamente igual: X Music, Marta - O Meu Canto e Made In Portugal e isso somente serve para "inflar" o número de "referências", o que dificulta a análise dos voluntários.

Outro ponto, o assunto se desviou completamente! As fontes primárias é uma outra história a parte! Eu posso citar este exemplo, o qual a fonte da Confederação Brasileira de Futebol é a única que me permite referenciar todos os clubes de futebol classificados numa única ligação! Existe um caráter informativo. Outra história é uma notícia republicada de forma massiva por empresas de marketing, num evidente caráter promocional. Sendo assim, questiono: você tem confiabilidade? Você sabe se a notícia enviada foi conferida? Sabe quais processos de verificação o conteúdo passou? Por exemplo, usaria esta fonte para atestar a informação de que vender selo de verificação é proibida?

Edmond Dantès d'un message? 06h45min de 31 de março de 2021 (UTC)[responder]

Pergunta e Comentário como você diferencia estas "notícias com evidente caráter promocional" de fonte primária? Não ficou claro. Entendo que, na medida em que é um texto feito pela própria pessoa ou empresa que deseja ser divulgada, ou a mando da mesma, é uma fonte primária e deve ser tratada como tal. Por exemplo, a reportagem acima confirma que "ao menos uma pessoa defende que vender selos de autenticidade pode dar cadeia", isso ainda não diz nada sobre a importância deste fato... ele é comungado por outros advogados? Este "um", é na verdade um grupo? Qual tamanho? Há processos neste sentido? Há jurisprudência neste sentido?--Felipe da Fonseca (discussão) 10h58min de 31 de março de 2021 (UTC)[responder]