Um problema de integridade editorial está se tornando mensurável em grande escala

Uma ampla revisão de artigos biomédicos encontrou um aumento acentuado de referências fabricadas desde 2023, levantando preocupação de que erros de citação gerados por IA estejam entrando em literatura que ajuda a moldar o entendimento clínico e, em alguns casos, diretrizes. De acordo com o texto-fonte fornecido, pesquisadores da Columbia University e de outras instituições examinaram 2,47 milhões de artigos no arquivo aberto do PubMed Central, cobrindo publicações de janeiro de 2023 até fevereiro de 2026. Entre 97,1 milhões de referências verificadas, 4.046 foram sinalizadas como fabricadas em 2.810 artigos.

A escala do conjunto de dados importa. As preocupações com citações inventadas por modelos de linguagem circulam há anos, mas o material fornecido apresenta isso como a maior revisão já feita de referências biomédicas. Isso transforma um problema anedótico em algo mais próximo de um alerta sistêmico. Se referências fabricadas estão aparecendo em milhares de artigos, a questão já não se limita a erros isolados ou ao uso amador. Ela se torna um desafio para os próprios fluxos de publicação científica.

O ponto mais marcante no texto-fonte é a curva de tendência. Ao longo de 2023, a taxa teria permanecido em torno de quatro referências fabricadas por 10 mil artigos. A partir de meados de 2024, ela subiu rapidamente, chegando a 51,3 por 10 mil no fim de 2025 e a 56,9 por 10 mil nas primeiras sete semanas de 2026. Isso representa um aumento de mais de doze vezes em relação à base anterior.

O timing fortalece a hipótese da IA, mas não prova exclusividade

Os autores citados no texto-fonte veem uma conexão provável e evidente com o uso disseminado de modelos de linguagem como o ChatGPT. O raciocínio é tanto cronológico quanto técnico. Como os geradores de texto de uso geral se tornaram amplamente adotados após o fim de 2022, e a publicação acadêmica muitas vezes leva de 100 a 200 dias entre a submissão e a aparição, o efeito da redação assistida por IA seria esperado em arquivos como o PubMed Central por volta de meados de 2024. É exatamente aí que começa o salto relatado.

Ao mesmo tempo, o material de origem observa que os pesquisadores não descartam outras causas. Atividade de paper mills e mudanças nas práticas de indexação são mencionadas como possíveis fatores contribuintes. Essa cautela é importante. Os dados parecem compatíveis com uma maior disseminação de citações fabricadas por IA, mas a fonte não afirma provar de forma exclusiva que os modelos de linguagem expliquem todos os casos.

Ainda assim, a lógica é convincente. Sabe-se que grandes modelos de linguagem podem produzir referências que parecem plausíveis, seguir o formato correto e até associar pesquisadores reais a artigos inexistentes. Em um ambiente acadêmico de alto volume, esses erros podem sobreviver se nem autores nem editores os validarem com cuidado.

O problema não são apenas referências falsas, mas referências falsas com aparência crível

Um dos detalhes mais alarmantes no material fornecido é como pode ser difícil detectar essas citações fabricadas por inspeção visual. O texto diz que as referências falsas muitas vezes combinam com o tema do artigo, usam formatação adequada, creditam pesquisadores reais e incluem anos de publicação plausíveis. Em um exemplo citado, um artigo de urologia continha 18 referências fabricadas entre 30 verificadas.

É isso que torna o problema especialmente perigoso na publicação biomédica. Uma citação visivelmente quebrada pode ser identificada rapidamente. Uma citação polida, porém inexistente, pode passar pela revisão por pares e entrar no registro publicado se ninguém a conferir em bases de dados confiáveis. A definição de “fabricada” adotada no estudo reflete essa preocupação: um título citado era sinalizado se não pudesse ser encontrado no PubMed, Crossref, OpenAlex ou Google Scholar.

O material de origem também destaca onde o risco se torna mais grave. Referências fabricadas são especialmente preocupantes quando aparecem em artigos de revisão, porque esses trabalhos costumam sintetizar evidências para públicos mais amplos e podem influenciar diretrizes clínicas. Se a estrutura de uma revisão contém literatura inventada, os efeitos posteriores podem ir muito além de uma única publicação.

A resposta proposta é mais automação, não menos escrutínio

Os pesquisadores, segundo o texto-fonte, pedem verificações automatizadas de referências antes da publicação e triagem retroativa de artigos já publicados. A recomendação é prática porque o problema em si é, em parte, uma questão de escala. Revisores humanos não conseguem verificar realisticamente cada citação manualmente em milhões de artigos, especialmente quando as referências falsas são desenhadas para parecer legítimas.

O material de origem observa que plataformas como o arXiv já introduziram sanções iniciais para erros relacionados à IA. Isso sinaliza um movimento em direção a normas mais rígidas, mas a publicação biomédica provavelmente precisa de mais do que avisos. A validação de referências talvez tenha de se tornar uma etapa técnica rotineira nos fluxos editoriais, assim como checagens de plágio ou triagem de imagens.

Há também uma lição mais ampla. Ferramentas de IA podem reduzir o custo de redigir textos, mas também podem reduzir o custo de produzir falsidades com aparência de autoridade. Na comunicação científica, essa troca é especialmente perigosa porque os leitores muitas vezes presumem que o aparato de citações já foi verificado. Quando essa suposição enfraquece, a confiança na literatura se corrói.

O desafio de integridade agora faz parte da história da adoção de IA

A nova auditoria sugere que citações fabricadas já não são uma questão periférica na publicação biomédica. Elas estão aparecendo com frequência suficiente, e crescendo rápido o bastante, para exigir mudanças de processo. Seja o principal motor o uso indevido de modelos de linguagem, as paper mills ou uma combinação de causas, a implicação prática é a mesma: referências não podem mais ser tratadas como confiáveis apenas porque parecem profissionais.

Isso é um problema sério para qualquer área, mas especialmente para uma em que revisões e sínteses podem ajudar a moldar diretrizes clínicas. A lição do material de origem não é que a IA deva ser excluída dos fluxos de pesquisa. É que a redação assistida por IA sem verificação rigorosa pode contaminar a cadeia de evidências. Quando isso acontece em escala, o custo em credibilidade se espalha muito além de um único artigo.

  • Uma auditoria de 2,47 milhões de artigos biomédicos encontrou 4.046 referências fabricadas em 2.810 artigos.
  • A taxa de citações falsas teria aumentado mais de doze vezes desde 2023 até o início de 2026.
  • Os pesquisadores apontam os modelos de linguagem como um provável motor, sem excluir outras causas.
  • Citações falsas são especialmente arriscadas em artigos de revisão que influenciam entendimento clínico e diretrizes.
  • Os autores do estudo pedem checagem automatizada de referências e triagem retroativa.

Este artigo é baseado em uma reportagem do The Decoder. Leia o artigo original.

Originally published on cleantechnica.com