22.06.2026 Inteligência Artificial

Jogar PDFs na IA não basta para fazer uma boa revisão científica

Pesquisador recomenda estratégia incremental para analisar artigos científicos com mais controle, rastreabilidade e senso crítico

Juliana Protásio

Pilhas de livros empilhados desordenadamente sobre superfície de madeira, fotografados em perspectiva com foco seletivo e luz ambiente quente

Plataformas voltadas ao ambiente acadêmico, como Consensus, Elicit e SciSpace, têm permitido otimizar processos que antes demandavam semanas de trabalho manual. A inteligência artificial (IA) generativa tornou-se uma ferramenta crescente na pesquisa científica, mas sua adoção exige critério metodológico para não comprometer a integridade das análises.

O principal risco está no chamado lazy prompting, a elaboração de comandos imprecisos que delegam o raciocínio crítico à máquina. Na revisão de literatura, a manifestação mais frequente desse problema é inserir grandes volumes de arquivos PDF de uma só vez, sem contexto suficiente para que o modelo os processe com precisão.

Em entrevista ao Science Arena, João Brainer, médico neurologista, pesquisador clínico do Einstein Hospital Israelita e professor da Universidade Federal de São Paulo (Unifesp), alertou para os riscos desse tipo de abordagem.

“As pessoas acreditam que a IA está habilidosa ao ponto de desenvolver um raciocínio crítico, mas isso não existe”, disse Brainer.

Alucinação e perda de conteúdo

O problema tem origem na arquitetura dos grandes modelos de linguagem (LLMs, na sigla em inglês). À medida que o volume de informações inserido simultaneamente em um prompt aumenta, a precisão do sistema decai de forma proporcional.

“Quanto mais informações eu jogo, maior vai ser a chance de a IA alucinar”, alerta Brainer.

O processamento massivo de documentos compromete a coerência analítica do modelo. O resultado é uma análise “confabulatória” e de baixa confiabilidade, caracterizada por três falhas graves:

Mistura de autores e referências entre estudos distintos;
Perda de conteúdos essenciais diluídos nos textos;
Geração de conclusões genéricas.

“Se você simplesmente pedir para pegar o que já existe e replicar, vai criar muitos textos inespecíficos. Em ciência, é preciso entender e saber onde está o problema, conhecer a realidade, falar com outras pessoas, ler artigos semelhantes”, explica Brainer.

A superficialidade, segundo ele, anula o rigor exigido pela ciência de fronteira.

Há ainda um limite técnico frequentemente ignorado: a maioria das ferramentas restringe o carregamento direto a cerca de dez artigos por vez.

Tentar contornar essa barreira, por meio de plataformas generalistas ou de contextos excessivamente amplos, satura a capacidade de processamento preciso do modelo.

Abordagem incremental como solução

Para preservar a qualidade da revisão de literatura, Brainer recomenda uma abordagem estratégica e fragmentada: alimentar a IA com lotes restritos de artigos: cinco PDFs por vez, como referência.

O fluxo incremental proposto está detalhado abaixo. Seguido sistematicamente, ele permite realizar verificações cruzadas e mitigar tanto os erros dos modelos quanto as inconsistências da leitura humana.

“A inteligência computacional ainda é e deve continuar sendo subserviente à inteligência humana, não deve ser entendida como substituta”, observa Brainer.

Para ele, o raciocínio crítico e os insights do pesquisador são insubstituíveis para garantir ética, transparência e impacto real na produção científica.

Como processar artigos científicos com IA em etapas incrementais

Upload de grupo pequeno: Carregar um conjunto restrito de artigos (referência: cinco PDFs) e analisar a resposta entregue pela ferramenta.
Inserção incremental: Adicionar o grupo seguinte e solicitar especificamente à IA que aponte o que o novo bloco acrescenta em relação ao anterior.
Rastreabilidade das afirmações: Exigir que a ferramenta justifique e indique, textualmente, em qual trecho de cada artigo, cada afirmação foi embasada.

Confira a seguir a íntegra da live com João Brainer:

* É permitida a republicação das reportagens e artigos em meios digitais de acordo com a licença Creative Commons CC-BY-NC-ND.
O texto não deve ser editado e a autoria deve ser atribuída, incluindo a fonte (Science Arena).