#Carreiras
Jogar PDFs na IA não basta para fazer uma boa revisão científica
Pesquisador recomenda estratégia incremental para analisar artigos científicos com mais controle, rastreabilidade e senso crítico
Assim como pilhas de livros, grandes conjuntos de PDFs podem sobrecarregar análises automatizadas quando processados sem curadoria, recorte e comandos precisos | Imagem: Unsplash
Plataformas voltadas ao ambiente acadêmico, como Consensus, Elicit e SciSpace, têm permitido otimizar processos que antes demandavam semanas de trabalho manual. A inteligência artificial (IA) generativa tornou-se uma ferramenta crescente na pesquisa científica, mas sua adoção exige critério metodológico para não comprometer a integridade das análises.
O principal risco está no chamado lazy prompting, a elaboração de comandos imprecisos que delegam o raciocínio crítico à máquina. Na revisão de literatura, a manifestação mais frequente desse problema é inserir grandes volumes de arquivos PDF de uma só vez, sem contexto suficiente para que o modelo os processe com precisão.
Em entrevista ao Science Arena, João Brainer, médico neurologista, pesquisador clínico do Einstein Hospital Israelita e professor da Universidade Federal de São Paulo (Unifesp), alertou para os riscos desse tipo de abordagem.
“As pessoas acreditam que a IA está habilidosa ao ponto de desenvolver um raciocínio crítico, mas isso não existe”, disse Brainer.
Alucinação e perda de conteúdo
O problema tem origem na arquitetura dos grandes modelos de linguagem (LLMs, na sigla em inglês). À medida que o volume de informações inserido simultaneamente em um prompt aumenta, a precisão do sistema decai de forma proporcional.
“Quanto mais informações eu jogo, maior vai ser a chance de a IA alucinar”, alerta Brainer.
O processamento massivo de documentos compromete a coerência analítica do modelo. O resultado é uma análise “confabulatória” e de baixa confiabilidade, caracterizada por três falhas graves:
- Mistura de autores e referências entre estudos distintos;
- Perda de conteúdos essenciais diluídos nos textos;
- Geração de conclusões genéricas.
“Se você simplesmente pedir para pegar o que já existe e replicar, vai criar muitos textos inespecíficos. Em ciência, é preciso entender e saber onde está o problema, conhecer a realidade, falar com outras pessoas, ler artigos semelhantes”, explica Brainer.
A superficialidade, segundo ele, anula o rigor exigido pela ciência de fronteira.
Há ainda um limite técnico frequentemente ignorado: a maioria das ferramentas restringe o carregamento direto a cerca de dez artigos por vez.
Tentar contornar essa barreira, por meio de plataformas generalistas ou de contextos excessivamente amplos, satura a capacidade de processamento preciso do modelo.
Abordagem incremental como solução
Para preservar a qualidade da revisão de literatura, Brainer recomenda uma abordagem estratégica e fragmentada: alimentar a IA com lotes restritos de artigos: cinco PDFs por vez, como referência.
O fluxo incremental proposto está detalhado abaixo. Seguido sistematicamente, ele permite realizar verificações cruzadas e mitigar tanto os erros dos modelos quanto as inconsistências da leitura humana.
“A inteligência computacional ainda é e deve continuar sendo subserviente à inteligência humana, não deve ser entendida como substituta”, observa Brainer.
Para ele, o raciocínio crítico e os insights do pesquisador são insubstituíveis para garantir ética, transparência e impacto real na produção científica.
Como processar artigos científicos com IA em etapas incrementais
-
Upload de grupo pequeno
-
Carregar um conjunto restrito de artigos (referência: cinco PDFs) e analisar a resposta entregue pela ferramenta.
-
Inserção incremental
-
Adicionar o grupo seguinte e solicitar especificamente à IA que aponte o que o novo bloco acrescenta em relação ao anterior.
-
Rastreabilidade das afirmações
-
Exigir que a ferramenta justifique e indique, textualmente, em qual trecho de cada artigo, cada afirmação foi embasada.
Confira a seguir a íntegra da live com João Brainer:
*
É permitida a republicação das reportagens e artigos em meios digitais de acordo com a licença Creative Commons CC-BY-NC-ND.
O texto não deve ser editado e a autoria deve ser atribuída, incluindo a fonte (Science Arena).