Sobre
#Notícias
01.06.2023

Por uma ciência aberta

Instituições adotam estratégias para impulsionar armazenamento e compartilhamento de dados brutos de pesquisa

Uma ciência aberta depende do Compartilhamento de dados de pesquisa Crédito: Mônica Nogara / Estúdio Voador

Embora muitos cientistas compreendam a importância de compartilhar dados brutos de pesquisa, poucos colocam isso em prática. É o que alerta editorial divulgado em junho na revista Nature, no qual é citado um estudo que analisou 3.556 artigos publicados em 282 periódicos nas áreas biomédicas e de saúde. O trabalho, publicado em maio no Journal of Clinical Epidemiology, identificou 1.792 papers de pesquisadores que haviam declarado que forneceriam os dados brutos mediante solicitação. No entanto, mais de 90% dos autores correspondentes recusaram ou não responderam às solicitações. Apenas 120 (6,7%) entregaram as informações em um formato utilizável, dentro do prazo combinado.

O compartilhamento de dados é cada vez mais estimulado no mundo. Em alguns casos, a prática é condição para pedir financiamento para projetos científicos. Nessa linha, uma das iniciativas mais recentes é dos Institutos Nacionais de Saúde (NIH), principal agência de apoio à pesquisa biomédica dos Estados Unidos. A partir de janeiro de 2023, os NIH passarão a exigir que a maioria dos 300 mil pesquisadores e 2.500 instituições financiadas anualmente pelo órgão inclua um plano de gerenciamento de dados em seus pedidos de subsídios.

De acordo com a política dos NIH para gerenciamento e compartilhamento de dados, a norma busca acelerar o ritmo de descobertas ao possibilitar a validação dos resultados de pesquisas, fornecendo acessibilidade a volumes de dados de alto valor científico e promovendo a reutilização destas informações em outros estudos. O esforço da política de compartilhamento de dados, de acordo com os NIH, deve evoluir de forma flexível e gradual, para acompanhar as oportunidades científicas e tecnológicas. 

“Esperamos que os pesquisadores planejem o compartilhamento de dados científicos com qualidade suficiente para que possam ser validados e replicados pelos pares”, disse ao HUB Einstein Ryan Bayha, diretor do Escritório de Engajamento Estratégico de Política Científica dos NIH. Ele explica que os dados científicos não incluem cadernos de laboratório, análises preliminares, relatórios, rascunhos de artigos, planos para pesquisas futuras e comunicações com colegas. Objetos físicos, como espécimes de laboratório, também ficam de fora.

No Brasil, o estímulo ao compartilhamento de dados de pesquisa não é uma novidade. Desde 2017 a Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) exige planos de gestão de dados para suas modalidades de financiamento, exceto para os projetos de iniciação científica. A cientista da computação Claudia Bauzer Medeiros, coordenadora do programa eScience e Data Science da FAPESP, observa que, de modo geral, o compartilhamento de dados – brutos ou não – aumenta a transparência da produção do conhecimento científico. “Além disso, outra maneira de tornar a pesquisa mais transparente é, por exemplo, disponibilizar o código computacional usado para gerar os dados brutos”, comenta Medeiros.

O imunologista Luiz Vicente Rizzo, diretor de Pesquisa do Einstein, destaca que o compartilhamento de dados tem diferentes funções. “Ampliar o acesso aos dados ajuda a multiplicar as interpretações sobre os resultados, fomentando a discussão e, consequentemente, aprimorando o processo científico.” Outra vantagem é que os custos das pesquisas tendem a diminuir com essa prática. De acordo com Rizzo, a chamada ciência aberta favorece grupos de pesquisa que dispõem de menos recursos financeiros. 

“Ao acessar dados brutos produzidos por outros cientistas, tais grupos podem participar da geração de conhecimento e, ao mesmo tempo, contribuir na reprodutibilidade de experimentos”, diz Rizzo, salientando a importância da confirmação de resultados de uma pesquisa em trabalhos posteriores como forma de identificar erros ou fraudes não detectados no processo de revisão por pares. 

Desafios e resistências

Entre os desafios para ampliar a difusão de dados brutos estão questões culturais – como a resistência de muitos pesquisadores em dividir informações com outros cientistas – ou mesmo impeditivos éticos ou legais, informa Medeiros.  “Na prática, estudos mostram que entre 60% e 70% dos cientistas no mundo inteiro não desejam compartilhar seus dados. Entre as razões, há a dificuldade técnica em preparar dados para o devido compartilhamento, a preocupação de que as informações sejam usadas indevidamente e o receio de que colegas façam descobertas e ‘saiam na frente.” 

Rizzo chama a atenção para outros fatores que geram desconfiança e impedem a disseminação de uma cultura de compartilhamento de dados na comunidade científica. “Em muitos casos, há interesse comercial atrelado aos dados e isso causa preocupação em relação à proteção da propriedade intelectual e da privacidade”, afirma o diretor do Einstein. 

Os custos das pesquisas tendem a diminuir com a ampliação do compartilhamento de dados brutos

Ele também ressalta a falta de plataformas mais confiáveis para compartilhar dados em escala global, com proteção contra invasões e adulterações. Além disso, diz ele, há divergências diplomáticas que prejudicam a troca de informações entre pesquisadores de diferentes países. 

“Minha impressão é que a maior resistência não é dos pesquisadores em si, mas sim de atores concentrados em outras instâncias, especialmente políticas e técnicas”, observa Rizzo. “Há dificuldades importantes a serem superadas em um mundo onde roubar dados virou a pirataria do século XXI.”

O nível de resistência em compartilhar dados varia, segundo Bayha, dos NIH, de acordo com a área de atuação do pesquisador. Ele identifica que diferentes comunidades de pesquisadores apresentam padrões distintos para gerenciar dados e graus variados de familiaridade com essas práticas. “Algumas áreas têm mais tradição no compartilhamento de dados brutos, como é o caso da pesquisa genômica.”

Para ilustrar, Bayha conta que os NIH fornecem repositórios de listas que demonstram o compartilhamento de dados de provenientes de várias pesquisas. Dentre eles, destaca o banco de dados de Genótipos e Fenótipos, que atualmente disponibiliza dados genômicos de mais de 2 mil estudos. 

No Einstein, uma das atribuições do Escritório de Integridade Científica, criado em 2019, é auditar a forma como os dados são armazenados pelos pesquisadores, explica Raymundo Machado de Azevedo Neto, pesquisador e membro do Escritório. “Muitos de nossos estudos usam as bases de dados e de prontuários dos hospitais geridos pelo Einstein. O acesso a essas bases é bastante restrito e protegido”, informa. 

“No entanto, uma vez utilizados em pesquisas, os dados devem ser devidamente anonimizados e protegidos. Por exemplo, quando parte da base é extraída e formatada em uma planilha, o conteúdo não pode conter informações sensíveis de pacientes, tais como nome, número de prontuário e telefone.” De acordo com Neto, o armazenamento adequado de dados exige proteção rigorosa da privacidade de pacientes que participam voluntariamente de ensaios clínicos, além de backups para evitar perda de informação.

Importância na pandemia 

Além de poder diminuir a necessidade de retrabalho na coleta de dados primários e catalisar novas colaborações, compartilhar dados brutos de pesquisa ajuda a acelerar o ritmo de descobertas – o que é desejável principalmente em situações emergenciais, como a pandemia de Covid-19, desencadeada em março de 2020.  

Estudo analisou a conformidade de pesquisadores em fornecer informações de trabalhos publicados.

Uma importante contribuição neste sentido foi o desenvolvimento do repositório Covid-19 Data Sharing/BR, uma iniciativa da FAPESP em cooperação com a Universidade de São Paulo (USP), a fim de disponibilizar dados que pudessem contribuir para pesquisas sobre a doença. O projeto reuniu instituições privadas, entre elas o Einstein, que disponibilizaram dados brutos de pacientes. “Trata-se de um caso raro de colaboração entre organizações públicas e privadas visando resolver um grande problema da sociedade”, avalia Medeiros.  

Pesquisas desenvolvidas a partir dos dados reunidos no repositório resultaram em artigos científicos e novos produtos, além de permitir o treinamento de jovens pesquisadores envolvidos nos esforços para combater a Covid-19. 

Outra experiência potencialmente exitosa de compartilhamento de dados é a Iniciativa Brasileira de Reprodutibilidade, financiada pelo Instituto Serrapilheira. Trata-se de um levantamento sistemático da reprodutibilidade de achados publicados pela ciência brasileira em áreas de pesquisa de laboratório. “Nosso intuito inicial é diagnosticar problemas, mais do que preencher lacunas”, afirma o médico Olavo Amaral, pesquisado do Instituto de Bioquímica Médica da Universidade Federal do Rio de Janeiro (UFRJ) e coordenador da iniciativa.

“Esperamos entender melhor o panorama da reprodutibilidade no Brasil e alguns fatores que possam estar relacionados com o sucesso ou o fracasso das replicações de estudos e, assim, contribuir na busca por soluções”, explica Amaral. 

De acordo com ele, o grupo está trabalhando para estabelecer a Rede Brasileira de Reprodutibilidade em breve, nos moldes da UK Reproducibility Network. A missão, diz Amaral, será disseminar e fomentar boas práticas de reprodução de pesquisas. “Dentre os muitos percalços para a pesquisa ser reprodutível estão o relato seletivo de dados, a falta de transparência em descrever métodos e resultados e o mau uso de estatística.”

* É permitida a republicação das reportagens e artigos em meios digitais de acordo com a licença Creative Commons CC-BY-NC-ND.
O texto não deve ser editado e a autoria deve ser atribuída, incluindo a fonte (Science Arena).

Notícias

Subscribe
Notify of
0 Comentários
Inline Feedbacks
Ver todos os comentários
Receba nossa newsletter

Newsletter

Receba nossos conteúdos por e-mail. Preencha os dados abaixo para assinar nossa newsletter

Captcha obrigatório
Seu e-mail foi cadastrado com sucesso!
Cadastre-se na Newsletter do Science Arena