re3data
Dados científicos volume 10, número do artigo: 571 (2023) Citar este artigo
119 Acessos
4 Altmétrico
Detalhes das métricas
Há mais de dez anos, o re3data, um registro global de repositórios de dados de pesquisa (RDRs), tem ajudado cientistas, agências de financiamento, bibliotecas e centros de dados a encontrar, identificar e referenciar RDRs. Como o maior diretório mundial de RDRs, o re3data descreve atualmente mais de 3.000 RDRs com base em um esquema abrangente de metadados. O serviço permite a busca de RDRs de qualquer tipo e de todas as disciplinas, e os usuários podem filtrar os resultados com base em uma ampla gama de características. As descrições do re3data RDR estão disponíveis como Dados Abertos acessíveis por meio de uma API e são utilizadas por vários serviços de Ciência Aberta. A re3data está envolvida em diversas iniciativas e projetos relativos à gestão de dados e é mencionada nas políticas de muitas instituições científicas, organizações financiadoras e editoras. Este artigo reflete sobre a experiência de dez anos na execução do re3data e discute dez questões-chave relacionadas ao gerenciamento de um serviço de Ciência Aberta que atende RDRs em todo o mundo.
Na década de 2010, tornar os dados de investigação acessíveis ao público ganhou importância: termos como e-ciência1 e ciberciência2 estavam a moldar os discursos sobre o trabalho científico na era digital. Várias discussões no seio da comunidade científica3,4,5,6,7,8 resultaram numa maior consciência do valor do acesso permanente aos dados de investigação. As recomendações políticas da Organização de Cooperação e Desenvolvimento Económico (OCDE)9 ou da Comissão Europeia10 reflectiram esta mudança.
A necessidade de uma gestão profissional de dados foi cada vez mais enfatizada com a publicação dos agora amplamente reconhecidos Princípios de Dados FAIR11. Investigadores, instituições académicas e financiadores começaram a abordar esta questão em políticas12, iniciativas e redes13,14,15, e infraestruturas16,17,18,19. Por exemplo, a National Science Foundation (NSF) nos Estados Unidos publicou uma Política de Partilha de Dados em 2011, na qual a agência financiadora exigia que os beneficiários fornecessem informações sobre o tratamento de dados num Plano de Gestão de Dados20. Na Alemanha, a Fundação Alemã de Pesquisa (DFG) publicou uma declaração semelhante sobre o acesso aos dados de pesquisa na década de 201021,22.
O tratamento de dados de investigação também foi discutido nas comunidades de bibliotecas e centros de computação: Em 2009, a Iniciativa Alemã para Informação em Rede (DINI), uma rede de fornecedores de infra-estruturas de informação, publicou um documento de posição sobre a necessidade de gestão de dados de investigação (RDM) em instituições de ensino superior23. Através das discussões no âmbito da DINI, tornou-se evidente a necessidade de um registo de RDRs. Na época, o Diretório de Repositórios de Acesso Aberto (OpenDOAR)24 já havia se consolidado como um diretório de repositórios temáticos e institucionais de Acesso Aberto. No entanto, não existia um diretório comparável para RDRs e não estava claro quantos repositórios dedicados a dados de investigação existiam.
Em 2011, um consórcio de instituições de investigação na Alemanha apresentou uma proposta à Fundação Alemã de Investigação (DFG), solicitando financiamento para desenvolver o 're3data – Registo de Repositórios de Dados de Investigação'25. Os membros do consórcio foram o Instituto de Tecnologia de Karlsruhe (KIT), a Humboldt-Universität zu Berlin e o Helmholtz Open Science Office no GFZ German Research Center for Geosciences. A DFG aprovou a proposta no mesmo ano. O projeto teve como objetivo desenvolver um serviço que ajudasse os investigadores a identificar RDRs adequados para armazenar os seus dados de investigação. A re3data entrou online em 2012 e já listou 400 RDRs um ano depois26.
Enquanto trabalhava no registo, a equipa do projeto na Alemanha tomou conhecimento de uma iniciativa semelhante nos EUA. Com o apoio do Instituto de Serviços de Museus e Bibliotecas, as bibliotecas de Purdue e da Universidade Estadual da Pensilvânia desenvolveram o Databib, um “catálogo on-line global e com curadoria de repositórios de dados de pesquisa”27. O Databib entrou no ar no mesmo ano28. Na altura, os RDR eram indexados e curados por funcionários de bibliotecas de instituições parceiras da re3data, enquanto a Databib tinha estabelecido um conselho editorial internacional para fazer a curadoria das descrições dos RDR27. Databib e re3data assinaram um Memorando de Entendimento em 2012 e, após excelente cooperação, os dois serviços se fundiram em 201429. A fusão reuniu ideias bem-sucedidas de cada serviço: Os esquemas de metadados foram combinados, resultando na versão 2.2 do esquema de metadados re3data30, e os conjuntos de descrições RDR foram mesclados. O conselho editorial internacional da Databib foi ampliado para incluir editores re3data. O desenvolvimento da infraestrutura de TI do re3data continuou, combinando a experiência que ambos os serviços construíram. Para a operação do serviço, foi instalada uma dupla de gestão, composta por membros de instituições representativas da re3data e da Databib.