Comment choisir un entrepôt de données
Si vous souhaitez rendre vos données disponibles, il existe de nombreux référentiels de données :
- Si votre organisme financeur vous demande de déposer vos données dans un certain référentiel. Pour voir si votre organisme financeur a un référentiel préféré , veuillez consulter la politique de données de recherche de votre organisme financeur (ANR : favoriser le libre accès aux publications – Open Access ) .
- Si votre organisme financeur n’a pas de référentiel préféré, vous souhaiterez peut-être utiliser un référentiel spécifique à une discipline qui est fréquemment utilisé dans votre domaine de recherche. Cela rendra vos données faciles à trouver pour votre communauté.
Il existe un grand nombre d’entrepôts de différents types :
- la plateforme nationale fédérée des données de la recherche «Recherche Data Gouv »
- entrepôts institutionnels ( l’université de Montpellier, Harvard Dataverse, Sextant pour l’IFREMER, INRA Dataverse, IrsteaData),
- entrepôts disciplinaires ou thématiques comme Pangaea ou EarthChem ou Materials Data Facility),
- entrepôts multi-disciplinaires comme Figshare, Mendeley Data, Zenodo (développé dans le cadre du projet européen OpenAire), Dryad ou Nakala (structure pour les SHS, mise en place par la TGIR Huma-Num). HAL entre aussi dans cette catégorie mais pour certains types de données seulement et dans la mesure où ce n’est pas ce que la communauté internationale utilise et que HAL n’attribue pas de DOI, il semble préférable de choisir un entrepôt dédié aux données.
Les dépôts sont décrits par des métadonnées standardisées, cela permet de rendre les données facilement repérables et citables dans la mesure où un DOI leur est attribué.
- re3data est un registre mondial de référentiels de données de recherche , vous pouvez donc rechercher dans leur base de données le meilleur référentiel pour héberger vos données.
- Vous pouvez également décider de soumettre vos données à un référentiel à usage général , tel que Zenodo .
Quelques considérations générales au moment de décider où déposer vos données:
- Les termes et conditions du référentiel sont-ils acceptables?
- Où vos données vont-elles être stockées?
- Êtes-vous autorisé à fournir des informations sur votre identifiant ORCID?
ORCID fournit à chaque universitaire un identifiant unique, et est de plus en plus requis par les éditeurs et par les référentiels de données au stade de la soumission des résultats de la recherche. L’utilisation d’ORCID garantit que les activités de recherche de chaque universitaire se distinguent de celles d’autres ayant des noms similaires. - Votre ensemble de données recevra-t-il un DOI permanent?
L’utilisation d’URL (Uniform Resource Locators) persistants, tels que les identificateurs d’objets numériques (DOI), garantit que vos données ont un emplacement permanent. L’URL ou DOI ne changera pas si vous quittez l’Université ou si le site Web est repensé – le lien vers vos données est permanent. - Le référentiel est-il utilisé par les personnes de votre discipline?
- Le référentiel vous permet-il de décrire suffisamment vos données pour qu’elles soient faciles à trouver?
Référentiels recommandés par le Journal Nature
Étude de faisabilité d’un service générique d’accueil et de diffusion des données simples : recueil des besoins et des contraintes des usagers
Contexte de l’étude :
La présente étude s’inscrit dans l’action “Développer un service générique d’accueil et de diffusion des données simples” de l’axe “Structurer et ouvrir les données de la recherche” du Plan National pour la Science Ouverte.
Télécharger le résumé de la phase 1 de l’étude.