ORGANISATION COLLECTE TRAITEMENT PRESERVATION PARTAGE REUTILISATION
Organisation
Cette étape permet de définir le projet de recherche et anticiper les prochaines étapes du cycle de vie des données. C’est à cette étape qu’on identifie les besoins et les ressources nécessaires (partenariats, financements, techniques etc.) pour réaliser le projet. Cette étape permet surtout d’anticiper la façon dont les données seront obtenues et stockées pour faciliter la traçabilité en amont afin de permettre la réutilisation des données. Quelles données collectées, où, quand, comment, qui etc. sont les principales interrogations auxquelles répondre dans cette étape. [Source, Université Paris-Saclay]
Un projet scientifique qui va produire et/ou utliser des {méta}données, codes sources, ... doit dès le début, s'organiser via les étapes du cycle de vie des données et ce en s'insérant dans les principes FAIR.
Les bonnes pratiques
Le Cycle de vie des données
Il s'agit de l’ensemble des étapes de gestion, de conservation et de diffusion des données de recherche, associées aux activités de recherche.es différentes étapes sont : la planification, l'acquisition, le stockage, la publication, la pérennisation et la réutilisation des {méta}données.
=> Le PNDB peut vous fournir une liste de ressources pour aider à vous "déplacer" dans ce cycle de données spécifique à l'écoinformatique et plus globalement aux sciences de la biodiversité.
Pour aller plus loin :
Principes FAIR
Il s'agit d'un ensemble de principes directeurs pour gérer les données de la recherche visant à les rendre faciles à trouver, accessibles, interopérables et réutilisables par l’humain et la machine.
=> Le PNDB peut vous former sur les principes FAIR et sur le cycle de vie des données [voir page Formations]
Pour aller plus loin :
- Wilkinson M. D. et al., 2017. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. https://doi.org/10.1038/sdata.2016.18
- principes FAIR via GO FAIR
- principes FAIR via "Ouvrir la Science"
- Atelier FAIR Implementation Profile (FIP)
- Présentation FAIR par le faire
Informations minimales à collecter et partager
La gouvernance du PNDB, a validé une liste de métadonnées indispensables afin d'avoir un degrès de "FAIRitude" (cf. principes FAIR) minimal et relativement élévé
- Données ouvertes (CC-BY 4.0 compatible Etalab)
- Licence obligatoire
- Lien direct de téléchargement des jeux de données brutes
- Périmètre thématique (Toute la biodiversité y compris la paléo- et archéo-biodiversité)
- Périmètre géographique (Données produites par la France)
- Couverture temporelle (à minima une date d’acquisition de données)
- Résumé
- Titre, auteurs et contacts
- Cadre d’acquisition (a minima via un champ texte)
- DOI / identifiants uniques
- couverture taxonomique (si présence de taxons)
- mots clés en lien avec Thesaurus
- Attributs des données (Dictionnaire des attributs de données avec unités et descriptions)
- Annotation sémantique (Mots-clés et noms d’attributs, ressources utilisables illimitées)
Ces informations minimales sont donc communes à toutes les fiches de métadonnées présentes dans le catalogue du PNDB
=> Le PNDB peut vous aider à identifier les informations minimales à collecter et partager lors de la rédaction d'un PGD [voir pages étapes du cycle de vie des données Organisation & Collecte] et vous former sur les principes FAIR et sur le cycle de vie des données [voir page Formations]
Plan de gestion de données
Le plan de gestion de données (PGD) ou Data management Plan (DMP) est un outil de gestion. Il se présente sous forme d’un document structuré en rubriques (ou étapes). Il a pour objectif de synthétiser la description et l’évolution des "objets" (jeux de données, métadonnées, codes sources, ...) de votre projet de recherche que vous allez générer au cours du temps. Il prépare le partage, la réutilisation et la pérennisation des données. [source Doranum, adapté]
Par exmple, l'Agence Nationale de la Recherche (ANR) demande de vous fournir un PGD lors de la première année de votre financement ANR.
=> Le PNDB peut vous accompagner dans la rédaction d'un PDG via des "templates" adapté à l'écoinformatique ou plus globalement à la science de la biodiversité.