ORGANISATION COLLECTE TRAITEMENT PRESERVATION PARTAGE REUTILISATION
Préservation
Cette étape consiste à la mise en sécurité et sureté des données traitées. Une protection sûre et une sauvegarde régulière sont essentielles tout au long du projet de recherche : Idéalement dans des supports différents selon la règle du « 3.2.1 » : 3 copies dans 2 supports différents et 1 hors site comme un Cloud par exemple. Il serait dommage de perdre le fruit de votre travail. [Source, Université Paris-Saclay]
- Informations minimales à préserver
- Standardisation des {méta}données
- Entrepôts de données
- Logigrammes "où déposer mes données?"
Informations minimales à préserver
La gouvernance du PNDB, a validé une liste de métadonnées indispensables afin d'avoir un degrès de "FAIRitude" (cf. principes FAIR) minimal et relativement élévé
- Données ouvertes (CC-BY 4.0 compatible Etalab)
- Licence obligatoire
- Lien direct de téléchargement des jeux de données brutes
- Périmètre thématique (Toute la biodiversité y compris la paléo- et archéo-biodiversité)
- Périmètre géographique (Données produites par la France)
- Couverture temporelle (à minima une date d’acquisition de données)
- Résumé
- Titre, auteurs et contacts
- Cadre d’acquisition (a minima via un champ texte)
- DOI / identifiants uniques
- couverture taxonomique (si présence de taxons)
- mots clés en lien avec Thesaurus
- Attributs des données (Dictionnaire des attributs de données avec unités et descriptions)
- Annotation sémantique (Mots-clés et noms d’attributs, ressources utilisables illimitées)
Ces informations minimales sont donc communes à toutes les fiches de métadonnées présentes dans le catalogue du PNDB
=> Le PNDB peut vous aider à identifier les informations minimales à préserver lors du dépôts des données et description des métadonnées notamment via le standard Ecological Metadata Language - EML [voir pages étapes du cycle de vie des données Organisation & Collecte] et vous former sur les principes FAIR et sur le cycle de vie des données [voir page Formations]
Standardisation des {méta}données
Standardiser par la métadonnée permet :
- la description fine, l’inférence, l’identification et l'interopérabilité des données
- s'intégrer dans l'approche la plus FAIR possible
- une meilleure reproductibilité en sciences écologiques.
L’Ecological Metadata Language - EML- est un standard pivot mondialement reconnu et qui a plus de 25 ans de retours d’expériences par les écologues / écoinformaticiens du national center for Ecological Analysis and Synthesis dans le cadre du projet DataONE
Exemple de cas pratique de standardisation par la métadonnée (à gauche) et "traduction en EML" (à droite)
Images et textes tirés de M.B. Jones et al., 2006 https://www.annualreviews.org/doi/10.1146/annurev.ecolsys.37.091305.110031
=> Le PNDB peut vous accompagner dans la standardisation des métadonnées en EML, et/ou dans le dépôt de métadonnées riches, et ce en lien avec l'équipe du GBIF France si vos données ou une partie de ces dernières sont compatibles avec le format Darwin Core.
Entrepôts de données
Dans le cadre de la politique de Science ouverte portée par le Ministère de l'Enseignement Supérieur et de la Recherche, le stockage de vos données doit se faire dans les entrepôts de données .
- un entrepôt thématique
Dans le cas de disciplines structurées pour le partage des données, il existe des entrepôts thématiques, comme c'est le cas pour le domaine de la biodiversité
Réalisée par le Comité pour la science ouverte à travers le Collège des Données de la recherche , voici la note méthodologique pour aider à choisir l’entrepôt thématiques le plus adaptés à vos données. Ci-dessous les entrepôts thématique de confiance dans le domaine de la biodiversité ("environnement" et certains de "biologie").
Si aucun entrepôt thématique n’est identifié, les producteurs de données peuvent déposer, par ordre de priorité :
- dans un entrepôt institutionnel, si applicable ;
- dans un espace institutionnel de l’entrepôt pluridisciplinaire Recherche Data Gouv ;
- dans l’espace générique de l’entrepôt Recherche Data Gouv
=> Le PNDB peut vous accompagner dans le choix du bon entrepôt pour vos données et métadonnées (Liste des responsables du réseau des systèmes d'informations - RSI - instance de gouvernance du PNDB)
Logigrammes "où déposer mes données?"
Un groupe de travail coordonnée par le PNDB et le GBIF France, au sein de l'unité d'Appui et de Recherche - PatriNat - a rédigé une note synthèse "comprendre, partager, réutiliser les données de biodiversité, complémentarité des systèmes d'information GBIF, SIB, SINP, PNDB". Cette dernière a pour objectif d'accompagner lescommunautés dans la compréhension, le partage et l'utilisation des données de biodiversité, et donc dans la préservation des {méta}données.
De même, Recherche Data Gouv propose un logigramme pour savoir "où déposer ses données?" voir le logigramme
ORGANISATION COLLECTE TRAITEMENT PRESERVATION PARTAGE REUTILISATION