MetaShARK : formulaire pour {méta}données
- Standardisation par la métadonnée
- Outils existants pour générer les partager de l'EML
- Focus sur l'outil développé par le PNDB : MetaShARK
- Partager les codes sources
Standardisation par la métadonnée
Standardiser par la métadonnée permet :
- la description fine, l’inférence, l’identification et l'interopérabilité des données
- s'intégrer dans l'approche la plus FAIR possible
- une reproductibilité en sciences écologiques.
L’Ecological Metadata Language - EML- est un standard pivot mondialement reconnu et qui a plus de 25 ans de retours d’expériences par les écologues / écoinformaticiens du national center for Ecological Analysis and Synthesis dans le cadre du projet DataONE
Image et textes tirés de M.B. Jones et al., 2006 https://www.annualreviews.org/doi/10.1146/annurev.ecolsys.37.091305.110031
Outils existants pour générer de l'EML et partager les métadonnées
Available online | Available as a standalone local app | Available as a private app deployed on demand | Need to have programming skills | Allow to use the entire EML specifications | Help for automatic attributes names detection | Help for automatic geographic coverage detection | Help for automatic taxonomic coverage detection | Help for automatic personal information gathering | Allow to upload data package on DataOne catalogs | allow to use last EML specifications | Overall "yes" score (higher is better) | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
MetaShARK R Shiny app | Yes | Yes | Yes through Galaxy-E | No | No | Yes | Yes | Yes | Yes | Yes | yes | 9 |
EzEML web form | Yes | No | No | No | No | Yes | No | No | No | No | 2 | |
Metacatui catalog web form | Yes | No | No | No | No | No | No | No | No | Yes but only the catalog where the form is used | 2 | |
Excel2EML R package | No | Yes | No | Yes but limited | No | No | No | No | No | No | 2 | |
EML Assembly Line R package | No | Yes | No | Yes | No | Yes | Yes | Yes | No | No | 5 | |
EML or EMLD R package | No | Yes | No | Yes | Yes | No | No | No | No | No | 3 | |
Integrated Publishing Toolkit (IPT) | Yes | Yes | Yes | No | No | No | Yes | Yes | Yes | No but in gbif.org | yes | 7 |
Focus sur l'outil développé par le PNDB : MetaShARK
MetaShARK (pour Metadata Shiny Application for Resources and Knowledge) est un projet R&D débuté dans le cadre du stage de M2 Bioinformatique d’Elie Arnaud à la station marine de Concarneau.
MetaShARK est une application R Shiny sous forme d'une interface graphique et utilisant les packages R EML et EML Assembly Line. Cette interface permet de parcourir facilement les spécifications de l’EML et de saisir des métadonnées. Cette application est accessible sur l’espace Github dédié https://github.com/earnaud/MetaShARK-v2 et utilisable sur metashark.test.pndb.fr
MetaSHARK est un package R utilisant le package R Shiny et il est installable via ces commandes :
devtools::install_github(« earnaud/MetaShARK-v2 ») MetaShARK::runMetashark()
Remplir les métadonnées et les partager en utilisant The Ecological Metadata Language - EML - permet :
- faire des liens entre des personnes, des projets, des objets (données, code source, protocoles, ...), des thèmes de recherche
- intégrer et générer des métadonnées liées à d'autres systèmes d'information, référentiels institutionnels
- générer V0 de data paper
Exemple de génération de métadonnées EML à partir d'ensembles de données via MetaShARK
Partager les codes sources
l'approche partage de codes sources sur GitHub / GitLab, puis dans le but de proposer un haut degré de FAIRitude, les conseils sont de définir les dépendances via conda, puis de les mettre à disposition via des containers (par exemple via Docker ou Singularity), puis le cas échéant galaxysation