MetaShARK : formulaire pour {méta}données


Standardisation par la métadonnée

Standardiser par la métadonnée permet :

L’Ecological Metadata Language - EML- est un standard pivot mondialement reconnu et qui a plus de 25 ans de retours d’expériences par les écologues / écoinformaticiens du national center for Ecological Analysis and Synthesis dans le cadre du projet DataONE

dataone_color-logo.jpg

Image et textes tirés de M.B. Jones et al., 2006 https://www.annualreviews.org/doi/10.1146/annurev.ecolsys.37.091305.110031


Outils existants pour générer de l'EML et partager les métadonnées

  Available online Available as a standalone local app Available as a private app deployed on demand Need to have programming skills Allow to use the entire EML specifications Help for automatic attributes names detection Help for automatic geographic coverage detection Help for automatic taxonomic coverage detection Help for automatic personal information gathering Allow to upload data package on DataOne catalogs allow to use last EML specifications Overall "yes" score (higher is better)
MetaShARK R Shiny app Yes Yes Yes through Galaxy-E No No Yes Yes Yes Yes Yes yes 9
EzEML web form Yes No No No No Yes No No No No   2
Metacatui catalog web form Yes No No No No No No No No Yes but only the catalog where the form is used   2
Excel2EML R package No Yes No Yes but limited No No No No No No   2
EML Assembly Line R package No Yes No Yes No Yes Yes Yes No No   5
EML or EMLD R package No Yes No Yes Yes No No No No No   3
Integrated Publishing Toolkit (IPT) Yes Yes Yes No No No Yes Yes Yes No but in gbif.org yes 7

Focus sur l'outil développé par le PNDB : MetaShARK

MetaShARK  (pour Metadata Shiny Application for Resources and Knowledge) est un projet R&D débuté dans le cadre du stage de M2 Bioinformatique d’Elie Arnaud à la station marine de Concarneau.

MetaShARK est une application R Shiny sous forme d'une interface graphique et utilisant les packages R EML et EML Assembly Line. Cette interface permet de parcourir facilement les spécifications de l’EML et de saisir des métadonnées. Cette application est accessible sur l’espace Github dédié https://github.com/earnaud/MetaShARK-v2 et utilisable sur metashark.test.pndb.fr

                  

MetaSHARK est un package R utilisant le package R Shiny et il est installable via ces commandes :

devtools::install_github(« earnaud/MetaShARK-v2 »)
MetaShARK::runMetashark()

Remplir les métadonnées et les partager en utilisant The Ecological Metadata Language - EML - permet :

Exemple de génération de métadonnées EML à partir d'ensembles de données via MetaShARK


Partager les codes sources

l'approche partage de codes sources sur GitHub / GitLab, puis dans le but de proposer un haut degré de FAIRitude, les conseils sont de définir les dépendances via conda, puis de les mettre à disposition via des containers (par exemple via Docker ou Singularity), puis le cas échéant galaxysation