Formations
Le PNDB propose des services d’accompagnement et de facilitation autour de la compréhension, du partage et de l’utilisation des données de biodiversité à destination des communautés scientifiques. Il offre des services tout au long du cycle de la donnée allant de l’élaboration des plans de gestion de données à l’analyse de ces dernières via la production d’indicateurs, en passant par la publication de Data Paper; et ce, en complémentarité aux outils & services existants des autres systèmes d'informations.
De plus, en tant que centre de référence thématique de Recherche Data Gouv du système Terre-Environnement (avec Data Terra), le PNDB contribue à favoriser l'appropriation des principes FAIR (Facile à Trouver, Accessible, Interopérable, Réutilisable) et à faire monter en compétence les communautés scientifiques concernées autour de la science ouverte et stimule les interactions entre producteurs et utilisateurs de données au travers de formations, ateliers, workshops, séminaires, facilitation de projets, articles & synthèses… et ce en lien avec les acteurs en écoinformatique (GBIF France, SIB, CESAB, etc...)
=> Pour toutes demandes : [contact.pndb] at [mnhn.fr] ou formulaire
Nota Bene : Ces in-formations peuvent se faire sous forme de wébinaires et/ou en présentiel
Offre de formations
Présentation "Comprendre le PNDB en 1 heure"
Cette présentation d'une durée d'1 heure peut se faire en présentiel ou en visio et comprend 2 temps : environ 1/2 h de présentation et 1/2h d'échange.
[Télécharger la présentation / Download the presentation]
Partager les {méta}données et publication d'un paper
Standardiser par la métadonnée permet :
- la description fine, l’inférence, l’identification et l'interopérabilité des données
- s'intégrer dans l'approche la plus FAIR possible
- une reproductibilité en sciences écologiques.
L’Ecological Metadata Language - EML- est un standard pivot mondialement reconnu et qui a plus de 25 ans de retours d’expériences par les écologues / écoinformaticiens du national center for Ecological Analysis and Synthesis dans le cadre du projet DataONE
Un data paper est une publication scientifique qui décrit précisément un jeu de données, et informe la communauté scientifique de son existence, de ses modalités et de son potentiel de réutilisation.
=> le qui, quoi, où, quand, commet, pourquoi des données = métadonnées
- Il décrit un jeu de données via les métadonnées
- Il démontre la qualité et quantité des données, leur méthode de collecte et de traitement.
- Il montre l’originalité et la portée de ce jeu de données, ainsi que leur potentiel pour des utilisations futures (arguments décisifs pour l’acceptation de la publication).
- Il donne généralement accès au jeu de données, dans un fichier attaché ou par un lien pérenne (URL, DOI) vers l’entrepôt (data repository, ou repository of research data) où le jeu est déposé. Le jeu de données décrit dans le data paper est en effet normalement accessible gratuitement à tous pour une réutilisation pouvant être commerciale (en France, licence ouverte Etalab V2.0 compatible licence CC-BY 4.0). Toutefois, selon les possibilités offertes par les entrepôts, les données peuvent être temporairement sous embargo, ou accessibles uniquement sur demande.
Source IRD : https://data.ird.fr/datapapers/ et adaptée
Cette présentation se fait en lien avec le GBIF France et dans le cadre du projet OpenMetaPaper (soutenu par le Fond National pour la Science Ouverte) qui vise à "booster" la plublication de data papers et de décrire finement les métadonnées
----------------------------------
Exemple de format proposé pour un atelier sur le sujet :
- Première partie : les data papers et le projet OpenMetaPaper du PNDB
- 9h-9h45 Introduction aux data papers
- 9h45-10h15 Présentation du projet FNSO 2019 OpenMetaPaper
- Pause 10h15-10h30
- Deuxième partie : Intérêt de partager les données brutes sur entrepôt de données + métadonnées fines dans catalogue PNDB et en parallèle données au standard Darwin-Core dans GBIF. Présentation des outils permettant de générer la métadonnée détaillée en EML et de transformer les données au standard de Darwin Core :
- 10h30-11h Arpha writing tool / IPT pour GBIF
- 11h-11h30 Patager et générer des métadonnées détaillées
- 11h30 -12h échanges et questions
[voir un exemple] [webinaire PNDB/GBIF-Fr sur les data papers] [support de présentation PNDB/GBIF-FR sur les data papers]
Atelier "FAIR par le faire"
[Télécharger la présentation en CC-BY 4.0]
Atelier "FAIR Implmentation Profile"
Les ateliers FAIR Implementation Profile - FIP - permettent un "diagnostic" des technologies, outils, standards, une cartographie nationale des système d'informations et entrepôts de données via l’approche FAIR (Facile à trouver, Accessible, Intéropérable, Réutiliseable) et d'accompagner et faciliter les structures à monter en compétences dans les principes FAIR
Initiation à Galaxy-Ecology
Galaxy-ecology est une plateforme d'analyses en ligne permettant de :
- le nettoyage des données
- la visualisation et les tendances
- la personnalisation et/ou l’utilisation de cadre analytiques robustes et reproductibles
- la production d’indicateur
Vous débutez sous Galaxy ou voulez juste voir comment cela fonctionne ? Vous trouverez des supports de formations en vous rendant sur le site du « Galaxy Training Network » dont des tutoriels introductifs à Galaxy et d’autres dédiés Galaxy-E. |
[Pour en savoir plus sur Galaxy-Ecology] [lien vers un webinaire "initiation à Galaxy-Ecology] [lien vers support de présentation "initiation à Galaxy-E"]
Atelier "{méta}données et variables essentielles de biodiversité"
un workshop : From raw biodiversity data to operational indicators through Essential Biodiversity Variables (cf. lien du congrès)
-
Abstract : Because data integration with different ecological scales in biodiversity science is complex, the biodiversity community (scientists, policy makers, managers, citizen, NGOs) needs to build, a framework of harmonized and interoperable data from raw, heterogeneous and scattered datasets, in order to observe, measure and understand the spatio-temporal dynamic of biodiversity from local to global scale. One of the most relevant approaches to reach that aim is the concept of Essential Biodiversity Variables (EBV). Because we can potentially extract a lot of information from raw datasets sampled at different ecological scales, the EBV concept represent a useful leverage for identifying appropriate data to be collated as well as associated analytical workflow for processing these data. Thanks to FAIR data and source code implementation (Findable, Accessible, Interopability, Reusable), it is possible to make transparent assessment of biodiversity by generating operational indicators through the EBV framework, and help designing or improving biodiversity monitoring at various scales.
Based on the EBV, the French biodiversity data hub (“Pôle National de Données de Biodiversité” - PNDB ), is an e-infrastructure for and by researchers developing an integrated framework for 1) extracting EBV information from raw data using Ecological Metadata Language , (EML), 2) running reproducible ecological analysis through open-access workflows, and 3) producing biodiversity indicators for research, expertise and policy makers thanks to the Galaxy-Ecology collaborative platform .
In line with both the GO FAIR initiative and the GEO BON network , the PNDB is proposing a case study to focus on i) advancing conceptual developments related to EBV, such as the complementarities between EBVs and Pressure-State-Response frameworks (e.g. DPsIR) or the improvement of the research/expertise interface, ii) implementing EBVs for and with various communities (scientific research, expertise and policy makers), and iii) operationalizing EBV based on existing technologies (EML, Galaxy-Ecology). All of this will benefit various communities of biodiversity scientists.
-
Auteurs : Coline Royaux (Sorbonne Université & MNHN), Jean-Baptiste Mihoub (Sorbonne Université), Olivier Norvez (FRB & MNHN), Sandrine Pavoine (MNHN), Dominique Pelletier (Ifremer), Aurélie Delavaud (FRB) & Yvan Le Bras (MNHN)
[le workshop est disponible içi]
Formation "Biodiversity Data Management"
L'objectif de cette formation de cinq jours, co-organisée par la FRB-CESAB, le PNDB et le GBIF France est de former les chercheurs aux différents aspects du cycle de vie des données : acquisition, gestion, archivage, rédaction des données papier et métadonnées. . Cette formation est centrée sur la biodiversité et les données environnementales.
La première édition de cette formation se déroulera en novembre 2024 au CESAB - informations supplémentaires prochainement -
=> Informations et inscriptions sur le site web dédié
Citation : Casajus N, Archambeau A-S, Coux C, Le Bras Y, Norvez O & Pamerlon S (2024) FRB-CESAB, PNDB & GBIF France training course: Biodiversity Data Management. URL: https://github.com/biodiversitydata
(Future) plateforme de formation
NB : titre provisoire pour cette plateforme de formation: MetaSEED pour {Meta}data & Service for Education in Ecoinformatics Didactic
Cet outil numérique est actuellement en cours de reflexion pédagogique et aura pour objectif d'informer & former les communautés de recherche sur :
- le contexte et les enjeux autour des {méta}données de biodiversité et de la reproductibilité dans un contexte de science ouverte
- le paysage français des systèmes d’informations, des entrepôts de données et leur lien avec le PNDB,
- les bonnes pratiques comme les principes FAIR (Facile à trouver, Accessible, Interopérable, et Réutilisable), et le cycle de vie de la donné
- les standards pivots comme l'EML (Ecological Metadata Language) pour la description fine des métadonnées, ou le DarwinCore pour les données de types occurrences.
- les outils (catalogue Metacat, Galaxy-Ecology), du PNDB et autres outils existants comme ceux du GBIF, de OpiDor et DoraNum, ..
- les services du PNDB (“FAIRisation” et mise à disposition des données et codes sources, formations/hackathons et accompagnement via un site web ludique) et autres services existants complementaires
[voir un exemple développé par l'équipe du PNDB dans le cadre de Vigie-nature école]
Cette réflexion globale et in fine ce site web pourrait être l’interface du PNDB en tant que centre de référence thématique de Recherche Data Gouv et ce en lien et complémentarité avec :
- les centre de ressources de Recherche Data Gouv comme OpiDor et DoraNum
- les GT communication et formation de Data Terra
- les ressources du point nodal français du GBIF
- le Centre de synthèse et d'analyse sur la biodiversité - CESAB - de la Fondation pour la Recherche sur la Biodiversité - FRB