Table des matières
Plan de Gestion de Données (PGD) et "data paper" : de la théorie à la pratique
Data Management Plan (DMP) and data paper: from theory to practice.
MODALITES :
Date : 26 Avril 2024 en salle Lyot.
Le Présentiel est privilégié en salle LYOT de l'OMP .
- Elle pourra néanmoins être suivie en distanciel
- A l'exception de l'atelier du matin qui sera en salle Jules Verne après la pause.
Physical presence is recommended in the room LYOT OMP.
- But it can be followed remotely at :
- Except the hands on session in the morning after the break in the Jules Verne room.
Attention :
- Les présentations orales seront en Français
- mais les supports et questions peuvent être en anglais.
- La priorité sera donnée au présentiel pour les questions.
- Des questions en distanciel seront possibles par la discussion publique (TCHAT) de BBB.
- Presentations will be in French :
- but materials and questions may be in English.
- Priority will be given to face-to-face questions.
- Remote questions will be possible via the BBB TCHAT.
INSCRIPTIONS / REGISTRATION :
Merci de vous inscrire pour cette journée afin d'optimiser l'organisation via ce lien:
Please register for this half-day event to optimize the organization via this link :
CONTEXTE, PUBLIC et PRE-REQUIS :
Depuis 2018, le mouvement pour la Science ouverte s’est accéléré et les pratiques de la communauté scientifique se sont développées. Le deuxième Plan national pour la Science ouverte (2021-2024) se consacre davantage à la structuration, au partage et à l’ouverture des données de la recherche. Gérer, partager ou ouvrir ses données sont des démarches qui participent à l’intégrité scientifique et à la visibilité des activités de recherche.
Cette journée est l’occasion de faire le point sur la méthodologie et les outils pour rédiger un plan de gestion de données (PGD) ou un “data paper” mais aussi de bénéficier des retours d’expériences de ceux qui se sont confrontés à l’exercice.
Since 2018, the Open Science movement has accelerated and the practices in the scientific community have developed. The second National Plan for Open Science (2021-2024) focuses more on structuring, sharing and opening up research data. Managing, sharing and opening up data are all steps that contribute to scientific integrity and the visibility of research activities.
This day is an opportunity to take stock of the methodology and tools needed to draw up a Data Management Plan (DMP) or a data paper, as well as to benefit from feedback from those who have already gone through the exercise.
PUBLIC :
Tout personnel en poste à l'observatoire Midi-Pyrénées (OMP) ou (en mode distanciel) dans un des laboratoires des instituts INEE et INSU du CNRS.
All staff working at the Midi-Pyrénées Observatory (OMP) or (in distance mode) in one of the laboratories of the INEE and INSU institutes of the CNRS.
PRE-REQUIS / PREREQUISITE:
Pour l’atelier du matin, avoir son ordinateur. Un exemple de PGD sera fourni, mais vous pouvez également apporter votre projet de PGD.
Bring your own computer for the morning workshop. An example of a DMP will be provided, but you can also bring your own DMP draft.
ORGANISATION & CONTACTS :
Cette action est organisée par le SCD de l'UT3 et l'atelier numérique de l'OMP.
This action is organized by the UT3 SCD and the “atelier numérique de l'OMP”.
-
- Administratrice des données de recherche, algorithmes et codes sources (ADAC).
-
- Chargée des données de la recherche, bibliométrie et projet pépinière de revues/Département Appui à la recherche et science ouverte.
-
- Référente IST pour les laboratoires de l'OMP.
- Chargée de formation et d’appui à la recherche/ Département Formation aux Compétences Informationnelles / Département Appui à la Recherche et Science Ouverte
-
- Chargée de bibliométrie et de données de la recherche/ Département Appui à la recherche et science ouverte.
- Etienne Gondet (UAR831/ Observatoire Midi-Pyrénées).
- Responsable technique de l'atelier numérique de l'OMP.
- Responsable technique de l'axe transverse Intelligence artificielle de l'OMP.
- Roland Martin (GET/ Observatoire Midi-Pyrénées) :
- Responsable de l'axe modélisation du GET/ Observatoire Midi-Pyrénées.
- Membre du bureau de l'atelier numérique de l'OMP.
MOTS-CLES / KEYWORDS and LEXIQUE:
ADAC, SCD, FAIR, DMP, FAIR, INEE, INSU, IST, PGD, “DATA PAPER” , Openscience, DMP Opidor, SNO
LEXIQUE
- ADAC : Administratrice des Données de recherche, Algorithmes et Codes sources .
- DL = Deep Learning = apprentissage profond (réseaux de neurones à plusieurs couches).
- Data paper : Publication scientifique visant à décrire un jeu de données notamment pour sa valorisation)
- DMP : Data Management Plan (PGD en Français).
- DMP opidor : Outil collaboratif en ligne (accessible via un portail) afin de rédiger un PGD.
- FAIR : Findable, Accesible, Interoperable, Reusable au sujet de données) .
- HPC : High Performance Computing.
- HPDA : High Performance Data Analytics.
- ML = Machine learning = apprentissage automatique plus général que le DL.
- IA : Intelligence artificielle.
- 3IA : Instituts Interdisciplinaires d'Intelligence artificielle: http://www.agence-nationale-recherche.fr/3IA-2018
- INEE : Institut National de l'Ecologie et de l'Environnement.
- INSU : Institut National des Sciences de l'univers.
- IST : Information Scientifique et Technique.
- PGD : Plan de Gestion de données (DMP en anglais)
- RdA : Research Data Alliance. https://www.rd-alliance.org/
- REX ou RETEX : RETour d'EXpériences.
- RNN : Réseaux de NeuroNes.
- RNN2DL : Des Réseaux de NeuroNes au Deep Learning.
- SCD : Service Commun de Documentation de l'université.
- SDU : Sciences De l'Univers au sens INSU englobe astrophysique, climat, oceano, aérologie, géophysiques, géologie….
- S3EU : Sciences de l'écologie, de l'Espace de l'Environnement et de l'Univers incluant aussi géologie, océanographie, méteorologie, climat… au sens INSU .
- SNO : Service Nationaux d'Observations (Sous entendu labelisée par l'INSU/CNRS).
- Surrogate Models = Modèles de Substitution .
PROGRAMME :
Matinée : Le PGD en pratique : planifier la gestion de vos données de recherche / DMP in practice: planning your research data management. Salle Lyot.
- 08h30 - 09h00 : Welcome & Coffee
- 09h00 - 09h10 : Introduction.
- M. M. Zribi (Directeur de l'OMP).
- 09h10 - 10h10 : Pourquoi et comment rédiger un plan de gestion de données ?
- S. Demay & L. Leclerc (SCD/UT3).
- 10h10 - 10h40 : Break / Pause-cafés.
- 10h40 - 12h30 : Démarrer mon 1er DMP avec l'outil DMP Opidor. Salle Jules Verne .
- S. Demay & F. Poupinot (SCD/UT3).
- Un exemple de PGD sera fourni, mais vous pouvez également apporter votre projet de PGD.
- 12h30 - 14h00 : Buffet
Après-Midi : Diffuser et valoriser ses données par le “data paper” / Using data paper to disseminate and add value to your data. Salle Lyot.
- 14h00 - 14h15 : Introduction et/ou tour de table rapide si public < 20 personnes.
- E. Gondet (OMP).
- 14h15 - 14h45 : Retour d'expérience sur mon premier “data paper” par K. Dassas (CESBIO/OMP).
- 14h45 - 15h00 : Créneau libre :
- 15h00 - 15h30 Pause Café :
- 15h30 - 16H00 : Retour d’expérience sur les "data papers" : 2 exemples dans la communauté «zone critique» L. Boithias (SNO M-TROPICS/GET/OMP).
- Feedback on Datapapers: two examples from the “critical zone” community.
- 16h00 - 17h00 : Table ronde, discussions.
MORE INFO ABOUT THE PRESENTATIONS :
Pourquoi et comment rédiger un plan de gestion de données
Title : Pourquoi et comment rédiger un plan de gestion de données ?.
Mail : soraya.demay@univ-tlse3.fr
Format : ~ 45 minutes présentation.
Résumé : Le Plan de Gestion de Données (PGD), ou “Data Management Plan” (DMP), est un document qui décrit comment seront gérées les données utilisées dans un projet de recherche. Exigé par les financeurs (Commission européenne, ANR, etc.), il s’agit d’un outil qui vise à anticiper la gestion des données tout au long du projet. Cette intervention a pour objectif de vous permettre de vous familiariser avec le PGD, de connaître les attendus, les enjeux et les éléments qu’il contient.
Démarrer mon 1er DMP avec l'outil DMP Opidor.
Title : Démarrer mon 1er DMP avec l'outil DMP Opidor.
Mail : flora.poupinot@univ-tlse3.fr
Format : atelier flash d'1h30 en salle Jules Verne
Résumé :
Maintenant que vous êtes familiarisé(e) avec les principes du plan de gestion de données, il est temps de passer à la pratique en abordant la rédaction de ce type de document. Cela vous semble laborieux ? Vous ne savez pas par où commencer ? Cet atelier a pour objectif de vous permettre d’acquérir quelques réflexes pour débuter sereinement la redaction d’un PGD avec l’outil DMP Opidor.
Un exemple de PGD sera fourni, mais vous pouvez également apporter votre projet de PGD.
Public & Requirement (Pré-Requis) : :
Pour cet atelier, avoir son ordinateur portable. Un exemple de PGD sera fourni, mais vous pouvez également apporter votre projet de PGD.
Retour d’expérience sur les Datapapers: 2 exemples dans la communauté zone critique
Titre / Title : Retour d’expérience sur les data papers : deux exemples dans la communauté « zone critique ».
- Feedback on data papers: two examples from the “critical zone” community.
Mail : laurie.boithias@get.omp.eu
Affiliation : : Laboratoire GET de l'OMP, SNO M-TROPICS
Format : 20 + 10 mns
Résumé : Les services nationaux d’observation (SNO) génèrent des chroniques de données sur le long-terme, collectées à basse ou haute fréquence. Ces données sont souvent utilisées de façon sporadique dans nombre d’articles scientifiques qui s’appuient sur les SNO. Le data paper est un format de publication des données facile à mettre en œuvre qui permet de valoriser l’intégralité des chroniques. Dans cette présentation, je donnerai deux exemples de data papers publiés dans Hydrological Processes (20 ans de données hydrologiques sur le bassin versant expérimental de Houay Pano au Laos) et dans Earth System Science Data (10 ans de données de qualité de l’eau mesurées dans le bassin du Mékong au Laos).
Critical zone observatories (CZO) produce long-term dataset, collected at low or high frequency. Data are often used sporadically in a number of scientific papers that rely on the CZO. The data paper is an easy-to-implement data publication format that makes it possible to valorize the whole dataset. In this presentation, I’ll show to examples of data papers published in Hydrological Processes (20 years of hydrological data in the experimental catchment of Houay Pano in Lao PDR) and in Earth System Science Data (10 years of water quality data measured within the Mekong river basin in Lao PDR) .
MiniBio : Laurie Boithias est physicienne-adjointe au laboratoire GET et rattachée au SNO M-TROPICS. Sa recherche et sa tâche d’observation sont étroitement imbriquées et s’intéressent aux déterminants de la dissémination des contaminants bactériens en milieu tropical.
Laurie Boithias is an associate professor at the GET laboratory and is involved in the M-TROPICS CZO. her research and her monitoring duty are closely interlinked and deal with the drivers of the microbial contaminants’ dissemination in tropical environments.
Polarimetric instrument Global Navigation Satellite System - Reflectometry airborne data
Titre : REX sur mon tout premier “data paper”.
Title : My first Data paper Polarimetric instrument Global Navigation Satellite System - Reflectometry airborne data.
Mail : karin.dassas@univ-tlse3.fr
Format :
Résumé :
Dans le contexte du projet Land surface Interactions with the Atmosphere over the Iberian Semi-arid Environment (LIAISE), une campagne aéroportée (flotte de recherche SAFIRE ATR-42) a eu lieu en juillet 2021 sur le site d’Urgell en Espagne. L’objectif principal de cette campagne était de mieux comprendre et modéliser les interactions surface-atmosphère dans un contexte d’irrigation intense.
Le retour d’expérience que je vais présenter concerne la publication dans Data in Brief d’un dataper ( https://www.sciencedirect.com/science/article/pii/S2352340923009125?via%3Dihub) relatif à trois jeux de données acquises lors de cette campagne.
- Le premier “dataset” est un ensemble complet de données aéroportées GNSS-R (GNSS-R : Global Navigation Satellite System - Reflectometry, technique opportuniste qui utilise les signaux GPS réfléchis), acquises avec l'instrument de réflectométrie GLORI développé au CESBIO.
- Les 2 autres jeux de données sont des ensembles de mesures terrains acquises simultanément aux vols. Il s’agit de mesures in situ (humidité du sol en surface, rugosité de surface, indice de surface foliaire (LAI) ) ainsi que de données d’occupations des sols.
Je me focaliserai sur les questions (et les réponses !) que j’ai pu avoir lors de la rédaction de ce datapaper, sachant d’une part que c’était ma première expérience pour ce type de publication, et d’autre part que les jeux de données concernés, malgré leur intérêt, représentent un faible volume spatial et temporel.
Remarque : Toutes les données sont hébergées par le SEDOO (SErvice de DOnnées de l'Omp).
MiniBio : Karin Dassas est ingénieure de Recherche CNRS. Après avoir travaillé pendant près de 20 ans dans un laboratoire d'Astrophysique (l'IAS à Orsay) comme ingénieure informaticienne projets (traitement de données, logiciel de bord, contrôle commande), elle a rejoint le CESBIO en 2021 pour travailler dans l'équipe Systèmes d'Observations, et plus particulièrement dans l'équipe micro-ondes, autour des thématiques humidité des sols et occupation des sols (agroécosystèmes).
REMERCIEMENTS / ACKNOWLEDGEMENTS :
A tous ceux qui ont contribué à cette action / To all those who have contributed to this action.
