Demi-Journée Thématique le matin suivi d'un atelier l'après-midi.
Accueil à partir de 08h45.
La journée sera composée :
L'objectif du matin est de faire le point en matière d'outils et de pratiques dans le domaine de la visualisation scientifique. Après un exposé général, plusieurs retours d'expériences précéderont une table ronde en fin de matinée.
ATTENTION :
Cette action est organisée par les COMET du CNES et l' atelier numérique de l'OMP.
Merci de :
D'expérience, les meilleurs navigateurs pour BBB sont:
Une bibliographie des ouvrages disponibles à la bibliothèque de l'OMP sur python et son écosystème.
La vidéo est disponible à cette adresse :
Titre : L'écosystème Python pour la visualisation et 10 règles simples pour réaliser de meilleures figures.
Auteur : Nicolas P. Rougier (LABRI/INRIA).
Résumé : La visualisation scientifique est définie classiquement comme un processus de représentation graphique de données scientifiques. Cependant, ce processus est loin d'être direct ou automatique car il existe de nombreuses façons de représenter les mêmes données: courbes, nuages de points, histogrammes ou camemberts pour n'en citer que quelques-unes. De plus, les même données avec une même représentation peuvent être perçues très différemment selon la personne qui regarde la figure. Une définition plus précise de la visualisation scientifique serait donc une interface graphique entre les personnes et les données. L'objectif de cet exposé est de fournir un ensemble de règles de base pour améliorer la conception des figures et d'expliquer les écueils les plus fréquents.
Mini Bio : Je suis directeur de recherche à l'Inria et je travaille au sein de l'institut des maladies neurodégénératives (Bordeaux) où j'effectue mes recherches en neurosciences computationelles. J'ai par ailleurs un intérêt prononcé pour la visualisation scientifique et une expertise reconnue sur la librairie matplotlib (Python) pour laquelle j'ai réalisé les “cheatsheets” (https://matplotlib.org/cheatsheets/) et récemment (2021) publié un ouvrage en accès libre (https://www.labri.fr/perso/nrougier/scientific-visualization.html).
Sébastien Pinel donnera cette présentation le matin et animera un atelier de 3h l'apres midi ( Voir plus bas pour plus de précisions).
–> PRESENTATION DU MATIN :
Titre : Un nouveau paradigme de visualisation de données pour les SIG (Systèmes d'Information Géographiques) ?
Auteur : Sébastien Pinel (MCF CEFREM/OMP).
Résumé : L'évolution des données géolocalisées a radicalement transformé la cartographie, donnant naissance à un nouveau paradigme de leur visualisation. Initialement, ces données étaient statiques et étaient associées à des formats de données de types matriciels (rasters) et vectoriels (shapes) utilisés sous des logiciels GUI de cartographies dédiées (e.g., Surfer, QGIS, MapInfo, …). L’arrivée des données ayant une profondeur temporelle, de variétés et volumes et croissants (collectes temps-réels, IoT, Big Data) nécessite des puissances de calculs de plus importantes et une mise à jour constante des cartes. Également, les notions de cartes interactives et de dataviz sont apparues. Face à cette problématique, certains logiciels de SIG ont mis en place des langages de programmation de type no-code permettant d’élaborer des workflows de géotraitement. Bien souvent, ceux-ci reposent sur des bibliothèques Python…
Mini Bio : Enseignant-chercheur à l’UPVD. Mes enseignements à l’IUT de Perpignan, département Science des Données, antenne de Carcassonne, s’articulent autour des mathématiques, statistiques, la géomatique, et l’apprentissage machine. Mes recherches, dans le domaine des géosciences, se concentrent autour de la télédétection, l'hydrologie, l'hydrodynamique, l’océanographie et l'analyse de données. Bien souvent, mes travaux combinent la collecte de données in situ et les techniques de modélisation physique et statistique pour aborder les questions scientifiques.
Sébastien Pinel donnera une présentation de 30 mns le matin ( voir plus haut) et animera cet atelier de 3h l'après-midi
–> ATELIER DE L'APRES-MIDI :
Titre : Cartographie sous Python (Cartopy, Folium).
Animateur : Sébastien Pinel (MCF CEFREM/OMP).
Thème de l'atelier et Objectif : Cartographie statique et dynamique sous Python.
Public visé : Toute personne fâchée avec Arcgis ou QGIS ou susceptible de faire des cartes/géotraitement autrement qu’avec un logiciel de SIG de type ArcGIS ou QGIS (IR, doctorants, chercheurs, IE, AI, étudiants stagiaires).
Prérequis : Notions de cartographie. Bonnes notions de Python (utilisateur au minimum mensuel).
Mini-programme :
Titre : Visualiser et faire ses premières analyses statistiques sans programmer (JAMOVI, SPSS…) .
Auteurs : Jean-Luc Demonsant et Borbala Göncz (MSHS-T/ PUD-T).
Résumé : La familiarisation avec l’analyse statistique et la programmation d’un logiciel de traitement statistique en parallèle peut s’avérer compliqué. Pour une première expérience, pour des usages simples, ou juste pour une visualisation rapide des données les logiciels « clique-boutons » peuvent être une solution satisfaisante qui donne aussi la possibilité de faire la transition à la programmation plus tard. Lors de cette intervention des analyses statistiques simples avec visualisation de données vont être présentées avec les logiciels JAMOVI (logiciel libre basé sur le logiciel R) et SPSS (logiciel propriétaire de IBM) qui a son pendant libre PSPP.
Mini Bio : Borbala, sociologue et Jean-Luc, économiste de formation sommes les ingénieurs de recherche en production, traitement et analyse de données de la Plateforme Universitaire de Données de Toulouse ( PUD-T) rattachée à la Maison des Sciences de l’Homme et de la Société de Toulouse ( MSHS-T). La PUD-T, émanation locale de l’Infrastructure de Recherche PROGEDO, est une plateforme de soutien à la recherche et à la formation s’adressant à toute la communauté scientifique intéressée par les données en Sciences Humaines et Sociales (SHS) sur le site toulousain. Nous proposons des formations, organisons des évènements scientifiques (dont la Semaine Data SHS qui a lieu tous les ans en décembre) et accompagnons plusieurs projets de recherche autour des données quantitatives en SHS.
Titre : Visualisations statistiques de données avec Seaborn.
Auteur : Robin Guillaume-Castel (LEGOS/OMP).
Résumé : Seaborn (https://seaborn.pydata.org/index.html) est une librairie python permettant de réaliser des graphiques associés à des calculs statistiques. Elle permet notamment de tracer, avec un minimum de code et une grande facilité, des graphiques complexes représentant des données, et d’agréger les données avec des agrégations statistiques intégrées. Dans cette présentation, les principales fonctionnalités de Seaborn seront présentées avec des exemples concrets lors d’une démonstration en direct : diagramme pour présenter la relation entre plusieurs variables, diagramme de distribution, affichage de données catégorique, etc… Cette librairie est construite pour fonctionner parfaitement avec des données sous forme de tableaux de type pandas DataFrame, elle permet donc de grandement augmenter les compétences graphiques de pandas. Elle peut aussi être adaptée à l’utilisation de tableaux numpy, ou de DataArray xarray notamment.
Mini Bio : Je suis actuellement en postdoc au LEGOS, où je travaille sur le bilan d’énergie de la Terre et le changement climatique à l’échelle globale. Je propose régulièrement des formations avec l’Atelier numérique de l’OMP, notamment celles sur xarray et pandas. J’aime me tenir au courant des nouvelles avancées des librairies python pour le traitement de données et la visualisation.