Table des matières
Atelier numérique de l'OMP
La performance dans le monde Python.
Le 1er décembre 2022 de 14h00 à 17h00
Une bibliographie des ouvrages disponibles à la bibliothèque de l'OMP sur python et son écosystème.
CAFE PYTHON :
- 13h45 : Accueil.
- 14h00-14h15 : Introduction. Tour de table si pas trop nombreux.
- E. Gondet (OMP)
- 14h15-15h10 : Optimiser un code Python .
- Annaig Pedrono (DTN/ISA/CID/CNES).
- 15h10-15h40 : Pause-Café.
Le parallélisme avec python :
- 15h40-16h20 : Programmation concurrente pour le traitement de données.
- Panorama et applications en python.
- Fernando Niño (LEGOS/OMP).
- 16h20-16h50 : Parallélisation simple en python avec la librairie dask. Voir Résumé et minibio.
- Adrien Garinet (LEGOS/OMP).
- 16h50-17h30 : User-friendly parallel data extraction in satellite images with the native python library concurrent.future. Voir Résumé et minibio.
- David Guimaraes (GET/OMP).
Attention :
- Ces 2 ateliers seront majoritairement en Français.
- Les questions en anglais sont bien sur possibles.
- Le distanciel sera possible mais en mode minimaliste.
- La priorité sera donnée au présentiel notamment pour les questions.
- Les questions en distanciel seront uniquement possibles via le tchat.
Résumés (Abstracts) des interventions :
Annaig Pedrono ( DTN/ISA/CID/CNES )
Titre : Optimiser un code Python.
Auteur : Annaig Pedrono (DTN/ISA/CID - CNES)
- Direction technique et numérique/ Infrastructures numériques, SI scientifique et Applicatif/calcul, Ingénierie logicielle et valorisation des données.
Résumé : A venir.
Mini Bio : Ingénieur de recherche en calcul scientifique à l’institut de Mécanique des Fluides de Toulouse pendant 16 ans, j’ai rejoint le CNES en 2020 pour assurer la responsabilité du support utilisateurs du Centre de Calcul. Le Centre de Calcul du CNES dispose de deux supercalculateurs et depuis peu d’une plateforme stockage objet qui sont accessibles à plus de 1000 utilisateurs (agents CNES, partenaires industriels et académiques).
Fernando Niño (CTOH/LEGOS/OMP).
Titre : Programmation concurrente pour le traitement de données. Panorama et applications en python.
David Guimaraes ( GET/OMP )
Titre : User-friendly parallel data extraction in satellite images with the native python library concurrent.future .
Auteur : David Guimaraes (GET/OMP)
Résumé : De nos jours, les scientifiques sont de plus en plus souvent chargés d'activités de codage, mais ils ne suivent généralement pas de formation officielle en la matière. Dans le but d'aider et de partager des expériences de codage python pour la science, je vous propose d'essayer une bibliothèque python plutôt accessible appelée concurrent.future. L'idée est de présenter rapidement un morceau de code en cours d'exécution avec et sans parallélisation dans un notebook jupyter afin que vous puissiez l'adapter à vos propres besoins. github :
Mini Bio : Diplômé en tant qu'analyste des systèmes d'information par le Collège technologique de l'État de São Paulo et d'un master en télédétection par l'Institut national de recherche spatiale au Brésil, David est actuellement ingénieur CDD à l'IRD chargé de la validation des images Sentinel-2 et de la chaîne OBS2CO au cluster HAL du CNES.
Adrien Garinet ( LEGOS/OMP )
Titre : Parallélisation simple en python avec la librairie dask. .
Auteur : Adrien Garinet (LEGOS/OMP)
Résumé : Dask est une bibliothèque python de parallélisation, conçue pour être facile d'utilisation - en offrant notamment un puissant outil de suivi des calculs - et s'interfaçant naturellement avec les bibliothèques les plus populaires de traitements de jeux de données : numpy, pandas, xarray. Cette courte introduction a vocation à en montrer la simplicité d'utilisation sur des cas pratiques, avec notamment une application en géosciences.
Mini Bio : Diplômé de l'IP Paris et de Supaéro, j'ai commencé une thèse sur les mélanges dans les mers d'Asie du Sud-Est au LEGOS en janvier dernier, sous la direction de Marine Herrmann. Ayant toujours fait du python et travaillant principalement avec des sorties de modèles océaniques pour ma thèse, j'ai commencé à utiliser dask de manière régulière dans ce cadre, et suis convaincu de son apport bénéfique dans le traitement des données en géosciences.
