Plan du cours
Fondamentaux de Python pour les tâches de données
- Installation de Python et configuration de l'environnement de développement
- Fundamentals du langage : variables, types de données, structures de contrôle
- Rédaction et exécution de scripts Python simples
Gestion des fichiers : CSV et Excel
- Lecture et écriture de fichiers CSV à l'aide du module csv et Pandas
- Manipulation de fichiers Excel à l'aide de openpyxl/xlrd et Pandas
- Exercices pratiques : automatisation de conversions de fichiers
Introduction à Pandas
- Bases des DataFrames : création, indexation, sélection et filtrage
- Opérations d'agrégation et de groupement
- Opérations courantes de nettoyage : valeurs manquantes, doublons et conversions de type
Introduction à Polars
- Concepts de Polars et caractéristiques de performance comparées à Pandas
- Opérations de base sur les DataFrames avec Polars
- Exemple d'utilisation : quand choisir Polars plutôt que Pandas
Transformation avancée des données (intermédiaire)
- Joins complexes, fonctions de fenêtre et opérations pivot avec Pandas
- Modes de traitement efficaces des données avec Polars
- Enchaînement d'opérations et optimisation de l'utilisation de la mémoire
Automatisation des processus avec Python
- Rédaction de scripts pour automatiser les tâches de données répétitives et les étapes ETL
- Planification de scripts avec des planificateurs de système d'exploitation ou des planificateurs de tâches
- Journalisation, gestion des erreurs et notifications
Emballage de scripts et bonnes pratiques
- Création d'exécutables avec PyInstaller ou des outils similaires
- Structure de projet, environnements virtuels et gestion des dépendances
- Bases du contrôle de version et documentation des flux de travail
Mini-projet pratique
- Tâche de bout en bout : lecture de fichiers bruts, nettoyage et transformation des données, production de sorties
- Automatisation du workflow et empaquetage en script ou exécutable exécutable
- Examen et améliorations basés sur les commentaires des pairs
Résumé et étapes suivantes
Pré requis
- Familiarité de base avec les concepts de programmation ou volonté d'apprendre
- Confort dans l'utilisation de la ligne de commande ou du terminal pour l'installation de packages
- Expérience de travail avec des tableurs (CSV/Excel)
Public cible
- Analystes de données et personnel opérationnel automatisant des tâches de données
- Ingénieurs analytiques recherchant un scripting ETL léger
- Professionnels intéressés par des workflows de données pratiques basés sur Python
Nos clients témoignent (5)
Le formateur a su adapter les exercices à nos cas d'usage
Stephane MATHIS - EURO-INFORMATION DEVELOPPEMENTS
Formation - Fraud Detection with Python and TensorFlow
Exemples/exercices parfaitement adaptés à notre domaine
Luc - CS Group
Formation - Scaling Data Analysis with Python and Dask
Traduction automatique
Très interactif avec de nombreux exemples, avec une bonne progression en termes de complexité entre le début et la fin de la formation.
Jenny - Andheo
Formation - GPU Programming with CUDA and Python
Traduction automatique
Très bonne préparation et expertise de l'animateur, communication parfaite en anglais. Le cours était pratique (exercices + partage d'exemples d'usage).
Monika - Procter & Gamble Polska Sp. z o.o.
Formation - Developing APIs with Python and FastAPI
Traduction automatique
Aide précieuse et bonne à l’écoute.. interactive
Ahmed El Kholy - FAB banak Egypt
Formation - Introduction to Data Science and AI (using Python)
Traduction automatique