Plan du cours
Fondamentaux de Python pour les tâches de données
- Installation de Python et configuration de l'environnement de développement
- Fundamentals du langage : variables, types de données, structures de contrôle
- Rédaction et exécution de scripts Python simples
Gestion des fichiers : CSV et Excel
- Lecture et écriture de fichiers CSV à l'aide du module csv et Pandas
- Manipulation de fichiers Excel à l'aide de openpyxl/xlrd et Pandas
- Exercices pratiques : automatisation de conversions de fichiers
Introduction à Pandas
- Bases des DataFrames : création, indexation, sélection et filtrage
- Opérations d'agrégation et de groupement
- Opérations courantes de nettoyage : valeurs manquantes, doublons et conversions de type
Introduction à Polars
- Concepts de Polars et caractéristiques de performance comparées à Pandas
- Opérations de base sur les DataFrames avec Polars
- Exemple d'utilisation : quand choisir Polars plutôt que Pandas
Transformation avancée des données (intermédiaire)
- Joins complexes, fonctions de fenêtre et opérations pivot avec Pandas
- Modes de traitement efficaces des données avec Polars
- Enchaînement d'opérations et optimisation de l'utilisation de la mémoire
Automatisation des processus avec Python
- Rédaction de scripts pour automatiser les tâches de données répétitives et les étapes ETL
- Planification de scripts avec des planificateurs de système d'exploitation ou des planificateurs de tâches
- Journalisation, gestion des erreurs et notifications
Emballage de scripts et bonnes pratiques
- Création d'exécutables avec PyInstaller ou des outils similaires
- Structure de projet, environnements virtuels et gestion des dépendances
- Bases du contrôle de version et documentation des flux de travail
Mini-projet pratique
- Tâche de bout en bout : lecture de fichiers bruts, nettoyage et transformation des données, production de sorties
- Automatisation du workflow et empaquetage en script ou exécutable exécutable
- Examen et améliorations basés sur les commentaires des pairs
Résumé et étapes suivantes
Pré requis
- Familiarité de base avec les concepts de programmation ou volonté d'apprendre
- Confort dans l'utilisation de la ligne de commande ou du terminal pour l'installation de packages
- Expérience de travail avec des tableurs (CSV/Excel)
Public cible
- Analystes de données et personnel opérationnel automatisant des tâches de données
- Ingénieurs analytiques recherchant un scripting ETL léger
- Professionnels intéressés par des workflows de données pratiques basés sur Python
Nos clients témoignent (2)
L'adaptation des exos à notre contexte et la prise en compte de notre demande
Amel Guetat - EURO-INFORMATION DEVELOPPEMENTS
Formation - Fraud Detection with Python and TensorFlow
Les exercices pratiques liés au contenu aident vraiment à mieux comprendre chaque sujet. De plus, le fait de commencer les cours par une leçon puis de continuer avec des exercices pratiques est une bonne méthode qui aide à relier le contenu de la leçon précédente.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Formation - Introduction to Data Science and AI using Python
Traduction automatique