Plan du cours
Fondamentaux de Python pour les tâches de données
- Installation de Python et configuration de l'environnement de développement
- Fondamentaux du langage : variables, types de données, structures de contrôle
- Écriture et exécution de scripts Python simples
Gestion des fichiers : CSV et Excel
- Lecture et écriture de fichiers CSV à l'aide du module csv et de Pandas
- Travail avec des fichiers Excel en utilisant openpyxl/xlrd et Pandas
- Exercices pratiques : automatisation des conversions de fichiers
Introduction à Pandas
- Fondamentaux des DataFrames : création, indexation, sélection et filtrage
- Opérations d'agrégation et de regroupement
- Opérations de nettoyage courantes : valeurs manquantes, doublons et conversions de types
Introduction à Polars
- Concepts de Polars et caractéristiques de performance par rapport à Pandas
- Opérations de base sur les DataFrames dans Polars
- Exemple de cas d'utilisation : quand choisir Polars plutôt que Pandas
Transformation avancée des données (niveau intermédiaire)
- Fusions complexes, fonctions de fenêtre et opérations de pivot dans Pandas
- Modèles de traitement de données efficaces avec Polars
- Chaînage des opérations et optimisation de l'utilisation de la mémoire
Automatisation des processus avec Python
- Écriture de scripts pour automatiser des tâches de données répétitives et des étapes ETL
- Programmation des scripts avec des planificateurs OS ou des planificateurs de tâches
- Journalisation, gestion des erreurs et notifications
Emballage des scripts et meilleures pratiques
- Création d'exécutables avec PyInstaller ou des outils similaires
- Structuration des projets, environnements virtuels et gestion des dépendances
- Fondamentaux du contrôle de version et documentation des flux de travail
Mini-projet pratique
- Tâche de bout en bout : lire des fichiers bruts, nettoyer et transformer les données, produire des sorties
- Automatiser le flux de travail et l'emballer sous forme de script exécutable ou d'exécutable
- Revue et améliorations basées sur les commentaires des pairs
Résumé et prochaines étapes
Pré requis
- Une familiarité de base avec les concepts de programmation ou la volonté d'apprendre
- À l'aise pour utiliser la ligne de commande ou le terminal pour l'installation de packages
- Expérience dans le travail avec des feuilles de calcul (CSV/Excel)
Audience
- Analystes de données et personnel opérationnel automatisant des tâches de données
- Ingénieurs analytiques recherchant un script ETL léger
- Professionnels intéressés par des flux de travail de données pratiques basés sur Python
Nos clients témoignent (2)
L'adaptation des exos à notre contexte et la prise en compte de notre demande
Amel Guetat - EURO-INFORMATION DEVELOPPEMENTS
Formation - Fraud Detection with Python and TensorFlow
Les exercices pratiques liés au contenu aident vraiment à mieux comprendre chaque sujet. De plus, le fait de commencer les cours par une leçon puis de continuer avec des exercices pratiques est une bonne méthode qui aide à relier le contenu de la leçon précédente.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Formation - Introduction to Data Science and AI using Python
Traduction automatique