Prenez contact avec nous

Plan du cours

Module 1 : Python fondamental pour les flux de travail ML

• Lancement du cours et configuration de l'environnement
Alignement des objectifs et configuration d'un environnement de travail Python ML reproductible

• Essentiels du langage Python (format accéléré)
Révision de la syntaxe, du contrôle de flux, des fonctions et des patterns couramment utilisés dans les bases de code ML

• Structures de données pour le ML
Listes, dictionnaires, ensembles et tuples pour les caractéristiques, les étiquettes et les métadonnées

• Listes en compréhension et outils fonctionnels
Exprimer les transformations à l'aide de compréhensions et de fonctions d'ordre supérieur

• Python orienté objet pour les développeurs ML
Classes, méthodes, composition et décisions de design pratiques

• dataclasses et modélisation légère
Conteneurs typés pour la configuration, les exemples et les résultats

• Décorateurs et context managers Chronométrage, mise en cache, journalisation et patterns d'exécution sécurisés des ressources

• Manipulation de fichiers et de chemins Manipulation robuste des ensembles de données et formats de sérialisation

• Exceptions et programmation défensive
Écriture de scripts ML qui échouent de manière sécurisée et transparente

• Modules, packages et structure du projet Organisation de bases de code ML réutilisables

• Typage et qualité du code Indications de type, documentation et structure adaptée au linter

Module 2 : NumPy, SciPy et manipulation de données

• Fondamentaux de NumPy pour le calcul vectorisé
Opérations sur les tableaux efficaces et codage conscient des performances

• Indexation, découpage, diffusion et formes
Manipulation sécurisée des tenseurs et raisonnement sur les formes

• Éléments de l'algèbre linéaire avec NumPy et SciPy
Opérations matricielles stables et décompositions utilisées en ML

• Plongée approfondie dans SciPy
Statistiques, optimisation, ajustement de courbes et matrices creuses

• Pandas pour les données ML tabulaires
Nettoyage, jointures, agrégations et préparation des ensembles de données

• Plongée approfondie dans scikit-learn
Interface des estimateurs, pipelines et flux de travail reproductibles

• Éléments de la visualisation
Diagrammes diagnostiques pour l'exploration des données et le comportement des modèles

Module 3 : Patterns de programmation pour la construction d'applications ML

• Du notebook au projet maintenable
Refactoring du code exploratoire en packages structurés

• Gestion de la configuration
Paramètres externalisés et validation au démarrage

• Journalisation, avertissements et observabilité
Journalisation structurée pour des systèmes ML déboguables

• Composants réutilisables avec POO et composition Conception de transformateurs et prédicteurs extensibles

• Patterns de design pratiques Patterns Pipeline, Fabrique ou Registre, Stratégie et Adaptateur

• Validation des données et vérification des schémas Prévention des problèmes de données silencieux

• Performance et profilage
Identification des goulets d'étranglement et application des techniques d'optimisation

• E/S de modèles et interfaces d'inférence
Persistance sécurisée et interfaces de prédiction propres

• Mini-construction de bout en bout
Pipeline ML de style production avec configuration et journalisation

Module 4 : Apprentissage statistique pour les données tabulaires, textuelles et d'images

• Fondamentaux de l'évaluation
Splits d'entraînement et de validation, validation croisée honnête et métriques alignées sur les objectifs business

• ML tabulaire avancé
GLMs régularisés, ensembles d'arbres et prétraitements sans fuite de données

• Calibration et incertitude
Mise à l'échelle de Platt, régression isotone, bootstrap et prédiction conforme

• Méthodes NLP classiques
Compromis de tokenisation, TF-IDF, modèles linéaires et Naive Bayes

• Modélisation de sujets
Fondamentaux de LDA et limitations pratiques

• Vision par ordinateur classique HOG, PCA et pipelines basés sur les caractéristiques

• Analyse des erreurs
Détection des biais, bruit dans les étiquettes et corrélations spuriaires

• Labs pratiques
Pipeline tabulaire protégé contre les fuites de données
Comparaison et interprétation des bases textuelles
Base de vision classique avec analyse structurée des échecs

Module 5 : Réseaux neuronaux pour les données tabulaires, textuelles et d'images

• Maîtrise de la boucle d'entraînement Boucles PyTorch propres avec AMP, clipping et reproductibilité

• Optimisation et régularisation
Initialisation, normalisation, optimiseurs et planificateurs

• Précision mixte et mise à l'échelle
Accumulation de gradients et stratégies de point de contrôle

• Réseaux neuronaux pour les données tabulaires
Embeddings catégoriels, croissements de caractéristiques et études d'ablation

• Réseaux neuronaux pour le texte
Embeddings, CNNs, BiLSTM ou GRU et gestion des séquences

• Réseaux neuronaux pour la vision Fondamentaux des CNN et architectures de style ResNet

• Labs pratiques
Framework d'entraînement réutilisable
Comparaison NN tabulaire vs boosting
Expériences de CNN avec augmentation et planification

Module 6 : Architectures neurales avancées

• Stratégies d'apprentissage par transfert
Patterns de gel et dégel, taux d'apprentissage discriminatifs

• Architectures Transformer pour le texte
Interne de l'auto-attention et approches de réglage fin

• Backbones de vision et prédiction dense
Concepts ResNet, EfficientNet, Vision Transformers et U-Net

• Architectures tabulaires avancées
TabTransformer, FT-Transformer et réseaux Deep and Cross

• Considérations sur les séries temporelles
Splits temporels et détection de dérive des covariables

• Techniques PEFT et d'efficacité LoRA, distillation et compromis de quantification

• Labs pratiques
Réglage fin d'un transformer texte pré-entraîné
Réglage fin d'un modèle de vision pré-entraîné
Comparaison Transformer tabulaire vs GBDT

Module 7 : Systèmes d'IA générative

• Fondamentaux du prompting Prompting structuré et génération contrôlée

• Fondamentaux des LLM
Tokenisation, réglage fin sur instructions et mitigation des hallucinations

• Génération augmentée par la récupération (RAG)
Découpage en chunks, embeddings, recherche hybride et métriques d'évaluation

• Stratégies de réglage fin LoRA et QLoRA avec contrôles de qualité des données

• Modèles de diffusion Intuition de la diffusion latente et adaptation pratique

• Données tabulaires synthétiques CTGAN et considérations de confidentialité

• Labs pratiques
Mini-application de style RAG pour la production
Validation des sorties structurées avec application du schéma Expérimentation de diffusion optionnelle

Module 8 : Agents IA et MCP

• Conception de la boucle d'agent
Observer, planifier, agir, réfléchir et persister

• Architectures d'agents
ReAct, planifier-exécuter et coordination multi-agents

• Gestion de la mémoire Approches épisodiques, sémantiques et bloc-notes

• Intégration d'outils et sécurité Contrats d'outils, sandboxing et défenses contre l'injection de prompts

• Cadres d'évaluation Traces rejouables, suites de tâches et tests de régression

• MCP et interopérabilité basée sur les protocoles
Conception de serveurs MCP avec exposition sécurisée des outils

• Labs pratiques
Construction d'un agent à partir de zéro
Exposition d'outils via un serveur de style MCP
Création d'un harnais d'évaluation avec contraintes de sécurité

Pré requis

Les participants doivent posséder des connaissances fonctionnelles en programmation Python.

Ce programme s'adresse aux professionnels techniques de niveau intermédiaire à avancé.

 56 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires