Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage automatique

  • Types d'apprentissage automatique – supervisé vs non supervisé
  • De l'apprentissage statistique à l'apprentissage automatique
  • Le flux de travail du data mining : compréhension de l'entreprise, préparation des données, modélisation, déploiement
  • Choisir le bon algorithme pour la tâche
  • Surapprentissage et compromis biais-variance

Vue d'ensemble de Python et des bibliothèques ML

  • Pourquoi utiliser des langages de programmation pour le ML
  • Choisir entre R et Python
  • Cours intensif de Python et Jupyter Notebooks
  • Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn

Tests et évaluation des algorithmes ML

  • Généralisation, surapprentissage et validation des modèles
  • Stratégies d'évaluation : jeu de validation (holdout), validation croisée, bootstrap
  • Métriques pour la régression : ME, MSE, RMSE, MAPE
  • Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
  • Visualisation de la performance des modèles : courbe de profit, courbe ROC, courbe de gain (lift)
  • Sélection de modèle et recherche sur grille (grid search) pour le réglage

Préparation des données

  • Importation et stockage des données en Python
  • Analyse exploratoire et statistiques descriptives
  • Gestion des valeurs manquantes et des valeurs aberrantes
  • Standardisation, normalisation et transformation
  • Recodage des données qualitatives et transformation des données avec pandas

Algorithmes de classification

  • Classification binaire vs multiclasse
  • Régression logistique et fonctions de discrimination
  • Naïve Bayes, k plus proches voisins
  • Arbres de décision : CART, forêts aléatoires, Bagging, Boosting, XGBoost
  • Machines à vecteurs de support et noyaux
  • Techniques d'apprentissage par ensembles

Régression et prédiction numérique

  • Moindres carrés et sélection de variables
  • Méthodes de régularisation : L1, L2
  • Régression polynomiale et modèles non linéaires
  • Arbres de régression et splines

Réseaux neuronaux

  • Introduction aux réseaux neuronaux et à l'apprentissage profond
  • Fonctions d'activation, couches et rétropropagation
  • Perceptrons multicouches (MLP)
  • Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux neuronaux
  • Réseaux neuronaux pour la classification et la régression

Prévision des ventes et analyse prédictive

  • Séries temporelles vs prévision basée sur la régression
  • Gestion des données saisonnières et basées sur les tendances
  • Construction d'un modèle de prévision des ventes utilisant des techniques de ML
  • Évaluation de la précision et de l'incertitude des prévisions
  • Interprétation commerciale et communication des résultats

Apprentissage non supervisé

  • Techniques de regroupement : k-means, k-médoides, regroupement hiérarchique, Self-Organizing Maps (SOM)
  • Réduction de dimensionnalité : ACP (PCA), analyse factorielle, SVD
  • Mise à l'échelle multidimensionnelle

Data mining textuel (Text Mining)

  • Prétraitement du texte et tokenisation
  • Sac de mots (Bag-of-words), racinisation et lemmatisation
  • Analyse des sentiments et fréquence des mots
  • Visualisation des données textuelles avec des nuages de mots (word clouds)

Systèmes de recommandation

  • Filtrage collaboratif basé sur l'utilisateur et basé sur l'article
  • Conception et évaluation des moteurs de recommandation

Extraction de motifs d'association

  • Ensembles fréquents et algorithme Apriori
  • Analyse du panier d'achat et ratio de gain (lift)

Détection des valeurs aberrantes

  • Analyse des valeurs extrêmes
  • Méthodes basées sur la distance et la densité
  • Détection des valeurs aberrantes dans les données à haute dimension

Étude de cas d'apprentissage automatique

  • Compréhension du problème commercial
  • Prétraitement des données et ingénierie des fonctionnalités
  • Sélection de modèle et réglage des paramètres
  • Évaluation et présentation des résultats
  • Déploiement

Résumé et prochaines étapes

Pré requis

  • Connaissances de base des concepts d'apprentissage automatique, tels que l'apprentissage supervisé et non supervisé
  • Familiarité avec la programmation Python (variables, boucles, fonctions)
  • Il est utile d'avoir une certaine expérience de la manipulation de données à l'aide de bibliothèques telles que pandas ou NumPy, mais cela n'est pas obligatoire
  • Aucune expérience préalable de la modélisation avancée ou des réseaux neuronaux n'est supposée

Public cible

  • Data scientists
  • Analystes commerciaux
  • Ingénieurs logiciels et professionnels techniques travaillant avec des données
 28 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires