Plan du cours

Machine Learning Introduction

  • Types de machine learning – supervisé vs non supervisé
  • Du apprentissage statistique à l'apprentissage automatique
  • Le workflow de la fouille de données : compréhension des affaires, préparation des données, modélisation, déploiement
  • Choisir le bon algorithme pour la tâche
  • Surchauffe et l'équilibre biais-variance

Python et Aperçu des bibliothèques ML

  • Pourquoi utiliser des langages de programmation pour le ML
  • Choisir entre R et Python
  • Cours express en Python et Jupyter Notebooks
  • Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn

Test et Évaluation des Algorithmes de ML

  • Généralisation, surajustement et validation du modèle
  • Stratégies d'évaluation : holdout, validation croisée, bootstrap
  • Métriques pour la régression : ME, MSE, RMSE, MAPE
  • Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
  • Visualisation des performances du modèle : courbe de profit, ROC curve, lift curve
  • Sélection et recherche en grille du modèle pour l'ajustement

Préparation des Données

  • Importation et stockage des données dans Python
  • Analyse exploratoire et statistiques sommaires
  • Gestion des valeurs manquantes et des outliers
  • Standardisation, normalisation et transformation
  • Réencodage des données qualitatives et data wrangling avec pandas

Algorithmes de Classification

  • Classification binaire vs multiclasse
  • Régression logistique et fonctions discriminantes
  • Naïve Bayes, k-plus proches voisins
  • Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
  • Machines à vecteurs de support et noyaux
  • Téchniques d'apprentissage ensembliste

Régression et Prédiction Numérique

  • Moindres carrés et sélection des variables
  • Méthodes de régularisation : L1, L2
  • Régression polynomiale et modèles non linéaires
  • Arbres de régression et splines

Unsupervised Learning

  • Techniques de regroupement : k-means, k-medoids, classification hiérarchique, SOMs
  • Réduction de la dimensionnalité : PCA, analyse factorielle, SVD
  • Mise à l'échelle multidimensionnelle

Text Mining

  • Prétraitement et tokenisation du texte
  • Bag-of-words, racinisation et lemmatisation
  • Analyse de sentiment et fréquence des mots
  • Visualisation des données textuelles avec nuages de mots

Systèmes de Recommandation

  • Filtrage collaboratif basé sur l'utilisateur vs basé sur les objets
  • Conception et évaluation des moteurs de recommandations

Mining de Modèles d'Association

  • Ensembles fréquents et algorithme Apriori
  • Analyse du panier de marché et ratio lift

Détection des Valeurs Anormales

  • Analyse des valeurs extrêmes
  • Méthodes basées sur la distance et la densité
  • Détection des outliers dans les données à haute dimensionnalité

Machine Learning Cas Pratique

  • Compréhension du problème d'affaires
  • Préparation des données et ingénierie de caractéristiques
  • Sélection et ajustement des paramètres du modèle
  • Évaluation et présentation des résultats
  • Déploiement

Résumé et Étapes Suivantes

Pré requis

  • Compréhension de base des statistiques et de l'algèbre linéaire
  • Familiarité avec les concepts d'analyse de données ou deelligence d'affaires
  • Certaines connaissances en programmation (idéalement Python ou R) sont recommandées
  • Intérêt pour l'apprentissage des techniques d'apprentissage automatique appliquées aux projets axés sur les données

Public cible

  • Analystes et scientifiques des données
  • Statisticiens et professionnels de la recherche
  • Développeurs et professionnels IT explorant les outils d'apprentissage automatique
  • Toute personne impliquée dans les projets de science des données ou d'analyse prédictive
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires