Plan du cours
Machine Learning Introduction
- Types de machine learning – supervisé vs non supervisé
- Du apprentissage statistique à l'apprentissage automatique
- Le workflow de la fouille de données : compréhension des affaires, préparation des données, modélisation, déploiement
- Choisir le bon algorithme pour la tâche
- Surchauffe et l'équilibre biais-variance
Python et Aperçu des bibliothèques ML
- Pourquoi utiliser des langages de programmation pour le ML
- Choisir entre R et Python
- Cours express en Python et Jupyter Notebooks
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et Évaluation des Algorithmes de ML
- Généralisation, surajustement et validation du modèle
- Stratégies d'évaluation : holdout, validation croisée, bootstrap
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation des performances du modèle : courbe de profit, ROC curve, lift curve
- Sélection et recherche en grille du modèle pour l'ajustement
Préparation des Données
- Importation et stockage des données dans Python
- Analyse exploratoire et statistiques sommaires
- Gestion des valeurs manquantes et des outliers
- Standardisation, normalisation et transformation
- Réencodage des données qualitatives et data wrangling avec pandas
Algorithmes de Classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Naïve Bayes, k-plus proches voisins
- Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Téchniques d'apprentissage ensembliste
Régression et Prédiction Numérique
- Moindres carrés et sélection des variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Unsupervised Learning
- Techniques de regroupement : k-means, k-medoids, classification hiérarchique, SOMs
- Réduction de la dimensionnalité : PCA, analyse factorielle, SVD
- Mise à l'échelle multidimensionnelle
Text Mining
- Prétraitement et tokenisation du texte
- Bag-of-words, racinisation et lemmatisation
- Analyse de sentiment et fréquence des mots
- Visualisation des données textuelles avec nuages de mots
Systèmes de Recommandation
- Filtrage collaboratif basé sur l'utilisateur vs basé sur les objets
- Conception et évaluation des moteurs de recommandations
Mining de Modèles d'Association
- Ensembles fréquents et algorithme Apriori
- Analyse du panier de marché et ratio lift
Détection des Valeurs Anormales
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection des outliers dans les données à haute dimensionnalité
Machine Learning Cas Pratique
- Compréhension du problème d'affaires
- Préparation des données et ingénierie de caractéristiques
- Sélection et ajustement des paramètres du modèle
- Évaluation et présentation des résultats
- Déploiement
Résumé et Étapes Suivantes
Pré requis
- Compréhension de base des statistiques et de l'algèbre linéaire
- Familiarité avec les concepts d'analyse de données ou deelligence d'affaires
- Certaines connaissances en programmation (idéalement Python ou R) sont recommandées
- Intérêt pour l'apprentissage des techniques d'apprentissage automatique appliquées aux projets axés sur les données
Public cible
- Analystes et scientifiques des données
- Statisticiens et professionnels de la recherche
- Développeurs et professionnels IT explorant les outils d'apprentissage automatique
- Toute personne impliquée dans les projets de science des données ou d'analyse prédictive
Nos clients témoignent (3)
Même en ayant dû manquer une journée à cause de réunions avec des clients, je me sens avoir une compréhension beaucoup plus claire des processus et techniques utilisés dans Machine Learning et quand j'utiliserais une approche plutôt qu'une autre. Notre défi maintenant est de pratiquer ce que nous avons appris et commencer à l'appliquer à notre domaine de problèmes.
Richard Blewett - Rock Solid Knowledge Ltd
Formation - Machine Learning – Data science
Traduction automatique
J'aime que la formation se soit concentrée sur des exemples et du codage. Je pensais qu'il était impossible de compresser autant de contenu en trois jours de formation, mais j'avais tort. La formation a abordé de nombreux sujets et tout a été fait de manière très détaillée (en particulier l'ajustement des paramètres du modèle - je ne m'attendais pas à ce qu'il y ait du temps pour cela et j'ai été grandement surpris).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Formation - Machine Learning – Data science
Traduction automatique
Il montre de nombreuses méthodes avec des scripts préparés - des matériaux très bien préparés et faciles à retracer.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Formation - Machine Learning – Data science
Traduction automatique