Plan du cours
Introduction à l'apprentissage automatique
- Types d'apprentissage automatique – supervisé vs non supervisé
- De l'apprentissage statistique à l'apprentissage automatique
- Le flux de travail du data mining : compréhension de l'entreprise, préparation des données, modélisation, déploiement
- Choisir le bon algorithme pour la tâche
- Surapprentissage et compromis biais-variance
Vue d'ensemble de Python et des bibliothèques ML
- Pourquoi utiliser des langages de programmation pour le ML
- Choisir entre R et Python
- Cours intensif de Python et Jupyter Notebooks
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Tests et évaluation des algorithmes ML
- Généralisation, surapprentissage et validation des modèles
- Stratégies d'évaluation : jeu de validation (holdout), validation croisée, bootstrap
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation de la performance des modèles : courbe de profit, courbe ROC, courbe de gain (lift)
- Sélection de modèle et recherche sur grille (grid search) pour le réglage
Préparation des données
- Importation et stockage des données en Python
- Analyse exploratoire et statistiques descriptives
- Gestion des valeurs manquantes et des valeurs aberrantes
- Standardisation, normalisation et transformation
- Recodage des données qualitatives et transformation des données avec pandas
Algorithmes de classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions de discrimination
- Naïve Bayes, k plus proches voisins
- Arbres de décision : CART, forêts aléatoires, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Techniques d'apprentissage par ensembles
Régression et prédiction numérique
- Moindres carrés et sélection de variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Réseaux neuronaux
- Introduction aux réseaux neuronaux et à l'apprentissage profond
- Fonctions d'activation, couches et rétropropagation
- Perceptrons multicouches (MLP)
- Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux neuronaux
- Réseaux neuronaux pour la classification et la régression
Prévision des ventes et analyse prédictive
- Séries temporelles vs prévision basée sur la régression
- Gestion des données saisonnières et basées sur les tendances
- Construction d'un modèle de prévision des ventes utilisant des techniques de ML
- Évaluation de la précision et de l'incertitude des prévisions
- Interprétation commerciale et communication des résultats
Apprentissage non supervisé
- Techniques de regroupement : k-means, k-médoides, regroupement hiérarchique, Self-Organizing Maps (SOM)
- Réduction de dimensionnalité : ACP (PCA), analyse factorielle, SVD
- Mise à l'échelle multidimensionnelle
Data mining textuel (Text Mining)
- Prétraitement du texte et tokenisation
- Sac de mots (Bag-of-words), racinisation et lemmatisation
- Analyse des sentiments et fréquence des mots
- Visualisation des données textuelles avec des nuages de mots (word clouds)
Systèmes de recommandation
- Filtrage collaboratif basé sur l'utilisateur et basé sur l'article
- Conception et évaluation des moteurs de recommandation
Extraction de motifs d'association
- Ensembles fréquents et algorithme Apriori
- Analyse du panier d'achat et ratio de gain (lift)
Détection des valeurs aberrantes
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection des valeurs aberrantes dans les données à haute dimension
Étude de cas d'apprentissage automatique
- Compréhension du problème commercial
- Prétraitement des données et ingénierie des fonctionnalités
- Sélection de modèle et réglage des paramètres
- Évaluation et présentation des résultats
- Déploiement
Résumé et prochaines étapes
Pré requis
- Connaissances de base des concepts d'apprentissage automatique, tels que l'apprentissage supervisé et non supervisé
- Familiarité avec la programmation Python (variables, boucles, fonctions)
- Il est utile d'avoir une certaine expérience de la manipulation de données à l'aide de bibliothèques telles que pandas ou NumPy, mais cela n'est pas obligatoire
- Aucune expérience préalable de la modélisation avancée ou des réseaux neuronaux n'est supposée
Public cible
- Data scientists
- Analystes commerciaux
- Ingénieurs logiciels et professionnels techniques travaillant avec des données
Nos clients témoignent (3)
J'ai vraiment aimé la fin où nous avons pris le temps de jouer avec CHAT GPT. La salle n'était pas très bien organisée pour cela - au lieu d'une grande table, quelques petites tables auraient été préférables afin que nous puissions travailler en petits groupes et brainstormer.
Nola - Laramie County Community College
Formation - Artificial Intelligence (AI) Overview
Traduction automatique
Travailler à partir des principes fondamentaux de manière concentrée, puis passer à l'application d'études de cas le même jour
Maggie Webb - Department of Jobs, Regions, and Precincts
Formation - Artificial Neural Networks, Machine Learning, Deep Thinking
Traduction automatique
Qu'il utilisait des données réelles d'entreprise. Le formateur avait une très bonne approche en faisant participer et concourir les stagiaires
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Formation - Applied AI from Scratch in Python
Traduction automatique