Prenez contact avec nous

Plan du cours

Introduction

Cette section offre une vue d'ensemble de l'utilisation de l'apprentissage automatique, des facteurs à prendre en compte, des principes sous-jacents, ainsi que des avantages et des inconvénients. Types de données (structurées/non structurées/statiques/en flux continu), validité et volume des données, analyse pilotée par les données vs pilotée par l'utilisateur, modèles statistiques vs modèles d'apprentissage automatique, défis de l'apprentissage non supervisé, compromis biais-variance, itération/évaluation, approches de validation croisée, apprentissage supervisé/non supervisé/par renforcement.

THÈMES MAJEURS

1. Comprendre Naive Bayes

  • Concepts de base des méthodes bayésiennes
  • Probabilité
  • Probabilité conjointe
  • Probabilité conditionnelle avec le théorème de Bayes
  • L'algorithme Naive Bayes
  • La classification Naive Bayes
  • L'estimateur de Laplace
  • Utilisation de caractéristiques numériques avec Naive Bayes

2. Comprendre les arbres de décision

  • Diviser pour régner
  • L'algorithme d'arbre de décision C5.0
  • Choisir la meilleure partition
  • Élagage de l'arbre de décision

3. Comprendre les réseaux de neurones

  • Des neurones biologiques aux neurones artificiels
  • Fonctions d'activation
  • Topologie du réseau
  • Le nombre de couches
  • Le sens de circulation de l'information
  • Le nombre de nœuds dans chaque couche
  • Formation des réseaux de neurones par rétropropagation
  • Apprentissage profond

4. Comprendre les machines à vecteurs de support

  • Classification avec des hyperplans
  • Trouver la marge maximale
  • Le cas des données linéairement séparables
  • Le cas des données non linéairement séparables
  • Utilisation de noyaux pour les espaces non linéaires

5. Comprendre le regroupement

  • Le regroupement comme tâche d'apprentissage automatique
  • L'algorithme k-means pour le regroupement
  • Utilisation de la distance pour attribuer et mettre à jour les clusters
  • Choisir le nombre approprié de clusters

6. Mesurer la performance pour la classification

  • Travailler avec des données de prédiction de classification
  • Un regard approfondi sur les matrices de confusion
  • Utilisation des matrices de confusion pour mesurer la performance
  • Au-delà de la précision – autres mesures de performance
  • La statistique kappa
  • Sensibilité et spécificité
  • Précision et rappel
  • La mesure F
  • Visualisation des compromis de performance
  • Courbes ROC
  • Estimation de la performance future
  • La méthode de séparation
  • Validation croisée
  • Échantillonnage bootstrap

7. Ajuster les modèles standards pour une meilleure performance

  • Utilisation de caret pour le réglage automatique des paramètres
  • Création d'un modèle simple réglé
  • Personnalisation du processus de réglage
  • Amélioration de la performance du modèle avec l'apprentissage par méta-apprentissage
  • Compréhension des ensembles
  • Bagging
  • Boosting
  • Arbres aléatoires
  • Formation des arbres aléatoires
  • Évaluation de la performance des arbres aléatoires

THÈMES SECONDAIRES

8. Comprendre la classification par les plus proches voisins

  • L'algorithme kNN
  • Calcul de la distance
  • Choix d'un k approprié
  • Préparation des données pour l'utilisation avec kNN
  • Pourquoi l'algorithme kNN est-il paresseux ?

9. Comprendre les règles de classification

  • Séparer pour régner
  • L'algorithme One Rule
  • L'algorithme RIPPER
  • Règles issues des arbres de décision

10. Comprendre la régression

  • Régression linéaire simple
  • Estimation des moindres carrés ordinaires
  • Corrélations
  • Régression linéaire multiple

11. Comprendre les arbres de régression et les arbres de modèle

  • Ajout de la régression aux arbres

12. Comprendre les règles d'association

  • L'algorithme Apriori pour l'apprentissage des règles d'association
  • Mesure de l'intérêt des règles – support et confiance
  • Construction d'un ensemble de règles avec le principe Apriori

Compléments

  • Spark/PySpark/MLlib et bandits multinômes

Pré requis

Connaissances en Python

 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (7)

Cours à venir

Catégories Similaires