Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage par renforcement

  • Vue d'ensemble de l'apprentissage par renforcement et de ses applications
  • Différences entre l'apprentissage supervisé, non supervisé et par renforcement
  • Concepts clés : agent, environnement, récompenses et politique

Processus de décision de Markov (MDP)

  • Compréhension des états, actions, récompenses et transitions d'état
  • Fonctions de valeur et équation de Bellman
  • Programmation dynamique pour résoudre les MDP

Algorithmes fondamentaux de l'AR

  • Méthodes tabulaires : Q-Learning et SARSA
  • Méthodes fondées sur la politique : algorithme REINFORCE
  • Architectures Actor-Critic et leurs applications

Apprentissage par renforcement profond

  • Introduction aux réseaux de neurones profonds Q (DQN)
  • Mémoire d'expérience et réseaux cibles
  • Gradients de politique et méthodes avancées d'AR profond

Frameworks et outils d'AR

  • Introduction à OpenAI Gym et autres environnements d'AR
  • Utilisation de PyTorch ou TensorFlow pour le développement de modèles d'AR
  • Entraînement, test et benchmarking des agents d'AR

Défis de l'AR

  • Équilibre entre exploration et exploitation pendant l'entraînement
  • Gestion des récompenses rares et des problèmes d'affectation de crédit
  • Évolutivité et défis computationnels en AR

Activités pratiques

  • Implémentation des algorithmes Q-Learning et SARSA à partir de zéro
  • Entraînement d'un agent basé sur DQN pour jouer à un jeu simple dans OpenAI Gym
  • Ajustement fin des modèles d'AR pour améliorer les performances dans des environnements personnalisés

Résumé et prochaines étapes

Pré requis

  • Solide compréhension des principes et algorithmes d'apprentissage automatique
  • Maîtrise de la programmation en Python
  • Familiarité avec les réseaux de neurones et les frameworks d'apprentissage profond

Public cible

  • Ingénieurs en apprentissage automatique
  • Spécialistes en intelligence artificielle
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires