Plan du cours

Techniques Avancées Reinforcement Learning

Déploiement de Modèles Reinforcement Learning

Exploration et Exploitation

Introduction à Reinforcement Learning

Méthodes Basées sur les Politiques

Apprentissage par Renforcement Q et Réseaux Neuronaux Profonds Q (DQNs)

Synthèse et Prochains Pas

Travail avec OpenAI Gym

  • Équilibrer l'exploration et l'exploitation dans les modèles RL
  • Stratégies d'exploration : epsilon-greedy, softmax et plus
  • Introduction à l'apprentissage par renforcement Q
  • Implémentation de DQNs en utilisant TensorFlow
  • Optimisation de l'apprentissage Q avec le rappel d'expérience et les réseaux cibles
  • Apprentissage par renforcement multi-agents
  • Gradient de politique déterministe profond (DDPG)
  • Optimisation de politique proximale (PPO)
  • Algorithmes de gradient de politique
  • Algorithme REINFORCE et son implémentation
  • Méthodes acteur-critique
  • Applications du monde réel de l'apprentissage par renforcement
  • Intégration des modèles RL dans les environnements de production
  • Configuration d'environnements dans OpenAI Gym
  • Simulation des agents dans des environnements dynamiques
  • Évaluation de la performance des agents
  • Qu'est-ce que l'apprentissage par renforcement ?
  • Concepts clés : agent, environnement, états, actions et récompenses
  • Défis en apprentissage par renforcement

Pré requis

Public

  • Scientifiques des données
  • Praticiens de l'apprentissage automatique
  • Rechercheurs en IA
  • Expérience avec la programmation Python
  • Compréhension de base des concepts d'apprentissage profond et d'apprentissage automatique
  • Connaissance des algorithmes et concepts mathématiques utilisés dans l'apprentissage par renforcement
 28 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires