Plan du cours

Introduction à Reinforcement Learning

  • Qu'est-ce que l'apprentissage par renforcement ?
  • Concepts clés : agent, environnement, états, actions et récompenses
  • Défis en apprentissage par renforcement

Exploration et Exploitation

  • Équilibrer l'exploration et l'exploitation dans les modèles RL
  • Stratégies d'exploration : epsilon-greedy, softmax et autres

Q-Learning et Réseaux Neuronaux Q (DQN)

  • Introduction à Q-learning
  • Implémentation des DQN avec TensorFlow
  • Optimisation de Q-learning avec le replay d'expérience et les réseaux cibles

Méthodes basées sur la politique

  • Algorithmes de gradient de politiques
  • Algorithme REINFORCE et son implémentation
  • Méthodes acteur-critique

Travailler avec OpenAI Gym

  • Configuration des environnements dans OpenAI Gym
  • Simulation d'agents dans des environnements dynamiques
  • Évaluation de la performance des agents

Techniques avancées en Reinforcement Learning

  • Apprentissage par renforcement multi-agents
  • Gradient déterministe profond (DDPG)
  • Optimisation de la politique proximale (PPO)

Déploiement des modèles Reinforcement Learning

  • Applications réelles de l'apprentissage par renforcement
  • Intégration des modèles RL dans les environnements de production

Résumé et Étapes Suivantes

Pré requis

  • Expérience avec la programmation Python
  • Compréhension de base des concepts d'apprentissage profond et d'apprentissage automatique
  • Connaissance des algorithmes et des concepts mathématiques utilisés dans l'apprentissage par renforcement

Public cible

  • Scientifiques des données
  • Professionnels de l'apprentissage automatique
  • Chercheurs en IA
 28 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires