Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage par renforcement

  • Qu'est-ce que l'apprentissage par renforcement ?
  • Concepts clés : agent, environnement, états, actions et récompenses
  • Défis liés à l'apprentissage par renforcement

Exploration et exploitation

  • Équilibrer l'exploration et l'exploitation dans les modèles de RL
  • Stratégies d'exploration : epsilon-greedy, softmax et d'autres

Apprentissage Q (Q-Learning) et Réseaux Q Profonds (DQN)

  • Introduction à l'apprentissage Q
  • Mise en œuvre de DQN à l'aide de TensorFlow
  • Optimisation de l'apprentissage Q avec la replay d'expérience et les réseaux cibles

Méthodes basées sur la politique

  • Algorithmes de gradient de la politique
  • Algorithme REINFORCE et sa mise en œuvre
  • Méthodes acteur-critique

Travail avec OpenAI Gym

  • Configuration des environnements dans OpenAI Gym
  • Simulation d'agents dans des environnements dynamiques
  • Évaluation des performances de l'agent

Techniques avancées d'apprentissage par renforcement

  • Apprentissage par renforcement multi-agents
  • Gradient de politique déterministe profond (DDPG)
  • Optimisation de la politique proximale (PPO)

Déploiement de modèles d'apprentissage par renforcement

  • Applications réelles de l'apprentissage par renforcement
  • Intégration de modèles RL dans des environnements de production

Résumé et prochaines étapes

Pré requis

  • Expérience avec la programmation Python
  • Compréhension de base des concepts d'apprentissage profond et d'apprentissage automatique
  • Connaissance des algorithmes et des concepts mathématiques utilisés dans l'apprentissage par renforcement

Public visé

  • Scientistes des données
  • Praticiens en apprentissage automatique
  • Chercheurs en IA
 28 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires