Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan du cours
Introduction
Reinforcement Learning Bases
Techniques de base Reinforcement Learning
Introduction à la toile de jute
Convergence des valeurs et itération des politiques
Façonnage des récompenses
Exploration
Généralisation
MDP partiellement observables
Possibilités
Logistique
TD Lambda
Dégradés politiques
Apprentissage Q profond
Sujets en théorie des jeux
Résumé et prochaines étapes
Pré requis
- Maîtrise de Python
- Une compréhension du calcul universitaire et de l'algèbre linéaire
- Compréhension de base des probabilités et Statistics
- Expérience de la création de modèles d'apprentissage automatique en Python et Numpy
Audience
- Développeurs
- Data Scientists
21 heures