What You Need to Know Before
You Start
Starts 7 June 2025 00:09
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
Agents d'apprentissage utilisant Q-Learning : théorie et code - Cours sur l'IA agentique, conférence 13
Plongez dans le Q-learning pour l'apprentissage par renforcement avec des bases théoriques et une implémentation en Python. Maîtrisez les agents d'apprentissage, les tables Q, les stratégies epsilon-greedy et codez un environnement simple à partir de zéro.
Code With Aarohi
via YouTube
Code With Aarohi
2484 Cours
39 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Plongez dans le Q-learning pour l'apprentissage par renforcement avec des bases théoriques et une implémentation en Python. Maîtrisez les agents d'apprentissage, les tables Q, les stratégies epsilon-greedy et codez un environnement simple à partir de zéro.
Programme
- Introduction à l'apprentissage par renforcement (RL)
- Fondements du Q-Learning
- La Q-Table
- Stratégie Epsilon-Greedy
- Implémentation en Python
- Construction d'un environnement simple
- Coder un agent Q-Learning
- Applications pratiques et améliorations
- Conclusion et lectures complémentaires
Aperçu des concepts de RL
Composants clés : agent, environnement, actions, états, récompenses
Définition et objectif du Q-Learning dans le RL
L'équation de Bellman et mises à jour des valeurs Q
Dilemme exploration vs. exploitation
Structure et objectif de la Q-table
Initialisation et représentation de la Q-table
Mises à jour de la Q-table en fonction des actions et des récompenses
Explication de la stratégie epsilon-greedy pour l'exploration
Équilibrer exploration et exploitation
Modulation de la valeur epsilon pour l'efficacité de l'apprentissage
Mise en place de l'environnement Python
Codage de la Q-table et du mécanisme de mise à jour
Mise en œuvre de la sélection d'actions epsilon-greedy
Conception d'un environnement de base pour un agent apprenant
Définition de l'espace des états et de l'espace des actions
Structure des récompenses et transitions d'état
Intégration de tous les composants en un agent fonctionnel
Exécuter des simulations et observer la progression de l'apprentissage
Passer à des environnements plus complexes
Introduction de variantes telles que le Q-Learning avec approximation de fonction
Récapitulatif des concepts clés
Lectures suggérées et ressources pour un apprentissage avancé
Sujets
Informatique