What You Need to Know Before
You Start

Starts 7 June 2025 00:09

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Agents d'apprentissage utilisant Q-Learning : théorie et code - Cours sur l'IA agentique, conférence 13

Plongez dans le Q-learning pour l'apprentissage par renforcement avec des bases théoriques et une implémentation en Python. Maîtrisez les agents d'apprentissage, les tables Q, les stratégies epsilon-greedy et codez un environnement simple à partir de zéro.
Code With Aarohi via YouTube

Code With Aarohi

2484 Cours


39 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Plongez dans le Q-learning pour l'apprentissage par renforcement avec des bases théoriques et une implémentation en Python. Maîtrisez les agents d'apprentissage, les tables Q, les stratégies epsilon-greedy et codez un environnement simple à partir de zéro.

Programme

  • Introduction à l'apprentissage par renforcement (RL)
  • Aperçu des concepts de RL
    Composants clés : agent, environnement, actions, états, récompenses
  • Fondements du Q-Learning
  • Définition et objectif du Q-Learning dans le RL
    L'équation de Bellman et mises à jour des valeurs Q
    Dilemme exploration vs. exploitation
  • La Q-Table
  • Structure et objectif de la Q-table
    Initialisation et représentation de la Q-table
    Mises à jour de la Q-table en fonction des actions et des récompenses
  • Stratégie Epsilon-Greedy
  • Explication de la stratégie epsilon-greedy pour l'exploration
    Équilibrer exploration et exploitation
    Modulation de la valeur epsilon pour l'efficacité de l'apprentissage
  • Implémentation en Python
  • Mise en place de l'environnement Python
    Codage de la Q-table et du mécanisme de mise à jour
    Mise en œuvre de la sélection d'actions epsilon-greedy
  • Construction d'un environnement simple
  • Conception d'un environnement de base pour un agent apprenant
    Définition de l'espace des états et de l'espace des actions
    Structure des récompenses et transitions d'état
  • Coder un agent Q-Learning
  • Intégration de tous les composants en un agent fonctionnel
    Exécuter des simulations et observer la progression de l'apprentissage
  • Applications pratiques et améliorations
  • Passer à des environnements plus complexes
    Introduction de variantes telles que le Q-Learning avec approximation de fonction
  • Conclusion et lectures complémentaires
  • Récapitulatif des concepts clés
    Lectures suggérées et ressources pour un apprentissage avancé

Sujets

Informatique