Ce que vous devez savoir avant
Vous commencez

Débute 5 June 2026 00:08

Se termine 5 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Agents d'apprentissage utilisant Q-Learning : théorie et code - Cours sur l'IA agentique, conférence 13

Rejoignez-nous pour la Conférence 13 du Cours Agentic AI alors que nous explorons le monde de l'apprentissage par renforcement avec Q-Learning. Cette session offre un aperçu complet de l'apprentissage par renforcement à travers des idées théoriques détaillées et une implémentation pratique en Python. Vous acquerrez des connaissances essen.
Code With Aarohi via YouTube

Code With Aarohi

6076 Cours


39 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join us in Lecture 13 of the Agentic AI Course as we delve into the world of Q-Learning. This session provides a comprehensive look at reinforcement learning through detailed theoretical insights and practical Python implementation.

You will gain essential knowledge about learning agents and explore the intricacies of Q-tables and epsilon-greedy strategies. The lecture also includes a step-by-step guide to coding a simple environment from scratch, equipping you with the skills to master these concepts effectively.

Enhance your understanding of artificial intelligence and computer science with this engaging and informative course available on YouTube.

Programme

  • Introduction à l'apprentissage par renforcement (RL)
  • Aperçu des concepts de RL
    Composants clés : agent, environnement, actions, états, récompenses
  • Fondements du Q-Learning
  • Définition et objectif du Q-Learning dans le RL
    L'équation de Bellman et mises à jour des valeurs Q
    Dilemme exploration vs. exploitation
  • La Q-Table
  • Structure et objectif de la Q-table
    Initialisation et représentation de la Q-table
    Mises à jour de la Q-table en fonction des actions et des récompenses
  • Stratégie Epsilon-Greedy
  • Explication de la stratégie epsilon-greedy pour l'exploration
    Équilibrer exploration et exploitation
    Modulation de la valeur epsilon pour l'efficacité de l'apprentissage
  • Implémentation en Python
  • Mise en place de l'environnement Python
    Codage de la Q-table et du mécanisme de mise à jour
    Mise en œuvre de la sélection d'actions epsilon-greedy
  • Construction d'un environnement simple
  • Conception d'un environnement de base pour un agent apprenant
    Définition de l'espace des états et de l'espace des actions
    Structure des récompenses et transitions d'état
  • Coder un agent Q-Learning
  • Intégration de tous les composants en un agent fonctionnel
    Exécuter des simulations et observer la progression de l'apprentissage
  • Applications pratiques et améliorations
  • Passer à des environnements plus complexes
    Introduction de variantes telles que le Q-Learning avec approximation de fonction
  • Conclusion et lectures complémentaires
  • Récapitulatif des concepts clés
    Lectures suggérées et ressources pour un apprentissage avancé

Matières

Computer Science