Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 20:19

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Agentes de Aprendizaje Usando Q-Learning: Teoría y Código - Curso de Agentes AI Conferencia 13

Únete a nosotros en la Clase 13 del Curso de IA Agente mientras nos adentramos en el mundo de Q-Learning. Esta sesión ofrece una visión completa del aprendizaje por refuerzo a través de detalladas perspectivas teóricas y una implementación práctica en Python. Adquirirás conocimientos esenciales sobre agentes de aprendizaje y explorarás la.
Code With Aarohi via YouTube

Code With Aarohi

6076 Cursos


39 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us in Lecture 13 of the Agentic AI Course as we delve into the world of Q-Learning. This session provides a comprehensive look at reinforcement learning through detailed theoretical insights and practical Python implementation.

You will gain essential knowledge about learning agents and explore the intricacies of Q-tables and epsilon-greedy strategies. The lecture also includes a step-by-step guide to coding a simple environment from scratch, equipping you with the skills to master these concepts effectively.

Enhance your understanding of artificial intelligence and computer science with this engaging and informative course available on YouTube.

Programa

  • Introducción al Aprendizaje por Refuerzo (RL)
  • Descripción general de los conceptos de RL
    Componentes clave: agente, entorno, acciones, estados, recompensas
  • Fundamentos del Q-Learning
  • Definición y propósito del Q-Learning en RL
    La Ecuación de Bellman y actualizaciones de valores Q
    Dilema de Exploración vs. Explotación
  • La Tabla Q
  • Estructura y propósito de la tabla Q
    Inicialización y representación de la tabla Q
    Actualizaciones a la tabla Q basadas en acciones y recompensas
  • Estrategia Epsilon-Greedy
  • Explicación de la estrategia epsilon-greedy para la exploración
    Equilibrio entre exploración y explotación
    Modulación del valor epsilon para la eficiencia del aprendizaje
  • Implementación en Python
  • Configuración del entorno Python
    Codificación de la tabla Q y mecanismo de actualización
    Implementación de la selección de acciones epsilon-greedy
  • Construcción de un Entorno Simple
  • Diseño de un entorno básico para un agente de aprendizaje
    Definición del espacio de estados y del espacio de acciones
    Estructura de recompensas y transiciones de estado
  • Codificación de un Agente de Q-Learning
  • Integración de todos los componentes en un agente funcional
    Ejecución de simulaciones y observación de la progresión del aprendizaje
  • Aplicaciones Prácticas y Mejoras
  • Escalar a entornos más complejos
    Introducción de variaciones como el Q-Learning con aproximación de funciones
  • Conclusión y Lecturas Adicionales
  • Recapitulación de conceptos clave
    Lecturas sugeridas y recursos para un aprendizaje avanzado

Materias

Computer Science