What You Need to Know Before
You Start
Starts 7 June 2025 00:09
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
Agentes de Aprendizaje Usando Q-Learning: Teoría y Código - Curso de Agentes AI Conferencia 13
Sumérgete en el aprendizaje Q para el aprendizaje por refuerzo con fundamentos teóricos y una implementación en Python. Domina los agentes de aprendizaje, las tablas Q, las estrategias epsilon-greedy y programa un entorno simple desde cero.
Code With Aarohi
via YouTube
Code With Aarohi
2484 Cursos
39 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Sumérgete en el aprendizaje Q para el aprendizaje por refuerzo con fundamentos teóricos y una implementación en Python. Domina los agentes de aprendizaje, las tablas Q, las estrategias epsilon-greedy y programa un entorno simple desde cero.
Programa de estudio
- Introducción al Aprendizaje por Refuerzo (RL)
- Fundamentos del Q-Learning
- La Tabla Q
- Estrategia Epsilon-Greedy
- Implementación en Python
- Construcción de un Entorno Simple
- Codificación de un Agente de Q-Learning
- Aplicaciones Prácticas y Mejoras
- Conclusión y Lecturas Adicionales
Descripción general de los conceptos de RL
Componentes clave: agente, entorno, acciones, estados, recompensas
Definición y propósito del Q-Learning en RL
La Ecuación de Bellman y actualizaciones de valores Q
Dilema de Exploración vs. Explotación
Estructura y propósito de la tabla Q
Inicialización y representación de la tabla Q
Actualizaciones a la tabla Q basadas en acciones y recompensas
Explicación de la estrategia epsilon-greedy para la exploración
Equilibrio entre exploración y explotación
Modulación del valor epsilon para la eficiencia del aprendizaje
Configuración del entorno Python
Codificación de la tabla Q y mecanismo de actualización
Implementación de la selección de acciones epsilon-greedy
Diseño de un entorno básico para un agente de aprendizaje
Definición del espacio de estados y del espacio de acciones
Estructura de recompensas y transiciones de estado
Integración de todos los componentes en un agente funcional
Ejecución de simulaciones y observación de la progresión del aprendizaje
Escalar a entornos más complejos
Introducción de variaciones como el Q-Learning con aproximación de funciones
Recapitulación de conceptos clave
Lecturas sugeridas y recursos para un aprendizaje avanzado
Asignaturas
Ciencias de la Computación