Qué necesitas saber antes de
comenzar
Inicio 8 June 2026 07:15
Fin 8 June 2026
Razonamiento Agéntico con Aprendizaje por Refuerzo
DevConf
6076 Cursos
15 minutes
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Explore how reinforcement fine-tuning enhances agentic reasoning in large language models, using Wordle as a testbed to demonstrate structured reasoning over pattern matching.
Materias
Computer Science