Ce que vous devez savoir avant
Vous commencez
Débute 8 June 2026 07:15
Se termine 8 June 2026
Raisonnement agentique avec apprentissage par renforcement
DevConf
6076 Cours
15 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Explore how reinforcement fine-tuning enhances agentic reasoning in large language models, using Wordle as a testbed to demonstrate structured reasoning over pattern matching.
Matières
Computer Science