Ce que vous devez savoir avant
Vous commencez

Débute 8 June 2026 07:15

Se termine 8 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Raisonnement agentique avec apprentissage par renforcement

Découvrez comment le réglage fin par renforcement améliore le raisonnement agentif dans les grands modèles de langage, en utilisant Wordle comme banc d'essai pour démontrer un raisonnement structuré par rapport à la correspondance de motifs.
DevConf via YouTube

DevConf

6076 Cours


15 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Explore how reinforcement fine-tuning enhances agentic reasoning in large language models, using Wordle as a testbed to demonstrate structured reasoning over pattern matching.


Matières

Computer Science