Ce que vous devez savoir avant
Vous commencez

Débute 7 June 2026 17:31

Se termine 7 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Contrôle Optimal Universel, Apprentissage par Renforcement, et Atteindre des Objectifs dans les LLMs

Explorez la théorie universelle du contrôle optimal et comment les techniques d'apprentissage par renforcement peuvent être appliquées pour aider les Grands Modèles de Langage à atteindre des objectifs spécifiques avec Yann Ollivier de FAIR de Meta.
Institut des Hautes Etudes Scientifiques (IHES) via YouTube

Institut des Hautes Etudes Scientifiques (IHES)

6076 Cours


54 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Explore universal optimal control theory and how reinforcement learning techniques can be applied to help Large Language Models achieve specific goals with Yann Ollivier from Meta's FAIR.


Matières

Computer Science