Ce que vous devez savoir avant
de commencer

Débute 27 June 2025 18:14

Se termine 27 June 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Contrôle Optimal Universel, Apprentissage par Renforcement, et Atteindre des Objectifs dans les LLMs

Explorez la théorie universelle du contrôle optimal et comment les techniques d'apprentissage par renforcement peuvent être appliquées pour aider les Grands Modèles de Langage à atteindre des objectifs spécifiques avec Yann Ollivier de FAIR de Meta.
Institut des Hautes Etudes Scientifiques (IHES) via YouTube

Institut des Hautes Etudes Scientifiques (IHES)

2765 Cours


54 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Explorez la théorie universelle du contrôle optimal et comment les techniques d'apprentissage par renforcement peuvent être appliquées pour aider les Grands Modèles de Langage à atteindre des objectifs spécifiques avec Yann Ollivier de FAIR de Meta.


Sujets

Informatique