Ce que vous devez savoir avant
Vous commencez

Débute 23 July 2026 09:12

Se termine 23 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

Contrôle Optimal Universel, Apprentissage par Renforcement, et Atteindre des Objectifs dans les LLMs

Explorez la théorie universelle du contrôle optimal et comment les techniques d'apprentissage par renforcement peuvent être appliquées pour aider les Grands Modèles de Langage à atteindre des objectifs spécifiques avec Yann Ollivier de FAIR de Meta.

Institut des Hautes Etudes Scientifiques (IHES) via YouTube

54 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Explore universal optimal control theory and how reinforcement learning techniques can be applied to help Large Language Models achieve specific goals with Yann Ollivier from Meta's FAIR.

Matières

Computer Science

Ce que vous devez savoir avant Vous commencez

Contrôle Optimal Universel, Apprentissage par Renforcement, et Atteindre des Objectifs dans les LLMs

54 minutes

Not Specified

Free Video

Aperçu

Matières

IA pour l'automatisation et la modélisation de la FP&A (planification financière et analyse)

FP&A avec IA : Projet de Fin d'Études

Interprétabilité des LLM - Génération de Descriptions de Caractéristiques SAE - Printemps 2026

CodeCloak : une méthode basée sur DRL pour atténuer les fuites de code par les assistants de code LLM

IA générative pour le TALN avec PyTorch

Ingénieur en apprentissage automatique : Modèles d'apprentissage automatique et profond

Ce que vous devez savoir avant
Vous commencez