Ce que vous devez savoir avant
Vous commencez

Débute 4 June 2026 12:51

Se termine 4 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Nouvelle formation post-AI - Ajouter le RL en tant que vecteur orthogonal au SFT

Découvrez comment améliorer l'IA après l'entraînement en intégrant l'apprentissage par renforcement comme un vecteur orthogonal au réglage fin supervisé pour une adaptation continue et une performance améliorée.
Discover AI via YouTube

Discover AI

6076 Cours


27 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Discover how to enhance AI post-training by integrating reinforcement learning as an orthogonal vector to supervised fine-tuning for continual adaptation and improved performance.


Matières

Computer Science