Qué necesitas saber antes de
comenzar
Inicio 4 June 2026 12:49
Fin 4 June 2026
Nuevo post-entrenamiento de IA: Añadir RL como vector ortogonal a SFT
Discover AI
6076 Cursos
27 minutes
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Discover how to enhance AI post-training by integrating reinforcement learning as an orthogonal vector to supervised fine-tuning for continual adaptation and improved performance.
Materias
Computer Science