Qué necesitas saber antes de
comenzar

Inicio 7 June 2026 17:31

Fin 7 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Control óptimo universal, aprendizaje por refuerzo y alcance de objetivos en modelos de lenguaje grandes (LLMs)

Explora la teoría del control óptimo universal y cómo se pueden aplicar técnicas de aprendizaje por refuerzo para ayudar a los Modelos de Lenguaje Grandes a alcanzar objetivos específicos con Yann Ollivier de FAIR de Meta.
Institut des Hautes Etudes Scientifiques (IHES) via YouTube

Institut des Hautes Etudes Scientifiques (IHES)

6076 Cursos


54 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Explore universal optimal control theory and how reinforcement learning techniques can be applied to help Large Language Models achieve specific goals with Yann Ollivier from Meta's FAIR.


Materias

Computer Science