Qué necesitas saber antes de
comenzar

Inicio 23 July 2026 08:28

Fin 23 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Control óptimo universal, aprendizaje por refuerzo y alcance de objetivos en modelos de lenguaje grandes (LLMs)

Explora la teoría del control óptimo universal y cómo se pueden aplicar técnicas de aprendizaje por refuerzo para ayudar a los Modelos de Lenguaje Grandes a alcanzar objetivos específicos con Yann Ollivier de FAIR de Meta.

Institut des Hautes Etudes Scientifiques (IHES) via YouTube

54 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Explore universal optimal control theory and how reinforcement learning techniques can be applied to help Large Language Models achieve specific goals with Yann Ollivier from Meta's FAIR.

Materias

Computer Science

Qué necesitas saber antes de comenzar

Control óptimo universal, aprendizaje por refuerzo y alcance de objetivos en modelos de lenguaje grandes (LLMs)

54 minutes

Not Specified

Free Video

Resumen

Materias

IA para Automatización y Modelado de FP&A

FP&A con IA: Proyecto de Fin de Carrera

Interpretabilidad de los LLM - Generación de Descripciones de Características de SAE - Primavera 2026

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Qué necesitas saber antes de
comenzar