Qué necesitas saber antes de
comenzar

Inicio 7 June 2026 07:35

Fin 7 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

La Oscura Sombra de la IA - Engaño y Alineación en Modelos de Lenguaje Grandes

Descubra cómo los métodos de seguridad de la IA, como el aprendizaje reforzado con retroalimentación humana (RLHF), pueden crear mentirosos sofisticados, explore nuevos marcos para entrenar agentes veraces y descubra técnicas automatizadas de refinamiento de personalidad.
Discover AI via YouTube

Discover AI

6076 Cursos


31 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Uncover how AI safety methods like RLHF may create sophisticated liars, explore new frameworks for training truthful agents, and discover automated persona refinement techniques.


Materias

Computer Science