What You Need to Know Before
You Start

Starts 8 June 2025 01:22

Ends 8 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Entrenamiento Adversarial para la Robustez en Seguridad de los LLMs

Explora técnicas para mejorar la robustez de seguridad de los grandes modelos de lenguaje mediante métodos de entrenamiento adversarial con el investigador Gauthier Gidel de IVADO-Mila.
Simons Institute via YouTube

Simons Institute

2544 Cursos


1 hour 1 minute

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Explora técnicas para mejorar la robustez de seguridad de los grandes modelos de lenguaje mediante métodos de entrenamiento adversarial con el investigador Gauthier Gidel de IVADO-Mila.

Programa de estudio

  • Introducción al entrenamiento adversarial
  • Definición e importancia del entrenamiento adversarial
    Visión general de la robustez en seguridad de los Modelos de Lenguaje Grande (LLMs)
    Introducción al investigador Gauthier Gidel y IVADO-Mila
  • Fundamentos de los Modelos de Lenguaje Grande (LLMs)
  • Arquitectura y funcionamiento de los LLMs
    Limitaciones y vulnerabilidades de los LLMs
  • Comprensión de los ataques adversariales
  • Tipos de ataques adversariales en LLMs
    Estudios de casos de ataques adversariales en LLMs
  • Técnicas de entrenamiento adversarial
  • Métodos básicos de entrenamiento adversarial
    Técnicas avanzadas para el entrenamiento adversarial de LLMs
  • Mejora de la robustez en seguridad en LLMs
  • Estrategias para mejorar la robustez de los modelos
    Métricas para evaluar la robustez
  • Implementación práctica del entrenamiento adversarial
  • Configuración de experimentos para el entrenamiento adversarial
    Herramientas y bibliotecas para implementar el entrenamiento adversarial
  • Estudios de casos y aplicaciones
  • Aplicaciones en el mundo real de los LLMs entrenados adversarialmente
    Análisis de estudios de casos que demuestran la mejora en la robustez
  • Desafíos y direcciones futuras
  • Desafíos actuales en el entrenamiento adversarial para LLMs
    Direcciones futuras de investigación y oportunidades
  • Conclusiones y discusión
  • Conclusiones clave del curso
    Sesión abierta de preguntas y respuestas
  • Recursos adicionales
  • Lecturas recomendadas y recursos para una mayor exploración

Asignaturas

Ciencias de la Computación