What You Need to Know Before
You Start
Starts 8 June 2025 01:22
Ends 8 June 2025
00
days
00
hours
00
minutes
00
seconds
Entrenamiento Adversarial para la Robustez en Seguridad de los LLMs
Explora técnicas para mejorar la robustez de seguridad de los grandes modelos de lenguaje mediante métodos de entrenamiento adversarial con el investigador Gauthier Gidel de IVADO-Mila.
Simons Institute
via YouTube
Simons Institute
2544 Cursos
1 hour 1 minute
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Explora técnicas para mejorar la robustez de seguridad de los grandes modelos de lenguaje mediante métodos de entrenamiento adversarial con el investigador Gauthier Gidel de IVADO-Mila.
Programa de estudio
- Introducción al entrenamiento adversarial
- Fundamentos de los Modelos de Lenguaje Grande (LLMs)
- Comprensión de los ataques adversariales
- Técnicas de entrenamiento adversarial
- Mejora de la robustez en seguridad en LLMs
- Implementación práctica del entrenamiento adversarial
- Estudios de casos y aplicaciones
- Desafíos y direcciones futuras
- Conclusiones y discusión
- Recursos adicionales
Definición e importancia del entrenamiento adversarial
Visión general de la robustez en seguridad de los Modelos de Lenguaje Grande (LLMs)
Introducción al investigador Gauthier Gidel y IVADO-Mila
Arquitectura y funcionamiento de los LLMs
Limitaciones y vulnerabilidades de los LLMs
Tipos de ataques adversariales en LLMs
Estudios de casos de ataques adversariales en LLMs
Métodos básicos de entrenamiento adversarial
Técnicas avanzadas para el entrenamiento adversarial de LLMs
Estrategias para mejorar la robustez de los modelos
Métricas para evaluar la robustez
Configuración de experimentos para el entrenamiento adversarial
Herramientas y bibliotecas para implementar el entrenamiento adversarial
Aplicaciones en el mundo real de los LLMs entrenados adversarialmente
Análisis de estudios de casos que demuestran la mejora en la robustez
Desafíos actuales en el entrenamiento adversarial para LLMs
Direcciones futuras de investigación y oportunidades
Conclusiones clave del curso
Sesión abierta de preguntas y respuestas
Lecturas recomendadas y recursos para una mayor exploración
Asignaturas
Ciencias de la Computación