What You Need to Know Before
You Start
Starts 8 June 2025 00:54
Ends 8 June 2025
00
days
00
hours
00
minutes
00
seconds
¿Fuera de Distribución, Fuera de Control? Entendiendo los Desafíos de Seguridad en la IA
Explore los desafíos de seguridad en la IA, centrándose en problemas fuera de distribución y garantías de seguridad para modelos de lenguaje grande con Aditi Raghunathan.
Simons Institute
via YouTube
Simons Institute
2544 Cursos
59 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Explore los desafíos de seguridad en la IA, centrándose en problemas fuera de distribución y garantías de seguridad para modelos de lenguaje grande con Aditi Raghunathan.
Programa de estudio
- Introducción a la Seguridad en IA
- Problemas de Fuera de Distribución (OOD)
- Fundamentos Teóricos
- Modelos de Lenguaje a Gran Escala (LLMs)
- Garantías de Seguridad en IA
- Técnicas para Mejorar la Seguridad
- Estudios de Caso
- Consideraciones Éticas
- Talleres Prácticos
- Direcciones Futuras y Desafíos de Investigación Abiertos
- Cierre del Curso
Panorama general de las preocupaciones de seguridad en IA
Importancia de abordar la seguridad en los sistemas de IA
Definición y ejemplos de OOD
Impacto de OOD en el rendimiento del sistema de IA
Estrategias para detectar datos OOD
Fundamentos estadísticos y probabilísticos de OOD
Robustez en modelos de IA
Métricas de evaluación para escenarios OOD
Introducción a los modelos de lenguaje a gran escala
Casos de uso y aplicaciones comunes
Limitaciones y modos de fallo
Definición y ejemplos de garantías de seguridad
Enfoques para asegurar la seguridad en modelos de IA
Técnicas de verificación y validación
Métodos de entrenamiento robustos
Entrenamiento adversarial y defensas
Interpretabilidad y confiabilidad del modelo
Análisis de fallos de IA en el mundo real
Lecciones aprendidas y mejoras de seguridad
Implicaciones éticas de la seguridad en IA
Equilibrio entre rendimiento y seguridad
Ejercicios prácticos con herramientas de código abierto
Simulaciones de escenarios OOD y evaluaciones de seguridad
Tendencias emergentes en seguridad de IA
Áreas clave para más investigación y desarrollo
Revisión y discusión de conceptos clave
Reflexiones finales sobre el futuro de la seguridad en IA y los desafíos de OOD
Asignaturas
Ciencias de la Computación