What You Need to Know Before
You Start

Starts 8 June 2025 00:54

Ends 8 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

¿Fuera de Distribución, Fuera de Control? Entendiendo los Desafíos de Seguridad en la IA

Explore los desafíos de seguridad en la IA, centrándose en problemas fuera de distribución y garantías de seguridad para modelos de lenguaje grande con Aditi Raghunathan.
Simons Institute via YouTube

Simons Institute

2544 Cursos


59 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Explore los desafíos de seguridad en la IA, centrándose en problemas fuera de distribución y garantías de seguridad para modelos de lenguaje grande con Aditi Raghunathan.

Programa de estudio

  • Introducción a la Seguridad en IA
  • Panorama general de las preocupaciones de seguridad en IA
    Importancia de abordar la seguridad en los sistemas de IA
  • Problemas de Fuera de Distribución (OOD)
  • Definición y ejemplos de OOD
    Impacto de OOD en el rendimiento del sistema de IA
    Estrategias para detectar datos OOD
  • Fundamentos Teóricos
  • Fundamentos estadísticos y probabilísticos de OOD
    Robustez en modelos de IA
    Métricas de evaluación para escenarios OOD
  • Modelos de Lenguaje a Gran Escala (LLMs)
  • Introducción a los modelos de lenguaje a gran escala
    Casos de uso y aplicaciones comunes
    Limitaciones y modos de fallo
  • Garantías de Seguridad en IA
  • Definición y ejemplos de garantías de seguridad
    Enfoques para asegurar la seguridad en modelos de IA
    Técnicas de verificación y validación
  • Técnicas para Mejorar la Seguridad
  • Métodos de entrenamiento robustos
    Entrenamiento adversarial y defensas
    Interpretabilidad y confiabilidad del modelo
  • Estudios de Caso
  • Análisis de fallos de IA en el mundo real
    Lecciones aprendidas y mejoras de seguridad
  • Consideraciones Éticas
  • Implicaciones éticas de la seguridad en IA
    Equilibrio entre rendimiento y seguridad
  • Talleres Prácticos
  • Ejercicios prácticos con herramientas de código abierto
    Simulaciones de escenarios OOD y evaluaciones de seguridad
  • Direcciones Futuras y Desafíos de Investigación Abiertos
  • Tendencias emergentes en seguridad de IA
    Áreas clave para más investigación y desarrollo
  • Cierre del Curso
  • Revisión y discusión de conceptos clave
    Reflexiones finales sobre el futuro de la seguridad en IA y los desafíos de OOD

Asignaturas

Ciencias de la Computación