What You Need to Know Before
You Start
Starts 8 June 2025 01:05
Ends 8 June 2025
00
days
00
hours
00
minutes
00
seconds
1 hour 11 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Explore el concepto de simular entrenamiento contrafactual en el contexto de modelos de lenguaje grande (LLMs) con garantías de seguridad con Roger Grosse de la Universidad de Toronto.
Programa de estudio
- Introducción al Entrenamiento Contrafactual
- Fundamentos Teóricos de los Contrafactuales
- Entrenamiento Contrafactual en Modelos de Lenguaje Grandes
- Protección de la IA con Contrafactuales
- Técnicas para Simular Contrafactuales
- Estudios de Caso: Aplicaciones en el Mundo Real
- Direcciones Futuras y Oportunidades de Investigación
- Taller Práctico: Implementación del Entrenamiento Contrafactual
- Revisión y Conclusión del Curso
Definición e importancia en la seguridad de la IA
Contexto histórico y desarrollo
Visión general del aprendizaje de modelos de lenguaje grandes (LLMs)
Razonamiento contrafactual en IA
Causalidad y su relación con los contrafactuales
Formulaciones matemáticas clave
Comprensión de las arquitecturas de modelos de lenguaje
Aplicación de contrafactuales dentro del entrenamiento de LLM
Estudios de caso y ejemplos de entrenamiento contrafactual
Introducción a los conceptos de seguridad en IA
Papel de los contrafactuales en la mejora de la fiabilidad del modelo
Consideraciones éticas y desafíos
Metodologías de simulación
Herramientas y software para la simulación contrafactual
Mejores prácticas y errores comunes
Análisis de implementaciones exitosas de entrenamiento contrafactual
Métricas evaluativas y evaluación de impacto
Tendencias emergentes en la investigación de IA contrafactual
Potencial de innovación en mecanismos de seguridad
Discusión de preguntas de investigación abiertas
Sesión práctica con orientación experta
Desarrollo de una simulación contrafactual simple
Ejercicios colaborativos de resolución de problemas
Resumen de conceptos clave
Comentarios y discusión de los participantes
Rutas de aprendizaje futuras y recursos
Asignaturas
Ciencias de la Computación