Qué necesitas saber antes de
comenzar

Inicio 24 July 2026 16:45

Fin 24 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Garantías de Seguridad Probabilística Usando los Internos del Modelo

Únete a nosotros para una exploración perspicaz de las garantías de seguridad probabilística para modelos de lenguaje. Dirigida por Jacob Hilton del Centro de Investigación de Alineación, esta sesión se centra en el análisis crítico de los internos del modelo. Ideal para entusiastas y profesionales en inteligencia artificial y ciencias de la.

Simons Institute via YouTube

46 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us for an insightful exploration of probabilistic safety guarantees for language models. Led by Jacob Hilton from the Alignment Research Center, this session focuses on the critical analysis of model internals.

Ideal for enthusiasts and professionals in artificial intelligence and computer science, this YouTube event offers cutting-edge insights into enhancing model safety and reliability.

Programa

Introducción a la Seguridad Probabilística

Panorama de la Seguridad en Sistemas de IA

Comprensión de las Garantías Probabilísticas

Fundamentos de los Internos del Modelo

Arquitectura de Modelos de Lenguaje

Componentes Clave y Sus Funciones

Análisis de Internos del Modelo

Técnicas para la Inspección Interna

Herramientas y Software para el Análisis

Métodos Probabilísticos en la Seguridad de IA

Fundamentos de la Teoría de Probabilidad

Aplicación de Métodos Probabilísticos en IA

Desarrollo de Garantías de Seguridad

Criterios de Seguridad en Modelos de Lenguaje

Construcción de Garantías de Seguridad usando Enfoques Probabilísticos

Estudios de Caso y Ejemplos Prácticos

Revisión de Investigaciones y Hallazgos Anteriores

Análisis de Escenarios Reales de Modelos de Lenguaje

Implementación de Marcos de Seguridad

Diseño de Mecanismos de Seguridad Basados en Internos

Prueba y Validación de Medidas de Seguridad

Evaluación de la Seguridad en Modelos de Lenguaje

Métricas para Asegurar la Seguridad

Estrategias de Evaluación y Mejora Continua

Herramientas y Recursos

Bibliotecas de Software para el Análisis de Modelos

Conjuntos de Datos para Pruebas de Protocolos de Seguridad

Conferencia por Jacob Hilton

Perspectivas del Centro de Investigación de Alineación

Sesión de Preguntas y Respuestas sobre Temas Avanzados de Seguridad

Conclusión y Futuras Direcciones

Resumen de Aprendizajes Clave

Desafíos Futuros y Oportunidades en la Seguridad de la IA

Proyecto Final

Aplicación de los Conceptos del Curso

Desarrollo de un Marco de Seguridad Probabilística para un Modelo de Lenguaje

Materias

Computer Science

Qué necesitas saber antes de comenzar

Garantías de Seguridad Probabilística Usando los Internos del Modelo

46 minutes

Not Specified

Free Video

Resumen

Programa

Materias

IA para Automatización y Modelado de FP&A

FP&A con IA: Proyecto de Fin de Carrera

Interpretabilidad de los LLM - Generación de Descripciones de Características de SAE - Primavera 2026

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Qué necesitas saber antes de
comenzar