Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 06:12

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

El lado oscuro de la IA: el jailbreaking, las inyecciones, las alucinaciones y más

Explore las vulnerabilidades de la IA mediante ejercicios prácticos de elusión de sistemas, inyecciones de instrucciones y pruebas de sesgo con modelos reales como ChatGPT para comprender los riesgos de seguridad y los métodos de prevención.
via Zero To Mastery

29 Cursos


3 hours

Actualización opcional disponible

Intermedio

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

Step over to the dark side and learn about the vulnerabilities, exploits, and unintended consequences that AI models like LLMs suffer from, with hands-on prompting and exercises.What jailbreaking models involves and how to do it yourselfUnderstanding vulnerabilities inherent to models, including prompt and data leakageThe risks of exposing LLMs to proprietary or sensitive dataExploring the toxicity and bias inherently built into different modelsReal-world tests using ChatGPT, DeepSeek and other modelsExperiment with steering an LLM's neurons to prevent hallucinations

Programa

  •   Introducción
  • Bienvenido al lado oscuro (Introducción a las directrices y el jailbreak)
    Ejercicio: Conoce a tus compañeros y al instructor
    Recursos del curso
  •   El lado oscuro de la IA
  • ¡Jailbreak! (El aviso DAN)
    Ejercicio: Crea tu propio jailbreak
    Jailbreaking con múltiples ejemplos
    Inyecciones de indicaciones - Parte 1
    Inyecciones de indicaciones - Parte 2
    Pensando como LLMs - Inyección multimodal
    Filtraciones - Parte 1 (Filtración de indicaciones)
    Filtraciones - Parte 2 (Filtración de datos)
    Exposición
    Envenenamiento
    Toxicidad
    Alucinaciones
    Pensando como LLMs - Grande vs Pequeño
    Desafío: Realiza tu propia investigación sobre interpretabilidad mecanicista en alucinaciones
    Instrucciones del desafío
    Tabla de líderes: Interpretabilidad Mecanística
    La ficha del modelo
    Profundización en las fichas de modelo
    Ejercicio: Explora la ficha del modelo para GPT-o3-mini y aprende algo nuevo
  •   ¿A dónde ir desde aquí?
  • ¡Sigamos aprendiendo juntos!
    ¡Revisa este Byte!

Impartido por

Scott Kerr


Materias

Computer Science