Qué necesitas saber antes de
comenzar

Inicio 14 July 2026 12:09

Fin 14 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Registrarse

El lado oscuro de la IA: el jailbreaking, las inyecciones, las alucinaciones y más

Explore las vulnerabilidades de la IA mediante ejercicios prácticos de elusión de sistemas, inyecciones de instrucciones y pruebas de sesgo con modelos reales como ChatGPT para comprender los riesgos de seguridad y los métodos de prevención.

via Zero To Mastery

3 hours

Actualización opcional disponible

Intermedio

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

Step over to the dark side and learn about the vulnerabilities, exploits, and unintended consequences that AI models like LLMs suffer from, with hands-on prompting and exercises.What jailbreaking models involves and how to do it yourselfUnderstanding vulnerabilities inherent to models, including prompt and data leakageThe risks of exposing LLMs to proprietary or sensitive dataExploring the toxicity and bias inherently built into different modelsReal-world tests using ChatGPT, DeepSeek and other modelsExperiment with steering an LLM's neurons to prevent hallucinations

Programa

Introducción

Bienvenido al lado oscuro (Introducción a las directrices y el jailbreak)

Ejercicio: Conoce a tus compañeros y al instructor

Recursos del curso

El lado oscuro de la IA

¡Jailbreak! (El aviso DAN)

Ejercicio: Crea tu propio jailbreak

Jailbreaking con múltiples ejemplos

Inyecciones de indicaciones - Parte 1

Inyecciones de indicaciones - Parte 2

Pensando como LLMs - Inyección multimodal

Filtraciones - Parte 1 (Filtración de indicaciones)

Filtraciones - Parte 2 (Filtración de datos)

Exposición

Envenenamiento

Toxicidad

Alucinaciones

Pensando como LLMs - Grande vs Pequeño

Desafío: Realiza tu propia investigación sobre interpretabilidad mecanicista en alucinaciones

Instrucciones del desafío

Tabla de líderes: Interpretabilidad Mecanística

La ficha del modelo

Profundización en las fichas de modelo

Ejercicio: Explora la ficha del modelo para GPT-o3-mini y aprende algo nuevo

¿A dónde ir desde aquí?

¡Sigamos aprendiendo juntos!

¡Revisa este Byte!

Impartido por

Scott Kerr

Materias

Computer Science

Qué necesitas saber antes de comenzar

El lado oscuro de la IA: el jailbreaking, las inyecciones, las alucinaciones y más

3 hours

Intermedio

Paid Course

Resumen

Programa

Impartido por

Materias

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Preparación de Datos y Aprendizaje Automático Aplicado

Construyendo un Asistente de Cocina con IA usando Django

Ingeniería de características y almacenes de características para IA y ML

Qué necesitas saber antes de
comenzar