Learn how Computer Vision models work, including Vision Transformers and Meta’s SAM, and how they power real-world image systems. Then put your knowledge into practice by deploying a scalable computer vision pipeline on AWS using production-ready tools and infrastructure.Understand how Vision Transformers process imagesBreak down attention math without the hand-wavingUse Meta’s SAM for prompt-based segmentationVisualize and evaluate segmentation outputsConnect detection models with segmentation pipelinesBuild scalable computer vision workflows in PythonDeploy vision systems on AWS infrastructureDesign production-ready AI pipelines for real products
- Introducción
Introducción
Qué Estamos Construyendo
Ejercicio: Conoce a Tus Compañeros de Clase y al Instructor
Recursos del Curso
ZTM Plugin + Comprensión de Tu Reproductor de Video
Establece Tu Meta de Racha de Aprendizaje
- Matemáticas detrás de Vision Transformers
Vision Transformers vs Redes Neuronales Convolucionales
Operaciones Cuadráticas
Introducción a ViTs y Entrenamiento Conjunto con Embeddings
Comprensión de Mecanismos de Atención, Resumen Breve
Comprensión del Pipeline Completo de ViT
Divirtámonos (+ Más Recursos)
- Matemáticas Detrás de SAM de Meta (Segment Anything Model)
Introducción a Codificadores de Prompts para SAM
Modo AutoPrompt de SAM
Modo de Clic Manual de SAM
Embeddings de ViT dentro de SAM
Cálculo de la Puntuación de Atención para Vision Transformers en SAM
Cómo se Entrena SAM
Cálculo de la Auto Atención de Prompts para SAM
Atención Cruzada de Imagen a Prompt
Atención Cruzada de Prompt a Imagen
(Opcional) Finalización del Ejemplo de SAM Parte 1
(Opcional) Finalización del Ejemplo de SAM Parte 2
Finalización
Actualizaciones Ilimitadas
- Configurando Nuestro Entorno AWS
Creando Nuestro Dominio SagemakerAI
Iniciando el Dominio y Comprendiendo los Precios
Instalando Bibliotecas
Deteniendo Instancias y Servidores
Chequeo del Curso
- Configurando Modelos de Código Abierto como el SAM de Meta
Descargando el Modelo SAM de Meta
Actualizando Permisos IAM
Importando Bibliotecas
Comprensión de cómo usamos Rekognition con SAM
Definiendo Funciones Auxiliares
Aclaración Sobre Funciones Auxiliares
Detección y Filtrado de Rekognition
Inicializar Modelo SAM desde S3
Función Principal de Procesamiento Parte 1
Función Principal de Procesamiento Parte 2
Ejecutando la Celda Principal de Procesamiento
Implementar un Nuevo Sistema de Vida
- Visualizando nuestros Resultados
Visualizando Detecciones de Rekognition
Visualizar Todas las Máscaras de SAM
Visualizando Puntuaciones IOU de Calidad de Coincidencia Parte 1
Visualizando Puntuaciones IOU de Calidad de Coincidencia Parte 2
Visualizando Segmentaciones de Imágenes con Cajas Delimitadoras
Visualizando Máscaras y Etiquetas Sin Cajas Delimitadoras
Visualizando Segmentaciones en Máscaras en Blanco y Negro
Ejercicio: Síndrome del Impostor
- Guardando Resultados en S3
Guardando Metadatos en S3
Guardar Imágenes en S3
Guardando Máscaras Individuales en S3
- Pruebas + Configuración
Agregando un Servidor GPU a Nuestro Cuaderno y Cuotas de AWS
Probando Nuestro Pipeline Completo
Correcciones Menores
Producción + Limpieza
- ¿Hacia Dónde Ir Desde Aquí?
¡Gracias!
Revisa Este Curso
Conviértete en un Alumno
Guía de Aprendizaje
Eventos ZTM Todos los Meses
Avales en LinkedIn