Resumen
Master modern computer vision through a practical, PyTorch‑first path. In this course you will build, train, and evaluate deep neural networks to solve real‑world image problems.
You’ll begin with the end‑to‑end ML workflow and a simple multilayer perceptron (MLP), then learn the core building blocks of convolutional neural networks (CNNs):
convolution, pooling, feature maps, and activation functions. From there, you’ll implement and fine‑tune state‑of‑the‑art architectures such as VGG and ResNet, and practice best‑practice model evaluation.
You will then tackle object detection and localization with YOLO, SSD, and Faster R‑CNN, and progress to image segmentation with U‑Net and Mask R‑CNN. Along the way you’ll use PyTorch to perform data augmentation, hyperparameter tuning, and non‑maximum suppression while balancing accuracy, speed, and deployment constraints.
Designed for learners with basic Python and NumPy, this course is ideal for aspiring machine‑learning engineers, data scientists, and developers who want industry‑ready experience with CNNs, transfer learning, object detection, and image segmentation. Build a portfolio‑quality project and gain in‑demand skills for AI‑powered products.
Expect clear code templates and real datasets for practice and reproducible workflows.
Programa
- Módulo 1: Introducción a la IA, Aprendizaje Automático, Visión por Computadora y PyTorch
Este módulo introduce a los estudiantes en la Inteligencia Artificial (IA) y el Aprendizaje Automático con una visión general completa de los conceptos fundamentales, teorías y aplicaciones de la IA y el aprendizaje automático. A través de una combinación de conferencias teóricas, ejercicios prácticos y ejemplos del mundo real, los estudiantes adquirirán una comprensión básica de la IA y su subcampo, el aprendizaje automático.
- Módulo 2: Flujo de Trabajo y Perceptrón Multicapa (MLP) en Fundamentos de Aprendizaje Automático
Este módulo introduce a los estudiantes al Perceptrón Multicapa (MLP) y a los Modelos de Red Neuronal Convolucional (CNN) con un entendimiento comprensivo de la arquitectura, entrenamiento y aplicaciones de los MLPs y CNNs en el campo de la IA y el aprendizaje automático. A través de conferencias teóricas, ejercicios prácticos e implementación práctica, los estudiantes obtendrán el conocimiento y habilidades necesarios para diseñar, entrenar y utilizar modelos MLP y CNN para diversas tareas.
- Módulo 3: Fundamentos de Redes Neuronales Convolucionales (CNNs)
Este módulo introduce a los estudiantes en temas/técnicas avanzadas en Redes Neuronales Convolucionales (CNN) con un entendimiento profundo de técnicas y aplicaciones avanzadas en el campo de las CNNs. Enfocándose en temas como el aprendizaje por transferencia, la visualización de capas y los modelos generativos, los estudiantes adquirirán el conocimiento y habilidades para aprovechar el poder de las CNNs en tareas complejas de análisis de imágenes.
- Módulo 4: Arquitecturas Avanzadas de CNN
Este módulo sobre Detección de Objetos y Segmentación Semántica utilizando Aprendizaje Profundo proporcionará a los estudiantes una comprensión completa de técnicas avanzadas para detectar objetos y realizar segmentación a nivel de píxeles en imágenes y videos. A través de una combinación de conferencias teóricas, ejercicios prácticos y proyectos prácticos, los estudiantes obtendrán el conocimiento y habilidades necesarias para abordar de manera efectiva tareas complejas de visión por computación utilizando métodos de aprendizaje profundo.
- Módulo 5: Detección y Localización de Objetos
Este módulo sobre Aprendizaje Profundo para Visión por Computadora con PyTorch proporciona a los estudiantes una comprensión completa del uso del framework PyTorch para resolver diversas tareas de visión por computadora. Mediante una combinación de ejercicios prácticos y proyectos prácticos, los estudiantes adquirirán el conocimiento y habilidades necesarias para abordar de manera efectiva tareas de clasificación, modelado generativo, detección de objetos y segmentación de imágenes utilizando técnicas de aprendizaje profundo.
- Módulo 6: Segmentación de Imágenes
Este módulo sobre Segmentación de Imágenes proporciona a los estudiantes una comprensión completa de técnicas avanzadas para segmentar y analizar imágenes utilizando métodos de aprendizaje profundo. Los estudiantes obtendrán el conocimiento y habilidades necesarias para construir, entrenar y evaluar modelos de segmentación de imágenes para una variedad de aplicaciones de visión por computadora.
- Proyecto Final: Aplicación del Mundo Real con PyTorch
Este módulo sirve como una experiencia culminante en la que los estudiantes aplicarán conceptos y técnicas de todo el curso en un contexto práctico de visión por computadora. A través de trabajo basado en proyectos y resolución de problemas prácticos, los estudiantes desarrollarán aún más su comprensión del aprendizaje profundo con PyTorch, al mismo tiempo que demuestran su capacidad para abordar tareas de visión por computadora del mundo real.
Impartido por
Aamna Mohammed Al Shehhi
Materias
Computer Science