Qué necesitas saber antes de
comenzar

Inicio 5 June 2026 11:40

Fin 5 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Aprendizaje Profundo para IA Parte 1

Domina los fundamentos del aprendizaje profundo, desde redes neuronales y CNNs hasta RNNs, VAEs, GANs y Transformadores, con implementación práctica en TensorFlow/Keras y PyTorch.
Northeastern University via Coursera

Northeastern University

27 Cursos


Northeastern es una universidad de investigación de renombre mundial con campus en Boston y alrededor del mundo. Ofrece un modelo de aprendizaje experiencial que anima a los estudiantes a aprender a través de la experiencia del mundo real.

7 weeks, 3 hours a week

Actualización opcional disponible

Intermedio

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

This is Part 1 of a two-part graduate sequence in deep learning. It establishes the foundations of modern deep learning and the core neural architectures behind today's AI systems.

You will build from how neural networks learn—through forward propagation and backpropagation—to convolutional networks for computer vision, recurrent networks for sequence data, and the first generative architectures:

variational autoencoders, generative adversarial networks, and Transformers. The course emphasizes both conceptual understanding and hands-on implementation in TensorFlow/Keras and PyTorch.

Part 2 continues with advanced generative modeling.

Programa

  • Resumen de Redes Neuronales y Aprendizaje Profundo
  • El aprendizaje profundo ha transformado la inteligencia artificial al permitir que los modelos aprendan representaciones jerárquicas directamente a partir de datos sin procesar, superando dramáticamente los enfoques tradicionales diseñados a mano en los dominios de visión, lenguaje y ciencia. Construirás el vocabulario conceptual y práctico del que depende todo el curso: cómo se construyen las redes neuronales, cómo avanza el entrenamiento mediante pases hacia adelante y hacia atrás, y por qué el aprendizaje profundo es particularmente adecuado para datos no estructurados y de alta dimensión.
  • Redes Neuronales Convolucionales
  • Las Redes Neuronales Convolucionales son la columna vertebral arquitectónica de la visión por computadora moderna y un componente que encontrarás repetidamente a lo largo de este curso, dentro de autoencoders, GANs y U-Nets de modelos de difusión. Desarrollarás la capacidad de leer, diseñar y razonar sobre arquitecturas de CNN desde las operaciones de convolución a nivel de filtro a diseños emblemáticos como VGG y ResNet, y aprenderás cómo los modelos preentrenados pueden adaptarse a nuevas tareas mediante el aprendizaje de transferencia.
  • Introducción a la Visión por Computadora
  • La visión por computadora es el campo que permite a las máquinas percibir e interpretar información visual, el dominio donde el aprendizaje profundo logró por primera vez un rendimiento superhumano. Examinarás sus tareas fundamentales, desde la clasificación de imágenes y la detección de objetos hasta la segmentación semántica, y luego trabajarás a través de toda la línea de detección desde la familia R-CNN hasta YOLOv8, ganando suficiente profundidad arquitectónica para entender cómo estos sistemas se extienden y ajustan para nuevos dominios.
  • Redes Neuronales Recurrentes
  • Los modelos que estudiaron en módulos anteriores tratan las entradas como estructuras dispuestas espacialmente de tamaño fijo. Muchos problemas del mundo real involucran secuencias donde el orden importa y el contexto se acumula con el tiempo: texto, habla, datos de series temporales, señales financieras. Aprenderás cómo las RNN procesan secuencias a través de un estado oculto, cómo los LSTM y GRU abordan el problema del gradiente de desaparición, y por qué estas arquitecturas, y sus modos de falla, motivaron directamente el mecanismo de atención cubierto en el módulo Transformer.
  • Autoencoders Variacionales
  • Este módulo marca el punto de inflexión del curso: el cambio de modelos discriminativos que aprenden límites de decisión a modelos generativos que aprenden a sintetizar nuevos datos. Examinarás el paisaje generativo completo: VAEs, GANs, modelos autorregresivos, flujos normalizadores, modelos de difusión y modelos basados en energía, antes de profundizar en el autoencoder y su extensión probabilística, el Autoencoder Variacional.
  • Redes Generativas Antagónicas
  • Las Redes Generativas Antagónicas adoptan un enfoque fundamentalmente diferente al modelado generativo: en lugar de maximizar un objetivo de probabilidad, dos redes entrenan en competencia. Pasarás por el conjunto completo de herramientas de GAN, desde GANs Convolucionales Profundas y técnicas de estabilización del entrenamiento hasta la distancia de Wasserstein, penalización de gradiente, generación condicional y traducción de dominio cíclicamente consistente.
  • Transformadores
  • Introducido en "Attention Is All You Need" (Vaswani et al., 2017), el Transformer es posiblemente el desarrollo arquitectónico más importante en el aprendizaje profundo desde el CNN. Derivarás el mecanismo de atención desde los principios básicos: Consulta, Clave, Valor, producto escalar escalado, atención de múltiples cabezas, ensamblarás la arquitectura completa con codificación posicional y enmascaramiento causal, y lo verás aplicado en un modelo de lenguaje estilo GPT.

Impartido por

Xuemin Jin


Materias

Computer Science