Qué necesitas saber antes de
comenzar

Inicio 5 July 2026 08:34

Fin 5 July 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Construyendo agentes de IA multimodales

Domina la orquestación de agentes de IA multimodal utilizando ChatGPT, Claude, Gemini y Manus AI para automatizar flujos de trabajo empresariales, generar activos visuales y construir sistemas de contenido con múltiples agentes escalables.
via Coursera

2961 Cursos


6 weeks, 1 hour a week

Actualización opcional disponible

Principiante

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

By completing this comprehensive course on building multimodal AI agents, you will master the exact orchestration techniques used by top operations architects to automate enterprise-grade digital production factories. You will learn to eliminate context fragmentation, engineer automated brand style guardians, stabilize multi-frame video consistency, and deploy persistent autonomous project workspaces.

This course bridges the gap between basic prompting and scalable systems engineering, giving you the direct operational frameworks required to transform raw enterprise briefs into high-value visual assets on autopilot. What makes this course unique is its hands-on architectural approach to the leading foundational environments.

Instead of treating artificial intelligence as a simple conversational chatbot, you will learn to manage ChatGPT, Claude, Gemini, and Manus AI as an elite, coordinated workforce with a shared cognitive memory layer. You will build and configure advanced Multi-Agent systems, program custom configurations via specialized dashboards, and deploy autonomous operators to execute complex web and file-compilation loops.

Whether you are a software engineer optimizing token efficiency or a project manager scaling a go-to-market workflow, this course delivers a structured treasure trove of practical, non-conversational prompt frameworks that will change how you build with AI and scale your career.

Programa

  • Introducción a los Agentes de IA Multimodal
  • Descubra cómo los agentes de IA multimodal evolucionan desde simples instrucciones hasta sistemas autónomos que manejan texto, imágenes y audio sin problemas.
  • Agentes de Generación Visual e Imagen
  • Aprenda cómo configurar agentes que analizan automáticamente entradas visuales y generan imágenes personalizadas de alta calidad.
  • Agentes de Presentación y Documentación Automatizados
  • Domine el uso de agentes que transforman ideas crudas y datos desordenados en presentaciones y reportes profesionales y visualmente impresionantes.
  • Agentes de Creación de Video y Contenido
  • Explore cómo los agentes pueden tomar un solo concepto y de manera autónoma redactar, crear storyboards y generar contenido de video.
  • Orquestación de Equipos de Contenido Multi-Agentes
  • Conecte agentes de texto, imagen, presentación y video en un equipo de creación de contenido AI unificado y colaborativo.
  • El Futuro de la IA y Cierre del Curso
  • Analice las tendencias futuras, los impactos en el mundo real y las consideraciones éticas del uso generalizado de IA multimodal autónoma.

Impartido por

Anton Voroniuk


Materias

Artificial Intelligence