Qué necesitas saber antes de
comenzar

Inicio 28 July 2026 02:00

Fin 28 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Registrarse

Construyendo agentes de IA multimodales

Domina la orquestación de agentes de IA multimodal utilizando ChatGPT, Claude, Gemini y Manus AI para automatizar flujos de trabajo empresariales, generar activos visuales y construir sistemas de contenido con múltiples agentes escalables.

via Coursera

6 weeks, 1 hour a week

Actualización opcional disponible

Principiante

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

By completing this comprehensive course on building multimodal AI agents, you will master the exact orchestration techniques used by top operations architects to automate enterprise-grade digital production factories. You will learn to eliminate context fragmentation, engineer automated brand style guardians, stabilize multi-frame video consistency, and deploy persistent autonomous project workspaces.

This course bridges the gap between basic prompting and scalable systems engineering, giving you the direct operational frameworks required to transform raw enterprise briefs into high-value visual assets on autopilot. What makes this course unique is its hands-on architectural approach to the leading foundational environments.

Instead of treating artificial intelligence as a simple conversational chatbot, you will learn to manage ChatGPT, Claude, Gemini, and Manus AI as an elite, coordinated workforce with a shared cognitive memory layer. You will build and configure advanced Multi-Agent systems, program custom configurations via specialized dashboards, and deploy autonomous operators to execute complex web and file-compilation loops.

Whether you are a software engineer optimizing token efficiency or a project manager scaling a go-to-market workflow, this course delivers a structured treasure trove of practical, non-conversational prompt frameworks that will change how you build with AI and scale your career.

Programa

Introducción a los Agentes de IA Multimodal

Descubra cómo los agentes de IA multimodal evolucionan desde simples instrucciones hasta sistemas autónomos que manejan texto, imágenes y audio sin problemas.

Agentes de Generación Visual e Imagen

Aprenda cómo configurar agentes que analizan automáticamente entradas visuales y generan imágenes personalizadas de alta calidad.

Agentes de Presentación y Documentación Automatizados

Domine el uso de agentes que transforman ideas crudas y datos desordenados en presentaciones y reportes profesionales y visualmente impresionantes.

Agentes de Creación de Video y Contenido

Explore cómo los agentes pueden tomar un solo concepto y de manera autónoma redactar, crear storyboards y generar contenido de video.

Orquestación de Equipos de Contenido Multi-Agentes

Conecte agentes de texto, imagen, presentación y video en un equipo de creación de contenido AI unificado y colaborativo.

El Futuro de la IA y Cierre del Curso

Analice las tendencias futuras, los impactos en el mundo real y las consideraciones éticas del uso generalizado de IA multimodal autónoma.

Impartido por

Anton Voroniuk

Materias

Artificial Intelligence

Qué necesitas saber antes de comenzar

Construyendo agentes de IA multimodales

6 weeks, 1 hour a week

Principiante

Paid Course

Resumen

Programa

Impartido por

Materias

IA para Automatización y Modelado de FP&A

FP&A con IA: Proyecto de Fin de Carrera

Interpretabilidad de los LLM - Generación de Descripciones de Características de SAE - Primavera 2026

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Qué necesitas saber antes de
comenzar