This course features Coursera Coach! A smarter way to learn with interactive, real-time conversations that help you test your knowledge, challenge assumptions, and deepen your understanding as you progress through the course.
This course is designed for developers eager to dive into OpenAI's JavaScript APIs. Throughout this course, you'll build 15 practical projects that demonstrate how to implement OpenAI technologies like GPT-3, GPT-4, DALL-E, Whisper, and more.
You will learn how to integrate these cutting-edge AI models into web applications, providing real-time data processing and user interaction. The course begins with an introduction to the OpenAI platform, helping you set up your environment, and acquire an API key.
From there, you'll dive into a variety of use cases, including text completion, code generation, sentiment analysis, and image creation using DALL-E. Each section includes hands-on coding exercises to solidify your understanding and teach you how to leverage OpenAI models effectively.
By the end of this course, you’ll have developed a portfolio of 15 projects, ranging from a book summarizer app to a real-time weather app and an audio-to-text transcription app using Whisper. You’ll gain invaluable skills in prompt engineering, API parameters, and building web applications that interact with OpenAI models in creative ways.
This course is ideal for developers and AI enthusiasts who want to learn how to integrate OpenAI APIs into real-world projects. Some JavaScript knowledge and basic web development skills are required, but the course is accessible to anyone eager to explore the potential of AI.
- Introducción - Aplicación de Compleción de Texto
En este módulo, te presentaremos el curso, cubriendo los conceptos y herramientas esenciales que utilizarás. Aprenderás cómo interactuar con la API de OpenAI, configurar tu clave API y comenzar a construir tu primer proyecto: una aplicación de compleción de texto. Esta sección sienta las bases para los proyectos más complejos que vendrán.
- Usar ChatGPT
En este módulo, profundizaremos en las diversas aplicaciones de ChatGPT y exploraremos cómo aprovechar su poder para tareas del mundo real. Desde la compleción de texto hasta casos de uso complejos como análisis de sentimiento y generación de código, adquirirás experiencia práctica aplicando las habilidades de ChatGPT. Al final de esta sección, estarás equipado para enfrentar una amplia variedad de desafíos utilizando la API de OpenAI.
- Parámetros de la API de OpenAI
En este módulo, exploraremos los parámetros críticos que gobiernan cómo la API de OpenAI genera respuestas. Aprenderás a ajustar la temperatura, los tokens y las secuencias de parada para un mejor control del output, mientras profundizas en funciones avanzadas como top P y penalizaciones para mejorar la variedad y relevancia de las respuestas. Al final, tendrás una comprensión más profunda de cómo optimizar tus interacciones con la API para diferentes casos de uso.
- Streams de OpenAI
En este módulo, profundizaremos en las capacidades de streaming de OpenAI, permitiendo la interacción en tiempo real con la API. Aprenderás a establecer una conexión de stream, escuchar eventos en tu backend y manejar el flujo dinámico de datos en tu aplicación frontend. Al final, estarás equipado para construir aplicaciones altamente interactivas y receptivas impulsadas por la API de stream de OpenAI.
- Ingeniería de Prompts
En este módulo, exploraremos el arte de la ingeniería de prompts para maximizar la efectividad de tus interacciones con ChatGPT. Aprenderás técnicas prácticas como especificar el contexto, refinar formatos de respuesta y usar enfoques basados en ejemplos para mejorar el desempeño del modelo. Al dominar estas estrategias, podrás crear prompts más precisos, relevantes y atractivos para una amplia gama de casos de uso.
- Aplicación Resumidora de Libros PDF
En este módulo, te guiaremos a través del proceso de construcción de una aplicación resumidora de libros en PDF completamente funcional. Aprenderás a crear la interfaz de la aplicación, extraer texto de los PDFs subidos y dividir el texto en fragmentos manejables para resumir. Al final, habrás desarrollado una aplicación que procesa archivos PDF grandes y genera resúmenes claros y concisos utilizando la API de OpenAI.
- API de Chat - Aplicación de Clima en Vivo
En este módulo, exploraremos la API de Chat y construiremos una aplicación de clima en vivo que interactúa con datos en tiempo real. Aprenderás a enviar tu primera solicitud a la API de Chat, comparar diferentes modelos (GPT-3 vs GPT-4) y usar llamadas a funciones para conectarte a servicios externos. Al final, podrás crear una aplicación que recupere datos meteorológicos y los presente en lenguaje natural a través de ChatGPT.
- Aplicación de Chatbot: ¡Chatea con Einstein, Bill Gates y Más!
En este módulo, te guiaremos a través de la creación de una aplicación de chatbot interactiva donde los usuarios podrán conversar con figuras históricas y contemporáneas como Einstein, Steve Jobs y Bill Gates. Aprenderás a diseñar la interfaz de usuario, gestionar estados de los mensajes y ajustar dinámicamente la conversación según la personalidad seleccionada. Al final, tendrás un chatbot que responde en personaje, proporcionando una experiencia personalizada para cada usuario.
- Embeddings - Aplicación de Similitud
En este módulo, exploraremos el concepto de embeddings y cómo se utilizan para medir la similitud entre entradas de texto. Aprenderás a crear una aplicación sencilla que genera embeddings para las entradas del usuario y calcula la similitud coseno entre ellas. Además, obtendrás una visión de los costos asociados con la generación de embeddings, proporcionando una comprensión completa de esta poderosa técnica de PLN.
- Aplicación de Recomendaciones de Libros
En este módulo, construirás una emocionante aplicación de recomendaciones de libros que sugiere libros basados en las preferencias del usuario. Empezarás descargando y convirtiendo un conjunto de datos de libros, luego calcularás embeddings para cada descripción de libro. Compararás las entradas del usuario con estos embeddings para encontrar las recomendaciones de libros más relevantes y finalmente mostrarás estas recomendaciones en una interfaz de usuario interactiva. Para agregar un toque visual, incluso mapearás tus datos de libros en un espacio 2D usando Atlas. Al final del módulo, tendrás una aplicación de recomendaciones de libros completamente funcional.
- Aplicación de Chat con PDF: Chatea con Cualquier Documento en PDF
En este módulo, te guiaremos a través de la creación de una aplicación que permite a los usuarios interactuar con cualquier documento PDF a través de una interfaz de chatbot. Aprenderás a extraer texto de los PDFs, dividir el contenido en fragmentos y calcular embeddings para coincidir las consultas del usuario con las secciones relevantes. Además, construirás el contenedor de chat y gestionarás el flujo de mensajes entre el usuario y el contenido del PDF. Al final de esta sección, tendrás una aplicación funcional que permite el acceso conversacional a documentos PDF.
- Aplicación de Texto a Imagen Usando DALL-E
En este módulo, explorarás el emocionante mundo de la generación de imágenes usando DALL-E. Aprenderás a integrar el modelo DALL-E en una aplicación para crear imágenes a partir de prompts de texto. El módulo cubrirá la visualización de las imágenes generadas en tu aplicación React, y también cómo implementar el almacenamiento de imágenes con una solicitud POST. Al final de esta sección, tendrás una aplicación de texto a imagen completamente funcional potenciada por DALL-E.
- Aplicación de Edición de Imágenes Usando DALL-E y Canvas
En este módulo, crearás una poderosa aplicación de edición de imágenes que combina las capacidades artísticas de DALL-E con la flexibilidad de una interfaz de canvas. Comenzarás construyendo la interfaz de usuario y configurando subidas de imágenes, luego avanzarás a características de dibujo y enmascaramiento dentro del canvas. Finalmente, aprenderás cómo enviar solicitudes al servidor para aplicar ediciones y guardar imágenes tanto originales como enmascaradas. Al final, tendrás una aplicación de edición de imágenes completamente funcional capaz de generar y modificar imágenes basadas en interacciones del usuario.
- Aplicación de Variaciones de Imágenes Usando DALL-E
En este módulo, aprenderás cómo crear una aplicación que tome una imagen de entrada y genere diferentes variaciones usando DALL-E. Explorarás cómo interactuar con la API de OpenAI para producir estas variaciones y mostrarlas en tu aplicación. Al final de esta sección, habrás construido una aplicación que brinda a los usuarios la capacidad de ver múltiples interpretaciones artísticas de cualquier imagen cargada.
- Aplicación de Audio a Texto Usando Whisper
En este módulo, crearás una aplicación de transcripción de audio a texto impulsada por el modelo Whisper de OpenAI. Aprenderás a construir la interfaz de usuario para la carga de archivos de audio, implementar handlers de React y configurar la funcionalidad del lado del servidor para guardar y transcribir archivos de audio. Al final de esta sección, tendrás una aplicación completamente funcional que convierte audio en texto y aprovecha las características avanzadas de Whisper para una transcripción precisa.
- Aplicación de Traducción de Audio Usando Whisper
En este módulo, desarrollarás una aplicación de traducción de audio que utiliza Whisper para convertir el lenguaje hablado de varios archivos de audio en texto en inglés. Aprenderás a manejar cargas de archivos de audio e integrar la API de Whisper para una traducción fluida. Al final de esta sección, tendrás una aplicación funcionando capaz de traducir contenido de audio a texto en tiempo real.
- Aplicación de Voz a Texto Usando Whisper
En este módulo, construirás una aplicación de voz a texto aprovechando el modelo Whisper de OpenAI para una transcripción precisa. Adaptarás el código de proyectos anteriores para crear una experiencia de transcripción fluida y eficiente. Al final de esta sección, tendrás una aplicación que transcribe el habla en tiempo real a texto, lista para ser utilizada en diversas aplicaciones.
- Aplicación de Traducción de Voz Usando Whisper
En este módulo, crearás una aplicación que traduce lenguaje hablado a texto en inglés usando Whisper. Aprenderás cómo capturar y procesar la voz, luego enviarla a Whisper para la traducción. Al final de esta sección, tendrás una aplicación completamente funcional capaz de traducir voz a inglés de manera instantánea.