Resumen
En este curso, aprenderás a construir soluciones de análisis de datos en streaming utilizando servicios de AWS, incluidos Amazon Kinesis, Amazon Data Firehose y Amazon Managed Streaming for Apache Kafka (Amazon MSK). Kinesis es un servicio de transmisión de datos en tiempo real masivamente escalable y duradero. Amazon MSK ofrece un servicio de Apache Kafka seguro, completamente gestionado y altamente disponible.
Aprenderás cómo Kinesis y Amazon MSK se integran con servicios de AWS como AWS Glue y AWS Lambda. El curso aborda los componentes de la ingesta de datos en streaming, el almacenamiento en streaming y el procesamiento de streaming de la pipeline de análisis de datos. También aprenderás a aplicar las mejores prácticas de seguridad, rendimiento y gestión de costos en la operación de Kinesis y Amazon MSK.
El curso está dividido en diferentes módulos. Los módulos de aprendizaje introducen nuevos conceptos y los servicios de AWS que puedes utilizar para construir tu solución. Los módulos de laboratorio son actividades prácticas en profundidad con instrucciones paso a paso para que apliques lo que has aprendido.
Actividades
Contenido interactivo, videos, comprobaciones de conocimiento, evaluaciones y laboratorios prácticos
Objetivos del curso
- Reconocer un desafío de un cliente de análisis y describir la solución adecuada de AWS para resolverlo utilizando una arquitectura de datos en streaming.
- Describir fuentes de datos adecuadas para aplicaciones de streaming y cómo se ingieren esos datos.
- Identificar servicios de almacenamiento a corto y largo plazo para datos en streaming.
- Describir cómo diseñar e implementar soluciones de procesamiento de datos en tiempo real.
- Reconocer cómo servir datos en streaming para el consumo por parte de los usuarios finales.
- Describir cómo optimizar una pipeline de datos en streaming utilizando Amazon Kinesis, Amazon MSK y Amazon Redshift.
- Identificar mejores prácticas para asegurar una pipeline de datos en streaming.
Público objetivo
- Ingeniero de datos
- Analista de datos
- Arquitecto de datos
- Ingeniero de inteligencia empresarial
Habilidades recomendadas
- 2-3 años de experiencia en ingeniería de datos
- 1-2 años de experiencia práctica con servicios de AWS
- Haber completado AWS Cloud Practitioner Essentials o equivalente
- Haber completado Fundamentos de Análisis en AWS Parte 1 y 2
- Haber completado Ingeniería de Datos en AWS - Fundamentos
Guía del curso
Módulo 1: Construyendo una Solución de Pipeline de Datos en Streaming
Este curso muestra cómo identificar, seleccionar y configurar los servicios adecuados de AWS para construir una solución de pipeline de datos en streaming que cumpla con los objetivos empresariales de un cliente ficticio.
- Introducción
- Ingesta de Datos desde Fuentes de Streaming
- Almacenamiento de Datos en Streaming
- Procesamiento de Datos
- Análisis de Datos
- Evaluación Final
- Conclusión
Módulo 2: Análisis de Streaming con Amazon Managed Service para Apache Flink (Laboratorio)
Este laboratorio es una actividad práctica paso a paso para construir una pipeline de procesamiento de streaming mediante la ingesta de datos de clickstream y el enriquecimiento de los datos de clickstream con datos de catálogo almacenados en Amazon Simple Storage Service (Amazon S3). Realizarás análisis en los datos enriquecidos para identificar las ventas por categoría en tiempo real y visualizar la salida.
- Descripción general del laboratorio
- Tarea 1: Configuración del entorno del cuaderno
Programa de estudio
Enseñado por
Etiquetas