What You Need to Know Before
You Start
Starts 7 June 2025 18:28
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
Cómo construir un lago de datos nativo en la nube con tecnologías de código abierto
Descubra cómo implementar un lago de datos basado en Kubernetes utilizando herramientas de código abierto, desde la configuración inicial hasta ejecutar una plataforma prototipo completa en su máquina local.
Canonical Ubuntu
via YouTube
Canonical Ubuntu
2544 Cursos
30 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Descubra cómo implementar un lago de datos basado en Kubernetes utilizando herramientas de código abierto, desde la configuración inicial hasta ejecutar una plataforma prototipo completa en su máquina local.
Programa de estudio
- Introducción a los Lagos de Datos Nativos en la Nube
- Fundamentos de Kubernetes
- Tecnologías de Código Abierto para Lagos de Datos
- Capa de Almacenamiento
- Ingesta de Datos
- Procesamiento de Datos
- Acceso a Datos y Consultas
- Seguridad y Gobernanza
- Monitoreo y Registro
- Implementación y Pruebas
- Estudio de Caso y Proyectos Prácticos
- Conclusión y Tendencias Futuras
Visión general de las arquitecturas nativas en la nube
Beneficios de los lagos de datos para el almacenamiento y análisis de datos
Comprensión de la orquestación de contenedores
Configuración de un clúster local de Kubernetes (Minikube, kind o K3s)
Operaciones básicas de Kubernetes: Pods, Servicios y Despliegues
Apache Hadoop y HDFS
Apache Spark para el procesamiento de datos
Apache Kafka para la ingestión de datos en tiempo real
Configuración de sistemas de archivos distribuidos
Configuración de soluciones de almacenamiento de objetos (e.g., MinIO, Ceph)
Configuración de canalizaciones de ingesta de datos con Kafka
Exploración de herramientas ETL como Apache NiFi y Apache Airflow
Ejecutar trabajos de Spark en Kubernetes
Implementación de procesamiento por lotes y en flujo
Configuración de motores de consulta SQL (e.g., Presto, Trino)
Uso de Hive Metastore para la gestión de esquemas
Implementación de prácticas básicas de seguridad
Introducción a herramientas de gobernanza de datos (Apache Atlas)
Configuración de herramientas de monitoreo (Prometheus, Grafana)
Agregación de registros y monitoreo con el stack ELK (Elasticsearch, Logstash, Kibana)
Construcción de un prototipo de lago de datos en una máquina local
Realización de pruebas y validación de datos
Estudios de caso de arquitectura de lagos de datos en el mundo real
Proyecto final: Implementación de un lago de datos nativo en la nube usando herramientas de código abierto en Kubernetes
Tendencias emergentes en tecnologías de datos nativas en la nube
Examinar el futuro de los lagos de datos de código abierto
Asignaturas
Negocios