Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 20:10

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Integración de Data Lakes y ClickHouse - Comprendiendo los Formatos de Tablas Abiertas y el Análisis en Tiempo Real

Acompáñenos en una sesión reveladora sobre la integración de data lakes con ClickHouse®, donde desentrañaremos las complejidades de los formatos Parquet e Iceberg. Mejore su comprensión de los análisis en tiempo real aprovechando el poder de Apache Spark y Kafka para enfrentar eficazmente los desafíos de procesamiento de datos a gran escala..
Altinity via YouTube

Altinity

6076 Cursos


1 hour 1 minute

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us for an insightful session on integrating data lakes with ClickHouse®, where we will unravel the complexities of Parquet and Iceberg formats. Enhance your understanding of real-time analytics by leveraging the power of Apache Spark and Kafka to tackle large-scale data processing challenges effectively.

This course is ideal for those looking to expand their knowledge in data integration and analytics.

Delivered via YouTube, this session falls under the categories of Artificial Intelligence Courses and Business Courses.

Programa

  • Introducción a los Lagos de Datos
  • Panorama General de Lagos de Datos vs. Almacenes de Datos
    Beneficios de los Lagos de Datos para el Análisis a Gran Escala
    Tecnologías Clave que Impulsan los Lagos de Datos
  • Panorama de ClickHouse
  • Introducción a ClickHouse y su Arquitectura
    Configuración e Instalación de ClickHouse para la Integración de Datos
    Ventajas de Usar ClickHouse para Análisis en Tiempo Real
  • Formatos de Tabla Abiertos
  • Introducción al Formato Parquet
    Estructura y Beneficios de Parquet
    Lectura y Escritura de Parquet con ClickHouse
    Introducción al Formato Apache Iceberg
    Características y Casos de Uso de Iceberg
    Integración de Iceberg con ClickHouse
  • Análisis en Tiempo Real con Apache Spark
  • Introducción a Apache Spark para el Procesamiento de Grandes Datos
    Configuración de Spark para la Integración con ClickHouse
    Transformación de Datos sobre la Marcha usando Apache Spark
  • Transmisión de Datos en Tiempo Real con Apache Kafka
  • Comprendiendo Apache Kafka y sus Componentes
    Configuración de Kafka y Mejores Prácticas para Lagos de Datos
    Transmisión de Datos a ClickHouse a través de Kafka
  • Integración de Lagos de Datos con ClickHouse
  • Estrategias para Carga Eficiente de Datos
    Optimización de Consultas para Cargas de Trabajo Mixtas
    Estudios de Caso y Ejemplos de Integración de Lagos de Datos
  • Laboratorios Prácticos
  • Configuración de un Lago de Datos con ClickHouse
    Practicando la Conversión de Formatos de Datos (Parquet, Iceberg)
    Implementación de Tuberías de Datos en Tiempo Real con Kafka y Spark
  • Conclusión y Tendencias Futuras
  • Revisión de los Aprendizajes Clave
    Exploración de Tendencias Emergentes en Lagos de Datos y Análisis en Tiempo Real
    Hoja de Ruta para Aprendizaje y Exploración Adicionales
  • Recursos y Lecturas Adicionales
  • Libros y Artículos Recomendados
    Tutoriales en Línea y Documentación
    Foros de la Comunidad y Canales de Soporte

Materias

Business