Qué necesitas saber antes de
comenzar

Inicio 6 June 2026 10:14

Fin 6 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Código Abierto y el Data Lakehouse - Entendiendo Componentes y Tecnologías

Acompáñanos en un viaje para comprender el poder transformador de los data lakehouses, donde la tecnología de vanguardia se encuentra con la eficiencia económica. Sumérgete en el mundo de Apache Arrow, Iceberg y Project Nessie y descubre cómo sirven como alternativas revolucionarias a los almacenes de datos tradicionales. Esta exploración of.
OSACon via YouTube

OSACon

6076 Cursos


26 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us on a journey to understand the transformative power of data lakehouses, where cutting-edge technology meets economic efficiency. Delve into the world of Apache Arrow, Iceberg, and Project Nessie, and discover how they serve as revolutionary alternatives to traditional data warehouses.

This exploration offers insights into how these open-source components maximize both performance and affordability, paving the way for advancements in data handling and storage.

Programa

  • Introducción a los Data Lakehouses
  • Definición y características clave
    Comparación con los almacenes de datos y los lagos de datos
    Beneficios y limitaciones de los data lakehouses
  • Componentes Principales de los Data Lakehouses
  • Separación de almacenamiento y cómputo
    Gestión de metadatos
    Motores de consulta y optimización
  • Apache Arrow
  • Resumen de Apache Arrow
    Formato columnar en memoria
    Beneficios de rendimiento para data lakehouses
    Integración con otras tecnologías de datos
  • Apache Iceberg
  • Introducción a Apache Iceberg
    Arquitectura y características
    Ventajas sobre los formatos de tablas tradicionales
    Casos de uso y ejemplos de implementación
  • Proyecto Nessie
  • Resumen del Proyecto Nessie
    Control de versiones para data lakehouses
    Ramas, fusiones y reproducibilidad
    Ecosistema e integración
  • Comparación de Tecnologías de Data Lakehouse de Código Abierto
  • Casos de uso y comparaciones de rendimiento
    Análisis de costos y asequibilidad
    Estudios de caso de implementaciones exitosas
  • Consideraciones Prácticas y Mejores Prácticas
  • Gobernanza de datos y seguridad
    Estrategias de optimización de rendimiento
    Selección de los componentes adecuados para necesidades específicas
  • Tendencias Futuras y Desarrollos en Data Lakehouses
  • Tecnologías emergentes e innovaciones
    Adopción y evolución en la industria
    Especulaciones sobre futuras direcciones en la gestión de datos
  • Revisión del Curso y Reflexiones Finales
  • Resumen de conceptos y tecnologías clave
    Discusión sobre el impacto de los data lakehouses en la industria
    Preguntas, respuestas y discusiones interactivas

Materias

Business