What You Need to Know Before
You Start

Starts 7 June 2025 22:31

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Código Abierto y el Data Lakehouse - Entendiendo Componentes y Tecnologías

Descubra cómo los data lakehouses combinan rendimiento y asequibilidad, explorando Apache Arrow, Iceberg y Project Nessie como alternativas a los almacenes de datos tradicionales.
OSACon via YouTube

OSACon

2544 Cursos


26 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Descubra cómo los data lakehouses combinan rendimiento y asequibilidad, explorando Apache Arrow, Iceberg y Project Nessie como alternativas a los almacenes de datos tradicionales.

Programa de estudio

  • Introducción a los Data Lakehouses
  • Definición y características clave
    Comparación con los almacenes de datos y los lagos de datos
    Beneficios y limitaciones de los data lakehouses
  • Componentes Principales de los Data Lakehouses
  • Separación de almacenamiento y cómputo
    Gestión de metadatos
    Motores de consulta y optimización
  • Apache Arrow
  • Resumen de Apache Arrow
    Formato columnar en memoria
    Beneficios de rendimiento para data lakehouses
    Integración con otras tecnologías de datos
  • Apache Iceberg
  • Introducción a Apache Iceberg
    Arquitectura y características
    Ventajas sobre los formatos de tablas tradicionales
    Casos de uso y ejemplos de implementación
  • Proyecto Nessie
  • Resumen del Proyecto Nessie
    Control de versiones para data lakehouses
    Ramas, fusiones y reproducibilidad
    Ecosistema e integración
  • Comparación de Tecnologías de Data Lakehouse de Código Abierto
  • Casos de uso y comparaciones de rendimiento
    Análisis de costos y asequibilidad
    Estudios de caso de implementaciones exitosas
  • Consideraciones Prácticas y Mejores Prácticas
  • Gobernanza de datos y seguridad
    Estrategias de optimización de rendimiento
    Selección de los componentes adecuados para necesidades específicas
  • Tendencias Futuras y Desarrollos en Data Lakehouses
  • Tecnologías emergentes e innovaciones
    Adopción y evolución en la industria
    Especulaciones sobre futuras direcciones en la gestión de datos
  • Revisión del Curso y Reflexiones Finales
  • Resumen de conceptos y tecnologías clave
    Discusión sobre el impacto de los data lakehouses en la industria
    Preguntas, respuestas y discusiones interactivas

Asignaturas

Negocios