Lo que necesitas saber antes de
que comiences

Comienza 1 July 2025 12:22

Termina 1 July 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Código Abierto y el Data Lakehouse - Entendiendo Componentes y Tecnologías

Acompáñanos en un viaje para comprender el poder transformador de los data lakehouses, donde la tecnología de vanguardia se encuentra con la eficiencia económica. Sumérgete en el mundo de Apache Arrow, Iceberg y Project Nessie y descubre cómo sirven como alternativas revolucionarias a los almacenes de datos tradicionales. Esta exploración of.
OSACon via YouTube

OSACon

2765 Cursos


26 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Acompáñanos en un viaje para comprender el poder transformador de los data lakehouses, donde la tecnología de vanguardia se encuentra con la eficiencia económica. Sumérgete en el mundo de Apache Arrow, Iceberg y Project Nessie y descubre cómo sirven como alternativas revolucionarias a los almacenes de datos tradicionales.

Esta exploración ofrece ideas sobre cómo estos componentes de código abierto maximizan tanto el rendimiento como la asequibilidad, allanando el camino para avances en el manejo y almacenamiento de datos.

Programa de estudio

  • Introducción a los Data Lakehouses
  • Definición y características clave
    Comparación con los almacenes de datos y los lagos de datos
    Beneficios y limitaciones de los data lakehouses
  • Componentes Principales de los Data Lakehouses
  • Separación de almacenamiento y cómputo
    Gestión de metadatos
    Motores de consulta y optimización
  • Apache Arrow
  • Resumen de Apache Arrow
    Formato columnar en memoria
    Beneficios de rendimiento para data lakehouses
    Integración con otras tecnologías de datos
  • Apache Iceberg
  • Introducción a Apache Iceberg
    Arquitectura y características
    Ventajas sobre los formatos de tablas tradicionales
    Casos de uso y ejemplos de implementación
  • Proyecto Nessie
  • Resumen del Proyecto Nessie
    Control de versiones para data lakehouses
    Ramas, fusiones y reproducibilidad
    Ecosistema e integración
  • Comparación de Tecnologías de Data Lakehouse de Código Abierto
  • Casos de uso y comparaciones de rendimiento
    Análisis de costos y asequibilidad
    Estudios de caso de implementaciones exitosas
  • Consideraciones Prácticas y Mejores Prácticas
  • Gobernanza de datos y seguridad
    Estrategias de optimización de rendimiento
    Selección de los componentes adecuados para necesidades específicas
  • Tendencias Futuras y Desarrollos en Data Lakehouses
  • Tecnologías emergentes e innovaciones
    Adopción y evolución en la industria
    Especulaciones sobre futuras direcciones en la gestión de datos
  • Revisión del Curso y Reflexiones Finales
  • Resumen de conceptos y tecnologías clave
    Discusión sobre el impacto de los data lakehouses en la industria
    Preguntas, respuestas y discusiones interactivas

Asignaturas

Negocios