Ce que vous devez savoir avant
Vous commencez

Débute 6 June 2026 10:14

Se termine 6 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Open Source et le Data Lakehouse - Comprendre les Composants et les Technologies

Rejoignez-nous dans un voyage pour comprendre le pouvoir transformateur des data lakehouses, où la technologie de pointe rencontre l'efficacité économique. Plongez dans le monde d'Apache Arrow, Iceberg et Project Nessie, et découvrez comment ils fonctionnent comme des alternatives révolutionnaires aux entrepôts de données traditionnels. Cett.
OSACon via YouTube

OSACon

6076 Cours


26 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join us on a journey to understand the transformative power of data lakehouses, where cutting-edge technology meets economic efficiency. Delve into the world of Apache Arrow, Iceberg, and Project Nessie, and discover how they serve as revolutionary alternatives to traditional data warehouses.

This exploration offers insights into how these open-source components maximize both performance and affordability, paving the way for advancements in data handling and storage.

Programme

  • Introduction aux Data Lakehouses
  • Définition et caractéristiques clés
    Comparaison avec les entrepôts de données et les data lakes
    Avantages et limitations des data lakehouses
  • Composants Principaux des Data Lakehouses
  • Séparation du stockage et du calcul
    Gestion des métadonnées
    Moteurs de requêtes et optimisation
  • Apache Arrow
  • Aperçu d'Apache Arrow
    Format colonne en mémoire
    Avantages en termes de performance pour les data lakehouses
    Intégration avec d'autres technologies de données
  • Apache Iceberg
  • Introduction à Apache Iceberg
    Architecture et fonctionnalités
    Avantages par rapport aux formats de table traditionnels
    Cas d'utilisation et exemples de mise en œuvre
  • Projet Nessie
  • Aperçu du Projet Nessie
    Contrôle de version pour les data lakehouses
    Bifurcations, fusions et reproductibilité
    Écosystème et intégration
  • Comparaison des Technologies Open Source de Data Lakehouse
  • Cas d'utilisation et comparaisons de performance
    Analyse des coûts et de l'accessibilité
    Études de cas de déploiements réussis
  • Considérations Pratiques et Meilleures Pratiques
  • Gouvernance des données et sécurité
    Stratégies d'optimisation de la performance
    Choisir les bons composants pour des besoins spécifiques
  • Tendances et Développements Futurs des Data Lakehouses
  • Technologies émergentes et innovations
    Adoption et évolution dans l'industrie
    Spéculations sur les directions futures en gestion des données
  • Revue du Cours et Réflexions Finales
  • Récapitulatif des concepts et technologies clés
    Discussion sur l'impact des data lakehouses dans l'industrie
    Q&R et discussions interactives

Matières

Business