Ce que vous devez savoir avant
de commencer

Débute 1 July 2025 05:58

Se termine 1 July 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Open Source et le Data Lakehouse - Comprendre les Composants et les Technologies

Rejoignez-nous dans un voyage pour comprendre le pouvoir transformateur des data lakehouses, où la technologie de pointe rencontre l'efficacité économique. Plongez dans le monde d'Apache Arrow, Iceberg et Project Nessie, et découvrez comment ils fonctionnent comme des alternatives révolutionnaires aux entrepôts de données traditionnels. Cett.
OSACon via YouTube

OSACon

2765 Cours


26 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Rejoignez-nous dans un voyage pour comprendre le pouvoir transformateur des data lakehouses, où la technologie de pointe rencontre l'efficacité économique. Plongez dans le monde d'Apache Arrow, Iceberg et Project Nessie, et découvrez comment ils fonctionnent comme des alternatives révolutionnaires aux entrepôts de données traditionnels.

Cette exploration offre des perspectives sur la manière dont ces composants open-source optimisent à la fois la performance et l'abordabilité, ouvrant la voie à des avancées dans la gestion et le stockage des données.

Programme

  • Introduction aux Data Lakehouses
  • Définition et caractéristiques clés
    Comparaison avec les entrepôts de données et les data lakes
    Avantages et limitations des data lakehouses
  • Composants Principaux des Data Lakehouses
  • Séparation du stockage et du calcul
    Gestion des métadonnées
    Moteurs de requêtes et optimisation
  • Apache Arrow
  • Aperçu d'Apache Arrow
    Format colonne en mémoire
    Avantages en termes de performance pour les data lakehouses
    Intégration avec d'autres technologies de données
  • Apache Iceberg
  • Introduction à Apache Iceberg
    Architecture et fonctionnalités
    Avantages par rapport aux formats de table traditionnels
    Cas d'utilisation et exemples de mise en œuvre
  • Projet Nessie
  • Aperçu du Projet Nessie
    Contrôle de version pour les data lakehouses
    Bifurcations, fusions et reproductibilité
    Écosystème et intégration
  • Comparaison des Technologies Open Source de Data Lakehouse
  • Cas d'utilisation et comparaisons de performance
    Analyse des coûts et de l'accessibilité
    Études de cas de déploiements réussis
  • Considérations Pratiques et Meilleures Pratiques
  • Gouvernance des données et sécurité
    Stratégies d'optimisation de la performance
    Choisir les bons composants pour des besoins spécifiques
  • Tendances et Développements Futurs des Data Lakehouses
  • Technologies émergentes et innovations
    Adoption et évolution dans l'industrie
    Spéculations sur les directions futures en gestion des données
  • Revue du Cours et Réflexions Finales
  • Récapitulatif des concepts et technologies clés
    Discussion sur l'impact des data lakehouses dans l'industrie
    Q&R et discussions interactives

Sujets

Affaires