What You Need to Know Before
You Start

Starts 7 June 2025 20:25

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Open Source et le Data Lakehouse - Comprendre les Composants et les Technologies

Découvrez comment les data lakehouses allient performance et abordabilité, en explorant Apache Arrow, Iceberg et Project Nessie comme alternatives aux entrepôts de données traditionnels.
OSACon via YouTube

OSACon

2544 Cours


26 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Découvrez comment les data lakehouses allient performance et abordabilité, en explorant Apache Arrow, Iceberg et Project Nessie comme alternatives aux entrepôts de données traditionnels.

Programme

  • Introduction aux Data Lakehouses
  • Définition et caractéristiques clés
    Comparaison avec les entrepôts de données et les data lakes
    Avantages et limitations des data lakehouses
  • Composants Principaux des Data Lakehouses
  • Séparation du stockage et du calcul
    Gestion des métadonnées
    Moteurs de requêtes et optimisation
  • Apache Arrow
  • Aperçu d'Apache Arrow
    Format colonne en mémoire
    Avantages en termes de performance pour les data lakehouses
    Intégration avec d'autres technologies de données
  • Apache Iceberg
  • Introduction à Apache Iceberg
    Architecture et fonctionnalités
    Avantages par rapport aux formats de table traditionnels
    Cas d'utilisation et exemples de mise en œuvre
  • Projet Nessie
  • Aperçu du Projet Nessie
    Contrôle de version pour les data lakehouses
    Bifurcations, fusions et reproductibilité
    Écosystème et intégration
  • Comparaison des Technologies Open Source de Data Lakehouse
  • Cas d'utilisation et comparaisons de performance
    Analyse des coûts et de l'accessibilité
    Études de cas de déploiements réussis
  • Considérations Pratiques et Meilleures Pratiques
  • Gouvernance des données et sécurité
    Stratégies d'optimisation de la performance
    Choisir les bons composants pour des besoins spécifiques
  • Tendances et Développements Futurs des Data Lakehouses
  • Technologies émergentes et innovations
    Adoption et évolution dans l'industrie
    Spéculations sur les directions futures en gestion des données
  • Revue du Cours et Réflexions Finales
  • Récapitulatif des concepts et technologies clés
    Discussion sur l'impact des data lakehouses dans l'industrie
    Q&R et discussions interactives

Sujets

Affaires