What You Need to Know Before
You Start

Starts 7 June 2025 00:44

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Normes ouvertes pour les lacs de données : comprendre Apache Iceberg, Parquet, Arrow et Nessie

Découvrez comment des standards open source tels qu'Apache Iceberg et Nessie dynamisent les data lakehouses, permettant des plateformes de données flexibles et rentables tout en minimisant les problèmes de verrouillage fournisseur et de mouvement des données.
SNIAVideo via YouTube

SNIAVideo

2484 Cours


43 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Découvrez comment des standards open source tels qu'Apache Iceberg et Nessie dynamisent les data lakehouses, permettant des plateformes de données flexibles et rentables tout en minimisant les problèmes de verrouillage fournisseur et de mouvement des données.

Programme

  • Introduction aux Data Lakehouses
  • Vue d'ensemble des Data Lakehouses
    Importance des normes ouvertes
  • Apache Iceberg
  • Introduction à Apache Iceberg
    Caractéristiques clés et avantages
    Cas d'utilisation et applications industrielles
  • Apache Parquet
  • Comprendre Apache Parquet
    Format de stockage des données et compression
    Intégration avec les Lakehouses
  • Apache Arrow
  • Introduction à Apache Arrow
    Avantages pour le traitement des données
    Amélioration de l'interopérabilité des données
  • Apache Nessie
  • Vue d'ensemble d'Apache Nessie
    Contrôle de version pour les Data Lakes
    Gestion et suivi des modifications des données
  • Intégration et Interopérabilité
  • Combiner Iceberg, Parquet, Arrow et Nessie
    Meilleures pratiques pour les Lakehouses ouverts
  • Répondre à l'enfermement propriétaire
  • Comprendre les risques d'enfermement propriétaire
    Stratégies pour atténuer et éviter l'enfermement
  • Mise à l'échelle et performance
  • Optimisation de la performance des Lakehouses
    Mise à l'échelle des normes ouvertes dans des environnements de grande taille
  • Considérations de coût
  • Efficacité des coûts dans les Lakehouses ouverts
    Analyse des avantages en termes de coût par rapport aux solutions traditionnelles
  • Études de cas réelles
  • Exemples industriels de mises en œuvre de Lakehouses ouverts
    Leçons apprises et meilleures pratiques
  • Avenir des Lakehouses ouverts
  • Tendances et technologies émergentes
    Le rôle des normes ouvertes dans les futures architectures de données
  • Conclusion et prochaines étapes
  • Résumé des concepts clés
    Ressources supplémentaires pour un apprentissage continu

Sujets

Affaires