Ce que vous devez savoir avant
Vous commencez

Débute 6 June 2026 13:43

Se termine 6 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Comment construire un lac de données cloud native avec des technologies open source

Rejoignez notre guide complet sur la construction d'un data lake cloud native en utilisant des technologies open source de pointe. Cette session vous guidera à travers le déploiement d'un data lake basé sur Kubernetes, de la phase d'installation initiale à l'exécution d'un prototype pleinement fonctionnel sur votre machine locale. Acquérez.
Canonical Ubuntu via YouTube

Canonical Ubuntu

6076 Cours


30 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join our comprehensive guide on building a cloud native data lake utilizing cutting-edge open source technologies. This session will walk you through deploying a Kubernetes-based data lake, from the initial setup phase to running a fully functional prototype on your local machine.

Gain hands-on experience and insights into creating data-driven solutions that are efficient and scalable. Perfect for learners interested in artificial intelligence and business courses.

Find this invaluable educational resource provided by YouTube.

Programme

  • Introduction aux lacs de données natifs cloud
  • Aperçu des architectures natives cloud
    Avantages des lacs de données pour le stockage et l'analyse des données
  • Fondamentaux de Kubernetes
  • Comprendre l'orchestration de conteneurs
    Mise en place d'un cluster Kubernetes local (Minikube, kind ou K3s)
    Opérations de base de Kubernetes : Pods, Services et Déploiements
  • Technologies Open Source pour les lacs de données
  • Apache Hadoop et HDFS
    Apache Spark pour le traitement des données
    Apache Kafka pour l'ingestion de données en temps réel
  • Couche de stockage
  • Mise en place de systèmes de fichiers distribués
    Configuration de solutions de stockage d'objets (par exemple, MinIO, Ceph)
  • Ingestion de données
  • Configuration de pipelines d'ingestion de données avec Kafka
    Exploration d'outils ETL comme Apache NiFi et Apache Airflow
  • Traitement des données
  • Exécution des tâches Spark sur Kubernetes
    Mise en œuvre du traitement par lots et du traitement en flux
  • Accès aux données et requêtes
  • Mise en place de moteurs de requête SQL (par exemple, Presto, Trino)
    Utilisation d'Hive Metastore pour la gestion des schémas
  • Sécurité et gouvernance
  • Mise en œuvre des pratiques de sécurité de base
    Introduction aux outils de gouvernance des données (Apache Atlas)
  • Surveillance et journalisation
  • Configuration des outils de surveillance (Prometheus, Grafana)
    Agrégation et surveillance des journaux avec la pile ELK (Elasticsearch, Logstash, Kibana)
  • Déploiement et tests
  • Construction d'un prototype de lac de données sur une machine locale
    Effectuer des tests et une validation des données
  • Études de cas et projets pratiques
  • Études de cas d'architectures de lacs de données dans le monde réel
    Projet de synthèse : Déployer un lac de données natif cloud en utilisant des outils open source sur Kubernetes
  • Conclusion et tendances futures
  • Tendances émergentes dans les technologies de données natives cloud
    Examiner l'avenir des lacs de données open source

Matières

Business