Lo que necesitas saber antes de
que comiences

Comienza 29 June 2025 08:11

Termina 29 June 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Dominar el Almacén SQL de Databricks y Spark SQL

Un curso integral sobre Databricks SQL Warehouse y Spark SQL para ingenieros de datos, analistas de datos, desarrolladores de BI, etc.
via Udemy

4123 Cursos


14 hours 8 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

Databricks SQL Warehouse es una tecnología relativamente nueva para construir Data Lakehouse o Data Warehouse aprovechando el poderoso motor Apache Spark, donde los análisis se pueden construir a escala. Como parte de este curso completo, aprenderás todas las habilidades clave necesarias para dominar Databricks SQL Warehouse, incluyendo Spark SQL, ya que el SQL en Databricks SQL Warehouse se basa en Spark SQL.

Programa de estudio

  • Introducción a Databricks y la Arquitectura Data Lakehouse
  • Visión general de la Plataforma Databricks
    Introducción a la Arquitectura Data Lakehouse
    Beneficios de usar Databricks SQL Warehouse
  • Comenzando con Databricks SQL Warehouse
  • Configuración de su entorno Databricks
    Navegación básica y funciones de la interfaz
    Entender Clusters y escalabilidad
  • Fundamentos de Spark SQL
  • Introducción a la sintaxis de Spark SQL
    DataFrames y Datasets
    Operaciones SQL comunes en Spark
  • Funciones avanzadas de Spark SQL
  • Joins, Agregaciones y Funciones de Ventana
    Manejo de JSON, Tipos Complejos y UDFs
    Técnicas de optimización de rendimiento
  • Creación y consulta de Databricks SQL Warehouses
  • Creación y gestión de Databricks SQL Warehouses
    Consulta de datos con Spark SQL
    Mejores prácticas para escribir consultas eficientes
  • Integración e Ingesta de Datos
  • Conexión a diversas fuentes de datos
    Importación e ingestión de datos en Databricks
    Procesos ETL usando Databricks
  • Casos de uso reales de Databricks SQL Warehouse
  • Análisis y reportes
    Integraciones de aprendizaje automático
    Procesamiento de datos en tiempo real
  • Seguridad, Cumplimiento y Gobernanza
  • Acceso de usuarios y permisos
    Cifrado de datos y estándares de cumplimiento
    Monitoreo y auditoría
  • Talleres prácticos y proyecto integrador
  • Laboratorios prácticos: Construcción de pipelines de datos
    Proyectos grupales: Resolución de problemas del mundo real
    Presentación del proyecto integrador y retroalimentación
  • Conclusión y Direcciones Futuras
  • Resumen y puntos clave
    Tendencias emergentes en Databricks y Spark SQL
    Recursos para aprendizaje continuo

Enseñado por

Durga Viswanatha Raju Gadiraju, Pratik Kumar, Sathvika Dandu, Madhuri Gadiraju, Sai Varma and Phani Bhushan Bozzam


Asignaturas

Ciencia de Datos