Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 03:53

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Gestión de Datos para Análisis Parte 2

Explora los fundamentos de SQL, bases de datos NoSQL (MongoDB, Neo4j) y tecnologías de big data para desarrollar habilidades esenciales de gestión de datos para aplicaciones de análisis y aprendizaje automático.
Northeastern University via Coursera

Northeastern University

26 Cursos


Northeastern es una universidad de investigación de renombre mundial con campus en Boston y alrededor del mundo. Ofrece un modelo de aprendizaje experiencial que anima a los estudiantes a aprender a través de la experiencia del mundo real.

9 hours 55 minutes

Actualización opcional disponible

Intermedio

Avanza a tu propio ritmo

Free Online Course (Audit)

Actualización opcional disponible

Resumen

This course will offer you an opportunity to learn the fundamental concepts and emerging technologies in data storage and data governance. It presents a balanced theory-practice focus and covers Structured Query Language, and two flavors of NoSQL databases in MongoDB and Neo4j graph database.

It also includes a brief introduction to big data management including hadoop, MapReduce, and Apache Spark. By the end of this part 2 course on data analytics, you will have a foundational understanding of the theory and applications of database management to support data analytics, data mining, machine learning, and artificial intelligence.

Programa

  • Lenguaje de Consulta Estructurada, Parte 1
  • Este módulo presenta primero una visión general del Lenguaje de Definición de Datos (SQL DDL) del lenguaje de consulta estructurada (SQL) para definir un modelo de datos relacional. Examina la creación de esquemas, la creación de tablas, el comando de eliminación y el comando de alteración. Se ilustran varias sintaxis con ejemplos explícitos. Este módulo también discute el Lenguaje de Manipulación de Datos de SQL (SQL DML) utilizado para recuperar datos, actualizar datos, insertar nuevos datos y eliminar datos existentes. El enfoque está en las declaraciones SQL INSERT para insertar datos en tablas y algunas declaraciones SQL SELECT simples. Declaraciones SQL SELECT más complejas se discutirán en módulos posteriores junto con las declaraciones SQL DELETE y SQL UPDATE.
  • Lenguaje de Consulta Estructurada, Parte 2
  • Este módulo continúa la discusión sobre la declaración SELECT del lenguaje de manipulación de datos SQL (DML). Se introducen varias funciones agregadas: COUNT, SUM, AVG, VARIANCE, MIN y MAX, que se utilizan para resumir información de las tuplas de la base de datos. Esto es seguido por la cláusula GROUP BY/HAVING, que permite la aplicación de funciones agregadas a subgrupos. Luego, este módulo discute las consultas de unión que permiten al usuario combinar o unir datos de múltiples tablas. Las consultas de unión interna presentan una cláusula "donde" que coincide con una o varias columnas de dos tablas. La unión externa izquierda, la unión externa derecha y la unión externa completa se pueden usar para mantener todas las tuplas de una o ambas tablas en el resultado, independientemente de si tienen o no tuplas coincidentes en la otra tabla. Todas las consultas en este módulo utilizan la base de datos Wine en el área de práctica en línea y se pueden ejecutar allí.
  • Lenguaje de Consulta Estructurada, Parte 3
  • Este módulo presenta consultas SQL más complejas. Introduce consultas anidadas donde un bloque completo de SELECT FROM aparece en la cláusula WHERE de otra consulta. La subconsulta o bloque interno está anidado en el bloque externo y puede haber anidamiento de varios niveles. El optimizador de consultas suele aplanar la consulta anidada en múltiples consultas y las ejecuta secuencialmente desde el nivel más interno al más externo. Este módulo también examina la consulta anidada correlacionada, donde el bloque interno utiliza una o más columnas de la tabla definida en el bloque externo. En este caso, la consulta no se puede aplanar, y la subconsulta del bloque interno debe evaluarse para cada tupla de la tabla (también utilizada en el bloque interno). Se discute el uso de los operadores >= ALL y > ANY. El primero se puede utilizar para encontrar los valores más altos o más grandes mientras que el segundo se puede utilizar para excluir los valores más bajos o más pequeños. Todas las consultas en este módulo usan la base de datos Wine en el área de práctica en línea y se pueden ejecutar allí. Finalmente, este módulo examina las declaraciones DELETE y UPDATE que se pueden usar para eliminar o modificar datos. Concluye con una breve discusión sobre las vistas SQL.
  • Extensión a los Sistemas de Gestión de Bases de Datos Relacionales
  • Este módulo introduce un par de extensiones a los Sistemas de Gestión de Bases de Datos Relacionales (RDBMSs). Comenzaremos revisando los componentes centrales del modelo relacional y sus limitaciones. Posteriormente, el módulo explora métodos para extender las bases de datos relacionales, comenzando con una revisión exhaustiva de los disparadores y procedimientos almacenados como mecanismos fundamentales para aumentar la actividad de los RDBMSs. El módulo concluye adentrándose en las complejidades de las consultas recursivas, una extensión poderosa del lenguaje SQL.
  • Bases de Datos NoSQL: MongoDB
  • Este módulo presenta una visión general del movimiento NoSQL y los sistemas distribuidos. Se discute la base de datos NoSQL MongoDB a nivel introductorio. MongoDB está destinado para almacenar documentos como currículums, documentos legales, libros, etc. No utiliza ningún esquema ni modelo de datos y almacena documentos como colecciones, las cuales almacenan una colección de atributos etiquetados y desordenados que representan ítems semiestructurados.
  • Bases de Datos NoSQL: Base de Datos de Grafos Neo4j
  • Este módulo continúa la discusión sobre la base de datos NoSQL. La teoría de grafos y la base de datos de grafos Neo4j se discuten a nivel introductorio. Neo4j es una base de datos de grafos que aplica la teoría de grafos al almacenamiento de información. Consiste en nodos y aristas, ambos de los cuales pueden almacenar información. Las bases de datos de grafos son particularmente útiles en la modelización de redes sociales como X (anteriormente conocido como Twitter) y Facebook. De cierta manera, una base de datos de grafos es una base de datos hiper-relacional donde las tablas de unión son reemplazadas por relaciones más interesantes y semánticamente significativas que se pueden navegar (recorrido de grafo) y/o consultar, basándose en la coincidencia de patrones de grafo.

Impartido por

Xuemin Jin


Materias

Computer Science