This course will offer you an opportunity to learn the fundamental concepts and emerging technologies in database design and modeling and database systems. It presents a balanced theory-practice focus and covers entity relationship model and UML model, relational model, and relational databases.
By the end of this part 1 course on data analytics, you will have a foundational understanding of the theory and applications of database management to support data analytics, data mining, machine learning, and artificial intelligence.
- Concepts fondamentaux de la gestion de base de données
Dans ce module, nous introduirons les concepts fondamentaux de la gestion des bases de données, passerons en revue les applications de la technologie des bases de données et définirons les concepts clés. Nous comparerons également l'approche basée sur des fichiers à la gestion des données avec l'approche basée sur les bases de données. Enfin, nous examinerons les éléments d'un système de base de données et les avantages de la conception de bases de données.
- Architecture et catégorisation des systèmes de gestion de bases de données (SGBD)
Dans ce module, nous faisons un aperçu rapide de ce qui se trouve sous le capot d'un système de gestion de bases de données. Nous examinerons les composants clés de l'architecture SGBD et comment ces composants fonctionnent ensemble pour le stockage, le traitement et la gestion des données. Nous vérifierons également comment les SGBD peuvent être catégorisés selon les modèles de données, le degré d'accès simultané, l'architecture et l'utilisation.
- Modélisation de données conceptuelle, Partie 1
Dans ce module, nous passons d'abord en revue le processus de conception de base de données depuis la conception conceptuelle et logique jusqu'à la conception physique de base de données et élaborons sur les besoins en données d'un processus métier. Nous introduisons ensuite le modèle Entité-Relation (ER) pour la modélisation de données conceptuelle. Les éléments fondamentaux du modèle ER comprennent les types d'entité, les types d'attribut et les types de relation. Nous discutons des détails des types d'attributs tels que les domaines, les types d'attributs clés, les attributs simples versus composés, les attributs mono-valués versus multi-valués, et les attributs dérivés. Pour les types de relation, nous examinons également le degré et les rôles, les cardinalités, les types d'entité faibles et les types de relation ternaires. Divers exemples sont inclus pour clarification.
- Modélisation de données conceptuelle, Partie 2
Dans ce module, nous apprendrons trois concepts supplémentaires de modélisation des données sémantiques : spécialisation/généralisation, catégorisation et agrégation. Ces concepts renforcent et étendent le modèle ER discuté dans le module précédent. Nous introduirons un modèle conceptuel alternatif : le diagramme de classe du Langage de Modélisation Unifié (UML). L'UML est un langage de modélisation qui assiste dans la spécification, la visualisation, la construction et la documentation des artefacts d'un système logiciel. L'UML peut offrir des diagrammes de cas d'utilisation, des diagrammes de séquence, des diagrammes de paquetages, des diagrammes de déploiement, etc. Ici, nous utilisons l'UML pour la modélisation de données conceptuelle.
- Aspects organisationnels de la gestion des données
Dans ce module, nous nous concentrons sur certains aspects organisationnels de la gestion des données, y compris le catalogue SGBD, les rôles des métadonnées, et la modélisation de métadonnées. Nous discutons également de la qualité des données, de la gouvernance des données et des différents rôles dans la gestion des données. À la fin de ce module, vous comprendrez la gestion appropriée des données et les définitions de données correspondantes. La gestion des données implique une gestion appropriée des données et des définitions de données correspondantes ou des métadonnées. L'objectif de la gestion des données est de garantir que les (méta-)données soient de bonne qualité, et donc une ressource clé, pour les tâches d'analyse de données et une prise de décision managériale efficace et efficiente.
- Modèle relationnel
Comme discuté dans les modules précédents, la conception d'une base de données nécessite plusieurs étapes. Une fois que le modèle de données conceptuel est finalisé, l'étape suivante est de mapper le modèle de données conceptuel à un modèle de données logique par le concepteur de la base de données lors de l'étape de conception logique. Notez que, contrairement au modèle de données conceptuel, le modèle de données logique est associé au modèle de données utilisé par l'environnement d'implémentation du SGBD. En d'autres termes, un modèle de données logique est destiné à un type spécifique de SGBD. Étant donné que les dix premiers SGBD utilisés sont généralement dominés par les SGBD relationnels tels qu'Oracle, MySQL (open-source), Microsoft SQL Server, etc., nous nous concentrerons sur le modèle relationnel qui peut être utilisé comme un modèle de données logique pour les SGBD relationnels.
- Normalisation du modèle relationnel et cartographie du modèle EER au modèle relationnel
Ce module présente d'abord un aperçu des anomalies d'insertion, de suppression et de mise à jour dans un modèle relationnel non normalisé et discute des lignes directrices de normalisation informelles. Deux concepts clés utilisés dans les formes normales sont définis et examinés : la dépendance fonctionnelle et le type d'attribut principal ainsi que divers cas particuliers de dépendance fonctionnelle, y compris les dépendances complètes versus partielles, transitives, triviales et multi-valuées. Le processus et les procédures formelles pour la normalisation d'un modèle relationnel sont discutés en détail via la première forme normale (1 NF), la deuxième forme normale (2 NF), la troisième forme normale (3 NF), la forme normale de Boyce-Codd (BCNF) et la quatrième forme normale (4 NF).