Modélisation dimensionnelle : La méthode Kimball (Télécharger la version PDF)
L’excellence en matière de modélisation dimensionnelle est essentielle à un entrepôt de données/système de Business Intelligence bien conçu, quelle que soit votre architecture. Ce cours vous donne l’occasion d’apprendre directement du leader d’opinion de l’industrie en matière de modélisation dimensionnelle, Margy Ross.
Le Data Warehouse Toolkit, 3e édition (Kimball/Ross, 2013) a établi un portefeuille étendu de techniques et de vocabulaire dimensionnels, y compris les dimensions conformes, les dimensions à évolution lente, les dimensions de pacotille, les mini-dimensions, les tables de pont, les tables de faits d’instantanés périodiques et cumulatifs, et la liste est longue. Le mot « Kimball » est synonyme de modélisation dimensionnelle.
Dans ce cours intensif, vous apprendrez des techniques pratiques de modélisation dimensionnelle couvrant des modèles et des meilleures pratiques de base à avancées. Les concepts sont enseignés par une combinaison de conférences, d’exercices en classe, d’ateliers en petits groupes et de problèmes individuels, basés sur des scénarios réels de l’industrie. Les étudiants acquerront une compréhension approfondie de la modélisation dimensionnelle afin qu’ils puissent appliquer en toute confiance les techniques sur leur lieu de travail.
Instructeur
Margy Ross, coauteur de The Data Warehouse Toolkit, 3e édition et de plusieurs autres livres de la boîte à outils avec Ralph Kimball. Elle se concentre sur la modélisation dièmensionnelle depuis plus de trois décennies et a précédemment co-instruit les cours de l’Université Kimball avec Ralph. Margy a enseigné les concepts de modélisation dimensionnelle à près de 15 000 étudiants dans le monde entier.
Fondements de la modélisation dimensionnelle
- Objectifs du système DW/BI
- Rôle de la modélisation dimensionnelle dans le mart indépendant, Kimball, Corporate Information Factory, et les architectures hybrides
- Caractéristiques des tables de faits et de dimensions
- Granularité des tables de faits
- Bénéfices de la modélisation dimensionnelle
- Processus de conception à 4de conception en 4 étapes
Étude de cas sur les ventes au détail
- Tables de faits de transaction
- Hiérarchies de tables de dimensions dénormalisées
- Gestion des nuls
- Dimensions régénérées
- Clé de substitution pour les dimensions
- Rôle des dimensions
- .dimension
- Date et heure de la journéeconsidérations sur les dimensions
- Tables de faits en forme de mille-pattes avec dimensions normalisées
- Schémas en flocon de neige avec dimensions normalisées
- Tables de faits sans faits
Facturation. Atelier de conception
- Complications avec des données opérationnelles d’en-tête/de ligne
- Faits alloués à différents niveaux de détail
- Faits et dimensions simultanés
- Abstrait, dimensions génériques
- Commentaires en texte libre
- Dimensions de pacotille pour divers indicateurs de transaction
- Multiples devises et unités de mesure
Détails du cours – Jour 2
Étude de cas sur les inventaires
- Implications des processus d’affaires sur l’architecture des données
- Faits sémi-additifs
- .faits additifs
- Tables de faits d’instantanés périodiques et accumulatifs
- Dimensions formées – roll-ups identiques et rétrécis
- Architecture de bus de l’entrepôt de données d’entreprise et matrice de bus
- Fraisage à travers les tables de faits
- Tables de faits cross-process consolidées
- Exercice individuel : Traduire les exigences commerciales en matrice de bus DW d’entreprise
Exercice de revue de conception de l’enseignement supérieur
- Fautes de conception courantes et erreurs à éviter
- Tables de pont et désignation primaire pour les attributs de dimension multivalués
- Liste de contrôle pour la conduite des revues de conception
Dimensions à évolution lente
- Type 0 : conserver l’original
- Type 1 : Écraser
- Type 2 : ajouter une nouvelle ligne
- Type 3 : ajouter un nouvel attribut, plus plusieurs attributs de type 3
- Type 4 : ajouter une mini-dimension, plus des défis de type 4
- Techniques avancées pour fournir des valeurs d’attributs actuelles et ponctuelles
- Type 5 : Ajout d’une mini-dimension, plus attributs de type 1/déclenchement
- Type 6 : attributs doubles de type 1 et de type 2 dans la même dimension
- Type 7 : tables de dimension double de type 1 et de type 2
Atelier de conception de cartes de crédit
- Schémas complémentaires de transaction et d’instantané périodique
- Considérations de conception pour une dimension par rapport à deux dimensions
- Tables de pont pour les attributs de dimension multivalués
- Normalisation de table de faits avec dimension de type de mesure
- Tagging rows after the fact
.
Étude de cas d’assurance
- Examen des modèles de conception et des techniques
- Développement de la matrice de bus à partir de l’étude de cas étendue
- . étude de cas étendue
- Comparaison des grains des tables de faits
- Matrice de bus de mise en œuvre détaillée
Détails du cours – Jour 3
Vue d’ensemble du cycle de vie, Exigences, et processus de modélisation dimensionnelle
- Vue d’ensemble de la méthode du cycle de vie de Kimball
- Facteurs de préparation et cadrage
- Bonnes pratiques de collecte des exigences et hiérarchisation
- Modélisation dimensionnelle participants et flux de processus
Étude de cas financière
- Schémas de grand livre
- Clé de substitution de tableau de faits
- Dimensions d’audit
- Bandes de valeurs de faits
- Timespan transaction, périodique, et tables de faits d’instantanés accumulatifs
- Forcer des hiérarchies légèrement échelonnées en profondeur fixe
- Tables de pont pour des hiérarchies échelonnées à profondeur variable, plus l’option pathtring
- Plus d’informations sur les devises multiples
- Multiples fuseaux horaires
- Supertypes et sous-types
Ressources humaines Exercice de dimension multivaluée
- Colonnes contre lignes
- Exemples de dimension « Many-to-many » et alternatives de conception, y compris les ponts
- Des rapports aux défis
Étude de cas de client
- Des faits agrégés en tant qu’attributs de dimension
- Séries temporelles de balises de dimension
- Orientateurs
- Cohortes
- Big data, l’analyse prédictive et l’analyse prescriptive
- Des bacs à sable DW et analytiques conventionnels complémentaires
.