Dimensionale Modellierung: Die Kimball-Methode (PDF-Version herunterladen)
Für ein gut konzipiertes Data-Warehouse/Business-Intelligence-System ist eine exzellente Dimensionsmodellierung von entscheidender Bedeutung, unabhängig von Ihrer Architektur. In diesem Kurs haben Sie die Möglichkeit, direkt von Margy Ross, der Vordenkerin der Dimensionsmodellierung in der Branche, zu lernen.
Das Data Warehouse Toolkit, 3. Auflage (Kimball/Ross, 2013) hat ein umfangreiches Portfolio an Dimensionstechniken und Vokabular eingeführt, darunter angepasste Dimensionen, sich langsam ändernde Dimensionen, Junk-Dimensionen, Mini-Dimensionen, Brückentabellen, periodische und akkumulierende Snapshot-Faktentabellen, und die Liste geht weiter. Das Wort „Kimball“ ist ein Synonym für Dimensionsmodellierung.
In diesem Intensivkurs lernen Sie praktische Techniken der Dimensionsmodellierung, die grundlegende bis fortgeschrittene Muster und bewährte Verfahren umfassen. Die Konzepte werden durch eine Kombination aus Vorlesungen, Übungen, Workshops in kleinen Gruppen und individuellen Problemstellungen vermittelt, die auf realen Industrieszenarien basieren. Die Teilnehmer erhalten ein umfassendes Verständnis der dimensionalen Modellierung, so dass sie die Techniken selbstbewusst an ihrem Arbeitsplatz anwenden können.
Lehrer
Margy Ross, Co-Autorin von The Data Warehouse Toolkit, 3rd Edition und mehrerer anderer Toolkit-Bücher mit Ralph Kimball. Sie beschäftigt sich seit mehr als drei Jahrzehnten mit der dimensionalen Modellierung und war früher gemeinsam mit Ralph Kimball Dozentin an der Kimball University. Margy hat weltweit fast 15.000 Studenten Konzepte der dimensionalen Modellierung vermittelt.
Grundlagen der dimensionalen Modellierung
- DW/BI-Systemziele
- Rolle der dimensionalen Modellierung im Independent Mart, Kimball, Corporate Information Factory, und hybriden Architekturen
- Fakten- und Dimensionstabellenmerkmale
- Faktentabellengranularität
- Vorteile der Dimensionsmodellierung
- 4-Schritt-Design-Prozess
Fallstudie Einzelhandel
- Transaktionsfaktentabellen
- Denormalisierte Dimensionstabellenhierarchien
- Umgang mit Nullen
- Degenerierte Dimensionen
- Ersatzschlüssel für Dimensionen
- Dimensionsrollenspielen
- Datum und UhrzeitTagesdimensionen
- Centipede-Faktentabellen mit normalisierten Dimensionen
- Snowflake-Schemata mit normalisierten Dimensionen
- Faktenlose Faktentabellen
Fakturierung Design-Workshop
- Komplikationen mit operativen Kopf-/Zeilendaten
- Zugeordnete Fakten auf verschiedenen Detailebenen
- Gleichzeitige Fakten und Dimensionen
- Abstract, generische Dimensionen
- Freiformtextkommentare
- Junk-Dimensionen für diverse Transaktionsindikatoren
- Mehrere Währungen und Maßeinheiten
Kursdetails – Tag 2
Fallstudie Inventarisierung
- Auswirkungen von Geschäftsprozessen auf die Datenarchitektur
- Semi-additive Fakten
- Periodische und kumulierende Snapshot-Faktentabellen
- Konforme Dimensionen – identische und geschrumpfte Roll-Ups
- Enterprise Data Warehouse Bus-Architektur und Bus-Matrix
- Faktentabellen übergreifend konsolidieren
- Prozessübergreifende Faktentabellen
- Individuelle Übung: Übersetzen von Geschäftsanforderungen in eine Unternehmens-DW-Bus-Matrix
Übung zur Überprüfung des Designs
- Gängige Designfehler und zu vermeidende Fehler
- Brückentabellen und primäre Bezeichnung für mehrwertige Dimensionsattribute
- Checkliste für die Durchführung von Design-Reviews
Slowly Changing Dimensions
- Typ 0: Original beibehalten
- Typ 1: Überschreiben
- Typ 2: neue Zeile hinzufügen
- Typ 3: neues Attribut hinzufügen, plus mehrere Attribute des Typs 3
- Typ 4: Mini-Dimension hinzufügen, plus Herausforderungen des Typs 4
- Fortgeschrittene Techniken, um aktuelle und zeitpunktbezogene Attributwerte zu liefern
- Typ 5: Mini-Dimension hinzufügen, plus Typ-1-Attribute/Auslöser
- Typ 6: Duale Typ-1- und Typ-2-Attribute in derselben Dimension
- Typ 7: Doppeltyp-1- und Typ-2-Dimensionstabellen
Kreditkarten-Design-Workshop
- Komplementäre Transaktions- und periodische Snapshot-Schemata
- Gestaltungsüberlegungen für eine Dimension gegenüber zwei Dimensionen
- Brückentabellen für mehrwertige Dimensionsattribute
- Faktentabellen-Normalisierung mit Messtyp-Dimension
- Tagging rows after the fact
Versicherungsfallstudie
- Übersicht über Entwurfsmuster und Techniken
- Entwicklung einer Busmatrix aus erweiterten Fallstudie
- Vergleich von Faktentabellen
- Detaillierte Implementierung der Busmatrix
Kursdetails – Tag 3
Übersicht über den Lebenszyklus, Anforderungen, und dimensionaler Modellierungsprozess
- Überblick über die Kimball-Lifecycle-Methode
- Readiness-Faktoren und Scoping
- Best Practices für die Erfassung von Anforderungen und Priorisierung
- dimensionale Modellierung Teilnehmer und Prozessablauf
Finanzfallstudie
- Hauptbuchschemata
- Surrogatschlüssel für Faktentabellen
- Prüfungsdimensionen
- Faktwertbanding
- Zeitspanne Transaktion, periodische und akkumulierende Snapshot-Faktentabellen
- Zwingen von leicht ausgefransten Hierarchien in feste Tiefe
- Brückentabellen für ausgefranste Hierarchien mit variabler Tiefe, plus Pathstring-Option
- Mehr über mehrere Währungen
- Mehrere Zeitzonen
- Supertypen und Subtypen
Human Resources Multivalued Dimension Exercise
- Column versus row trade-offs
- „Many-to-many“ Dimension Beispiele und Design Alternativen, einschließlich Brücken
- Reports-to-Herausforderungen
Kundenfallstudie
- Aggregierte Fakten als Dimensionsattribute
- Zeitreihen von Dimensions-Tags
- Outriggers
- Cohorts
- Big Data, Predictive Analytics und Prescriptive Analytics
- Komplementäre konventionelle DW und analytische Sandboxen