Modellazione dimensionale: The Kimball Method (Download PDF version)
L’eccellenza nella modellazione dimensionale è fondamentale per un sistema di data warehouse/business intelligence ben progettato, indipendentemente dalla vostra architettura. Questo corso vi dà l’opportunità di imparare direttamente dal leader del settore della modellazione dimensionale, Margy Ross.
Il Data Warehouse Toolkit, 3a edizione (Kimball/Ross, 2013) ha stabilito un ampio portafoglio di tecniche e vocabolario dimensionali, comprese le dimensioni conformate, le dimensioni che cambiano lentamente, le dimensioni spazzatura, le mini-dimensioni, le tabelle ponte, le tabelle dei fatti istantanee periodiche e accumulate, e la lista continua. La parola “Kimball” è sinonimo di modellazione dimensionale.
In questa classe intensiva, imparerete tecniche pratiche di modellazione dimensionale che coprono modelli di base e avanzati e le migliori pratiche. I concetti vengono insegnati attraverso una combinazione di lezioni, esercizi in classe, workshop in piccoli gruppi e problemi individuali, basati su scenari industriali del mondo reale. Gli studenti acquisiranno una comprensione approfondita della modellazione dimensionale in modo da poter applicare con fiducia le tecniche nel loro posto di lavoro.
Istruttore
Margy Ross, co-autrice di The Data Warehouse Toolkit, 3rd Edition e diversi altri libri Toolkit con Ralph Kimball. Si è concentrata sulla modellazione dimensionale per oltre tre decenni e in precedenza ha co-istruito i corsi della Kimball University con Ralph. Margy ha insegnato i concetti di modellazione dimensionale a quasi 15.000 studenti in tutto il mondo.
Fondamenti di modellazione dimensionale
- Obiettivi del sistema DW/BI
- Ruolo della modellazione dimensionale nel mart indipendente, Kimball, Corporate Information Factory, e architetture ibride
- Caratteristiche delle tabelle dei fatti e delle dimensioni
- Granularità delle tabelle dei fatti
- Benefici della modellazione dimensionale
- Processo di progettazione a 4 fasi
Caso di studio sulle vendite al dettaglio
- Tabelle dei fatti delle transazioni
- Gerarchie delle tabelle delle dimensioni denormalizzate
- Gestione dei nulls
- Dimensioni generate
- Chiavi surrogate per le dimensioni
- Ruolo delle dimensionigiocare
- Considerazioni sulla data e sull’oragiorno
- Tabelle di fatti a centopiedi con dimensioni normalizzate
- Schemi a fiocco di neve con dimensioni normalizzate
- Tabelle di fatti senza fatti
Fatturazione Workshop di progettazione
- Complicazioni con dati di testata/linea operativa
- Fatti assegnati a diversi livelli di dettaglio
- Fatti e dimensioni simultanei
- Abstract, dimensioni generiche
- Commenti di testo libero
- Dimensioni spazzatura per indicatori di transazioni varie
- Valute multiple e unità di misura
Dettagli del corso – Giorno 2
Caso di studio dell’inventario
- Implicazioni dei processi aziendali sull’architettura dei dati
- Semi-fatti additivi
- Tabelle dei fatti istantanee periodiche e cumulative
- Dimensioni conformate – roll-up identici e rimpiccioliti
- Enterprise Data Warehouse Bus Architecture e matrice del bus
- Formazione attraverso le tabelle dei fatti
- Tabelle dei fatti consolidate attraverso i processi
- Esercizio individuale: Tradurre i requisiti di business nella matrice del DW bus dell’impresa
Esercizio di revisione del design dell’istruzione superiore
- Erori comuni di design ed errori da evitare
- Tabelle ponte e designazione primaria per attributi di dimensioni multivalutate
- Lista di controllo per condurre revisioni del design
Cambiamento lento delle dimensioni
- Tipo 0: mantenere l’originale
- Tipo 1: sovrascrivere
- Tipo 2: aggiungere nuova riga
- Tipo 3: aggiungere nuovo attributo, più attributi multipli di tipo 3
- Tipo 4: aggiungere mini-dimensione, più sfide di tipo 4
- Tecniche avanzate per fornire valori di attributi attuali e point-in-time
- Tipo 5: aggiungere mini-dimensione, più attributi/outrigger di tipo 1
- Tipo 6: doppio tipo 1 e tipo 2 nella stessa dimensione
- Tipo 7: tabelle di dimensione di tipo 1 e di tipo 2
Laboratorio di progettazione delle carte di credito
- Schemi di transazione e di istantanee periodiche complementari
- Considerazioni sulla progettazione di una dimensione rispetto a due dimensioni
- Tabelle di collegamento per attributi di dimensioni multivalutate
- Normalizzazione della tabella dei fatti con dimensione di tipo misurazione
- Tagging delle righe dopo il fatto
Caso di studio dell’assicurazione
- Rassegna dei modelli e delle tecniche di progettazione
- Sviluppo della matrice di bus da caso di studio esteso
- Confronto dei grani delle tabelle dei fatti
- Matrice del bus di implementazione dettagliata
Dettagli del corso – Giorno 3
Panoramica del ciclo di vita, Requisiti, e processo di modellazione dimensionale
- Panoramica del metodo Kimball Lifecycle
- Fattori di disponibilità e scoping
- Buone pratiche di raccolta dei requisiti e prioritizzazione
- Modellazione dimensionale partecipanti e flusso di processo
Caso di studio finanziario
- Schemi di contabilità generale
- Chiavi surrogate della tabella dei fatti
- Dimensioni di audit
- Banda di valori dei fatti
- Tempistica delle transazioni, periodiche, e tabelle dei fatti a scatto cumulativo
- Forzare gerarchie leggermente irregolari in profondità fissa
- Tabelle ponte per gerarchie irregolari a profondità variabile, più opzione pathstring
- Più su valute multiple
- Fusi orari multipli
- Supertipi e sottotipi
Esercizio dimensione multivalore risorse umane
- Colonna contro riga
- Esempi di dimensione “Molti a molti” e alternative di progettazione, inclusi i ponti
- Report-to challenges
Customer Case Study
- Fatti aggregati come attributi di dimensione
- Serie temporale di tag di dimensione
- Outriggers
- Cohorts
- Big data, analitica predittiva e prescrittiva
- Sandwich analitici e DW convenzionali complementari