Modelado dimensional: El método Kimball (Descargar versión PDF)
La excelencia en el modelado dimensional es fundamental para un sistema de almacén de datos/inteligencia empresarial bien diseñado, independientemente de su arquitectura. Este curso le ofrece la oportunidad de aprender directamente del líder de pensamiento en modelado dimensional de la industria, Margy Ross.
El Data Warehouse Toolkit, 3ª edición (Kimball/Ross, 2013) estableció una amplia cartera de técnicas y vocabulario dimensionales, incluyendo dimensiones conformadas, dimensiones que cambian lentamente, dimensiones basura, minidimensiones, tablas puente, tablas de hechos instantáneos periódicos y acumulativos, y la lista continúa. La palabra «Kimball» es sinónimo de modelado dimensional.
En esta clase intensiva, aprenderá técnicas prácticas de modelado dimensional que abarcan patrones básicos y avanzados y las mejores prácticas. Los conceptos se enseñan a través de una combinación de conferencias, ejercicios de clase, talleres en grupos pequeños y problemas individuales, basados en escenarios de la industria del mundo real. Los estudiantes obtendrán una comprensión profunda del modelado dimensional para que puedan aplicar con confianza las técnicas en su lugar de trabajo.
Instructora
Margy Ross, coautora de The Data Warehouse Toolkit, 3ª edición y varios otros libros de Toolkit con Ralph Kimball. Se ha centrado en el modelado diemensional durante más de tres décadas y anteriormente fue co-instructora de las clases de la Universidad Kimball con Ralph. Margy ha enseñado conceptos de modelado dimensional a casi 15.000 estudiantes en todo el mundo.
Fundamentos del modelado dimensional
- Objetivos del sistema DW/BI
- Función del modelado dimensional en el mercado independiente, Kimball, Corporate Information Factory y arquitecturas híbridas
- Características de las tablas de hechos y dimensiones
- Granularidad de las tablas de hechos
- Beneficios del modelado dimensional
- 4-proceso de diseño en 4 pasos
Estudio de caso de ventas al por menor
- Tablas de hechos de transacciones
- Jerarquías de tablas de dimensiones normalizadas
- Tratar con nulos
- Dimensiones degeneradas
- Claves sustitutas para las dimensiones
- Relación de las dimensiones
- Periodos dede la dimensión
- Consideraciones sobre la fecha y la hora delconsideraciones sobre dimensiones de fecha y hora del día
- Tablas de hechos en forma de ciempiés con dimensiones normalizadas
- Esquemas en forma de copo de nieve con dimensiones normalizadas
- Tablas de hechos sin datos
Facturación Taller de diseño
- Complicaciones con datos operacionales de cabecera/línea
- Hechos asignados a diferentes niveles de detalle
- Hechos y dimensiones simultáneos
- Abstractos, dimensiones genéricas
- Comentarios de texto de forma libre
- Dimensiones de tipo «basura» para indicadores de transacciones diversas
- Monedas y unidades de medida múltiples
Detalles del curso – Día 2
Estudio de un caso de inventario
- Implicaciones de los procesos de negocio en la arquitectura de datos
- Semi-hechos aditivos
- Tablas de hechos instantáneos periódicos y acumulativos
- Dimensiones conformadas – roll-ups idénticos y encogidos
- Arquitectura de bus de almacén de datos empresarial y matriz de bus
- Perforación a través de tablas de hechos
- Tablas de hechos consolidados entre procesos
- Ejercicio individual: Traducir los requisitos de negocio en la matriz del bus DW de la empresa
Ejercicio de revisión del diseño de la educación superior
- Fallas de diseño comunes y errores a evitar
- Tablas puente y designación primaria para atributos de dimensión multivaluada
- Lista de comprobación para realizar revisiones de diseño
Cambiar lentamente las dimensiones
- Tipo 0: conservar el original
- Tipo 1: sobrescribir
- Tipo 2: añadir nueva fila
- Tipo 3: añadir nuevo atributo, más múltiples atributos de tipo 3
- Tipo 4: añadir minidimensión, más retos de tipo 4
- Técnicas avanzadas para entregar valores de atributos actuales y puntuales
- Tipo 5: añadir minidimensión, más atributos/desafíos de tipo 1
- Tipo 6: atributos duales de tipo 1 y 2 en la misma dimensión
- Tipo 7: tablas de dimensiones duales de tipo 1 y tipo 2
Taller de diseño de tarjetas de crédito
- Esquemas complementarios de transacciones e instantáneas periódicas
- Consideraciones de diseño para una dimensión frente a dos dimensiones
- Tablas puente para atributos de dimensiones multivaluadas
- Normalización de tablas de hechos con dimensión de tipo de medición
- Etiquetado de filas después del hecho
Estudio de caso de seguros
- Revisión de patrones y técnicas de diseño
- Desarrollo de matriz de bus de caso de estudio ampliado
- Comparación de granos de tablas de hechos
- Matriz de bus de implementación detallada
Detalles del curso – Día 3
Resumen del ciclo de vida, Requisitos, y proceso de modelado dimensional
- Resumen del método del ciclo de vida Kimball
- Factores de preparación y alcance
- Mejores prácticas de recopilación de requisitos y priorización
- Modelado dimensional participantes y flujo de procesos
Caso de estudio financiero
- Esquemas del libro mayor
- Claves sustitutas de la tabla de hechos
- Dimensiones de auditoría
- Bandas de valores de hechos
- Transacciones temporales tablas de hechos periódicas y acumulativas
- Forzar jerarquías ligeramente irregulares en profundidad fija
- Tablas puente para jerarquías irregulares de profundidad variable, además de la opción pathstring
- Más sobre múltiples monedas
- Múltiples zonas horarias
- Supertipos y subtipos
Ejercicio de dimensión multivaluada de recursos humanos
- Ejemplos de dimensión «muchos a muchos» y alternativas de diseño, incluyendo puentes
- Desafíos de los informes
Estudio de caso de un cliente
- Hechos agregados como atributos de dimensión
- Serie temporal de etiquetas de dimensión
- Columnas
- Cohortes
- Big data, análisis predictivo y análisis prescriptivo
- Cajas de arena de análisis y DW convencionales complementarias