Documente Academic
Documente Profesional
Documente Cultură
(Almacenes de Datos)
Mtodos de Diseo de Datawarehouse
Prof. Concettina Di Vasta
Clase 7
Contenido
Datamart
Definicin
Tipos de Datamarts
Mtodo para la construccin de Datamarts
Mtodos de Diseo de un DW. Comparaciones
Inmon
Kimball
Datamarts
Se refiere a una vista del Data Warehouse
orientada slo a un aspecto de la organizacin.
Contiene mucha menos cantidad de datos que el
warehouse y es el objeto del procesamiento analtico
por parte del usuario final [Oracle98].
07/01/2014
07/01/2014
Tipos de Datamarts
Datamart Independiente
07/01/2014
Tipos de Datamarts
Datamart Dependiente
07/01/2014
Requerimientos y Diseo
Construccin
Documentacin
Acceso y Manejo
07/01/2014
Requerimientos y Diseo
Construccin
Descripcin de la situacin
actual
Descripcin de los
Requerimientos
Diseo lgico
Transformacin del Diseo
Documentacin
lgico a fsico
Capturar el diseo del Sistema
Fuente
Acceso y Manejo
07/01/2014
Requerimientos y Diseo
Construccin
Generar las tablas
Fact y Dimensiones
Documentacin
Proceso ETC
Llenado de las tablas
del Diagrama Estrella
Acceso y Manejo
07/01/2014
Requerimientos y Diseo
Construccin
Documentacin
Acceso y Manejo
07/01/2014
Creacin de la
Metacapa del
Usuario Final
Creacin y
Generacin de
Reportes
Almacenes de Datos - UCV
10
Datawarehouse
Alcance
Fuentes de Datos
Tamao Promedio
07/01/2014
Datamart
Corporativo
Mltiples
Slo un aspecto
Muchas
Pocas
> 100 GB
< 100 GB
11
Inmon vs Kimball
1990
Inmon publica Building the Data Warehouse.
1996
Kimball publica The Data Warehouse Toolkit.
2002
Inmon:
La arquitectura como una coleccin de fuentes
diversas.
El almacn de datos variable en el tiempo.
Enfoque top down.
Kimball:
Mltiples bases de datos llamadas data marts que
son organizadas por procesos de negocio
Usa el bus de datos estndar para la empresa.
Enfoque bottom-up.
07/01/2014
12
Qu es un Data Warehouse ?
13
Kimball
Kimball, en 1997, declar que:
"... el almacn de datos no es ms que la
unin de todos los datamarts ",
Kimball presenta un mtodo de
almacenamiento de datos bottom up en el
que los datamarts individuales ofrecen vistas
finas de los datos de la organizacin que
podra ser combinados en una almacn de
datos.
07/01/2014
14
Inmon
Inmon respondi en 1998 al decir:
"Se puede coger todos los peces pequeos en
el ocano y apilarlos juntos y todava no
hacen una ballena
Refleja el punto de vista opuesto es decir: que
el almacn de datos debe ser diseado
desde arriba hacia abajo (top down) para
incluir todos los datos corporativos.
En este mtodo, los datamarts son creados
slo despus que la data completa del
almacn se ha creado.
07/01/2014
15
El Modelo de Inmon
Consiste de todas las base de datos y sistemas
de informacin en una organizacin..
CIF (Corporate Information Factory)
Define un ambiente de base de datos completo
como:
Operacional
Atmico
Departamental
Individual
16
Datos histricos.
Datawarehouse Inmon
07/01/2014
19
Enfoque Kimball
Modelo de Datos Dimensional
Hechos (Facts)
Dimensiones
La tabla de hechos contiene mtricas
Las tablas dimensiones contienen atributos
No se adhiere a la teora de la normalizacin
Accesible por el usuario
07/01/2014
20
07/01/2014
21
07/01/2014
22
Se centrar en la empresa
Enfoque en la organizacin
Top down
07/01/2014
23
Comparacin
INMON
KIMBALL
Enfoque
Top-down
Bottom up
Complejidad
del mtodo
Bastante
Complejo
Complejidad
bastante simple
Orientacin de
la data
Maneja data o
reas
Orientado a
procesos
Herramientas
Tradicional (ER
y DIS)
Modelacin
Dimensional
Acessibilidad
Bajo
del usuario final
07/01/2014
Alto
24
Comparacin (Filosofa)
INMON
KIMBALL
Audiencia primaria
IT
Usuarios finales
Objetivos
Ofrecer una
solucin que hace
que sea fcil
para los usuarios
finales para
consultar los
datos y tener una
tasa de
respuesta razonable
07/01/2014
25
Cmo escoger?
07/01/2014
Caracterstica
Kimball
Inmon
Naturaleza de los
requerimientos
Tctica
Estratgica
Requerimientos
de integracin de
datos
reas de negocio
individual
Organizacin
Estructura de
datos
No mtricas
Mtricas de
negocio, medidas
de rendimiento, y
Cuadros de
mando
26
Cmo escoger?
Caracterstica
Kimball
Inmon
Persistencia de
la data
Requerimientos
de personal y
habilidades
Equipos pequeos
generalistas
Equipos grandes de
especialistas
Tiempo de
entrega
La necesidad de la
primera aplicacin
datawarehouse es
urgente
Los requerimientos
de la organizacin
permiten la puesta
en marcha con ms
tiempo
Costo de
Menor costo de
implementacin arranque, con cada
proyecto posterior el
costo es el mismo
07/01/2014
Altos costos de
inicio con menores
costos de desarrollo
de proyectos
posteriores
Almacenes de Datos - UCV
27
Mtodos de Diseo de un DW
El proceso de desarrollo de un DW es diferente al
desarrollo de sistemas operacionales clsicos.
Las metodologas ms conocidas son las
propuestas por Ralph Kimball y Bill Inmon.
Metodologa Inmon
Los requerimientos no se conocen hasta que el
DW est parcialmente poblado.
Los datos se revisan por el analista DSS, su
resultado permite agregar o modificar el DW.
Metodologa Kimball
Datawarehouse
(Almacenes de Datos)