Sunteți pe pagina 1din 35

Datawarehouse

(Almacenes de Datos)
Mtodos de Diseo de Datawarehouse
Prof. Concettina Di Vasta
Clase 7

Contenido

Datamart
Definicin
Tipos de Datamarts
Mtodo para la construccin de Datamarts
Mtodos de Diseo de un DW. Comparaciones
Inmon
Kimball

Datamarts
Se refiere a una vista del Data Warehouse
orientada slo a un aspecto de la organizacin.
Contiene mucha menos cantidad de datos que el
warehouse y es el objeto del procesamiento analtico
por parte del usuario final [Oracle98].

Es un pequeo almacn de datos, diseado para


una unidad de negocio.
Se centra en un tema concreto.
Muchos almacenes de datos comienzan siendo
DataMart (para minimizar riesgos) y se va
ampliando su mbito.

07/01/2014

Almacenes de Datos - UCV

Tipos de Almacenes de datos

Corporativos (Data Warehouses)


Departamentales (Data Marts)

07/01/2014

Almacenes de Datos - UCV

Tipos de Datamarts
Datamart Independiente

07/01/2014

Almacenes de Datos - UCV

Tipos de Datamarts
Datamart Dependiente

07/01/2014

Almacenes de Datos - UCV

Mtodo para la construccin de Datamarts

Requerimientos y Diseo

Construccin

Documentacin

Acceso y Manejo

07/01/2014

Almacenes de Datos - UCV

Mtodo para la construccin de Datamarts

Requerimientos y Diseo

Construccin

Descripcin de la situacin
actual
Descripcin de los
Requerimientos
Diseo lgico
Transformacin del Diseo
Documentacin
lgico a fsico
Capturar el diseo del Sistema
Fuente

Acceso y Manejo

07/01/2014

Almacenes de Datos - UCV

Mtodo para la construccin de Datamarts

Requerimientos y Diseo

Construccin
Generar las tablas
Fact y Dimensiones
Documentacin
Proceso ETC
Llenado de las tablas
del Diagrama Estrella

Acceso y Manejo
07/01/2014

Almacenes de Datos - UCV

Mtodo para la construccin de Datamarts

Requerimientos y Diseo

Construccin

Documentacin

Acceso y Manejo

07/01/2014

Creacin de la
Metacapa del
Usuario Final
Creacin y
Generacin de
Reportes
Almacenes de Datos - UCV

10

Diferencias entre un Datamarts y Data Warehouse

Datawarehouse

Alcance

Aspectos que considera

Fuentes de Datos

Tamao Promedio

07/01/2014

Datamart

Corporativo

Una lnea de Investigacin

Mltiples

Slo un aspecto

Muchas

Pocas

> 100 GB

< 100 GB

Almacenes de Datos - UCV

11

Inmon vs Kimball
1990
Inmon publica Building the Data Warehouse.
1996
Kimball publica The Data Warehouse Toolkit.
2002
Inmon:
La arquitectura como una coleccin de fuentes
diversas.
El almacn de datos variable en el tiempo.
Enfoque top down.
Kimball:
Mltiples bases de datos llamadas data marts que
son organizadas por procesos de negocio
Usa el bus de datos estndar para la empresa.
Enfoque bottom-up.

07/01/2014

Almacenes de Datos - UCV

12

Qu es un Data Warehouse ?

Bill Inmon, define un almacn de datos como:


- Orientado a la informacn relevante de la
organizacin (Subject-oriented).
- Variable en el tiempo.
- No voltil.
- Integrado.
Ralph Kimball, define un almacn de datos
como:
"Una copia de la data transaccional
especficamente
estructurada para consultas y anlisis."
07/01/2014

Almacenes de Datos - UCV

13

Kimball
Kimball, en 1997, declar que:
"... el almacn de datos no es ms que la
unin de todos los datamarts ",
Kimball presenta un mtodo de
almacenamiento de datos bottom up en el
que los datamarts individuales ofrecen vistas
finas de los datos de la organizacin que
podra ser combinados en una almacn de
datos.

07/01/2014

Almacenes de Datos - UCV

14

Inmon
Inmon respondi en 1998 al decir:
"Se puede coger todos los peces pequeos en
el ocano y apilarlos juntos y todava no
hacen una ballena
Refleja el punto de vista opuesto es decir: que
el almacn de datos debe ser diseado
desde arriba hacia abajo (top down) para
incluir todos los datos corporativos.
En este mtodo, los datamarts son creados
slo despus que la data completa del
almacn se ha creado.
07/01/2014

Almacenes de Datos - UCV

15

El Modelo de Inmon
Consiste de todas las base de datos y sistemas
de informacin en una organizacin..
CIF (Corporate Information Factory)
Define un ambiente de base de datos completo
como:

Operacional
Atmico
Departamental
Individual

El Warehouse es parte del todo mayor (CIF)


07/01/2014

Almacenes de Datos - UCV

16

Inmon: Datos operacionales


Se realizan tres tipos de carga:

Datos histricos.

Datos contenidos en el ambiente operacional.

Cambios al DW ocurridos por las actualizaciones


de los ODS, despus de la primera carga.

Inmon: Modelo de Datos


El desarrollo del modelo de datos se basa en:
Modelo de alto nivel. Compuesto por distintos
E-R integrados.
Modelo de nivel medio Compuesto por
conjuntos de items de datos (DIS: Data Item
Set)
Modelo de bajo nivel Se extienden los DIS
incluyendo caractersticas fsicas del
almacenamiento. Se optimiza el rendimiento
desnormalizando.

Datawarehouse Inmon

07/01/2014

Almacenes de Datos - UCV

19

Enfoque Kimball
Modelo de Datos Dimensional
Hechos (Facts)
Dimensiones
La tabla de hechos contiene mtricas
Las tablas dimensiones contienen atributos
No se adhiere a la teora de la normalizacin
Accesible por el usuario
07/01/2014

Almacenes de Datos - UCV

20

El ciclo de vida de la data segn Kimball

07/01/2014

Almacenes de Datos - UCV

21

El Bus de Datos de Kimball

Los datos se mueven al rea intermedia


La data se depura y es consistente
Los Data Marts estn basados en un solo
proceso
Con la suma de los datamarts se puede
constituir un Enterprise Data Warehouse
Las dimensiones conformadas son la
clave del xito.

07/01/2014

Almacenes de Datos - UCV

22

Kimbal versus Inmon


Kimball

Se iniciar con data marts


Centrado en la entrega rpida de los
usuarios
Inmon

Se centrar en la empresa
Enfoque en la organizacin
Top down

07/01/2014

Almacenes de Datos - UCV

23

Comparacin
INMON

KIMBALL

Enfoque

Top-down

Bottom up

Complejidad
del mtodo

Bastante
Complejo

Complejidad
bastante simple

Orientacin de
la data

Maneja data o
reas

Orientado a
procesos

Herramientas

Tradicional (ER
y DIS)

Modelacin
Dimensional

Acessibilidad
Bajo
del usuario final

07/01/2014

Alto

Almacenes de Datos - UCV

24

Comparacin (Filosofa)
INMON

KIMBALL

Audiencia primaria

IT

Usuarios finales

Objetivos

Ofrecer una buena


solucin tcnica
basada en mtodos
probados

Ofrecer una
solucin que hace
que sea fcil
para los usuarios
finales para
consultar los
datos y tener una
tasa de
respuesta razonable

07/01/2014

Almacenes de Datos - UCV

25

Cmo escoger?

07/01/2014

Caracterstica

Kimball

Inmon

Naturaleza de los
requerimientos

Tctica

Estratgica

Requerimientos
de integracin de
datos

reas de negocio
individual

Organizacin

Estructura de
datos

No mtricas
Mtricas de
negocio, medidas
de rendimiento, y
Cuadros de
mando

Almacenes de Datos - UCV

26

Cmo escoger?
Caracterstica

Kimball

Inmon

Persistencia de
la data

Los sistemas fuentes


son relativamente
estables

Alta tasa de cambio


de sistemas fuentes

Requerimientos
de personal y
habilidades

Equipos pequeos
generalistas

Equipos grandes de
especialistas

Tiempo de
entrega

La necesidad de la
primera aplicacin
datawarehouse es
urgente

Los requerimientos
de la organizacin
permiten la puesta
en marcha con ms
tiempo

Costo de
Menor costo de
implementacin arranque, con cada
proyecto posterior el
costo es el mismo
07/01/2014

Altos costos de
inicio con menores
costos de desarrollo
de proyectos
posteriores
Almacenes de Datos - UCV

27

Mtodos de Diseo de un DW
El proceso de desarrollo de un DW es diferente al
desarrollo de sistemas operacionales clsicos.
Las metodologas ms conocidas son las
propuestas por Ralph Kimball y Bill Inmon.

Metodologa Inmon
Los requerimientos no se conocen hasta que el
DW est parcialmente poblado.
Los datos se revisan por el analista DSS, su
resultado permite agregar o modificar el DW.

Metodologa Kimball

Describe un flujo de tareas de alto nivel requeridas para


el diseo, desarrollo e implementacin de un DW.

Estructura de la Metodologa Kimball

Checklist para el diseo de un DW (Kimball)

Regla #1 Cargar los datos atmicos detallados


en estructuras dimensionales.

Regla #2 Las dimensiones se procesan


alrededor de los procesos de negocios

Regla #3 Asegurar que cada tabla de hechos


tiene una dimensin tiempo asociada

Regla #4 Asegurar que la tabla de hechos est


en el mismo grano o nivel de detalle

Checklist para el diseo de un DW (Kimball)

Regla #5 Resolver relaciones muchos a muchos


en la tabla de hechos.

Regla #6 Resolver relaciones muchos a uno en


tablas dimensionales

Regla #7 Almacenar etiquetas de reportes y


valores de filtros en tablas dimensionales

Regla #8 Asegurar que las tablas tengan claves


subrogadas

Checklist para el diseo de un DW (Kimball)

Regla #9 Crear dimensiones conformadas


para integrar datos a travs de la empresa

Regla #10 Analizar los requerimientos de


manera continua para asegurar soluciones
adaptadas a la toma de decisiones.

Datawarehouse
(Almacenes de Datos)

S-ar putea să vă placă și