Sunteți pe pagina 1din 29

Introduccin al Datamart y al

Datawarehouse

Objetivos Generales

Reconoce y diferencia los conceptos de Datamart y


Datawarehouse.

Contenido de Agenda

Concepto de Datamart

Concepto de Datawarehouse

La visin de Bill Inmon: Inmon Corporate Information


Factory

La visin de Ralph Kimball: Kimball Bus Architecture

Etapas de un proceso de Data Mart y Data Warehouse


segn la metodologa de Ralph Kimball

1. Concepto de Datamart

Un
Datamart
es
un
Datawarehouse ms pequeo.

Est orientado principalmente


a un rea del Negocio.

Su implementacin en tiempo
es ms corta.

Su implementacin en dinero
es ms cmoda.

Contenido de Agenda

Concepto de Datamart

Concepto de Datawarehouse

La visin de Bill Inmon: Inmon Corporate Information


Factory

La visin de Ralph Kimball: Kimball Bus Architecture

Etapas de un proceso de Data Mart y Data Warehouse


segn la metodologa de Ralph Kimball

2. Concepto de Datawarehouse
Un Data Warehouse (DWH)
es un repositorio central que
contiene la informacin ms
valiosa de la empresa. Los
datos
que
aqu
se
almacenan han pasado por
un proceso de calidad que
asegura su consistencia.
Adems, el repositorio est
construido de tal manera
que el acceso sea lo ms
rpido posible.

Contenido de Agenda

Concepto de Datamart

Concepto de Datawarehouse

La visin de Bill Inmon: Inmon Corporate Information


Factory

La visin de Ralph Kimball: Kimball Bus Architecture

Etapas de un proceso de Data Mart y Data Warehouse


segn la metodologa de Ralph Kimball

3.

La visin de Bill Inmon: Inmon Corporate


Information Factory

3.1 Caractersticas CIF: Orientado a un Tema


La data es categorizada y almacenada por reas de negocio
en lugar de aplicaciones.
Aplicaciones OLTP
Planes de
Equidad

Acciones

Seguros
Prestamos

Ahorros

Tema del Data Warehouse


Informacion
Financiera
del Cliente

3.2 Caractersticas CIF: Integrada


La data es definida como nica.
Ahorros
Cuenta
corriente
Prestamos
Aplicaciones OLTP

Cliente
Data Warehouse

3.3 Caractersticas CIF: Variante en el


Tiempo
La data es almacenada como serie de fotos asociadas al
tiempo.

Time

Data

1/2013

January

2/2013

February

3/2013

March

Data Warehouse

3.4 Caractersticas CIF: No Voltil


La data en el DW tpicamente No cambia.
Operacional

Warehouse
Load

Insert
Update
Delete

Read

Read

Contenido de Agenda

Concepto de Datamart

Concepto de Datawarehouse

La visin de Bill Inmon: Inmon Corporate Information


Factory

La visin de Ralph Kimball: Kimball Bus Architecture

Etapas de un proceso de Data Mart y Data Warehouse


segn la metodologa de Ralph Kimball

4. La visin de Ralph Kimball: Kimball Bus


Architecture

Contenido de Agenda

Concepto de Datamart

Concepto de Datawarehouse

La visin de Bill Inmon: Inmon Corporate Information


Factory

La visin de Ralph Kimball: Kimball Bus Architecture

Etapas de un proceso de Data Mart y Data Warehouse


segn la metodologa de Ralph Kimball

5.Etapas de un proceso de Data Mart y Data


Warehouse segn la metodologa de Ralph
Kimball

Business Dimensional Lifecycle propuesto por Ralph


Kimball

5.1 Planificacin del Proyecto


La planificacin busca identificar la
definicin y el alcance del proyecto
de Data Warehouse incluyendo
justificaciones
del
negocio
y
evaluaciones de factibilidad. La
planificacin
del
proyecto
se
focaliza sobre recursos, perfiles,
tareas, duraciones y secuencialidad.
El plan de proyecto resultante
identifica todas las tareas asociadas
con el BDL e identifica las partes
involucradas.

5.2 Planificacin del Proyecto


Un factor determinante en el xito de
un proceso de Data Warehousing es la
interpretacin correcta de los diferentes
niveles de requerimientos, expresados
por los diferentes niveles de usuarios.
La tcnica utilizada para relevar los
requerimientos de los analistas del
negocio
difiere
de
los
enfoques
tradicionales guiados por los datos. Los
diseadores de los Data Warehouses
deben entender los factores claves que
guan al negocio para determinar
efectivamente los requerimientos y
traducirlos en consideraciones de

5.3 Modelado Dimensional


La definicin de los requerimientos
del negocio determina los datos
necesarios
para
cumplir
los
requerimientos analticos de los
usuarios.
Disear los modelos de datos para
soportar estos anlisis requieren un
enfoque diferente al usado en los
sistemas operacionales.
Bsicamente se comienza con una
matriz donde se determina la
dimensionalidad de cada indicador y
luego se especifican los diferentes
grados de detalle (atributos) dentro
de cada concepto del negocio

5.4 Diseo Fsico


El diseo fsico de las base de
datos se focaliza sobre la
seleccin de las estructuras
necesarias para soportar el
diseo lgico.
Algunos
de
los
elementos
principales de este proceso son
la definicin de convenciones
estndares de nombres y seteos
especficos del ambiente de la
base de datos.
La indexacin y las estrategias
de particionamiento son tambin
determinadas en esta etapa.

5.5 Diseo y Desarrollo de Presentacin de


Datos
Esta etapa es una de las ms
subestimadas de las tareas en un
proyecto de Data Warehouse. Las
principales sub etapas de esta zona
del ciclo de vida son: la extraccin, la
transformacin y la carga (ETL
process). Se definen como procesos
de extraccin a aquellos requeridos
para
obtener
los
datos
que
permitirn efectuar la carga del
Modelo Fsico acordado. As mismo,
se definen como procesos de
transformacin a los procesos para
convertir o recodificar los datos
fuente a fin poder efectuar la carga
efectiva del Modelo Fsico. Por otra
parte, los procesos de carga de datos
son los procesos requeridos para

5.6 Diseo de la Arquitectura Tecnolgica


Los
ambientes
de
Data
Warehousing
requieren
la
integracin
de
numerosas
tecnologas. Se debe tener en
cuenta
tres
factores:
los
requerimientos del negocio, los
actuales ambientes tcnicos y las
directrices tcnicas estratgicas
futuras planificadas para de esta
forma poder establecer el diseo
de la arquitectura tcnica del
ambiente de Data Warehousing.

5.7 Seleccin de Productos e Instalacin


Utilizando
el
diseo
de
arquitectura tcnica como
marco, es necesario evaluar
y seleccionar componentes
especficos de la arquitectura
como ser la plataforma de
hardware, el motor de base
de datos, la herramienta de
ETL
o
el
desarrollo
pertinente, herramientas de
acceso, etc.

5.8 Especificaciones de Aplicaciones para


usuarios finales
No todos los usuarios del Data
Warehouse necesitan el mismo
nivel de anlisis. Es por ello que
en esta etapa se identifican los
diferentes roles o perfiles de
usuarios para determinar los
diferentes tipos de aplicaciones
necesarias en base al alcance de
los diferentes perfiles (gerencial,
analista del negocio, vendedor,
etc.)

5.9 Desarrollo de Aplicaciones para usuarios


finales
Siguiendo a la especificacin de las aplicaciones para usuarios
finales, el desarrollo de las aplicaciones de los usuarios finales
involucra configuraciones del metadata y construccin de reportes
especficos.
Una vez que se ha cumplido con todos los pasos de la
especificacin y se tiene la posibilidad de trabajar con algunos
datos de prueba, comienza el desarrollo de la aplicacin (Kimball,
1998).

5.10 Implementacin
La implementacin representa la analoga de la tecnologa, los
datos y las aplicaciones de usuarios finales accesibles desde el
escritorio del usuario del negocio.
Hay varios factores extras que aseguran el correcto funcionamiento
de todas estas piezas, entre ellos se encuentran la capacitacin, el
soporte tcnico, la comunicacin, las estrategias de feedback.
Todas estas tareas deben ser tenidas en cuenta antes de que
cualquier usuario pueda tener acceso al Data Warehouse.

5.11 Mantenimiento y Crecimiento


Data Warehousing es un proceso (de etapas bien definidas, con
comienzo y fin, pero de naturaleza espiral) pues acompaa a la
evolucin de la organizacin durante toda su historia.
Se necesita continuar con los relevamientos de forma constante
para poder seguir la evolucin de las metas por conseguir.
Segn afirma Kimball (1998), si se ha utilizado el BDL el Data
Warehouse est preparado para evolucionar y crecer.
Al contrario de los sistemas tradicionales, los cambios en el
desarrollo deben ser vistos como signos de xito y no de falla.

5.12 Gerenciamiento del Proyecto


El gerenciamiento del proyecto
asegura que las actividades
del BDL se lleven en forma y
sincronizadas.
Entre
sus
actividades
principales se encuentra el
monitoreo del proyecto y la
comunicacin
entre
los
requerimientos del negocio.
Asimismo,
determina
las
restricciones de informacin
para
poder
manejar
correctamente
las
expectativas
en
ambos

Laboratorio 2: Introduccin al Data Mart y el


Data Warehouse

Actividad 3: Cuestionario de Preguntas

Tiempo: 20 minutos

Cuestionario de Preguntas

Actividad 4: : Desarrollo de un caso siguiendo la


metodologa de Ralph Kimball.

Tiempo: 20 minutos

Desarrollo de un caso siguiendo la metodologa de Ralph


Kimball

S-ar putea să vă placă și