Sunteți pe pagina 1din 42

Sistemas de Informacin Gerencial

Tema 6: Inteligencia de Negocios: Modelo Dimensional

Ing. Francisco Rodrguez Novoa

1
INDICE

OLTP. OLAP

Modelo Estrella. Modelo Copa de Nieve

Modelo Dimensional

2
Mapa de Inteligencia de Negocios

Inteligencia
de Negocios

Metodologa
Kimball

Modelo
Planeamiento Modelado Modelado Minera de
del ETL
del Proyecto Dimensional Fsico Datos
Negocio

Reportes
MODELOS RELACIONALES Y DIMENSIONALES
Dos tcnicas
Modelo E-R Modelo dimensional
Entidades Hechos
Atributos Dimensiones
Relaciones Medidas
OLTP (On Line Transactional Process)

Son sistemas de informacin operacionales que tienen


transacciones en lnea y de esa manera se van aadiendo
datos.
Gran detalle de cada operacin.
Lgica

El Diseo Transaccional es:

Orientado a aplicaciones con


movimientos constantes.
Datos normalizados. Se
busca ahorrar espacio de
almacenamiento.
Datos voltiles
No existe sumarizacin de
datos.
Grandes niveles de detalle.
OLAP (Online Analytical Process)

Tecnologa que permite la


explotacin de datos en
diferentes niveles
organizacionales y
periodos de tiempo
Lgica

El Data Warehouse esta:


Orientado a reas de la
organizacin
Integrado
Los datos no son voltiles
Diversos niveles de detalle
con sumarizacines.
Se disminuye la cantidad de
ligas con modelos tipo
estrella o copo de nieve.
Conceptos Generales
Fundamentos.
Registrar y Analizar y
Transacciones
Controlar (OLTP) Evaluar (OLAP)

Ventas
Inventarios Velocidad de Transaccin Velocidad de Consultas
Contabilidad Integridad de Informacin Apoyo Toma de Decisiones
Recursos Humanos Evitar Redundancias Desnormalizado
Etc- 3 Forma Normal

On-Line Transaction On-Line Analytical


Processing Processing
10
Como operan las B.D. Relacionales

Los datos se almacenan en tablas

Variable Meses Cantidad Productos

Sales January 25000 Large


Expenses January 15000 Large
Cost of goods January 5000 Large
Sales February 27000 Large
Expenses February 20000 Large
Cost of goods February 6000 Large
Sales March 2700 Large
Expenses March 8000 Large
Cost of goods March 19000 Large
Sales Qtr1 54700 Large
Sales April 23000 Medium
Expenses April 6100 Medium
Cost of goods April 1800 Medium
Sales May 7600 Medium
Expenses May 1200 Medium
Cost of goods May 2000 Medium
Lgica
Variable Months Amount Product

Sales January 25000 Large


Expenses January 15000 Large de esta estructura
Cost of goods January 5000 Large
Sales February 27000 Large
Expenses February 20000 Large
a esta
Cost of goods February 6000 Large
Sales March 2700 Large se necesita
Expenses March 8000 Large
Cost of goods March 19000 Large
Sales Qtr1 54700 Large
Sales April 23000 Medium
Expenses April 6100 Medium
VariableApril
Cost of goods January
1800 February
MediumMarch April May June
Sales May 7600 Medium
Expenses May 1200 Medium
Cost of goods
Sales May 2000 27000
25000 Medium24000 28000 30000 29000
Expenses 15000 20000 15000 17000 19000 14000
Cost of goods 5000 6000 5000 7000 7000 6000
OLAP
Vista Multidimensional
Poder observar los datos desde distintas perspectivas.

Denver Profit
LA Accounts by Product Total Exp Products by Time
SF Margin
West Cogs
February March East West
Actual Budget Actual Budget Actual Budget Actual Budget
Sales Camera TV Jan
TV Feb
VCR position only Mar position only
Audio Qtr 1
Margin Camera VCR Jan
TV Feb
VCR Mar
Audio Qtr 1

Apr Apr
Mar Products by Region Mar Regions by Scenario
Feb Feb
Jan Jan
Actual Budget Sales Margin
Sales Margin Sales Margin TV VCR TV VCR
TV East East Actual
West Budget
South Forecast
Total Variance
VCR East West Actual
West Budget
South Forecast
Total Variance
Conceptos Generales
Caractersticas de un DataWarehouse

Orientado a Los datos se organizan y estructuran de acuerdo a las reas


Temas temticas que son de inters para los directivos de la empresa y
no en funcin de procesos operacionales especficos. Todos los
datos relativos a una misma entidad quedarn en una tabla.

Integrado Debido a que la informacin procede desde distintos sistemas,


es tarea del DW integrar las diversas fuentes y normalizar los
datos.

Variantes en Un DW se organiza como una sucesin de fotografas de la


el Tiempo organizacin o empresa, cada una asociada a un periodo o punto
especfico del tiempo, lo que permite realizar anlisis en funcin
del tiempo, con la finalidad de realizar pronsticos y anlisis de
tendencias.

No Voltil No se realizan actualizacin o eliminaciones de los datos, los


datos se insertan como nuevos registros y por tanto no
sobrescriben los existentes.
14
Conceptos Generales
Componentes del Cubo

Tabla de Almacena los indicadores del negocio (datos numricos),


Hechos tanto bsicos como elementos calculados.

Tabla de Almacena los datos descriptivos, por lo general son tablas


Dimensiones con un porcentaje muy bajo de filas en relacin a las tablas
de Hechos, pero pueden contener muchas ms columnas.

Una correcta y completa definicin de campos en la tabla de


dimensiones puede ayudar a realizar anlisis robusto sobre
los datos.
Conceptos Generales
Topologa

Estrella Las dimensiones se relacionan directamente con la tabla de


hechos.

Por lo general esta estrategia es utilizada cuando hay grandes


volmenes de informacin y/o cuando existe un proceso
robusto de administracin de Informacin (por ejemplo EIAD).

Copo de Las dimensiones se pueden relacionar con las tablas de


Nieve hechos, o con otras dimensiones.

Esta estrategia es mejor para la administracin directa en el


modelo de DW.

16
Modelo Estrella
Eficiencia

Soportado por mltiples


RDBMS

Anlisis de datos de menor


complejidad, debido a la de-
normalizacin
Modelo Copo de Nieve
Mayor normalizacin, es
decir, los niveles de las
jerarquas se normalizan.

Mayor flexibilidad

Mayor dificultad de
mantenimiento

Joins ms costosos

Menos registros en las


dimensiones.
Modelado Dimensional
Es una adaptacin del modelo relacional.
Consiste de tablas de hechos que se caracterizan usando
dimensiones y medidas.
La informacin sobre un hecho (actividad) se representa
mediante indicadores (medidas o atributos de hecho).
La informacin de cada dimensin se representa por un
conjunto de atributos (atributos de dimensin).
Una dimensin es el contexto de un hecho, tienden a ser
discretas y jerrquicas.
Un indicador es una cantidad que describe el hecho, debe ser
agregables.
Conceptos bsicos

1. Hecho. Evento, actividad, item transaccin del negocio.

2. Medida. Atributo o medida de hechos, mtricas del


negocio

3. Dimensin. Caracterstica de un hecho.

4. Jerarqua. Relaciones padre-hijo dentro de una


dimensin

5. Tabla de hechos: Almacena eventos y las mtricas.

6. Tabla de dimensin. Almacenan las dimensiones.


Hechos
Representan un evento o actividad especfica, tiene
dimensiones y medidas.
Representan un item de negocio, una transaccin o un evento
que tiene significancia para el negocio.
Corresponden a una coleccin de items de datos y datos de
contexto.
Son aquellos datos que residen en una tabla de hechos y que
son utilizados para crear indicadores, a travs de
sumarizaciones preestablecidas.
Un hecho debe estar relacionado al menos con una
dimensin: El tiempo.
Medidas Mtricas - Hechos
Es un atributo numrico de un hecho que representa la
performance o comportamiento del negocio relativo a la
dimensin

Ejemplos:
Ventas en $$
Cantidad de productos
Total de transacciones
Cantidad de pacientes admitidos
Llamadas efectuadas.
ImporteTotal = precioProducto * cantidadVendida
Rentabilidad = utilidad / PN
CantidadVentas = cantidad
PromedioGeneral = AVG(notasFinales)
Hechos o medidas
Representan los valores que son analizados.

Caractersticas de las medidas:


Deben ser numricas. Porque estos valores son las bases de
las cuales el usuario puede realizar clculos.
Cruzan todas las dimensiones en todos los niveles.

Si la medida es no numrica debemos codificarla a un valor


numrico y cuando tengamos que exponerla decodificarla
para mostrarla con el valor original.
Hechos o medidas
Las medidas pueden clasificarse en:
Naturales.
Son aquellas que se obtiene por agregacin de los datos
originales.
Suma: suma los valores de las columnas
Cuenta: conteo de los valores
Mnima: valor mnimo
Mxima: valor mximo
Cuenta de Distintos: valores diferentes
Calculadas
Si se derivan de una medida natural.
Clculos Matemticos
Expresiones condicionales
Alertas
Dimensiones
Es una caracterstica de un hecho que permite su anlisis
posterior, en el proceso de toma de decisiones.
Determina el contexto del hecho (quin particip, cundo
y donde pas y su tipo).

Es una entidad de negocios respecto de la cual se deben


calcular las mtricas (clientes, productos, tiempo)

Tienden a ser discretas y jerrquicas <pas, regin,


departamento, provincia, distrito>.

Es una coleccin de miembros o unidades o individuos


del mismo tipo que permite categorizar un hecho.
Dimensiones 3

Se utilizan como parmetros para los anlisis OLAP

Las dimensiones habituales son:

Dimensin Miembro
Tiempo Meses, Trimestre, Aos
Geografa Pas, Regin, Ciudad
Cliente Id Cliente
Vendedor Id Vendedor
Ejemplo
Ejemplo
The Time Dimension

Time is critical to the data warehouse.


A consistent representation of time is required for
extensibility.

Time
Sales fact
dimension
How and where should it be stored?
Granularidad
La granularidad es el nivel de detalle en que se almacena la
informacin.

Por ejemplo:
Datos de ventas o compras de una
empresa, pueden registrarse da a da
Datos pertinentes a pagos de sueldos o
cuotas de socios, podrn almacenarse
a nivel de mes.

A mayor nivel de detalle, mayor posibilidad analtica, ya que


los mismos podrn ser resumidos o sumarizados.
Los datos con granularidad fina (nivel de detalle) podrn ser
resumidos hasta obtener una granularidad media o gruesa.
No sucede lo mismo en sentido contrario.
Tablas de Hechos
Dimensiones
Las tablas de hechos contienen
las dimensiones y las medidas
de los hechos.
Los hechos o medidas son los
valores de datos que se
analizan (son numricos).
La tabla de hechos tiene una Clave primaria
compuesta por las claves
primarias de las tablas de
dimensiones relacionadas a
este. Medidas o
hechos
Tabla de dimensiones 6

Definen la organizacin lgica de los datos.

Tiene una PK (nica) y columnas de referencia:


Clave principal (PK) o identificador nico.
Clave forneas.
Datos de referencia primarios (identifican la dimensin)
Datos de referencia secundarios (complementan la descripcin).
No siempre la PK del OLTP, corresponde con la PK de la tabla
de dimensin relacionada.
Ejercicio
Etapas en la construccin de un modelo dimensional:

Requerimientos
0 del usuario

Construccin Armado de la
Definicin de
de las Tabla de
las Medidas
2 Dimensiones 3 Hechos 4

Decidir la
granularidad
1
Requerimientos del usuario

Dimensiones

Medidas Tiempo Sucursal Vendedor Cliente Producto

Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X

Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
Decidir la granularidad
La granularidad:
Es el nivel de detalle al que se desea almacenar
informacin sobre la actividad a modelar.
Define el nivel atmico de datos en el almacn de datos.
Determina el significado de las tuplas de la tabla de
hechos.
Determina las dimensiones bsicas del esquema.

Por ejemplo en la dimensin Sucursal:


Decidir la granularidad
Ejemplo de la dimensin fecha. Se desea los datos por:
Informacin anual
Informacin semestral
Informacin trimestral + granularidad
Informacin mensual. .... + detalle
Informacin semanal
Informacin diaria
Transaccin en el OLTP
Construccin de las dimensiones
Identificar las dimensiones que caracterizan el proceso al
nivel de detalle (grnulo) que se ha elegido.
De cada dimensin se debe decidir los atributos
(propiedades) relevantes para el anlisis de la actividad.
Entre los atributos de una dimensin existen jerarquas
naturales que deben ser identificadas (da-mes-ao)

Tiempo. Cundo se produce la actividad


Sucursal.Donde est ubicado el almacn
Vendedor. Quin ha vendido
Cliente. Quin es el destinatario de la actividad
Producto. Cul es el objeto de la actividad
Dimensin Tiempo Dimensin Sucursal Dimensin Vendedor

* Ao * Sucursal * Sucursal
** Semestre ** Tipo Sucursal ** Seccin Dimensin Cliente
*** Trimestre *** Pas *** Vendedor
**** Mes **** Provincia * Pas
***** Ciudad ** Provincia
***** Da
*** Ciudad
**** Razn Social

Dimensiones

Medidas Tiempo Sucursal Vendedor Cliente Producto

Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X

Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
Dimensiones

Medidas Tiempo Sucursal Vendedor Cliente Producto

Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X

Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
Fact_Ventas
Tabla de Hechos 3
ID_Tiempo
ID_Producto
ID_Cliente
ID_Vendedor
ID_Sucursal

Dimensiones

Medidas Tiempo Sucursal Vendedor Cliente Producto

Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X

Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
Definicin de las medidas

Fact_Ventas Fact_Ventas
Fact_Ventas

ID_Tiempo ID_Tiempo
ID_Producto ID_Fecha
ID_Producto
ID_Cliente ID_Producto
ID_Cliente
ID_Vendedor ID_Cliente
ID_Vendedor
ID_Sucursal ID_Vendedor
ID_Sucursal
Ventas_Importe
Ventas_Costo
Ventas_Unidades

Medidas
FIN

42

S-ar putea să vă placă și