Sunteți pe pagina 1din 30

Inteligencia de Negocios - BI

Semana 06

Dimensionamiento
de la base de datos

Michaela Pacheco Valdez


Ing. de Sistemas
Mixaela.pacheco@gmail.com

Objetivos
Base

de datos multidimensional.

Tablas

de dimensiones.

Dimensin

tiempo.

Inteligencia de Negocios

Modelo Multidimensional
El modelo multidimensional, es mucho menos riguroso en cuanto a
organizacin; le permite a analistas y diseadores ms flexibilidad en
el diseo, para lograr un mayor desempeo y optimizar la
recuperacin de la informacin, desde un punto de vista ms cercano
al usuario final.

El modelo multidimensional produce una base de datos que es


simple de navegar y encuestar

Existen menor cantidad de tablas y relaciones en este, que en el


modelo entidad-relacin

Inteligencia de Negocios

Modelo Multidimensional
El modelo multidimensional dentro del entorno de las bases de datos,
es una disciplina de diseo que se sustenta en el modelo entidadrelacin y en las realidades de la ingeniera de texto y datos
numricos.
Modela las particularidades de los procesos que ocurren en una
organizacin, dividindolos en mediciones y entorno.
Las medidas son en su mayora, medidas numricas, y se les
denomina hechos. Alrededor de estos hechos existe un contexto que
describe en qu condiciones y en qu momento se registr este hecho
Aunque el entorno se ve como un todo, existen registros lgicos de
diferentes caractersticas que describen un hecho
Inteligencia de Negocios

Modelo Multidimensional
por ejemplo, si el hecho referido, es la venta de un
producto en una cadena de tiendas, se podra dividir el
entorno que rodea al hecho de la cantidad vendida, en el
producto vendido, el cliente que lo compr, la tienda y la
fecha en que se realiz la venta. A estas divisiones se le
denomina dimensiones y a diferencia de los hechos que son
numricos,
estos
son
fundamentalmente
textos
descriptivos.

Inteligencia de Negocios

Modelo Multidimensional
Las herramientas de DW y OLAP se basan en un modelo de datos
multidimensional
Este modelo ve los datos como cubosUn CUBO permite que los
datos sean modelados y visualizados en mltiples dimensiones.

Un cubo esta definido por 2 componentes:


Tablas de dimensiones
Tablas de Hechos

Dimension Tables: tales como items (nombre, tipo, marca), o tiempo (das, semanas,
meses, aos)
Fact Table: Contiene las medidas (ej: ventas en pesos) y las claves para cada una de las
tablas de dimensiones relacionadas.
Inteligencia de Negocios

Modelo Multidimensional
En la literatura de almacenamiento de datos, un cubo de
base de n-D se llama un cuboide de base. Ms a la cima del
esta el cuboide 0-D, que tiene el ms alto nivel de
resumen, se llama el cuboides pice. El entramado de
cuboides forma un cubo de datos.

Inteligencia de Negocios

Inteligencia de Negocios

Tablas de dimensiones
Una tabla de dimensin contiene, por lo general, una llave simple y un
conjunto de atributos que describen la dimensin.
Las tablas de dimensin, son las que alimentan a las tablas de hechos,
la llave de un hecho es la composicin de las llaves de las dimensiones
que estn conectados a esta, por tanto, los atributos que conforman
las tablas de dimensiones tambin describen el hecho
Los atributos dimensionales son fundamentalmente textos descriptivos,
estos desempean un papel determinante, son la fuente de gran parte
de todas las necesidades que deben cubrirse, adems, sirven de
restricciones en la mayora de las consultas que realizan los usuarios.

Inteligencia de Negocios

Tablas de dimensiones
Representa lo que se quiere guardar en relacin a un
problema.
Cada tabla a su vez puede tener asociadas otras tablas.
Las Tablas de Dimensin pueden ser especificadas por
usuarios o por expertos o generadas automticamente y
ajustadas a partir de la distribucin de los datos.

Inteligencia de Negocios

Tablas de dimensiones
Claves Naturales vs Claves Subrogadas Las claves existentes en los
OLTP se denominan claves naturales;
Las claves subrogadas son aquellas que se definen artificialmente, son:
de tipo numrico secuencial,
no tienen relacin directa con ningn dato
y no poseen ningn significado en especial.

Inteligencia de Negocios

Modelo Multidimensional: Por qu


usar claves subrogadas?
Fuentes heterogneas. El DW suele alimentarse de diferentes
fuentes, cada una de ellas con sus propias claves, por lo que es
arriesgado asumir un cdigo de alguna aplicacin en particular.
Ejemplo: Dos sistemas con claves su propia tabla de
localidades.. Qu ID le ponemos en el DW?
Cambios en las aplicaciones origen. Puede pasar que cambie la
lgica operacional de alguna clave que hubisemos supuesto
nica, o que ahora admite nulos.
Ejemplo: Algo raro... Qu pasa si uno de los empleados no tiene
nro de documento?
Inteligencia de Negocios

Modelo Multidimensional: Por qu


usar claves subrogadas?
Rendimiento. Dado que un entero ocupa menos espacio que una
cadena y adems se lee mucho ms rpido. El problema en si no
es el espacio, sino el tiempo de lectura.
Las claves subrogadas forman parte de la tabla de hechos, cada
cdigo se repite miles/millones de veces. Ser necesario
optimizar todo lo posible.
Lo mejor es crear nuestras propias claves subrogadas desde el
inicio del proyecto.

Inteligencia de Negocios

Tabla de Hechos
Las tablas de hechos, representan los procesos que ocurren en
la organizacin, son independientes entre s (no se relacionan
unas con otras).
En estas, se almacenan las medidas numricas de la
organizacin. Cada medida, se corresponde con una
interseccin de valores de las dimensiones y generalmente se
trata de cantidades numricas, continuamente evaluadas y
aditivas.
La razn de estas caractersticas, es que facilita que los miles
de registros que involucran una consulta, sean comprimidos
ms fcilmente y se pueda dar respuesta con rapidez, a una
solicitud que abarque gran cantidad de informacin
Inteligencia de Negocios

Tabla de Hechos

El
modelo
multidimensional
es
organizado
generalmente entorno a un tema.
Ej: Ventas, Precipitaciones, etc.
Ese tema tiene que estar representado en la Tabla de
Hechos.
Los hechos son medidas numricas, que se expresan
generalmente en cantidades que van a permitir expresar
las relaciones entre las dimensiones.
La TH contiene contiene los nombres de los hechos o
las medidas y tambin las claves para cada una de las
Tablas de Dimensiones que vamos a relacionar.
Inteligencia de Negocios

Medidas
Una medida consiste de dos componentes:
propiedad numrica de un hecho, como el precio de
venta o ganancia
una frmula, por lo general una funcin de agregacin
simple, como suma, que pueden combinar varios valores de
medida en una sola.
Las medidas pueden ser de tres clases:

Inteligencia de Negocios

Medidas
Las medidas pueden ser de tres clases:
Aditivas: Pueden ser combinadas a lo largo de una dimensin
Ventas totales del producto, localizacin, y el tiempo, porque
esto no causa ningn solapamiento entre los fenmenos del
mundo real que generaron los valores individuales.
Semiaditivas: No se las puede combinar a lo largo de una o ms
dimensiones Resumir inventario a travs de productos y
almacenes es significativo, pero sumando los niveles de inventario
a travs del tiempo no tiene sentido
No Aditivas: No se puede combinar a lo largo de cualquier
dimensin. Por lo general debido a que la frmula elegida impide
que se combinen
Inteligencia de Negocios

DIMENSIN TIEMPO
La dimensin ms importante de un Data Warehouse, es la
dimensin tiempo.
Cada hechos que se registra en un tabla de hecho, tiene asociada
una marca de tiempo, es decir, en qu momento ocurri este
hecho. Esto permite el almacenamiento y anlisis histrico de la
informacin. La insercin de datos, en la base de datos
multidimensional, se hace por intervalos de tiempo, lo cual
asegura un orden implcito.5

Inteligencia de Negocios

Modelado conceptual del Data


Warehouses

El modelo de datos de ER es utilizado en el diseo de


bases de datos relacionales donde el esquema de la base
consiste en un conjunto de entidades y relaciones entre
ellas. Este modelo es apropiado para OLTP
Un DW sin embargo, requiere un esquema conciso y
orientado a un tema que facilite la tarea de OLAP
El abordaje ms popular para diseo de DW es el modelo
multidimensional
Inteligencia de Negocios

Tipo de modelado multidimensional


Este modelo, puede existir en forma de:
Esquema de Estrella
Esquema de copo de nieve
Constelacin de Hechos

Inteligencia de Negocios

Esquema de Estrella
Es el esquema ms utilizado, donde el DW contiene:
1) una gran tabla central (Fact Table) que contiene el volumen de
datos sin redundancia
2) Un conjunto de tablas relacionadas (Dimension Tables) una por
cada dimensin. Cada dimensin es representada por una
nica tabla y cada tabla contiene un conjunto de atributos.
Los Atributos de una dimensin pueden formar una Jerarqua
(Orden Total) o una grilla (lattice) (Orden Parcial)

Inteligencia de Negocios

Esquema de Estrella

Inteligencia de Negocios

Un modelo multidimensional que no tiene


jerarquas, se denomina modelo en

Esquema de copo de nieve


Se trata de una variante del esquema Estrella donde
algunas tablas de dimensiones son Normalizadas.
Con esta Normalizacin se generan tablas adicionales y
el grfico resultante forma una figura similar a un copo
de nieve.

Inteligencia de Negocios

Esquema de copo de nieve

Inteligencia de Negocios

Esquema copo de nieve


La ventaja fundamental que proporciona este esquema, es
que se ocupa menor espacio de almacenamiento, sin
embargo, aumenta el nmero de tablas con las que el
usuario debe interactuar e incrementa la complejidad de
las consultas a realizar

Inteligencia de Negocios

Esquema constelacin de hechos


Son mltiples tablas de hechos que comparten Tablas de
Dimensiones
visto como una coleccin de esquemas de estrella, de ah el
nombre.

Inteligencia de Negocios

Conclusiones

El esquema estrella proporciona mayor compresin,


navegabilidad, es ms cercano a cmo el usuario final
refleja la visin de una consulta empresarial. Se
recomienda, de ser posible, que se emplee un esquema
estrella antes que un copo de nieve.
El modelo multidimensional obtiene mayor velocidad de
recuperacin de las consultas en comparacin con el
modelo Entidad-Relacin.

Inteligencia de Negocios

Bibliografa

1. MNDEZ, ANDREA Y ARIEL MRTIRE: "Fundamentos de Data


Warehouse, Centro de Actualizacin Permanente en
Ingeniera del Software, Escuela de Postgrado, Instituto
Tecnolgico, Buenos Aires, Argentina, 2004.
2. KIMBALL, RALPH: Is ER Modeling Hazardous to DSS,
October, 1995, http://www.dbmsmag.com/9510d05.html,
August, 2005.
3. Fact Tables and Dimension Tables, January, 2003,
http://www.intelligententerprise.com/030101/
602warehouse1_1.jhtml, July, 2005.
Inteligencia de Negocios

Gracias por su atencin