Documente Academic
Documente Profesional
Documente Cultură
FACULTAD DE INGENIERA
ESCUELA DE INGENIERIA DE SISTEMAS
INTELIGENCIA DE NEGOCIOS
Fundamentos de OLAP
Tabla de Contenido
Arquitectura de un DWH
OLTP
Load Manager
DW Manager
Query Manager
Objetivos
1. Presentar la arquitectura de una DWH
2. Presentar los conceptos bsicos necesarios para
entender la tecnologa OLTP
3. Presentar ejemplos sencillos de cada uno de los
conceptos relacionados al OLTP
ARQUITECTURA DE UN
DATA WAREHOUSING
Arquitectura de un DWH
Fuentes
externas
Adquisicin
de datos
Integracin
de Datos
OLAP
Server
Datos
Extraccin de
datos
Consultas y
anlisis de
datos
OLAP
Consultas/
Reportes
Warehouse
Minera
de datos
Metadata
Fuentes
internas
Supervisin
Administracin
Construccin y
mantenimiento
Facultad de Ingeniera Escuela de Ingeniera de Sistemas
Arquitectura
Los datos son extrados desde aplicaciones, bases de datos, archivos, etc.
Los datos son integrados, transformados y limpiados, para ser cargados en el DW
La informacin del DW se estructura en cubos multidimensionales, los cuales
preparan esta informacin para responder a consultas dinmicas con una buena
performance.
Los usuarios acceden a los cubos multidimensionales del DW utilizando herramientas
de consulta, exploracin, anlisis, reportes, etc.
Facultad de Ingeniera Escuela de Ingeniera de Sistemas
OLTP
OLTP (On Line Transaction
Processing), informacin transaccional
generada por la empresa en su
operacin.
Diferentes formatos, procedencia,
funcin, configuracin.
Archivos de textos.
Hipertextos.
Hojas de clculos.
Informes semanales, mensuales,
anuales, etc.
Bases de datos transaccionales.
Facultad de Ingeniera Escuela de Ingeniera de Sistemas
ETL
ETL (Extraccin, Transformacin y Carga).
Extraccin. Desde los OLTP
Transformacin. Manipulacin, integracin, solucin de
inconsistencias.
Carga. Carga en el DWH
ETL. Extraccin
Extrae los datos relevantes desde diversas
fuentes OLTP.
CRM
ERP
TXT
Aplicaciones
a la medida
Otras
ETL . Transformacin
Convierte datos inconsistentes
en datos compatibles y
congruentes, para ser cargados
en el DW.
Codificacin.
Medida de atributos.
Convenciones de
nombramiento.
Fuentes mltiples.
Archivo
s planos
BDR
ERP
CRM
ETL
ETL
BD Temporal
ETL
Sistema
Objetivo
Evaluar
Calidad
de datos
Registros de
excepcin
Correcci
n de datos
por el
usuario
ETL . Transformacin
Codificacin.
Medida de atributos.
Convenciones de nombramiento.
Fuentes mltiples.
ETL. Transformacin
Datos no existentes
El dato no existe por que:
No fue registrado en el momento
En la integracin de BD una de
ellas no tiene esa columna
Datos extremos
Se presenta por que:
Caso excepcional
Error de digitacin.
ETL. Carga
Carga el DWH con:
Datos transformados que
residen en tablas temporales.
Datos de OLTP que tienen
correspondencia directa.
El proceso ETL
DBR
BMDM
CUBO
Product
Customer
Employee
Total
Quantity
Freight
Descount
Modelos Multidimensionales
Tabla de
hechos
Esquema en Estrella
(Star Scheme).
Tablas de
dimensiones
Dimensiones
Medidas
Esquema Copo de
Nieve
(Snowflake Scheme).
Esquema Constelacin
(Starflake Scheme).
Facultad de Ingeniera Escuela de Ingeniera de Sistemas
Esquema Estrella
Tabla de
hechos
Tablas de
dimensiones
Dimensiones
Medidas o hechos
Esquema Constelacin
Tabla de dimensiones
Definen la organizacin lgica de los datos.
Tablas de Hechos
Las tablas de hechos contienen
hechos.
Los hechos o medidas son los
valores de datos que se analizan
(son numricos).
La tabla de hechos tiene una clave
primaria compuesta por las claves
primarias de las tablas de
dimensiones relacionadas a este.
Dimensiones
Medidas o
hechos
Hechos o medidas
Las medidas representan los valores que son
analizados:
Hechos o medidas
Caractersticas de las medidas:
Deben ser numricas.
Cruzan todas las dimensiones en todos los niveles.
Cubos Multidimensionales o
hipercubos
La idea de multidimensionalidad
Region
Sales
granularity
Product
category
Year
Quarter
Product
type
Product
3 dimensiones
El Cubo
Regin
Mobiles
Fax
Standard
Vaud
Fribourg
Neuchatel
1999
Tipo de
Producto
1998
1997
Ao
Ventas de telefonos Standard en 1997
en la regin Vaud
29
Granularidad
La granularidad es el nivel de detalle en que se
almacena la informacin.
Por ejemplo:
Datos de ventas o compras de una
empresa, pueden registrarse da a da
Datos pertinentes a pagos de sueldos o
cuotas de socios, podrn almacenarse
a nivel de mes.
Consultas
Ejecuta consultas relacionales, tales como Join y
agregaciones, y de consultas propias del anlisis
de datos, como drill-up y drill-down.
Una consulta consiste en obtener indicadores
desde una tabla de hechos, restringidas por las
propiedades o condiciones de los atributos.
Las operaciones pueden ser:
Drill-down.
Drill-up.
Drill-across.
Roll-across.
Pivot.
Page.
Ejemplo
Sea el siguiente esquema estrella
Matricialmente
Drill-down
Datos
originales
Drill-down
Matricialmente
Drill-up
Datos
originales
Drill-up
Se analiza a
mayor detalle
agregando un
criterio ms
Matricialmente
Drill-across
Datos
originales
Drill-across
Matricialmente
Roll-across
Datos
originales
Roll-across
Selecciona el
orden de
visualizacin
de atributos e
indicadores
Matricialmente
Roll-across
Datos
originales
Pivot
Page
Presenta el cubo dividido en secciones, mediante
valores de un atributo, como si se tratase de
pginas de un libro:
Page
Pivot permite realizar las siguientes acciones:
1. Mover un atributo o indicador desde el encabezado
de fila al encabezado de columna.
2. Mover un atributo o indicador desde el encabezado
de columna al encabezado de fila.
3. Cambiar el orden de los atributos o indicadores del
encabezado de columna.
4. Cambiar el orden de los atributos o indicadores del
encabezado de fila.
Matricialmente
Pgina 1
Datos
originales
Page
Matricialmente
Pgina 1
Datos
originales
Page
PREGUNTAS