Documente Academic
Documente Profesional
Documente Cultură
de Soluciones BI
2
Datos fuente
La primera capa considera todas las fuentes de datos
relevantes para el BI a implementar.
3
Datos fuente
Estas pueden encontrase en diversos medios y formatos:
Finanzas
Hojas de Cálculo
Inventario y Archivos planos
Ventas
RRHH
4
Capa de integración de datos
Esta capa es la encargada de la integración de los datos desde
las múltiples fuentes existentes para la construcción del Data
Warehouse y los Data Marts de la base analítica. Se utilizan
rutinas para Extracción, Transformación y Carga (ETL).
Las rutinas ETL tienen la función de manipular los datos de las
distintas fuentes de datos a fin de integrarlos todos al Datawarehouse
según formatos y estructuras que requieren.
Integración de fuentes heterogéneas
Limpia los datos removiendo problemas transaccionales y
asegurando consistencia en los datos.
5
Capa de integración de datos
Para construir las rutinas de integración de esta capa, es
necesario conocer:
La estructura del Datawarehouse y/o Datamart a poblar.
La naturaleza de los datos fuentes:
• Estructura: (Columnas, rango de valores, tipos de datos)
• Dependencias: (relaciones entre las fuentes, claves primarias,
claves foráneas, elementos asociados)
• Redundancia: Identificar datos que se solapan, repetición de
datos, columnas con distintos nombres que tienen los mismos
valores o columnas con nombres similares que contienen
distintos valores.
• Datos: Identificar los datos claves para poblar el DWH/DM.
6
Capa de integración de datos
Los procesos de ETL consideran:
7
Capa de integración de datos
Los procesos de ETL consideran:
8
Capa de integración de datos
2. Transform: Algunos ejemplos de transformaciones
Selección de columnas
Generar nuevos valores calculados
(monto_venta*cantidad*precio_unitario)
Codificar valores de formato libre para que correspondan al
formato destino.
Filtrar
Ordenar
Unir datos de múltiples fuentes
Agregación de los datos
Generación de claves sustitutas
Trasponer o pivotear
Seperar columnas (por ejemplo fecha y horas)
Validaciones de datos
…
9
Capa de integración de datos
Los procesos de ETL consideran:
2. Load: Carga de los datos a la base analítica (Data Marts /
Datawarehouse/Staging Area (ODS))
10
Capa de integración de datos
Los procesos de ETL se pueden implementar con:
1. Herramientas de integración de datos:
Pentaho Data Integrator (Kettle)
Oracle Warehouse Buider (OWB)
Data Integrator (SAP Business Object)
Oracle Data Integrator (ODI)
Microsoft Integration Services
SaS Dataflux
BITool
Entre otros
2. Lenguajes de datos
(SQL, PLSQL, Transact SQL)
3. Otros Lenguajes
(Java, VB.net, C#, C++, etc.) 11
Capa analítica
La base analítica es el núcleo del sistema. Puede
contener diversos componentes:
12
Capa analítica
Área intermedia o de integración de datos
(Staging área)
14
Capa analítica
Bodegas de Datos (Datamart):
“Se refiere a una vista del Datawarehouse orientada solo a un
aspecto de la organización. Contiene mucha menos cantidad de
datos que el datawarehouse y es el objeto de procesamiento
analíticos por parte del usuario final” [Oracle98].
15
Capa analítica
Existen dos corrientes respecto de los Data Warehouse
1990
Inmon publica “Building the Data Warehouse”.
1996
Kimball publica “The Data Warehouse Toolkit”.
2002
Inmon:
• La arquitectura como una colección de fuentes diversas.
• El almacén de datos orientado a temas, variante en el tiempo, no
volátil e integrado.
• Enfoque top down.
Kimball:
• Múltiples bases de datos llamadas data marts que son organizadas
por procesos de negocio.
• Enfoque bottom-up.
16
Capa analítica
Kimball
17
Capa analítica
Inmon
18
Método Descendente (Top Down)
19
Arquitectura Datawarehouse segun Inmon
20
Método Ascendente (Buttom Up)
21
Arquitectura Datawarehouse según Kimball
22
Métodos de Diseño de un DW
23
Estructura de la Metodología Kimball
24
Capa de Visualización y explotación de
datos
Visualización: esta capa es la encargada de desplegar los análisis
sobre los cubos mediante sus diversos cortes de información, cruces
y filtros.
Esta capa tiene diversos medios por los que desplegar información:
Pantallas
Portales web
Archivos (Excel, pdf,
powerpoint)
Correo electrónico
25
Capa de visualización y explotación de
datos
De acuerdo con su nivel de complejidad, se pueden clasificar las
soluciones BI en:
Cubos OLAP
26
Capa de Visualización y explotación de
datos
Consultas e informes simples:
29
Herramientas de explotación
Capa de Visualización y explotación de
datos
Capa de Visualización y explotación de
datos
32
Capa de Visualización y explotación de
datos
33
Capa de Visualización y explotación de
datos
34
Capa de Visualización y explotación de
datos
35
Capa de Visualización y explotación de
datos
36
Gracias por su Atención
SOLUCIONES DE INTELIGENCIA DE
NEGOCIO PARA EL APOYO A LA
TOMA DE DECISIONES
Prof. Brenda López