Sunteți pe pagina 1din 16

Business Intelligence es la habilidad para transformar los datos en informacin, y la

informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de


decisiones en los negocios.

Desde un punto de vista ms pragmtico, y asocindolo directamente con las


tecnologas de la informacin, podemos definir Business Intelligence como el conjunto
de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y transformar
datos de los sistemas transaccionales e informacin desestructurada (interna y externa
a la compaa) en informacin estructurada, para su explotacin directa (reporting,
anlisis OLTP / OLAP, alertas...) o para su anlisis y conversin en conocimiento, dando
as soporte a la toma de decisiones sobre el negocio.

Los principales productos de Business Intelligence que existen hoy en da son:

Cuadros de Mando Integrales (CMI)

Sistemas de Soporte a la Decisin (DSS)

Sistemas de Informacin Ejecutiva (EIS)

Por otro lado, los principales componentes de orgenes de datos en el Business


Intelligence que existen en la actualidad son:

Datamart

Datawarehouse

Datamart
Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por
disponer la estructura ptima de datos para analizar la informacin al detalle desde
todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart
puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo
un compendio de distintas fuentes de informacin.
Por tanto, para crear el datamart de un rea funcional de la empresa es preciso
encontrar la estructura ptima para el anlisis de su informacin, estructura que puede
estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre
una base de datos OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De esta forma se
pueden plantear dos tipos de datamarts:

Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, segn los
requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios
de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los
cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es
introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones ms usuales) aprovechando las caractersticas particulares de cada rea
de la empresa. Las estructuras ms comunes en este sentido son las tablas report, que
vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las
vistas materializadas, que se construyen con la misma estructura que las anteriores,
pero con el objetivo de explotar la reescritura de queries (aunque slo es posibles en
algunos SGBD avanzados, como Oracle).

Los datamarts que estn dotados con estas estructuras ptimas de anlisis presentan
las siguientes ventajas:

Poco volumen de datos

Mayor rapidez de consulta

Consultas SQL y/o MDX sencillas

Validacin directa de la informacin

Facilidad para la historizacin de los datos


Datawarehouse
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar
y depurar informacin de una o ms fuentes distintas, para luego procesarla
permitiendo su anlisis desde infinidad de pespectivas y con grandes velocidades de
respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones
el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y
fiable de Business Intelligence.

La ventaja principal de este tipo de bases de datos radica en las estructuras en las que
se almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc). Este tipo de persistencia de la informacin es homognea y fiable,
y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un
entorno diferente a los sistemas operacionales).

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se traduce
literalmente como almacn de datos. No obstante, y como cabe suponer, es mucho
ms que eso. Segn defini el propio Bill Inmon, un datawarehouse se caracteriza por
ser:

Integrado: los datos almacenados en el datawarehouse deben integrarse en


una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas. La informacin suele
estructurarse tambin en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.

Temtico: slo los datos necesarios para el proceso de generacin del


conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una nica tabla del datawarehouse. De esta forma, las
peticiones de informacin sobre clientes sern ms fciles de responder dado
que toda la informacin reside en el mismo lugar.

Histrico: el tiempo es parte implcita de la informacin contenida en un


datawarehouse. En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad del negocio en el momento presente. Por el contrario, la
informacin almacenada en el datawarehouse sirve, entre otras cosas, para
realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.

No voltil: el almacn de informacin de un datawarehouse existe para ser


ledo, pero no modificado. La informacin es por tanto permanente, significando
la actualizacin del datawarehouse la incorporacin de los ltimos valores que
tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre
lo que ya exista.

Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre
los datos. Los metadatos permiten saber la procedencia de la informacin, su
periodicidad de refresco, su fiabilidad, forma de clculo... etc.

Los metadatos sern los que permiten simplificar y automatizar la obtencin de la


informacin desde los sistemas operacionales a los sistemas informacionales.

Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:

Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su


propio lenguaje de negocio, indicando qu informacin hay y qu significado
tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas
de Business Intelligence como DSS, EIS o CMI.

Dar soporte a los responsables tcnicos del datawarehouse en aspectos


de auditora, gestin de la informacin histrica, administracin del
datawarehouse, elaboracin de programas de extraccin de la informacin,
especificacin de las interfaces para la realimentacin a los sistemas
operacionales de los resultados obtenidos... etc.

Por ltimo, destacar que para comprender ntegramente el concepto de


datawarehouse, es importante entender cual es el proceso de construccin del mismo,
denominado ETL (Extraccin, Transformacin y Carga), a partir de los sistemas
operaciones de una compaa:

Extraccin: obtencin de informacin de las distintas fuentes tanto internas


como externas.

Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin


de la informacin.

Carga: organizacin y actualizacin de los datos y los metadatos en la base de


datos.
Una de las claves del xito en la construccin de un datawarehouse es el desarrollo de
forma gradual, seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacn de datos a los dems usuarios. Por ello es importante
elegir este usuario inicial o piloto, siendo importante que sea un departamento con
pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se
puedan obtener y medir resultados a corto plazo.

Principales aportaciones de un datawarehouse

Proporciona una herramienta para la toma de decisiones en cualquier rea


funcional, basndose en informacin integrada y global del negocio.

Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para


encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor
aadido para el negocio de dicha informacin.

Proporciona la capacidad de aprender de los datos del pasado y de predecir


situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantacin de sistemas de gestin integral


de la relacin con el cliente.

Supone una optimizacin tecnolgica y econmica en entornos de Centro de


Informacin, estadstica o de generacin de informes con retornos de la inversin
espectaculares.

Si no est familiarizado con el concepto de datawarehouse, puede resultarle til,


adems, examinar las siguientes definiciones:
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS
ESCUELA DE COMPUTACIN
INTELIGENCIA DE NEGOCIO

INFORME TECNICO.
Metodologa de Kimball.

Elaborado por:
Agustn Azuaje CI.: 19.060.888

CARACAS, DICIEMBRE 2014.


Indice

Introduccion
Objetivo General
Objetivos Especificos
Alcance
Metodologa de Kimball
Conclusion
Bibliografia
Introduccion

A lo largo de la evolucin tecnolgica, el ser humano ha logrado desarrollar


mtodos de anlisis de datos que permiten optimizar la obtencin especfica de
informacin, este fenmeno est directamente relacionado con con la inteligencia
de negocios, debido a que esta se encuentra basada en la toma de decisiones.
Existen diversas metodologas que permiten implementar el inicio de existencia
para la acumulacion de datos (base de datos) para su previo anlisis histrico
(almacenes de datos), entre ellas, existe la metodologa de Kimball que presenta
el ciclo de vida de un almacn de datos y los pasos necesario para una ptima
implementacin.

A lo largo del presente documento se presentar fundamentalmente el ciclo


de vida presentado por Kimball en el libro The Data Warehouse Lifecycle Toolkit,
ademas de distintas referencias electronicas.

Objetivo General

Desarrollar los conocimientos bsicos y necesarios para la aplicacin de la


metodologa de Ralph Kimball para la creacin de un almacn de datos o
datawarehousing, especficamente en el ambito de Inteligencia de Negocios,
siguiendo las recomendaciones indicadas por Ralph Kimball, Margy Ross, Warren
Thornthwaite, Joy Mundy y Bob Becker en el libro The Data Warehouse Lifecycle
Toolkit.

Objetivos Especficos

Identificar cada fase existente en la metodologa Kimball.


Especificar las fases necesarias para el desarrollo exitoso de un almacn
de datos.
Relacionar cada fase especificada con los entregables necesarios.

Alcance
El presente documento organiza y presenta el ciclo de vida de un
Datawarehose/BI para un desarrollo exitoso de un proyecto de Inteligencia de
negocios.

Metodologa de Kimball

Un almacn de datos es una coleccin de datos historia orientada a un


mbito determinado, generalmente empresarial, caso en el cual, se realiza el
estudio especfico de tendencias de mercado, estudio de determinados productos
relacionado con sus ventas, preferencias del cliente, entre muchos otros. La
Metodologa Kimball es un proceso que asegura una exitosa creacin de una
fuente de datos, integrada, no voltil y variable en el tiempo que ayuda con la toma
de decisiones en la entidad que as lo requiera.

La Metodologa Kimball se basa en el Ciclo de Vida Dimensional del


Negocio o Business Dimensional Lifecycle, el cual esta conformado por 4
principios bsicos:
1. Centrarse en el negocio
2. Construir una infraestructura de informacin adecuada.
3. Realizar entregas en incrementales significativos.
4. Ofrecer la solucin completa.

Podemos ver en la siguiente imagen el ciclo de vida que ser desarrollado en el


presente informe.
Planificacin del Proyecto.
Definicin de Requerimientos del Negocio.
Modelado Dimensional.
Diseo Fsico.
Diseo e Implementacin del subsistema de Extraccin, Transformacin y
Carga (ETL).
Implementacin.
Mantenimiento y Crecimiento del Data Warehouse.
Especificacin de aplicaciones de BI.
Diseo de la Arquitectura Tcnica.

Planificacin del proyecto.

Basado en determinar el proposito o base central del proyecto DW/BI,


ademas de los objetivos, el alcance y los principales riesgo. En si, un a
presentacin inicial de las necesidades de informacin.

En la Planificacin del proyecto se manejan las siguientes acciones:

Definir alcance
Identificar tareas
Programar tareas
Planificar uso de recursos
Asignar carga de trabajo a los recursos
Elaboracin de un documento final para el plan del proyecto.
Monitoreo del estado de los procesos
Rastreo de problemas.

Definicin de Requerimientos del Negocio.

Proceso basado en la interaccin directa con el negocio, conocer sobre el


negocio, personal, clientes y competidores. Todo este proceso se realiza por
medio de anlisis de documentos internos, entrevistas al personal y un estudio
externo de la organizacin.
Para la entrevista del personal se manejan 4 grandes grupos:

El directivo responsable de tomar las decisiones estratgicas.


Los administradores intermedios y de negocio responsables de explorar
alternativas estratgicas y aplicar decisiones
El personal de sistemas, si existe.
El personal que se entrevista por razones polticas.

Modelado dimensional.

Proceso bsico para el desarrollo DW e iterativo basado en 4 paso

Elegir el proceso de negocio: Decisin de la direccin y dependiente del


anlisis de requerimientos y de los temas analticos anotados en la etapa
anterior.

Establecer el nivel de granularidad: Enfocado en el nivel de detalle con el


cual ser desarrollado la DW. La granularidad depende de los
requerimientos solicitados por el negocio. La sugerencia general es
comenzar a disear el DW al mayor nivel de detalle posible, ya que se
podran realizar agrupamientos posteriores, al nivel deseado.

Elegir las dimensiones: Las dimensiones surgen a partir de las


discusiones del equipo, las facilitadas por la eleccin del nivel de
granularidad y de la matriz de procesos/dimensiones. Las tablas de
dimensiones tienen un conjunto de atributos que brindan una perspectiva
sobre una medida en una tabla hechos.
Identificar medidas y las tablas de hechos: Este paso, consiste en
identificar las medidas que surgen de los procesos de negocios. Una
medida es un atributo (campo) de una tabla que se desea analizar,
sumando o agrupando sus datos y usando los criterios de corte conocidos
como dimensiones. Las medidas habitualmente se vinculan con el nivel de
granularidad del punto 2, y se encuentran en tablas que denominamos
tablas de hechos (fact en ingls). Cada tabla de hechos tiene como
atributos una o ms medidas de un proceso organizacional, de acuerdo a
los requerimientos. Un registro contiene una medida expresada en
nmeros, como ser cantidad, tiempo, dinero, etc., sobre la cual se desea
realizar una operacin de agregacin (promedio, conteo, suma, etc.) en
funcin de una o ms dimensiones. La granularidad, en este punto, es el
nivel de detalle que posee cada registro de una tabla de hechos.

Diseo Fsico.

Base fundamental para el soporte de las estructuras manejas en el


diseo lgico y para su desarrollo se deben contestar las siguientes interrogantes:

Cmo puede determinar cun grande ser el sistema de DW/BI?


Cules son los factores de uso que llevarn a una configuracin ms grande y
ms compleja?
Cmo se debe configurar el sistema?
Cunta memoria y servidores se necesitan? Qu tipo de almacenamiento y
procesadores?
Cmo instalar el software en los servidores de desarrollo, prueba y produccin?
Qu necesitan instalar los diferentes miembros del equipo de DW/BI en sus
estaciones de trabajo?
Cmo convertir el modelo de datos lgico en un modelo de datos fsicos en la
base de datos relacional?
Cmo conseguir un plan de indexacin inicial?
Debe usarse la particin en las tablas relacionales?

Diseo e implementacin del subsistema ETL

Proceso relacionado con la extraccin, transformacin y carga de los datos


manejados en el modelo relacional y su alimentacin al modelo dimensional.

Implementacion

Directamente relacionado con unificacin de las tecnologas


utilizadas en el proceso realizado a los datos para su presentacin final ante el
usuario encargado de la toma de decisiones, ademas de manejar los factores
involucrados con el correcto funcionamiento de todas las entidades necesarias del
DW.

Mantenimiento y crecimiento del DW

Ente enfocado en la retroalimentacin entre el ciclo de vida y el


usuario final, y as generar un un crecimiento positivo e iterativo de la DW.
Enfocndose en la experiencia del usuario final es posible mejorar, innovar y
permitir la evolucin por medio del mantenimiento de la DW.

Especificacin de aplicaciones BI

Herramientas estructuradas que permiten el acceso paralelo al almacn de


datos, ademas se presentar a los distintos usuarios maneras de facil
entendimiento y comprensin de los datos, por medio de informes y vistas
sofisticadas. Estas herramientas Kimball las divide en las siguientes categoras:

Informes estndar: formes simples, de formato predefinido, y parmetros


de consulta fijos, proporcionan a los usuarios un conjunto bsico de
informacin acerca de lo que est sucediendo en un rea determinada de la
empresa y se utilizan da a da.

Aplicaciones analticas: Son ms complejas que los informes estndar,


debido a que pueden incluir algoritmos y modelos de minera de datos, que
ayudan a identificar oportunidades o cuestiones subyacentes en los datos

Diseo de la Arquitectura Tcnica

Relacionado con los procesos y herramientas que se aplican a los datos.


En el rea tcnica existen dos conjuntos que tienen distintos requerimientos,
brindan sus propios servicios y componentes de almacenaje de datos:

Back room: Responsable de la obtencin y preparacin de los datos, por lo


que tambin se conoce como adquisicin de datos.
Front room es responsable de entregar los datos a la comunidad de
usuario y tambin se le conoce como acceso de datos.

Conclusion
La Metodologa Kimball proporciona un conjunto de conocimientos
que aseguran y modelan una serie de acciones para el desarrollo ptimo de un
DW pequeo y mediano debido a su versatilidad, enfoque ascendente y
renovador, gracias a su mantenimiento constante e intercambio de informacin
con los usuarios finales por medio de las herramientas de BI y todos los
documentos que se manejan en el anlisis final de datos.

METODOLOGIAS DE BI

METODOLOGA RALPH KIMBALL

(Considerado el principal promotor del enfoque dimensional para el diseo de


almacenes de datos), un Data Warehouse es una copia de los datos transaccionales especficamente
estructurada para la consulta y el anlisis

PORQUE USAR LA METODOLOGA DE RALPH KIMBALL


Conduce a una solucin completa en una cantidad de tiempo relativamente pequea. Adems, debido a la
gran cantidad de documentacin que se puede encontrar y a los numerosos ejemplos aportados en diferentes
entornos, permite encontrar una respuesta a casi todas las preguntas que puedan surgir, sobre todo cuando
no se dispone de la experiencia previa necesaria.

Por otro lado, este tipo de metodologa bottom-up permite que, partiendo de cero, podamos empezar a
obtener informacin til en cuestin de das y despus de los prototipos iniciales, comenzar el ciclo
de vida normal que nos ofrezca una solucin completa de BI.
METODOLOGA W. H. INMON

(Considerado por muchos el padre del Data Warehouse),


un Data Warehouse es un conjunto de datos orientados por temas, integrados, variantes en el tiempo
y no voltiles, que tienen por objetivo dar soporte a la toma de decisiones.

PORQUE USAR LA METODOLOGA DE W. H. INMON

Tiene un enfoque a modo de explosin en el sentido de que en cierto modo no viene acompaada del
ciclo de vida normal de las aplicaciones, sino que los requisitos irn acompaando al proyecto segn
vaya comprobndose su necesidad. Aunque esta visin de Inmon puede traer consigo mucho riesgo a
la compaa, ya que invierte grandes esfuerzos en el desarrollo del DW y no es hasta la aparicin de
los DM cuando se empieza a explotar la inversin y obtener beneficios.

Esta metodologa para la construccin de un sistema de este tipo es frecuente a la hora de disear un
sistema de informacin, utilizando las herramientas habituales como el esquema Entidad/Relacin
pero al tener un enfoque global, es ms difcil de desarrollar en un proyecto sencillo, pues estamos
intentando abordar el todo, a partir del cual luego iremos al detalle. Esta es otra de las
restricciones que trabajan en contra de la metodologa de Inmune ya que implica un consumo de
tiempo mayor, teniendo como consecuencia que muchas empresas se inclinen por usar metodologas
con las que obtengan resultados tangibles en un espacio menor de tiempo.

S-ar putea să vă placă și