Documente Academic
Documente Profesional
Documente Cultură
Usuarios limitados.
rea especfica.
Cubos de informacin
Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas
en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata
de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3
dimensiones, los cubos OLAP tienen un nmero indefinido de dimensiones, razn por
la cual tambin reciben el nombre dehipercubos. Un cubo OLAP contendr datos de
una determinada variable que se desea analizar, proporcionando una vista lgica de
los datos provistos por el sistema de informacin hacia el data warehouse, esta vista
estar dispuesta segn unas dimensiones y podr contener informacin calculada. El
anlisis de los datos est basado en las dimensiones del hipercubo, por lo tanto, se
trata de un anlisis multidimensional.
A la informacin de un cubo puede acceder el ejecutivo mediante "tablas dinmicas"
en una hoja de clculo o a travs de programas personalizados. Las tablas dinmicas
le permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la
informacin con mucha facilidad. Las diferentes operaciones que se pueden realizar
con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos
a un data warehouse, ste es una coleccin de datos que est formada por
dimensiones y variables, entendiendo como dimensiones a aquellos elementos
que participan en el anlisis y variables a los valores que se desean analizar.
Dimensiones
Las dimensiones de un cubo son atributos relativos a las variables, son las
perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones).
Son catlogos de informacin complementaria necesaria para la presentacin de los
datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de
tiempo, etc. Es decir, la informacin general complementaria a cada uno de los
registros de la tabla de hechos.
Variables
Tambin llamadas indicadores de gestin, son los datos que estn siendo
analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables
representan algn aspecto cuantificable o medible de los objetos o eventos a analizar.
Normalmente, las variables son representadas por valores detallados y numricos
para cada instancia del objeto o evento medido. En forma contraria, las dimensiones
son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o
abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor,
tomando como valores un conjunto de elementos menor que el de las variables;
ejemplos de dimensiones podran ser: productos, localidades (o zonas), el
tiempo (medido en das, horas, semanas, etc.), ...
Ejemplos
Ejemplos de variables podran ser:
Beneficios
Gastos
Ventas
etc.
tiempo (medido de diferentes maneras, por horas, por das, por meses, por
aos, ...)
etc.
Tablas
Columnas de tablas
Entidades y Relaciones
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su
propio lenguaje de negocio, indicando qu informacin hay y qu significado tiene.
Ayudar a construir consultas, informes y anlisis, mediante herramientas de Business
Intelligence como DSS, EIS o CMI.
Dar soporte a los responsables tcnicos deldatawarehouse en aspectos de
auditora, gestin de la informacin histrica, administracin del datawarehouse,
elaboracin de programas de extraccin de la informacin, especificacin de las
interfaces para la realimentacin a los sistemas operacionales de los resultados
obtenidos... etc
Funciones ETL (extraccin, transformacin y carga)
Los procesos de extraccin, transformacin y carga (ETL) son importantes ya que
son la forma en que los datos se guardan en un almacn de datos (o en cualquier
base de datos). Implican las siguientes operaciones:
Carga. Consiste en almacenar los datos en la base de datos final, por ejemplo
el almacn de datos objetivo normal.organizacin y actualizacin de los datos y
los metadatos en la base de datos.
Middleware
Middleware es un trmino genrico que se utiliza para referirse a todo tipo de software
de conectividad que ofrece servicios u operaciones que hacen posible el
funcionamiento de aplicaciones distribuidas sobre plataformas heterogneas. Estos
servicios funcionan como una capa de abstraccin de software distribuida, que se sita
entre las capas de aplicaciones y las capas inferiores (sistema operativo y red).
El middleware puede verse como una capa API, que sirve como base a los
programadores para que puedan desarrollar aplicaciones que trabajen en diferentes
entornos sin preocuparse de los protocolos de red y comunicaciones en que se
ejecutarn. De esta manera se ofrece una mejor relacin costo/rendimiento que pasa
por el desarrollo de aplicaciones ms complejas, en menos tiempo.
La funcin del middleware en el contexto de los data warehouse es la de asegurar la
conectividad entre todos los componentes de la arquitectura de un almacn de datos.
Diseo de un almacn de datos
Para construir un Data Warehouse se necesitan herramientas para ayudar a la
migracin y a la transformacin de los datos hacia el almacn. Una vez construido, se
requieren medios para manejar grandes volmenes de informacin. Se disea su
arquitectura dependiendo de la estructura interna de los datos del almacn y
especialmente del tipo de consultas a realizar. Con este criterio los datos deben ser
repartidos entre numerosos data marts. Para abordar un proyecto de data warehouse
es necesario hacer un estudio de algunos temas generales de la organizacin o
empresa, los cuales se describen a continuacin:
Inconvenientes
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos de ellos
son:
A menudo existe una delgada lnea entre los almacenes de datos y los
sistemas operacionales. Hay que determinar qu funcionalidades de estos se
pueden aprovechar y cules se deben implementar en el data warehouse,
resultara costoso implementar operaciones no necesarias o dejar de implementar
alguna que s vaya a necesitarse.
Conclusiones
1.
El uso de sistemas Data Warehouse es una poderosa estrategia para
administrar empresas.
2.
Los resultados que arrojan los anlisis de los datos obtenidos y consolidados
en el Data Warehouse pueden hacer que la directiva de la empresa corrija las
estrataegias hasta ahora trazadas y mejore as las ganancias.
3.
El mantenimiento de un Sistema Data Warehouse es algo complejo, que
requiere de recursos monetarios y estrategia.
4.
El modelo dimensional brinda una forma muy sencilla de representacin de los
datos y mejora as el tiempo de consultas a la base de datos.
5.
Los sistemas de transformacin de datos de SQL Server brindan una poderosa
herramienta a quienes se inicien en la confeccin de un Data Warehouse sobre este
gestor de Bases de datos.
APLICACIONES
USOS DEL DATA WAREHOUSE
Los datos operacionales y los datos del data warehouse son accesados por usuarios
que usan los datos de maneras diferentes.
Uso de
Data Warehouse
Control de Gestin:
Sistemas de Presupuestacin, Anlisis de Desviaciones, Reporting (EIS, MIS,
etc.)
Logstica:
Recursos Humanos
Planificacin de incorporaciones, Gestin de carreras profesionales, Asignacin
de recursos a proyectos alternativos, etc.
Etc.
BIBLIOGRAFIA
Leer
ms: http://www.monografias.com/trabajos57/data-warehouse-sql/datawarehouse-sql2.shtml#ixzz3JuAKpkX1
http://www.dataprix.com/seguridad-informacion-dwh
http://www.dataprix.com/aplicaciones-dwh