Documente Academic
Documente Profesional
Documente Cultură
o rg
Almacn de datos
En el contexto de la inf ormtica, un almacn de datos (del ingls data warehouse) es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), integrado, no voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organizacin, ms all de la inf ormacin transaccional y operacional, almacenado en una base de datos diseada para f avorecer el anlisis y la divulgacin ef iciente de datos (especialmente OLAP, procesamiento analtico en lnea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de inf ormacin que se subdividen a veces en unidades lgicas ms pequeas dependiendo del subsistema de la entidad del que procedan o para el que sean necesario.
ndice
[ocultar]
Data marts
Artculo principal: Data mart. Los Data marts son subconjuntos de datos de un data warehouse para reas especf icas. Entre las caractersticas de un data mart destacan:
Usuarios limitados. rea especf ica. Tiene un propsito especf ico. Tiene una f uncin de apoyo.
Dimensiones
Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis de las variables (f orman parte de la tabla de dimensiones). Son catlogos de inf ormacin complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la inf ormacin general complementaria a cada uno de los registros de la tabla de hechos.
Variables
Tambin llamadas indicadores de gestin , son los datos que estn siendo analizados. Forman parte de la tabla de hechos. Ms f ormalmente, las variables representan algn aspecto cuantif icable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numricos para cada instancia del objeto o evento medido. En f orma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podran ser: productos, localidades (o zonas), el tiempo (medido en das, horas, semanas, etc.), ...
Ejemplos
Ejemplos de variables podran ser: Beneficios
Gastos Ventas etc. Ejemplos de dimensiones podran ser: producto (dif erentes tipos o denominaciones de productos) localidades (o provincia, o regiones, o zonas geogrf icas) tiempo (medido de dif erentes maneras, por horas, por das, por meses, por aos, ...) tipo de cliente (casado/soltero, joven/adulto/anciano, ...) etc. Segn lo anterior, podramos construir un cubo de inf ormacin sobre el ndice de ventas (variable a estudiar) en f uncin del producto vendido, la provincia, el mes del ao y si el cliente est casado o soltero (dimensiones). Tendramos un cubo de 4 dimensiones.
data warehouse o se puedan migrar de ste a otra base de datos. Carga. Consiste en almacenar los datos en la base de datos f inal, por ejemplo el almacn de datos objetivo normal.
Middleware
Artculo principal: Middleware. Middleware es un trmino genrico que se utiliza para ref erirse a todo tipo de sof tware de conectividad que of rece servicios u operaciones que hacen posible el f uncionamiento de aplicaciones distribuidas sobre plataf ormas heterogneas. Estos servicios f uncionan como una capa de abstraccin de sof tware distribuida, que se sita entre las capas de aplicaciones y las capas inf eriores (sistema operativo y red). El middleware puede verse como una capa API, que sirve como base a los programadores para que puedan desarrollar aplicaciones que trabajen en dif erentes entornos sin preocuparse de los protocolos de red y comunicaciones en que se ejecutarn. De esta manera se of rece una mejor relacin costo/rendimiento que pasa por el desarrollo de aplicaciones ms complejas, en menos tiempo. La f uncin del middleware en el contexto de los data warehouse es la de asegurar la conectividad entre todos los componentes de la arquitectura de un almacn de datos.
de f orma iterativa que se harn para llegar a la construccin del producto f inal deseado. Prueba del concepto tecnolgico.- Es un paso opcional que se puede necesitar para determinar si la arquitectura especif icada del data warehouse f uncionar f inalmente como se espera.
Inconvenient es
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos de ellos son: A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacn de datos no suele ser esttico. Los costos de mantenimiento son elevados. Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
A veces, ante una peticin de inf ormacin estos devuelven una inf ormacin subptima, que tambin supone una prdida para la organizacin. A menudo existe una delgada lnea entre los almacenes de datos y los sistemas operacionales. Hay que determinar qu f uncionalidades de estos se pueden aprovechar y cules se deben implementar en el data warehouse, resultara costoso implementar operaciones no necesarias o dejar de implementar alguna que s vaya a necesitarse.