Sunteți pe pagina 1din 5

Bases de datos multidimensionales (BDM).

Como ya hemos visto anteriormente una base de datos es un conjunto de datos pertenecientes al un mismo contenido y almacenados para su posterior uso. Un ejemplo cotidiano de una base de datos seria una biblioteca puede considerarse una base de datos compuesta en su mayora por documentos y textos impresos en papel para su consulta. Existen una gran cantidad de bases de datos como son: base de datos relaciona, estticas, dinmicas, orientadas a objetos, etc. de la que hablaremos ahora es de la base de datos multidimensional: Definicin: Son bases de datos creadas para realizar aplicaciones ms amplias, como la creacin de cubos OLAP, esta son similares a las bases de datos relacionales, la nica diferencia es que los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla. Usos.

Aplicaciones OLAP. Campo de Inteligencia Empresarial. Hacer ms rpida la consulta de una diversidad de datos.

Diseos Conceptuales Multidimensionales.


Es la primera de las tres etapas del diseo de base de datos y esta consiste en la preparacin de un modelo de datos usados en una organizacin, la cual va separada de las consideraciones fsicas. Se utilizan para representar la realidad a un alto nivel de abstraccin. Cualidades

Expresividad.- Deben tener los conceptos o bases necesarios para expresar claramente la realidad. Simplicidad.- Deben ser sencillos para que los esquemas o representaciones grficas sean fciles de entender. Minimalidad.- Cada concepto debe tener distinto significado. Formalidad.- Todos los conceptos.

Cubos e Hper Cubos.


Cubos De Informacin O Cubos OLAP
Se trata de ordenar los datos por tablas o relaciones en las bases de datos multidimensionales. Los cubos OLAP tienen un nmero infinito e ilimitado de dimensiones, por eso son llamados tambin hper cubos. Caractersticas. Un cubo OLAP contendr datos de una variable o estructura que se desea analizar, dando una vista lgica de los datos proporcionados por el sistema de informacin hacia el data warehouse, esta vista estar disponible segn las dimensiones y podr contener informacin calculada. Los cubos o Hper cubos constan de lo siguiente: Dimensiones:

Criterios de anlisis de los datos. Macro-objetos del problema. Variables independientes. Ejes en el hipercubo. Medidas

Valores o indicadores a analizar. Datos asociados a relaciones entre los objetos del problema.

Variables dependientes. Variables en la interseccin de las dimensiones. Un ejemplo seria el siguiente: Dimensiones: Modelo, Color, Vendedor, Fecha. Medidas: Las cantidades vendidas.

Definicin y conceptos de las BDM.


Una base de datos multidimensional, es aquella que almacena sus datos con varias dimensiones, es decir que en vez de un valor, encontramos varios dependiendo de los "ejes" definidos. Para realizar el anlisis de los datos es muy habitual visualizar los mismos en manera de tablas de doble entrada. Por ejemplo, no es raro un anlisis de ventas en el que se visualizan tablas que muestran el volumen de ventas cruzando meses con tipos de producto, o meses con comerciales, o comerciales con tipos de producto, o clientes con meses, etc. para responder a preguntas como las mencionadas en el primer apartado de este artculo. Partiendo de la idea de que resulta muy interesante visualizar los datos en forma de tablas surge el concepto de dimensin. Las dimensiones son cada una de las posibles clasificaciones que se pueden aplicar a las filas o a las columnas. Las dimensiones del ejemplo de la aplicacin de facturacin podran ser las provincias, los meses y los productos. Simplificando, para poder visualizar estas tablas, y cualquier otra combinacin de las dimensiones, hay que mantener en el servidor el contenido de cada una de las posibles celdas. Estos datos se pueden guardar en una base de datos relacional con un esquema especfico, o bien almacenarse directamente en una base de datos multidimensional, como la representada en esta figura. A los datos almacenados de esta manera se les suele llamar cubos. Aunque aqu se representa un cubo de solo tres dimensiones es posible tener cubos de cualquier nmero de dimensiones. Las dimensiones que no aparecen en filas o columnas en una tabla se suelen llamar paginadas, y permiten determinar los datos que aparecern en la tabla, eligiendo uno de sus miembros. Por ejemplo, si en las filas estn los productos y en las columnas los meses, la dimensin paginada que quedara sera la de provincias. En la dimensin de provincias se podra elegir una provincia concreta, lo que sera similar a cortar una rodaja del cubo concreta y visualizar el contenido de sus celdas. Las dimensiones pueden estar organizadas en jerarquas de modo que se pueden ver los datos a diferentes niveles. Por ejemplo una jerarqua de fechas podra tener un primer nivel llamado Todos, seguido de un segundo nivel que incluyera los aos, otro nivel de meses, y as sucesivamente. Utilizada como dimensin paginada se podra elegir por tanto Todos, un ao concreto, un mes concreto, etc. Utilizada en filas o columnas podran mostrarse tablas divididas por aos, por meses, etc. Independientemente de cual sea el almacenamiento elegido para los datos multidimensionales, debe existir un servidor que permita acceder a ellos para visualizar las tablas tal como se explica, segn vaya requirindolas la aplicacin cliente. A este tipo de servidor se le llama servidor OLAP.

Modelos conceptuales multidimensionales.


El modelo multidimensional Los datos en un DW se modelan en data cubes (cubos de datos sera su traduccin literal), estructuras multidimensionales (hipercubos, en concreto) cuyas operaciones ms comunes son:

Roll up (incremento en el nivel de agregacin de los datos). Drill down (incremento en el nivel de detalle, opuesto a roll up). Slice (reduccin de la dimensionalidad de los datos mediante seleccin).

Dice (reduccin de la dimensionalidad de los datos mediante proyecccin). Pivotaje o rotacin (reorientacin de la visin multidimensional de los datos).

Modelos de datos como conjuntos de medidas descritas por dimensiones. Adecuado para resumir y organizar datos (p.ej. hojas de clculo). Enfocado para trabajar sobre datos de tipo numrico. Ms simple: Ms fcil de visualizar y entender que el modelado E/R Dimensiones Perspectivas o entidades respecto a las cuales una organizacin quiere mantener sus datos organizados (p.ej. tiempo, localizacin, clientes, proveedores) Miembros Nombres o identificadores que marcan una posicin dentro de la dimensin. Ejemplos: Meses, trimestres y aos son miembros de la dimensin tiempo. Ciudades, regiones y pases son miembros de la dimensin localizacin. Jerarquas Los miembros de las dimensiones se suelen organizar en forma de jerarquas. Organizacin jerrquica de las dimensiones Hechos Colecciones de datos relacionados compuestas por medidas y un contexto. Las dimensiones determinan el contexto de los hechos. Cada hecho particular est asociado a un miembro de cada dimensin. Medidas Atributos numricos asociados a los hechos (lo que realmente se mide). Ejemplos: Volumen de las ventas, coste asociado a un producto, nmero de transacciones efectuadas, porcentaje de beneficios

Cubos e hipercubos de datos.


Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un nmero indefinido de dimensiones, razn por la cual tambin reciben el nombre de hipercubos. Un cubo OLAP contendr datos de una determinada variable que se desea analizar, proporcionando una vista lgica de los datos provistos por el sistema de informacin hacia el data warehouse, esta vista estar dispuesta segn unas dimensiones y podr contener informacin calculada. El anlisis de los datos est basado en las dimensiones del hipercubo, por lo tanto, se trata de un anlisis multidimensional. A la informacin de un cubo puede acceder el ejecutivo mediante tablas dinmicas en una hoja de clculo o a ravs de programas personalizados. Las tablas dinmicas le permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la informacin con mucha facilidad. Las diferentes operaciones que se

pueden realizar con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, ste es una coleccin de datos que est formada por dimensiones y variables, entendiendo como dimensiones a aquellos elementos que participan en el anlisis y variables a los valores que se desean analizar. Dimensiones Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones). Son catlogos de informacin complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general complementaria a cada uno de los registros de la tabla de hechos. Variables Tambin llamadas indicadores de gestin, son los datos que estn siendo analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables representan algn aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podran ser: productos, localidades (o zonas), el tiempo (medido en das, horas.

Estructuras no-jerrquicas y jerrquicas de los datos.


Estructuras Jerrquicas Una Base de datos jerrquica es un tipo de Sistema Gestor de Bases de Datos que, como su nombre indica, almacenan la informacin en una estructura jerrquica que enlaza los registros en forma de estructura de rbol (similar a un rbol visto al revs), en donde un nodo padre de informacin puede tener varios nodos hijo. Esta relacin jerrquica no es estrictamente obligatoria, de manera que pueden establecerse relaciones entre nodos hermanos. En este caso la estructura en forma de rbol se convierte en una estructura en forma de grafo dirigido. Esta variante se denomina Bases de datos de red. Cmo funcionan? A diferencia del modelo relacional, el modelo jerrquico no diferencia una vista lgica de una vista fsica de la base de datos. De manera que las relaciones entre datos se establecen siempre a nivel fsico, es decir, mediante referencia a direcciones fsicas del medio de almacenamiento (sectores y pistas). Los datos se almacenan en la forma de registros, el equivalente a las filas del modelo relacional. Cada registro consta de un conjunto de campos, el equivalente a las columnas del modelo relacional. Un conjunto de registros con los mismos campos se denomina fichero (record type, en ingls), el equivalente a las tablas del modelo relacional. El modelo jerrquico facilita relaciones padre-hijo, es decir, relaciones 1:N (de uno

a varios) del modelo relacional. Pero a diferencia de ste ltimo, las relaciones son unidireccionales. En justicia, dichas relaciones son hijo-padre, pero no padre-hijo. Por ejemplo, el registro de un empleado (nodo hijo) puede relacionarse con el registro de su departamento (nodo padre), pero no al contrario. Esto implica que solamente se puede consultar la base de datos desde los nodos hoja hacia el nodo raz. La consulta en el sentido contrario requiere una bsqueda secuencial por todos los registros de la base de datos (por ejemplo, para consultar todos los empleados de un departamento). En las bases de datos jerrquicas no existen ndices que faciliten esta tarea. Obsrvese que, a priori, no existen relaciones N:M (de muchos a muchos) en el modelo jerrquico. Salvo que se simulen mediante varias relaciones 1:N. No obstante, esto puede provocar problemas de inconsistencia, ya que el gestor de base de datos no controla estas relaciones. Como ya se ha mencionado, las relaciones se establecen mediante punteros entre registros. Es decir, un registro hijo contiene la direccin fsica en el medio de almacenamiento de su registro padre. Esto tiene una ventaja fundamental sobre las bases de datos relacionales: el rendimiento. El acceso de un registro a otro es prcticamente inmediato sin necesidad de consultar tablas de correspondencia. Las relaciones jerrquicas entre diferentes tipos de datos pueden hacer que sea muy sencillo responder a determinadas preguntas, pero muy difcil el contestar a otras. Limitaciones del modelo jerrquico A continuacin se mencionan los problemas tpicos de las bases de datos jerrquicas y que no existen en las bases de datos relacionales. Todos estos problemas derivan del hecho de que el sistema gestor de base de datos no implementa ningn control sobre los propios datos, sino que queda en manos de las aplicaciones garantizar que se cumplen las condiciones invariantes que se requieran (por ejemplo, evitar la duplicidad de registros). Dado que todas las aplicaciones estn sujetas a errores y fallos, esto es imposible en la prctica. Adems dichas condiciones suelen romperse ex profeso por motivos operativos (generalmente, ajustes debidos a cambios en el negocio) sin evaluarse sus consecuencias. Duplicidad de registros No se garantiza la inexistencia de registros duplicados. Esto tambin es cierto para los campos clave. Es decir, no se garantiza que dos registros cualesquiera tengan diferentes valores en un subconjunto concreto de campos. Integridad referencial No existe garanta de que un registro hijo est relacionado con un registro padre vlido. Por ejemplo, es posible borrar un nodo padre sin eliminar antes los nodos hijo, de manera que stos ltimos estn relacionados con un registro invlido o inexistente. Des normalizacin Este no es tanto un problema del modelo jerrquico como del uso que se hace de l. Sin embargo, a diferencia del modelo relacional, las bases de datos jerrquicas no tienen controles que impidan la des normalizacin de una base de datos. Por ejemplo, no existe el concepto de campos clave o campos nicos.

S-ar putea să vă placă și