Documente Academic
Documente Profesional
Documente Cultură
Como ya hemos visto anteriormente una base de datos es un conjunto de datos pertenecientes al un mismo contenido y almacenados para su posterior uso. Un ejemplo cotidiano de una base de datos seria una biblioteca puede considerarse una base de datos compuesta en su mayora por documentos y textos impresos en papel para su consulta. Existen una gran cantidad de bases de datos como son: base de datos relaciona, estticas, dinmicas, orientadas a objetos, etc. de la que hablaremos ahora es de la base de datos multidimensional: Definicin: Son bases de datos creadas para realizar aplicaciones ms amplias, como la creacin de cubos OLAP, esta son similares a las bases de datos relacionales, la nica diferencia es que los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla. Usos.
Aplicaciones OLAP. Campo de Inteligencia Empresarial. Hacer ms rpida la consulta de una diversidad de datos.
Expresividad.- Deben tener los conceptos o bases necesarios para expresar claramente la realidad. Simplicidad.- Deben ser sencillos para que los esquemas o representaciones grficas sean fciles de entender. Minimalidad.- Cada concepto debe tener distinto significado. Formalidad.- Todos los conceptos.
Criterios de anlisis de los datos. Macro-objetos del problema. Variables independientes. Ejes en el hipercubo. Medidas
Valores o indicadores a analizar. Datos asociados a relaciones entre los objetos del problema.
Variables dependientes. Variables en la interseccin de las dimensiones. Un ejemplo seria el siguiente: Dimensiones: Modelo, Color, Vendedor, Fecha. Medidas: Las cantidades vendidas.
Roll up (incremento en el nivel de agregacin de los datos). Drill down (incremento en el nivel de detalle, opuesto a roll up). Slice (reduccin de la dimensionalidad de los datos mediante seleccin).
Dice (reduccin de la dimensionalidad de los datos mediante proyecccin). Pivotaje o rotacin (reorientacin de la visin multidimensional de los datos).
Modelos de datos como conjuntos de medidas descritas por dimensiones. Adecuado para resumir y organizar datos (p.ej. hojas de clculo). Enfocado para trabajar sobre datos de tipo numrico. Ms simple: Ms fcil de visualizar y entender que el modelado E/R Dimensiones Perspectivas o entidades respecto a las cuales una organizacin quiere mantener sus datos organizados (p.ej. tiempo, localizacin, clientes, proveedores) Miembros Nombres o identificadores que marcan una posicin dentro de la dimensin. Ejemplos: Meses, trimestres y aos son miembros de la dimensin tiempo. Ciudades, regiones y pases son miembros de la dimensin localizacin. Jerarquas Los miembros de las dimensiones se suelen organizar en forma de jerarquas. Organizacin jerrquica de las dimensiones Hechos Colecciones de datos relacionados compuestas por medidas y un contexto. Las dimensiones determinan el contexto de los hechos. Cada hecho particular est asociado a un miembro de cada dimensin. Medidas Atributos numricos asociados a los hechos (lo que realmente se mide). Ejemplos: Volumen de las ventas, coste asociado a un producto, nmero de transacciones efectuadas, porcentaje de beneficios
pueden realizar con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, ste es una coleccin de datos que est formada por dimensiones y variables, entendiendo como dimensiones a aquellos elementos que participan en el anlisis y variables a los valores que se desean analizar. Dimensiones Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones). Son catlogos de informacin complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general complementaria a cada uno de los registros de la tabla de hechos. Variables Tambin llamadas indicadores de gestin, son los datos que estn siendo analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables representan algn aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podran ser: productos, localidades (o zonas), el tiempo (medido en das, horas.
a varios) del modelo relacional. Pero a diferencia de ste ltimo, las relaciones son unidireccionales. En justicia, dichas relaciones son hijo-padre, pero no padre-hijo. Por ejemplo, el registro de un empleado (nodo hijo) puede relacionarse con el registro de su departamento (nodo padre), pero no al contrario. Esto implica que solamente se puede consultar la base de datos desde los nodos hoja hacia el nodo raz. La consulta en el sentido contrario requiere una bsqueda secuencial por todos los registros de la base de datos (por ejemplo, para consultar todos los empleados de un departamento). En las bases de datos jerrquicas no existen ndices que faciliten esta tarea. Obsrvese que, a priori, no existen relaciones N:M (de muchos a muchos) en el modelo jerrquico. Salvo que se simulen mediante varias relaciones 1:N. No obstante, esto puede provocar problemas de inconsistencia, ya que el gestor de base de datos no controla estas relaciones. Como ya se ha mencionado, las relaciones se establecen mediante punteros entre registros. Es decir, un registro hijo contiene la direccin fsica en el medio de almacenamiento de su registro padre. Esto tiene una ventaja fundamental sobre las bases de datos relacionales: el rendimiento. El acceso de un registro a otro es prcticamente inmediato sin necesidad de consultar tablas de correspondencia. Las relaciones jerrquicas entre diferentes tipos de datos pueden hacer que sea muy sencillo responder a determinadas preguntas, pero muy difcil el contestar a otras. Limitaciones del modelo jerrquico A continuacin se mencionan los problemas tpicos de las bases de datos jerrquicas y que no existen en las bases de datos relacionales. Todos estos problemas derivan del hecho de que el sistema gestor de base de datos no implementa ningn control sobre los propios datos, sino que queda en manos de las aplicaciones garantizar que se cumplen las condiciones invariantes que se requieran (por ejemplo, evitar la duplicidad de registros). Dado que todas las aplicaciones estn sujetas a errores y fallos, esto es imposible en la prctica. Adems dichas condiciones suelen romperse ex profeso por motivos operativos (generalmente, ajustes debidos a cambios en el negocio) sin evaluarse sus consecuencias. Duplicidad de registros No se garantiza la inexistencia de registros duplicados. Esto tambin es cierto para los campos clave. Es decir, no se garantiza que dos registros cualesquiera tengan diferentes valores en un subconjunto concreto de campos. Integridad referencial No existe garanta de que un registro hijo est relacionado con un registro padre vlido. Por ejemplo, es posible borrar un nodo padre sin eliminar antes los nodos hijo, de manera que stos ltimos estn relacionados con un registro invlido o inexistente. Des normalizacin Este no es tanto un problema del modelo jerrquico como del uso que se hace de l. Sin embargo, a diferencia del modelo relacional, las bases de datos jerrquicas no tienen controles que impidan la des normalizacin de una base de datos. Por ejemplo, no existe el concepto de campos clave o campos nicos.