Documente Academic
Documente Profesional
Documente Cultură
1. Un Data Warehouse proporciona una visión global, común e integrada de los datos
de la organización, independiente de cómo se vayan a utilizar posteriormente por
los consumidores o usuarios, con las propiedades siguientes: estable, coherente,
fiable y con información histórica. Al abarcar un ámbito global de la organización y
con un amplio alcance histórico, el volumen de datos puede ser muy grande
(centenas de terabytes). Las bases de datos relacionales son el soporte técnico más
comúnmente usado para almacenar las estructuras de estos datos y sus grandes
volúmenes. Normalmente en el almacén de datos habrá que guardar información
histórica que cubra un amplio período de tiempo. Pero hay ocasiones en las que no
se necesita la historia de los datos, sino sólo sus últimos valores, siendo además
admisible generalmente un pequeño desfase o retraso sobre los datos
operacionales. En estos casos el almacén se llama almacén operacional
(ODS, Operational Data Store).
http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema en estrella:
Esquema de estrella
La tabla de hechos se encuentra en el centro del modelo y está relacionada con las tablas
de dimensiones de forma radial que a su vez no se relacionan entre sí.
http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema en copo de nieve:
El esquema en copo de nieve (snowflake schema) es un esquema de representación
derivado del esquema en estrella, en el que las tablas de dimensión se normalizan en
múltiples tablas. Por esta razón, la tabla de hechos deja de ser la única tabla del esquema
que se relaciona con otras tablas, y aparecen nuevas joins gracias a que las dimensiones
de análisis se representan ahora en tablas de dimensión normalizadas. En la estructura
dimensional normalizada, la tabla que representa el nivel base de la dimensión es la que
hace join directamente con la tabla de hechos. La diferencia entre ambos esquemas (star y
snowflake) reside entonces en la estructura de las tablas de dimensión. Para conseguir un
esquema en copo de nieve se ha de tomar un esquema en estrella y conservar la tabla de
hechos, centrándose únicamente en el modelado de las tablas de dimensión, que si bien
en el esquema en estrella se encontraban totalmente denormalizadas, ahora se dividen en
subtablas tras un proceso de normalización. Es posible distinguir dos tipos de esquemas
en copo de nieve, un snowflake completo (en el que todas las tablas de dimensión en el
esquema en estrella aparecen ahora normalizadas en el snowflake) o un snowflake parcial
(sólo se lleva a cabo la normalización de algunas de ellas).
En este esquema existen jerarquías entre las tablas de dimensiones y las mismas
presentan caminos alternativos o pueden estar relacionadas.
http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/
Esquema constelación
Este esquema puede estar formado por varios modelos en estrella definiéndose más de
una tabla de hechos en la parte central del esquema relacionadas por sus respectivas
tablas de dimensiones.
La tabla de hechos puede estar conformada por millones de registros en dependencia de
su granularidad y de los intervalos de tiempo de los mismos. Los hechos son todas
operaciones estadísticas y aritméticas que posibilitan agilizar y dinamizar el trabajo con los
datos consultados en sus diferentes dimensiones.
GRANULARIDAD
El concepto de granularidad parte del principio que es más fácil reutilizar unidades más
pequeñas dado, que de este modo, es posible seleccionar aquellas partes que nos
interesan y descartar aquellas que no son adecuadas en el contexto donde nos
encontramos.
Además la granularidad describe el nivel de detalle de la base de datos
en datawarehouse. La determinación del nivel de granularidad es uno de los puntos más
importantes del modelado lo cual impacta directamente en el tamaño de la base de datos.
http://josepcurto.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/
https://www.esan.edu.pe/apuntes-empresariales/2015/06/diferencia-entre-data-warehouse-data-mart/