Sunteți pe pagina 1din 13

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y

depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo


su anlisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La
creacin de un datawarehouse representa en la mayora de las ocasiones el primer
paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de
Business Intelligence.
Definicin de Bill Inmon
Bill Inmon1 fue uno de los primeros autores en escribir sobre el tema de los
almacenes de datos, define un data warehouse(almacn de datos) en trminos de
las caractersticas del repositorio de datos:

Orientado a temas.- Los datos en la base de datos estn organizados de


manera que todos los elementos de datos relativos al mismo evento u objeto
del mundo real queden unidos entre s.slo los datos necesarios para el
proceso de generacin del conocimiento del negocio se integran desde el
entorno operacional. Los datos se organizan por temas para facilitar su acceso
y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos
sobre clientes pueden ser consolidados en una nica tabla del datawarehouse.
De esta forma, las peticiones de informacin sobre clientes sern ms fciles
de responder dado que toda la informacin reside en el mismo lugar.

Variante en el tiempo.- Los cambios producidos en los datos a lo largo del


tiempo quedan registrados para que los informes que se puedan generar
reflejen esas variaciones.el tiempo es parte implcita de la informacin
contenida en un datawarehouse. En los sistemas operacionales, los datos
siempre reflejan el estado de la actividad del negocio en el momento presente.
Por el contrario, la informacin almacenada en el datawarehouse sirve, entre
otras cosas, para realizar anlisis de tendencias. Por lo tanto, el
datawarehouse se carga con los distintos valores que toma una variable en el
tiempo para permitir comparaciones.

No voltil.- La informacin no se modifica ni se elimina, una vez almacenado


un dato, ste se convierte en informacin deslo lectura, y se mantiene para
futuras consultas.el almacn de informacin de un datawarehouse existe para
ser ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los ltimos
valores que tomaron las distintas variables contenidas en l sin ningn tipo de
accin sobre lo que ya exista.

Integrado.- La base de datos contiene los datos de todos los sistemas


operacionales de la organizacin, y dichos datos deben ser consistentes.los
datos almacenados en el datawarehouse deben integrarse en una estructura
consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La informacin suele
estructurarse tambin en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.

Inmon defiende una metodologa descendente (top-down) a la hora de disear un


almacn de datos, ya que de esta forma se considerarn mejor todos los datos
corporativos. En esta metodologa los Data marts se crearn despus de haber
terminado el data warehouse completo de la organizacin.
Una definicin ms amplia de almacn de datos[editar]
Las definiciones anteriores se centran en los datos en s mismos. Sin embargo, los
medios para obtener esos datos, para extraerlos, transformarlos y cargarlos, las
tcnicas para analizarlos y generar informacin, as como las diferentes formas para
realizar la gestin de datos son componentes esenciales de un almacn de datos.
Muchas referencias a un almacn de datos utilizan esta definicin ms amplia. Por lo
tanto, en esta definicin se incluyen herramientas para extraer, transformar y cargar
datos, herramientas para el anlisis (inteligencia empresarial) y herramientas para
gestionar y recuperar losmetadatos.
Funcin de un almacn de datos
En un almacn de datos lo que se quiere es contener datos que son necesarios o
tiles para una organizacin, es decir, que se utiliza como un repositorio de datos para
posteriormente transformarlos en informacin til para el usuario. Un almacn de datos
debe entregar la informacin correcta a la gente indicada en el momento ptimo y en
el formato adecuado. El almacn de datos da respuesta a las necesidades de usuarios
expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de
informacin ejecutiva (EIS) o herramientas para hacer consultas o informes. Los
usuarios finales pueden hacer fcilmente consultas sobre sus almacenes de datos sin
tocar o afectar la operacin del sistema.
En el funcionamiento de un almacn de datos son muy importantes las siguientes
ideas:

Integracin de los datos provenientes de bases de datos distribuidas por las


diferentes unidades de la organizacin y que con frecuencia tendrn diferentes
estructuras (fuentes heterogneas). Se debe facilitar una descripcin global y un
anlisis comprensivo de toda la organizacin en el almacn de datos.

Separacin de los datos usados en operaciones diarias de los datos usados


en el almacn de datos para los propsitos de divulgacin, de ayuda en la toma de
decisiones, para el anlisis y para operaciones de control. Ambos tipos de datos
no deben coincidir en la misma base de datos, ya que obedecen a objetivos muy
distintos y podran entorpecerse entre s.

Peridicamente, se importan datos al almacn de datos de los distintos sistemas de


planeamiento de recursos de la entidad (ERP) y de otros sistemas de software
relacionados con el negocio para la transformacin posterior. Es prctica comn
normalizar los datos antes de combinarlos en el almacn de datos mediante
herramientas de extraccin, transformacin y carga (ETL). Estas herramientas leen los
datos primarios (a menudo bases de datos OLTP de un negocio), realizan el proceso

de transformacin al almacn de datos (filtracin, adaptacin, cambios de formato,


etc.) y escriben en el almacn.
Data marts
Los Data marts son subconjuntos de datos de un data warehouse para reas
especficas.
Entre las caractersticas de un data mart destacan:

Usuarios limitados.

rea especfica.

Tiene un propsito especfico.

Tiene una funcin de apoyo.

Cubos de informacin
Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas
en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata
de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3
dimensiones, los cubos OLAP tienen un nmero indefinido de dimensiones, razn por
la cual tambin reciben el nombre dehipercubos. Un cubo OLAP contendr datos de
una determinada variable que se desea analizar, proporcionando una vista lgica de
los datos provistos por el sistema de informacin hacia el data warehouse, esta vista
estar dispuesta segn unas dimensiones y podr contener informacin calculada. El
anlisis de los datos est basado en las dimensiones del hipercubo, por lo tanto, se
trata de un anlisis multidimensional.
A la informacin de un cubo puede acceder el ejecutivo mediante "tablas dinmicas"
en una hoja de clculo o a travs de programas personalizados. Las tablas dinmicas
le permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la
informacin con mucha facilidad. Las diferentes operaciones que se pueden realizar
con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos
a un data warehouse, ste es una coleccin de datos que est formada por
dimensiones y variables, entendiendo como dimensiones a aquellos elementos
que participan en el anlisis y variables a los valores que se desean analizar.
Dimensiones
Las dimensiones de un cubo son atributos relativos a las variables, son las
perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones).
Son catlogos de informacin complementaria necesaria para la presentacin de los
datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de
tiempo, etc. Es decir, la informacin general complementaria a cada uno de los
registros de la tabla de hechos.

Variables
Tambin llamadas indicadores de gestin, son los datos que estn siendo
analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables
representan algn aspecto cuantificable o medible de los objetos o eventos a analizar.
Normalmente, las variables son representadas por valores detallados y numricos
para cada instancia del objeto o evento medido. En forma contraria, las dimensiones
son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o
abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor,
tomando como valores un conjunto de elementos menor que el de las variables;
ejemplos de dimensiones podran ser: productos, localidades (o zonas), el
tiempo (medido en das, horas, semanas, etc.), ...
Ejemplos
Ejemplos de variables podran ser:

Beneficios

Gastos

Ventas

etc.

Ejemplos de dimensiones podran ser:

producto (diferentes tipos o denominaciones de productos)

localidades (o provincia, o regiones, o zonas geogrficas)

tiempo (medido de diferentes maneras, por horas, por das, por meses, por
aos, ...)

tipo de cliente (casado/soltero, joven/adulto/anciano, ...)

etc.

Segn lo anterior, podramos construir un cubo de informacin sobre el ndice de


ventas (variable a estudiar) en funcin delproducto vendido, la provincia, el mes del
ao y si el cliente est casado o soltero (dimensiones). Tendramos un cubo de 4
dimensiones.
Elementos que integran un almacn de datos
Metadatos
Los metadatos permiten saber la procedencia de la informacin, su periodicidad de
refresco, su fiabilidad, forma de clculo... etc.

Uno de los componentes ms importantes de la arquitectura de un almacn de datos


son los metadatos. Se define comnmente como "datos acerca de los datos", en el
sentido de que se trata de datos que describen cul es la estructura de los datos que
se van a almacenar y cmo se relacionan.
El metadato documenta, entre otras cosas, qu tablas existen en una base de datos,
qu columnas posee cada una de las tablas y qu tipo de datos se pueden almacenar.
Los datos son de inters para el usuario final, el metadato es de inters para los
programas que tienen que manejar estos datos. Sin embargo, el rol que cumple el
metadato en un entorno de almacn de datos es muy diferente al rol que cumple en
los ambientes operacionales. En el mbito de los data warehouse el metadato juega
un papel fundamental, su funcin consiste en recoger todas las definiciones de la
organizacin y el concepto de los datos en el almacn de datos, debe contener toda la
informacin concerniente a:

Tablas

Columnas de tablas

Relaciones entre tablas

Jerarquas y Dimensiones de datos

Entidades y Relaciones

Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su
propio lenguaje de negocio, indicando qu informacin hay y qu significado tiene.
Ayudar a construir consultas, informes y anlisis, mediante herramientas de Business
Intelligence como DSS, EIS o CMI.
Dar soporte a los responsables tcnicos deldatawarehouse en aspectos de
auditora, gestin de la informacin histrica, administracin del datawarehouse,
elaboracin de programas de extraccin de la informacin, especificacin de las
interfaces para la realimentacin a los sistemas operacionales de los resultados
obtenidos... etc
Funciones ETL (extraccin, transformacin y carga)
Los procesos de extraccin, transformacin y carga (ETL) son importantes ya que
son la forma en que los datos se guardan en un almacn de datos (o en cualquier
base de datos). Implican las siguientes operaciones:

Extraccin. Accin de obtener la informacin deseada a partir de los datos


almacenados en fuentes externas.obtencin de informacin de las distintas
fuentes tanto internas como externas.

Transformacin. Cualquier operacin realizada sobre los datos para que


puedan ser cargados en el data warehouse o se puedan migrar de ste a otra
base de datos.filtrado, limpieza, depuracin, homogeneizacin y agrupacin de
la informacin.

Carga. Consiste en almacenar los datos en la base de datos final, por ejemplo
el almacn de datos objetivo normal.organizacin y actualizacin de los datos y
los metadatos en la base de datos.

Middleware
Middleware es un trmino genrico que se utiliza para referirse a todo tipo de software
de conectividad que ofrece servicios u operaciones que hacen posible el
funcionamiento de aplicaciones distribuidas sobre plataformas heterogneas. Estos
servicios funcionan como una capa de abstraccin de software distribuida, que se sita
entre las capas de aplicaciones y las capas inferiores (sistema operativo y red).
El middleware puede verse como una capa API, que sirve como base a los
programadores para que puedan desarrollar aplicaciones que trabajen en diferentes
entornos sin preocuparse de los protocolos de red y comunicaciones en que se
ejecutarn. De esta manera se ofrece una mejor relacin costo/rendimiento que pasa
por el desarrollo de aplicaciones ms complejas, en menos tiempo.
La funcin del middleware en el contexto de los data warehouse es la de asegurar la
conectividad entre todos los componentes de la arquitectura de un almacn de datos.
Diseo de un almacn de datos
Para construir un Data Warehouse se necesitan herramientas para ayudar a la
migracin y a la transformacin de los datos hacia el almacn. Una vez construido, se
requieren medios para manejar grandes volmenes de informacin. Se disea su
arquitectura dependiendo de la estructura interna de los datos del almacn y
especialmente del tipo de consultas a realizar. Con este criterio los datos deben ser
repartidos entre numerosos data marts. Para abordar un proyecto de data warehouse
es necesario hacer un estudio de algunos temas generales de la organizacin o
empresa, los cuales se describen a continuacin:

Situacin actual de partida.- Cualquier solucin propuesta de data warehouse


debe estar muy orientada por las necesidades del negocio y debe ser compatible
con la arquitectura tcnica existente y planeada de la compaa.

Tipo y caractersticas del negocio.- Es indispensable tener el conocimiento


exacto sobre el tipo de negocios de la organizacin y el soporte que representa la
informacin dentro de todo su proceso de toma de decisiones.

Entorno tcnico.- Se debe incluir tanto el aspecto del hardware (mainframes,


servidores, redes,...) as como aplicaciones y herramientas. Se dar nfasis a
los Sistemas de soporte a decisiones (DSS), si existen en la actualidad, cmo
operan, etc.

Expectativas de los usuarios.- Un proyecto de data warehouse no es


nicamente un proyecto tecnolgico, es una forma de vida de las organizaciones y
como tal, tiene que contar con el apoyo de todos los usuarios y su convencimiento
sobre su bondad.

Etapas de desarrollo.- Con el conocimiento previo, ya se entra en el desarrollo


de un modelo conceptual para la construccin del data warehouse.

Prototipo.- Un prototipo es un esfuerzo designado a simular tanto como sea


posible el producto final que ser entregado a los usuarios.

Piloto.- El piloto de un data warehouse es el primero, o cada uno de los


primeros resultados generados de forma iterativa que se harn para llegar a la
construccin del producto final deseado.

Prueba del concepto tecnolgico.- Es un paso opcional que se puede necesitar


para determinar si la arquitectura especificada del data warehouse funcionar
finalmente como se espera.

Almacn de datos espacial


Almacn de datos espacial es una coleccin de datos orientados al tema, integrados,
no voltiles, variantes en el tiempo y que aaden la geografa de los datos, para la
toma de decisiones. Sin embargo la componente geogrfica no es un dato agregado,
sino que es una dimensin o variable en la tecnologa de la informacin, de tal manera
que permita modelar todo el negocio como un ente holstico, y que a travs de
herramientas de procesamiento analtico en lnea (OLAP), no solamente se posea un
alto desempeo en consultas multidimensionales sino que adicionalmente se puedan
visualizar espacialmente los resultados.
El almacn de datos espacial forma parte de un extensivo Sistema de Informacin
Geogrfica para la toma de decisiones, ste al igual que los SIG, permiten que un gran
nmero de usuarios accedan a informacin integrada, a diferencia de un simple
almacn de datos que est orientado al tema, el Data warehouse espacial
adicionalmente es Geo-Relacional, es decir que en estructuras relacionales combina e
integra los datos espaciales con los datos descriptivos. Actualmente es geo-objetos,
esto es que los elementos geogrficos se manifiestan como objetos con todas sus
propiedades y comportamientos, y que adicionalmente estn almacenados en una
nica base de datos Objeto-Relacional.
Los Data Warehouse Espaciales son aplicaciones basadas en un alto desempeo de
las bases de datos, que utilizanarquitecturas Cliente-Servidor para integrar diversos
datos en tiempo real. Mientras los almacenes de datos trabajan con muchos tipos y
dimensiones de datos, muchos de los cuales no referencian ubicacin espacial, a
pesar de poseerla intrnsecamente, y sabiendo que un 80% de los datos poseen
representacin y ubicacin en el espacio, en los Data warehouse espaciales, la
variable geogrfica desempea un papel importante en la base de informacin para la
construccin del anlisis, y de igual manera que para un Data warehouse, la variable

tiempo es imprescindible en los anlisis, para los Data warehouse espaciales la


variable geogrfica debe ser almacenada directamente en ella.
Ventajas
Hay muchas ventajas por las que es recomendable usar un almacn de datos. Algunas
de ellas son:

Los almacenes de datos hacen ms fcil el acceso a una gran variedad de


datos a los usuarios finales

Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la


decisin tales como informes de tendencia, por ejemplo: obtener los tems con la
mayora de las ventas en un rea en particular dentro de los ltimos dos
aos;informes de excepcin, informes que muestran los resultados reales frente
a los objetivos planteados a priori.

Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar


el valor operacional de las aplicaciones empresariales, en especial la gestin de
relaciones con clientes.

Inconvenientes
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos de ellos
son:

A lo largo de su vida los almacenes de datos pueden suponer altos costos. El


almacn de datos no suele ser esttico. Los costos de mantenimiento son
elevados.

Los almacenes de datos se pueden quedar obsoletos relativamente pronto.

A veces, ante una peticin de informacin estos devuelven una informacin


subptima, que tambin supone una prdida para la organizacin.

A menudo existe una delgada lnea entre los almacenes de datos y los
sistemas operacionales. Hay que determinar qu funcionalidades de estos se
pueden aprovechar y cules se deben implementar en el data warehouse,
resultara costoso implementar operaciones no necesarias o dejar de implementar
alguna que s vaya a necesitarse.
Conclusiones
1.
El uso de sistemas Data Warehouse es una poderosa estrategia para
administrar empresas.
2.
Los resultados que arrojan los anlisis de los datos obtenidos y consolidados
en el Data Warehouse pueden hacer que la directiva de la empresa corrija las
estrataegias hasta ahora trazadas y mejore as las ganancias.

3.
El mantenimiento de un Sistema Data Warehouse es algo complejo, que
requiere de recursos monetarios y estrategia.
4.
El modelo dimensional brinda una forma muy sencilla de representacin de los
datos y mejora as el tiempo de consultas a la base de datos.
5.
Los sistemas de transformacin de datos de SQL Server brindan una poderosa
herramienta a quienes se inicien en la confeccin de un Data Warehouse sobre este
gestor de Bases de datos.

APLICACIONES
USOS DEL DATA WAREHOUSE
Los datos operacionales y los datos del data warehouse son accesados por usuarios
que usan los datos de maneras diferentes.

Uso de Base de Datos Operacionales

Uso de
Data Warehouse

Muchos usuarios concurrentes

Pocos usuarios concurrentes

Consultas predefinidas y actualizables

Consultas complejas, frecuentemente


no anticipadas.

Cantidades pequeas de datos detallados Cantidades grandes de datos detallados

Requerimientos de respuesta inmediata

Requerimientos de respuesta no crticos

Maneras diferentes de uso de datos


Los usuarios de un data warehouse necesitan acceder a los datos complejos,
frecuentemente desde fuentes mltiples y de formas no predecibles.
Los usuarios que accedan a los datos operacionales, comnmente efectan tareas
predefinidas que, generalmente requieren acceso a una sola base de datos de una
aplicacin. Por el contrario, los usuarios que accedan al data warehouse, efectan
tareas que requieren acceso a un conjunto de datos desde fuentes mltiples y
frecuentemente no son predecibles. Lo nico que se conoce (si es modelada
correctamente) es el conjunto inicial de datos que se han establecido en el depsito.
Por ejemplo, un especialista en el cuidado de la salud podra necesitar acceder a los
datos actuales e histricos para analizar las tendencias de costos, usando un conjunto
de consultas predefinidas. Por el contrario, un representante de ventas podra
necesitar acceder a los datos de cliente y producto para evaluar la eficacia de una
campaa de marketing, creando consultas base o ad-hoc para encontrar nuevamente
necesidades definidas.
Slo pocos usuarios acceden a los datos concurrentemente
En contraste a la produccin de sistemas que pueden manejar cientos o miles de
usuarios concurrentes, al data warehouse acceda un limitado conjunto de usuarios en
cualquier tiempo determinado.
Los usuarios generan un procesamiento no predecible complejo
Los usuarios del data warehouse generan consultas complejas. A veces la respuesta a
una consulta conduce a la formulacin de otras preguntas ms detalladas, en un
proceso llamado drilling down. El data warehouse puede incluir niveles de resmenes
mltiples, derivado de un conjunto principal, nico, de datos detallados, para soportar
este tipo de uso.
En efecto, los usuarios frecuentemente comienzan buscando en los datos resumidos y
como identifican reas de inters, comienzan a acceder al conjunto de datos detallado.
Los conjuntos de datos resumidos representan el "Qu" de una situacin y los
conjuntos de datos detallados permiten a los usuarios construir un cuadro sobre
"Cmo" se ha derivado esa situacin.
Las consultas de los usuarios accedan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre muchas
clases de datos, las consultas al data warehouse permiten acceder a volmenes muy
grandes tanto de data detallada como resumida. Debido a los requerimientos de datos
histricos, los data warehouses evolucionan para llegar a un tamao ms grande que
sus orgenes operacionales (de 10 a 100 veces ms grande).
Las consultas de los usuarios no tienen tiempos de respuesta crticos

Las transacciones operacionales necesitan una respuesta inmediata porque un cliente


puede estar esperando una respuesta. En el data warehouse, por el contrario, tiene un
requerimiento de respuesta no-crtico porque el resultado frecuentemente se usa en un
proceso de anlisis y toma de decisiones. Aunque los tiempos de respuesta no son
crticos, los usuarios esperan una respuesta dentro del mismo da en que es hecha la
consulta.
Por lo general, los diferentes niveles de datos dentro del data warehouse reciben
diferentes usos. A ms alto nivel de esquematizacin, se tiene mayor uso de los datos.
La data ms resumida, permite capturar los datos en forma ms rpida y eficiente. Si
en una tarea se encuentra que se hace mucho procesamiento a niveles de detalle del
data warehouse, entonces se consumir muchos recursos de mquina. Es mejor hacer
el procesamiento a niveles ms altos de esquematizacin como sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la
informacin a nivel de detalle en un pre data warehouse. La seguridad de la
informacin de detalle se consigue de muchas maneras, aun cuando estn disponibles
otros niveles de esquematizacin. Una de las actividades del diseador de datos es el
de desconectar al usuario del sistema de soporte de decisiones del uso constante de
datos a nivel de detalle ms bajo.
El diseador de datos tiene dos predisposiciones:
Instalar un sistema chargeback, donde el usuario final pague por los recursos
consumidos
Sealar el mejor tiempo de respuesta que puede obtenerse cuando se trabaja con la
data a un nivel alto de esquematizacin, a diferencia de un pobre tiempo de respuesta
que resulta de trabajar con los datos a un nivel bajo de detalle.
BENEFICIOS ASOCIADOS AL DATA WAREHOUSE
Un DW puede dar lugar a una serie de importantes beneficios para la organizacin. En
cualquier caso, su utilizacin permitir que la informacin de gestin sea: accesible,
correcta, uniforme y actualizada.
Estas caractersticas asociadas a la informacin contenida en un DW, junto con otra
serie de aspectos inherentes al mismo dan lugar a la obtencin de un conjunto de
ventajas, que podramos resumir del siguiente modo:
Menor coste en la toma de decisiones: Se suprime el despilfarro de tiempo que se
poda producir al intentar ejecutar consultas de datos largas y complejas con bases de
datos que estaban diseadas especficamente para transacciones ms cortas y
sencillas.
Mayor flexibilidad ante el entorno: El DW convierte los datos operacionales en
informacin relacionada y estructurada, que genera el "conocimiento" necesario para
la toma de decisiones. Esto permite establecer una base nica del modelo de

informacin de la organizacin, que puede dar lugar a una visin global de la


informacin en base a los conceptos de negocio que tratan los usuarios. Adems,
aporta una mejor calidad y flexibilidad en el anlisis del mercado, y del entorno en
general.
Esta visin global puede conllevar tambin la obtencin de otras ventajas competitivas,
al identificar determinados costes que con los sistemas anteriores podan permanecer
ocultos, por ejemplo:
Mejor servicio al cliente: Todo lo que hemos dicho en el punto anterior implica una
importante mejora en la calidad de gestin, lo que tambin repercute en la relacin con
el cliente, que es, como sabemos, uno de los pilares bsicos en los que descansa
cualquier organizacin ajustada. De hecho, el que un DW implique una mayor
flexibilidad ante el entorno tiene una consecuencia directa en una mayor capacidad
para responder a las necesidades de los clientes.
Rediseo de procesos: Ofrecer a los usuarios una capacidad de anlisis de la
informacin de su negocio que tiende a ser ilimitada y permite con frecuencia obtener
una visin ms profunda y clara de los procesos de negocio propiamente dichos, lo
que a su vez permite obtener ideas renovadoras para la rediseo de los mismos.
Alineamiento con los objetivos de rightsizing: Se distribuye cada vez ms en toda la
organizacin la responsabilidad en la toma de decisiones. Esta capacidad de
decisiones distribuidas es cada vez ms necesaria para el rightsizing de las empresas,
y es uno de los aspectos en los que el DW puede aportar una contribucin esencial.
En conclusin, el concepto de DW abarca mucho ms que simplemente copiar datos
operacionales a una base de datos informacional distinta. El sistema deber ofrecer
una solucin completa para gestionar y controlar el flujo de informacin desde bases
de datos corporativas y fuentes externas a sistemas de soporte de decisiones de
usuarios
finales.
Adems, debe permitir a los usuarios conocer qu informacin existe en el almacn de
datos, y cmo poder acceder a ella y manipularla

2.2.6.4. Data Warehouse: Otras reas de aplicacin


Otras reas de la empresa han aplicado las soluciones que proporciona la tecnologa
Data Warehouse para mejorar gran parte de sus procesos actuales. Entre ellas
destacamos:

Control de Gestin:
Sistemas de Presupuestacin, Anlisis de Desviaciones, Reporting (EIS, MIS,
etc.)

Logstica:

Mejora de la relacin con proveedores, Racionalizacin de los procesos de


control de inventarios, Optimizacin de los niveles de produccin, Previsin de
la demanda en infraestructura.

Recursos Humanos
Planificacin de incorporaciones, Gestin de carreras profesionales, Asignacin
de recursos a proyectos alternativos, etc.

SEGURIDAD DE ACCESO Y MANIPULACIN DE LA INFORMACIN EN EL DW


A continuacin trataremos las consideraciones a contemplar en cuanto a seguridad de
accesos y seguridad de datos (backup), puesto que si bien la seguridad de accesos (al
nivel de datos y de aplicacin) debe ser tratada de la misma manera que en los
sistemas operacionales, los procedimientos de copias de seguridad merecen un
especial tratamiento.
Tal y como ocurre en los sistemas operacionales, un sistema Data Warehouse debe
poder realizar procedimientos de recuperacin de la informacin desde cualquier
momento en el que los datos estaban validados. Un Data Warehouse, debe poder
contar con procedimientos de recuperacin, que permitan recuperar los datos ante
cualquier situacin de catstrofe.
No obstante, es preciso tener en cuenta otras consideraciones, as por ejemplo
dependiendo del tamao de un Data Mart, se puede elegir no realizar un backup, sino
realizar un refresco especial desde los datos operacionales, dependiendo de la
periodicidad estndar de carga.
En cuanto a la seguridad de acceso, se cumple en los sistemas de Data Warehouse,
que es preciso el implantar niveles de acceso a la informacin, realizando un plan
completo de seguridad que contemple:

Acceso a recursos de la red (local o intranet)

Asignacin de usuarios a grupos con perfiles de seguridad diferenciados

Asignacin de niveles de autorizacin de aplicacin a grupos de usuarios

Seguridad a nivel de Base de Datos, mediante los procedimientos provistos por


las mismas.

Etc.

BIBLIOGRAFIA
Leer
ms: http://www.monografias.com/trabajos57/data-warehouse-sql/datawarehouse-sql2.shtml#ixzz3JuAKpkX1
http://www.dataprix.com/seguridad-informacion-dwh
http://www.dataprix.com/aplicaciones-dwh

S-ar putea să vă placă și