Sunteți pe pagina 1din 12

DATA WAREHOUSING

Integrantes:
Jaime Aravena Siqus.
Kevin Aravena Vega.
Gabriel Herrera Diaz.















2

ndice

ndice..2
Abstract...3
Introduccin....3
Introduccin a Data Warehousing..4
Objetivos Generales............................................................................................................................4
Conceptos Previos...5
Objetivos del Data Warehouse....6
Marco Teorico............................................................................................................................. ........6
Conclusin................................................................................................................... ........................12
Bibliografa............................................................................................ ..............................................12
















3


Abstract
This paper general purpose is, show and
explain the Data Warehouse (DW) concept and all
its functionality on the business world as clear as
possible. To start we are going to make an
introduction to the Data Warehouse concept. Then
we are going to see an explanation of many
concepts that are involved with this topic to
understand it in greater details, for example we
have the Business Intelligence which is an
extremely important concept to have in mind when
we talk about DW and not only this but many
others like this. In the next place, we show the
principal objectives that the Data Warehouse has
been made for. In the next section we explain
more deeply the Data Warehouse, explaining the
progress that has made over the time and its
history and then we are going to see the main
features presented in the DW like its architecture
and how it operates. To finish we show an
example of implementation of the Data
Warehouse on a business company explaining its
functionality.
Key Words: Business Intelligence, Data Mart,
Data Mining, OLTP, OLAP.


1. Introduccin
Desde que se inici la era de la
computacin, los establecimientos han utilizado
los datos desde sus sistemas operacionales para
atender sus necesidades de informacin. Algunas
proporcionan acceso directo a la informacin
contenida dentro de las aplicaciones
operacionales. Otras, han extrado los datos desde
sus bases de datos operacionales para combinarlos
de varias formas no estructuradas, en su intento
por solucionar la necesidad de requerimiento
informtico.
Ambos mtodos han mejorado con el
paso del tiempo y ahora las organizaciones
manejan una data no limpia e inconsistente, sobre
las cuales, generalmente, se toman decisiones
importantes.


La gestin administrativa admite que una
manera en particular de aumentar la eficiencia
radica en hacer el mejor uso posible de los
recursos de informacin existentes dentro de la
organizacin. Sin embargo, a pesar de que esto se
viene intentando desde hace mucho tiempo, no se
tiene todava un uso mejorado de los mismos.
La razn principal es la manera en que
han evolucionado las computadoras, basadas en
las tecnologas de informacin y sistemas. La
mayora de las organizaciones hacen lo posible
por conseguir buena informacin, pero el logro de
ese objetivo depende fundamentalmente de su
arquitectura actual, tanto de hardware como de
software.
El data warehouse, es actualmente, el
centro de atencin de las grandes instituciones,
porque provee un ambiente para que las
organizaciones hagan un mejor uso de la
informacin que est siendo administrada por
diversas aplicaciones operacionales.
Un data warehouse es una coleccin de
datos en la cual se encuentra integrada toda la
informacin de la Institucin y que se usa como
soporte elemental para la toma de decisiones
gerenciales. Aunque diversas organizaciones y
personas individuales logran comprender el
enfoque de un Warehouse, la experiencia ha
demostrado que existen muchas dificultades
potenciales que ya indagaremos.
Reunir los elementos de datos apropiados
para la bsqueda desde diversas fuentes de
aplicacin en un ambiente integral centralizado,
simplifica de manera cuantiosa el problema de
acceso a la informacin y en consecuencia, acelera
de sobremanera el proceso de anlisis, consultas y
el menor tiempo de uso de la informacin.

Las aplicaciones para soporte de
decisiones basadas en un data warehousing,
pueden hacer ms prctica y fcil la explotacin
de datos para una mayor eficacia del negocio, que
no se logra cuando se usan slo los datos que
provienen de las aplicaciones operacionales (que
ayudan en la operacin de la empresa en sus
operaciones cotidianas), en los que la informacin
4

se obtiene realizando procesos independientes y
muchas veces complejos.

Un data warehouse se crea al extraer
datos desde una o ms bases de datos de
aplicaciones operacionales. La data extrada es
transformada para eliminar inconsistencias (datos
intiles en mi bsqueda) y resumir si es necesario
y luego, cargadas en el data warehouse. El proceso
de transformar, crear el detalle de tiempo variante,
resumir y combinar los extractos de datos, ayudan
a crear el ambiente para el acceso a la informacin
Institucional. Este nuevo enfoque ayuda a las
personas individuales, en todos los niveles de la
empresa, a efectuar su toma de decisiones con ms
responsabilidad y reducir el porcentaje de error en
la decisin tomada.
La innovacin de la Tecnologa de
Informacin dentro de un ambiente data
warehousing, puede permitir a cualquier
organizacin hacer un uso ms ptimo de los
datos, como un ingrediente clave para un proceso
de toma de decisiones ms efectivo. Las
organizaciones tienen que aprovechar sus recursos
de informacin para crear la informacin de la
operacin del negocio, pero deben considerarse
las estrategias tecnolgicas necesarias para la
implementacin de una arquitectura completa de
data warehouse.




2. Introduccin al concepto Data
Warehousing
Data warehousing es el centro de la
arquitectura para los sistemas de informacin en la
dcada de los '90. Soporta el procesamiento
informtico al proveer una plataforma slida, a
partir de los datos histricos para hacer el anlisis.
Facilita la integracin de sistemas de aplicacin
no integrados. Organiza y almacena los datos que
se necesitan para el procesamiento analtico,
informtico sobre una amplia perspectiva de
tiempo.
Un Data Warehouse o Depsito de Datos
es una coleccin de datos orientado a temas,
integrado, no voltil, de tiempo variante, que se
usa para el soporte del proceso de toma de
decisiones gerenciales.
Se puede caracterizar un data warehouse
haciendo un contraste de cmo los datos de un
negocio almacenados en un data warehouse,
difieren de los datos operacionales usados por las
aplicaciones de produccin.



3. Objetivos generales y
especficos
El principal objetivo es introducirnos
plenamente en el mundo del Data Warehouse,
indagando dentro de internet como equipo de
trabajo, ya sea en distintos Papers adentrndonos
en los distintos formatos de gente familiarizada
con el tema, distintas tesis internacionales,
entrando en los distintos sistemas que actualmente
utilizan Data Warehouse, concepto que por el
momento conocemos de forma muy bsica y
esperamos profundizarlo y conocerlo en su
totalidad.
Tambin tenemos por objetivos lograr
una metodologa de trabajo rpida y eficiente, ya
que se nos vienen una gran cantidad de trabajos
ms durante el semestre que esperamos hacerlos
de la mejor forma posible cumpliendo todas las
expectativas tanto de profesor, ayudantes y
nosotros mismos.
Y para finalizar como objetivo especfico
queremos adentrarnos en lo que es un Paper,
generar una pauta que nos sirva para el futuro,
cumplir con todas las especificaciones para este
Paper tratando de abarcar la mayor informacin
posible y que el contenido sea sintetizado y
preciso.




5

4. Conceptos Previos
A continuacin sern explicados
brevemente algunos conceptos clave para un
mejor entendimiento del tema, pues bien el
concepto de Data Warehouse est compuesto por
muchos trminos anidados los cuales son claves
para su total comprensin:

4.1 Business Intelligence

Es el uso de datos en una empresa para
realizar una mejor toma de decisiones, de esta
manera los datos son transformados en
informacin y esta informacin en conocimientos
mediante una serie de tcnicas que llevan a la
optimizacin en la toma de decisiones.


4.2 Data Mart

Muy parecido al concepto de Data
Warehouse, pero su principal fin es contener solo
la informacin de un rea especfica con el fin de
tener una visin ms detallada para hallar una
solucin a un problema en concreto, este puede
contener datos de distintas fuentes de informacin.


4.3 Data Mining

El concepto Data Mning es conformado
por tcnicas y herramientas las cuales son
utilizadas para llevar a cabo una bsqueda de
manera automtica o semiautomtica para as
poder encontrar datos que ayuden a entender el
papel o comportamiento que cumplen algunos
datos dentro de un rea de bsqueda.



4.4 OLTP (On-Line Transactional
Processing)

Son bases de datos las cuales estn
orientadas al tratamiento y procesamiento de
transacciones de manera que se analizan los datos
en tiempo real, adems de esto lleva a cabo tareas
como insercin, modificacin y borrado de datos
los cuales posteriormente van siendo estructurados
por niveles.

4.5 OLAP (On-Line Analytical
Processing)

Estas bases de datos, como su nombre lo
indica, estn orientadas al procesamiento analtico
y es una solucin utilizada en el Business
Intelligence con la cual se busca agilizar la
consulta de grandes cantidades de datos de manera
que se extraiga informacin til para la empresa.
Para llevar a cabo esto se utilizan estructuras
multidimensionales las cuales contienen datos
resumidos de bases de datos o Sistemas
Transaccionales.




4.6 MOLAP (Multimedimensional
Analytical Processing)

Los datos son almacenados en una
matriz multidimensional lo cual ayuda a agilizar
las bsqueda adems de hacerlas ms efectivas, el
nico problema que presenta es que ocupa ms
espacio en el disco que los dems mtodos.


4.7 ROLAP (Relational Analytical
Processing)

Implementa OLAP de mejor manera
puesto que almacena la informacin en una base
de datos relacional. La respuesta a consultas
ROLAP suelen ser ms lentas que las realizadas
con MOLAP. Su uso ms comn es el acceso a
grandes cantidades de datos que se usan con poca
frecuencia.




6

4.8 HOLAP (Hybrid Analytical
Processing)

Tambin encontramos el modelo
HOLAP, el cual es una combinacin de las
tcnicas MOLAP y ROLAP. Este mtodo nos
presenta una mezcla en la que se tratan los datos
de manera multidimensional pero a la vez se
mantienen las conexiones relacionales para poder
realizar consultas ms eficaces y rpidas.





5. Objetivos del Data Warehouse.
Hacer que la informacin de la empresa sea de un
fcil acceso:
El contenido del Data Warehouse debe
ser comprensible y obvio para el cliente. La
comprensibilidad requiere si o si legibilidad, por
lo que el contenido necesita ser nombrado de
manera significativa y no con un nombre
aleatorio. El usuario de negocio debe poder
extraer datos del Data Warehouse y mezclar esta
informacin de todas las formas requeridas,
utilizando herramientas simples y fciles de usar,
con un tiempo de respuesta mnimo.
El Data Warehouse debe presentar la informacin
de la organizacin consistentemente:
La informacin del Data Warehouse debe
ser creble. Los datos deben ser elegidos de varios
sitios en la organizacin, deben ser escogidos de
tal manera que sean tiles en la bsqueda, con
calidad asegurada, y liberados cuando no sean
necesarios para el usuario. La informacin de un
proceso de negocio debe coincidir con la
informacin de otro proceso. Todos los datos se
contabilizan y estn completos. La consistencia
tambin requiere que las definiciones comunes del
contenido del Data Warehouse estn disponibles
para todos los usuarios.


El Data Warehouse debe ser adaptable y resistente
a cambios:
No se pueden evitar los cambios. Las
necesidades de los clientes, las condiciones del
negocio, los datos, la tecnologa entro otros
factores, estn sujetos a cambios en el tiempo. Los
cambios en el Data Warehouse no deben borrar
los datos previos.
El Data Warehouse debe ser seguro de tal manera
que proteja nuestra informacin.
El Data Warehouse debe controlar
efectivamente el acceso a la informacin
confidencial de la organizacin.
El Data Warehouse debe servir como base para
tomar una decisin con el menor porcentaje de
error.
El Data Warehouse debe contener la
informacin correcta para soportar la toma de
decisiones


6. Marco Terico
6.1 Data Warehouse
Data Warehouse es un almacn de datos
que recoge toda la informacin que produce una
empresa. Sobre la informacin que hay, de
carcter histrico, se genera nueva informacin en
forma de resmenes, contabilizaciones e incluso
se llega a un nivel superior de detalle para poder
ofrecer informacin orientada a la toma de
decisiones en cualquier momento, sin necesidad
de esperar largos periodos en la realizacin de
informes tediosos que tienen ms probabilidad de
error y acumulan un nivel muy superior de
imprecisiones.
Un Data Warehouse puede ser la mejor
herramienta para conseguir informacin de
calidad, dnde los datos que se muestren sean
vlidos, se encuentren correctamente formateados
y tengan un propsito bien definido. Es decir, que
se sepa para que se vaya a usar dicho dato, como
usarlos y que el hecho de hacerlo no traiga errores
de la base y en definitiva convertir los repositorios
de la informacin en conocimiento til a la
empresa.

7

6.2 Etapas del Data Warehouse
En un principio se crea que el
almacenamiento de datos se tena que centrar en la
prestacin de capacidad para aquellas decisiones
estratgicas que tomaban los trabajadores sobre
el entorno referente a las empresas. reas del tipo
marketing, planificaciones estratgicas y finanzas
entre otras, hicieron aumentar el acceso a la
informacin lo que tambin hizo aumentar la
calidad de tomar decisiones. En estos tiempo, al
tener un entorno empresarial altamente
competitivo, se hace insuficiente el solo
desarrollar una estrategia corporativa. En estos
das, una buena estrategia no es nada sin una gran
y mejor ejecucin.

En este margen llegan las nuevas
generaciones, que traen consigo nuevas
implementaciones de Data Warehouse, las que
mejoran la ejecucin de las estrategias de negocio,
asegurando en cierto porcentaje el desarrollo de
las empresas. Para la maduracin y el apoyo a las
decisiones dentro de las empresas u
organizaciones, se plantean cinco etapas donde el
almacenamiento de datos va evolucionando junto
con las empresas y organizaciones.

A continuacin presentaremos un tipo de
implementacin del Data Warehouse planteado y
reforzado por el Director de Terada Corporation,
empresa estadounidense que profundiza el tema,
Stephen Brobst.



6.2.1 Presentacin de informes

Es primordial que las organizaciones
presenten informes a partir de su propia fuente de
verdad. El trabajar duro y dedicarse a
proporcionar informacin lo ms integrada posible
hace que la toma de decisiones se vea facilitada y
prepara la informacin y la convierte en la base
para las siguientes etapas de implementacin de
almacenamiento de datos. La integracin de los
datos se hace tediosa y se convierte en el mayor
desafo para la primera etapa. El limpiar los datos,
construirlos de forma consistente es sumamente
importante, sin embargo no tiene que ser algo
exagerado. Se trata de evitar el llegar a un nico
valor estndar para una gran cantidad de fuentes
de datos.


6.2.2 Anlisis

En el entorno de anlisis, destaca el
hecho de que los que toman las decisiones se
centran menos en lo que sucedi y ms en el por
qu sucedi. Las estructuras de consulta pasan a
ser no tan predecibles como lo son en el entorno
de la primera etapa de informes, lo que en
definitiva logra que las preguntas a la base de
datos no puedan ser conocidas de antemano. La
interaccin con la informacin aumenta mucho en
esta etapa, por lo que es importante que una
aplicacin de almacenamiento de datos tenga un
ptimo rendimiento. La primera etapa es
programada para ejecutarse ya sea de forma
regular siguiendo los calendarios de las
organizaciones, por un motor de sincronizacin y
en algunos casos de forma manual. En este caso,
el anlisis es principalmente una actividad prctica
con el refinamiento de las preguntas en un entorno
interactivo. Hablamos de una aplicacin por la
necesidad de que entre el almacn de datos y los
usuarios no exista un intermediario del tipo
programador. El que una aplicacin tenga
herramientas grficas, tipeos de consultas claros, y
principalmente un buen rendimiento. Los usuarios
suelen ser impacientes, por lo que el proporcionar
la informacin en tiempos de respuestas en
segundos se hace vital. Para lograr un buen
rendimiento se ocupan tcnicas avanzadas de
indexacin lo que optimiza y genera accesos
eficientes y flexibles a la informacin dentro de
los tiempos de respuestas aceptables.

6.2.3 Prediccin
Si bien es sumamente importante que las
empresas u organizaciones mejoren y ejecuten sus
tcnicas y experiencias de la toma de decisiones
con las cuales responden el qu y el por qu
dentro de sus interacciones laborales y de
negocios, es necesario llegar a un nuevo nivel y
dar un paso hacia lo que es el aprovechar la
informacin con fines predictivos.




8

El comprender el qu suceder tiene
suma importancia en las gestiones proactivas de
las distintas estrategias de las empresas u
organizaciones. De esta forma, se plantea el
construir herramientas y modelos predictivos con
detalles de los datos a travs de su historia. El
nmero de usuarios finales que reciben esta
informacin predictiva es bastante reducido a los
anteriores, sin embardo este hecho implica una
gran carga de trabajo en cuanto a la construccin
de modelos los cuales suelen ser muy intensos.
Los algoritmos de prediccin toman en cuenta una
gran cantidad de datos y observaciones para un
objetivo muy especfico dentro de las
organizaciones. Logaritmos, exponenciales y
funciones trigonomtricas o estadsticas son muy
comunes para obtener las caractersticas esperadas
de prediccin. El tener el acceso a la informacin
detallada resulta ser esencial para que los
algoritmos puedan hacer predicciones. Es por eso
que las dos primeras etapas anteriores estn
plenamente enfocadas en esos asuntos. A pesar de
todos los costos de crear algoritmos de
prediccin, se hace sumamente necesario para el
desarrollo a futuro de todas las organizaciones.
El saber que est pasando con tus producciones
es importante pero lo que pasar en el maana es
lo primordial, sobre todo considerando que lo que
est pasando hoy ya lo saba desde ayer.


6.2.4 Puesta en funcionamiento
En una primera instancia, las tres
primeras etapas apuntan a lo que es el tomar una
decisin estratgica dentro de una organizacin.
Esta cuarta etapa se centrar en el apoyo a las
distintas decisiones tomadas con anterioridad. El
apoyo ir ms por la parte humana, donde valga la
redundancia esta etapa apoyar a las personas en
el campo en el que se est ejecutando. Esta
seccin resulta ser vital para aquellas
transacciones o movimientos con un registro
sumamente rpido y con respuesta inmediata. El
apoyar a las personas hace referencia a manejar
los datos de tal forma que cada dato que se le
proporciona al usuario sea a un nivel detallado. En
el caso de minoristas resulta ser muy importante,
ya que suelen utilizar un inventario manejado por
un vendedor con una cadena de tiendas y donde
los costos de inventarios resultan ser elevados. Es
por esto que esta seccin tiene como objetivo el
reducir los costos de inventarios a travs de
cadenas de suministros mucho ms eficientes. Lo
realiza de tal forma que el acceso a la informacin
relativa a las ventas, promociones, inventario o lo
que sea relativo al caso, sea con lujos de detalles
como ya se mencion anteriormente. Manejar
datos del fabricante, fechas de entrega,
vencimiento entre muchos otros, hace que se
pueda ejecutar de manera eficiente en base a los
requisitos del inventario las distintas decisiones.

Para ejemplificar un poco tenemos el caso de los
camiones de carga. Existen muchas decisiones
sumamente complejas a tomar, tales como qu
hacer si se rompe algn paquete, como manejar
los cambios de paquetes entre un camin y otro, el
qu hacer si un camin llega tarde En fin una
variada gama de eventos que hacen difcil el tomar
una decisin y donde esta etapa de Puesta en
funcionamiento viene a solucionar de cierta
forma esos inconvenientes al apoyar al usuario
con informacin detallada cosa que pueda tomar
la mejor decisin. Muy importante tambin es que
esa informacin est puesta al da y que
obviamente se actualice a tiempo real. El adquirir
continuamente datos y distintas operaciones no
debe ser impedimento para tener el almacn de
datos actualizado. El tener una actualizacin de
los datos de semanas o en algunos casos de meses
resulta insuficiente para apoyar las decisiones
tcticas de una forma aceptable.




6.2.5 Almacenamiento activo
Ya en la etapa anterior uno se acerca al
concepto de Almacenamiento activo, pero es
ac donde se profundiza en su totalidad. Mientras
ms enriquecido est nuestro almacn de datos
activos, ms jugarn estos datos en aspectos
operativos relacionados con el apoyar las
decisiones, y habrn ms incentivos para que las
empresas apuesten por el automatizar los procesos
de decisin. Las empresas buscan el automatizar
decisiones tanto por razones de eficiencia y por
coherencia de la toma de decisiones, pero an ms
cuando los seres humanos no tienen un real valor
significativo en estas mismas. Por ejemplo, el que
un cliente interacte con una pgina web o un
cajero automtico, hace que no exista ms
remedio que el automatizar la toma de decisiones.




9

La toma de decisiones de estos casos
tiene lugar sin seres humanos entre medio y de
una forma totalmente automatizada donde los
tiempos de respuesta deben ser sumamente
nfimos (entre segundos o milisegundos).

Con el avance de la tecnologa, cada vez
ms las decisiones pasan por un proceso
totalmente automatizado. Ya no se requiere mucha
mano de obra para actualizar inventarios, precios
entre otros. De hecho hasta el sector de comercio
minorista en muchos casos ya cuenta con
tecnologas electrnicas que hacen no ms que un
trmite la toma de decisiones. Los trabajos del
tipo manual ya en estos tiempos son difciles de
encontrar. Gracias a los avances y la eficacia del
proceso y etapa tres de prediccin, hasta no hay
problemas para las temporadas con mayor
demanda, donde los inventarios son ms altos de
lo que deberan ser, donde ya es posible encontrar
sofisticadas estrategias para dar soluciones y
tomar decisiones. El tener un almacn de datos
activo, nos permite el que estas decisiones se
tomen de manera ptima evaluando elemento por
elemento, tienda por tienda, con una rigurosidad
segundo a segundo con eventos a favor y en
contra. Incluso es posible tener las decisiones
cliente por cliente en un almacn de datos activo.

En estos tiempos existe una intensa
competencia y variadas innovaciones
tecnolgicas, las cuales estn motivando a estos
avances dentro de las distintas empresas y
organizaciones. Un almacn de datos activo les
ofrece informacin y permite un ptimo soporte a
las decisiones, en lugar de limitarse a los procesos
estratgicos de toma de decisiones. Eso s, el
hecho de tener un almacn de datos activo no
quiere decir el que ste reemplazar el apoyo de
decisiones estratgicas que se evaluaron en las
etapas anteriores. De hecho un almacn de datos
soporta la coexistencia de ambos tipos de cargas
de trabajo.

Con esto podemos concluir que el
proceso de formar un almacn de datos activo es
evolutivo en su totalidad. El tratar de saltar de la
fase tres a la cinco no es aconsejable, por lo que se
dice que este es un proceso de iteracin.




6.3 Caractersticas del Data
Warehouse
Las principales caractersticas del uso del
Data Warehouse son presentadas a continuacin:
Es un depsito de datos. Los datos son
independientes de los sistemas operativos o de las
aplicaciones existentes, simplemente satisfacen
ciertos requerimientos.

Es una forma de arquitectura de
estructura de datos. Permite atender consultas para
la toma de decisiones ya que dota a los sistemas
de explotacin del DW de agregaciones y
desagregacin de datos de forma interactiva.

Incluye un proceso que integra datos
provenientes de diversas fuentes, algunas internas
y otras externas. Tiene la capacidad de integrar
datos heterogneos para conformar informacin
homognea y precisa, dnde el hecho de generar
conocimiento sea ms sencillo

Los datos contenidos en un Data
Warehouse constituyen la historia detallada de los
negocios de la empresa y su relacin con los
clientes. Las empresas que sepan

Un Data Warehouse es un sistema de
aplicacin empresarial que contiene su propia base
de datos. Es decir, se puede ver como un sistema
aparte de los sistemas dnde la empresa mantiene
su actividad empresarial primaria.

La construccin y desarrollo de un Data
Warehouse exitoso requiere la integracin de
varios componentes de tecnologa y la habilidad
para hacerlos funcionar todos juntos. Adems
debe tenerse muy claro el propsito por el que se
crear el Data Warehouse y saber que
requerimientos debe cubrir toma un papel crucial
en el desarrollo del mismo.

La finalidad de un Data Warehouse
consiste en ayudar al usuario empresarial a
conocer el pasado y poder planear el futuro, ayuda
a anticiparse. Permite posicionar la empresa con
respecto a los competidores.



10

6.4 Funcionamiento de un Data
Warehouse
Para comprender ntegramente el
concepto de Data Warehouse, es importante
entender cul es el proceso de construccin del
mismo, denominado ETL (Extraccin,
Transformacin y Carga), a partir de los sistemas
operaciones de una compaa:
Extraccin: obtencin de informacin de las
distintas fuentes tanto internas como externas.
Transformacin: filtrado, limpieza, depuracin,
homogeneizacin y agrupacin de la informacin.
Carga: organizacin y actualizacin de los datos
y los metadatos en la base de datos.

6.5 Arquitectura de un Data
Warehouse
1. Detalle de los datos actuales

Reflejan los acontecimientos ms
recientes, las ltimas informaciones generadas por
los sistemas de produccin de la organizacin. El
nivel de detalle no tiene por qu ser el mismo que
el de los sistemas de produccin, ya que los datos
pueden ser fruto de alguna agregacin o de una
simplificacin de los datos originales.

2. Detalle de datos antiguos

Estn almacenados en un nivel de detalle
consistente con los datos detallados actuales, esto
significa que si los datos actuales hacen referencia
a ventas diarias en el ao actual, los datos
historiados contienen las ventas de aos anteriores
en el nivel de detalle de da tambin.

3. Datos resumidos

Son datos obtenidos como resultado de
un proceso de sntesis de los datos actuales. Lo
que se tiene entonces son datos agregados o
resumidos. Por ejemplo, se entiende mejor la
evolucin de las ventas si se la presenta resumida
por semanas que de manera diaria.




4. Metadatos

Ofrecen informacin descriptiva sobre el
contexto, la calidad, la condicin y las
caractersticas de los datos. El metadato se sita
en una dimensin diferente a la de los otros datos
en el data warehouse, debido a que su contenido
no es tomado directamente desde el ambiente
operacional.



6.6 Ventajas y Desventajas en el uso de
un Data Warehouse
Ventajas:

Proporciona informacin clave para la
toma de decisiones empresariales.

Mejora la calidad de las decisiones
tomadas.

Especialmente til para el medio y largo
plazo.

Son sistemas relativamente sencillos de
instalar si las fuentes de datos y los
objetivos estn claros.

Muy tiles para el almacenamiento de
anlisis y consultas de histricos.

Proporciona un gran poder de
procesamiento de informacin.

11

Permite una mayor flexibilidad y rapidez
en el acceso a la informacin.

Facilita la toma de decisiones en los
negocios.

Las empresas obtienen un aumento de la
productividad.

Proporciona una comunicacin fiable
entre todos los departamentos de la
empresa.

Mejora las relaciones con los
proveedores y los clientes.

Permite conocer qu est pasando en el
negocio, es decir, estar siempre enterado
de los buenos y malos resultados.

Transforma los datos en informacin y la
informacin en conocimiento
Permite hacer planes de forma ms
efectiva.

Reduce los tiempos de respuesta y los
costes de operacin.



Desventajas:

No es muy til para la toma de decisiones
en tiempo real debido al largo tiempo de
procesamiento que puede requerir. En
cualquier caso la tendencia de los
productos actuales (junto con los avances
del hardware) es la de solventar este
problema convirtiendo la desventaja en
una ventaja.

Requiere de continua limpieza,
transformacin e integracin de datos.

Mantenimiento.

En un proceso de implantacin puede
encontrarse dificultades ante los
diferentes objetivos que pretende una
organizacin.

Una vez implementado puede ser
complicado aadir nuevas fuentes de
datos.

Requieren una revisin del modelo de
datos, objetos, transacciones y adems
del almacenamiento.

Tienen un diseo complejo y
multidisciplinar.

Requieren una reestructuracin de los
sistemas operacionales.

Tienen un alto coste.

Requieren sistemas, aplicaciones y
almacenamiento especfico.


6.7 Ejemplo de Empresa
A continuacin se expone un fragmento
de una noticia la cual muestra el uso de Data
Warehousing en una empresa como lo es una
cadena de comida rpida:
...la comida rpida constantemente va en
aumento, no lo hace as la tecnologa que est
detrs de esta. As lo visualiza Exclusive Ore
compaa especializada en la distribucin y
logstica de insumos, para la industria de los
alimentos rpidos. Esta compaa decidi crear
con Microsoft SQL Server 2000 y algunas
herramientas de Microsoft Excel, plataformas de
tecnologa que aporten datos en dos formas: la
generacin de informacin diaria de su sistema
TACO DePol utility y obtener informacin
contable para los reportes financieros desde
Microsoft Dynamics. El Data Warehouse que
dise Excluise Ore, incluye varios mdulos como
SalesMix Cube, SalesDayPart Cube, SalesOps
Cube y ReportCard Cube. Con la combinacin de
estos, el usuario podr medir el desplazamiento
de materias primas y productos para controlar
mejor las operaciones de los restaurantes.
Como podemos apreciar, el concepto
Data Warehouse va ms all de solo empresas
bancarias o gestiones, mediante este fragmento
expuesto podemos ver como mediante un DW se
pueden controlar distintas operaciones como lo
son el manejo de una cadena de restaurantes de
una manera mucho ms detallada, pues de esta
forma es mucho ms fcil poder detectar un error
en algn sector del negocio.

12

7. Conclusin
Al llegar al final del proyecto, podemos
decir que el desarrollo de un Sistema de DW es
bastante complejo. Abarca gran cantidad de
personas, usuarios de los sistemas fuente,
desarrolladores, etc. Tambin comprende
diferentes componentes, sistemas fuente,
herramientas de extraccin, herramientas de
consulta, redes, aplicaciones de usuario final,
bases de datos, etc. Un Sistema de DW debe
combinar todos stos elementos y brindar un
producto final consistente, amigable y confiable
que a su vez est preparado para enfrentar los
continuos cambios que surjan debido a su tan
variada estructura. Un trabajo no trivial.

Todas nuestras metas contempladas para
esta presentacin fueron realizadas con xito, pues
a lo largo de este paper se ha expuesto de manera
clara el concepto Data Warehouse en su totalidad,
pasando por su avance a travs del tiempo,
explicacin estructural y funcional,

Para finalizar, un Data Warehouse tiene
como finalidad almacenar y proveer a la
organizacin informacin relevante y a tiempo
para que esta pueda tomar decisiones correctas sin
cometer errores que puedan provocar un gran
problema tanto para la misma como para sus
clientes.











8. Bibliografa
Database Management
Mc Fadden - Benjamin/Cummings Publishing
Company/Inc., 4 Edicin, 1994.


http://www.1keydata.com/datawarehousing/conce
pts.html

http://delfos.bligoo.com/content/view/195902/Dat
a-Warehouse-Data-mart-y-Data-
Mining.html#.UlF54dLL2GE

http://www.definicionabc.com/tecnologia/datawar
ehouse.php

http://www.inf.udec.cl/~revista/ediciones/edicion3
/cwolff.PDF

http://www.sinnexus.com/business_intelligence/d
atawarehouse.aspx

http://en.wikipedia.org/wiki/Data_warehouse

http://www.monografias.com/trabajos17/data-
warehouse/data-warehouse.shtml

http://oltp.wikispaces.com/Diferencia+entre
+OLTP+y+OLAP

S-ar putea să vă placă și