Sunteți pe pagina 1din 5

Universidad UNITEC Campus Ecatepec

Datamining y Datawarehousing
Entregable 1
Alumno: Carlos Reyes Zaraza

Profesor: Natisma Julieta Lopez Salas

Carrera: Ingeniera en Sistemas Computacionales

Grupo: SCC08V

Horario: 13:00 - 14:30

Fecha: Febrero 24 2014

Universidad UNITEC Campus Ecatepec


Instrucciones: A partir de la lectura realizada al documento proporcionado para el tema Qu es el data warehouse?, contesta correctamente las siguientes preguntas. Enumere al menos dos de los problemas que mencionan los ejecutivos y que se pueden resolver con el Data Warehouse.
Tenemos montaas de datos en esta compaa, pero no podemos acceder a ellos. Slo me interesa ver lo que es importante.

Describa el proceso que se debe seguir para llegar de los datos al conocimiento.
Cuando los datos se ponen en un contexto, se convierten en informacin, y si luego esta informacin es sintetizada con la ayuda de la experiencia se llega al conocimiento.

En sus propias palabras, defina Data Warehouse.


Un Data Warehouse es una copia de los datos transaccionales, especficamente diseada para realizar consultas y anlisis

La base de datos del Data Warehouse est separada de las bases de datos transaccionales?
Si, los datos que estn almacenados en un lugar diferente a donde se almacenan los datos de las aplicaciones

Por qu se dice que los datos estn integrados en un Data Warehouse?


Debido a que estos solo almacenan informacin relevante al rea usuaria y a la operatividad del sistema.

Universidad UNITEC Campus Ecatepec


6

Por qu se dice que los datos estn orientados a un tema de negocio en Data Warehouse?
Porque se tienen modelos que representan las entidades del negocio.

Por qu se dice que los datos son no-voltiles en Data Warehouse?


Por qu se guardan los datos histricos. Usualmente no se eliminan registros.

Por qu se dice que los datos son variantes en el tiempo en Data Warehouse?
Por qu se actualizan peridicamente. Se mantiene la historia.

Enumere los componentes funcionales del Data Warehouse.


1. Bloque de bases de datos operacionales, que capturan los datos y son la fuente de datos del Data Warehouse. 2. Bloque de extraccin, transporte, transformacin, estandarizacin, limpieza y carga de los datos, que es el bloque responsable de poblar el Data Warehouse. Este bloque tambin es conocido como el Staging area. 3. Almacn o base de datos de Data Warehouse, es donde se almacena la informacin integrada, orientada al tema , histrica y actualizada. 4. Bloque de explotacin o acceso, que es donde se encuentran las aplicaciones que permiten el acceso, exploracin y anlisis de los datos. 5. Metadatos, que es otra base de datos que contiene informacin acerca de los datos que hay en el Data Warehouse, acerca de los procesos y acerca del negocio.

10

Los problemas de calidad de datos pueden ser solucionados con un data Warehouse?
Si, debido a que la calidad de los datos en un Data Warehouse, conducir a una reingeniera de las aplicaciones de negocio.

Universidad UNITEC Campus Ecatepec

11

Defina Data Warehousing en sus propias palabras.


Data Warehousing es el proceso de construir un Data Warehouse, el cual es un proceso continuo e incremental.

12

Por qu se utiliza la analoga con un proceso industrial al definir Data Warehousing?


Ensamblar las materias primas(los datos de diferentes fuentes) segn instrucciones especficas (modelo) para realizar un producto terminado(los datos listos para la consulta, exploracin o anlisis), guardado en un almacen de datos(el Data Warehouse) para que est disponible a los clientes(usuarios finales)

13

Cules deben ser las caractersticas de una aplicacin en el contexto de Data Warehousing?
Un Data Warehouse no se construye en una sola iteracin. Cada tema tratado, se descompone en un conjunto de iniciativas (las aplicaciones). Cada aplicacin debe estar claramente definida (objetivos, actores, frecuencia y periodicidad del anlisis). Las aplicaciones deben ser controlables y proporcionar resultados tangibles en plazos menores a 6 meses, que corresponden al plazo medio de realizacin de una aplicacin. La descomposicin en aplicaciones aporta numerosas ventajas, pero genera dificultades sobre ciertos temas, como los relacionados con la infraestructura tcnica y organizativa que necesitan ser visualizados globalmente dentro de una arquitectura.

14

Enumere los sub-procesos que se llevan a cabo dentro del proceso de adquisicin.
1. Adquisicin. Consiste en recoger los datos tiles del sistema de produccin. Se debe identificar los datos que sean necesarios para atender los requerimientos de informacin, luego planificar las extracciones con el fin de evitar saturacin en la red, o afectar al sistema transaccional de produccin. 2. Almacenamiento. El componente bsico del soporte del almacenamiento es el DBMS (DataBase Manager System). El DBMS o motor de base de datos debe tener las caractersticas que le permitan responder eficientemente a las exigencias de las consultas analticas. Para lograrlo debe contar con diversos recursos como el paralelismo, la optimizacin del indexado con la finalidad de acelerar las consultas agregadas, ordenamientos y agrupaciones.

Universidad UNITEC Campus Ecatepec


3. Acceso. El acceso al Data Warehouse se da mediante herramientas o aplicaciones de tipo Cliente/servidor o herramientas que pueden utilizarse desde el Web. Hay una gran variedad de herramientas en el mercado y el nmero de aplicaciones de acceso que se pueden desarrollar es tambin muy grande. Sea cual sea el tipo de herramienta, tendr que adaptarse a las exigencias del usuario y su manera de trabajar.

Cul es el componente bsico del proceso de almacenamiento?


El componente bsico del soporte del almacenamiento es el DBMS (DataBase Manager System).

Mencione las caractersticas de un DBMS adecuado para Data Warehouse.


El DBMS o motor de base de datos debe tener las caractersticas que le permitan responder eficientemente a las exigencias de las consultas analticas. Para lograrlo debe contar con diversos recursos como el paralelismo, la optimizacin del indexado con la finalidad de acelerar las consultas agregadas, ordenamientos y agrupaciones.

Cules son las infraestructuras bsicas para la implementacin de un Data Warehouse?


La infraestructura tcnica o conjunto de componentes materiales y programas, y la infraestructura operativa o conjunto de procedimientos y servicios para administrar los datos, gestionar los usuarios y utilizar el sistema.

S-ar putea să vă placă și