Documente Academic
Documente Profesional
Documente Cultură
Datamining y Datawarehousing
Entregable 1
Alumno: Carlos Reyes Zaraza
Grupo: SCC08V
Describa el proceso que se debe seguir para llegar de los datos al conocimiento.
Cuando los datos se ponen en un contexto, se convierten en informacin, y si luego esta informacin es sintetizada con la ayuda de la experiencia se llega al conocimiento.
La base de datos del Data Warehouse est separada de las bases de datos transaccionales?
Si, los datos que estn almacenados en un lugar diferente a donde se almacenan los datos de las aplicaciones
Por qu se dice que los datos estn orientados a un tema de negocio en Data Warehouse?
Porque se tienen modelos que representan las entidades del negocio.
Por qu se dice que los datos son variantes en el tiempo en Data Warehouse?
Por qu se actualizan peridicamente. Se mantiene la historia.
10
Los problemas de calidad de datos pueden ser solucionados con un data Warehouse?
Si, debido a que la calidad de los datos en un Data Warehouse, conducir a una reingeniera de las aplicaciones de negocio.
11
12
13
Cules deben ser las caractersticas de una aplicacin en el contexto de Data Warehousing?
Un Data Warehouse no se construye en una sola iteracin. Cada tema tratado, se descompone en un conjunto de iniciativas (las aplicaciones). Cada aplicacin debe estar claramente definida (objetivos, actores, frecuencia y periodicidad del anlisis). Las aplicaciones deben ser controlables y proporcionar resultados tangibles en plazos menores a 6 meses, que corresponden al plazo medio de realizacin de una aplicacin. La descomposicin en aplicaciones aporta numerosas ventajas, pero genera dificultades sobre ciertos temas, como los relacionados con la infraestructura tcnica y organizativa que necesitan ser visualizados globalmente dentro de una arquitectura.
14
Enumere los sub-procesos que se llevan a cabo dentro del proceso de adquisicin.
1. Adquisicin. Consiste en recoger los datos tiles del sistema de produccin. Se debe identificar los datos que sean necesarios para atender los requerimientos de informacin, luego planificar las extracciones con el fin de evitar saturacin en la red, o afectar al sistema transaccional de produccin. 2. Almacenamiento. El componente bsico del soporte del almacenamiento es el DBMS (DataBase Manager System). El DBMS o motor de base de datos debe tener las caractersticas que le permitan responder eficientemente a las exigencias de las consultas analticas. Para lograrlo debe contar con diversos recursos como el paralelismo, la optimizacin del indexado con la finalidad de acelerar las consultas agregadas, ordenamientos y agrupaciones.