Software Libre para la Toma de Decisiones FliSoL CUCEA 2016
2. 2. Inteligencia de Negocios - Business Intelligence Sabidura Conocimiento Informacin Datos Hacer lo correcto Hacer las cosas bien Por qu? Qu es lo mejor? Cmo hacerlo? Qu? Es obtener conocimiento a travs de los datos que una organizacin tiene a su disposicin para ayudar en la toma de decisiones. 3. 3. Business Intelligence Analysis Anlisis que pueden realizarse para la Inteligencia de Negocios: Anlisis estadstico Pronsticos (Forecasting) Minera de datos (Data Mining) Optimizacin Minera de Procesos 4. 4. Business Intelligence Reporting El anlisis de datos permite generar reportes o informes con la informacin y conocimientos obtenidos. Tipos de reportes: Informes predefinidos Informes a la medida (ad-hoc) Consultas y Cubos OLAP Alertas 5. 5. Data Warehousing Los Data Warehouses concentran la informacin de una organizacin en una base de datos diseada para el anlisis y la difusin eficiente de los datos. Contiene todos los datos de los sistemas operacionales Se organizan para que todos los datos relativos al mismo evento u objeto del mundo real queden relacionados entre s. La informacin no se modifica ni se elimina. La informacin es read-only y solo accesible para consultas. 6. 6. ETL - Extract, Transform and Load ETL es la integracin de los datos para poder ser analizados de una forma precisa y congruente. En la mayora de los casos, la informacin que se quiere analizar se encuentra dispersa o los datos estn sucios, es decir, no tienen las caractersticas ideales con la forma de trabajar de nuestras herramientas de inteligencia de negocios. 7. 7. Esquema de Proceso 8. 8. Extraccin de Datos Este paso significa extraer datos de diversas fuentes de datos, tales como archivos XLS (Excel), archivos XML (facturas electrnicas, por ejemplo), bases de datos SQL (de nuestro ERP o sistema de planeacin de recursos empresariales), bases de datos NoSQL, o simplemente de archivos TXT o puro texto. Con la fase de extraccin, se valida si los datos tienen los valores correctos o esperados. 9. 9. Transformacin de Datos En este proceso, se aplica una serie de reglas o funciones a una buena parte de los datos. Una funcin importante de la transformacin es la limpieza de los datos, que tiene por objetivo el transmitir slo los datos adecuados. Algunos de los procesos de transformacin que se pueden aplicar son los siguientes 10. 10. Elegir slo ciertas columnas o filas. Traducir valores codificados (0: masculino, 1: femenino) Codificar valores (Aguascalientes:1, Jalisco:14) Crear un Valor Calculado (ventas = cantidad * precio) Agregacin, acumulacin y resumen de los valores. Unir datos de diferentes fuentes y evitar duplicados Transposicin o pivote entre columnas y filas. Separar una columna en diversas columnas 11. 11. Carga de Datos En esta fase se cargan los datos en el destino final que puede ser un archivo plano simple o un almacn de datos. Se pueden aplicar las restricciones definidas en el esquema de la BD, por lo que esta fase refleja si todo se ha realizado bien. Un uso alternativo para ETL es mover informacin hacia otra aplicacin de forma permanente. La nueva aplicacin podra utilizar un diferente proveedor de base de datos y podra tener un esquema muy diferente. 12. 12. ETL usando Kettle 13. 13. Algunas Herramientas Open Source Pentaho Jaspersoft SpagoBI RapidMiner Palo Eclipse BIRT Project Logi Analytics 14. 14. Caractersticas de Pentaho Es una de las herramientas ms populares de BI. Modelo de negocios basado en Open Core - Ofrece una versin de comunidad con las caractersticas principales de forma open source y gratuita, mientras que tambin se ofrece otra versin empresarial con caractersticas ms avanzadas. Pentaho tiene capacidades de integracin de datos, servicios OLAP, informes, cuadros de mando, minera de datos y ETL. 15. 15. Herramientas de Pentaho 16. 16. Data Integration (Kettle): Ofrece capacidades de ETL. Disea transformaciones y jobs de forma visual Report Designer: Genera informes en Excel, PDF, HTML y ms. Aggregation Designer: Crea tablas agregadas y mejora rendimiento de anlisis OLAP. Hadoop Shims: Plugins para distribuciones de Hadoop. 17. 17. Caractersticas de Jaspersoft Inici como una herramienta independiente para BI, su popularidad lo llev a ser adquirida por Tibco, quienes tienen sus propias herramientas comerciales para BI (Spotfire). Su modelo de negocios tambin est basado en Open Core Adems de ofrecer OLAP, informes y ETL, cuenta con un servidor donde se pueden almacenar los informes y realizar anlisis. 18. 18. Proceso en Jaspersoft 19. 19. Herramientas de Jaspersoft Jaspersoft ETL: Ofrece transformaciones y jobs de forma visual Jaspersoft Studio: Genera informes con integracin al Servidor, incluye librera JasperReports. JasperReports Server: Ofrece Informes y Anlisis en un Servidor autnomo y puede servir como un concentrador de informacin empresarial. 20. 20. Caractersticas de SpagoBI Es la nica suite de herramientas de BI 100% Open Source. Su modelo de negocios est basado en Servicios y Consultora Es la que ofrece mayor cantidad de herramientas de todas, incluyendo ETL, Informes, Anlisis OLAP, Grficas Interactivas, Informes Ad-Hoc, Geolocalizacin, Minera de Datos, Anlisis de Grafos, Automatizacin Ofimtica, soporte mvil y ms. 21. 21. Arquitectura de SpagoBI 22. 22. Mdulos de SpagoBI SpagoBI Server: El ncleo de la suite incluyendo las herramientas de anlisis. SpagoBI Studio: Entorno de desarrollo integrado. SpagoBI Meta: Entorno de los metadatos. SpagoBI SDK: La capa de integracin que permite utilizar SpagoBI con herramientas externas SpagoBI Applications: Una coleccin de modelos analticos verticales que se desarrollan utilizando SpagoBI. 23. 23. Fin de la Presentacin