Sunteți pe pagina 1din 23

PENTAHO BI (Open Source) Introduccin

Taller Tcnicos PENTAHO Junio 2011

Introduccin a Pentaho BI:

Enterprise & Community.

Componentes de la Plataforma

Pentaho Reporting Anlisis de Datos (Mondrian JPIVOT) Dashboard Pentaho Data Integration Data Mining - WEKA

Instalacin y Administracin de Pentaho BI Comunity:

Consola administrativa:

Definicin de Datasource Usuarios y Roles Repositorio

Consola de Usuario Taller Pentaho Junio 2011

Qu es Business Intelligence?

Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el conocimiento en accin, para la toma de decisiones
DATOS

ANLISIS

CONOCIMIENTO

Tecnologas involucradas:

Data Warehouse Reporting Anlisis OLAP (On-line Analytical Processing) Dashboards Integracin de datos (ETL Extract, Transform and load) Minera de datos

Taller Pentaho Junio 2011

Crculo virtuoso de la informacin

DATOS

ANLISIS

Qu pas? - Qu pasa ahora? - Por qu pas? - Qu pasar? Taller Pentaho Junio 2011

Beneficios

Crear un crculo virtuoso de la informacin ( datos informacin mejores decisiones generan nuevos datos) Permite una visin nica, histrica, persistente y de calidad de la informacin. Crear, manejar y mantener KPI (indicadores de rendimiento) y ATOS ANLISIS CONOCIMIENTO KGI (indicadores de metas). Aporta informacin actualizada. Reduce la brecha de orientacin de negocios entre el departamento de IT y la organizacin. Mejorar la competitividad como resultado de ser capaces de: Diferenciar lo relevante de lo superfluo Acceder ms rpido a la informacin Tener mayor agilidad en la toma de decisiones.

Taller Pentaho Junio 2011

Cundo es necesaria la inteligencia de negocio?

La toma de decisiones es realizada en forma intuitiva. Se detectan problemas de calidad de informacin. ATOS Excel Caos = uso intensivoANLISIS de Excel como herramienta de CONOCIMIENTO anlisis. Cada usuario con un archivo personalizado, por lo que la informacin es inconsistente entre las reas y el costo de sincronizacin elevado. Necesidad de cruzar informacin entre reas.

Se ha alcanzado una masa crtica de datos.


Es necesario automatizar los procesos de extraccin y distribucin de la informacin.

Taller Pentaho Junio 2011

Cmo detectar que no existe una estrategia de BI?

Los usuarios identifican al departamento de IT como origen de sus problemas de inteligencia de negocios.

El nivel jerrquico ms alto considera que BI representa otro centro de costo.

ATOS de IT contina ANLISIS El departamento preguntando a los usuarios finales sobre CONOCIMIENTO las necesidades de los reportes.
El sistema de BI est soportado por una Mesa de Ayuda No es posible medir el uso del sistema de BI No hay un plan para desarrollar, contratar, retener y aumentar el equipo de BI. No existe un responsable funcional (o bien el asignado no es el adecuado). Existen mltiples soluciones que repiten funcionalidad. Alguien cree que es un xito que la informacin consolidada est disponible a los usuarios finales al cabo de 2 semanas.

Taller Pentaho Junio 2011

Fases de un Proceso BI

DATOS

ANLISIS

Fase 1: recolectar los requerimientos de informacin especficos Fase 2: extraer de las diferentes fuentes de informacin. Fase 3: se integran y cargan los datos en crudo en un formato utilizable para el anlisis.

Fase 4: se obtendrn las respuestas a las preguntas, mediante la creacin de reportes, indicadores de rendimiento, cuadros de mando, grficos estadsticos, etc.
Fase 5: explorar los datos de manera sencilla e intuitiva.

Taller Pentaho Junio 2011

Porqu Open Source BI?

La solucin elegida debera ser evaluada segn los siguientes criterios: Adaptabilidad a todos los entornos. Sin costos de licencias Independencia del proveedor DATOS ANLISIS Garantas de permanencia. Upgrades y mejoras frecuentes Tendencia a la calidad y utilizacin de estndares (XML MDX) Dedicacin full a los servicios y a la solucin de negocios. Gran aprovechamiento de Web Services. La comunidad del software libre
Taller Pentaho Junio 2011

Plataforma Pentaho Open Source BI

Caractersticas ms importantes: Aplicacin web desarrollada en J2EE. Modular. Servidor Web: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. DATOS ANLISIS Base de datos: va JDBC, DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, Firebird, etc. Sistema operativo: Multiplataforma. Repositorio de datos basado en XML. Todos los componentes estn expuestos va Web Services Incluye: ETL, Reporting, OLAP, Data mining, Dashboards, etc. Taller Pentaho Junio 2011 Licencia: GNU GPL.

Plataforma Pentaho Open Source BI

Estrategia open core: a partir de un ncleo open source se ofrecen servicios y mdulos mejorados. Existen dos versiones disponibles de Pentaho:
DATOS ANLISIS

Pentaho Community Edition


Completamente gratuita

Pentaho Enterprise Edition


Se ofrece bajo modalidad de subscripcin

Taller Pentaho Junio 2011

Plataforma Pentaho Open Source BI

Pentaho Community Edition

ersin comunitaria, sin costos de licencia, sin servicios de soporte asociados.

DATOS

ANLISIS

s una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de BI.

fPentaho sol la recomienda para: Aficionados al BI Acadmicos Programadores de Software Abierto Es totalmente software de cdigo abierto, la licencia en Taller Pentaho Junio 2011 su mayora bajo la versin GNU.

Plataforma Pentaho Open Source BI

Pentaho Enterprise Edition

Versin empresarial, sin costos de licencia.

DATOS

ANLISIS

Tiene asociados servicios de soporte y mantencin que se pagan a travs de una suscripcin anual.

Es una versin certificada que adems posee algunas funcionalidades mejoradas para la consola de administracin, y para la construccin de tableros de control.
Taller Pentaho Junio 2011

Componentes de la Plataforma

DATOS

ANLISIS

Taller Pentaho Junio 2011

Componentes de la Plataforma
Pentaho Reporting

Existen productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. Pentaho Report Designer: Contiene dos DATOS ANLISIS componentes: Un editor basado con prestaciones profesionales destinado a desarrolladores. Un Wizard que facilita el trabajo y permite a los usuarios obtener resultados de forma inmediata. Est destinada a usuarios con menos conocimientos tcnicos. Web ad-hoc Reporting: es un Wizard va Web basado enPentaho metadatos que extiende la capacidad de los Taller Junio 2011

Componentes de la Plataforma
Pentaho Anlisis OLAP de Datos

Carctersticas Generales: Modelado Multi Dimensional de Datos:

Utiliza MONDRIAN como servidor OLAP de tipo ROLAP. DATOS ANLISIS El modelo de los cubos se guarda en archivos XML Lenguaje de consulta MDX
utiliza JPIVOT, el cual permite anlisis Ad-Hoc de los cubos de Mondrian. Este componente como otros puede ser reemplazado por otras soluciones que se integran a Pentaho, p.e. PAT

Navegacin y Exploracin de Datos:


Taller Pentaho Junio 2011

Componentes de la Plataforma
Pentaho Anlisis OLAP de Datos

DATOS

ANLISIS

Taller Pentaho Junio 2011

Componentes de la Plataforma
Pentaho Dashboard

Todos los componentes del modulo Pentaho Reporting y Pentaho Analysis (JPIVOT) pueden formar parte de un Dashboard. DATOS ANLISIS Identificacin de Indicadores (KPIs, Key Performance Indicators)

Monitoreo / Mtricas Drill a reportes de soporte Alertas basadas en reglas del negocio

Investigar detalles subyacentes

Seguimiento de excepciones

Taller Pentaho Junio 2011

Componentes de la Plataforma
Pentaho Data Integration

Poderosa herramienta de ETL (Extraccin, Transformacin y Carga del DW). Entorno grfico de desarrollo . Multiplataforma DATOS ANLISIS Basado en dos tipos de objetos: Transformaciones (coleccin de pasos en un proceso ETL) y trabajos (coleccin de transformaciones) Incluye cuatro herramientas:

Taller Pentaho Junio 2011

SPOON: para disear transformaciones usando el entorno grfico PAN: para ejecutar transformaciones diseadas con SPOON. CHEF: para crear trabajos KITCHEN: para ejecutar trabajos

Componentes de la Plataforma
Data Mining - WEKA

Se utiliza para:

Descubrir patrones ocultos y correlacinales en los datos Prevenir eventos futuros basados en patrones histricos DATOS

Taller Pentaho Junio 2011

Instalacin

Qu necesitamos descargar para poder ver la solucin propuesta?

El servidor BI:

http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%2 0Server/3.6.0-stable/ DATOS ANLISIS Biserver-ce-3.6.0-stable.zip para Windows Biserver-ce-3.6.0-stable.tar.gz para Linux

El motor Postgresql 8.3 o superior y su correspondiente JDBC Pentaho Data Integration 4.1.0:
http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.1.0stable/ Pdi-ce-4.1.0-stable.zip para Windows Pdi-ce-41.0-stable.tar.gz para Linux

Taller Pentaho Junio 2011

Instalacin
Al descomprimir el bi-server tendrn los siguientes directorios: Pentaho/ administrationconsole/ biserver-ce/

DATOS ANLISIS Necesitarn configurar la siguiente variable de entorno: SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre en windows

Y copiar el driver jdbc de postgresql a:

C:\pentaho360\administration-console\jdbc c:\pentaho360\biserver-ce\tomcat\lib

en Windows en Windows

Verificar que tambin est el driver en:

Taller Pentaho Junio 2011

Referencias Bibliogrficas y Otros.

Introduccin al Business Intelligence Josep Curto Daz ISBN: 978-84-9788-886-8 Mayo 2010 Pentaho 3.2 Data Integration Mara Carina Roldn - ISBN 978-1-847199-54-6 2010 Proyecto de implementacin de un Data Warehouse para universidades nacionales - Trabajo Final De Grado - Del Giudice Glenda, Della Mea (principalmente el Anexo 1) Toda la documentacin producida por el Ing. Daro Bernabeu.

Pentaho Solutions Business Intelligence and Data Warehousing with Pentaho and MySQL Parte III - Roland Bouman, Jos van Dongen - ISBN: 978-0-470-48432-6
http://kettle.pentaho.org/ de la Community.
http://Sourceforge.net/projects/pentaho/files Taller Pentaho Junio 2011

S-ar putea să vă placă și