Sunteți pe pagina 1din 33

UNIVERSIDAD LAICA ELOY ALFARO DE MANAB

FACULTAD DE CIENCIAS INFORMTICAS

ASIGNATURA:
INTELIGENCIA DE NEGOCIOS

TEMA/TTULO DEL TRABAJO:


TRABAJO PRCTICO (PENTAHO)

ALUMNA:
GOMEZ CASTRO TANIA CRISTINA

Curso:
NOVENO NIVEL "A
Profesor:
ING. JORGE MOYA

MANTA-MANAB-ECUADOR
JULIO, 2014

1. Objetivos
Utilizar la herramienta Pentaho Data Integration para realizar un proceso ETL
Trasferir datos desde un archivo de Excel a una base de datos PostgreSQl

2.

Materiales utilizados
Computadora
Internet
Pentaho
Excel
Pgadmin
Postgresql
Word
Camtasia Studio

3. Instalacin
Primero ejecutamos el instalador de Pentaho y damos clic en Next

Aceptamos los trminos y condiciones y clic en Next

En esta parte se eleg que pentaho se instalara con sus diferentes herramientas y clic en
Next

En esta parte nos pide que coloquemos un usuario y contrasea

Damos clic en Next y se empezar a instalar

Damos clic en Next

Y en este cuadro nos dice todo lo que se instalo

Aqu tenemos la carpeta Pentaho

esto

es

lo

que

contiene

la

carpeta

Pentaho

Abrimos la carpeta data integration

Ejecutamos como administrador el archivo que se llama Spoon.bat

Y aqu ya tenemos la herramienta lista para trabajar

4. Crear el proyecto
Para crear el proceso ETl lo primero que hice fue crear una nueva transformacin

Y tendremos esta vista, en donde se encuentran una serie de carpetitas que nos servirn
para poder hacer los procesos que necesitemos.

5. Disear el modelo de negocio

Informacin

Informacin
Inmueble

$Producto
Vendedor

Cliente

$
Informacin

6. Modelo de datos
Una vez creada el rea de transformacin buscaremos en la carpetita de input (entrada)
que en este ejemplo es un fichero en Excel; arrastramos la opcin Microsoft Excel Input

Ahora en la carpetita Output (Salida) elegimos la opcin Insert /Update

Y arrastrndolo al rea de transformacin nuestro modelo de datos quedara as

7. Proceso de extraccin, transformacin y carga (ETL)


Ahora tenemos que configurar el modelo de datos que hemos creado
Damos doble clic en la entrada (Microsoft Excel Input); aparecer esta ventana en donde
tenemos que buscar en donde est el archivo de Excel y le damos clic en Add

En el menu Sheets de la ventana que nos apareci daremos clic en Get sheetnames; nos
aparecern las hojas del archivo de Excel, seleccionamos las hojas que queremos en este
caso eligiere la hoja1.

Ahora en el men Fields damos clic en GEt Fields from header row; nos aparecern los
capos que tiene el fichero de Excel, aqu podremos cambiar el nombre del campo
tambin podremos cambiar el tipo de datos eso depende de nosotros, para ver una
previa damos clic en Preview rows es ah en donde podremos ver si todo hasta el
momento est bien!

Y si todo hasta el momento est bien damos clic en OK.


Bien, ahora tengo ya configurada la entrada, ahora hay que configurar la Salida.
Damos doble clic en Insert / Update
En la parte que dice conexin damos clic en nueva y establecemos la conexin con la
base de datos.

En donde dice Target schema elegimos el esquema en donde queremos que se cree la
tabala o en donde se encuentre la tabla a la cual queremos trasferir los datos.
En la parte que dice Target table escribimos el nombre de la tabla o buscamos la tabla
en donde se trasferirn los datos.
En el cuadro donde dice The key(s) to look up the value(s) damos clic en Get Fields para
extraer los campos de la tabla que hemos seleccionados
En el cuadro de Update fields damos clic en Get update fields que es para obtener los
datos actualizados
Por ultimo en la parte inferior damos clic en SQL para ejecutar lo que hemos configurado
hasta el momento.

8. Resultados para la toma de negocios


Una vez configurado todo lo anterior revisamos en nuestra base de datos si se han
trasferido los datos.

Y como ven en el ejemplo si aparece la tabla que cree y ahora ver que todos los datos
se hayan transferido.

Y este es el resultado esperado!

9. Bitcora
Como ejemplo para utilizar la herramienta de BI Pentaho, utilice una base de datos en
Excel que contena informacin de una inmobiliaria, estos datos los trasfer a PostgreSql
para tener una base de datos ms sofisticada.
Pasos de este ejemplo:

Entender el modelo del negocio


Tener la base de datos del negocio
Descargar la herramienta Pentaho
Instalar Pentaho
Crear un rea de transformacin que servir para trasferir los datos en este caso
de Excel a postgresql
Arrastrar al rea de trasformacin la entrada que en este caso seria el archivo de
Excel
Arrastrar al rea de trasformacin la salida
Vincular con una conexin la entrada y la salida
Configurar la entrada, ah podremos buscar la ruta del archivo, ver que contiene
este archivo y verificar los datos que queremos trasferir
Configurar la salida; aqu hay que conectarse con la base de datos, verificar los
datos que queremos.
Hecha la configuracin ejecutamos el SQL
Ejecutamos el proyecto
Verificamos en la base de datos si los datos del archivo en Excel fueron
trasferidos.

10. Pantallazos

11. Video de utilizacin


https://www.youtube.com/watch?v=vMcMePsN270&feature=youtu.be
12. Conclusiones
La herramienta Pentaho es de mucha utilidad para hacer procesos de ETl.
Los resultados obtenidos fueron los esperados.

13. Recomendaciones
Si utilizaran un archivo en Excel tener en cuenta que este tiene que ser de la
versin 97-2003.
Tener en cuenta el tipo de campo para que no hayan errores futuros.
Analizar la herramienta y disfrutar de las utilidades que nos da.

14. Referencias bibliogrficas

(s.f.). Obtenido de http://www.pentaho.com/


Mazn, B. (6 de septiembre de 2013). Youtube. Obtenido de
https://www.youtube.com/watch?v=mZrbd_WTiec

S-ar putea să vă placă și