Documente Academic
Documente Profesional
Documente Cultură
TESIS DE GRADO
GUAYAQUIL – ECUADOR
2013
DEDICATORIA
III
III
AGRADECIMIENTO
VIII
ÍNDICE GENERAL
IX
POBLACIÓN Y MUESTRA........................................................................................104
OPERACIONALIZACIÓN DE LAS VARIABLES.....................................................106
INSTRUMENTOS DE RECOLECCIÓN DE DATOS.................................................109
PROCESAMIENTO DE LA INFORMACIÓN............................................................109
RECOLECCIÓN DE LA INFORMACIÓN..................................................................110
PROCESAMIENTO Y ANÁLISIS...............................................................................113
CRITERIOS PARA LA ELABORACIÓN DE LA PROPUESTA................................128
CAPITULO IV – MARCO ADMINISTRATIVO 82
CRONOGRAMA............................................................................................................82
PRESUPUESTO..............................................................................................................85
CAPITULO V – CONCLUSIONES Y RECOMENDACIONES 90
CONCLUSIONES...........................................................................................................90
RECOMENDACIONES.................................................................................................91
X
XI
ÍNDICE DE CUADROS
Pág.IL
CUADRO N°. 1
MENSAJES QUE ARROJA LA HERRAMIENTA ………………………………….52
CUADRO N°. 2
BARRAS DE HERRAMIENTAS – SPOON..................................................................55
CUADRO N°. 3
VARIABLES DEL ESTUDIO........................................................................................ 65
CUADRO N°. 4
Datos Obtenidos de la Empresa.......................................................................................68
CUADRO N°. 5
Estimación de Porcentaje................................................................................................ 70
CUADRO N°. 6
MATRIZ DE OPERACIONALIZACIÓN DE VARIABLES.........................................71
CUADRO N°. 7
DIAGRAMA DE LA TÉCNICA UTILIZADA.............................................................. 72
CUADRO N°. 8
HA RECIBIDO CURSOS DE CAPACITACIÒN...........................................................81
CUADRO N°. 9
DESEA QUE LAS TRANSACCIONES SE VALIDEN DESDE EL SISTEMA...........82
CUADRO N°. 10
INVENTARIO ACTUAL DE LAS DIFERENTES AGENCIAS...................................83
CUADRO N°. 11
SEGURIDADES EN REGISTRO DE TRANSACCIONES..........................................84
CUADRO N°. 12
GARANTIZAR LA INVIOLABILIDAD DE SUS DATOS......................................... 85
CUADRO N°. 13
TECNOLOGÍA DE PUNTA PARA SER CAPACITADO..............................................86
CUADRO N°. 14
AHORRAR TIEMPO Y DINERO EN TODAS LAS AGENCIAS.................................. 87
CUADRO N°. 15
PLANIFICACIÓN DETALLADO DEL TRABAJO REALIZADO............................. 95
CUADRO N°. 16
REFERENCIA DE EGRESOS DEL PROYECTO.........................................................98
XII
NDICE DE GRAFICOS
Pág.
GRÁFICO N°. 1
ETAPAS DEL ESTUDIO DE TRANSFORMACIÓN DE BASE DE DATOS..............61
GRÁFICO N°. 3
PROCESO DE MIGRACIÓN EN SITIO.......................................................................65
GRÁFICO N°. 4
PROCESO DE MIGRACIÓN GRADUAL....................................................................66
GRÁFICO N°. 5
PROCESO DE MIGRACIÓN DE BASE DE DATOS...................................................67
GRÁFICO N°. 6
PROCESO DE MIGRACIÓN.........................................................................................68
GRÁFICO N°. 7
PROCESO DE INTEGRACIÓN DE DATOS - PENTAHO...........................................71
GRÁFICO N°. 8
PROCESO DE INTEGRACIÓN DE DATOS – PENTAHO..........................................73
GRÁFICO N°. 9
INTERFACE MODO GRÁFICO - SPOON PENTAHO................................................79
GRÁFICO N°. 10
PROCESO DE EXTRACCIÓN DE LOS DATOS – SPOON PENTAHO.....................81
GRÁFICO N°. 11
DISEÑO DE TRANSFORMACIÓN DE DATOS..........................................................85
GRÁFICO N°. 12
TRANSFORMACIÓN DE DATOS - SPOON...............................................................86
GRÁFICO N°. 13
LOGO DE BÚSQUEDA DE CONEXIONES................................................................86
GRÁFICO N°. 14
MUESTRA LOS PASOS DE CONSTRUCCIÓN..........................................................87
GRÁFICO N°. 15
TRANSFORMACIÓN DE DATOS ENTREDA/SALIDA – SPOON...........................89
GRÁFICO N°. 16
CONFIGURACIÓN VARIABLES DE ENTORNO.......................................................93
XIII
GRÁFICO N°. 17
MAPEO DE FLOJOS EN DATOS ACTUALES............................................................94
GRÁFICO N°. 18
Tabla de Cuestionario Capacitación..............................................................................115
GRÁFICO N°. 19
Tabla de Cuestionario Ventas y Pagos.............................................................................82
GRÁFICO N°. 20
Tabla de Cuestionario Inventario.....................................................................................83
GRÁFICO N°. 21
Tabla de Cuestionario Seguridades.................................................................................84
GRÁFICO N°. 22
Tabla de Cuestionario Garantizar transacciones..............................................................85
GRÁFICO N°. 23
Tabla de Cuestionario Tecnología...................................................................................86
GRÁFICO N°. 24
Tabla de Cuestionario Ahorrar tiempo y dinero..............................................................87
GRÁFICO N°. 25
Hipótesis Seguridad de la Información...........................................................................88
GRÁFICO N°. 26
Hipótesis Inviolabilidad...................................................................................................89
GRÁFICO N°. 27
Hipótesis Garantizar transferencias.................................................................................90
GRÁFICO N°. 28
Hipótesis Cursos de Capacitación.................................................................................125
GRÁFICO N°. 29
Hipótesis Ahorrar tiempo y dinero..................................................................................92
GRÁFICO N°. 30
CRONOGRAMA DE TRABAJO...................................................................................82
XIV
ABREVIATURAS
XV
SIMBOLOGÍA
XVI
XX
INTRODUCCIÓN
muchas ideas a la mente, en este estudio tomaremos un diseño como aquel que
puede representar la solución a un problema del mundo real, para lo cual se usará
seguridad y confidencialidad que deben poseer las bases de datos, ya que representa
servicios exequiales con formas de pago muy cómodas y económicas para el sector
tecnológica con la que operaba la institución, cumplía con las actividades diarias
1
datos de los clientes no se encontraban del todo claros, adicionalmente existían
puerta a puerta, estas transacciones eran ingresadas al final del día en la agencia más
En este estudio pudimos notar que durante los dos últimos años la institución se ha
visto afectada por las quejas y molestias que causan la inconsistencia de los datos
respuesta.
2
Cabe exaltar la importancia de migrar o cambiar los sistemas actuales de
información de una empresa, por otros productos o versiones que se adapten mejor a
las necesidades actuales y/o futuras de dicha empresa. Dentro de los objetivos
Es decir diversas copias de un mismo dato no concuerdan entre sí, por ejemplo: que
anterior.
mismos.
Es difícil escribir nuevos programas de aplicación para obtener los datos apropiados.
óptimo.
PROBLEMAS DE SEGURIDAD
Se debe considerar el control de acceso a los datos, por tal motivo debe ser
PROBLEMAS DE INTEGRIDAD
entregar un reporte global del trabajo, mencionando los puntos más relevantes del
proceso.
3
CAPÍTULO I
EL PROBLEMA
CAPITULO I – El PROBLEMA
que posee una herramienta de código abierto, para lo cual se promovió nuestro
sistema.
El sistema que poseían era un aplicativo realizado en Power Builder con una base de
datos Access 2003, este tipo de repositorio cubría las necesidades de la empresa
desde que se inició hasta unos meses antes de que se ampliaran sus agencias.
4
existían pagos duplicados afectando la empresa, todas estas anomalías aumentaban
entrega, el cual consta de 5 días laborables. A principios del año 2011, Servicios
la entrega del balance anual, después de esta molestia la empresa decidió auditar los
costos generados en todo el año debido a gastos que se habían generado debido al
la información que era ingresada en el sistema, por este motivo utilizaban como
control. A pesar de las molestias o trabajos extras para los empleados no se tomaba
una solución definitiva para corregir el problema de raíz ya que al tener varias
agencias a nivel nacional era complicado tener un control sobre todas de forma
sistema, capacitando así a una persona por agencia con el objeto que se imparta o se
difunda el mensaje.
solucionaron del todo ya que no solo poseen empleados atendiendo en las agencias
5
forma mensual, ya que se debía seguir cumpliendo con los tiempos de entrega y
El contador interno de la compañía realizó un análisis profundo del gasto que estaba
en un lapso de seis meses pierde 2 días de labores al 50% y esto representa una
para subsanar la información de los clientes, esto incurre de forma alarmante para
una empresa mediana. La detección y clausura de anomalías son realizadas por una
secuencia de operaciones sobre los datos sabidos como el flujo de trabajo. Para
teclado, etc.
para solventar sus gastos, desde ahí la construcción del estudio de la transformación
6
de datos fue diseñada en base a las necesidades de esta empresa, ya que constituye
las empresas pequeñas de poseer bases de datos no relacionales, lo cual esto con el
disponibilidad.
evaluación de las insuficiencias que existen dentro de la institución y del manejo del
ejercicio. Para esto es inevitable entender el ciclo del negocio y los requerimientos
que posee:
esos documentos son trasladados a una agencia donde serán ingresados al sistema
por el vendedor.
amortización de sus pagos mensuales. Estas tablas son creadas por el sistema y
mantenidas en su base de datos Microsoft Access 2003 y que contienen todas las
alícuotas de cada mes entre otros rubros que se pudieran haber contratado. En el
son atesoradas en cualquier agencia, siendo este cobro guardado en la base de datos
7
de forma aislada ya que si el cliente vuelve a realizar el mismo pago en otra agencia
se le cobra con el mismo número de cuota siendo ésta a pagar la cuota siguiente. Sin
embargo, existen numerosas causales por las cuales estos valores no pueden ser
solicita a Sistemas que se realicen cambios manuales a fin de contar con la data
Para este estudio del diseño se realizó un análisis del porcentaje de inconsistencia
que existía por agencia, lo que pudimos observar que en las agencias nuevas se
8
Dentro de esta muestra se realizó un segundo análisis en base a la data existente,
data, mientras que el análisis multivariado, mostró que el factor con independencia
representa una muestra de nuestro universo, la misma que servirá para resolver el
comunidad open source que provee a las organizaciones para sus necesidades de
inteligencia de negocios.
una solución permanente que aplaque el malestar y desgaste económico que posee la
con el objetivo de trasladar toda la información a una base de datos relacional. Cabe
mencionar las desventajas que tiene la base de datos que posee la empresa, como
son:
No es Multiplataforma.
9
No puede ser accedida simultáneamente.
real, por lo que se conllevó a utilizar diversas alternativas, hasta concluir que la
mejor opción para esta empresa era realizarlo con una herramienta de código
usuario final, mantener un ambiente seguro y confiable de sus datos incluso para el
data nos dimos cuenta que la inconsistencia de la información debió ser prevista en
10
las parametrizaciones que se programaban dentro del sistema antes de ser puesto en
CAUSAS:
Al realizar las investigaciones del problema pudimos constatar los orígenes tales
como:
direccionales.
CONSECUENCIAS:
Falta de control y seguridad en los procesos, esto produce que su riesgo se eleve y
11
Aborrecimiento al sistema por parte de los usuarios.
resultados y analizando los datos, incluso puede decidirse diseñar una nueva
alternativa que pueda afinar con mayor eficiencia los datos (esto dependerá mucho
con muestras de tamaños pequeños, sobre todo cuando poseen poca demanda de
información.
Cabe señalar que al igual que en los temas anteriores, los estudios con
inversamente).
En aquellos escenarios del mundo real en las que no es viable experimentar con la
realidad, ofrecen un marco teórico para evaluar la toma de decisiones así como sus
dinámico si, ya que alguno(s) de los elementos que intervienen en este estudio no
permanecen constantes, en este caso tenemos un estudio dinámico por que usamos
la variable tiempo.
12
Habitualmente todos los estudios deterministas derivan diseños disparejos ya sean
numerarias.
Después de haber realizado el análisis del diseño, se debe establecer una nueva
dicho proceso hemos considerado una de las mejores herramientas de código abierto
control y credibilidad a nivel nacional de todos sus empleados, costo de servicio por
Para exponer que el estudio del diseño de transformación funciona, se elaboró una
una agencia en particular, creando scripts de filtrado dentro de cada modelador que
incluye la herramienta.
desarrolló un formulario para validar la migración de los datos, el mismo que fue
validado por un experto en el área de base de datos (Ing. Cesar Cuenca, DBA).
13
La transformación de datos pretende medir los beneficios que posee esta
herramienta de software libre migrando una base de datos de forma íntegra, rápida y
información.
PLANTEAMIENTO
¿Cómo realizar una migración que permita trasladar el 100% de la data que se
Evidente: Existen muchas formas de detectar que una base de datos posee
transformar los datos de forma íntegra hacia otra estructura relacional mediante el
posibles llamados de atención por los entes de control, pudiendo llegar a ser
volumen, cabe señalar que la empresa posee 5 agencias a nivel nacional y posee una
14
Original: Este es un campo bastante interesante, ya que en nuestro país ha sido
Identifica los productos esperados: Por medio de este estudio podríamos no solo
OBJETIVO DE LA INVESTIGACION
Objetivo General:
Objetivos Específicos:
almacenada.
15
JUSTIFICACION E IMPORTANCIA DE LA INVESTIGACIÓN
mayor apertura a los software libres que en nuestro país que prácticamente es
inexplorado.
diseño nuevo con respecto a otros aplicativos que se pueden llegar a implementar.
este estudio se demostrará que las herramientas de software libre, son los más útiles
atención por los entes de control, desgaste de utilidad para la compañía y pérdida de
que generaba duplicidad de pagos entre agencias o hurto por parte de los empleados,
mensuales, donde se descubren varios reclamos de los clientes que no han sido
de campo.
Este estudio, ayudará a disminuir los casos de reclamos por afectación no solo al
cliente sino a la empresa ya que al momento de realizar una cobranza se realiza una
16
pistas de auditoria en las cuales ponga sobre aviso al administrador del sistema.
Además por la frecuencia cada vez más alta de las empresas en crecimiento.
Ambato en el año 2001, que lo trata de introducir como una nueva área de
tecnología orientada a objetos en el área de las Bases de Datos. El desafío del área
característica central de este trabajo para obtener una mejor idea y comprensión de
show=full), en nuestro caso es lógico que sea de gran interés ya que al prescindir de
puede también mencionar que se descartarán gastos por licenciamiento del software
cuenta que una transformación mal realizada podría dar por terminada una
en el procesamiento de la data.
17
de procesamiento ni se costosa inversión para la empresa, dado que nuestro estudio
demostrar que las herramientas de código abierto poseen muy buenas características
BENEFICIOS
Entre los beneficios que se obtendría al resolver esta situación, podemos mencionar:
CAPÍTULO II
18
MARCO TEÓRICO
CAPITULO II – MARCO TEÓRICO
Antes de empezar a describir los factores de éxito del estudio haremos una breve
colección de datos integrados, con redundancia controlada y con una estructura que
refleje las interrelaciones y restricciones existentes en el mundo real; los datos que
19
Objetivo del Proyecto
generado por la mala gestión del sistema y llamados de atención por parte de los
entre procesos. En este estudio se identificarán los elementos o aspectos que resultan
esenciales para que se alcancen los mejores resultados del proyecto. A estos
GRÁFICO N°.
ETAPAS DEL ESTUDIO DE TRANSFORMACIÓN DE BASE DE DATOS
20
Es importante hacer distinguir que en la planeación del diseño de migración, se
para los riesgos de mayor impacto y probabilidad, así como analizar las condiciones
organizar hoy el trabajo, dadas las exigencias de los mercados actuales y el potencial
la nueva tecnología para resolver mejor problemas antiguos, sino de aprovechar los
21
Una transformación o migración de datos puede llegar a ser muy costosa para la
En el año 2001, el belga Matt Casters empezó el desarrollo de una herramienta para
uso personal, consciente de las dificultades que había tenido durante su experiencia
componentes hasta llegar a 2004 con la versión 1.2. En la versión 2.0 se incluyó un
22
plataforma será capaz de ejecutar las reglas de negocio necesarias, expresadas en
en el momento adecuado.
atención o multas por parte de los entes de control, optimar el desempeño de la base
identificarán los elementos o aspectos que resultan esenciales para que se alcancen
los mejores resultados del proyecto. A estos elementos se les denomina comúnmente
ciclos.
real, basado en esto el estudio está obligado a encontrar la técnica más beneficiosa
23
FUNDAMENTACIÓN TEÓRICA
entre un repositorio u otro permitirá cifrar y estructurar los datos en forma óptima.
Podemos tener el mejor sistema, la base de datos más robusta o aplicable al negocio
pero si no tenemos una buena arquitectura del negocio o una estructura de base de
La migración de los datos consiste en convertir los datos desde un sistema de base
existentes, cambios en algunos tipos de datos que existen en una base de datos pero
no en otras, etc.
Este estudio tiene como producto principal la herramienta Spoon de Pentaho, para el
Ventajas
Menor capacitación.
24
Desventajas
histórica y la vigente.
Migración en sitio
escribe las Bases de Datos originales, y convierte todos los datos a los formatos
GRÁFICO N°.
PROCESO DE MIGRACIÓN EN SITIO
25
Recomendado para instancias de pequeña dimensión o instalaciones contenidas en
un solo servidor.
Migración gradual
luego migrado a las nuevas Bases de Datos. Los cambios se pueden revertir a la
versión anterior porque las Bases de Datos no se alteran. Requiere más espacio
GRÁFICO N°.
PROCESO DE MIGRACIÓN GRADUAL
26
Permite más control sobre la migración y es recomendable cuando se han hecho
una en sitio.
Base de Datos
resto.
GRÁFICO N°.
PROCESO DE MIGRACIÓN DE BASE DE DATOS
Solamente se pueden migrar Bases de Datos completas pero es la forma más rápida
para migrar.
27
Factores de Riesgo en la transformación
pruebas, las cuales inicialmente, pueden ser a pequeña escala para validar o
modificar la arquitectura final y el plan de migración, así como para comprobar que
los tiempos para tener una planeación integral y minimizar los riesgos como:
Sistemas con muchas identificaciones pueden ser entre muy difícil a imposible de
ser migrados; la única forma de saberlo con certeza es hacer una migración de
prueba.
son migradas.
empresa.
28
diseñadas en Spoon, puede ser de un fichero o del repositorio. Desde la línea de
GRÁFICO N°.
PROCESO DE MIGRACIÓN
Una vez terminado el proceso se deben medir los resultados y entregar un reporte
RUIZ (2003) Expresa: Hoy, la tecnología puede definirse como la aplicación del
conocimiento científico a la solución de problemas prácticos y la obtención de
metas humanas; un cuerpo de conocimientos desarrollados por una cultura que
provee métodos o medios para controlar el entorno, extraer las fuentes,
producir bienes y servicios, así como mejorar las condiciones de vida. (pag 24)
29
Una actividad central es realizar un análisis del diseño de datos actual y del nuevo,
para estipular cuáles son los campos y tablas críticas; posteriormente, se analizará y
documentará la correspondencia campo por campo del nuevo modelo con el modelo
las tablas de acuerdo con los requerimientos del modelo en el nuevo ambiente y
determinar las limitaciones existentes, sin destruir los datos almacenados ni las
relaciones que existen entre ellas. De igual modo, es necesario considerar los
Funcionamiento de Pentaho
de programación Java. Eso hace que sea una solución muy flexible para cubrir una
información valiosa de la empresa para que la misma pueda ser entregada al usuario
de manera íntegra. Provee una estabilidad, una sola versión de todos los recursos de
información, que es uno de los más grandes desafíos para las organizaciones de
Delineante gráfico enriquecido para permitir a los desarrolladores ETL una amplia
30
Análisis y presentación de informes, incluyendo Hadoop, NoSQL, tradicionales y
Pentaho Data Integration tiene un diseñador gráfico automático que permite hacer
exactamente lo que los desarrolladores de código más hábiles pueden lograr en una
Esta herramienta puede de manera muy simple tomar datos de una fuente (archivos
Ventajas de la herramienta
minutos) de cubos OLAP, reportes, etc. y a su vez, las partes interesadas pueden
(que los datos necesarios sean los correctos, que el tiempo de ejecución sea
aceptable, que los reportes muestren la información que los usuarios necesiten, que
31
el diseño del cubo OLAP satisface las necesidades de información de los analistas,
etc.).
informáticas.
GRÁFICO N°.
PROCESO DE INTEGRACIÓN DE DATOS - PENTAHO
32
Que consideraciones debemos tener con Spoon?
proyectos dónde sea necesario trabajar con datos erróneos. Las diferentes soluciones
datos y KITCHEN para la ejecución de los trabajos Batch diseñados con CHEF.
En esta plataforma basta con ejecutar el archivo .bat para iniciar Spoon.
spoon.sh: inicia Spoon en una plataforma tipo Unix, tal como GNU/Linux, Apple
cd /home/datos/programas/data-integration
sh spoon.sh
33
Qué plataformas soporta Spoon?
GNU/Linux
Bloqueo ocasional de la JVM corriendo SuSE Linux y KDE. Corriendo bajo Gnome
FreeBSD
Problemas con arrastrar y soltar. Utilizar el menú contextual del clic derecho sobre
Dado a que las bases de datos entre agencias con relación a la matriz, no estrecha
34
estándar. Al surgir este efecto, se obtiene como resultado la inconsistencia de los
GRÁFICO N°.
PROCESO DE INTEGRACIÓN DE DATOS – PENTAHO
Como nos muestra el gráfico, el esquema con que se dan las tablas de las diferentes
bases de datos, señalan que en un mismo campo, tienen distintos tipos o formas de
ser pobladas. Durante la traslado de los datos a la base de la matriz, se produce una
La principal actividad que perjudica a la empresa se debe al alto gasto que posee por
erradicar llamados de atención por parte de los entes de control ya que esto también
ubicar a los clientes, otra área que se ve involucrada en esta afectación es el área
35
comercial ya que se les imposibilita permitir enviar invitaciones para los eventos
que hay que reconocer es que un grupo de desarrolladores expertos, por lo general
trabajan en un alto nivel de asesoría. A los miembros del grupo no se les presenta un
problema y se les dice que lo resuelvan, ya que por medio de este retroalimentación
empresa.
El diseño posee muchas ventajas sobre una descripción verbal del inconveniente,
una ventaja obvia es que el diseño puntualiza un problema en forma mucho más
sencilla y moverse, en forma evolutiva, hacia diseños más elaborados que reflejen
mejor la complejidad del inconveniente real. El diseño debe ser menos confuso que
el sistema real, de otra manera, no tiene sentido trabajar con diseños si se puede
36
Documento del diseño
partir de este diseño. Puede pensarse que esta debe ser la parte primordial del
estudio, pero por lo general no lo es, hallar la solución es la parte entretenida del
óptima, es decir, la mejor, es necesario reconocer que estas soluciones son óptimas
una abstracción y no una representación del inconveniente real, no puede existir una
garantía de que la solución óptima del diseño resulte ser la mejor solución viable
toma en cuenta los muchos inestimables e inseguridad asociados a casi todos los
problemas existentes, pero si el diseño está bien expresado la solución debe tener
37
El distinguido desarrollador de software estadounidense, autor y empresario Jeff
comenzar a optimizar para usuarios. Al ver este tema como una optimización hacia
Por lo tanto, la meta de un estudio debe ser llevarlo a cabo de una manera óptima,
Un procedimiento óptimo para el diseño original puede ser menos ideal para el
estudio pos-óptimo, establece una parte muy característica, éste determina qué
medidas del diseño son los más críticos, las medidas críticas, del diseño son aquellos
Criterios de aceptación
38
# de datos cargados
# de datos válidos
Sin vacilación podemos decir que la inicial versión de un diseño tenga fallas, por lo
corregir todas las fallas que se puedan encontrar, este proceso de ensayo y
en la base de datos, ya que no habrá datos utilizables para poder confrontar. Otro
procedimiento podría ser contener una información que no haya sido evaluada como
39
un computador). El segmento de este arranque incluye el proceso de un
mantenimiento durante su uso posterior, por lo tanto si las condiciones cambian con
Sin embargo, con el fin de atacar los retos que implica el movimiento de datos hacia
premisas de validación, refinar los diseños y aplicar las mejores prácticas a medida
que el proyecto progresa. Esta metodología usa las mismas 4 fases básicas (análisis,
Una vez terminado el período de desarrollado para aplicar el diseño, la última fase
40
Objetivo: Realizar un examen completo y establecer una lista de chequeo de los
elementos de datos que serán migrados. Del mismo modo se realiza el mapeo de los
suplir los requerimientos del sistema destino. Se deben hacer tres consideraciones.
elementos de datos, rangos, etc. y poner en evidencia las relaciones entre ellos.
Mapeo.- Permite entender cuales bases de datos, entidades y atributos satisfacen los
los sistemas fuente y el sistema destino.- Entre mejor sea la especificación inicial
41
alternativa como motor de base de datos es PostgreSql, esta alternativa se instalará
en un servidor Suse Linux 12.1 ya que también posee el beneficio de ser libre en
herramienta Spoon, creando las conexiones a la base de datos, para este escenario
posibles errores que se puedan generar. Estos log serán validados una vez que
bloques de códigos en forma de script, los cuales van a realizar como filtro para el
salida:
GRÁFICO N°.
INTERFACE MODO GRÁFICO - SPOON PENTAHO
42
Es recomendable utilizar el "Modo seguro" cuando se mezclan filas de muchas
fuentes para asegurarse de que todas las filas tengan el mismo diseño en todas las
condiciones.
Cuando se ejecuta en modo seguro, la transformación verifica cada fila que pasa y
asegura que todos los diseños sean idénticos. Si una fila no tiene el mismo diseño
Saltos de Transformación
Saltos de Trabajo
Seguir este camino cuando el resultado sea verdadero: especifica que la siguiente
encontrado, tabla encontrada, sin error, que la evaluación sea verdadera, etc.
Seguir este camino cuando el resultado sea falso: especifica que la siguiente
43
Trabajo de origen sea falso, que significa fracaso de la ejecución, archivo no
Crear un Salto
Para crear un nuevo salto entre 2 pasos, se puede utilizar alguna de las siguientes
opciones:
Clic con el botón del medio en el paso origen, mantener presionado el botón y
Mantener presionada la tecla "SHIFT", hacer clic con el botón izquierdo en el paso
destino.
nodo "Saltos", esto abrirá una nueva ventana en donde debemos especificar cuál
Seleccionar los dos pasos que se desean unir utilizando "CTRL" + clic izquierdo
sobre los mismos, luego hacer clic derecho en alguno de los dos pasos y seleccionar
"Nuevo Salto". Esta característica trabaja solamente con pasos que aún no se han
representa una acción o un paso a seguir. Dentro de cada uno de estos gráficos
44
GRÁFICO N°.
PROCESO DE EXTRACCIÓN DE LOS DATOS – SPOON PENTAHO
inconsistencias de los datos y la codificación, que pueden existir dentro de una base
de datos única y que casi siempre existen cuando múltiples bases de datos la
contribuyen.
Una función lineal de las variables independientes que permita clasificar a las
estructuras en uno de los dos niveles o grupos establecidos por los dos valores de la
La transformación de datos es un modelo que, a partir del diseño estimado para cada
tablas que almacenarán los errores (log) y alterar la estructura de los campos
los datos en las tablas padres filtrando campos reconocidos como inconsistentes,
45
data de acuerdo a las condicionantes del script. Subsiguientemente se ejecutan los
celulares, etc.
depuración de la data. Adicionalmente para cada proceso se creó una taba donde se
Estos registros deben ser verificados uno a uno manualmente con la ayuda de algún
media que emplea para establecer el estudio base y diagnosticar el espacio que
operatividad de mejora que se obtendrá con este proceso. (Hair, Anderson, Tatham y
variable dependiente como respuesta base de datos Access y respuesta control y, por
46
tanto, cuando se haga referencia en lo continuo a estos términos de probabilidad se
hablará del pre (base actual) y pro (diseño de transformación) para la otra.
Dónde:
probabilidad de un suceso:
Dónde:
Y, es la variable independiente
En este caso al describir más de una variable independiente los diseños que se han
R = Ti+ H1X1+H2X2+……+ €
H1, H2, son los coeficientes dependientes e informan cuanto varia la probabilidad
47
Re catalogar las variables independientes ordinales en variables simuladas o
estadísticas de éxito.
Diseño
Este bosquejo fue concebido en base al análisis que se realizó después del
ser realizadas por un arquitecto de sistemas que en este caso existe. Una vez
empresa que es hacia donde se quiere llegar con el diseñador gráfico. Hoy en día las
empresas manejan una gran cantidad de datos por lo tanto es muy valioso que una
base de datos posea una buena estructura relacional capaz de manejar bien sus
transacciones.
miles, es importante asegurar que nuestra base de datos esté correctamente diseñada
para que tenga eficiencia y que se pueda seguir utilizando por largo tiempo.
La velocidad de acceso,
El tamaño de la información,
El tipo de la información,
48
Facilidad de acceso a la información,
Para la realización de este proyecto hemos considerado todas las falencias que posee
EXTRACCIÓN Y TRANSFORMACIÓN
fases. Después de que se conoce que datos migrar, donde conseguirlos y como se
la fuente deberán ser corregidos por los usuarios finales o el jefe de sistemas de la
empresa.
desempeño.
49
GRÁFICO N°.
DISEÑO DE TRANSFORMACIÓN DE DATOS
los saltos o hops. Dentro de cada salto fluye la información entre los diferentes
pasos, existirán pasos donde se recupere registros de las tablas de la base de datos
antigua, y los registros recuperados van a ser transmitidos a los siguientes pasos que
incluirán scripts con condicionantes que irán filtrando la data de acuerdo al nuevo
GRÁFICO N°.
TRANSFORMACIÓN DE DATOS - SPOON
50
En este proceso se llevarán a cabo varios pasos que estarán agrupados por categorías
y cada uno de ellos está diseñado para cumplir una función específica.
con el usuario, existen configuraciones que debe realizarse, como crear la conexión
a las bases de datos relacionadas, para esto contiene distintos íconos en los cuales
La pestaña "Árbol Principal" permite ver las conexiones asociadas con los trabajos y
transformaciones abiertas.
GRÁFICO N°.
LOGO DE BÚSQUEDA DE CONEXIONES
GRÁFICO N°.
MUESTRA LOS PASOS DE CONSTRUCCIÓN
51
Opciones de la Línea de Comandos
Las opciones que se pueden utilizar al iniciar la aplicación son las siguientes:
file = nombreArchivo
Logfile = nombreArchivoAcceso
La opción anterior permite especificar la ubicación del archivo de log que por
Level = nivelAcceso
CUADRO N°.
MENSAJES QUE ARROJA LA HERRAMIENTA
Nothing.- No muestra ninguna salida
Error.- Solamente muestra los errores
Minimal.- Usa logging mínimo
Basic.- Este es el nivel de logging básico por defecto
Detailed.- Da una salida detallada del logging
Debug.- Muestra una salida detallada para propósitos de depuración
Logging detallado a nivel de fila. Advertencia: esto genera una
Rowlevel.-
pérdida de datos.
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
Rep = nombreCatalogo
User = nombreUsuario
catálogo:
Pass = password
Trans = nombreTransformacion
52
Aquí se establece la transformación del catálogo que se desea ejecutar.
Job = nombreTrabajo
Los campos en itálica (en cursiva) representan los valores que utilizan las opciones.
Utilizar comillas simples o comillas dobles si hay espacios en los valores de las
opciones; las comillas aseguran que los valores de las opciones permanecen juntos.
Catálogo
cualquier base de datos relacional. Para cargar una Transformación o trabajo desde
Settings\<nombreUsuario>\.kettle
ESTEBAN (2009) Expresa: Pese a las limitaciones actuales, el país dispone del
principal recurso para ello: el potencial humano, que unido a los grandes
centros de investigación, integrados en polos científicos posibilita el acceso a
este campo de la investigación, así como la generación de nuevas tecnologías
propias. (pag. 18)
53
GRÁFICO N°.
TRANSFORMACIÓN DE DATOS ENTREDA/SALIDA – SPOON
Historia de Licenciamiento
Desde la versión 2.2.0, Spoon fue liberado al dominio público bajo la licencia
LGPL.
Spoon es software libre; se puede redistribuir y/o modificar bajo los términos de la
GNU Lesser General Public License publicada por la Free Software Foundation; ya
Spoon se distribuye con la esperanza de que será útil, pero sin ninguna garantía;
particular.
54
CUADRO N°.
BARRAS DE HERRAMIENTAS – SPOON
Icono Descripción Transformación Trabajo
Crea un nuevo Trabajo o
SI SI
Transformación
Abre una
Transformación/Trabajo desde
un archivo si no está conectado
SI SI
a un Catálogo o desde el
Catálogo si se está conectado a
uno.
Guarda la
Transformación/Trabajo en un SI SI
archivo o en el Catálogo.
Guarda la
Transformación/Trabajo con un
SI SI
nombre diferente y/o en
diferente lugar.
Ejecuta la
Transformación/Trabajo actual
SI SI
desde el archivo XML o
Catálogo.
Pone en pausa la ejecución de la
SI NO
actual Transformación.
Detiene la ejecución de la actual
SI SI
Transformación/Trabajo.
Vista previa de la
Transformación: ejecuta la
Transformación actual desde la
memoria. Puede obtener una SI NO
vista previa de las filas
generadas por los pasos
seleccionados.
Ejecuta la Transformación en el
modo de depuración, lo cual
SI NO
permite detectar problemas y/o
errores en la ejecución.
Repite el procesamiento de una
Transformación para una
determinada fecha y hora. Esto
hará que algunos pasos (entrada
archivo de texto y entrada
SI NO
Excel) sólo procesen las filas
que no fueron interpretadas
correctamente durante la
ejecución en una fecha y hora en
particular.
Verifica la Transformación: SI NO
55
Spoon ejecuta varias pruebas
para cada paso para ver si todo
va a funcionar como debería.
Ejecuta un análisis de impacto:
analiza qué impacto tendrá la
SI NO
Transformación sobre las bases
de datos utilizadas.
Genera el SQL necesario para
ejecutar la actual SI SI
Transformación/Trabajo.
Abre el explorador de bases de
datos y permite realizar una
vista previa de los datos,
SI SI
ejecutar las consultas SQL,
generar DDL (Lenguaje de
Definición de Datos), etc.
Muestra u oculta el panel de
/ resultados de la ejecución de la SI SI
Transformación/Trabajo.
Representa el tamaño de
visualización (en porcentaje) del SI SI
área de trabajo.
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
CONFIGURACIÓN VARIABLES DE ENTORNO
56
En este caso se crearon dos variables de entorno, con sus respectivos valores, que
Los valores asociados a las variables de entorno deben definirse a través de "Editar
-> Establecer Variables de Entorno" se perderán al reiniciar Spoon. Para que esto no
GNU/Linux: home/<nombreUsuario>/.kettle/
Para crear las variables en este archivo, debe realizarse de la siguiente manera:
nombreVariable = valor
En este caso sería simplemente añadir al final del archivo las siguientes líneas
mail.puerto.gmail = 465
mail.server.gmail = smtp.gmail.com
En todo momento se pueden ver los valores que poseen las variables de entorno, a
Tal y como puede observarse estas variables son utilizadas en la sesión del usuario
actual.
una tabla de una base de datos, se puede ver la información de log de ejecuciones
"Salida Excel".
Permite enviar los archivos que contenían errores de nuevo a la fuente y que se
corrijan los datos. En casos donde se tiene una tabla destino fija, se puede mapear
57
los campos del flujo de datos actual a los correspondientes campos de la tabla
destino.
GRÁFICO N°.
MAPEO DE FLOJOS EN DATOS ACTUALES
Unos pocos tipos de bases de datos no están soportados en esta versión debido a la
Limitaciones
58
El "Editor SQL simple" no reconoce los dialectos de todas las bases de datos
otros objetos específicos de base de datos pueden plantear problemas. En estos casos
se debe considerar el uso de las herramientas que vienen con la base de datos.
Validación
Actividades: Una vez se tiene listo el mapeo el siguiente paso es chequear si los
datos cumplen las validaciones del sistema destino, incluyendo reglas de negocio,
que se aplica las validaciones de negocio, puede ser un repositorio temporal donde
se almacenan los datos recibidos de la fuente con el fin de pasarlos luego de estas
Pruebas y cargue
lógicos. El primer paso es ejecutar los mapas. Así los mapas se ejecuten
así.
59
Si los datos fueron cargados en los campos correctos.
Los datos convertidos de forma automática deben ser formalmente verificados por
FUNDAMENTACIÓN LEGAL
Economista Rafael Correa Delgado emitió el Decreto Presidencial No. 1014 con
fecha 10 de Abril del 2008, en el cual establece el uso del Software Libre.
gobierno central.
proyecto, atendiendo a las preguntas que realicen los miembros del Tribunal. Las
mejorar las condiciones intelectuales de los sectores que no han tenido acceso a la
educación superior; la orientación del pueblo frente a los problemas que lo afectan;
Universitario.
61
cuyo órgano operativo es la Investigación y Desarrollo de dicha Unidad de
Proyectos Académicos.
internacionales de universidades. Estará a cargo del director (a) y contará con una
Guayaquil.
62
d) Elaborar el Plan Operativo Anual de Investigación de la Universidad y las
la actividad científica.
63
grado, maestría y doctorado, con destacados resultados en la investigación e
científica y tecnológica que debe realizar esta institución, así como su planes de
país.
de financiamiento externo
64
Secretaría Nacional de Ciencia y Técnica, y las Políticas de Ciencia y Tecnología
CUADRO N°.
VARIABLES DEL ESTUDIO
HIPÓTESIS Variables Independientes
¿Cómo un diseño de
Transformación de Datos
utilizando la herramienta - Inconsistencia de los datos
Spoon de Pentaho puede
migrar varias bases de datos
subsanando la data
inconsistente?
Variable Dependiente.
Variable Dependiente.
65
para trasladar información desde un repositorio a otro y para tal objeto la
horas de trabajo, costos altos para la empresa, riesgos de data perdida, funcionalidad
alternativa.
Variables independientes.
detallada así como también al área de cobranzas para realizar su trabajo de forma
Falta de capacitación a los empleados: Para obtener una idea más clara del estudio
que se va a realizar se analizaron varios motivos por el cual la data estaba mal
CAPÍTULO III
METODOLOGÍA
66
DISEÑO DEL ESTUDIO
10%: Bibliografía.
TIPO DE ESTUDIO
datos que se aplica para el estudio debe catalogar según el tamaño de la base de
67
repositorio a otro sin tener riesgos de perdida de data y como resultado nos arrojara
POBLACIÓN Y MUESTRA
Población:
Nacionales que tiene como sede principal Guayaquil, con sucursales en:
Manabí
El Oro
Azuay
Tulcán y
Esmeraldas
Cabe mencionar que en todas las sucursales incluyendo matriz se tienen errores, los
eficiencia de la institución.
Muestra:
CUADRO N°. .
Datos Obtenidos de la Empresa
68
POBLACIÓN N
Manabí 180
TOTAL 500
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
Se aplica la fórmula:
EL TAMAÑO DE LA MUESTRA
P. Q. N m
n n
( N 1) E 2 / K 2 P. Q 2
e ( m 1) 1
125 500
n n
( 499)(0.0009) 0.25 (0.0036)(499) 1
125 500
n n
0.4491 0.25 1.7964 1 69
125 500
n n
0.6991 2.7964
n 178.80 n 178.80
Cálculo de la fracción
muestral:
n 178.80
f 0.3576
N 500
incidencias a nivel de la base de datos, cuya referencia nos servirá para realizar las
encuestas.
CUADRO N°.
Estimación de Porcentaje
70
Luego de tener el porcentaje de la muestra de cada agencia se consideró validar la
encontraron los mismos tipos de errores pero con mayor afluencia en la sucursal
Manabí, ya que es la única agencia que posee servicio de puerta a puerta. Por tanto
CUADRO DE VARIABLES
CUADRO N°.
MATRIZ DE OPERACIONALIZACIÓN DE VARIABLES
Variables Dimensiones Indicadores Técnicas y/o
Instrumentos
71
TIPOS DE INVESTIGACION
encuestas en el cual se puntualizan las etapas que se llevaron a cabo para organizar
los datos en estudio. Al instante de recopilar datos se aplicó el software SPSS, para
el mejor proceso de los datos. Se discurre que la técnica establecida que se utilizó es
de campo.
CUADRO N°.
DIAGRAMA DE LA TÉCNICA UTILIZADA
Elaboración de Encuestas
Análisis de estabilidad
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
72
EN EL ESTUDIO
continuación, los datos serán analizados por el software SPSS (Paquete estadístico
potente y fiable) que servirá para el análisis estadístico y nos ayudará a exponer el
LOS UTENSILIOS
Técnica Instrumento
Encuesta Cuestionario
el problema.
Los resultados de las entrevistas fueron comparados con artículos de internet y sobre
Libros e Internet.
73
PROCESAMIENTO DE LA INFORMACIÓN
EN EL PROYECTO
en el mundo real.
RECOLECCIÓN DE LA INFORMACIÓN
ENTREVISTA A DBA’S
1.- ¿La falta de Capacitación es indicativo del mal ingreso de datos por parte de
los usuarios?
“Si, ya que el ingreso de la información en los distintos sistemas no siempre son las
2.- ¿Qué indicios son muestras de que una base de datos se encuentre
inconsistente?
innecesariamente los datos en los archivos que conforman la base de datos y esto se
debe a un grupo de factores que en su mayoría van asociados al ingreso de los datos
desde algún aplicativo mal diseñado, al tipo de dato que le creemos a los campos de
la base, a las longitudes, columnas, etc. Muchas veces este tipo de errores no causan
74
3.- ¿La carencia de un Manual de Usuario provoca un alto porcentaje de
“Si, en varias empresas no se camacita al personal por falta de tiempo y solo recibe
una inducción sencilla que suele darse por la persona que renuncia, pero esta
capacitación no siempre es entendida por tanto un empleado debe ser dotado por un
“La causa principal se da por el mal ingreso de la información por parte del usuario
y por la mala arquitectura que posee el software al permitir ese mal ingreso.”
“Por lo general los sistemas que poseen vulnerabilidades a nivel de estructuras, tipos
de datos, ingresos sin validaciones son las más propensas a tener inconsistencias,
dado que estas falencias permiten el ingreso de la información de forma desigual por
permita.
6.- ¿Existe algún método para detectar con anticipación las falencias que pueda
“De hecho se la puede detectar en el ambiente de TEST o prueba, una vez que el
tanto técnico como de usuario con el fin de detectar problemas mucho antes de
7.- ¿Qué tipo de base de datos es recomendable para una mediana empresa?
75
que necesitemos poseer. Para este proyecto se recomendó PostgreSql, ya que es una
LA ENCUESTA
CONTENIDOS.
Servicios Nacionales (Fue dirigida hacia los servicios funerales que ofrece esta
institución).
Sistema
2. Datos Relevantes.
76
5. Cuando realiza sus pagos, le solicitan actualizar sus datos? Si ___ No___
6. ¿Ha realizado algún tipo de reclamo por mal ingreso de sus pagos?
Si ___ No ___
___________________________________________________________________
9.- Sexo:
VALIDACIÓN
El trabajo fue revisado por expertos en el área de base de datos, como también en el
PROCEDIMIENTOS DE LA INVESTIGACIÓN
transformar los datos desde una base de datos a otra y lo hace de forma fácil, rápida
77
Realizar el formulario de preguntas.
Realizar scripts que permitan el filtrado de los datos como técnica para representar
Recolección de la información.
Los datos alcanzados para este estudio florecieron mediante la observación directa,
ya que valieron para la corrección y mejora de los procesos actuales que poseía la
empresa Servicios Nacionales tanto con los clientes como para control interno de los
mismos y así tomar los correctivos necesarios para una mejora organizacional.
3.- Para las cuales usamos un modelo de regresión logística, y gracias a este modelo
PROCESAMIENTO Y ANÁLISIS
Se creó una base de datos para pruebas en un servidor virtual Suse Linux 12.1, para
estadísticos.
78
Una vez realizado el levantamiento de información a través de los cuestionarios
datos.
Validación y Edición
Codificación
Introducción de datos
VALIDACIÓN
establecido.
En nuestra entrevista, se explotó todos los conocimientos del jefe de sistemas de esa
institución y tratamos de aclarar todas las dudas acerca de la mala arquitectura del
sistema anterior, para poder darle el tratamiento más óptimo a los datos.
EDICIÓN
Implica verificar los errores del entrevistado. El proceso de edición para las
79
CODIFICACIÓN
respuestas, la mayoría de las preguntas de las entrevistas son cerradas y están pre-
codificadas.
PROCESO DE CODIFICACIÓN
preguntas contestadas por los clientes. Donde se obtuvo como resultado los datos y
ANÁLISIS DE RESULTADOS
N = Total de Datos.
80
EL CUESTIONARIO
Pregunta 1:
1.- ¿Han recibido algún curso donde se los capacite en cuanto al manejo de
Access?
CUADRO N°.
HA RECIBIDO CURSOS DE CAPACITACIÒN
GRÁFICO N°.
Tabla de Cuestionario Capacitación
81
2.- ¿Usted desearía que las ventas y pagos de las diferentes agencias se puedan
CUADRO N°.
DESEA QUE LAS TRANSACCIONES SE VALIDEN DESDE EL SISTEMA
DATOS UNIDADES PORCENTAJE
No 10.8 6
Si 169.20 94
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Tabla de Cuestionario Ventas y Pagos
Desearía que las ventas y pagos de las diferentes agencias
Se puedan validar desde el sistema
No Si
6%
94%
82
3.- ¿Desearía poder revisar el inventario actual de las diferentes agencias?
CUADRO N°.
INVENTARIO ACTUAL DE LAS DIFERENTES AGENCIAS
DATOS UNIDADES PORCENTAJE
No 5.4 3
Si 174.6 97
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Tabla de Cuestionario Inventario
Poder ver el inventario Actual de las diferentes agencias
No Si
3%
97%
Las conexiones entre agencias hacia un servidor principal logran que aquello de ir
4.- ¿Cree usted que al registrar un pago o una venta, el sistema debe tener
GRÁFICO N°.
Tabla de Cuestionario Seguridades
Seguridades adicionales al registrar un pago o una venta en el sistema
4%
No Si
96%
dinero.
84
5.- ¿Cree usted necesario que Servicios Nacionales adquiera tecnología de
clientes?
CUADRO N°.
GARANTIZAR LA INVIOLABILIDAD DE SUS DATOS
DATOS FRECUENCIA PORCENTAJE
No 7.20 4
Si 172.80 96
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Tabla de Cuestionario Garantizar transacciones
Garantizar las transacciones e información de Clientes
4%
No Si
96%
avanzado que existe en un determinado momento. Con el avance del tiempo, los
por otros. Estos nuevos productos son los que contarán, por un tiempo, con la
85
6.- ¿Está usted de acuerdo que Servicios Nacionales al adquirir tecnología de
CUADRO N°.
TECNOLOGÍA DE PUNTA PARA SER CAPACITADO
DATOS FRECUENCIA PORCENTAJE
No 9 5
Si 171 95,2
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Tabla de Cuestionario Tecnología
Servicios Nacionales adquiera tecnología de punta y que sea
Capacitado en esta.
5%
No
Si
95%
nueva tecnología adquirida por Servicios Nacionales para poder agilitar el proceso
Norma establecida en la Ley Federal del Trabajo que obliga a toda entidad o
86
7.- ¿Le gustaría a usted poseer un sistema eficiente, relacional y seguro para
CUADRO N°.
AHORRAR TIEMPO Y DINERO EN TODAS LAS AGENCIAS
DATOS FRECUENCIA PORCENTAJE
No 9 5
Si 171 95
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Tabla de Cuestionario Ahorrar tiempo y dinero
Ahorrar tiempo y dinero en todas las agencias
No Si
5%
95%
relacional, seguro y eficiente para poder agilitar sus trámites y por ende ahorra
transacciones.
interés. El dinero disponible hoy, vale más que la expectativa de la misma cantidad
87
LAS HIPÓTESIS
1.- Crecidamente el 97% de los usuarios aseguran requerir que la información de todas
CUADRO N°. 5
SEGURIDAD DE LA INFORMACIÓN
DATOS FRECUENCIA PORCENTAJE
No 5.4 3
Si 174.6 97
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Hipótesis Seguridad de la Información
Seguridad de la Información
No Si
3%
97%
88
Hipótesis N° 2 - Inviolabilidad
tener la facilidad de registrar los pagos desde cualquier agencia a nivel nacional
CUADRO N°. 16
INVIOLABILIDAD
DATOS FRECUENCIA PORCENTAJE
No 7.2 4
Si 172.80 96
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Hipótesis Inviolabilidad
Garantizar la inviolabilidad de sus pagos en cualquier agencia.
4%
No Si
96%
enunciado dice ¿Cree usted necesario que Servicios Nacionales adquiera tecnología
89
Hipótesis N° 3 - Garantizar transferencias
3.- Los usuarios del área de ventas necesitan emplear seguridades tecnológicas para
CUADRO N°. 17
GARANTIZAR TRANSFERENCIAS
DATOS FRECUENCIA PORCENTAJE
No 19.8 11
Si 160,2 89
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Hipótesis Garantizar transferencias
Seguridades tecnológicas para garantizar las transferencias
En línea
Muy bajas 3%
4% 4%
Bajas
Altas
89%
Muy altas
enunciado dice ¿Cree usted que al registrar un pago o una venta, el sistema debe
90
Hipótesis N° 4 - Cursos y Capacitación
CUADRO N°. 18
CURSOS Y CAPACITACION
DATOS FRECUENCIA PORCENTAJE
No 7.2 4
Si 172.8 96
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Hipótesis Cursos de Capacitación
Esta hipótesis queda verificada de acuerdo a la pregunta número uno ¿Ha recibido
o actualización.
91
Hipótesis N° 5 - Ahorrar tiempo y dinero
CUADRO N°. 19
AHORRAR TIEMPO Y DINERO
DATOS FRECUENCIA PORCENTAJE
No 9 5
Si 171 95
Total 180 100%
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
GRÁFICO N°.
Hipótesis Ahorrar tiempo y dinero
Ahorrar tiempo y dinero en su lugar de trabajo
No Si
5%
95%
recibido algún curso donde se los capacite en cuanto al manejo de Access? con
el 95%.
92
CRITERIOS PARA LA ELABORACIÓN DE LA PROPUESTA
razonamientos que se utilizaron para la proposición fueron por cumplir con las
metas de cumplimiento reducir costos para la empresa, reducir gastos y velar por la
del problema a investigar, fue creado con criterios de seguridad informática basados
PostgreSql
Spoon de Pentaho
Access 2003
Las tipologías fundamentales que tendrá esta base de datos son las siguientes:
Inviolabilidad de la información.
Portabilidad.
Seguridad.
93
CAPÍTULO IV
MARCO ADMINISTRATIVO
CRONOGRAMA
GRÁFICO N°.
CRONOGRAMA DE TRABAJO
planeación estimada se plantea ejecutar las siguientes iteraciones dentro del proceso
de migración de datos:
94
La iteración 1 corresponde a la migración de catálogos e inicio de la migración
longitud).
activos pendientes.
iteración y tendrá que estar sincronizado con las generaciones en los pasos del
diseño.
CUADRO N°.
PLANIFICACIÓN DETALLADO DEL TRABAJO REALIZADO
95
Creación Base de Datos PostgreSql 4 14/08/2012 17/08/2012
8:00 17:00
Diseño de modelamiento de Bases de 21 20/08/2012 17/09/2012
Datos 8:00 17:00
Seguridades lógicas 13 03/09/2012 19/09/2012
8:00 17:00
Análisis de alternativas – HARDWARE 8,75 19/09/2012 01/10/2012
10:00 17:00
Análisis de alternativas de seguridad 8 03/10/2012 12/10/2012
lógicas 8:00 17:00
Instalación del Aplicativo en las diferentes 13 15/10/2012 31/10/2012
agencias 8:00 17:00
Definiciones de acceso- usuarios- 5 25/10/2012 31/10/2012
administradores 8:00 17:00
Implementación de contingencia 28 01/11/2012 10/12/2012
8:00 17:00
Diseño de respaldo 13 11/12/2012 27/12/2012
8:00 17:00
Verificación - afinamientos 27 28/12/2012 04/02/2013
8:00 17:00
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
Manejo de inconsistencias
Los datos que no puedan ser ingresados en el modelo de datos, porque no cumplen
describe a continuación:
Registro de inconsistencias
Los datos que no puedan ser cargados, por ser inválidos serán enviados a un
96
Existirá una estructura en la cual se registrarán todas las inconsistencias,
Corrección de inconsistencias
Pruebas
funciona correctamente, medir los tiempos para tener una planeación integral y
minimizar los riesgos. Las pruebas generales corresponden a las pruebas del usuario
transacciones de prueba con datos reales y con casos especiales (que no se presentan
transacción, utilizando los mismos datos de entrada, pueden no generan los mismos
97
PRESUPUESTO
Nuestro presupuesto comprende los diferentes gastos que se llevaran a efecto, para
CUADRO N°.
REFERENCIA DE EGRESOS DEL PROYECTO
EGRESOS DÓLARES
Suministros de oficina $ 90.00
Fotocopias 40.00
Libros y documentos 0.00
Computadora y servicios de Internet 400.00
Transporte 30.00
Refrigerio 41.00
Empastado, anillado de tesis de grado 50.00
TOTAL……………………………………… $ 651.00
Elaboración: Johanna Hernández Velasco
Fuente: Servicios Nacionales
S.A., donde laboré como analista desarrollador junior, logrando solventar los
98
Diseño, desarrollo e implantación del sistema de información misional de la
Oracle. Oracle Warehouse Builder 10g Release 2 for Windows and Unix,
Núñez Jover J., La ciencia y la tecnología como procesos sociales. En: Grupo de
Caracas, Venezuela. - Editorial Rial. 150 Paginas, 2009. Pag.8, 10, 12.
NETGRAFÍA
Date, C.J. (2001) "Introduction a los sistemas de Bases de datos", Prentice Hall,
99
Miguel, A; Piattini, M; (2006) "Diseno de Bases de Datos Relacionales",
Caracas, Venezuela, Editorial Rial, 150 Paginas, 2009, Pag.8, 10, 12.
REFERENCIAS WEB
100
http://wikinvestigacion.wikispaces.com , Universidad de Sevilla, España Sevilla,
2012
Venezuela, 2008
el 21 de Octubre de 2010.
(http://www.upm.es/portal/site/institucional/menuitem.fa77d63875fa4490b99bfa04d
ffb46a8/?vgnextoid=b713c85fb34c1210VgnVCM10000009c7648aRCRD).
Pentaho Data Integration Big Data and More: The Power to Access, Prepare
http://www.pentaho.com/explore/pentaho-data-integration/
101
CONCLUSIONES Y RECOMENDACIONES
CONCLUSIONES
El 97% de los usuarios indican que desean realizar sus transacciones en línea y con las
agencias interrelacionada, sobre todo evitar errores por duplicidad de pago y mal control
de inventarios.
Como hemos estado hablando durante todo el documento, hoy en día, la información que
mucho de los casos, como uno de los bienes más preciados de las distintas entidades. Así
mismo, la desinformación, puede ser una de las armas con las que se puede atacar a
En esta sociedad en la que vivimos se hace muy necesario la seguridad en las bases de
datos, y como principal exponente en Internet ya que este método es cada vez más
particulares, etc.
El tema tratado será uno de los claros exponentes a tener muy en cuenta en el futuro de
El 89% de los empleados del área de ventas indican que al realizar sus ingresos de
contratos o pagos ellos necesitan seguridades informáticas para que no sean modificadas
ni eliminadas.
El traspaso de información de una base a otra cada vez es más valioso y que puede
El tema tratado es un mundo muy amplio y fascinante, de la misma manera, tiene muchas
la hora de poder dar una solución en la mejora del traspaso de información. Hoy en día,
103
existes muchas herramientas informáticas (software), las cuales nos ayudan en estos
procesos de migración, sin embargo, el cómo se las emplee y se las configure para efectos
de mitigar los tiempos en que esta procesa para tales fines, es lo que durante la redacción
e investigación del presente documento, se logra evidenciar. Además de ello, obtener una
Pienso que las variables que se han incluido dentro de esta investigación son las más
operatividad de la empresa sino también la seguridad de los datos de los clientes, los
cuales deben ser guardado con mucho cuidado para mantener la confianza y continuidad
del negocio.
104
RECOMENDACIONES
parte del hardware. Los cambios tecnológicos realizados deben estar de acuerdo a la
A los usuarios de las distintas agencias se los debe de capacitar acerca de las nuevas
manejo y control del mismo. Entre las conclusiones que podemos nombrar son:
Siempre se debe realizar un análisis de las diferentes transacciones que realizan los
Los empleados de la funeraria del área técnica deben estar siempre actualizados en los
Así mismo, para futuros estudiantes que se interesen por la metodología implementada en
optimizar los procesos mostrados y detallados, así como también, hacer uso de la misma,
La migración de datos debe ser correctamente evaluada antes de ejecutarla, ya que esto tiene
muchos tipos de riesgo en cuanto a la perdida de información. Por tanto para prevenir
proceso.
105