Sunteți pe pagina 1din 56

FACULTAD DE INGENIERÍA

ESCUELA ACADÉMICO PROFESIONAL DE


INGENIERÍA DE SISTEMAS

“SISTEMA DE SOPORTE A LA PLANIFICACIÓN UTILIZANDO


MINERÍA DE DATOS PARA MEJORAR LA EFICIENCIA DEL
PROCESO DE TOMA DE DECISIONES EN EL AREA DE CONTROL
DE LA PRODUCCIÓN EN CAMPOSOL S.A”

TESIS PARA OBTENER EL TÍTULO


PROFESIONAL DE INGENIERÍA DE SISTEMAS

AUTOR:
ARÉVALO ZAPATA MANUEL WILFREDO

ASESOR:
DIAZ AMAYA LOURDES ROXANA

LÍNEA DE INVESTIGACIÓN:
SISTEMAS DE INFORMACIÓN Y COMUNICACIONES

TRUJILLO - PERÚ
2018
PÁGINA DEL JURADO

El presidente y los miembros de Jurado Evaluador designado por la Escuela de Ingeniería


de Sistemas.

APRUEBAN

La tesis denominada:

“SISTEMA DE SOPORTE A LA PLANIFICACIÓN UTILIZANDO MINERÍA DE


DATOS PARA MEJORAR LA EFICIENCIA DEL PROCESO DE TOMA DE
DECISIONES EN EL AREA DE CONTROL DE LA PRODUCCIÓN EN
CAMPOSOL S.A”

Presentado por:

____________________________________

Tapia Benites Ronal Humberto

JURADO EVALUADOR:

___________________________________

Ing. …………………………….
PRESIDENTE DEL JURADO

__________________________________ ___________________________________

Ing. ………………………….. Ing. ……………………….


SECRETARIO VOCAL
DEDICATORIA

……………………………………………
Manuel Wilfredo Arévalo Zapata
AGRADECIMIENTO

A Dios, ……………………….

A mi familia ……………………
DECLARACIÓN DE AUTENCIDAD

Yo, AREVALO ZAPATA MANUEL, con DNI N° 41557796, a efecto de cumplir con las
disposiciones vigentes consideradas en el Reglamento de Grados y Títulos de la Universidad
Cesar Vallejo, Facultad de Ingeniería, Escuela Académico Profesional de Ingeniería de
Sistemas, declaro bajo juramento que toda la documentación que acompaño es veraz y
autentica.

Así mismo, declaro también bajo juramento que todos los datos e información que se
presenta en el presente proyecto de tesis son auténticos y veraces.

En tal sentido asumo la responsabilidad que corresponda ante cualquier falsedad,


encubrimiento u omisión tanto de los documentos como de la información aportada por lo
cual me someto a lo dispuesto en las normas académicas de la Universidad Cesar Vallejo.

Trujillo, diciembre 2018.

……………………………………………
Manuel Wilfredo Arévalo Zapata
PRESENTACIÓN

Señores Miembros del Jurado:

UNIVERSIDAD CESAR VALLEJO DE TRUJILLO

De mi especial consideración:

Cumpliendo con los requerimientos estipulados en el reglamento de proyectos de tesis de la


facultad de ingeniería de la universidad César Vallejo, pongo a vuestra disposición el
presente proyecto al que he titulado:

“SISTEMA DE SOPORTE A LA PLANIFICACIÓN UTILIZANDO MINERÍA DE


DATOS PARA MEJORAR LA EFICIENCIA DEL PROCESO DE TOMA DE
DECISIONES EN EL AREA DE CONTROL DE LA PRODUCCIÓN EN
CAMPOSOL S.A”

El presente proyecto ha sido desarrollado teniendo como base los conocimientos adquiridos
al largo de estudio de formación profesional, los cuales fueron aplicados conjuntamente con
la experiencia profesional, lográndose de esta manera culminar exitosamente el desarrollo
del proyecto de investigación.
Esperando que el presente proyecto se convierta en una guía para el desarrollo de futuros
trabajos relacionados al tema.
Señores Miembros del Jurado, dejo a vuestro elevado criterio la evaluación del presente
informe.

Trujillo, diciembre 2018


Contenido
PÁGINA DEL JURADO ................................................................................................................... 2
DEDICATORIA ................................................................................................................................. 3
AGRADECIMIENTO ........................................................................................................................ 4
DECLARACIÓN DE AUTENCIDAD .............................................................................................. 5
PRESENTACIÓN .............................................................................................................................. 6
RESUMEN ......................................................................................................................................... 9
ABSTRACT ..................................................................................................................................... 10
GENERALIDADES ......................................................................................................................... 11
I. INTRODUCCION .................................................................................................................. 13
1.1. Realidad Problemática ................................................................................................... 13
1.2. Trabajos Previos ............................................................................................................. 16
1.3. Teorías Relacionadas al Tema....................................................................................... 19
1.4. Formulación al Problema .............................................................................................. 42
1.5. Justificación del Estudio ................................................................................................ 42
1.5.1. Justificación Valor Teórico: .................................................................................. 42
1.5.2. Justificación Conveniencia: ................................................................................... 42
1.5.3. Justificación Implicancias prácticas: .................................................................... 42
1.5.4. Justificación con Relevancia Social: ..................................................................... 42
1.5.5. Justificación Utilidad metodológica:..................................................................... 42
1.6. Hipótesis .......................................................................................................................... 42
1.7. Objetivos ......................................................................................................................... 43
1.7.1. General: ................................................................................................................... 43
1.7.2. Específicos: .............................................................................................................. 43
II. MÉTODO ............................................................................................................................ 44
2.1. Diseño de Investigación .................................................................................................. 45
2.1.1. Investigación Aplicada: .......................................................................................... 45
2.1.2. Tipo de Investigación: ............................................................................................ 45
2.2. Variables, Operacionalización....................................................................................... 45
2.2.1. Variable Independiente: ........................................................................................ 45
2.2.2. Variable Dependiente: ........................................................................................... 45
2.2.3. Escalas de Medición en la Operacionalización de Variables .............................. 45
2.2.4. Operacionalización ................................................................................................. 46
2.3. Población y Muestra....................................................................................................... 48
2.3.1. Población: ................................................................................................................ 48
2.3.2. Muestra: .................................................................................................................. 48
2.4. Técnicas e Instrumentos de Recolección de Datos, Validez y Confiabilidad ............ 48
2.4.1. Técnicas e Instrumentos de Recolección de Datos ............................................... 48
2.5. Métodos de Análisis de Datos ............................................Error! Bookmark not defined.
2.6. Aspectos Éticos ...................................................................Error! Bookmark not defined.
III. RESULTADOS ................................................................................................................... 52
IV. DISCUSIÓN ........................................................................................................................ 54
V. CONCLUSIONES .................................................................................................................. 56
VI. RECOMENDACIONES .................................................................................................... 56
VII. PROPUESTA ..........................................................................Error! Bookmark not defined.
REFERENCIAS ............................................................................................................................. 56
ANEXOS ......................................................................................................................................... 56
RESUMEN

La presente investigación titulada: “SISTEMA DE SOPORTE A LA PLANIFICACIÓN


UTILIZANDO MINERÍA DE DATOS PARA MEJORAR LA EFICIENCIA DEL
PROCESO DE TOMA DE DECISIONES EN EL AREA DE CONTROL DE LA
PRODUCCIÓN EN CAMPOSOL S.A” tiene como finalidad mejorar el seguimiento y
control de proveedores de transporte, mediante un sistema de información vía web.

Para ello, se obtuvo la información de los procesos a través de una encuesta dirigida al
personal involucrado en el proceso de despacho (ver Anexo I). La población es 16 órdenes
de servicio de transporte, ejecutados en una quincena, y la muestra es la misma por ser
pequeña. Para el análisis de requerimientos enfocados a resolver los objetivos específicos
planteados tales como, reducir el tiempo de registro del requerimiento del servicio de
transporte, reducir el tiempo de registro de la orden de servicio de transporte y reducir el
tiempo de registro del seguimiento del servicio de transporte. El tipo de investigación que se
siguió fue aplicada y pre-experimental. Se utilizó como método de análisis de datos la Prueba
T-Student y como metodología de desarrollo ICONIX, para la elección de ésta metodología
se sometió a selección y se comprobó por tres expertos que es el más aceptable para el
desarrollo de la presente investigación (ver Anexo III). Con el sistema implantado se logró
reducir el tiempo promedio de registro del requerimiento del servicio de transporte en un
80.19%; además se redujo el tiempo promedio de registro de la orden de servicio de
transporte en un 69.33%; así mismo se logró reducir el tiempo promedio de registro del
seguimiento del servicio de transporte en un 90.20%. Se concluyó que con la
implementación del sistema de información vía web se ha logrado mejorar
significativamente el seguimiento y control de los proveedores de transporte.

Palabras claves: Sistema de información, web, seguimiento, control, proveedores de


transporte.
ABSTRACT

La presente investigación titulada: “SISTEMA DE SOPORTE A LA PLANIFICACIÓN


UTILIZANDO MINERÍA DE DATOS PARA MEJORAR LA EFICIENCIA DEL
PROCESO DE TOMA DE DECISIONES EN EL AREA DE CONTROL DE LA
PRODUCCIÓN EN CAMPOSOL S.A” tiene como finalidad mejorar el seguimiento y
control de proveedores de transporte, mediante un sistema de información vía web.

Para ello, se obtuvo la información de los procesos a través de una encuesta dirigida al
personal involucrado en el proceso de despacho (ver Anexo I). La población es 16 órdenes
de servicio de transporte, ejecutados en una quincena, y la muestra es la misma por ser
pequeña. Para el análisis de requerimientos enfocados a resolver los objetivos específicos
planteados tales como, reducir el tiempo de registro del requerimiento del servicio de
transporte, reducir el tiempo de registro de la orden de servicio de transporte y reducir el
tiempo de registro del seguimiento del servicio de transporte. El tipo de investigación que se
siguió fue aplicada y pre-experimental. Se utilizó como método de análisis de datos la Prueba
T-Student y como metodología de desarrollo ICONIX, para la elección de ésta metodología
se sometió a selección y se comprobó por tres expertos que es el más aceptable para el
desarrollo de la presente investigación (ver Anexo III). Con el sistema implantado se logró
reducir el tiempo promedio de registro del requerimiento del servicio de transporte en un
80.19%; además se redujo el tiempo promedio de registro de la orden de servicio de
transporte en un 69.33%; así mismo se logró reducir el tiempo promedio de registro del
seguimiento del servicio de transporte en un 90.20%. Se concluyó que con la
implementación del sistema de información vía web se ha logrado mejorar
significativamente el seguimiento y control de los proveedores de transporte.

Palabras claves: Sistema de información, web, seguimiento, control, proveedores de


transporte.
GENERALIDADES
 TÍTULO:
“Sistema de Soporte a la Planificación Utilizando Minería de Datos para Mejorar la
Eficiencia del Proceso de Toma de Decisiones en el Área de Control de la Producción
en CAMPOSOL S.A”

 AUTOR:
Arévalo Zapata, Manuel Wilfredo

 ASESOR:
Asesor Metodológico: Ing. Díaz Amaya, Lourdes Roxana

 TIPO DE INVESTIGACIÓN:
De acuerdo con el fin que se persigue: Aplicada dado que en la investigación a realizar
se pone en práctica los conocimientos adquiridos a lo largo de la carrera.

De acuerdo con la técnica de contrastación: Descriptiva

De acuerdo con la orientación: Pre - Experimental

porque se aplicarán métodos: PreTest y PostTest, también llamada método de sucesión


o en línea, con el fin de contrastar la hipótesis.

 LÍNEA DE INVESTIGACIÓN:
Sistemas de Información y Comunicaciones.

 LOCALIDAD:
Área de control de la producción en CAMPOSOL S.A. Chao, Virú, Trujillo, Perú.

 DURACIÓN DE LA INVESTIGACIÓN:
Una vez aprobado el proyecto se tendrá un límite de 4 meses para culminar el proyecto.
I. INTRODUCCION
1.1. Realidad Problemática
El manejo de la información es fundamental dentro de las empresas y parte
principal para sacar ventaja competitiva en los negocios, para que los responsables
de tomar decisiones tengan fácil y rápido acceso a información útil y acorde con el
menor margen posible de errores para no situar en riesgo las operaciones de la
empresa, permitiendo brindar propuestas de valor agregado y supremacía a quienes
las utilicen de manera eficaz y eficiente.
El proceso de toma de decisiones ha experimentado cambios a través del
tiempo. En un principio se tomaban decisiones basadas en la intuición, pero con el
desarrollo de la tecnología, se ha hecho posible que las organizaciones tengan gran
información sobre las operaciones que realizan, facilitando el análisis de los datos y
la toma de decisiones informadas
CAMPOSOL, es una empresa peruana conocida por sus extensas actividades
de cultivo y exportación de fruta y verdura fresca, ofreciendo de esta manera una
gama más completa a su clientela global. Así se ha convertido en el fabricante #1
del Perú en mangos, paltas y arándanos”.
Según (Camposol, 2018) “empresa agroindustrial líder en el Perú, está
involucrada en la preparación, cosecha y comercialización de productos agrícolas
de alta calidad exportando a más de 40 países, a través de sus oficinas comerciales
en Estados Unidos de América; Europa y Asia. La calidad es una de las
competencias más valiosas y el sistema de gestión de calidad se basa en los
principales estándares internacionales. Compitiendo en obtener lo mejor en términos
de calidad. Participa y orienta cada etapa del ciclo de crecimiento de nuestros
productos agrícolas, tal como espárragos (blanco y verde), paltas, uvas, arándanos,
mangos, pimientos del Piquillo, granadas y mandarinas, entre otros”.
Según (Adex, 2018) “Los constantes avances en la apertura comercial y la
promoción de nuestra oferta exportable han colocado al Perú como una de las
principales fuentes de alimentos para el mundo. Sin duda, una posición ganada
gracias al esfuerzo conjunto entre el sector público y privado que en el 2016 permitió
generar exportaciones por más de 5 mil 550 millones de dólares.” (Ver Anexo 4).
Según (Comercio, 2018) “Con una tasa de crecimiento de 24,4% en marzo y
15,5% en el primer trimestre del año, las exportaciones peruanas mantienen el ritmo
de crecimiento necesario para lograr el objetivo de duplicarse al 2021, informó el
presidente de la Asociación de Exportadores ADEX, Juan Varilias Velásquez”.
Entre enero y marzo, los envíos sumaron US$11.561 millones. Los tradicionales
ascendieron a US$ 8.426 millones, creciendo 14,7% y los no tradicionales US$
3.135 millones, alzándose en 17,6%, informó ADEX”.
Según (Inei, 2018) “El sector comercio exportador de palta, que los productos
bandera de Camposol creció, como se denota a continuación:” (Ver Anexo 4)
El área de Planificación Control de la Producción (PCP) de Camposol cumple
una función fundamental como parte de la gerencia de Operaciones de la Empresa,
en donde convergen procesos de campo desde la preparación de terreno para los
cultivos, la siembra, asistencia y cosecha de los mismos; teniendo que ver con ello
la planificación de los insumos (volumen por Kg de materia prima, calibre,
categoría), abastecimiento de materiales, que se usan para la elaboración de los
diferentes procesos que se tienen hasta llegar a concretar la entrega de los productos
hacia los clientes finales, para lo cual el área Comercial y Comercio Exterior
(COMEX) son los encargados de velar por los procesos de transporte, reservas
marítimas y/o aéreas, para que el producto llegue a las diferentes clientes.
El Problema que aqueja a CAMPOSOL se observa en PCP, es en ésta área
donde se elabora el Plan de Producción y Despacho diario (PPDD), es decir, lo que
la empresa produce y despacha día a día. Para integrar información transversal
respecto a capacidad de planta, plazos máximos y mínimos de despacho,
requerimientos según tipo de cliente, proyección de campo; contenedores, cajas, y
demás indicadores determinados por la empresa como ratios de aprovechamiento de
materia prima para distribución. El PPDD es dinámico puede cambiar según
condiciones climáticas, entre otras, lo cual hace cambiar el plan de ventas en vista
que proyectado ya no se tiene que operar así, es allí donde radica la fuente principal
en donde PCP, incurre en poca precisión en el cálculo en absolver preguntas como
qué cantidad de pedidos podrían hacerse por día, qué pedidos podemos empacar de
acuerdo a las prioridades la información; predecir la información del PPDD como
es el caso de la cantidad de pedidos.
Por lo tanto: (Ver Anexo 3 – Espina de Ishikawa)
 La información del PPDD proviene de diferentes fuentes computacionales:
Hoja de Cálculo Excel y SAP, lo que genera decisiones no estructuradas para
el proceso de toma de decisiones.
 No existe una técnica clara en donde, sea posible identificar con anticipación
cuales son los factores y priorización a considerar de lo que está definido a
priori en el PPDD.
 La información obtenida por el SAP, es solo para validar si, lo procesado
está acorde a lo panificado, sin embargo, no se cuenta con un software
parametrizable que permita manejar información exacta para PCP.
 Es básico en el proceso de toma de decisiones del PCP recopilar datos
exactos y de manera automática, de las áreas asociadas, proyección de
campo, comercial y comercio exterior, para la generación de alternativas y
posterior selección de la más apropiada.
Para identificar mejor la problemática se ha elaborado una encuesta (Anexo 01)
para evidenciar mejor las causas y consecuencias respectivas, así tenemos:
 Tomando en cuenta el análisis del anexo 01 acerca de la satisfacción del
personal administrativo con respecto a cómo se ejecuta actualmente la toma
de decisiones en el área de la PCP, se denota que hace aún falta mejorar el
nivel de satisfacción de la toma de decisiones automatizando versus la
tradicional Hoja de cálculo Excel, la brecha no es tanto sobre el uso de la
hoja de cálculo. (14 en acuerdo vs 13 en desacuerdo ver gráfico 1) llevado a
porcentaje seria un 35% a un 32.5%.
 Sin embargo, la satisfacción del personal administrativo acerca del Plan de
Producción y Despacho diario (PPDD) es regular no está satisfecho la forma
de trabajo (18 regular ver gráfico 2) el cual representa un 60% (regular) a un
26.7% que piensa que es bueno, por lo cual necesita ser mejor, teniendo en
cuenta la naturaleza de la Empresa en donde de todas maneras el usuario
tiene que Operar por ser producción, pero la propuesta del proyecto es a
través de un Software (Sistema de Soporte a la Planificación) de allí la
importancia del mismo.
1.2. Trabajos Previos
1.2.1. Nivel Internacional:
Título: “MODELO CONCEPTUAL DE DATAMART PARA LA GESTIÓN
DE RECURSOS HUMANOS EN EL ÁMBITO DE LA ADMINISTRACIÓN
PÚBLICA NACIONAL”.
Autor: María del Rosario Martínez
Año: 2016
Universidad: Universidad Abierta Interamericana, UAI Buenos Aires,
Argentina.
Resumen: Hace uso de un modelo con una particularidad de la herramienta es
su modelo multidimensional mediante los cuales se reflejan los elementos
analizados. El modelo estrella planteado para el desarrollo destaca también.
Aporte: Se rescata la metodología empleada para aplicar un modelo
multidimensional el mismo que, es la esencia de un datamart. Los datos se
estructuran para representar hechos y dimensiones, el modelo estrella utilizado
es ideal por su simplicidad.

Título: “DISEÑO Y CONSTRUCCIÓN DE UN DATAMART PARA EL


FILTRO DE OPINIONES EN LA WEB A PARTIR DE DATOS
ORIGINADOS EN EL PORTAL EDUCAR CHILE”.
Autor: Pérez Ríos Sebastián y Ángel Jiménez Molina
Años: 2012
Universidad: Universidad de Chile.
Resumen: El presente trabajo resalta el rendimiento de las herramientas usadas
como MySql y Jasper para el almacenamiento y extracción de información, el
algoritmo usado para para obtener los resultados muy efectivos para la
problemática planteada, se resaltando el diseño de una arquitectura que permite
la extracción y alineamiento de los datos, además de su posterior carga en un
repositorio multidimensional.
Aporte: Se rescata el diseño arquitectónico para la herramienta software: Data
mart y que mediante éste; se lleva el control de los procesos, pudiendo por ello
trabajar con indicadores.
1.2.2. Nivel Nacional:
Título: “IMPLEMENTACIÓN DE UN DATAMART COMO UNA
SOLUCIÓN DE INTELIGENCIA DE NEGOCIOS PARA EL ÁREA DE
LOGÍSTICA DE T-IMPULSO”.
Autor: Julio Yalan Castillo y Luis Palomino Paniora.
Año: 2013
Universidad: Universidad Nacional Mayor de San Marcos.
Resumen: Se demostró que a través del proceso de extracción, transformación
y carga de data se obtiene un repositorio que permita la explotación eficiente de
la información, se redujo el tiempo para en la elaboración de reporte y ayuda en
la toma de decisiones con información relevante y oportuna.
Aporte: Contribuye en la metodología de trabajo ya que hace uso de una
arquitectura de manera multidimensional, la clasificación y tipos de Datamarts
nos das una perspectiva de cómo se podrían trabajar los indicadores.

Título: “MODELO DE MINERÍA DE DATOS USANDO MACHINE


LEARNING CON RECONOCIMIENTO DE PATRONES DE SÍNTOMAS Y
ENFERMEDADES RESPIRATORIAS EN LAS HISTORIAS CLÍNICAS
PARA MEJORAR EL DIAGNÓSTICO DE PACIENTES EN LA CIUDAD
DE TRUJILLO 2016”.
Autor: Sandra Zoraida Medrano Parado
Año: 2016
Universidad: Universidad Cesar Vallejo
Resumen: Con la solución planteada se logró reducir el tiempo de atención,
mejorando la efectividad para los diagnósticos a partir de síntomas y signos,
queda demostrado el aporte que la minería de datos brinda a la sociedad.
Aporte: Se rescatan métodos de aprendizaje automático asociados a algoritmos
de análisis predictivo u obtención de datos con reconocimiento de patrones de
síntomas, la metodología usada Crisp-DM. es pionera cuando se trata de
implementación de minería de datos.
1.2.3. Nivel Local:
Título: “APLICATIVO DATAMART Y LA AGILIZACIÓN DE LA TOMA
DE DECIONES EN EL DEPARTAMENTO DE FARMACIA DEL
HOSPITAL ELEAZAR GUZMÁN BARRÓN – NUEVO CHIMBOTE”.
Autor: Ángeles Pacheco, Vicente Miguel.
Universidad: Universidad Cesar Vallejo
Año: 2015
Resumen: Los resultados obtenidos al implementar un Datamart se logró
reducir los tiempos de búsqueda y elaboración de reportes para mejor la
satisfacción de los directivos en la toma de decisiones y de ésta manera tener
una visión holística.
Aporte: El uso de la metodología Ralph Kimball. es una de las usadas para
implementar soluciones de Business Inteligence, lo cual nos ayuda a definir la
orientación a propuesta planteada, el resto de arquitectura la mayoría coincide
con el modelo estrella, herramienta Olap, Etl y otra más.

Título: “IMPLEMENTACIÓN DE UN DATAMART PARA AGILIZAR LA


TOMA DE DECISIONES EN EL ÁREA DE SISTEMA INTEGRAL DE
SEGUROS DE LA RED DE SALUD PACÍFICO SUR NUEVO CHIMBOTE,
ANCASH”.
Autor: Vásquez Castañeda, Luis Ángel
Universidad: Universidad Cesar Vallejo
Año: 2017
Resumen: De acuerdo al resultado los objetivos planteados, como la reducción
de tiempo para la recopilación de datos, esto repercute en el nivel de satisfacción
de los directivos del SIS, se lograron al permitir tener información en menos
tiempo y de calidad y los más resaltante ayudo a reducir el costo de horas-
hombre empleadas para dicho proceso.
Aporte: La metodología empleada para aplicar un modelo multidimensional
de un Datamart, el modelo estrella utilizado es ideal por su simplicidad y
velocidad desde el punto de vista del usuario final.
1.3. Teorías Relacionadas al Tema
1.3.1. Proceso De Toma De Decisiones
Según (Robbins Stephen P, 2010) “En todos los niveles y áreas
organizacionales, “eligen entre dos o más alternativas, los individuos toman
decisiones. Pero no sólo deciden los gerentes. Realizan la toma de decisiones
en afección a sus puestos y la organización donde laboran, todos los integrantes
de una organización. ¿Cómo se realiza la toma de estas decisiones? Aunque una
elección entre alternativas es llamada toma de decisiones, la idea es demasiado
simplista; por lo tanto ¿En qué consiste el proceso de toma de decisiones?, en
la Figura 1, se ilustra el mismo, iniciando con la identificación de un problema
y los criterios de decisión y cómo ponderarlos; en seguida se pasa a trazar,
analizar y elegir una opción para resolver el problema, y para finalizar se evalúa
la eficacia de la decisión, esos son una serie de ocho etapas”.

Etapas para la toma de decisiones


Según (Davies, 2014) “Una de las principales actividades en la gestión es la
toma de decisiones, que es la actividad mediante la cual se decide qué acciones
son apropiadas en determinadas situaciones. La toma de decisiones depende de
la información, ya que ésta reduce la incertidumbre de este proceso.
La información son datos interpretados en algún contexto por una persona o
grupo concreto. Dado que la información depende de los datos, generalmente
se asume que una buena toma de decisiones depende de datos buenos.

Información Toma de Decisión


Acción
Decisiones

Proceso para la toma de decisiones

Organización
Entradas Salidas
Sistema de Actividad Humana

Entradas de
Control
Gestión

Flujo de proceso a la toma de decisiones


Los datos son relevantes para la decisión que se va a tomar deben ser
Relevantes.
Toma de Decisiones
Información
Inteligencia

Diseño

Elección

Implementación Decisión

Modelo de Toma de Decisiones


El modelo de toma de decisiones ilustrado en la figura anterior tiene varios
lazos explícitos de realimentación, lo que sugiere que la mayor parte de la toma
de decisiones es iterativa. Por ejemplo, en la fase de diseño se pueden plantear
nuevas cuestiones que requieran la recopilación de inteligencia adicional.
Racionalidad:
Los modelos clásicos de toma de decisiones asumen que es un proceso
racional. La toma de decisiones racional se caracteriza por las siguientes
propiedades:
 Inteligencia. Debe recopilar todos los datos relevantes e interpretarlos
con imparcialidad.
 Diseño. La persona que toma las decisiones debe identificar todas las
alternativas viables e identificar un conjunto explícito de criterios para
elegir entre ellos.
 Elección. La persona que toma las decisiones debería elegir entre las
diferentes alternativas basándose en una valoración sistemática,
utilizando ponderaciones explícitas de la importancia de cada criterio
principal.
Estudios recientes sobre toma de decisiones humana real revelan que en las
organizaciones la mayor parte de esta actividad diverge sustancialmente de su
ideal racional. Este hecho no es sorprendente cuando uno se da cuenta de que
la toma de decisiones racional requiere un tiempo ilimitado para tomar una
decisión, toda la información relevante para el problema, y un procesador de
información que se capaz de manejar toda la información y todas las
alternativas.
Por eso, la mayoría de los procesos de toma de decisiones humana se
presentan como la búsqueda de una solución satisfactoria, en lugar de
presentarse como un comportamiento racional. La toma de decisiones
satisfactoria describe cómo las personas toman decisiones en un tiempo
limitado, basándose en información limitada y con la capacidad limitada de
procesar información.
 Tiempo limitado. La mayor parte de la toma de decisiones para la
gestión debe realizarse en una cantidad de tiempo finita.
 Información limitada. En la mayoría de las situaciones factibles es
imposible recopilar todos los datos posiblemente significativos para el
problema por una limitación de recursos.
 Capacidad limitada de procesamiento de la información. El proceso de
toma de decisiones está restringido por las limitaciones humanas en el
procesamiento de información. Por ejemplo, la información se
interpreta y la interpretación humana está sujeta a influencias emotivas
no racionales. Además, los seres humanos tenemos limitaciones de
memoria a corto plazo. La mayoría de las personas únicamente pueden
manejar, por término medio, siete elementos de información al mismo
tiempo”.

Niveles de Gestión en el Proceso de Toma de Decisiones:

Según (Davies, 2014) “La toma de decisiones es una actividad


fundamental en la organización pudiendo identificar tres niveles de gestión:
gestión estratégica, gestión táctica y gestión operativa (Figura 5).

Estos tres niveles de gestión se pueden distinguir en base a las siguientes


dimensiones:

 Las características de la toma de decisiones. A medida que


ascendemos en la jerarquía de a gestión, los problemas y las
decisiones son menos estructuradas. Las decisiones estructuradas
frecuentemente se denominan decisiones algorítmicas, ya que se
puede representar e implementar un procedimiento explícito para
tomar dichas decisiones. Con frecuencia, las decisiones no
estructuradas se denominan decisiones heurísticas, puesto que no se
puede establecer ningún procedimiento, aunque se pueden sugerir
algunas “reglas generales” para abordar el problema.”
Horizonte Datos Problemas
temporal resumid no
Gestión os
lejano estructura
estratégi
ca
Gestión
táctica

Gestión
operativa

Horizonte Datos Problemas


temporal concreto estructura
cercano s dos
Niveles de Gestión en la toma de decisiones

 Las necesidades de datos. A medida que ascendemos en la jerarquía


de la gestión, las necesidades de datos resumidos y de datos relativos
al entorno exterior son mayores. La gestión operativa necesita datos
concretos de las actividades operativas de la organización. La
gestión estratégica necesita datos que resuman el funcionamiento de
la organización y la compare con sus competidores.
 El horizonte temporal. A medida que ascendemos en la jerarquía de
la gestión, mayor es el horizonte temporal de las decisiones y de la
información. Los directores operativos necesitan datos que les
ayuden a tomar decisiones hora a hora. Es más probable que los
directores estratégicos piensen en marcos temporales de meses y
años.
1.3.2. Minería de Datos:
Según (Torralbo, 2014) “es una disciplina parte de la informática se dedica a
estudiar el análisis de grandes cantidades de datos con objetivo de obtener
conocimiento a partir de ellos”.
Según (JORDI GIRONÉS ROIG, 2017) “un proyecto de minería de datos se
graficaría a continuación”
Proceso de KDD

1.3.3. Base Datos:


Según (Abraham Silberschatz, 2006), “Las bases de datos son diseñadas para
el almacenamiento estructurado de datos. Desde las más pequeñas aplicaciones
multiusuario, incluso los móviles y las agendas electrónicas hacen uso de
tecnología de bases de datos para aguardar la integridad de los datos y ahorrar
la labor tanto de usuarios como de los programadores que las desarrollaron. Se
delimita como un “conjunto de datos enlazados entre sí. Los conceptos
principales en esta definición son datos y relaciones. Una base de datos es un
conjunto de archivos enlazados que permite manipular la información de alguna
empresa. Este archivo puede ser visto como una colección de registros y cada
registro está compuesto por diferentes campos. Cada uno de los campos de cada
registro permite llevar información de algún atributo de una entidad del mundo
real”.
1.3.4. Metodologías:

Ralph Kimball:
Según (Matta Romualdo, 2017) “apunta principalmente en la delineación de
la base de datos, que servirá como repositorio a la información para la toma de
decisiones. La delineación se basa en la elaboración de tablas de hechos
conocidos como FACT que son tablas que agrupan la información numérica de
los indicadores a analizar, es decir la parte cuantitativa de la información.
Enfoque de la metodología de Kimball:
El modelo dimensional se inicia con tablas:
 De hechos
 De dimensiones
 Los hechos incluyen las métricas
 Las dimensiones incluyen los atributos
 Pueden incluir grupos de datos repetidos
 Los datos no están normalizados
 Accesible al usuario final.
La Metodología Kimball se enfoca en el Ciclo de Vida Dimensional del
Negocio o Business Dimensional Lifecycle, el cual está establecido por 4
principios básicos: Centrarse en el negocio, Construir una infraestructura de
información adecuada, realizar entregas en incrementales significativos, ofrecer
la solución completa.”
Ciclo de Vida de Negocio Dimensional de Ralph Kimball
CRISP-DM:
Según (JORDI GIRONÉS ROIG, 2017) “Veamos el siguiente esquema que
resume el objetivo de la metodología para minería de datos.

Fases de la Metodología Crisp-DM


RESULTADOS = MODELOS + DESCUBRIMIENTO

Es decir, el propósito de ésta metodología de minería de datos no son solo


plantear los diferentes modelos, que son por supuesto importantes , sino
también los descubrimientos, que podríamos definir como cualquier cosa aparte del
modelo que contribuye a alcanzar los objetivos de negocio o que contribuye a
plantear nuevas preguntas, que a su vez son decisivas para alcanzar los objetivos de
negocio.
Siempre y cuando sea posible, probaremos el modelo en un entorno de prueba
para asegurar de que el posterior proceso de despliegue se realiza satisfactoriamente
y asegurarnos también de que el modelo obtenido es capaz de dar respuesta a los
objetivos de negocio.
Estableceremos un ranquin de resultados a base de los criterios de éxito con
relación con el cumplimiento de los objetivos de negocio”

Técnica de minería de datos para el proyecto:

Regresión:

Al igual que la clasificación, la regresión es una tarea de aprendizaje inductivo


que ha sido ampliamente estudiada y utilizada. Se puede definir, de forma informal,
como un problema de clasificación con clases continuas. Es decir, los modelos de
regresión predicen valores numéricos en lugar de etiquetas de clase discretas. A
veces también nos podemos referir a la regresión como predicción numérica.
La tarea de regresión consiste en asignar valores numéricos a instancias de un
dominio dado, descritos por un conjunto de atributos discretos o de valor continuo.
Se supone que esta asignación se aproxima a alguna función objetivo, generalmente
desconocida, excepto para un subconjunto del dominio.
Este subconjunto se puede utilizar para crear el modelo de regresión.
En este caso, la función de regresión se puede definir como:
donde f representa la función de regresión, X el conjunto de atributos que forman
una instancia y R un valor en el dominio de los números reales.
Comparativa de metodologías:

Queda demostrado que, para el presente proyecto la metodología a utilizar es


KIMBALL y RUP ágil (AUP).
Comparativa de Metodologías

MYSQL:

Es un sistema de gestión de base de datos que tiene como principales objetivos


la rapidez y el volumen, es fácil y ligero que se adapta muy perfectamente a
ambientes en que la robustez de datos sea del orden de megabytes (en la
documentación habla de 50 millones de registros). La versión 5 de MySql se añadido
el control de procedimientos almacenados, transacciones y triggers, la cual se
diferencia de grandes SGBD como Oracle. (Piero Berni Millet, 2010)

Esto nos dice que cualquiera puede descargarlo de internet, y lo mejor es que
como es de código abierto esto quiere decir que cualquier programador puede
remodelar su código para mejorarlo. (Jorge Sánchez, 2003)

MySQL Server trabaja con arquitectura cliente servidor el servidor de datos


MySql Server es un sistema cliente/servidor que consiste en un servidor SQL,
programas y bibliotecas cliente, herramientas administrativas y una gran cantidad de
interfaces de programación para aplicaciones. (David Axmark y Michael Widenius,
2007)

En el último benchmark realizado de SGBD, se ha visto un gran crecimiento


en la potencia de MySQL, frente a sus competidores. (Piero Berni Millet, 2010)

FUENTE: Libro: Laboratorio de PHP y MySQL


Elaborado: Piero Bemi Millet

PHP:

Es un lenguaje introducido en páginas HTML. El código PHP se traduce en


el lado del servidor web, donde se ejecuta la página HTML solicitada antes de llevar
a cabo su transmisión al navegador. De esta forma se puede programar aplicaciones
asociadas al servidor web, aumentando así la funcionalidad de dicho servidor y
convirtiéndolo en un sistema de cliente/servidor mucho más completo. Su objetivo
principal es hacer que desarrolladores de aplicaciones basadas en web puedan escribir
páginas dinámicas de forma sencilla y rápida. (Piero Berni Millet, 2010)

Estructura interna de PHP

FUENTE: Libro: Laboratorio de PHP y MySQL


Elaborado: Piero Bemi Millet

PHP nos proporciona una gran facilidad para acceder a diferentes tipos de
bases de datos como Oracle, Sybase, MySql, etc. Es muy sencillo portar una
aplicación escrita con PHP para MySql a cualquier servidor de base de datos, ya que
las diferentes funciones de acceso que ofrece son en muchos casos, sin sintaxis
compartida (Piero Berni Millet, 2010)

Es un lenguaje para programar scripts del lado del servidor, que se incrustan
dentro del código HTML. Este lenguaje es gratuito y multiplataforma. PHP es el
acrónimo de Hipertext Preprocesor. Es un lenguaje de programación del lado del
servidor gratuito e independiente de plataforma, rápido, con una gran librería de
funciones y mucha documentación. (Álvarez, 2001).
ARQUITECTURA EN 3 CAPAS:

A continuación, se describen cada una de las 3 capas:

 Capa de presentación: Se encarga de la interacción con el usuario


mediante interfaces, en ella se realiza poco procesamiento ya que
envía las peticiones a la capa de lógica de negocios.
 Capa de lógica de negocios: Define toda la lógica del programa,
representa el corazón de la aplicación ya que se comunica con todas
las demás capas para llevar a cabo todas las tareas; a su vez, ésta se
comunica con la capa de datos.
 Capa de almacenamiento o capa de datos: Se encarga de la
interacción con el gestor de base de datos y otras fuentes de las cuales
se obtiene la información necesaria para el sistema; en esta capa se
definen las consultas o sentencias que se ejecutarán en la base de
datos. (Morales González, 2014).

Programación N capas

Fuente: (Instituto Tecnológico de Matehuala, 2015)


PROCESO DE SOFTWARE:

Un conjunto coherente de políticas, estructuras organizativas, tecnologías,


procedimientos y artefactos necesitándose concebir, desarrollar, implantar y
mantener un producto o software es un Proceso de Software. (Sicilia, y otros, 2011).

Un proyecto es un esfuerzo llevándose a cabo una sola vez, teniendo así los
objetivos ya definidos y produciéndose dentro de un plazo determinado (Sicilia, y
otros, 2011).

Un proyecto de Ingeniería del Software es un proyecto con la meta de obtener


un producto de software que satisfaga ciertos requisitos, en el plazo previsto dentro
del presupuesto (Sicilia, y otros, 2011).

Es el periodo de tiempo, el ciclo de vida de un desarrollo de software, empieza


con la toma la decisión de desarrollo de un producto de software y concluye con la
entrega del software (Sicilia, y otros, 2011).

SISTEMA DE APOYO A LA TOMA DE DECISIONES:

Sistema de Apoyo a la Toma de decisiones

Fuente: (Cohen Karen, y otros, 2014,2009,2004,2000)


TIPOS DE SISTEMA DE APOYO A LAS DECISIONES

SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES (DSS)

En una organización, como una serie de datos con múltiples


dimensiones, jerarquías y relaciones es percibido por la información, como,
por ejemplo, los datos de inventarios, las ventas y las compras están
dependientes entre sí y relacionados. El análisis multidimensional para
facilitar la consulta y el análisis de los datos deben ser incluidos por los DSS.
Desde diferentes variables organizacionales y perspectivas, la información
puede ser consultada. De modo lógico sus datos en arreglos utilizando el
concepto llamado “cubo”, están relacionados los almacenes
multidimensionales. (Cohen Karen, y otros, 2014, 2009, 2004, 2000).

SISTEMAS DE APOYO A EJECUTIVOS:

John Rockart es uno de los autores en el tema de los sistemas de


información para ejecutivos, quién considera que el monitoreo y seguimiento
es permitido por el objetivo fundamental de este tipo de sistemas, por parte
del ejecutivo, de los factores de éxito del negocio. (Cohen Karen, y otros,
2014, 2009, 2004, 2000)

Así, entre otros, La comercialización de productos para ferreterías


tienen los siguientes factores críticos del éxito de una empresa:

 La prueba ácida.
 Días venta de cartera.
 Días venta de inventario.
 Niveles de ventas en cada una de las zonas geográficas.
 Monto de cartera o cuenta por cobrar vencidas.
 Rentabilidad del negocio (Cohen Karen, y otros, 2014,2004, 2000).
METODOLOGÍA DEL PRESENTE PROYECTO APLICA KIMBALL
LIFECYCLE (KLC):

Según (Rivadeneira, 2010) La metodología se basa en lo que Kimball denomina


Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle) (Kimball
et al 98, 08, Mundy & Thornthwaite 06). Este ciclo de vida del proyecto de DW,
está basado en cuatro principios básicos:
 Centrarse en el negocio: Hay que concentrarse en la identificación de los
requerimientos del negocio y su valor asociado, y usar estos esfuerzos para
desarrollar relaciones sólidas con el negocio, agudizando el análisis del
mismo y la competencia consultiva de los implementadores.
 Construir una infraestructura de información adecuada: Diseñar una base de
información única, integrada, fácil de usar, de alto rendimiento donde se
reflejará la amplia gama de requerimientos de negocio identificados en la
empresa.
 Realizar entregas en incrementos significativos: crear el almacén de datos
(DW) en incrementos entregables en plazos. Hay que usa el valor de negocio
de cada elemento identificado para determinar el orden de aplicación de los
incrementos. En esto la metodología se parece a las metodologías ágiles de
construcción de software.
 Ofrecer la solución completa: proporcionar todos los elementos necesarios
para entregar valor a los usuarios de negocios. Para comenzar, esto significa
tener un almacén de datos sólido, bien diseñado, con calidad probada, y
accesible. También se deberá entregar herramientas de consulta ad hoc,
aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio
web y documentación.
 La construcción de una solución de DW/BI (Datawarehouse/Business
Intelligence) es sumamente compleja, y Kimball nos propone una
metodología que nos ayuda a simplificar esa complejidad. Las tareas de esta
metodología (ciclo de vida) se muestra la figura 1.

Fig. 1: Tareas de la metodología de Kimball, denominada Business


Dimensional Lifecycle (Kimball et al 98, 08, Mundy & Thornthwaite 06)

La metodología de Kimball nos indica que un conglomerado de los Data Marts


dentro de una empresa es considerado un Data Warehouse, siendo de una forma
especial para el análisis, una copia de los datos transaccionales, de acuerdo, en las
dimensiones de análisis y sus atributos, su organización jerárquica, así también los
diferentes hechos de negocio que se quieren analizar son incluidos al modelo
dimensional (no normalizado). Por un lado, tenemos tablas para los hechos (las facts
tablas) y, por otro lado, tablas para representar las dimensiones. Los elementos
anteriormente citados a través de las dimensiones conformada son contenidos en
los diferentes Data Marts están conectados entre sí, por la llamada bus structure
(pues este bus contiene los elementos en común que los comunican pues permiten
que los usuarios puedan realizar querys conjuntos sobre los diferentes Data Marts).
Puede ser, por ejemplo, la dimensión cliente, que contienen todos los atributos o
elementos de análisis referentes a los clientes y es compartida por diferentes Data
Marts (ventas, pedidos, gestión de cobros, etc.) que conforma una dimensión.
Al final el Data W arehouse Corporativo no es más que la unión de los diferentes
Data Marts, pues este enfoque también se referencia como Bottom-up, que están
estructurados de una forma común, a través del bus structure. Ser flexible y sencillo
de implementar permite esta característica, pues como primer elemento del sistema
de análisis podemos construir una Data Mart, y luego que comparten las
dimensiones, ir añadiendo otros. En este sistema, la información de los sistemas
operacionales y los procesan en el Data Stage son extraídos por los procesos ETL,
realizando posteriormente, respetando los estándares de las dimensiones
(dimensiones conformadas), el llenado de cada uno de los Data Mart de manera
individual.

Esta metodología presenta para el desarrollo, las siguientes etapas:


Etapas de la Metodología Ralph Kimball
Fuente: (Ralph Kimball, 2002)

Planificación del Proyecto


La planificación realiza el alcance del proyecto y la identificación de la
definición, también evaluaciones de factibilidad y justificaciones del negocio.

Sobre los recursos, los perfiles, las tareas, las duraciones y la secuencialidad,
es focalizada por la planificación del proyecto. Todas las tareas y las áreas
involucradas son identificadas por el plan de proyecto resultante.

Sobre la definición del proyecto (identificación del escenario del proyecto para saber
de dónde surge la necesidad del Data Warehouse) es desarrollado por esta etapa.
Según sentencia Kimball, “Antes de comenzar si existe la demanda y de dónde
proviene, si se tiene que se debe estar seguro.

Si no hay usuarios entusiasmados y no se tiene un sólido usuario sponsor, posponga


el proyecto”. Convincentes motivaciones del negocio, identificación de los usuarios
sponsors, cooperación entre áreas de negocios y de sistemas, análisis de factibilidad
(tanto tecnológica como de disponibilidad de datos) y análisis de la cultura de la
organización son factores asociados con estas etapas (Ralph Kimball, 2002).
Definición de Requerimientos del Negocio
La correcta interpretación de los niveles diferentes de requerimientos
expresados por los niveles diferentes de usuarios es un factor determinante en el
éxito de un proceso de Data Warehousing.
El enfoque tradicional guiado por los datos es diferido por la técnica utilizada
para relevar los requerimientos de los analistas del negocio. Los factores claves que
guían al negocio para determinar y traducirlos en consideraciones apropiadas de
diseño y los requerimientos efectivamente, deben ser entendidos por los diseñadores
de los Data Warehouses.
Las implementaciones realizadas de un Data Warehouse siempre son
impactadas por los usuarios y sus requerimientos finales. Según la perspectiva de
Kimball, En el centro del “universo del Data Warehouse” son posicionados por los
requerimientos del negocio. Como destaca siempre Kimball, el alcance del Data
Warehouse son determinados por los requerimientos del negocio (cómo debe estar
organizado, qué datos debe contener, quiénes y desde dónde accederán, cada cuánto
debe actualizarse, etc) (Ralph Kimball, 2002).

Modelado Dimensional

Un proceso dinámico y altamente iterativo es la creación de un modelo


dimensional.
Con un modelo dimensional es iniciado por el proceso de diseño de alto nivel
obtenido de la matriz de requerimientos, a partir de los procesos en prioridad.
El proceso iterativo consiste en cuatro pasos:
 Elegir el proceso del negocio: elegir el área a modelar es considerado
el primer paso. Depende del análisis de requerimientos y es
una decisión de la dirección y de los temas de análisis anotados en la
etapa anterior.
 Establecer el nivel de granularidad: es decir, el nivel de detalle
especificado. A los requerimientos del negocio, la elección de
la granularidad están de acuerdo y lo que es posible a partir de los
datos actuales. El DW al mayor detalle posible es la sugerencia
general al empezar a diseñar, esto al nivel deseado, se podría luego
realizar agrupamientos.
 Elegir las dimensiones: surgen naturalmente de las discusiones del
equipo, y facilitadas por de la matriz de procesos/dimensión y la
elección del nivel de granularidad. Uno conjunto de atributos son
obtenidos por las tablas de dimensiones sobre una medida en una tabla
hechos, que brindan una perspectiva o forma analítica.
 Identificar las tablas de he ch o s y m e d id a s: En identificar las
medidas que surgen de los procesos del negocio en eso consiste el
último paso. Es una medida, se agrupa usando los criterios de corte
conocidos como dimensión, sus datos en eso consiste un atributo
(campo) de una tabla que desea analizar. Las medidas se encuentran
en tablas que llamamos tablas de hechos y

Se vinculan con el nivel de granularidad. Como atributo una o más


medidas de un proceso organizacional tiene cada tabla de hechos con relación
a los requerimientos (Ralph Kimball, 2002).

Diseño Físico
Para soportar el diseño lógico, Se realiza sobre la selección de las
necesarias estructuras. La definición de convenciones de nombres estándares
y seteos específicos del ambiente de la base de datos son algunos de los
elementos principales de este proceso (Ralph Kimball, 2002).

Diseño e Implementación del subsistema de Extracción, Transformación


y Carga (ETL)
La más subestimada de las tareas en un proyecto de Data Warehouse
es esta etapa. La extracción, la transformación y la carga son las principales
sub etapas de esta zona del ciclo de vida. Aquellos requeridos para obtener
los datos, es un proceso de extracción que se permiten efectuar, en acuerdo,
la carga del modelo físico.
También el convertir o recodificar los datos fuente, se definen como
proceso de transformación, pudiendo efectuar del modelo físico, la carga
efectiva. Por otra parte, los requeridos para la población de la Data Warehouse
son los procesos de carga de datos.
Pues tienen que ver con la materia prima de la Data Warehouse, todas
estas tareas son críticas altamente, los datos. Si el usuario choco con la
información inconsistente entonces la pérdida de credibilidad y la
desconfianza de la Data Warehouse será inmediatamente resultados e
inevitables. Es por ello, un factor en determinación en el éxito de un proyecto
de Data Warehousing es la calidad de los datos. Es allí donde con la calidad
de los datos fuente, deben sanearse todos los inconvenientes relacionados.
Como advierte Kimball, el iceberg de un proyecto de Data
Warehousing es el proceso de Data Staging. Para lograr datos de alta calidad
de los sistemas fuentes, son muchos los desafíos que se enfrentan. En general,
que termina tomando más tiempo del previsto siempre, es una de las etapas
más subestimadas (Ralph Kimball, 2002).
Selección del producto e Implementación
Se evalúa y selecciona los componentes específicos de la arquitectura
utilizando como marco el diseño de arquitectura técnica como ser la
plataforma de hardware, el motor de BD, la herramienta de ETL o el
desarrollo pertinente, herramientas de acceso, etc.
Después, a instalar y probar de los mismos en un ambiente integrado
de Data Warehousing son procedidos por los componentes determinados
(Ralph Kimball, 2002).
Mantenimiento y Crecimiento del Data Warehouse
Un proceso (etapas ya definidas, con comienzo y fin, pero de naturaleza
espiral) es el Data Warehousing, pues durante toda su historia, acompaña a la
evolución de la organización. Para poder seguir la evolución de las metas por
conseguir, se continúa con los relevamientos. “la Data Warehouse está
preparado para evolución y crecimiento, si se ha utilizado el ciclo de vida
dimensional del negocio” según, afirma Kimball. Al contrario de los sistemas
tradicionales, como signos de éxito y no de falla, los cambios en el desarrollo
son vistos. Para manejar los nuevos requerimientos de los usuarios, es
importante priorizar y de esa forma crecer y evolucionar (Ralph Kimball,
2002).
Especificación de aplicaciones de BI
Necesitan el mismo nivel de análisis no todos los usuarios del Data
Warehouse. para la determinación de los diferentes tipos de aplicaciones, Es
por ello, que en esta etapa se identifican los diferentes roles o perfiles de
usuarios, sobre la base al alcance de los diferentes perfiles (analista del
negocio, gerencial, vendedor, etc.)
Sobre el proceso de creación de aplicaciones “templates”,
Kimball se concentra. Se empieza definiendo para el usuario final, su rol
en el acceso a la información del negocio y el concepto de la aplicación. En
lo que a desarrollo de aplicaciones se refiere, brinda un marco metodológico
bastante estándar. Para usuarios finales en dos grandes fases, se divide el
proceso de crear las aplicaciones: desarrollo y especificidad. Así tenemos,
usuarios con perfil más estratégico y menos predecibles (power users),
clasifica a los usuarios según su perfil de consulta, otra de las clases pasando
por los usuarios gerenciales con uso de interfaces push- button, son los
usuarios netamente operacionales consumidores de una serie de reportes
estándares (final users) (Ralph Kimball, 2002).

Diseño de la Arquitectura Técnica


Para de esta forma poder establecer el diseño de la arquitectura técnica
del ambiente de Data Warehousing; de numerosas tecnologías, la integración
es requerida por los ambientes de Data Warehousing. Se debe tener en cuenta
tres factores: los actuales ambientes técnicos, los requerimientos del negocio
y las directrices técnicas estratégicas futuras planificadas (Ralph Kimball,
2002).
Sirven para comunicar los deseos entre los clientes y el arquitecto, del
mismo modo, que, en una construcción, los planos, como así también
materiales necesarios y medir esfuerzo (flexibilidad y mantenimiento,
comunicación, documentación, planificación, rehúso y productividad). “Nos
ayudara cuando sea tiempo de hacer incorporaciones o remodelar, Un buen
conjunto de planos” finalmente, argumenta Kimball. (Ralph Kimball,
2002).
1.4. Formulación al Problema
¿De qué manera el desarrollo de un Sistema de soporte a la Planificación utilizando
minería de datos mejorara la eficiencia del proceso de toma de decisiones en el área
de control de la producción de Camposol S.A.?
1.5. Justificación del Estudio:
1.5.1. Justificación Valor Teórico:
El proyecto permite investigar técnicas innovadoras de minería de datos
orientada al proceso de toma de decisiones.
1.5.2. Justificación Conveniencia:
El proyecto es conveniente en la medida que permite aportar académico-
profesionalmente a partir de la integración de las diferentes asignaturas llevadas
en la carrera profesional por medio de un producto software.
1.5.3. Justificación Implicancias prácticas:
La Empresa cuenta herramientas de hardware (servidor, computadores),
para disponibilidad (laptops y computadoras de escritorio) del fin que se
persigue y en cuanto al software se utilizará tipo Licenciado y Open Source
(Java), que facilita la ejecución del proyecto, siendo favorable para el
proyecto y la empresa.
1.5.4. Justificación con Relevancia Social:
Se incrementa la satisfacción del personal administrativo del PCP, al hacer el
uso del Software, ya que cumple con todos los requerimientos y expectativas
laborales.
1.5.5. Justificación Utilidad metodológica:
Es de gran beneficio porque, a través del presente proyecto se permite
investigar metodologías validadas y probadas en escenarios diferentes y en
ésta oportunidad traerlo al campo de la Agroindustria.
1.6. Hipótesis
¿El Sistema de soporte a la Planificación utilizando minería de datos mejorará
significativamente la eficiencia del proceso de toma de decisiones en el área de
control de la producción de Camposol S.A.?
1.7. Objetivos
1.7.1. General:
Mejorar la eficiencia del proceso de toma de decisiones en el área de control
de la producción en Camposol S.A. mediante un Sistema de soporte a la
planificación usando minería de datos.
1.7.2. Específicos:
 Determinar el Tiempo promedio para obtener el Plan productivo y de
Trabajo por parte de los Usuarios(PCP).
 Determinar el Tiempo promedio para que los usuarios finales determinen
especificaciones técnicas del PCP.
 Determinar el Tiempo promedio de demora, del usuario para predecir y
programar el PPDD.
 Determinar el Nivel de satisfacción del usuario.
II. MÉTODO
2.1. Diseño de Investigación
2.1.1. Investigación Aplicada:
La investigación a realizar se pone en práctica los conocimientos adquiridos
a lo largo de la carrera.

2.1.2. Tipo de Investigación:


Experimental, porque se controla las variables, se aplicarán métodos: Pre-
Test y Post-Test, también llamada método de sucesión o en línea, con el fin de
contrastar la hipótesis.
2.2. Variables, Operacionalización
2.2.1. Variable Independiente:
Sistema de Soporte a la Planificación usando minería de datos.
2.2.2. Variable Dependiente:
Mejorar la eficiencia del proceso de toma de decisiones en el área de control de
la producción en Camposol S.A.
Proceso de toma de decisiones del área de control de la producción en
CAMPOSOL S.A.
2.2.3. Escalas de Medición en la Operacionalización de Variables
Escala de Razón:
Los datos de razón son de valor numérico, por ejemplo: distancia, la altura, el
peso y el tiempo se miden con una escala de razón.
a) Tiempo promedio para obtener el Plan productivo y de Trabajo.
b) Tiempo promedio para especificaciones técnicas. Ej. Tiempo promedio
de pedidos que podemos empacar de acuerdo a las prioridades del
Cliente. Tiempo promedio para predecir y programar. Ej. Tiempo para
programar que cantidad de contenedores a salir según pedido del cliente.
2.2.4. Operacionalización
Tabla 1: Operacionalización de Variables
Identificación Definición Definición Escala de
Indicadores
de variables conceptual operacional medición
Sistema de El Sistema nos
Información para permitirá gestionar
ayudar en la Toma y solucionar los
Sistema de de decisiones problemas Interacción con el
Soporte a la estratégicas de alto ocurridos en el área Usuario. Ordinal
Planificación. nivel en las de PCP.
organizaciones.
(Beynon-Davies,
2014)
Proceso que consiste En el proceso de Tiempo promedio
en elegir la acción producción se para obtener el Plan
adecuada en una obtendrá productivo y de
situación adecuada. resultados en las trabajo por parte de
(Beynon-Davies, que se podrá los usuarios.
2014) mejorar el tiempo
en obtener el plan Tiempo promedio
Eficiencia del
productivo, las para que los usuarios De Razón
Proceso de
especificaciones finales determinen
toma de
técnicas, predecir y especificaciones
Decisiones.
programar el plan técnicas del PCP.
de producción de Tiempo promedio de
despachos diario demora, del usuario
(PPDD) para predecir y
programar el PPDD.
Nivel de satisfacción Ordinal
del usuario.
Fuente: Se elabora a partir del presente trabajo.
Elaboración: Propia
Tabla 2: Indicadores
Técnica / Tiemplo
Nº- Indicador Descripción Objetivo Modelo de Cálculo
Instrumento Empleado
Tiempo promedio ∑𝑛𝑖=1(𝑇𝑀𝑃𝐶𝑃)𝑖
Determinar el TPMPCP =
para obtener Plan Reducir el tiempo de Medición del 𝑛
tiempo promedio
1 productivo y de elaboración de tiempo con Diario TPMPCP: Tiempo promedio para obtener el Plan
para obtener la
Trabajo. matriz. cronómetro productivo y de Trabajo por parte de los Usuarios.
matriz del PCP.
(TPMPCP) n: cantidad de usuarios.
∑𝑛𝑖=1(𝑇𝐸𝑇)𝑖
Determinar el TPET =
Tiempo promedio 𝑛
tiempo promedio TPET: Tiempo promedio para que los usuarios finales
para analizar Disminuir el tiempo Medición de
para analizar determinen especificaciones técnicas del PCP.
2 especificaciones en para analizar tiempo con Diario
especificaciones TEF: Tiempo para que los usuarios finales determinen
técnicas especificaciones cronómetro
técnicas del Plan especificaciones técnicas del PCP.
(TPET)
de Trabajo n: cantidad de usuarios.

∑𝑛𝑖=1(𝑇𝐺𝑅)𝑖
Determinar el TPGR =
Tiempo promedio 𝑛
tiempo promedio Reducir el tiempo Medición de TPPP: Tiempo promedio de demora, del usuario para
para predecir y
3 para predecir y para predecir y tiempo con Diario predecir y programar el PPDD.
programar.
programar programar. cronómetro TGR: Tiempo de demora, del usuario para predecir y
(TPPP)
reportes. programar el PPDD.
n: cantidad de usuarios.
∑𝑛𝑖=1(𝑆𝑈)𝑖
Nivel de Determinar el Incrementar el nivel NSC =
satisfacción del nivel de de satisfacción del 𝑛
4 Encuesta Semanal NSC: Nivel de satisfacción del usuario
usuario. satisfacción del usuario del PCP en la
SC: Satisfacción del usuario
(NSU) usuario empresa.
n: cantidad de usuarios
Fuente: Se elabora a partir del presente trabajo
2.3. Población y Muestra
2.3.1. Población:
La población está formada por los usuarios del PCP de la Empresa.
2.3.2. Muestra:
Son 05 los usuarios finales del Proyecto.
2.4. Técnicas e Instrumentos de Recolección de Datos, Validez y Confiabilidad

2.4.1. Técnicas e Instrumentos de Recolección de Datos

TÉCNICA INSTRUMENTO INFORMANTES


Usuarios de Planificación y
Encuesta Cuestionario
Control de la Producción.
Ficha de recolección de Usuarios de Planificación y
Observación
datos (Cronómetro) Control de la Producción.
Técnica e Instrumento de Recolección de Datos – Problemática

INDICADOR TÉCNICA INSTRUMENTO


Cumple con los requerimientos Registro de la(s) interacciones
Cronómetro
funcionales del Software con el Usuario.
Tiempo promedio para obtener Registro del tiempo de
Cronómetro
Plan productivo y de Trabajo. elaboración de la matriz PCP.
Registro del tiempo para analizar
Tiempo promedio para analizar
Cronómetro especificaciones técnicas del
especificaciones técnicas.
Plan de Trabajo.
Tiempo promedio para predecir y Registro del tiempo para
Cronómetro
programar. predecir y programar reportes.
Nivel de satisfacción del usuario. Encuesta Cuestionario.
Técnica e Instrumento de Recolección de Datos - Indicadores

La recolección de datos se hará uso de la encuesta y la Guía de observación:


Validez y Confiabilidad del Instrumento.

 Juicio de experto.

Se realizarán encuestas a expertos del tema que se desarrolla para dar validez a los
instrumentos que se utilizarán en el desarrollo del proyecto de investigación.

 Alpha de Cron Bach.

Se utilizará esta herramienta para medir la confiabilidad de las encuestas que se


aplicaran a los empleados.

Sin embargo, hay que tener en cuenta lo siguiente:

a) Para población(N) desconocida.

Ecuación 1: Muestra para Población Desconocida

𝑧 2 𝑝𝑞
𝑛=
𝐸2

Donde:

n=tamaño de la muestra
z: 1.96 (95% de confianza) Distribución Normal.
p: Proporción de positivos (0.5)
q: Proporción de negativos (0.5)
E: Precisión de la Estimación

b) Para la Población(N) Conocida.

Ecuación 2: Muestra para Población Conocida

𝑁𝑧 2 𝑝𝑞
𝑛=
(𝑁 − 1)𝐸 2 + 𝑍 2 𝑝𝑞

Donde:

N: Tamaño de la Población.
n: Tamaño de la Muestra.
z: 1.96(95% de confianza) Distribución Normal
p: Probabilidad de Éxito (0.5).
q: Probabilidad de Fracaso (0.5).
E: Error máximo que se tolera en las mediciones (0.05)

c) Para Ajustar la Muestra (n’)

Ecuación 3: Ajuste de Muestra

𝑛
𝑛′ = 𝑛
1+𝑁

Donde:

n’: Valor de Muestra Ajena.


n: Valor de la Muestra Estimada.
N: Población Muestral.

Nota: Se aplica cuando se conoce la población (n) y si n >32 caso contrario no se


ajusta es decir si n ≤ 32.

Métodos de análisis de datos.

Para el análisis estadístico de los resultados se aplicará las siguientes formulas


estadísticas:

Ecuación 4: Desviación Estándar.

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆= √
𝑛−1

Ecuación 5: Media Aritmética.

∑𝑛𝑖=1 𝑋𝑖
̅
𝑋= √
𝑛

Ecuación 6: Varianza.

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1

Para el procesamiento y análisis de datos antes y después de la aplicación del estímulo


se utilizará la distribución de T-Student.

Aspectos éticos.
 Veracidad: La información usada en este proyecto de investigación fue citada con
autenticidad, respetando propiedad intelectual a lo largo de su desarrollo.

 Respeto a la autonomía: Las personas que participaron al aplicar los instrumentos


de evaluación dieron consentimiento para participar en estas.
III. RESULTADOS
Cronograma de Ejecución del Proyecto
MODELO DE DESARROLLO DE METODOLOGÍA KLC

Elaboración propia

METODOLOGÍA AUP (RUP ÁGIL):

DEFINICIÓN DE LOS REQUERIMIENTOS FUNCIONALES:

Dif. = Dificultad Pri. = Prioridad


Valor Descripción Valor Descripción
1 Alta 1 Alta
2 Media 2 Media
3 Baja 3 Baja

Requerimientos Funcionales
Nº Descripción Dif. Pri.
1 El Sistema permitirá crear una cuenta de usuario. 2 3
2 El Sistema permitirá el ingreso mediante usuario y contraseña. 2 2
3 El Sistema permitirá actualizar información del usuario autenticado. 2 3
4 El Sistema permitirá determinar la prioridad acerca de los pedidos por día. 1 1
El Sistema permitirá determinar el porcentaje de desviación del proyectados vs
5 1 1
real por fecha.
El sistema permitirá mostrar el listado de contenedores a empacar según el
6 3 2
proyectado por día.
El Sistema permitirá consultar que es lo que se necesita producir por día según
7 3 2
Gerencia de Operaciones.
El Sistema permitirá determinar del plan diario, toma de datos de campo o 2 1
8
ajuste.
El Sistema permitirá listar el historial de proyección de campo de las semanas 3 2
9
anteriores.
El Sistema permitirá compartir el historial con las distintas fuentes 3 3
10
dimensionales.
11 El Sistema permitirá listar el volumen de producción por determinado tiempo. 3 3
12 El Sistema permitirá mostrar las prioridades de campo en determinado tiempo. 1 2
13 El Sistema permitirá mostrar las fechas de zarpe y despacho de planta 2 2
El sistema permitirá mostrar la fecha de llegada del material necesaria para 3 3
14
atender determinado destino.
El sistema permitirá mostrar el listado de contenedores a empacar por día; de 3 3
15
acuerdo a las restricciones de ( TT, plazos máximos de entrega del fcl)
El Sistema permitirá mostrar que pedidos son retail (composición exacta) y que 3 3
16
pedidos son spots; además de ver su avance y % de cumplimiento día a día
El sistema listará que viajes no se llegaron a completar y ya estaban 3 3
17
programados para despacho.
El sistema llevara un histórico del cumplimiento del % de cumplimiento de los 3 3
18 viajes cumplidos tanto en retails como de spots ( tanto en volumen como en cada
una de las variables de cada cultivo ( color, categoría, calibre)
19 El sistema permitirá mostrar el plan de eficiencia operativa. 3 3

OBJETIVOS DEL NEGOCIO SEGÚN AUP

Mejorar la Eficiencia del Proceso de Toma de


Decisiones

Construir los Mantenedores Preparar la matríz PCP Elaborar Plan de Eficiencia Operativa
IV. DISCUSIÓN

V. CONCLUSIONES

VI. RECOMENDACIONES

REFERENCIAS

ANEXOS

S-ar putea să vă placă și