Documente Academic
Documente Profesional
Documente Cultură
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
RESUMEN:
Pag. 1 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
ABSTRACT:
The need of companies to know their current situation, the factors that influence the
performance of their operations and therefore the fulfillment of their goals, has led to
the use of different methods, techniques and strategies that enable the improvement
or optimization of their processes, obtaining quality products to satisfy their
customers and obtain greater profitability and profit. At present, Data Science,
Business Intelligence and Data Mining are technologies for data analysis, with a
focus on decision making, in different areas, be they commercial, financial,
productive, administrative and others. The purpose of this paper is to implement a
business intelligence and data mining solution in a web environment focused on the
analysis of the main key performance indicators (KPIs) of production and sales
processes of a poultry company located in the canton Pasaje - El Oro - Ecuador. The
web application named IncuAnalytic was implemented according to the CRISP-DM
methodology and through the use of the tools: Postgres SQL for the data warehouse,
Pentaho BI Server for multidimensional descriptive analysis OLAP and the design of
a Dashboard, the R + Shiny language for the implementation of basic statistics and
predictive models of production using data mining techniques: regression (linear,
quadratic, cubic and exponential) and time series. From the results obtained it is
possible to emphasize that the administrator or owner of the company can make use
of IncuAnalytic to obtain in a fast and timely way information related to the productive
process of his business and that is useful for the making of decisions and to make
predictions.
1.- Introducción
En los últimos años, las empresas han formulado estrategias de negocios que les
facilita la toma de decisiones basadas en la evaluación de datos históricos de sus
procesos y mediante la identificación de sus KPI’s. Los datos en crudo proveniente
de varias fuentes son extraídos, transformados y cargados (ETL) en un nuevo
almacén de datos (DW: Data warehouse) organizado a su vez en temas (data marts)
(Mazón et al., 2017), para luego mediante técnicas de análisis acceder al DW y
visualizar la información relevante, oportuna y en forma consolidada (Astriani &
Trisminingsih, 2016; Jevgeni, Eduard, & Roman, 2015; Lindberg, Tan, Yan, & Starfelt,
Pag. 2 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
2015; Longo, Giacovelli, & Bochicchio, 2014; Meier, Lagemann, Morlock, &
Rathmann, 2013).
La minería de datos (DM: Data Mining), también ofrece distintas estrategias para la
obtención del conocimiento de bases de datos (KDD), aplicando técnicas de análisis
para la detección de patrones ocultos, asociaciones, clasificaciones o diagnósticos,
apoyándose en disciplinas como: Matemática, Estadística, Inteligencia Artificial y el
aprendizaje automático (Machine Learning) (Femina & Sudheep, 2015; Hamrouni,
Slimani, & Ben Charrada, 2015; Jothi, Rashid, & Husain, 2015); DM también es
considerada como el paso más importante en el proceso de descubrimiento de
conocimiento potencialmente útil y comprensible basado en los datos para
establecer modelos tanto predictivos como descriptivos. (Jothi et al., 2015;
Kavakiotis et al., 2017; Upadhyay, Sharma, Sharma, Bharadwaj, & Seeja, 2016). Un
modelo descriptivo generalmente no supervisado se enfoca en la búsqueda de
patrones que describen los datos que pueden ser interpretados normalmente por los
individuos, por otra parte, los modelos predictivos aplican funciones de aprendizaje
supervisado para predecir valores desconocidos o futuros a partir de variables de
interés. Los algoritmos y modelos de minería de datos pueden elaborarse en
diferentes herramientas y lenguajes tales como: R, Python, Weka, Minitab,
RapidMiner, etc. Sin embargo, existen aplicaciones BI que posibilitan la ejecución de
dichas técnicas mediante la adaptación de pluggins tal es el caso de Pentaho, Qlick,
Power BI, Tableau, entre otras.
Pag. 3 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Pag. 4 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Pag. 5 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
C) Preparación de Datos
En esta fase realiza el proceso ETL, mediante el cual se los extrae desde los
sistemas de origen hacia el DW, del que solo se seleccionaron datos significativos
para la aplicación de las técnicas de BI y Data Mining. Luego se preparan los datos a
las técnicas de Data Mining que se van a emplear.
Pag. 6 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Pag. 7 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Tipo de
Fórmula
Regresión
Lineal y=a+bx
Cuadrático y=a+bx+ cx 2
2 3
Cúbico y=a+bx+ cx + dx
R2 ≥ 0.95 Eficiente
2 2
R ≥ 0.85∧R ≥ 0.94 Bueno
R2 ≥ 0.70∧R2 ≥ 0.84 Regular
2
R <0.7 No aceptable
Por otra parte, para la evaluación de P-valor se consideró un nivel de confianza del
95% (0.95) y un grado de error del 5% (0.05).
Pag. 8 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
3.1.- Resultados
Pag. 9 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Tipo de R2 P_valor
Regresión
Lineal 0.887 8.03 e-14
Cuadrático 0.892 8.104 e-13
Cúbico 0.893 8.776 e-12
Logarítmica 0.7968 1.734 e-10
En Fig. 4 se presentan las gráficas de cada uno de los modelos evaluados con su
respectivo factor de correlación (R2) y su línea de tendencia:
Pag. 10 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Pag. 11 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Fig. 6: Datos pronosticados de las producciones de aves en su etapa inicial para dos
años.
En lo que respecta al modelo predictivo para ventas según periodo, en las Fig. 7 y 8
se muestran las ventas reales y el pronóstico obtenido al predecir las ventas en 2
años (2017 y 2018) en base a la técnica de series temporales. En la gráfica las
líneas continuas representan datos reales históricos y las líneas entre cortadas
representan la predicción.
3.2.- Discusión
Pag. 12 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
4.- Conclusiones
Pag. 13 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
Pag. 14 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec
Para publicar en:
Revista* ( )
*Alternativas o Cumbres
Memorias* ( )
*Con ISBN
http://doi.org/10.1016/j.egypro.2015.07.474
Longo, A., Giacovelli, S., & Bochicchio, M. A. (2014). Fact - Centered ETL: A
Proposal for Speeding Business Analytics up. Procedia Technology, 16, 471–
480. http://doi.org/10.1016/j.protcy.2014.10.114
Mazón, B., Rivas, W., Pinta, M., Mosquera, A., Astudillo, L., & Gallegos, H. (2017).
Dashboard para el soporte de decisiones en una empresa del sector minero.
Conference Proceedings - Universidad Técnica de Machala, 1, 1218–1229.
Retrieved from
http://investigacion.utmachala.edu.ec/proceedings/index.php/utmach/article/view
/219/191
Meier, H., Lagemann, H., Morlock, F., & Rathmann, C. (2013). Key performance
indicators for assessing the planning and delivery of industrial services. Procedia
CIRP, 11, 99–104. http://doi.org/10.1016/j.procir.2013.07.056
Ng, A. H. C., Bandaru, S., & Frantz??n, M. (2016). Innovative Design and Analysis of
Production Systems by Multi-objective Optimization and Data Mining. Procedia
CIRP, 50, 665–671. http://doi.org/10.1016/j.procir.2016.04.159
Reuter, C., & Brambring, F. (2016). Improving Data Consistency in Production
Control. Procedia CIRP, 41, 51–56. http://doi.org/10.1016/j.procir.2015.12.116
Siknun, G. P., & Sitanggang, I. S. (2016). Web-based Classification Application for
Forest Fire Data Using the Shiny Framework and the C5.0 Algorithm. Procedia
Environmental Sciences, 33, 332–339.
http://doi.org/10.1016/j.proenv.2016.03.084
Tokola, H., Gröger, C., Järvenpää, E., & Niemi, E. (2016). ScienceDirect Designing
manufacturing dashboards on the basis of a Key Performance Indicator survey.
Procedia CIRP, 0, 619–624. http://doi.org/10.1016/j.procir.2016.11.107
Tutunea, M. F. (2015). Business Intelligence Solutions for Mobile Devices – An
Overview. Procedia Economics and Finance, 27(15), 160–169.
http://doi.org/10.1016/S2212-5671(15)00985-5
Upadhyay, S., Sharma, C., Sharma, P., Bharadwaj, P., & Seeja, K. R. (2016). Privacy
preserving data mining with 3-D rotation transformation. Journal of King Saud
University - Computer and Information Sciences, 1–7.
http://doi.org/10.1016/j.jksuci.2016.11.009
van Os, H. W. A., Herber, R., & Scholtens, B. (2014). Designing a Decision Support
System for Subsurface Activities. Procedia Environmental Sciences, 22, 12–19.
http://doi.org/10.1016/j.proenv.2014.11.002
Wessiani, N. A., & Sarwoko, S. O. (2015). Risk Analysis of Poultry Feed Production
Using Fuzzy FMEA. Procedia Manufacturing, 4(IESS), 270–281.
http://doi.org/10.1016/j.promfg.2015.11.041
Pag. 15 / 15
1er. Congreso Internacional TECDES – Sept 2017 – investigacion.utmachala.edu.ec/es/tecdes2017 –
tecdes@utmachala.edu.ec