Sunteți pe pagina 1din 16

UNIVERSIDAD NACIONAL DE CHIMBORAZO

FACULTAD DE INGENIERÍA

CARRERA DE SISTEMAS Y COMPUTACIÓN


TRABAJO DE TITULACIÓN

TEMA:

Análisis de exactitud de los métodos de regresión aplicados en


la base de datos del Sistema Académico de la UNACH

Autora: Thalia Veloz Tutor: MsC. Jorge Delgado


Riobamba - Ecuador
2019
PLANTEAMIENTO DEL PROBLEMA
La Universidad Nacional de Chimborazo a través de la
Organizaciones Coordinación de Desarrollo de Sistemas Informáticos
(CODESI) gestiona la información académica en el SICOA.

generan grandes cantidades de información información información


personal y personal y
académica académica

Estudiantes Docentes

No existe la aplicación de herramientas de minería de datos efectivas


para la generación de conocimiento y que contribuyan al desarrollo
desconocen el potencial que esta del proyecto: “Diseño de estrategias de mejoramiento continuo en la
información puede albergar en la toma de gestión académica e investigativa de la UNACH, utilizando minería
decisiones de datos”.
Riobamba - Ecuador
2019
OBJETIVOS
Objetivo General

Identificar el mejor método de regresión aplicado en la base de datos del Sistema Académico de la UNACH por
medio del análisis comparativo de la exactitud, para apoyar al proyecto: “Diseño de estrategias de mejoramiento
continuo en la gestión académica e investigativa de la UNACH, utilizando minería de datos”.

Objetivos Específicos:

 Utilizar la metodología CRISP-DM para el análisis, preparación y construcción de los datos personales y
académicos de estudiantes y docentes.
 Aplicar los métodos de regresión lineal y polinomial para determinar las correlaciones entre los datos
cuantitativos de estudiantes y docentes.
 Analizar los resultados de las medidas de exactitud: RMSE, AE, R y R2 de los métodos de regresión lineal y
polinomial para la determinación del mejor método.

Riobamba - Ecuador
2019
MARCO TEÓRICO

Regresión
Técnicas Lineal
Métodos de
supervisadas o
Regresión
Minería de predictivas Regresión
Datos Técnicas no Polinomial
supervisadas o
descriptivas

Riobamba - Ecuador
2019
MARCO TEÓRICO

Regresión lineal Regresión Polinomial

Analiza la relación entre dos variables Son aplicables cuando la dependencia


cuantitativas, su objetivo es explicar el entre la variable dependiente cuantitativa y
comportamiento de una variable la variable independiente cuantitativa
dependiente, a partir de una variable muestran un comportamiento curvilíneo o
independiente. no lineal.

Y = β0 + β1X + ε Y = β0 + β1X+ β2X2+…+ βkXk + ε

Y: variable dependiente
X: variable independiente
β0, β1: coeficientes de regresión
ε: error del modelo
Riobamba - Ecuador
2019
MARCO TEÓRICO
Para evaluar los métodos de regresión se pueden utilizar las siguientes medidas:
raíz del error cuadrático medio coeficiente de correlación
RMSE R

• Mide la cantidad de • Evalúa una posible


error al comparar un relación entre dos
valor predicho y un variables
valor observado

error absoluto coeficiente de determinación


AE R2
• Es la diferencia • Es la porción de
entre el valor real y variabilidad de Y
el valor aproximado que queda explicada
por su dependencia
de la variable X
Riobamba - Ecuador
2019
METODOLOGÍA CRISP-DM

Comprensión del Comprensión de Preparación de


negocio los datos los datos

Evaluación Modelado

Riobamba - Ecuador
2019
RESULTADOS
Medidas de exactitud para la tabla Estudiante
Variable dependiente: Promedio General

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5


RL/RP RL/RP RL/RP RL/RP RL/RP

Variables Número Número Hijos Número Número Total


independientes Hermanos Integrantes dependen Ingresos
Hogar Ingresos
peor modelo
RMSE 0,988/0,991 0,998/0,998 1,000/1,000 0,993/0,995 1,000/1,000
AE 0,679/0,679 0,680/0,680 0,679/0,679 0,679/0,679 0,679/0,679
R 0,153/0,125 0,063/0,063 0,017/0,019 0,112/0,099 0,000/0,009
R2 0,024/0,018 0,004/0,004 0,000/0,001 0,013/0,011 0,000/0,000

Métodos Promedio Promedio Promedio Promedio


Método con
mejor modelo RMSE AE R R2 mayor
exactitud
Regresión Lineal 0,995 0,679 0,069 0,008
Regresión Polinomial 0,996 0,679 0,063 0,006

Riobamba - Ecuador
2019
RESULTADOS
Variable dependiente: Promedio General

Modelo 1 Modelo 2 Modelo 3


RL/RP RL/RP RL/RP
Variables Promedio Promedio Sexto Promedio
independientes Quinto Semestre Semestre Séptimo
Semestre
RMSE 0,522/0,869 0,384/0,701 0,391/0,717
AE 0,392/0,652 0,297/0,544 0,303/0,558
R 0,516/0,507 0,770/0,704 0,762/0,633
R2 0,274/0,267 0,594/0,515 0,582/0,464 Método con
peor modelo mejor modelo mayor
Métodos Promedio Promedio Promedio Promedio
exactitud
RMSE AE R R2
Regresión Lineal 0,432 0,330 0,682 0,483
Regresión Polinomial 0,762 0,584 0,614 0,415

Riobamba - Ecuador
2019
RESULTADOS
Medidas de exactitud para la tabla Docente Variable dependiente: Resultado Final de Evaluación Docente

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7 Modelo 8 Modelo 9


RL/RP RL/RP RL/RP RL/RP RL/RP RL/RP RL/RP RL/RP RL/RP

Horas Clase
Variables

Internacion
Nº Eventos
Nº Eventos

Nº Eventos

Nº Eventos
Académica

Nacionales
Aprobados

Aprobados
Actividad

Asistidos

Asistidos

Número
Eventos

Eventos
Horas

Horas

Horas

Hijos
ales
independientes

RMSE 0,920/ 0,929/ 0,923/ 0,932/ 0,921/ 0,927/ 0,926/ 0,921/ 0,924/
0,920 0,930 0,923 0,931 0,924 0,930 0,927 0,921 0,926

AE 0,498/ 0,514/ 0,513/ 0,517/ 0,515/ 0,513/ 0,516/ 0,514/ 0,516/


0,498 0,516 0,513 0,518 0,514 0,516 0,518 0,514 0,518

R 0,185/ 0,000/ 0,162/ 0,010/ 0,182/ 0,109/ 0,127/ 0,179/ 0,164/


0,185 0,011 0,162 0,026 0,164 0,105 0,118 0,179 0,164

R2 0,055/ 0,000/ 0,031/ 0,001/ 0,042/ 0,018/ 0,020/ 0,043/ 0,044/


0,055 0,003 0,031 0,009 0,037 0,016 0,018 0,043 0,051

mejor modelo peor modelo


Riobamba - Ecuador
2019
RESULTADOS

Métodos Promedio Promedio Promedio Promedio


RMSE AE R R2
Método con
Regresión Lineal 0,924 0,512 0,124 0,028
mayor
Regresión Polinomial 0,925 0,513 0,123 0,029
exactitud

Riobamba - Ecuador
2019
RESULTADOS
Variable dependiente: Resultado Final de Evaluación Docente

Modelo 1 Modelo 2 Modelo 3


RL/RP RL/RP RL/RP
Variables Evaluación Evaluación Evaluación
independientes Componente Componente Componente
Docencia Gestión Investigación
RMSE 0,708/0,696 0,894/0,931 0,923/0,920
AE 0,482/0,475 0,485/0,517 0,506/0,503
R 0,642/0,655 0,318/0,237 0,150/0,164 peor modelo
2
Rmejor 0,439/0,457 0,115/0,078 0,029/0,034
modelo
Métodos Promedio Promedio Promedio Promedio Método con
RMSE AE R R2 mayor
exactitud
Regresión Lineal 0,841 0,491 0,370 0,218

Regresión Polinomial 0,849 0,498 0,352 0,189

Riobamba - Ecuador
2019
RESULTADOS

Resultado final de las medidas de exactitud de los métodos

Métodos Promedio Promedio Promedio Promedio


RMSE AE R R2

Método con
Regresión Lineal 0,798 0,503 0,311 0,184 mayor
exactitud
Regresión 0,883 0,568 0,288 0,159
Polinomial

Riobamba - Ecuador
2019
CONCLUSIONES

Se logró seguir el proceso de minería de datos mediante la utilización de la metodología CRISP-DM,


teniendo como la fase más difícil a la preparación de los datos.

Una vez aplicado los métodos de regresión a los datos cuantitativos personales y académicos de estudiantes
y docentes de la UNACH se obtuvo en promedio correlaciones débiles (RL:0,311 y RP:0,288), deduciendo
que las variables independientes de estudiantes y docentes influyen mínimamente en las variables
dependientes.

Al realizar los análisis de las medidas de exactitud: RMSE, AE, R y R2 obtenidos de los 20 modelos
generados con los métodos de regresión lineal y polinomial sobre los datos cuantitativos de estudiantes y
docentes se determinaron en promedio errores altos: RMSE (RL: 0,798/RP: 0,883) y AE (RL: 0,503/RP:
0,568) y correlaciones débiles: R (RL: 0,311/RP: 0,288) y R2 (RL: 0,184/RP: 0,159).

Riobamba - Ecuador
2019
RECOMENDACIONES

Escoger una metodología de minería de datos como guía y una herramienta que ayude al análisis de
los datos.

Para realizar un proyecto de investigación sobre minería de datos con métodos de regresión en
cualquier tipo de entorno, es necesario efectuar un estudio previo de los métodos disponibles para
poder determinar aquellos que mejor se ajusten a las necesidades del proyecto.

Riobamba - Ecuador
2019
Riobamba - Ecuador
2019

S-ar putea să vă placă și