Trabajo

Ensayo
(tema)
(aquí va el profesor)
Kainer Kalle Bautte Cantillo
Universidad del Magdalena
Programa de Ingeniería Industrial
2019-2
1. ¿Cuáles son las características de una buena variable explicativa?
Las variables poseen diversos aspectos de clasificación, los cuales permiten conocer de un amplio panorama y/o parámetros basándose en
datos, características y elementos que se enfocan en disponer de estas, para con esto “(…) abordar el problema de construcción o selección un
modelo” (González, 2015 p. 11).
De manera más específica, dentro de las variables cuantitativas encontramos la existencia de la variable explicativa, la cual desempeña una
función estrictamente ligada con la descripción precisa de los datos, ya que “Esto se debe a que los datos económicos no proceden de un diseño
experimental” (Novales, 2010, p. 88).
Es decir, que los datos se obtienen de un modelo relacionado con el muestreo.
Es por esta razón, que este tipo de variables debe poseer en general datos y parámetros para una buena precisión en la investigación, sin
embargo, de manera específica de igual manera debe poseer unas características fundamentales, estructurales de esta misma, que son las
siguientes:
 Edad
 Genero
 Estimaciones
 Predicciones
 Algoritmos
 Métodos
2. ¿Cuáles son los supuestos asociados con el modelo de regresión múltiple?
Normalidad: Esto se refiere a que todos los datos, tanto las variables dependientes como las independientes, tienen que tener puntajes que
estén distribuidos normalmente. Más eficientemente los residuos (error) de estos puntajes deben tener una distribución normal.
Relación lineal: Si no se tiene linealidad se dice que tenemos un error de especificación. En el caso de que sean varias variables
independientes, la opción Analizar-Regresión Lineal-Gráficos-Generar todos los gráficos parciales nos da los diagramas de dispersión parcial
para cada variable independiente. En ellos se ha eliminado el efecto proveniente de las otras variables y así la relación que muestran es la relación
neta entre las variables representadas.
Independencia: Se asume el supuesto de la independencia en la selección de la muestra. Ello significa que la elección de un elemento no
condiciona la elección de los restantes.
Homocedasticidad: Es una característica de un modelo de regresión lineal que implica que la varianza de los errores es constante a lo largo
del tiempo.
3. ¿Qué mide el coeficiente de regresión parcial en la regresión múltiple?
Mide la correlación entre dos variables si las demás variables no varían, es decir, los valores de las demás variables son fijos. Por ejemplo, el
coeficiente de correlación parcial ρ12.3, es la correlación entre la variable 1 y 2 siendo constante el valor de la variable 3; o el coeficiente de
correlación parcial ρ23.1 es la correlación entre la variable 2 y 3 siendo constante el valor de la variable 1.
4. ¿Qué mide el error estándar de la estimación en la regresión múltiple?
Mide la precisión con la que el modelo estima el valor desconocido del coeficiente. El error estándar del coeficiente siempre es positivo. Se
utiliza el error estándar del coeficiente para medir la precisión de la estimación del coeficiente. Cuanto menor sea el error estándar, más precisa
será la estimación.
5. Su ecuación de la regresión múltiple estimada es
Y=7,52+3𝑋1-12.2𝑋2. Pronostique el valor de Y si 𝑋1 = 20 y 𝑋2 = 7.
Y=7.52+3(20)-12.2(7)
Y=7.52+60-85.4
Y=-17.88
6. Explique cada uno de los siguientes conceptos:
a) Matriz de correlación: este concepto se refiere al vínculo surgido de la intersección entre varias variables de la clase cuantitativa, es
decir, es la asociación entre dos (2) o más variables.
Por lo tanto, nos permiten encontrar elementos como: la variación conjunta de dos variables, la relación lineal perfecta, la colinealidad exacta
o aproximada, entre otros elementos.
b) R²: “El R es una herramienta estadística que se utiliza en modelos estadísticos como en una regresión para predecir futuros resultados”,
por lo cual, “El R2 es el porcentaje de variación de la variable de respuesta que explica su relación con una o más variables predictoras”.
(Anónimo, 2016).
Es decir, el símbolo R² hace referencia a la variación producto de la asociación de varias variables de clase predictoras.
c) Multicolinealidad: “La Multicolinealidad en regresión es una condición que ocurre cuando algunas variables predictoras incluidas en el
modelo están correlacionadas con otras variables predictoras” (Anónimo, 2019).
Por lo tanto, “(…) la Multicolinealidad es dependencia lineal entre las variables independientes” (Palacios, 2018).
d) Residuo: “llamamos residuos a las diferencias entre los valores de la variable dependiente observados y los valores que predecimos a
partir de nuestra recta de regresión”. (Menéndez, 2002, p. 1).

Es decir, el margen de diferencia arrojado como resultado de la asociación de dos o más variables es a lo que se le denomina como residuo.
e) Variable ficticia: se define como variable ficticia la utilización de “una variable utilizada para explicar valores cualitativos en un modelo
de regresión” (López. 2018).
Por lo cual, una variable ficticia se refiere a la implementación de variable explicativas enfocadas hacia la descripción precisa de un modelo.
f) Regresión por pasos: Este procedimiento consta de recorrer una serie de pasos enfocándose en poder determinar qué tipo de variables
pueden ser utilizadas e incluidas, así como también excluidas de una investigación con la finalidad de otorgar una mayor precisión a este.
Consiste en ir elaborando sucesivas ecuaciones de regresión en las que se va añadiendo cada vez un regresor más. El primer paso consiste
en seleccionar el regresor de máxima correlación simple con el criterio, y se define, en consecuencia, una ecuación de regresión simple
con esa variable.
A continuación, se elabora una segunda ecuación de regresión añadiendo a la anterior otro regresor, esta vez el que más proporción de
variabilidad explicada aporte sobre la ecuación anterior. Así hasta que no haya más regresores que aporten nada sustantivo, que es cuando
el procedimiento acaba. Hay que indicar, y aquí esta lo destacable de este procedimiento, que, en este proceso de elaboración del modelo
definitivo, hay una continua reevaluación de los predictores incluidos en el modelo, de forma que si algún regresor queda explicado por
los restantes (en el sentido de que carece de contribución específica propia) queda eliminado.
El procedimiento hacia delante (forward), es equivalente al anterior excepto en el sentido que no existe ninguna reevaluación, y se van
incluyendo, por tanto, en el modelo las variables según su importancia.
El procedimiento hacia atrás (backward) es justamente el contrario del anterior. Se comienza incluyendo todas las variables en el modelo
de regresión y se van eliminando regresores progresivamente de menor a mayor contribución específica hasta que ésta sea lo
suficientemente significativa como para no poder ser eliminada.
El procedimiento Eliminar (remove), permite cuando se ensayan diferentes modelos de regresión (con la especificación de bloques)
eliminar en cada uno de estos ensayos las variables que nos interese. Es una forma, digamos manual, de ir probando distintos modelos”.
(Anónimo)
Peso Millas por galon En el modelo de regresión lineal se tomó como variable predictora el peso con el cual se cargan los camiones para su transporte y variable de respuesta el
60 5,3 consumo de combustible medidos en millas por galón en este modelo se muestra que dicha variable explica el 75,1 % del consumo, el cual se vislumbra en el
55 5 coeficiente de determinación R2, también cabe mencionar que dicho modelo es significativo.
80 4 Los automóviles tienen un consumo base de 8.8484 millas por galón y por cada kilo libras que se le agregada generara una disminución del rendimiento de
72 4,2 0,060399.
75 4,5 El analisis nos ayuda a ver mediante su ecuacion que el modelo es de caracter decreciente, es decir la relacion entre las millas por galon y el peso en los envios
63 5,1 es inversamente proporcional. Esto es de vital importancia a la hora de pronosticar, ya que conociendo el comportamiento de cada variable sabremos optimizar
48 7,2 el pronostico para poder conseguir un modelo que se ajuste a las necesidades de la demanda.
79 3,9
82 3,8
72 4,4 Resumen
Peso vs Millas por galon y = -0,0604x + 8,8484
R² = 0,7579
58 4,9 8 Gráfico de probabilidad normal
60 5,1 Estadísticas de la regresión 7 90
74 4,5 Coeficiente de correlación múltiple 0,870551245 80
6
80 4,3 Coeficiente de determinación R^2 0,75785947 70
53 5,9 R^2 ajustado 0,751487351 5 GRAFICAS RESIDUOS -> 60
61 5,5 Error típico 5,093596038 50
Peso
4 y = 0,3433x + 51,433
80 3,5 Observaciones 40 40
3
R² = 0,9645
68 4,1 30
40 45 50 55 60 65 70 75 80 85 90 20
76 4,5 ANÁLISIS DE VARIANZA
10
75 4,4 Grados de libertad Suma de cuadradosPromedio de los cuadrados F Valor crítico de F
0
63 5 Regresión 1 3085,700617 3085,700617 118,9336615 2,90585E-13 0 20 40 60 80 100 120
65 4,9 Residuos 38 985,8993826 25,9447206 Muestra percentil
72 4,6 Total 39 4071,6
81 4
64 5,3 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
78 4,4 Intercepción 127,636359 5,472944335 23,3213333 4,04659E-24 116,5569624 138,7157556 116,5569624 138,7157556 Millas por galon Curva de regresión
62 4,9 Millas por galon -12,54757896 1,15055542 -10,90567107 2,90585E-13 -14,87675664 -10,21840128 -14,87675664 -10,21840128 ajustada
83 3,8
100
79 4,1
61 4,8 80
63 5 Análisis de los residuales Resultados de datos de probabilidad 60
Peso
62 4,9
40 Peso
77 4,6 Observación Pronóstico Peso Residuos Residuos estándares Percentil Peso
Pronóstico Peso
76 4,5 1 61,13419052 -1,13419052 -0,225580741 1,25 48 20
51 5,7 2 64,89846421 -9,898464207 -1,96871941 3,75 50 0
74 4,2 3 77,44604317 2,553956835 0,507960052 6,25 51 0 2 4 6 8
78 4,3 4 74,93652737 -2,936527374 -0,584050042 8,75 53 Millas por galon
50 6,1 5 71,17225369 3,827746314 0,761305826 11,25 55
79 4,3 6 63,64370631 -0,643706312 -0,12802765 13,75 55
55 4,7 7 37,2937905 10,7062095 2,129373003 16,25 58
8 78,70080106 0,299198939 0,059508096 18,75 60 Millas por galon Gráfico de los
9 79,95555896 2,044441043 0,406621743 21,25 60 residuales
10 72,42701158 -0,427011582 -0,084928932 23,75 61
15
11 66,1532221 -8,153222103 -1,621605764 26,25 61
12 63,64370631 -3,643706312 -0,724701852 28,75 62 10
13 71,17225369 2,827746314 0,562414425 31,25 62 5
Residuos
14 73,68176948 6,318230522 1,256641718 33,75 63
0
15 53,60564315 -0,605643145 -0,120457213 36,25 63
0 1 2 3 4 5 6 7 8
16 58,62467473 2,375325272 0,47243177 38,75 63 -5
17 83,71983264 -3,719832645 -0,739842725 41,25 64
-10
18 76,19128527 -8,19128527 -1,6291762 43,75 65
19 71,17225369 4,827746314 0,960197226 46,25 68 -15
Millas por galon
20 72,42701158 2,572988418 0,51174527 48,75 72
21 64,89846421 -1,898464207 -0,377588205 51,25 72
22 66,1532221 -1,153222103 -0,229365959 53,75 72
23 69,91749579 2,082504209 0,414192179 56,25 74
24 77,44604317 3,553956835 0,706851453 58,75 74
25 61,13419052 2,86580948 0,569984861 61,25 75
26 72,42701158 5,572988418 1,108419472 63,75 75
27 66,1532221 -4,153222103 -0,826040161 66,25 76
28 79,95555896 3,044441043 0,605513143 68,75 76
29 76,19128527 2,80871473 0,558629207 71,25 77
30 67,40798 -6,407979999 -1,274492117 73,75 78
31 64,89846421 -1,898464207 -0,377588205 76,25 78
32 66,1532221 -4,153222103 -0,826040161 78,75 79
33 69,91749579 7,082504209 1,408649182 81,25 79
34 71,17225369 4,827746314 0,960197226 83,75 79
35 56,11515894 -5,115158937 -1,017361125 86,25 80
36 74,93652737 -0,936527374 -0,186267241 88,75 80
37 73,68176948 4,318230522 0,858858917 91,25 80
38 51,09612735 -1,096127353 -0,218010305 93,75 81
39 73,68176948 5,318230522 1,057750317 96,25 82
40 68,66273789 -13,66273789 -2,717401077 98,75 83
Gonzalez, A. (2015). Selección de variables: Una revisión de métodos existentes
(tesis de maestría). Universidadde da coruña, Coruña, España.
Novales, A. (2010). Análisis de Regresión. Universidad Complutense, Madrid, España.
Blog estadístico, (2016). R cuadrado o coeficiente de determinación o correlación múltiple y R
cuadrado ajustado. Recuperado de http://elestadistico.blogspot.com/2016/09/r-cuadrado-o-coeficiente-de.html
Soporte de minitab 18, (2019). Multicolinealidad en regresión. Recuperado de
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/regression/supporting-topics/model-
assumptions/multicollinearity-in-regression/
Menéndez, F, (2002). Residuos, Residuos studentizados y valores DFFIT: Su uso en Regresión
Lineal Simple y Múltiple. Universidad de la República. Recuperado de
http://tabarefernandez.tripod.com/coco2.pdf
López, J. F. (2018, 11, 26). Variable ficticia. Economipedia. Recuperado de

https://economipedia.com/definiciones/variable-ficticia.html
Anónimo. Regresión lineal múltiple. Recuperado de
https://personal.us.es/vararey/adatos2/multiple.pdf

Trabajo

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Trabajo

Încărcat de

Drepturi de autor:

Formate disponibile

Ensayo

Kainer Kalle Bautte Cantillo

Universidad del Magdalena

Programa de Ingeniería Industrial

modelo” (González, 2015 p. 11).

experimental” (Novales, 2010, p. 88).

Es decir, que los datos se obtienen de un modelo relacionado con el muestreo.

2. ¿Cuáles son los supuestos asociados con el modelo de regresión múltiple?

neta entre las variables representadas.

condiciona la elección de los restantes.

4. ¿Qué mide el error estándar de la estimación en la regresión múltiple?

5. Su ecuación de la regresión múltiple estimada es

Y=7,52+3𝑋1-12.2𝑋2. Pronostique el valor de Y si 𝑋1 = 20 y 𝑋2 = 7.

decir, es la asociación entre dos (2) o más variables.

o aproximada, entre otros elementos.

modelo están correlacionadas con otras variables predictoras” (Anónimo, 2019).

partir de nuestra recta de regresión”. (Menéndez, 2002, p. 1).

de regresión” (López. 2018).

con esa variable.

incluyendo, por tanto, en el modelo las variables según su importancia.

suficientemente significativa como para no poder ser eliminada.

(tesis de maestría). Universidadde da coruña, Coruña, España.

Novales, A. (2010). Análisis de Regresión. Universidad Complutense, Madrid, España.

Blog estadístico, (2016). R cuadrado o coeficiente de determinación o correlación múltiple y R

cuadrado ajustado. Recuperado de http://elestadistico.blogspot.com/2016/09/r-cuadrado-o-coeficiente-de.html

Soporte de minitab 18, (2019). Multicolinealidad en regresión. Recuperado de

Menéndez, F, (2002). Residuos, Residuos studentizados y valores DFFIT: Su uso en Regresión

Lineal Simple y Múltiple. Universidad de la República. Recuperado de

López, J. F. (2018, 11, 26). Variable ficticia. Economipedia. Recuperado de

Anónimo. Regresión lineal múltiple. Recuperado de

S-ar putea să vă placă și