Documente Academic
Documente Profesional
Documente Cultură
(tema)
(aquí va el profesor)
2019-2
1. ¿Cuáles son las características de una buena variable explicativa?
Las variables poseen diversos aspectos de clasificación, los cuales permiten conocer de un amplio panorama y/o parámetros basándose en
datos, características y elementos que se enfocan en disponer de estas, para con esto “(…) abordar el problema de construcción o selección un
De manera más específica, dentro de las variables cuantitativas encontramos la existencia de la variable explicativa, la cual desempeña una
función estrictamente ligada con la descripción precisa de los datos, ya que “Esto se debe a que los datos económicos no proceden de un diseño
Es por esta razón, que este tipo de variables debe poseer en general datos y parámetros para una buena precisión en la investigación, sin
embargo, de manera específica de igual manera debe poseer unas características fundamentales, estructurales de esta misma, que son las
siguientes:
Edad
Genero
Estimaciones
Predicciones
Algoritmos
Métodos
Normalidad: Esto se refiere a que todos los datos, tanto las variables dependientes como las independientes, tienen que tener puntajes que
estén distribuidos normalmente. Más eficientemente los residuos (error) de estos puntajes deben tener una distribución normal.
Relación lineal: Si no se tiene linealidad se dice que tenemos un error de especificación. En el caso de que sean varias variables
independientes, la opción Analizar-Regresión Lineal-Gráficos-Generar todos los gráficos parciales nos da los diagramas de dispersión parcial
para cada variable independiente. En ellos se ha eliminado el efecto proveniente de las otras variables y así la relación que muestran es la relación
Independencia: Se asume el supuesto de la independencia en la selección de la muestra. Ello significa que la elección de un elemento no
Homocedasticidad: Es una característica de un modelo de regresión lineal que implica que la varianza de los errores es constante a lo largo
del tiempo.
3. ¿Qué mide el coeficiente de regresión parcial en la regresión múltiple?
Mide la correlación entre dos variables si las demás variables no varían, es decir, los valores de las demás variables son fijos. Por ejemplo, el
coeficiente de correlación parcial ρ12.3, es la correlación entre la variable 1 y 2 siendo constante el valor de la variable 3; o el coeficiente de
correlación parcial ρ23.1 es la correlación entre la variable 2 y 3 siendo constante el valor de la variable 1.
Mide la precisión con la que el modelo estima el valor desconocido del coeficiente. El error estándar del coeficiente siempre es positivo. Se
utiliza el error estándar del coeficiente para medir la precisión de la estimación del coeficiente. Cuanto menor sea el error estándar, más precisa
será la estimación.
Y=7.52+3(20)-12.2(7)
Y=7.52+60-85.4
Y=-17.88
6. Explique cada uno de los siguientes conceptos:
a) Matriz de correlación: este concepto se refiere al vínculo surgido de la intersección entre varias variables de la clase cuantitativa, es
Por lo tanto, nos permiten encontrar elementos como: la variación conjunta de dos variables, la relación lineal perfecta, la colinealidad exacta
b) R²: “El R es una herramienta estadística que se utiliza en modelos estadísticos como en una regresión para predecir futuros resultados”,
por lo cual, “El R2 es el porcentaje de variación de la variable de respuesta que explica su relación con una o más variables predictoras”.
(Anónimo, 2016).
Es decir, el símbolo R² hace referencia a la variación producto de la asociación de varias variables de clase predictoras.
c) Multicolinealidad: “La Multicolinealidad en regresión es una condición que ocurre cuando algunas variables predictoras incluidas en el
Por lo tanto, “(…) la Multicolinealidad es dependencia lineal entre las variables independientes” (Palacios, 2018).
d) Residuo: “llamamos residuos a las diferencias entre los valores de la variable dependiente observados y los valores que predecimos a
e) Variable ficticia: se define como variable ficticia la utilización de “una variable utilizada para explicar valores cualitativos en un modelo
Por lo cual, una variable ficticia se refiere a la implementación de variable explicativas enfocadas hacia la descripción precisa de un modelo.
f) Regresión por pasos: Este procedimiento consta de recorrer una serie de pasos enfocándose en poder determinar qué tipo de variables
pueden ser utilizadas e incluidas, así como también excluidas de una investigación con la finalidad de otorgar una mayor precisión a este.
Consiste en ir elaborando sucesivas ecuaciones de regresión en las que se va añadiendo cada vez un regresor más. El primer paso consiste
en seleccionar el regresor de máxima correlación simple con el criterio, y se define, en consecuencia, una ecuación de regresión simple
A continuación, se elabora una segunda ecuación de regresión añadiendo a la anterior otro regresor, esta vez el que más proporción de
variabilidad explicada aporte sobre la ecuación anterior. Así hasta que no haya más regresores que aporten nada sustantivo, que es cuando
el procedimiento acaba. Hay que indicar, y aquí esta lo destacable de este procedimiento, que, en este proceso de elaboración del modelo
definitivo, hay una continua reevaluación de los predictores incluidos en el modelo, de forma que si algún regresor queda explicado por
los restantes (en el sentido de que carece de contribución específica propia) queda eliminado.
El procedimiento hacia delante (forward), es equivalente al anterior excepto en el sentido que no existe ninguna reevaluación, y se van
El procedimiento hacia atrás (backward) es justamente el contrario del anterior. Se comienza incluyendo todas las variables en el modelo
de regresión y se van eliminando regresores progresivamente de menor a mayor contribución específica hasta que ésta sea lo
El procedimiento Eliminar (remove), permite cuando se ensayan diferentes modelos de regresión (con la especificación de bloques)
eliminar en cada uno de estos ensayos las variables que nos interese. Es una forma, digamos manual, de ir probando distintos modelos”.
(Anónimo)
Peso Millas por galon En el modelo de regresión lineal se tomó como variable predictora el peso con el cual se cargan los camiones para su transporte y variable de respuesta el
60 5,3 consumo de combustible medidos en millas por galón en este modelo se muestra que dicha variable explica el 75,1 % del consumo, el cual se vislumbra en el
55 5 coeficiente de determinación R2, también cabe mencionar que dicho modelo es significativo.
80 4 Los automóviles tienen un consumo base de 8.8484 millas por galón y por cada kilo libras que se le agregada generara una disminución del rendimiento de
72 4,2 0,060399.
75 4,5 El analisis nos ayuda a ver mediante su ecuacion que el modelo es de caracter decreciente, es decir la relacion entre las millas por galon y el peso en los envios
63 5,1 es inversamente proporcional. Esto es de vital importancia a la hora de pronosticar, ya que conociendo el comportamiento de cada variable sabremos optimizar
48 7,2 el pronostico para poder conseguir un modelo que se ajuste a las necesidades de la demanda.
79 3,9
82 3,8
72 4,4 Resumen
Peso vs Millas por galon y = -0,0604x + 8,8484
R² = 0,7579
58 4,9 8 Gráfico de probabilidad normal
60 5,1 Estadísticas de la regresión 7 90
74 4,5 Coeficiente de correlación múltiple 0,870551245 80
6
80 4,3 Coeficiente de determinación R^2 0,75785947 70
53 5,9 R^2 ajustado 0,751487351 5 GRAFICAS RESIDUOS -> 60
61 5,5 Error típico 5,093596038 50
Peso
4 y = 0,3433x + 51,433
80 3,5 Observaciones 40 40
3
R² = 0,9645
68 4,1 30
40 45 50 55 60 65 70 75 80 85 90 20
76 4,5 ANÁLISIS DE VARIANZA
10
75 4,4 Grados de libertad Suma de cuadradosPromedio de los cuadrados F Valor crítico de F
0
63 5 Regresión 1 3085,700617 3085,700617 118,9336615 2,90585E-13 0 20 40 60 80 100 120
65 4,9 Residuos 38 985,8993826 25,9447206 Muestra percentil
72 4,6 Total 39 4071,6
81 4
64 5,3 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
78 4,4 Intercepción 127,636359 5,472944335 23,3213333 4,04659E-24 116,5569624 138,7157556 116,5569624 138,7157556 Millas por galon Curva de regresión
62 4,9 Millas por galon -12,54757896 1,15055542 -10,90567107 2,90585E-13 -14,87675664 -10,21840128 -14,87675664 -10,21840128 ajustada
83 3,8
100
79 4,1
61 4,8 80
63 5 Análisis de los residuales Resultados de datos de probabilidad 60
Peso
62 4,9
40 Peso
77 4,6 Observación Pronóstico Peso Residuos Residuos estándares Percentil Peso
Pronóstico Peso
76 4,5 1 61,13419052 -1,13419052 -0,225580741 1,25 48 20
51 5,7 2 64,89846421 -9,898464207 -1,96871941 3,75 50 0
74 4,2 3 77,44604317 2,553956835 0,507960052 6,25 51 0 2 4 6 8
78 4,3 4 74,93652737 -2,936527374 -0,584050042 8,75 53 Millas por galon
50 6,1 5 71,17225369 3,827746314 0,761305826 11,25 55
79 4,3 6 63,64370631 -0,643706312 -0,12802765 13,75 55
55 4,7 7 37,2937905 10,7062095 2,129373003 16,25 58
8 78,70080106 0,299198939 0,059508096 18,75 60 Millas por galon Gráfico de los
9 79,95555896 2,044441043 0,406621743 21,25 60 residuales
10 72,42701158 -0,427011582 -0,084928932 23,75 61
15
11 66,1532221 -8,153222103 -1,621605764 26,25 61
12 63,64370631 -3,643706312 -0,724701852 28,75 62 10
13 71,17225369 2,827746314 0,562414425 31,25 62 5
Residuos
14 73,68176948 6,318230522 1,256641718 33,75 63
0
15 53,60564315 -0,605643145 -0,120457213 36,25 63
0 1 2 3 4 5 6 7 8
16 58,62467473 2,375325272 0,47243177 38,75 63 -5
17 83,71983264 -3,719832645 -0,739842725 41,25 64
-10
18 76,19128527 -8,19128527 -1,6291762 43,75 65
19 71,17225369 4,827746314 0,960197226 46,25 68 -15
Millas por galon
20 72,42701158 2,572988418 0,51174527 48,75 72
21 64,89846421 -1,898464207 -0,377588205 51,25 72
22 66,1532221 -1,153222103 -0,229365959 53,75 72
23 69,91749579 2,082504209 0,414192179 56,25 74
24 77,44604317 3,553956835 0,706851453 58,75 74
25 61,13419052 2,86580948 0,569984861 61,25 75
26 72,42701158 5,572988418 1,108419472 63,75 75
27 66,1532221 -4,153222103 -0,826040161 66,25 76
28 79,95555896 3,044441043 0,605513143 68,75 76
29 76,19128527 2,80871473 0,558629207 71,25 77
30 67,40798 -6,407979999 -1,274492117 73,75 78
31 64,89846421 -1,898464207 -0,377588205 76,25 78
32 66,1532221 -4,153222103 -0,826040161 78,75 79
33 69,91749579 7,082504209 1,408649182 81,25 79
34 71,17225369 4,827746314 0,960197226 83,75 79
35 56,11515894 -5,115158937 -1,017361125 86,25 80
36 74,93652737 -0,936527374 -0,186267241 88,75 80
37 73,68176948 4,318230522 0,858858917 91,25 80
38 51,09612735 -1,096127353 -0,218010305 93,75 81
39 73,68176948 5,318230522 1,057750317 96,25 82
40 68,66273789 -13,66273789 -2,717401077 98,75 83
Gonzalez, A. (2015). Selección de variables: Una revisión de métodos existentes
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-statistics/regression/supporting-topics/model-
assumptions/multicollinearity-in-regression/
http://tabarefernandez.tripod.com/coco2.pdf
https://personal.us.es/vararey/adatos2/multiple.pdf