Documente Academic
Documente Profesional
Documente Cultură
Captulo 14
Chap 14-1
Objetivos de aprendizaje
En este capitulo, usted aprender:
Como desarrollar un modelo de regresin mltiple
Interpretar los coeficientes de regresin
Como determinar cuales variables independientes se
incluyen, o no, en el modelo regresional
Como determinar cuales variables independientes son
mas importantes en predecir el valor de una variable
dependiente
Como utilizar variables categricas en un modelo de
regresin
Como predecir una variable dependiente usando la
regresin logstica
Chap 14-2
El Modelo de regresin
multiple
Idea: Examinar la relacin lineal existente entre
1 variable dependiente (Y) & 2 o mas variables independientes (Xi)
Modelo de regresin mltiple con k variables Independientes:
Yintercepcin
Pendiente
Poblacional
Error aleatorio
Chap 14-3
Intercepcin
Estimacin
b b X b X b X
Y
i
0
1 1i
2 2i
k ki
Veremos como utilizar Excel para obtener los coeficientes
de la pendiente regresional y otros factores regresionales
Chap 14-4
b b X b X
Y
0
1 1
2 2
X2
X1
Chap 14-5
Ejemplo:
2 Variables Independientes
Un distribuidor de tartas desea evaluar los
factores que influyen en la demanda
Variable Dependiente : Tartas (unidades por
semana)
Variables Independientes :
Precio (en $)
Publicidad ($100s)
Chap 14-6
Tartas Ejemplo
Tartas
Precio
($)
Publicidad
($100s)
350
5.50
3.3
460
7.50
3.3
350
8.00
3.0
430
8.00
4.5
350
6.80
3.0
380
7.50
4.0
430
4.50
3.0
470
6.40
3.7
450
7.00
3.5
10
490
5.00
4.0
11
340
7.20
3.5
12
300
7.90
3.2
13
440
5.90
4.0
14
450
5.00
3.5
15
300
7.00
2.7
Demand
a
Vtas = b0 + b1 (Precio)
+ b2 (Publicidad)
Chap 14-7
0.72213
R Square
0.52148
Adjusted R Square
0.44172
Standard Error
47.46341
Observations
ANOVA
Regression
15
df
SS
MS
29460.027
14730.013
Residual
12
27033.306
2252.776
Total
14
56493.333
Coefficients
Standard Error
Intercept
306.52619
114.25389
2.68285
0.01993
57.58835
555.46404
Price
-24.97509
10.83213
-2.30565
0.03979
-48.57626
-1.37392
74.13096
25.96732
2.85478
0.01449
17.55303
130.70888
Advertising
t Stat
6.53861
Significance F
P-value
0.01201
Lower 95%
Upper 95%
Chap 14-8
b1 = -24.975: ventas
decrecern, en promedio
24.975 tartas vendidas por
semana para cada $1 de
incremento en el precio de
ventas, neto de los efectos de
cambios en publicidad
b2 = 74.131:
incremento en las
ventas en promedio
de 74.131 tartas por
semana para cada
$100 incremento en
la publicidad neta de
efectos de cambios
en el precio
Chap 14-9
Pronstico de las
Ventas es 428.62
tartas
Observe que la
publicidad est
expresada en $100s,
as $350 se convierte en
X2 = 3.5
Chap 14-10
Coeficiente de Determinacin
mltiple
Informa la proporcin de la variacin total en Y
,explicada por todas las variables, X variables
juntas
SSR
suma de cuadradosde la regresin
r
suma
SST
total de cuadrados
2
Chap 14-11
Coeficiente de
Determinacin mltiple
(continua)
Regression Statistics
multiple R
0.72213
R Square
0.52148
Adjusted R Square
0.44172
Standard Error
Regression
47.46341
Observations
ANOVA
SSR 29460.0
r
.52148
SST 56493.3
2
15
df
SS
MS
29460.027
14730.013
Residual
12
27033.306
2252.776
Total
14
56493.333
Coefficients
Standard Error
Intercept
306.52619
114.25389
2.68285
0.01993
57.58835
555.46404
Price
-24.97509
10.83213
-2.30565
0.03979
-48.57626
-1.37392
74.13096
25.96732
2.85478
0.01449
17.55303
130.70888
Advertising
t Stat
6.53861
Significance F
P-value
0.01201
Lower 95%
Upper 95%
Chap 14-12
r2 Ajustado
r2 nunca decrece cuando una nueva variable X
se adiciona al modelo
Esto puede ser una desventaja comparando
modelos
Cul es el efecto neto de adicionar una nueva
variable?
Perdemos un grado de libertad cuando una
nueva variable X es agregada
Tiene la nueva variable X adicionada poder
explicativo suficiente para compensar la
perdida de un grado de libertad?
Chap 14-13
r2 Ajustado
(continua)
n 1
2
1 (1 r )
n k 1
Chap 14-14
r2 Ajustado
(continua
Regression Statistics
multiple R
0.72213
R Square
0.52148
Adjusted R Square
0.44172
Standard Error
47.46341
Observations
ANOVA
Regression
15
df
2
adj
.44172
MS
29460.027
14730.013
Residual
12
27033.306
2252.776
Total
14
56493.333
Coefficients
Standard Error
Intercept
306.52619
114.25389
2.68285
0.01993
57.58835
555.46404
Price
-24.97509
10.83213
-2.30565
0.03979
-48.57626
-1.37392
74.13096
25.96732
2.85478
0.01449
17.55303
130.70888
Advertising
t Stat
6.53861
Significance F
P-value
0.01201
Lower 95%
Upper 95%
Chap 14-15
Es el Modelo Significativo?
Se utiliza la Prueba F para ver si el modelo es
significativo
Muestra si hay una relacin lineal entre todas las
variables X consideradas conjuntamente e Y
Usa el estadstico F
Hiptesis:
H0: 1 = 2 = = k = 0 (no hay relacin lineal)
H1: al menos una i 0 (al menos una variable
independiente afecta a Y)
Chap 14-16
SSR
MSR
k
F
SSE
MSE
n k 1
donde F tiene
(numerador) = k y
(denominador) = (n k - 1)
grados de libertad
Chap 14-17
0.72213
R Square
0.52148
Adjusted R Square
0.44172
Standard Error
47.46341
Observations
ANOVA
Regression
15
df
MSR 14730.0
F
6.5386
MSE
2252.8
con 2 y 12 g de l
SS
MS
Significance F
29460.027
14730.013
Residual
12
27033.306
2252.776
Total
14
56493.333
Coefficients
Standard Error
Intercept
306.52619
114.25389
2.68285
0.01993
57.58835
555.46404
Price
-24.97509
10.83213
-2.30565
0.03979
-48.57626
-1.37392
74.13096
25.96732
2.85478
0.01449
17.55303
130.70888
Advertising
t Stat
6.53861
P-value
para la
Prueba F
P-value
0.01201
Lower 95%
Upper 95%
Chap 14-18
H0: 1 = 2 = 0
H1: 1 and 2 not both zero
= .05
df1= 2
df2 = 12
Estadstico de la Prueba:
MSR
F
6.5386
MSE
Decisin:
Valor
Como el estadstico de la
prueba F cae en la regin
de rechazo (p-value es <
.05), rechazamos H0
Critico :
F = 3.885
= .05
Conclusion:
0No
rechazo H0
Rechazo H0
F.05 = 3.885
Chap 14-19
b b X b X
Y
0
1 1
2 2
<
Residuo = ei
= (Yi Yi)
Y
Yi
<
Yi
x2i
X1
<
x1i
X2
ei = (Yi Yi)
Supuestos:
Los errores estn normalmente distribudos
Los errores tienen una varianza constante
Los errores son independientes
Chap 14-21
Residuos vs. Yi
Residuos vs. X1i
Residuos vs. X2i
Residuos vs. tiempo (si el tiempo conforma una serie
de tiempo)
Usamos los grficos de residuos para
chequear las violaciones a los supuestos de la
regresin
Chap 14-22
Chap 14-23
bj 0
(gl = n k 1)
Sb j
Chap 14-24
0.72213
R Square
0.52148
Adjusted R Square
0.44172
Standard Error
47.46341
Observations
ANOVA
Regression
15
df
MS
29460.027
14730.013
Residual
12
27033.306
2252.776
Total
14
56493.333
Coefficients
Standard Error
Intercept
306.52619
114.25389
2.68285
0.01993
57.58835
555.46404
Price
-24.97509
10.83213
-2.30565
0.03979
-48.57626
-1.37392
74.13096
25.96732
2.85478
0.01449
17.55303
130.70888
Advertising
t Stat
6.53861
Significance F
P-value
0.01201
Lower 95%
Upper 95%
Chap 14-25
H0: i = 0
H1: i 0
Price
Advertising
d.f. = 15-2-1 = 12
= .05
Coefficients
Standard Error
t Stat
P-value
-24.97509
10.83213
-2.30565
0.03979
74.13096
25.96732
2.85478
0.01449
t/2 = 2.1788
/2=.025
/2=.025
Decisin: Rechazar H0
e
para
cada variable
que a
Hay evidencia
Conclusin
Rech H0
No rech H0
-t/2
-2.1788
Rech H0
t/2
2.1788
b j tnk 1Sb j
Coefficients
Standard Error
Intercept
306.52619
114.25389
Price
-24.97509
10.83213
74.13096
25.96732
Advertising
Donde t
(n k 1) g de l
Aqu t tiene
(15 2 1) = 12 d.f.
Intervalo de Confianza
para la pendiente poblacional i
Coefficients
Standard Error
Intercept
306.52619
114.25389
57.58835
555.46404
Price
-24.97509
10.83213
-48.57626
-1.37392
74.13096
25.96732
17.55303
130.70888
Advertising
Lower 95%
Upper 95%
Chap 14-28
= SSR (todas las variable) SSR( todas las variables excepto Xj)
Chap 14-29
b b X b X b X
Y
0
1 1
2 2
3 3
b b X b X
Y
0
2 2
3 3
El estadstico de la Prueba
Parcial F
Consideremos la prueba de hiptesis:
H0: variable Xj no mejora significativamente el modelo para el
modelo de todas las dems variables incluidas
El estadstico de la prueba F:
(con 1 y n-k-1 gl.)
Probando a un nivel de
significacin del = .05 para
determinar si la variable precio
mejora significativamente el
modelo dado que la variable
publicidad es includa
Chap 14-32
(Para X1 y X2)
ANOVA
ANOVA
df
SS
MS
29460.02687
14730.01343
Regression
Residual
12
27033.30647
2252.775539
Total
14
56493.33333
Regression
df
SS
17484.22249
Residual
13
39009.11085
Total
14
56493.33333
Chap 14-33
(Para X1 y X2)
ANOVA
ANOVA
df
SS
MS
29460.02687
14730.01343
Regression
Residual
12
27033.30647
2252.775539
Total
14
56493.33333
Regression
df
SS
17484.22249
Residual
13
39009.11085
Total
14
56493.33333
5.316
MSE(todas)
2252 .78
Chap 14-34
Chap 14-35
Coeficiente de Determinacin
Parcial en Excel
Los Coeficientes de Determinacin Parcial
pueden ser encontrados utilizando Excel:
PHStat | regression | mltiple regression
Chequear la caja del coefficient of partial determination
Regression Analysis
Coefficients of Partial Determination
Intermediate Calculations
SSR(X1,X2) 29460.02687
SST
56493.33333
SSR(X2)
17484.22249 SSR(X1 | X2) 11975.80438
SSR(X1)
11100.43803 SSR(X2 | X1) 18359.58884
Coefficients
r2 Y1.2
0.307000188
r2 Y2.1
0.404459524
Chap 14-36
Chap 14-37
Chap 14-38
b b X b (1) (b b ) b X
Y
0
1
1
2
0
2
1
1
b b X b (0)
Y
b
b X
0
Y (ventas)
b0 + b2
b0
intercepcin
Diferente
Ferado
Sin Ferado
Misma
pendiente
Si H0: 2 = 0 es
rechazado. Luego,
Ferado tiene un
efecto significativo
sobre las ventas
X1 (Precio)
Chap 14-39
Interpretando el Coeficiente de la
Variable Dummy (con 2 Niveles)
Ejemplo:
b b X b X b X
Y
0
1 1
2 2
3 3
Chap 14-42
20.43 0.045X
Y
1
Para el rancho: X2 = 1; X3 = 0
b b X b X b X
Y
0
1 1
2 2
3 3
b0 b1X1 b2 X2 b3 (X1X2 )
Chap 14-44
Efecto de la Interaccin
Dada:
Y 0 1X1 2 X2 3 X1X2
Chap 14-45
Ejemplo de Interaccin
Supongamos que X2 es una variable dummy y la ecuacin de regresin estimada es
Y
12
X2 = 1:
Y = 1 + 2X1 + 3(1) + 4X1(1) = 4 + 6X1
8
4
X2 = 0:
Y = 1 + 2X1 + 3(0) + 4X1(0) = 1 + 2X1
0
0
0.5
1.5
X1
Chap 14-46
Chap 14-47
Contribucin Simultnea de
Variables Independientes
Utilizamos la prueba parcial F para estudiar la
contribucin simultnea de las mltiples
variables del modelo
Sean m variables a ser adicionales de un conjunto pueden ser
adicionadas a un conjunto de variables simultneamente
Chap 14-49