Documente Academic
Documente Profesional
Documente Cultură
Captulo 4
-1
Gerardo Heckmann
Universidad Nacional de Crdoba
Relacin NO lineal
Sin relacin
Variable
Dependiente
(Respuesta)
Gerardo Heckmann , FCE - UNC
(Valores Observados
de Y) =
Error
Aleatorio
(continuacin)
Yi = 0 + 1 X i + i
i = Error Aleatorio
Yi = 0 + 1 X i + i
Recta de
Regresin
YX
Poblacional
(media condicional)
Constante Poblacional
YX = 0 + 1 X i
Variable
Independiente
(Explicativa)
(Media Condicional)
X
Valor observado de Y
5
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
-2
Estimacin de la
pendiente
Estimacin de la
constante
Yi = b0 + b1 X i + ei
Residuo
2
i
i =1
(Y Y ) = e
Y = b 0 + b1 X =
Interpretacin de la pendiente y
la constante
Yi = 0 + 1 X i + i
Yi = b0 + b1 X i + ei
b1
ei
1
YX = 0 + 1 X i
b0
Y i = b0 + b1 X i
1 =
E (Y | X )
X
Valor Observado
Gerardo Heckmann , FCE - UNC
Interpretacin de la pendiente y
la constante
(continuacin)
b0 = E ( Y | X = 0 ) es el valor promedio
E (Y | X )
b1 =
X
es el cambio estimado en
cambio unitario en X.
10
11
12
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
1. Normalidad
-3
Y
X2
X1
X
Gerardo Heckmann , FCE - UNC
13
Estimacin de Mxima
Verosimilitud de 0 y 1
14
Estimacin de Mxima
Verosimilitud de 0 y 1
(continuacin)
l( 0 , 1 , 2 , y i ) =
1
2
1
2 2
( y i 0 1 xi )2
L( 0 , 1 , 2 ) =
L( 0 , 1 , 2 , y i ) =
(y
0 1 xi )2
1
1
1
ln 2 ln 2
(y i 0 1 xi )2
2
2
2 2
15
Estimacin de Mxima
Verosimilitud de 0 y 1
16
(continuacin)
(continuacin)
L
= 0 = ( yi b0 b1 xi )
0
L
= 0 = ( yi b0 b1 xi ) xi
1
Gerardo Heckmann , FCE - UNC
y = nb b x
y x =b x +b x
0
i i
17
2
i
(2)
18
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
(continuacin)
(continuacin)
Y = b0 + b1 X
-4
yx
i i
n
b1 =
b0 = Y b1 X
Gerardo Heckmann , FCE - UNC
19
XY = b1 (
2
i
X 2)
Cov ( x, y ) yi xi nXY
=
S x2
xi2 nX 2
20
(continuacin)
L
n
1
=0= 2 + 4
2
2 S yx 2 S yx
(y b
i
b1 xi ) 2
i
i
i =1
Sabemos que:
2
yx
ei = yi b0 b1 xi
e
=
2
i
21
Mt2
Ventas
Anuales
($1000)
1
2
3
4
5
6
7
1,726
1,542
2,816
5,555
1,292
2,208
1,313
3,681
3,395
6,653
9,543
3,318
5,563
3,760
22
Queremos examinar la
dependencia lineal de
las ventas anuales de
las sucursales con su
tamao, medido en
mt2. Se dispone de
informacin muestral
de 7 sucursales.
Encontrar la ecuacin
de la recta que ajusta
mejor los datos.
= ei2 = ( yi b0 b1 xi )2
i =1
12000
10000
8000
6000
4000
2000
0
0
1000
Salida de Excel
23
2000
3000
4000
5000
6000
Mt2
24
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
Grfico de la ecuacin de
regresin estimada: Ejemplo
Ventas Anuales ($000)
Yi = b0 + b1 X i
= 1636.415 +1.487 X i
De la salida de Excel:
Constante
Var. X
-5
Coefic.
1636.414726
1.486633657
12000
10000
8000
6000
4000
2000
0
0
1000
2000
3000
4000
5000
6000
Mts.2
25
Interpretacin de resultados:
Ejemplo
26
Yi = 1636.415 + 1.487 X i
27
Medida de variacin:
La suma de los cuadrados
28
Medida de variacin:
La suma de cuadrados
(continuacin)
SCT
SCR
SCE
Suma de
cuadrados =
total
Suma de
cuadrados +
explicada
Suma de
cuadrados
no explicada
29
30
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
Medida de variacin:
La suma de cuadrados
-6
(continuacin)
Variaciones en
el tamao de
los locales no
utilizadas para
explicar las
variaciones
en las ventas
SCE =
(Yi - Yi )2
_
Y
Ventas
Variaciones en las
ventas explicadas
por los tamaos o
variaciones en los
tamaos usadas
para explicar
variaciones en las
ventas (SSR)
Tamaos
X
Xi
Gerardo Heckmann , FCE - UNC
31
Variaciones en las
ventas explicadas
por el trmino de
Error (SSE)
32
Medidas de Variacin
La suma de cuadrados: Ejemplo
Grados de libertad
gl
Regresin
SC
CM
SCR
CMR
=SCR/p
Residuos
n-p-1 SCE
Total
n-1
Significaci
nF
ANOVA
CMR/CME
P-value del
Test F
Regression
30380456.12
30380456
Residual
1871199.595
374239.92
Total
32251655.71
df
CME
=SCE/(n-p-1)
SCT
MS
SS
GL Regresin (explicada)
GL Error (residuos)
GL Totales
33
r2 =
SCE
0.000281201
SCT
SCR
34
de cuadrados
SCR Suma
Regression
Sum ofRegresin
Squares
=
SCT
TotaldeSum
of Squares
Suma
cuadrados
Total
Ventas
Significance F
El coeficiente de determinacin
F
81.17909
r2 =
Tamaos
Gerardo Heckmann , FCE - UNC
35
SCR
SCR + SCE
36
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
Coeficientes de determinacin (r 2) y
de correlacin (r)
-7
Y r2 = 1, r = +1
Y r2 = 1, r = -1
^=b +b X
Y
i
0
1 i
^=b +b X
Y
i
0
1 i
X
SCE
=
n2
SYX =
i =1
n2
r2 = 0, r = 0
^=b +b X
Y
i
0
1 i
^=b +bX
Y
i
0
1 i
37
38
Medidas de variacin:
Ejemplo de sucursales
Anlisis residual
Salida de Excel
R e g re ssi o n S ta tistic s
M u lt ip le R
0.9705572
R S q u a re
0 .9 4 1 9 8 1 2 9
A d ju s t e d R S q u a re 0 .9 3 0 3 7 7 5 4
S t a n d a rd E rro r
6 1 1 .7 5 1 5 1 7
O b s e rva t io n s
7
r2 = .94
(Y Y )
Propsitos
Examinar la linealidad
Evaluar violaciones de los supuestos
Syx
39
40
Residuos estandarizados
2
SRi =
ei
SYX 1 hi
donde
where
hi =
1
+
n
(X X )
( X X )
i
i =1
X
e
X
X
No Lineal
Gerardo Heckmann , FCE - UNC
Lineal
41
42
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
Anlisis Residual de
Homocedasticidad
-8
Salida Excel
Y pronost.
4202.344417
3928.803824
5822.775103
9894.664688
3557.14541
4918.90184
3588.364717
Residuos
-521.3444173
-533.8038245
830.2248971
-351.6646882
-239.1454103
644.0981603
171.6352829
Plot Residuos
X
SR
X
SR
Heterocedasticidad
X
0
Homocedasticidad
1000
2000
3000
4000
5000
6000
Mtrs2
Gerardo Heckmann , FCE - UNC
43
44
Anlisis Residual de
independencia
Anlisis residual de
independencia
Enfoque Grfico
El estadstico Durbin-Watson
No Independiente
e
Independendiente
Tiempo
Tiempo
Patrn Cclico
(e e
45
i =1
Gerardo Heckmann
46
i=2
2
i
Durbin-Watson en PHStat
i 1
D=
=.05
p=1
Gerardo Heckmann
47
Gerardo Heckmann
p=2
dL
dU
dL
dU
15
1.08
1.36
.95
1.54
16
1.10
1.37
.98
1.54
48
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
-9
Usando el Durbin-Watson
H0 :
Hiptesis
Test estadstico
t=
b1 1
donde
where Sb1 =
Sb1
dL
dU
4-dU
4-dL
Gerardo Heckmann
Local
1
2
3
4
5
6
7
Mts2
1,726
1,542
2,816
5,555
1,292
2,208
1,313
Vtas./
Ao
($000)
3,681
3,395
6,653
9,543
3,318
5,563
3,760
La pendiente es
1.487.
H0: 1 = 0
Salida Excel
H1: 1 0
Coef.
= .05
Constante 1636.4147
gl = 7 - 2 = 5
Mts2
1.4866
Valor(es) Crticos:
Rech.
.025
-2.5706 0 2.5706
51
b1 Sb1
Error Est.
451.4953
0.1650
t
P-value
3.6244 0.01515
9.0099 0.00028
Decisin:
Rechazar H0
Rech.
.025
Conclusin:
Hay evidencia de que
el tamao del local
afecta las ventas.
52
Hiptesis
b1 tn 2 Sb1
53
Estadstico de prueba
50
Test Estadstico:
Yi = 1636.415 +1.487Xi
X )2
Ecuacin de
Regresin
Estimada:
Ejemplo: Sucursales
Datos de 7 sucursales:
(X
i =1
d . f . =n-2
n2
G.L.=
49
SYX
n
SSR
1
SSE
(n 2 )
Numerador g.l.=1, denominador g.l.=n-2
F =
54
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
H0: 1 = 0
H1: 1 0
= .05
numerador
gl = 1
denominador
gl = 7 - 2 = 5
Hiptesis
H0: 1 = 0
H1: 1 0
(t )
n2
-10
= F1,n 2
Test:
De la salida de Excel
ANOVA
df
Regression
Residual
Total
1
5
6
Rech.
= .05
55
6.61
F1,n 2
SS
MS
F Significance F
30380456.12 30380456.12 81.179
0.000281
1871199.595 374239.919
32251655.71
Decisin: Rechazar H0
Conclusin:
Hay evidencia de que los
metros cuadrados afectan
las ventas anuales.
56
57
Caractersticas de y r
r = -1
r = -.6
r=0
Y
r = .6
r=1
58
X
59
60
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
-11
Hiptesis
Ejemplo Locales
Hay alguna
evidencia de
correlacin lineal
entre las ventas
anuales y la
superficie del local,
al nivel del .05 de
significacin?
Estadstico
t=
donde
where
1 r2
n2
( X X )(Y Y )
i
r = r2 =
i=1
n
( X X ) (Y Y )
2
i=1
i=1
61
Regression Statistics
Multiple R
0.9705572
R Square
0.94198129
Adjus ted R Square 0.93037754
Standard E rror
611.751517
Observations
7
Ejemplo Locales
62
.9706
t=
=
= 9.0099
1 .9420
1 r 2
5
n2
Valor(es) crticos:
Rech.
Decisin:
Rechazar H0
.025
Conclusin:
Hay evidencias de una
relacin lineal al 5% de
significacin
-2.5706 0 2.5706
Gerardo Heckmann , FCE - UNC
Y | X = X
( X X )2
1
Yi tn2 SYX
+ n i
n
( X i X )2
Rech.
.025
De la salida de Excel
Valor t de una
tabla con gl=n-2
63
i =1
Prediccin de valores
individuales
64
Intervalo para
la media de Y
Intervalo de
prediccin para un
valor individual Yi
1 ( X i X )2
Yi tn2 SYX 1+ + n
n
( X i X )2
i =1
Gerardo Heckmann , FCE - UNC
65
Un X dado
66
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
Ejemplo locales
Datos de 7 locales:
Local
Mtr2
Ventas
Anual
($000)
1
2
3
4
5
6
7
1,726
1,542
2,816
5,555
1,292
2,208
1,313
3,681
3,395
6,653
9,543
3,318
5,563
3,760
Predecir las
ventas anuales
para un local con
2000 mts2.
X = 2350.29
1 ( X X )2
Yi tn2SYX 1+ + n i
= 4610.45 1687.68
n
2
(
X
X
)
i
69
70
Hoja EXCEL
Microsoft Excel
Worksheet
i =1
tn-2 = t5 = 2.5706
68
tn-2 = t5 = 2.5706
i =1
67
SYX = 611.75
SYX = 611.75
1
( X X )2
Yi tn2 SYX
+ n i
= 4610.45 612.66
n
2
X
X
(
)
i
Yi = 1636.415 +1.487Xi
X = 2350.29
-12
71
72
Estadstica II Cat.
Anlisis de Regresin
Captulo 4
-13
Resumen
(continuacin)
Gerardo Heckmann , FCE - UNC
73
74
Resumen
(continuacin)
75
Estadstica II Cat.