Documente Academic
Documente Profesional
Documente Cultură
REGRESIN
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
5% significance test:
reject H0: 2 = 20 if
z
> 1.96 or
< 1.96
El diagrama resume el procedimiento para llevar a cabo una prueba, con significancia del
5%, para el coeficiente de una regresin, bajo el supuesto de que conocemos su desviacin
estndar.
1
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
reject H0: 2 = 20 if
z
> 1.96 or
< 1.96
Esta es un supuesto poco real. Usualmente, tenemos que estimarlo con el error estndar, y
es lo que usamos al construir el estadstico de prueba en vez de la desviacin estndar.
2
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
reject H0: 2 = 20 if
z
> 1.96 or
< 1.96
Debido a que tenemos que reemplazar la desviacin estndar por el error estndar en el
denominador, el estadstico de prueba tiene una distribucin t en vez de una distribucin
normal.
3
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
5% significance test:
reject H0: 2 = 20 if
reject H0: 2 = 20 if
> 1.96 or
< 1.96
Por consiguiente , nos referimos a este esdadstico de prueba como el estadstico t. Por lo
dems, los procedimientos de la prueba son muy similares a las pruebas de hiptesis de
una distribucin normal.
4
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
5% significance test:
reject H0: 2 = 20 if
reject H0: 2 = 20 if
> 1.96 or
< 1.96
0.4
normal
0.3
0.2
0.1
0
-6
-5
-4
-3
-2
-1
Esta es la grfica de una distribucin normal con media cero y varianza igual a uno.
0.4
normal
t, 10 d.f.
0.3
0.2
0.1
0
-6
-5
-4
-3
-2
-1
0.4
normal
t, 10 d.f.
0.3
0.2
0.1
0
-6
-5
-4
-3
-2
-1
0.4
normal
t, 10 d.f.
0.3
0.2
0.1
0
-6
-5
-4
-3
-2
-1
Incluso cuando el nmero de grados libertad es pequeo, como en este caso, las
distribuciones son muy similares.
9
0.4
normal
t, 10 d.f.
0.3
t, 5 d.f.
0.2
0.1
0
-6
-5
-4
-3
-2
-1
Esta es otra distribucin t, esta vez con slo 5 grados de libertad. Sigue siendo muy similar
a una distribucin normal.
10
0.4
normal
t, 10 d.f.
0.3
t, 5 d.f.
0.2
0.1
0
-6
-5
-4
-3
-2
-1
0.4
normal
t, 10 d.f.
0.3
t, 5 d.f.
0.2
0.1
0
-6
-5
-4
-3
-2
-1
0.1
normal
t, 10 d.f.
t, 5 d.f.
0
-6
-5
-4
-3
-2
-1
0.1
normal
t, 10 d.f.
t, 5 d.f.
0
-6
-5
-4
-3
-2
-1
Ello implica que las regiones de rechazo estn a ms desviaciones estndar de distancia
del cero para una distribucin t que para una distribucin normal.
14
0.1
normal
t, 10 d.f.
t, 5 d.f.
0
-6
-5
-4
-3 -1.96
-2
-1
Por ejemplo, la cola de 2.5% de una distribucin normal comienza a 1.96 desviaciones
estndar de la media.
15
0.1
normal
t, 10 d.f.
t, 5 d.f.
0
-6
-5
-4
-3 -2.33
-2
-1
Pero la cola de 2.5% de una distribucin t con 10 grados de libertad comienza hasta 2.33
desviaciones estndar de la media.
16
0.1
normal
t, 10 d.f.
t, 5 d.f.
0
-6
-5
-4
-3
-2.57-2
-1
Y para una distribucin t con 5 grados de libertad, sta comienza a 2.57 desviaciones
estndar de la media. Es decir que, en general, la distribucin t es ms conservadora que
la normal, pues requiere estadsticos de prueba ms elevados.
17
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1% 0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
Por esta razn, es necesario referirse a una tabla de valores crticos de t al desarrollar una
prueba de significatividad sobre los coeficientes de una ecuacin de regresin.
18
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
Nmero de grados
= nmero de observaciones
numero
parametros
estimados.
1.734
2.101
2.552 de 2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
La columna del lado izquierdo enlista los grados de libertad. El nmero de grados de
libertad en una regresin est definido por el nmero de observaciones menos el nmero
de parmetros estimados.
21
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
Note que a medida que el nmero de grados de libertad se hace ms grande, el valor crtico
converge en 1.96, el valor crtico para la distribucin normal. Esto se debe a que la
distribucin t converge hacia la distribucin normal.
24
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
5% significance test:
reject H0: 2 = 20 if
reject H0: 2 = 20 if
> 1.96 or
< 1.96
25
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
5% significance test:
reject H0: 2 = 20 if
reject H0: 2 = 20 if
> 1.96 or
< 1.96
26
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
Sin por el contrario queremos desarrollar una prueba con 1% significancia, usaramos la
columna indicada arriba. Note que conforme aumentan los grados de libertad, el valor
crtico converge hacia 2.58, que es el valor crtico para de la distribucin normal.
27
18
19
20
600
10%
5%
5%
2.5%
2%
1%
1%
0.5%
0.2%
0.1%
0.1%
0.05%
1.734
2.101
2.552
2.878
3.610
3.922
1.729
2.093
2.539
2.861
3.579
3.883
1.725
2.086
2.528
2.845
3.552
3.850
1.647
1.964
2.333
2.584
3.104
3.307
1.645
1.960
2.326
2.576
3.090
3.291
Para una regresin simple con 20 observaciones, el valor crtico de t con un nivel de 1% es
2.878.
28
s.d. of b2 conocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.d.:
b2 20
z
s.d.
s.d. of b2 desconocido
Discrepancia entre el valor
hipottico y el estimador
muestral, en trminos de s.e.:
b2 20
t
s.e.
5% significance test:
1% significance test:
reject H0: 2 = 20 if
reject H0: 2 = 20 if
> 1.96 or
< 1.96
Por lo que deberamos usar esta cifra para una prueba con un nivel de significancia del 1%.
29
Ejemplo:
p 1 2w u
Ejemplo:
p 1 2w u
H 0 : 2 1; H 1 : 2 1
Puede ser que tomemos como hiptesis nula que el ndice de inflacin de precios aumenta
uniformemente con los salarios, en este caso el verdadero coeficiente b2 sera igual a 1.
31
Ejemplo:
p 1 2w u
H 0 : 2 1; H 1 : 2 1
p 1.21 0.82 w
(0.05) (0.10)
Suponga que la regresin resultante es la que se muestra (con errores estndar entre
parntesis). Nuestra estimacin del coeficiente de inters es solamente 0.82.
Comprobaremos si podemos rechazar la hiptesis nula o no.
32
Ejemplo:
p 1 2w u
H 0 : 2 1; H 1 : 2 1
p 1.21 0.82 w
(0.05) (0.10)
b2 20 0.82 1.00
t
1.80.
s.e.( b2 )
0.10
Ejemplo:
p 1 2w u
H 0 : 2 1; H 1 : 2 1
p 1.21 0.82 w
(0.05) (0.10)
b2 20 0.82 1.00
t
1.80.
s.e.( b2 )
0.10
Ejemplo:
p 1 2w u
H 0 : 2 1; H 1 : 2 1
p 1.21 0.82 w
(0.05) (0.10)
b2 20 0.82 1.00
t
1.80.
s.e.( b2 )
0.10
Y 1 2 X u
En la prctica es inusual hacer una prediccin concreta para los coeficientes estimados. El
objetivo del anlisis es demostrar que Y es influenciada significativamente por X, sin tener
una nocin especfica sobre la magnitud de los verdaderos coeficientes del modelo.
36
Y 1 2 X u
H 0 : 2 0; H 1 : 2 0
En este caso es usual definir 2 = 0 como la hiptesis nula. En palabras, la hiptesis nula
es que X no influencia a Y. Despus, intentamos demostrar que la hiptesis nula es falsa.
37
Y 1 2 X u
H 0 : 2 0; H 1 : 2 0
b2 20
b2
t
s.e.( b2 ) s.e.(b2 )
Y 1 2 X u
H 0 : 2 0; H 1 : 2 0
b2 20
b2
t
s.e.( b2 ) s.e.(b2 )
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
El estadstico t para el intercepto es tambin enorme. Sin embargo, dado que el intercepto
no tiene ningn significado, no tiene sentido realizar una prueba t sobre l.
42
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
La siguiente columna en el resultado da lo que se conoce como los valores p para cada
coeficiente. Esta es la probabilidad de obtener el estadstico t de manera aleatoria, si la
hiptesis nula H0: = 0 fuese verdadera.
43
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
Si p < 0.05, se podra rechazar la hiptesis nula con un nivel de significancia del 5%. Si
fuera menor a 0.01, podramos rechazar al 1%. Si fuera 0.001, podramos rechazar al 0.1%.
Esto, asumiendo pruebas de dos colas.
45
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
En el presente caso p = 0 a tres lugares decimales del coeficiente de S. Esto significa que
podemos rechazar la hiptesis nula H0: b2 = 0 al 0.1%, sin tener que referirnos a la tabla de
valores crticos de t. (La prueba del intercepto no tiene sentido en esta regresin.)
46
. reg EARNINGS S
Source |
SS
df
MS
-------------+-----------------------------Model | 19321.5589
1 19321.5589
Residual | 92688.6722
538 172.283777
-------------+-----------------------------Total | 112010.231
539 207.811189
Number of obs
F( 1,
538)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
540
112.15
0.0000
0.1725
0.1710
13.126
-----------------------------------------------------------------------------EARNINGS |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------S |
2.455321
.2318512
10.59
0.000
1.999876
2.910765
_cons | -13.93347
3.219851
-4.33
0.000
-20.25849
-7.608444
------------------------------------------------------------------------------
Copyright Christopher Dougherty 20002008. This slideshow may be freely copied for
personal use. Traducido por Diego Forcada Gallardo
08.07.08