Sunteți pe pagina 1din 17

www.monografias.

com

Test de Zivot & Andrews Secuencial

1. Abstract
2. Metodologa para el uso del Test de Zivot & Andrews Secuencial
3. Bibliografa
4. Anexos
Abstract
This paper is based in recent methods of econometrics in economics . The aim of this paper
is to encourage an appreciation of the problems of empirical measurement relationships, and
assessment of the techniques by which those problems may be solved.

The problem under analysis is the efficient estimations parameters from econometric models
where these time series of type unit root with break point.

This working paper developed the techniques econometrics and test of stationary time
series analysis: Zivot & Andrews Test applied to economic time series. Unfortunately,
economic theory is often not rich enough to provide a tight specification of the dynamic
relationship among variables. Furthermore, estimation and inference are complicated by the
fact that endogenous variables may appear on both the left and right sides of the equations.
The Zivot & Andrews Test applied to economic time series is a powerful tool design to
analyze the statistics properties from econometric models.

Metodologa para el uso del Test de Zivot & Andrews Secuencial

Perron (1989) sostuvo que los tradicionales test de raz unitaria (Dickey-Fuller, Dickey-Fuller
Aumentado y Phillips-Perron) tenan poco poder para diferenciar una trayectoria de raz
unitaria de una estacionaria cuando haba cambio estructural. En consecuencia, como estos
test estaban sesgados hacia el no rechazo de la hiptesis nula de raz unitaria, a menudo se
rechazaba incorrectamente la hiptesis alternativa de estacionariedad. Perron encontr, por
ejemplo, que las series de agregados macroeconmicos y financieros utilizados por Nelson y
Plosser (1982) eran en su mayora estacionarias con cambio estructural, en oposicin a lo
que los citados autores sealaban. Siguiendo esta lnea, Zivot y Andrews (1992) 1 elaboraron
un test en la que la fecha del punto de quiebre era determinada endgenamente. Con esta
finalidad se desarroll un programa preparado para E-Views2, correspondiente al test de
Z&A, realizado de manera secuencial, esto ltimo se refiere a que el programa evala la
posible presencia de quiebre estructural en cada observacin de la serie analizada (genera
variables Dummy a partir de la 75ava observacin y termina en la observacin N-75).

Caso 1: Raz Unitaria y NO presencia de quiebre


Tenemos la siguiente serie denominada SERIE3, cuya grfica se muestra a continuacin:

1
Zivot, Eric y Andrews, Donald W.K., 1992, Further Evidence on the Great Crash, the Oil-Price Shock and the Unit-Root
Hypothesis, Journal of Business and Economic Statistics vol.10, nr.3, pp. 251-270.
2
Software utilizado para realizar Anlisis Economtrico. El programa se adjunta en el anexo del documento.
80

60

40

20

-20
50 100 150 200 250 300 350 400 450 500

SERIE3

A simple vista uno podra decir que la serie presenta 3 quiebres en su tendencia, alrededor
de la observacin 160, 230 y 320 respectivamente. Con esta apreciacin, utilizamos nuestro
programa.

Paso previo: Dado que el programa genera dummies continuamente, tanto para quiebres en
media como para quiebres en tendencia, es imprescindible que la serie se encuentre en
formato UNDATED. Colocamos el nombre de la serie en el regln que indica:

genr lserie = (Nombre de la serie a analizar)

Cualquier serie que coloquemos all, el programa cambiar su nombre a lserie, y a partir de
ello realiza sus clculos.

Dado que nuestra serie tiene 500 observaciones, el programa ha generado 350 variables
dummy para quiebre en media (desde DUM75 hasta DUM425) y otras 350 para quiebre en
tendencia (desde DUT75 hasta DUT425)

El ltimo grfico que se muestra, es el que aparece a continuacin:

800

600

400

200

0
50 100 150 200 250 300 350 400 450 500

F FT FM
La lnea roja (FT) muestra el resultado del test F aplicado secuencialmente, para posibles
quiebres en tendencia, la lnea verde (FM), muestra el mismo test, pero para posibles
quiebres en media, la lnea azul (F) es el test F, para ambos casos.
Como se puede aprecia, es la lnea roja la que alcanza valores ms altos, por lo que
podemos concluir que existe evidencia de un POSIBLE quiebre en tendencia, o dicho de
otra forma, si existe quiebre en la serie (y no raz unitaria), este sera quiebre en Tendencia,
y estara alrededor de la observacin 125.

-1

-2

-3

-4

-5
100 150 200 250 300 350 400

ZIVOTM VCRITM

Vemos en este grfico del Test Z&A para quiebre en media, que la lnea asociada al
resultado del test aplicado secuencialmente, no cruza el valor crtico. Como concluimos
inicialmente, si es que haba quiebre, este sera en Tendencia. Lo mismo ocurre para el caso
del Test Z&A aplicado para ambos casos, como se muestra en el siguiente grfico:

-1

-2

-3

-4

-5

-6
100 150 200 250 300 350 400

ZIVOT VCRIT
Veamos el grfico del test Z&A para el caso que nos interesa: la posible existencia de
quiebre en tendencia:

-1.5

-2.0

-2.5

-3.0

-3.5

-4.0

-4.5
100 150 200 250 300 350 400

ZIVOTT VCRITT

Vemos aqu que la lnea azul no cruza el valor crtico, por lo que no existe quiebre en
tendencia. Por lo tanto el comportamiento errtico de la serie, se debera a la presencia de
Raz Unitaria.

La hiptesis nula seria que la serie no presenta quiebre (no cruza la lnea roja),
entonces acepta Ho.

Caso 2: Quiebre en Media, y correccin.


Analizamos ahora la serie denominada serie5, cuya grfica presentamos a continuacin:

120

100

80

60

40

20

-20
50 100 150 200 250 300 350 400 450 500

SERIE5
El grfico del test F es el siguiente:

1200

1000

800

600

400

200
50 100 150 200 250 300 350 400 450 500

F FT FM

Concluimos que podra existir un quiebre en media, alrededor de la observacin 350, y ello
lo contrastaremos con el grfico del Test Z&A para quiebre en media.

-2

-3

-4

-5

-6
100 150 200 250 300 350 400

ZIVOTM VCRITM

Rechaza Ho de no quiebre.

Efectivamente, existe quiebre en media, y el mismo se presenta alrededor de la observacin


350. Cmo determinamos la fecha exacta del quiebre?. En la ventana de las series, al final
de las variables Dummy generadas, hay tres objetos numricos: Fecha, Fechat, y Fecham,
que indican la fecha u observacin que tiene el test F ms alto tanto para ambos casos,
quiebre en tendencia y quiebre en media respectivamente. Como nos interesa el quiebre en
media, hacemos doble click en Fecham, e inmediatamente aparecer en la parte inferior de
la ventana, el nmero 353. Eso quiere decir que el quiebre se da en es observacin, y que la
variable dummy que utilizaremos para corregir es DUM353.. Para finalizar, mostramos los
otros dos grficos restantes.
-2.0 -2

-2.5
-3

-3.0
-4
-3.5

-5
-4.0

-4.5 -6
100 150 200 250 300 350 400 100 150 200 250 300 350 400

Inicialmente, la SERIE5,
ZIVOTT
haba presentado el siguiente resultado enZIVOT
VCRITT
la aplicacin
VCRIT del test de
Raz unitaria (Dickey-Fuller Aumentado):

ADF Test Statistic -3.322979 1% Critical Value* -3.9808


5% Critical Value -3.4208
10% Critical Value -3.1328
*MacKinnon critical values for rejection of hypothesis of a unit root.

Inicialmente habramos dicho que la serie tiene raz unitaria, sin embargo. Ahora podemos
concluir, que eso no necesariamente es as, pues esa conclusin est alterada por la
presencia de un quiebre en la observacin 353. Por lo tanto pasaremos a corregir la serie y
luego de eso aplicar el test DFA, para ver si realmente existe raz unitaria

Correccin.-

El mismo procedimiento se usa para el caso de quiebre en tendencia. Sin embargo,


indicaremos la variacin, en donde se considere necesario.

Como ya sabemos, el quiebre se da en la observacin 353, afortunadamente el programa ya


genero las variables dummy (incluso la DUM353). Si el quiebre hubiera sido en tendencia,
entonces usaramos DUT353.
Corremos la siguiente regresin:

Ls serie5 c dum353

El comportamiento real de serie5, lo est recogiendo el trmino de error de esta ecuacin,


queremos saber que tan significativo es dum353, para luego quitarle ese efecto
distorsionador. Es decir, lo que estamos haciendo es:

Serie5 = + *dum353 + error

Si queremos que desaparezca dum353, lo que tenemos que hacer es generar una nueva
serie denominada Nuevaserie5, que ser:

Nueva serie5= serie5 dum353.

Con la regresin indicada, queremos encontrar el coeficiente asociado a Dum353, para


proceder a realizar la operacin mencionada. Obtenemos el siguiente resultado:
Dependent Variable: SERIE5
Method: Least Squares
Sample: 1 500
Included observations: 500
Variable Coefficient Std. Error t-Statistic Prob.
C 21.05669 0.593630 35.47108 0.0000
DUM353 47.94697 1.094818 43.79447 0.0000
R-squared 0.793870 Mean dependent var 35.15310
Adjusted R-squared 0.793456 S.D. dependent var 24.54128
S.E. of regression 11.15329 Akaike info criterion 7.665338
Sum squared resid 61949.14 Schwarz criterion 7.682196
Log likelihood -1914.334 F-statistic 1917.955
Durbin-Watson stat 1.670467 Prob(F-statistic) 0.000000

Era obvio que Dum353 iba a resultar significativa. De esto, nos interesa el coeficiente
asociado a la dummy, y es: 47.94697. Entonces generamos la siguiente serie:

Genr nuevaserie5 = serie 5 (47.94697*dum353)

El grfico de esta nueva serie5, es el siguiente:

60

40

20

-20
50 100 150 200 250 300 350 400 450 500

NUEVASERIE5

Sin embargo, es conveniente juntar ambos grficos para ver el efecto de la correccin
realizada:
120

100

80

60

40

20

-20
50 100 150 200 250 300 350 400 450 500

NUEVASERIE5 SERIE5

De la NUEVASERIE5, se puede apreciar el cambio a partir de la observacin 353 (recuerde


que hasta la observacin 352, ambas series son iguales), y la estabilidad es notoria. No
habra quiebre en media. Si aplicamos el Test Z&A, encontramos que el grfico asociado al
Test Z&A para quiebre en media, arroja el siguiente resultado:

-4.5

-5.0

-5.5

-6.0

-6.5

-7.0
100 150 200 250 300 350 400

ZIVOTM VCRITM

Es decir rechaza Ho de quiebre estructural

Y el Test de DFA, para raz unitaria, presenta ahora lo siguiente:

ADF Test Statistic -6.359861 1% Critical Value* -3.9808


5% Critical Value -3.4208
10% Critical Value -3.1328
*MacKinnon critical values for rejection of hypothesis of a unit root.

La conclusin es que no haba raz unitaria en la SERIE5, sino un quiebre en media.


Bibliografa

BOX,G.E.P y G.M.JENKINS (1970): Time series analysis,forecasting and control. San


Francisco, Holden day. Pgs. 87.
DICKEY,D.A y W. FLLER (1984): Testing for unit roots in seasonal time series. Journal of
the American Statistical Associations, # 79, pgs. 355-367.
ENGLE,R. y W.GRANJER (1987): Cointegration and error correction representation,
estimation and testing. Econometrica # 55. Pgs 251-276.
GRANJER,C. y P.NEWBOLD (1974): Spurious regressions in econometrics. Journal of
econometrics # 2. Pgs 111-120.
HENDRY, DAVID and RICHARD , JEAN FRANCOIS . (1983): The econometric analysis of
economic time series, International Statistical Review, N 51 , 1983.
SARGAN,J. y A.BHARGAVA. (1983):Testing residuals from least squares regression for
being generated by the Gaussian ramdom walk . Econometrica # 51, pgs 153-174.
SALKEVER, F, KENNETH. (1972): The use Dummy variables to compute predictions error,
and confidence intervals.. Journal of econometrics # 4, ,pgs 393-397.
TRUJILLO CALAGUA, GUSTAVO H :
(1994): Modelos Macroeconomtricos en el Per: nuevos aportes. Edit, Banco De La
Nacin, Gerencia Central de Operaciones de Gobierno. Pgs 320.
(1997): Modelos Economtricos en el Per: 1960-1997 (Compilador), Edit. Santa Rosa . 3
Vol.
(2002): Econometra Aplicada con Eviews 4.1, 1era Edicin.
Zivot, Eric y Andrews, Donald W.K., 1992, Further Evidence on the Great Crash, the Oil-
Price Shock and the Unit-Root Hypothesis, Journal of Business and Economic Statistics
vol.10, nr.3, pp. 251-270.

ANEXOS

ANEXO: 'Programa F Secuenciales Zivot&Andrews, por Gustavo Trujillo Calagua. En


eviews.
=====================================================================
!obs=
'actualizar: nmero de observaciones y serie bajo anlisis
'determina endgenamente el nmero de rezagos a incluir
'en la regresin de las primeras diferencias
=====================================================================
genr lserie=
genr dlserie=d(lserie)
!reg= -1*@ceiling((!obs)^(1/3))
genr t=@trend(1)
!regfin=0
smpl 1 !obs
FOR !rreg=!reg to -1
equation temp.ls dlserie c lserie(-1) dlserie(-1 to !rreg) t
!mcoef=-!rreg+2
!tdist=@tdist(c(!mcoef)/sqr(@covariance(!mcoef,!mcoef)),temp.@regobs-
temp.@ncoef)
IF !regfin=0 and !tdist<0.05 THEN
!regfin=!rreg
genr regfin=!regfin
ENDIF
NEXT
!nui=1
!nuf=!obs
!cotau=!nuf-@ceiling(0.15*!obs)
!cotal=!nui+@ceiling(0.15*!obs)
FOR !num=!cotal to !cotau
smpl !nui !num
genr dum{!num}=0
genr dut{!num}=0
smpl !num+1 !nuf
genr dum{!num}=1
genr dut{!num}=@trend(!num)
IF !regfin=0 then
smpl !nui !nuf
equation eq1.ls dlserie c lserie(-1) t dut{!num} dum{!num}
smpl !num !num
genr zivot=(c(2)/sqr(@covariance(2,2)))
smpl !nui !nuf
equation eq2.ls dlserie c lserie(-1) t dut{!num}
smpl !num !num
genr zivott=(c(2)/sqr(@covariance(2,2)))
smpl !nui !nuf
equation eq3.ls dlserie c lserie(-1) t dum{!num}
smpl !num !num
genr zivotm=(c(2)/sqr(@covariance(2,2)))
ENDIF
IF !regfin<>0 then
smpl !nui !nuf
equation eq1.ls dlserie c lserie(-1) dlserie(-1 to !regfin) t dut{!
num} dum{!num}
smpl !num !num
genr zivot=(c(2)/sqr(@covariance(2,2)))
smpl !nui !nuf
equation eq2.ls dlserie c lserie(-1) dlserie(-1 to !regfin) t dut{!
num}
smpl !num !num
genr zivott=(c(2)/sqr(@covariance(2,2)))
smpl !nui !nuf
equation eq3.ls dlserie c lserie(-1) dlserie(-1 to !regfin) t
dum{!num}
smpl !num !num
genr zivotm=(c(2)/sqr(@covariance(2,2)))
ENDIF
NEXT
smpl !cotal !cotau
genr vcrit=-5.08
genr vcritm=-4.8
genr vcritt=-4.42
plot zivot vcrit
plot zivott vcritt
plot zivotm vcritm
'TEST F secuencial
!bestf=0
!bestft=0
!bestfm=0
FOR !num=!cotal to !cotau
smpl !nui !nuf
equation eq4.ls lserie c t dut{!num} dum{!num}
smpl !num !num
genr f=@f
!f=@f
IF !f>!bestf THEN
!bestf=!f
!fecha=!num
ENDIF
smpl !nui !nuf
equation eq5.ls lserie c t dut{!num}
smpl !num !num
genr ft=@f
!ft=@f
IF !ft>!bestft THEN
!bestft=!ft
!fechat=!num
ENDIF
smpl !nui !nuf
equation eq6.ls lserie c t dum{!num}
smpl !num !num
genr fm=@f
!fm=@f
IF !fm>!bestfm THEN
!bestfm=!fm
!fecham=!num
ENDIF
NEXT
smpl !nui !nuf
scalar fecha=!fecha
scalar fechat=!fechat
scalar fecham=!fecham
scalar bestf = !bestf
scalar bestft = !bestft
scalar bestfm = !bestfm
group fstat f ft fm
plot fstat
=====================================================================
'Para determinar el valor F ms elevado revisar los escalares !bestf, !bestft, !bestfm;
'y para determinar las respectivas fechas, los escalares !fecha, !fechat, !fecham

Trabajo enviado por:

Gustavo Herminio Trujillo Calagua,


Economista de la Universidad Nacional Federico Villareal Lima-Per. Maestra en Economa
Matemtica y Doctor en Economa por Virginia State University, Blacksburg USA.
Consultor de Negocios.
Profesor Asociado de la Escuela de Ingeniera Econmica de la Universidad Cientfica del
Sur, Lima-Per.
Profesor Auxiliar de la Escuela de Administracin de la Universidad Privada San Pedro,
Cajamarca-Per.
Profesor Auxiliar de la Escuela de Economa de la Universidad Nacional de Cajamarca,
Cajamarca-Per.
CATEGORIA:
ECONOMIA/ECONOMETRIA/ECONOMIA MATETICA/POLITICA ECONOMICA
Gtrujillo@ucsur.edu.pe
gustavotrujillo@viabcp.com

Help en STATA
Prueba de raz unitaria de Zivot-Andrews que permite una interrupcin nica en la
interseccin y / o tendencia

zandrews es para usar con datos de series de tiempo. Debe modificar sus datos antes de
usar estas rutinas. Varname puede contener operadores de series temporales. zandrews se
puede aplicar a una sola serie de tiempo dentro de un panel.

maxlags(#) especifica el nmero de retardos adicionales o la cantidad mxima de retardos a


considerar. Debe ser un entero positivo. Si no se especifica, se usa T ^ 0.25. Maxlags se
debe dar con lagmethod (entrada).

trim(#) especifica la fraccin de rango de datos para omitir en cualquier extremo al examinar
posibles puntos de ruptura. Tiene un valor predeterminado de quince por ciento (0.15). TRIM
debe ser un nmero real positivo mayor que 0 y menor que 0.25.

break() selecciona qu elementos del proceso pueden tener un descanso. BREAK puede ser
INTERCEPT, TREND o BOTH. La seleccin predeterminada es intercepto.

lagmethod() Selecciona el mtodo para decidir el nmero de retardos adicionales. Si INPUT,


se usa el nmero de rezagos dados por la opcin MAXLAGS. Si AIC, se utiliza el valor de
mnimo de AIC. Si es BIC, se usa el valor mnimo de BIC. Si es TEST, el nmero de rezagos
es aquel para el cual el ltimo rezago incluido tiene un nivel de significancia marginal menor
que el lmite otorgado por la opcin LEVEL.

level(#) especifica el nivel de significacin de corte para LAGMETHOD=TTEST. Tiene un


valor predeterminado de 0.10. LEVEL debe ser un nmero real entre 0 y 0.25.

graph, solicita un grfico de las estadsticas de la prueba de raz unitaria para los diferentes
puntos de ruptura. El valor predeterminado es NOGRAPH.

http://betaeconomia.blogspot.pe/2014/08/como-hacer-pruebas-de-hipotesis-en-
stata.html

Cmo hacer pruebas de hiptesis en STATA?


BORRADOR
En el documento se presentan algunos comentarios y ejemplos del Cap. 4 (Multiple Regression
Analysis: Inference), del libro de Econometria de Wooldridge 2009 (4ta ed.).

- Las hiptesis deben establecerse antes de mirar los datos.


- El contexto de los ejemplos debe leerse en el libro.

Cmo analizar el estadstico t usando STATA?

**Ejemplo 4.1

*ALTERNATIVA DE UNA COLA

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\wage1.csv ", comma clear

. *Como usar el t para probar h0: Bj=0


. reg lwage educ exper tenure
Source | SS df MS Number of obs = 526
-------------+------------------------------ F( 3, 522) = 80.39
Model | 46.8741796 3 15.6247265 Prob > F = 0.0000
Residual | 101.455581 522 .194359351 R-squared = 0.3160
-------------+------------------------------ Adj R-squared = 0.3121
Total | 148.329761 525 .282532878 Root MSE = .44086

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .092029 .0073299 12.56 0.000 .0776292 .1064288
exper | .0041211 .0017233 2.39 0.017 .0007357 .0075065
tenure | .0220672 .0030936 7.13 0.000 .0159897 .0281448
_cons | .2843595 .1041904 2.73 0.007 .0796755 .4890435
------------------------------------------------------------------------------

. display _b[exper]*3
.01236333

*t calculado 2.31 se compara con el t crtico de la normal(de tabla) (1.645 para 5% de


significancia y 2.326 al 1%), por tanto (tcal>tcriti) la variable es estadsticamente
mayor que cero al 1% de significancia. Cuando se tiene ms de 122 gl se pueden usar
los t de la normal.

*t= Coef. / Std. Err., por tanto siempre tendra el signo del coef, aunque stata
siempre arroja el resultado en terminos absolutos.

**Ejemplo 4.2
*ALTERNATIVA DE UNA COLA

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\meap93.csv ", comma clear

*se prueba la hiptesis de que el tamao de la escuela (enroll) no incide en las


puntuaciones de los exmenes (math10)

. regress math10 totcomp staff enroll

Source | SS df MS Number of obs = 408


-------------+------------------------------ F( 3, 404) = 7.70
Model | 2422.93434 3 807.644779 Prob > F = 0.0001
Residual | 42394.2462 404 104.936253 R-squared = 0.0541
-------------+------------------------------ Adj R-squared = 0.0470
Total | 44817.1805 407 110.115923 Root MSE = 10.244

------------------------------------------------------------------------------
math10 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
totcomp | .0004586 .0001004 4.57 0.000 .0002613 .0006559
staff | .0479199 .039814 1.20 0.229 -.0303487 .1261884
enroll | -.0001976 .0002152 -0.92 0.359 -.0006207 .0002255
_cons | 2.274021 6.113794 0.37 0.710 -9.744801 14.29284
------------------------------------------------------------------------------

*En este caso existen 404 gl, se puede usar la c normal. Al 5% es -1.645, como el t es
-.92 no se puede rechazar h0.

. regress math10 ltotcomp lstaff lenroll

*cambiando la forma funcional se permite reducir el efecto del tamao de la escuela a


medida que esta aumenta

. display _b[lenrol]/100
-.01268042

**Ejemplo 4.3
*ALTERNATIVA DE DOS COLA

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\gpa1.csv ", comma clear

. regress colgpa hsgpa act skipped

------------------------------------------------------------------------------
colgpa | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hsgpa | .4118162 .0936742 4.40 0.000 .2265819 .5970505
act | .0147202 .0105649 1.39 0.166 -.0061711 .0356115
skipped | -.0831131 .0259985 -3.20 0.002 -.1345234 -.0317028
_cons | 1.389554 .3315535 4.19 0.000 .7339295 2.045178
------------------------------------------------------------------------------

*el t de 4.40 de hsgpa muestra que la variables es significativa aun para valores de
significancia muy pequeos. Sin embargo ACT no es significativa.

Otras alternativas de hiptesis respecto a Beta


**Ejemplo 4.4
*En ocasiones es necesario testear sobre si el parmetro asume valores diferentes a
cer. Como por ejemplo 1 o -1. En este caso el valor de t es:
t = (estimacin valor hipottico)/Err. Stan
Regla de rechazo: se rechaza ho si t>c

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\campus.csv ", comma clear

. gen lcrime=ln(crime)
. gen lenrroll=ln(enroll)
. regress lcrime lenrroll

Source | SS df MS Number of obs = 97


-------------+------------------------------ F( 1, 95) = 133.79
Model | 107.083654 1 107.083654 Prob > F = 0.0000
Residual | 76.0358244 95 .800377098 R-squared = 0.5848
-------------+------------------------------ Adj R-squared = 0.5804
Total | 183.119479 96 1.90749457 Root MSE = .89464

------------------------------------------------------------------------------
lcrime | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lenrroll | 1.26976 .109776 11.57 0.000 1.051827 1.487693
_cons | -6.63137 1.03354 -6.42 0.000 -8.683206 -4.579533
------------------------------------------------------------------------------

*Elasticidad estimada lenrroll | 1.26976


* lo que muestra evidencia a favor de mayor a 1.

. test lenrroll=1

( 1) lenrroll = 1

F( 1, 95) = 6.04
Prob > F = 0.0158 //este es el valor critico

. local tvalue=(_b[lenrrol]-1)/_se[lenrrol]
. local pvalue=ttail(120, `tvalue')
. display "T-value: " `tvalue' ", P-value: " `pvalue'
T-value: 2.45737, P-value: .00771259 // T-value: es el t calculado

*al 5% claramente se rechaza h0.

**Ejemplo 4.5

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\hprice2.csv ", comma clear
. gen ldist=ln(dist)
. regress lprice lnox ldist rooms stratio

Source | SS df MS Number of obs = 506


-------------+------------------------------ F( 4, 501) = 175.86
Model | 49.3987735 4 12.3496934 Prob > F = 0.0000
Residual | 35.1834974 501 .070226542 R-squared = 0.5840
-------------+------------------------------ Adj R-squared = 0.5807
Total | 84.5822709 505 .167489645 Root MSE = .265

------------------------------------------------------------------------------
lprice | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnox | -.95354 .1167418 -8.17 0.000 -1.182904 -.7241762
ldist | -.1343401 .0431032 -3.12 0.002 -.2190255 -.0496548
rooms | .2545271 .0185303 13.74 0.000 .2181203 .2909338
stratio | -.0524512 .0058971 -8.89 0.000 -.0640373 -.0408651
_cons | 11.08387 .3181115 34.84 0.000 10.45887 11.70886
------------------------------------------------------------------------------

*se desea probar la elasticidad de lnox.

. scalar tvalue=(_b[lnox]+1)/_se[lnox]

HASTA AQU SE HA UTILIZADO UN PROCEDIMIENTO CLASICO. CALCULAR EL T, SEGN LA HIPOTESIS


PLANTEADA, ELEGIR EL NIVEL DE SIGNIFICANCIA Y LUEGO ENCONTRAR EL T DE TABLA QUE
CORRESPONDE PARA POR ULTIMO COMPARAR.Ahora en vez de testear a distintos niveles de
significancia se calcula el P-value.(Cul es el menor nivel de significancia al que
se rechazara la hiptesis nula?.

P pequeos son evidencia en contra de la hiptesis nula.

Usar el P-valor (p-value) para test de hiptesis en STATA


**Ejemplo 4.6
insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion
a ejercicios de econometria\Base de datos wooldridge\401k.csv ", comma clear

. regress prate mrate age totemp

Source | SS df MS Number of obs = 1534


-------------+------------------------------ F( 3, 1530) = 56.41
Model | 42666.5732 3 14222.1911 Prob > F = 0.0000
Residual | 385718.966 1530 252.103899 R-squared = 0.0996
-------------+------------------------------ Adj R-squared = 0.0978
Total | 428385.539 1533 279.442622 Root MSE = 15.878

------------------------------------------------------------------------------
prate | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
mrate | 5.441433 .5244086 10.38 0.000 4.412797 6.470068
age | .2694073 .0451486 5.97 0.000 .1808477 .3579669
totemp | -.0001298 .0000367 -3.53 0.000 -.0002018 -.0000578
_cons | 80.29429 .7776952 103.25 0.000 78.76882 81.81975
------------------------------------------------------------------------------

. scalar tvalue=(_b[totemp])/_se[totemp]
. scalar pvalue=1-(ttail(1529, tvalue))
. display _b[totemp]*10000
Test de hiptesis usando intervalos de confianza en STATA
**Ejemplo 4.8
PRUEBA DE HIPOTESIS CON INTERVALOS DE CONFIANZA
insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion
a ejercicios de econometria\Base de datos wooldridge\rdchem.csv ", comma clear

. gen lrd=ln(rd)
. gen lsales=ln(sales)
. regress lrd lsales profmarg

Source | SS df MS Number of obs = 32


-------------+------------------------------ F( 2, 29) = 162.24
Model | 85.5970592 2 42.7985296 Prob > F = 0.0000
Residual | 7.65020517 29 .263800178 R-squared = 0.9180
-------------+------------------------------ Adj R-squared = 0.9123
Total | 93.2472644 31 3.00797627 Root MSE = .51361

------------------------------------------------------------------------------
lrd | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lsales | 1.084228 .0601941 18.01 0.000 .9611171 1.207339
profmarg | .0216594 .012782 1.69 0.101 -.0044827 .0478015
_cons | -4.378348 .4680132 -9.36 0.000 -5.335543 -3.421154
------------------------------------------------------------------------------

*STATA proporciona directamente el intervalo de confianza para el estimador al 95% de


significancia. ahora la regla de rechazo depender de si el valor testeado se
encuentra fuera o dentro del intervalo obtenido. En este caso la unidad se encuentra
dentro del intervalo, por lo que no se rechaza la h0; Beta[lsales]=1

HASTA AHORA SOLO SE HAN PROBADO HIPOTESIS RESPECTO A UN SOLO PARAMETRO, NO OBSTANTE
TAMBIEN SE HACE NECESARIO PROBAR HIPOTESIS SOBRE VARIOS ELEMENTOS A LA VEZ.
El estadstico F de significancia conjunta.
*Se estima un modelo, luego se eliminan variables a ver cmo cambian la suma de resdales
al cuadrado y se crea un estadstico a partir de este cambio.

insheet using "C:\Users\Nerys\Documents\Biblioteca\Econometria, libos ebooks\Solucion


a ejercicios de econometria\Base de datos wooldridge\mlb1.csv ", comma clear

estimates store m21, title(Model 1)


regress lsalary years gamesyr bavg hrunsyr rbisyr

estimates store m23, title(Model 2)


regress lsalary years gamesyr

estout m21 m23, cells(b(star fmt(5)) se(par fmt(5))) legend label varlabels(_cons
constant) stats(N r2 rss)

----------------------------------------------------
Model comp~2 Model 2
b/se b/se
----------------------------------------------------
years 0.06886*** 0.07132***
(0.01211) (0.01251)
gamesyr 0.01255*** 0.02017***
(0.00265) (0.00134)
bavg 0.00098
(0.00110)
hrunsyr 0.01443
(0.01606)
rbisyr 0.01077
(0.00717)
constant 11.19242*** 11.22380***
(0.28882) (0.10831)
----------------------------------------------------
N 353.00000 353.00000
r2 0.62780 0.59707
rss 183.18632 198.31150
----------------------------------------------------
* p<0.05, ** p<0.01, *** p<0.001

*Algebraicamente, siempre que se eliminen variables del modelo se incrementa la SRC.


Lo que se busca es ver si este aumento es suficientemente grande como para afirmar que
estas variables son no significativas conjuntamente. Pero para poder probar hiptesis
tambin se necesita un estadstico.

SSE(R): SRC(modelo rest)


SSE(F): SRC(modelo NO rest)
q : No. De variables omitidas
n : # observaciones
k : # variables independientes
(n-k-1)son los grados de libertad del modelo no restringido

Regla de rechazo: F>c

scalar F=((198.31150-183.18632)/3)/(183.18632/(353-5-1))
. display F
9.5502718

*cuando se rechaza h0, se dice que las variables son significativas conjuntamente. Una
manera de llamar los valore crtico de la distribucin F es:

. display invF(3,347,.95)
2.6306415

. display invF(3,347,.99)
3.83852

*por lo que el nmero es superior a los valores crticos, por lo que se rechaza h0 que
indicaba que las variables omitidas no tienen un efecto. Segn Wooldridge esto puede pasar
aunque las variables de forma individual no sean significativas, por cuestin
de correlacin y multicolinialidad que impida ver claramente los efectos parciales.

*valores pequenos de F, muestra evidencia en contra de la Hiptesis nula

S-ar putea să vă placă și