Sunteți pe pagina 1din 6

Solución Taller No.

9
Econometría 1 – 2007 II
Prof. Bernal

Para poder estimar el modelo y realizarle posteriormente la prueba de hipótesis sobre la


existencia de correlación serial por medio del estadístico Durbin-Watson, es necesario
declarar la base de datos como una serie de tiempo:

. tsset año, yearly


time variable: año, 1947 to 1988

Así, STATA identifica la base de datos como una serie de tiempo, donde la variable año
es la que representa el indicador de tiempo.

a. El modelo a estimar es:


log(inv) t = B0 + B1 log( pop ) t + B2 log( price) t −1 + u t

El mercado de finca raíz y de construcción no es como cualquier otro, en el


sentido que las transacciones toman tiempo. El tiempo que transcurre entre la
compra y la entrega del bien es muy amplio. Por lo tanto, la decisión de invertir
en vivienda se toma con base en planos o proyectos que en muchos casos no han
empezado a ser construidos. Es decir, la decisión de invertir se da en el momento
en que existe un precio que no es el que se va a tener en el periodo de la entrega
del inmueble. Por lo tanto, en el modelo se incluye el rezago del precio y no el
precio en el periodo t.

b. Los signos esperados del modelo se pueden explicar a través de la teoría


económica de la demanda. En primer lugar, un cambio en la población se puede
asociar con un cambio en la demanda de vivienda. En particular, si aumenta la
población, se genera un choque positivo de demanda y por tanto, se invierte más
en finca raíz. Es decir se espera que B1 sea positivo. Por otro lado, se espera que a
medida que aumentan los precios de la finca raíz se disminuya la demanda de
bienes inmuebles (por la ley de demanda). Por ende, se espera que el signo de B2
sea negativo.

c. Los resultados de la estimación son (no olvidar generar los logaritmos de las
variables y el rezago al índice de precios antes de correr la regresión):

. gen log_inv=log(inv)
. gen log_pop=log(pop)
. gen log_price=log(price)
. gen lag_lprice=log_price[_n-1]
(1 missing value generated)

. reg log_inv log_pop lag_lprice

Source | SS df MS Number of obs = 41


-------------+------------------------------ F( 2, 38) = 62.51
Model | 2.42556385 2 1.21278193 Prob > F = 0.0000

1
Residual | .73728905 38 .019402343 R-squared = 0.7669
-------------+------------------------------ Adj R-squared = 0.7546
Total | 3.1628529 40 .079071322 Root MSE = .13929

------------------------------------------------------------------------------
log_inv | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
log_pop | 1.963615 .2419208 8.12 0.000 1.473872 2.453358
lag_lprice | -1.166681 .5898602 -1.98 0.055 -2.36079 .027429
_cons | -12.5148 2.994132 -4.18 0.000 -18.5761 -6.453495
------------------------------------------------------------------------------

d. Los resultados de la estimación corroboran lo esperado según la teoría económica,


ya que si la población en t aumenta en 1%, se espera que la inversión en finca
raíz se incremente en 1.96% aproximadamente. Por su parte, aumentos en el nivel
de precios en un 1% en el período anterior disminuyen la inversión en finca raíz
en promedio en 1.16%. Al 5% de significancia, sólo el coeficiente asociado a la
población resulta estadísticamente significativo. Sin embargo, el precio rezagado
es estadísticamente significativo al 10%.

e. El gráfico de dispersión entre los residuales contra el tiempo es el siguiente:

. predict uhat, resid


(1 missing value generated)

. twoway connected uhat año


.4
.2
Residuals
0
-.2
-.4

1950 1960 1970 1980 1990


año

Se observa un patrón de los residuales en el tiempo, lo cual sugiere la presencia de


autocorrelación serial. De lo contrario, los residuales deberían estar distribuidos
más aleatoriamente a lo largo del tiempo y no exhibir ningún tipo de tendencia.
Sin embargo, la gráfica sólo es una prueba presuntiva y debe realizar una de tipo
formal.

2
f. El modelo a estimar es:
uˆ t = α + ρuˆ t −1 + vt

Los resultados son:

. gen lag_uhat=uhat[_n-1]
(2 missing values generated)

. reg uhat lag_uhat, nocons

Source | SS df MS Number of obs = 40


-------------+------------------------------ F( 1, 39) = 16.19
Model | .216323672 1 .216323672 Prob > F = 0.0003
Residual | .520964193 39 .013358056 R-squared = 0.2934
-------------+------------------------------ Adj R-squared = 0.2753
Total | .737287865 40 .018432197 Root MSE = .11558

------------------------------------------------------------------------------
uhat | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lag_uhat | .5491713 .1364669 4.02 0.000 .2731409 .8252017
------------------------------------------------------------------------------

Observando el t-estadístico y su correspondiente p-value (4.02 y 0, respectivamente),


se puede rechazar la hipótesis nula H 0 : ρ = 0 . Esto implica que existe una
correlación significativa entre el término de error en t y el término de error en t-1, lo
cual es evidencia de autocorrelación serial. En particular, correlación serial generada
por un proceso autorregresivo de orden 1, AR(1).

g. La fórmula para calcular el estadístico Durbin-Watson es la siguiente:


n

∑ (uˆ t − uˆ t −1 )
2

DW = t =2
n

∑ uˆ
t =1
2
t

La prueba de hipótesis acerca de la existencia de correlación serial corresponde a


H 0 : ρ = 0 (no hay correlación serial). Así, se tiene que:

∑ (uˆ − uˆ t −1 )
2
t = .6667
t =2
n

∑ uˆ
t =1
2
t = .7373
DW = .9043

3
Dado que DW<1.391 para n = 40 y K = 2 (el valor del límite inferior), se rechaza la
hipótesis nula, evidenciando la existencia de correlación serial positiva ( ρ > 0) .

Igualmente, si se usa el estimador de ρ , obtenido de la regresión de los residuales


estimados sobre sus rezagos, y a partir de la aproximación DW = 2(1 − ρ ) , se llega a
un resultado muy parecido del estadístico DW:

. display 2*(1-.5491713)
.9016574

h. Usando los comandos de STATA, los resultados son:


[Recuerde que el comando para obtener la prueba Durbin Watson se debe correr
inmediatamente después de la primera regresión del inciso c. y no después de la
regresión de los residuales presentada en el inciso f. De lo contrario, el resultado es
incorrecto]

reg log_inv log_pop lag_lprice


dwstat

Durbin-Watson d-statistic( 3, 41) = .9043247

El resultado es exactamente el mismo, llevando al mismo criterio de decisión.

i. La presencia de autocorrelación serial implica que los estimadores de MCO obtenidos


en la parte a) aún son insesgados pero las fórmulas de MCO para el cómputo de las
varianzas (y por ende, errores estándar) es incorrecto. Por tanto, las pruebas de
hipótesis o construcción de intervalos de confianza con base en los errores estándar
de la parte a) no son confiables. El problema de autocorrelación se podría corregir de
las siguientes dos maneras : (1) Hallando una transformación del modelo tal que los
errores del modelo transformado cumplan TODOS los supuestos del modelo clásico
lineal. De tal suerte que la estimación por MCO del modelo transformado arroja
estimadores insesgados y errores estándar correctos. Este procedimiento se conoce
como el método de Mínimos Cuadrados Generalizados Factibles (del cual hay dos
versiones: Cocrhane – Orcut y Prais – Winsten), y (2) Estimando las varianzas
robustas a autocorrelación calculando directamente la varianza correcta, es decir,
var(b) = ( X ´ X ) −1 X ´ΣX ( X ´ X ) −1 . Como Σ no es conocida, se debe hallar un
estimador. Este estimador se puede formar fácilmente cuando la autocorrelación es
AR(1) encontrando un estimador para σ 2 de la forma usual (es decir, utilizando un
promedio del cuadrado de los residuales) y un estimador para ρ que se obtiene de
correr una regresion de ût sobre uˆt −1 sin constante.

j. El modelo original es:

log(inv) t = B0 + B1 log( pop ) t + B2 log( price) t −1 + u t (1)

Rezagando este modelo UN período se obtiene:

4
log(inv) t −| = B0 + B1 log( pop ) t −1 + B2 log( price) t − 2 + u t −1

Multiplicando la segunda ecuación por ρ y restando la ecuación resultante de la


ecuación (1) se obtiene la siguiente transformación:

log(inv) t − ρ log(inv) t −1 = (1 − ρ ) B0 + B1 (log( pop) t − ρ log( pop) t −1 )


+ B2 (log( price) t −1 − ρ log( price) t − 2 ) + (u t − ρu t −1 )

lo que equivale a:

log(inv) *t = (1 − ρ ) B0 + B1 log( pop) *t + B 2 log( price) *t −1 + et (2)

donde et = u t − ρu t −1 , y et cumple TODOS los supuestos del modelo clásico lineal.


De esta forma, el modelo (2), que se conoce con el nombre de modelo cuasi-
diferenciado, cumple todos los supuestos del modelo clásico lineal y los estimadores
de MCO de este modelo y los correspondientes errores estándar son correctos. Para
construir las variables “asterisco” del modelo (2) y poderlo estimar por MCO,
necesitamos un estimador de ρ . En particular, utilizamos el estimador de ρ obtenido
en el inciso f):

. gen log_inv_tilda = log_inv - .5491713* lag_linv


(1 missing value generated)

. gen log_pop_tilda = log_pop - .5491713* lag_lpop


(1 missing value generated)

. gen lag_lprice_tilda = lag_lprice - .5491713* lag2_lprice


(2 missing values generated)

k. Los resultados de la estimación por MCO son:

. reg log_inv_tilda log_pop_tilda lag_lprice_tilda

Source | SS df MS Number of obs = 40


-------------+------------------------------ F( 2, 37) = 21.55
Model | .564662855 2 .282331427 Prob > F = 0.0000
Residual | .484685727 37 .013099614 R-squared = 0.5381
-------------+------------------------------ Adj R-squared = 0.5131
Total | 1.04934858 39 .026906374 Root MSE = .11445

------------------------------------------------------------------------------
log_inv_ti~a | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
log_pop_ti~a | 2.445304 .3855195 6.34 0.000 1.664167 3.226441
lag_lprice~a | -2.500552 .8071055 -3.10 0.004 -4.135903 -.8652013
_cons | -8.344219 2.144197 -3.89 0.000 -12.68878 -3.999663
------------------------------------------------------------------------------

Hay que recordar que es necesario dividir el intercepto por 1 − ρ para obtener el
verdadero estimador de éste. Así, el modelo estimado es:

5
log(inv) *t = -18.50864 + 2.445304 log( pop) *t − 2.500552 log( price) *t −1 (3)

Se observa que los signos de los coeficientes siguen siendo los mismos. Sin embargo los
efectos de la población y el nivel de precios sobre la inversión son mucho mayores, en
particular, prácticamente doblan a los del modelo sin transformar. Lo más importante es
que los errores estándar disminuyen significativamente con respecto al modelo estimado
en el inciso a. Como resultado de ello, todas las variables del modelo son ahora
significativas al 1%.

l. Usando el commando de STATA, los resultados son:

. prais log_inv log_pop lag_lprice, corc twostep

Iteration 0: rho = 0.0000


Iteration 1: rho = 0.5492

Cochrane-Orcutt AR(1) regression -- twostep estimates

Source | SS df MS Number of obs = 40


-------------+------------------------------ F( 2, 37) = 21.55
Model | .564663162 2 .282331581 Prob > F = 0.0000
Residual | .484685648 37 .013099612 R-squared = 0.5381
-------------+------------------------------ Adj R-squared = 0.5131
Total | 1.04934881 39 .02690638 Root MSE = .11445

------------------------------------------------------------------------------
log_inv | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
log_pop | 2.445305 .3855196 6.34 0.000 1.664168 3.226442
lag_lprice | -2.500552 .8071055 -3.10 0.004 -4.135903 -.8652009
_cons | -18.50864 4.756125 -3.89 0.000 -28.14547 -8.871816
-------------+----------------------------------------------------------------
rho | .5491713
------------------------------------------------------------------------------
Durbin-Watson statistic (original) 0.904325
Durbin-Watson statistic (transformed) 1.360632

Los resultados coinciden con los obtenidos en el inciso anterior

S-ar putea să vă placă și