Sunteți pe pagina 1din 19

ISAIARIKI MIYATAKE MEDINA (R1171-1)

Econometria II
COM – 06230
PRÁCTICA Nº 3
Datos de Panel 1
Corresponde a ejercicios seleccionados de los Capítulos 13 y 14 de Wooldridge.

1. Las siguientes ecuaciones se estimaron usando la base de datos KIELMC.WF1 para los años
1978 y 1981:
𝐿𝑜𝑔̂ (𝑝𝑟𝑖𝑐𝑒)= 11.49 - .547 nearinc +.394 y81*nearinc
(.26) (.058) (.080)
2
n=321, R = .220
y
𝐿𝑜𝑔̂ (𝑝𝑟𝑖𝑐𝑒)= 11.18 + .563 y81 - .403 y81*nearinc
(.27) (.044) (.067)
2
n = 321, R = .337.
Compare las estimaciones para el término de interacción y81*nearinc con aquellas de la
ecuación (13.9). ¿Porque son tan diferentes las estimaciones?
La primera ecuación omite la variable ficticia de 1981, y81, por lo que no permite
ninguna apreciación de los precios nominales de la vivienda durante el período de tres
años en ausencia de un incinerador. El término de interacción en este caso es
simplemente captar el hecho de que incluso las casas que están cerca del sitio del
incinerador se han valorizado en los últimos tres años. Esta ecuación adolece de un
sesgo variable omitido. La segunda ecuación omite la variable ficticia por estar cerca del
sitio del incinerador, nearinc, lo que significa que no permite diferencias sistemáticas en
las viviendas cercanas y distantes del sitio antes de que se construyera el sitio. Si, como
parece ser el caso, el incinerador se ubicó más cerca de las viviendas menos valiosas, y
luego omitió los atributos cercanos a los precios de la vivienda demasiado bajos para el
efecto del incinerador. De nuevo, tenemos un problema variable omitido. Esta es la
razón por la que se prefiere la ecuación (13.9) (o, mejor aún, la ecuación que agrega un
conjunto completo de controles).

2. ¿Por qué no se pueden usar primeras diferencias cuando se tienen cortes transversales
independientes en dos años (contrariamente a los datos de panel)?
No tenemos observaciones repetidas sobre las mismas unidades transversales en cada
período de tiempo, por lo que no tiene sentido buscar pares para diferenciar. Por
ejemplo, en el Ejemplo 13.1, es muy poco probable que la misma mujer aparezca en
más de un año, ya que cada año se obtienen nuevas muestras aleatorias. En el ejemplo
13.3, algunas casas pueden aparecer en la muestra tanto en 1978 como en 1981, pero
la superposición suele ser demasiado pequeña para realizar un verdadero análisis de
datos de panel.
ISAIARIKI MIYATAKE MEDINA (R1171-1)

3. Suponga que se desea estimar el efecto de varias variables sobre el ahorro anual y se tiene
una base de datos de panel sobre personas, recolectada el 31 de enero de 1990 y el 31 de
enero de 1992. Si se incluye una variable binaria para 1992 y se utiliza la primera
diferenciación, ¿es posible incluir además la edad en el modelo original? Explique.
No, no podemos incluir la edad como una variable explicativa en el modelo original.
Cada persona en el conjunto de datos del panel tiene exactamente dos años más el 31
de enero de 1992 que el 31 de enero de 1990. Esto significa que Δagei = 2 para todo i.
Pero la ecuación que estimamos es de la forma

Donde δ 0 es el coeficiente del año ficticio para 1992 en el modelo original. Como
sabemos, cuando tenemos una intersección en el modelo no podemos incluir una
variable explicativa que sea constante en i; esto viola la Asunción MLR.3. Intuitivamente,
dado que la edad cambia en la misma cantidad para todos, no podemos distinguir el
efecto de la edad del efecto del tiempo agregado.

4. i)Usando la base de datos INJURY.WF1, la ecuación estimada cuando afchnge se omite en la


ecuacion (13.12) es
𝐿𝑜𝑔 ̂(𝑑𝑢𝑟𝑎𝑡)= 1.129 + .253 highearn +.198 afchnge*highearn
(0.022) (.042) (.052)
2
n = 5,626, R = .021.
¿Es de sorprender que la estimación de la interacción sea muy cercana a aquella de la ecuación
(13.12)? Explique por qué.

No es sorprendente que el coeficiente en el término de interacción chenvejece poco cuando


afchnge escayó de la ecuación porque el coeficiente de afchnge en (3.12) es solo .0077
(y su estadística t es muy pequeña). The aumenta de .191 a .198 se explica fácilmenteyd por
muestreo
error.

ii) Cuando afchnge se incluye pero highearn se omite, el resultado es


𝐿𝑜𝑔 ̂(𝑑𝑢𝑟𝑎𝑡)= 1.233 - .100 afchnge + .447 afchnge・highearn
(0.023) (.040) (.050)
2
n = 5,626, R =.016.
¿Por qué el coeficiente del término de interacción ahora es mucho mayor que en la ecuación
(13.12)? [Sugerencia: en la ecuacion (13.10), ¿cuál es el supuesto que se hace sobre los grupos
de tratamiento y control si β1 = 0?]

oF señor es soltarped from el equation [así que eso 10b= en (3.10)], thEstamos en la carne
asadaEn g que, antes de tél cambia en política, allíe no hay diferencia en promedioe duración
ISAIARIKI MIYATAKE MEDINA (R1171-1)

entre alta ganadores y bajoganadores Pero the muy grande (.256), altamente estáticosigno
ticallysignificativo estienes el oyen en(3.12) shows esta presumption ser false. Antes de lacha
políticange, la horeja altay grupo gastó alrededor del 29,2% [exp(.256) 1 .292−≈ ] más tiempo
Compensacion por desempleo que el bajo ganando group. Por dropping highearn de la
regresión, nos attribute al cambio de política la diferenteuna vez entreen the two grupos
dijeront by mirard sin unla intervenciónntion

E J E R C I C I O S E N COM P U TADORA

C.1. Utilice la base de datos FERTIL1.WF1 para este ejercicio.


i) En la ecuacion estimada del ejemplo 13.1, pruebe si las condiciones de vida a los16 años
influyen sobre la fertilidad. (El grupo base es una ciudad grande.) Informe el valor del
estadístico F y el valor-p.

Dependent Variable: KIDS


Method: Least Squares
Date: 09/12/17 Time: 20:32
Sample: 1 1129
Included observations: 1129

Variable Coefficient Std. Error t-Statistic Prob.

EDUC -0.128427 0.018349 -6.999272 0.0000


AGE 0.532135 0.138386 3.845283 0.0001
AGESQ -0.005804 0.001564 -3.710324 0.0002
BLACK 1.075658 0.173536 6.198484 0.0000
EAST 0.217324 0.132788 1.636626 0.1020
NORTHCEN 0.363114 0.120897 3.003501 0.0027
WEST 0.197603 0.166913 1.183867 0.2367
FARM -0.052557 0.147190 -0.357072 0.7211
OTHRURAL -0.162854 0.175442 -0.928248 0.3535
TOWN 0.084353 0.124531 0.677367 0.4983
SMCITY 0.211879 0.160296 1.321799 0.1865
Y74 0.268183 0.172716 1.552737 0.1208
Y76 -0.097379 0.179046 -0.543881 0.5866
Y78 -0.068666 0.181684 -0.377945 0.7055
Y80 -0.071305 0.182771 -0.390136 0.6965
Y82 -0.522484 0.172436 -3.030016 0.0025
Y84 -0.545166 0.174516 -3.123871 0.0018
C -7.742457 3.051767 -2.537040 0.0113

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 1.158765 (4, 1111) 0.3275


Chi-square 4.635061 4 0.3268

Null Hypothesis: C(8)=C(9)=C(10)=C(11)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.


ISAIARIKI MIYATAKE MEDINA (R1171-1)

C(8) -0.052557 0.147190


C(9) -0.162854 0.175442
C(10) 0.084353 0.124531
C(11) 0.211879 0.160296

Restrictions are linear in coefficients.


Las condiciones de vida a los16 años no influyen sobre la fertilidad. el valor del estadístico F=1.1587
y el valor-p= 0.3275 lo cual son conjuntamente insignificativos

ii) Pruebe si la región del país a los 16 años (el Sur es el grupo base) influye sobre la fertilidad.

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 3.011656 (3, 1111) 0.0293


Chi-square 9.034968 3 0.0288

Null Hypothesis: C(5)=C(6)=C(7)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(5) 0.217324 0.132788


C(6) 0.363114 0.120897
C(7) 0.197603 0.166913

Restrictions are linear in coefficients.

Si la región del país a los 16 años si influye sobre la fertilidad F=3.011656 y el valor-p=0.0293

iii) Sea u el termino de error en la ecuación de la población. Suponga que piensa que la varianza
de u cambia con el tiempo (pero no con educ, age, etc.). Un modelo que captura esto es
u2 = y0 + y1y74 +y2 y76 +… +y6y84 + v.
Usando este modelo, pruebe si hay heterocedasticidad en u. (Sugerencia: su prueba F debe
tener 6 y 1,122 grados de libertad.)
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 2.904782 (6, 1122) 0.0082


Chi-square 17.42869 6 0.0078

Null Hypothesis: C(2)=C(3)=C(4)=C(5)=C(6)=C(7)=0


Null Hypothesis Summary:
ISAIARIKI MIYATAKE MEDINA (R1171-1)

Normalized Restriction (= 0) Value Std. Err.

C(2) -1.072178 0.362318


C(3) -0.769816 0.373997
C(4) -0.955906 0.379911
C(5) -1.211021 0.380609
C(6) -0.922060 0.356263
C(7) -1.371924 0.360371

Restrictions are linear in coefficients.

existe indicio de heterocedasticidad


iv) Añada los términos de interacción y74・educ, y76・educ, …, y84・educ al modelo estimado
de la tabla 13.1. Explique que representan estos términos. ¿Son conjuntamente
significativos?
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 1.483569 (6, 1105) 0.1803


Chi-square 8.901416 6 0.1792

Null Hypothesis: C(19)=C(20)=C(21)=C(22)=C(23)=C(24)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(19) -0.056425 0.072561


C(20) -0.092100 0.070875
C(21) -0.152387 0.075282
C(22) -0.097905 0.070452
C(23) -0.138945 0.068371
C(24) -0.176097 0.069915

Restrictions are linear in coefficients.

Estos término de interacción no son conjuntamente significativo

C.2. Utilice la base de datos CPS78_85.WF1 para este ejercicio.


i) ¿Cómo interpreta el coeficiente de y85 en la ecuacion (13.2)? ¿Tiene una interpretación
interesante? (Tenga cuidado aquí; debe considerar los términos de interacción y85・educ y
y85・female.)
Si se mantienen otros factores fijos, ¿cuál es el incremento porcentual estimado en el salario
nominal para un hombre con 12 años de educación? Proponga una regresión para obtener un
intervalo de confianza para esta estimación. [Sugerencia: para obtener el intervalo de
confianza, remplace y85・educ con y85・ (educ -12); remítase al ejemplo6.3.]
log(wage)=.459 +.118y85 + .0747educ +.0185y85 * educ + .0296exper - .00040 exper² + .202 union
(.093) (.124) (.0067) (.0094) (.0036) (.00008) (.030)

- .317 female + .085 y85_female


(.037) (.051)
n _ 1,084, R2 _ .426,
-
R 2 _ .422.
ISAIARIKI MIYATAKE MEDINA (R1171-1)

El coeficiente de y85 tiene una relación directa positiva con el salario por hora del trabajador al igual
que con y85・educ y y85・female, asique si la dammy se activa aumentara el salario
del trabajador
log(wage)=.459 + .0747educ +.0185y85 * educ
log(wage)=.459 + .0747(12) +.0185(1)* (12)
log(wage)=1.5774
tiene un aumento de 1.5774 por hora

Dependent Variable: LWAGE


Method: Least Squares
Date: 09/29/19 Time: 22:41
Sample: 1 1084
Included observations: 1084

Variable Coefficient Std. Error t-Statistic Prob.

C 1.806093 0.015974 113.0674 0.0000


EDUC-12 0.041587 0.007687 5.410288 0.0000
Y85*(EDUC-12) 0.057826 0.010921 5.294781 0.0000

R-squared 0.141079 Mean dependent var 1.867301


Adjusted R-squared 0.139490 S.D. dependent var 0.542804
S.E. of regression 0.503525 Akaike info criterion 1.468397
Sum squared resid 274.0740 Schwarz criterion 1.482203
Log likelihood -792.8713 Hannan-Quinn criter. 1.473624
F-statistic 88.77804 Durbin-Watson stat 1.743216
Prob(F-statistic) 0.000000

Otra forma

ii) Vuelva a estimar la ecuacion (13.2) pero mida todos los salarios en dólares de 1978. En
particular, defina el salario real como rwage= wage para 1978 y como rwage =wage/1.65 para
1985. Ahora, use log(rwage) en lugar de log(wage) al estimar la ecuación (13.2). ¿Cuáles
coeficientes difieren de aquellos de la ecuacion (13.2)?
Dependent Variable: LWAGE
Method: Least Squares
Date: 09/29/17 Time: 22:52
Sample: 1 1084
Included observations: 1084

Variable Coefficient Std. Error t-Statistic Prob.

C 0.576739 0.101460 5.684402 0.0000


Y78 -0.117806 0.123782 -0.951725 0.3415
EDUC 0.093181 0.007109 13.10704 0.0000
Y78*EDUC -0.018461 0.009354 -1.973509 0.0487
EXPER 0.029584 0.003567 8.293165 0.0000
EXPERSQ -0.000399 7.75E-05 -5.151307 0.0000
UNION 0.202132 0.030294 6.672233 0.0000
FEMALE -0.231657 0.036114 -6.414653 0.0000
Y78*FEMALE -0.085052 0.051309 -1.657644 0.0977

R-squared 0.426186 Mean dependent var 1.867301


Adjusted R-squared 0.421915 S.D. dependent var 0.542804
S.E. of regression 0.412704 Akaike info criterion 1.076097
Sum squared resid 183.0991 Schwarz criterion 1.117513
Log likelihood -574.2443 Hannan-Quinn criter. 1.091776
F-statistic 99.80353 Durbin-Watson stat 1.918367
Prob(F-statistic) 0.000000
ISAIARIKI MIYATAKE MEDINA (R1171-1)

Cambian de manera inversa todos los que fueron reemplazados de y85 por y78 y también cambian educ que
aumento y female que aumento de manera negativa todos lo demás variables no se modificaron sus coeficientes

C.3 Use los datos de KIELMC.WF1 para este ejercicio.


i) La variable dist es la distancia de cada casa al incinerador, en pies. Considere el modelo
Log (price) = β0 + δ0 y81 +β1log(dist) +δ1y81・log(dist) + u.
Si la construcción del incinerador reduce el valor de las casas más cercanas a su ubicación,¿Cuál
es el signo deδ1? ¿Qué significa si β1> 0?
Dependent Variable: LPRICE
Method: Least Squares
Date: 09/12/17 Time: 21:07
Sample: 1 321
Included observations: 321

Variable Coefficient Std. Error t-Statistic Prob.

C 8.058468 0.508436 15.84953 0.0000


Y81 -0.011311 0.805062 -0.014050 0.9888
LDIST 0.316689 0.051532 6.145451 0.0000
Y81*LDIST 0.048186 0.081793 0.589125 0.5562

R-squared 0.395795 Mean dependent var 11.37812


Adjusted R-squared 0.390077 S.D. dependent var 0.438174
S.E. of regression 0.342204 Akaike info criterion 0.705561
Sum squared resid 37.12173 Schwarz criterion 0.752557
Log likelihood -109.2425 Hannan-Quinn criter. 0.724325
F-statistic 69.21884 Durbin-Watson stat 1.394813
Prob(F-statistic) 0.000000

El signo de δ1 es negativo -0.011311, si β1> 0 significa que tiene una relación directamente
proporcional con el precio es decir mientras mas aumente la distancia de la casa al incinerador
se valorara más el precio .

ii) Estime el modelo del inciso i) e informe los resultados de la manera acostumbrada.Interprete
el coeficiente de y81・log(dist). ¿Que concluye a partir de esto?
El coeficiente de Y81*ldist es inversamente proporcional con el precio.

iii) Añada age, age 2, rooms, baths, log(intst), log(land) y log(area) a la ecuacion. Ahora,¿Cuál es su
conclusion acerca del efecto del incinerador sobre los valores de lasCasas?
Dependent Variable: LPRICE
Method: Least Squares
Date: 09/12/17 Time: 21:17
Sample: 1 321
Included observations: 321

Variable Coefficient Std. Error t-Statistic Prob.

C 7.673853 0.501572 15.29961 0.0000


Y81 -0.225446 0.494691 -0.455731 0.6489
LDIST 0.000923 0.044617 0.020679 0.9835
Y81*LDIST 0.062467 0.050279 1.242408 0.2150
AGE -0.008007 0.001417 -5.649774 0.0000
AGESQ 3.57E-05 8.71E-06 4.099486 0.0001
ROOMS 0.046139 0.017344 2.660193 0.0082
BATHS 0.101048 0.027822 3.631888 0.0003
ISAIARIKI MIYATAKE MEDINA (R1171-1)

LINTST -0.059976 0.031722 -1.890684 0.0596


LLAND 0.095343 0.024725 3.856081 0.0001
LAREA 0.350743 0.051949 6.751739 0.0000

R-squared 0.787021 Mean dependent var 11.37812


Adjusted R-squared 0.780151 S.D. dependent var 0.438174
S.E. of regression 0.205452 Akaike info criterion -0.293545
Sum squared resid 13.08522 Schwarz criterion -0.164305
Log likelihood 58.11391 Hannan-Quinn criter. -0.241942
F-statistic 114.5541 Durbin-Watson stat 1.691483
Prob(F-statistic) 0.000000

La distancia de la casa al incinerador dejo de ser estadísticamente significativo cuando se aumenta nuevo
atributos al modelo

iv) ¿Por qué el coeficiente de log(dist) es positivo y estadísticamente significativo en elIncisoii) pero
no en el inciso iii)? ¿Qué dice esto sobre los controles usados en el incisoiii)?
el coeficiente de ldist dejo de ser estadísticamente significativo ya que existe nuevo atributos
en el modelo que cambian la influencia que tiene la distancia de la casa al incinerador sobre el
precio
C.4 Utilice los datos de RENTAL.WF1 para este ejercicio. Los dat3os para los años 1980 y 1990
incluyen precios de arrendamiento (rent) y otras variables de las ciudades universitarias.
Laidea es ver si una mayor presencia de los estudiantes influye en las tasas de arrendamiento.
El modelo de efectos inobservables es
Log(rente it) = β0 + δ0y90t + β1log( popit) +β 2log(avgincit) + β 3pctstuit + a i +uit,

Donde pop es la poblacion de la ciudad, avginc es el ingreso promedio y pctstu es la población


estudiantil expresada como un porcentaje de la poblacion de la ciudad (durante el año escolar).
i) Obtenga la estimación combinada por MCO y reporte los resultados en la forma acostumbrada.
¿Qué significa el coeficiente estimado de la variable binaria de 1990? ¿Qué Obtiene para 𝛽̂ pctstu?
Dependent Variable: LRENT
Method: Least Squares
Date: 09/29/17 Time: 23:09
Sample: 1 128
Included observations: 128

Variable Coefficient Std. Error t-Statistic Prob.

C -0.568806 0.534881 -1.063425 0.2897


Y90 0.262227 0.034763 7.543222 0.0000
LPOP 0.040686 0.022515 1.807042 0.0732
LAVGINC 0.571446 0.053098 10.76209 0.0000
PCTSTU 0.005044 0.001019 4.948629 0.0000

R-squared 0.861281 Mean dependent var 5.746195


Adjusted R-squared 0.856770 S.D. dependent var 0.332707
S.E. of regression 0.125915 Akaike info criterion -1.268135
Sum squared resid 1.950124 Schwarz criterion -1.156728
Log likelihood 86.16066 Hannan-Quinn criter. -1.222870
F-statistic 190.9219 Durbin-Watson stat 1.235889
Prob(F-statistic) 0.000000

En el año 90 la renta aumento en 0,26 por cada porciento que aumente y de PCTSTU que es la población estudiantil
nos dice que por cada aumento de 10% de la población la renta subirá un 0.05
ii) ¿Son válidos los errores estandar que reporto en el inciso i)? Explique las razones.
ISAIARIKI MIYATAKE MEDINA (R1171-1)

No son validos por que existe correlación correlación


iii) Ahora diferencie la ecuación y estime por MCO. Compare el estimador de βpctstu con el
Estimador del inciso ii). ¿El tamaño relativo de la poblacion estudiantil parece influir
en el precio de la renta?
Dependent Variable: CLRENT
Method: Least Squares
Date: 09/29/17 Time: 23:31
Sample (adjusted): 2 128
Included observations: 64 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

Y90 0.385521 0.036824 10.46916 0.0000


CLPOP 0.072246 0.088343 0.817788 0.4167
CLAVGINC 0.309961 0.066477 4.662664 0.0000
CPCTSTU 0.011203 0.004132 2.711396 0.0087

R-squared 0.322262 Mean dependent var 0.559677


Adjusted R-squared 0.288375 S.D. dependent var 0.106838
S.E. of regression 0.090126 Akaike info criterion -1.914754
Sum squared resid 0.487362 Schwarz criterion -1.779824
Log likelihood 65.27212 Hannan-Quinn criter. -1.861598

El tamaño relativo de la poblacion estudiantil si parece influir en el precio de la renta ya que un


aumneto de la población estudiantil de 10% la renta aumentara en 1 pero no tiene un fuerte
efecto sobre el aumento

Iv) Obtenga los errores estándar robustos a la heterocedasticidad de la ecuación en primera


diferencia del inciso iii). ¿Cambian sus conclusiones?

Dependent Variable: CLRENT


Method: Least Squares
Date: 09/29/17 Time: 23:38
Sample (adjusted): 2 128
Included observations: 64 after adjustments
White heteroskedasticity-consistent standard errors & covariance

Variable Coefficient Std. Error t-Statistic Prob.

Y90 0.385521 0.048719 7.913226 0.0000


CLPOP 0.072246 0.069680 1.036825 0.3040
CLAVGINC 0.309961 0.089310 3.470617 0.0010
CPCTSTU 0.011203 0.002936 3.815872 0.0003

R-squared 0.322262 Mean dependent var 0.559677


Adjusted R-squared 0.288375 S.D. dependent var 0.106838
S.E. of regression 0.090126 Akaike info criterion -1.914754
Sum squared resid 0.487362 Schwarz criterion -1.779824
Log likelihood 65.27212 Hannan-Quinn criter. -1.861598

cambian los t statistic disminuyendo algunos y otros aumentándolos pero la significancia no cambian

C.5 Utilice la base de datos CRIME3.WF1 para este ejercicio.


ISAIARIKI MIYATAKE MEDINA (R1171-1)

i. En el modelo del ejemplo 13.6, pruebe la hipotesis H0: β1=β2. (Sugerencia: defina Ɵ1 = β1–
β2 y escriba β1 en función de Ɵ1 y β2. Sustituya esto en la ecuación y ordene los términos.
Haga una prueba t paraƟ1.)

Puede usar un paquete de software de econometría que pruebe directamente restricciones como
H0: β 1 = β 2 después de estimar el modelo sin restricciones en (13.22). Pero, como hemos visto
muchas veces, simplemente podemos reescribir la ecuación para probar esto usando cualquier
software de regresión. Escribe la ecuación diferenciada como
Δlog(crime) = δ 0 + β 1Δclrprc_1 + β 2Δclrprc_2 + Δu.

ii. Si β1 = β2, demuestre que la ecuación en diferencia puede escribirse como


Δlog(crimei) = δ0 +δ1Δavgclri+Δui , donde, δ1 = 2β1 y avgclri= (clrprci,_1 + clrprci,_2)/2 es el
promedio del porcentaje de casos resueltos en los dos años anteriores
Con β 1 = β 2 la ecuación se convierte (sin el subíndice i)
Δlog(crime) = δ 0 + β 1(Δclrprc-1 + Δclrprc-2) + Δu
= δ 0 + δ 1[(Δclrprc-1 + Δclrprc-2)/2] + Δu
Con δ 1 = 2 β 1. But (Δclrprc-1 + Δclrprc-2)/2 = Δavgclr.
iii. Estime la ecuación del inciso ii). Compare la R-cuadrada ajustada con aquella de la ecuación
(13.22). ¿Qué modelo utilizaría finalmente?
Δlog(crime) = .099 − .0167 Δavgclr
( 0.063) (0.0051)
Como no rechazamos la hipótesis en la parte (i), estaríamos justificados al usar el modelo más
simple con avgclr. Según el R cuadrado ajustado, tenemos un ajuste ligeramente peor con la
restricción impuesta. Pero esta es una consideración menor. Idealmente, podríamos obtener
más datos para determinar si las estimaciones sin restricciones bastante diferentes de β 1 y β 2
en la ecuación (13.22) revelan verdaderas diferencias en β 1 y β 2.
C.6 Utilice la base de datos GPA3.WF1 para este ejercicio. La base de datos es para 366 estudiantes
atletas de una universidad grande, para los semestres de otoño y primavera. [Un Análisis similar
se halla en Maloney y McCormick (1993), pero aquí se utiliza un verdaderoConjunto de datos
de panel]. Como se cuenta con datos de dos semestres para cada estudiante, resulta adecuado
un modelo de efectos inobservables. La primera interrogante de interés es la siguiente: ¿los
estudiantes atletas tienen un menor aprovechamiento en la escuela durante el semestre en
que su deporte esta en temporada?

i) Utilice MCO combinados para estimar un modelo con el promedio de calificaciones del semestre
(trmgpa) como variable dependiente y como variables explicativas spring, sat, hsperc, female,
black, white, frstsem, tothrs, crsgpa y season. Interprete el coeficiente de season (variable
binaria igual a uno si el deporte esta en temporada). ¿Es estadísticamente significativo?
Dependent Variable: TRMGPA
Method: Least Squares
Date: 09/15/17 Time: 11:59
Sample: 1 732
Included observations: 732

Variable Coefficient Std. Error t-Statistic Prob.

C -1.752847 0.347905 -5.038295 0.0000


SPRING -0.058007 0.048037 -1.207545 0.2276
SAT 0.001698 0.000149 11.36710 0.0000
HSPERC -0.008661 0.001036 -8.357825 0.0000
ISAIARIKI MIYATAKE MEDINA (R1171-1)

FEMALE 0.350401 0.051852 6.757666 0.0000


BLACK -0.254149 0.122922 -2.067574 0.0390
WHITE -0.023315 0.117395 -0.198599 0.8426
FRSTSEM -0.034659 0.076034 -0.455826 0.6487
TOTHRS -0.000339 0.000727 -0.466390 0.6411
CRSGPA 1.047865 0.104114 10.06456 0.0000
SEASON -0.027290 0.049046 -0.556423 0.5781

R-squared 0.477563 Mean dependent var 2.330246


Adjusted R-squared 0.470317 S.D. dependent var 0.758262
S.E. of regression 0.551858 Akaike info criterion 1.663863
Sum squared resid 219.5789 Schwarz criterion 1.732925
Log likelihood -597.9737 Hannan-Quinn criter. 1.690504
F-statistic 65.90696 Durbin-Watson stat 1.514998
Prob(F-statistic) 0.000000

El coeficiente de season tiene una relación inversa con el promedio de notas, pero no es
estadísticamente significativo es decir que no tiene mucha influencia sobre el promedio de
notas.

ii) La mayoría de los atletas que realiza su deporte solo en el otoño son jugadores de Futbol
americano. Suponga que sus niveles de capacidad innata difieren de forma sistemática de los
de otros atletas. Si la capacidad no se captura adecuadamente por medio de las puntuaciones
de la prueba de admisión a la universidad (sat) y el percentil que ocupo en el bachillerato
(hsperc), explique por qué los estimadores obtenidos estarán sesgados.

Los estimadores obtenidos estarán sesgados, porque existe correlación causada por variables
omitidas.

iii) Utilice los datos diferenciados entre los dos semestres. ¿Qué variables se eliminan? Ahora
pruebe el efecto de que el deporte este en temporada.
Dependent Variable: CTRMGPA
Method: Least Squares
Date: 09/18/17 Time: 12:00
Sample (adjusted): 2 732
Included observations: 366 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.236561 0.205970 -1.148523 0.2515


CFRSTSEM 0.019147 0.069266 0.276425 0.7824
CTOTHRS 0.012154 0.014391 0.844549 0.3989
CCRSGPA 1.136355 0.118812 9.564335 0.0000
CSEASON -0.064503 0.042522 -1.516951 0.1302

R-squared 0.208009 Mean dependent var 0.015683


Adjusted R-squared 0.199234 S.D. dependent var 0.646361
S.E. of regression 0.578400 Akaike info criterion 1.756463
Sum squared resid 120.7711 Schwarz criterion 1.809778
Log likelihood -316.4328 Hannan-Quinn criter. 1.777649
F-statistic 23.70335 Prob(F-statistic) 0.000000

Las variables que se eliminan son sat black female hperc. No existe evidencia de que los
ISAIARIKI MIYATAKE MEDINA (R1171-1)

estudiantes bajen su rendimiento de estudio cuando están en temporada de juego, pero si


pueden bajar un 6.4%.

C.7 La base de datos VOTE2.WF1 incluye datos de panel sobre las elecciones para la Cámara de
Representantes de los Estados Unidos en 1988 y 1990. Solo los ganadores de 1988 que también
compitieron en 1990 aparecen en la muestra; se trata de titulares del cargo. Un modelo de
efectos inobservables que explica el porcentaje del voto obtenido por los titulares del cargo
(vote) en términos de gastos de los dos candidatos es
voteit = β0 + δ0d90t+ β1log(inexpit) + β2log(chexpit) + β3incshrit+ ai +uit,

Donde incshrit es la parte del total de gastos de campaña correspondiente a los titulares del cargo
(en forma de porcentaje), inexp y chexp son los gastos en dólares del candidato titular del cargo y
del candidato opositor, respectivamente. El efecto inobservable ai contiene características del
titular del cargo, como la “calidad”, además de aspectos sobre el distrito que son constantes. El
género y el partido del titular son constantes en el tiempo, de manera que estan contenidos en ai.
Lo que interesa es el efecto de los gastos de campaña en los resultados de las elecciones.
i) Diferencie la ecuacion dada a lo largo de los dos años y estime por MCO la ecuación en
diferencias. ¿Qué variables son significativas individualmente al nivel de 5%, contra una
alternativa de dos colas?
ΔVoteit = −2.56 − 1.29 Δlog(inexp) − .599 Δlog(chexp) + .156 Δincshr Δ
(0.63) (1.38) (.711) (.064)
n = 157, R2 = .244, 2 R = .229
Solo Δincshr es estadísticamente significativo al nivel del 5% (estadístico t ≈ 2.44, valor p .016). Las
otras dos variables independientes tienen t estadísticas menos de una en valor absoluto.
iii) En la ecuación del inciso i), haga una prueba de significancia conjunta para Δlog(inexp) y
Δlog(chexp). Reporte el valor-p.
El estadístico F (con 2 y 153 df) es aproximadamente 1.51 con valor p ≈ .224. Por lo tanto, Δlog
(inexp) y Δlog (chexp) son conjuntamente insignificantes incluso al nivel del 20%

iv) Vuelva a estimar la ecuación del inciso i) con Δincshr como la única variable independiente.
Interprete el coeficiente de Δincshr. Por ejemplo, si la parte de gastos del titular del cargo aumenta
10 puntos porcentuales, según su predicción ¿cómo se afecta el porcentaje de votos obtenido por
el titular?
voteΔ = −2.68 + .218 Δincshr
(0.63) (.032)
n = 157, R2 = .229, 2 R = .224.

Esta ecuación implica que un aumento de 10 puntos porcentuales en la participación del titular del
gasto total aumenta el porcentaje del voto del titular en aproximadamente 2.2 puntos
porcentuales.

C.8 Utilice la base de datos CRIME4.WF1 para este ejercicio.


i) A la ecuación del ejemplo 13.9, añada los logaritmos de cada variable de salario en la base de
datos y estime el modelo en primera diferencia. ¿Cómo afecta la inclusión de estas variables a
los coeficientes de las variables de justicia penal del ejemplo 13.9?
Dependent Variable: CLCRMRTE
Method: Least Squares
Date: 10/01/17 Time: 12:58
ISAIARIKI MIYATAKE MEDINA (R1171-1)

Sample (adjusted): 2 630


Included observations: 540 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.007713 0.017058 0.452187 0.6513


D83 -0.099866 0.023895 -4.179315 0.0000
D84 -0.047937 0.023502 -2.039710 0.0419
D85 -0.004611 0.023500 -0.196220 0.8445
D86 0.027514 0.024149 1.139339 0.2551
D87 0.040827 0.024415 1.672178 0.0951
CLPRBARR -0.327494 0.029980 -10.92370 0.0000
CLPRBCON -0.238107 0.018234 -13.05829 0.0000
CLPRBPRI -0.165046 0.025969 -6.355506 0.0000
CLAVGSEN -0.021761 0.022091 -0.985050 0.3250
CLPOLPC 0.398426 0.026882 14.82128 0.0000

R-squared 0.432514 Mean dependent var 0.001998


Adjusted R-squared 0.421786 S.D. dependent var 0.202932
S.E. of regression 0.154310 Akaike info criterion -0.879542
Sum squared resid 12.59638 Schwarz criterion -0.792121
Log likelihood 248.4764 Hannan-Quinn criter. -0.845352
F-statistic 40.31816 Durbin-Watson stat 2.464999
Prob(F-statistic) 0.000000

Dependent Variable: CLCRMRTE


Method: Least Squares
Date: 10/01/17 Time: 12:57
Sample (adjusted): 2 630
Included observations: 540 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.027886 0.021891 1.273882 0.2033


D83 -0.101491 0.026374 -3.848138 0.0001
D84 -0.042128 0.024986 -1.686084 0.0924
D85 -0.002403 0.024112 -0.099665 0.9206
D86 0.029746 0.024573 1.210504 0.2266
D87 0.037308 0.024841 1.501854 0.1337
CLPRBARR -0.323041 0.030126 -10.72309 0.0000
CLPRBCON -0.239240 0.018281 -13.08701 0.0000
CLPRBPRI -0.168470 0.026228 -6.423262 0.0000
CLAVGSEN -0.014313 0.022456 -0.637356 0.5242
CLPOLPC 0.397244 0.027061 14.67959 0.0000
CLWCON -0.053348 0.031642 -1.685960 0.0924
CLWFED 0.000780 0.171928 0.004536 0.9964
CLWFIR 0.008101 0.021275 0.380779 0.7035
CLWLOC -0.023902 0.102368 -0.233494 0.8155
CLWMFG -0.137485 0.102415 -1.342435 0.1800
CLWTUC 0.014062 0.017678 0.795406 0.4267
CLWTRD -0.030617 0.030853 -0.992365 0.3215
CLWSTA -0.054622 0.096033 -0.568786 0.5697
CLWSER 0.021078 0.014464 1.457195 0.1457

R-squared 0.441808 Mean dependent var 0.001998


Adjusted R-squared 0.421413 S.D. dependent var 0.202932
S.E. of regression 0.154360 Akaike info criterion -0.862723
Sum squared resid 12.39007 Schwarz criterion -0.703776
Log likelihood 252.9351 Hannan-Quinn criter. -0.800559
F-statistic 21.66209 Durbin-Watson stat 2.442747
Prob(F-statistic) 0.000000
ISAIARIKI MIYATAKE MEDINA (R1171-1)

Las afecta de tal modo que algunaas dejan de ser significante como d84
pero en otras reducen su coeficiente
ii) ¿Tienen todas las variables del inciso i) el signo esperado? ¿Son conjuntamente significativas?
Explique por qué.
Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 21.66209 (19, 520) 0.0000


Chi-square 411.5798 19 0.0000

C.9 Para este ejercicio se utiliza la base de datos JTRAIN.WF1 con el propósito de determinar el
efecto de las subvenciones para la capacitación laboral (grant) sobre las horas de capacitación
para el trabajo por empleado (hrsemp). El modelo básico para los tres años es
hrsempit =β0 +δ1d88t + δ2d89t +β1grantit +β2granti, t_1 + β3log(employit) + ai +uit.
i) Estime la ecuación utilizando las primeras diferencias. ¿Cuántas empresas se emplean en la
estimación? ¿Cuantas observaciones totales se podrían usar si cada empresa tuviera datos para
todas las variables (en particular, para hrsemp) para los tres periodos?

Se emplean en la estimación 251 empresas,

ii) Interprete el coeficiente de grant (variable binaria igual a uno si recibió subvención) y comente
su significancia.
Grant es el nro de horas promedio (32.60horas ) que se toma en entrenar a un empleado.
Es estadísticamente significativo.
iii) ¿Le extraña que grant_1 sea insignificante? Explique sus razones.

No ya que el grant de un periodo resagado no tiene un efecto significativo sobre el siguiente a;o

iv) ¿Las empresas más grandes (employ es número de empleados) capacitan más o menos en
promedio a sus empleados? ¿Son muy grandes las diferencias en la capacitación?
No existe evidencia para determinar si las empresas mas grandes capacitan mas o menos en
promedio a sus empleados, no son grandes las diferencias de capacitación.

C.10 La base de datos MATHPNL.WF1 contiene datos de panel sobre los distritos escolares en
Michigan para los años 1992 a 1998. Es el análogo a nivel distrital de los datos a nivel escolar
usados por Papke (2005). La variable de respuesta que interesa en esta pregunta es math4,
el porcentaje de estudiantes de cuarto grado en un distrito que recibe una calificación
aprobatoria en un examen estandarizado de matemáticas. La variable explicativa clave es
rexpp, que son los gastos reales por alumno en el distrito. Los montos están expresados en
dólares de 1997. La variable del gasto aparecerá de forma logarítmica.
i) Considere el modelo estático de efectos inobservables
math4it =δ1y93t + ... + δ6 y98t + β1log(rexppit) +β2log(enrolit) +β3lunchit + ai +uit,
Donde enrolit es la matricula total del distrito y lunchit es el porcentaje de estudiantes en el
distrito elegibles para el programa de almuerzos escolares. (De modo que lunchit es una medida
bastante aceptable de la tasa de pobreza en todo el distrito). Sostenga que β1/10 es el cambio
ISAIARIKI MIYATAKE MEDINA (R1171-1)

en puntos porcentuales en math4it cuando el gasto real por estudiante aumenta


aproximadamente 10%.
Tome los cambios como de costumbre, manteniendo las otras variables fijas:
Δmath4it = β 1Δlog(rexppit) = ( β 1/100)⋅[ 100⋅Δlog(rexppit)] ≈ ( β 1/100)⋅( %Δrexppit). So, if
%Δrexppit = 10, then Δmath4it = ( β 1/100)⋅(10) = β 1/10.
ii) Use la primera diferencia para estimar el modelo del inciso i). El método más sencillo es
permitir un intercepto en la ecuacion en primeras diferencias e incluir variables binarias para los
años de 1994 a 1998. Interprete el coeficiente de la variable del gasto.
La ecuación, estimada por MCO agrupados en las primeras diferencias (excepto para las variables
ficticias del año), es:
mathΔ = 5.95 + .52 y94 + 6.81 y95 − 5.23 y96 − 8.49 y97 + 8.97 y98 4
(.52) (.73) (.78) (.73) (.72) (.72)

− 3.45 Δlog(rexpp) + .635 Δlog(enroll) + .025 Δlunch


(2.76) (1.029) (.055)
n = 3,300, R2 = .208.
Tomado literalmente, el coeficiente de gasto implica que un aumento del 10% en el gasto real por
alumno disminuye la tasa de aprobación de matemáticas en aproximadamente 3.45 / 10 ≈ .35
puntos porcentuales.

iii) Ahora, añada un rezago de la variable del gasto y vuelva a estimar usando las
primeras diferencias. Observe que perdió otro año de datos, así que solo está
usando los cambios a partir de 1994. Comente los coeficientes y la significancia de
las variables del gasto actual y rezagado.
mathΔ = 6.16 + 5.70 y95 − 6.80 y96 − 8.99 y97 + 8.45 y98 4
(.55) (.77) (.79) (.74) (.74)

− 1.41 Δlog(rexpp) + 11.04 Δlog(rexpp-1) + 2.14 Δlog(enroll)


(3.04) (2.79) (1.18)

+ .073 Δlunch
(.061)
n = 2,750, R2 = .238.
La variable de gasto contemporánea, aunque todavía tiene un coeficiente negativo, no es
estadísticamente significativa. El coeficiente de la variable de gasto rezagado es muy
estadísticamente significativo e implica que un aumento del 10% en el gasto el año pasado
aumenta la tasa de aprobación de matemáticas4
iv) Obtenga los errores estandar robustos a la heterocedasticidad para la regresión en
primeras diferencias del inciso iii). ¿Cómo se comparan estos errores estándar con
aquellos del inciso iii) para las variables del gasto?
El error estándar robusto de heterocedasticidad es de aproximadamente 4.28, lo que reduce aún
más la importancia de Δlog (rexpp). El error estándar robusto de heterocedasticidad es de
aproximadamente 4,38, lo que reduce sustancialmente la estadística t. Aún así, Δlog (rexpp ˆ
log(rexpp) log(rexpp)) es estadísticamente significativo en un poco más del nivel de significancia
del 1% frente a una alternativa de dos lados.
v) Ahora, obtenga los errores estandar robustos a la heterocedasticidad y a la
correlación serial. ¿Cómo afecta esto a la significancia de la variable del gasto
rezagado?
ISAIARIKI MIYATAKE MEDINA (R1171-1)

El error estándar completamente robusto para aproximadamente 4.94, que reduce aún más el
estadístico t para Δlog (rexpp). El error estándar completamente robusto para es
aproximadamente 5.13, lo que da a Δlog (rexpp) log (rexpp) log (rexpp)) una estadística t de
aproximadamente 2.15. El valor p de dos lados es aproximadamente .032.
vi) Verifique que los errores diferenciados rit=Δuit tengan correlación serial negativa al
realizar una prueba de correlacion serial AR (1).
Podemos usar cuatro años de datos para esta prueba. Al hacer una regresión de OLS agrupada de
1 en él es trr, usando los años 1995, 1996, 1997 y 1998 se obtiene ˆ ρ = −.423 (se = .019), que es
una fuerte correlación serial negativa.
Guías para las respuestas
c1.1(i) El estadístico F (con 4 y 1,111 g de l) es 1.16 y el p-value≈ ___, que muestra que las
variables de vivienda en su conjunto no son significativas.

(ii) El F estadístico (con 3 y 1,111 gdl) es ____ y el p-value≈ .029, y las variables dummy regionales
son conjuntamente significativas a un nivel del 5%.

(iii) Después de obtener los residuos mediante MCO, de estimar el modelo de la Tabla 13.1,
corremos la regresión en y74, y76, …, y84 usando todas las 1,129 observaciones. La hipótesis nula
de homoscedasticidad es H0: γ1 = 0, γ2 = 0, … , γ6 = 0. Así que simplemente usamos el F estadístico
usual para la significancia conjunta de las dummies anuales. El R-cuadrado es _____ y F ≈ 2.90;
con 6 y 1,122 gdl, el p-value es como .0082. Entonces existe evidencia de heteroscedasticidad
que es una función del tiempo a en un nivel de significancia del 1%. Ello siguiere que, como mínimo,
deberíamos computar tests de heterocedasticidad. También podríamos utilizar mínimos
cuadrados generalizados (ponderados)

(iv) Agregando y74*educ, …, y84*educ permitimos que la relación entre fertilidad y educación sean
diferentes cada año, recordemos, que el coeficiente en la interacción se agrega al coeficiente de
educ para obtener la tendencia en el año apropiado. Cuando estos términos de interacción son
agregados a la ecuación, R2≈137. El F estadístico para significancia conjunta (con 6 y 1,105 gdl) es
____ con un p-value .18. Entonces las interacciones no son significativas en conjunto inclusive a
un nivel de 10% de significancia. Eso es un poco confuso, de todas formas. Una ecuación abreviada
(que muestra solo los coeficientes que involucran educ) es

kids= −8.48 − .023 educ + … − .056 y74*educ − .092 y7*6educ

(3.13) ____ (.073) (.071)

− .152 y78*educ − .098 y80*educ − .139 y82*educ − .176 y84*educ.

______ ______ ______ _______

Tres de los términos de interacción, y78*educ, y82*educ, y y84*educ son estadísticamente


significativos a un nivel del 5% , con el p-value de .012. Los coeficientes son largos en magnitud. El
coeficiente en educ – que para el año base, 1972 – es pequeño e insignificante, sugiere pequeña o
ninguna relación entre fertilidad y educación en los inicios de los setenas. Las estimaciones
encontradas son consistentes al relacionar la fertilidad con educación en la medida que los años
ISAIARIKI MIYATAKE MEDINA (R1171-1)

pasan. El estadístico F es insignificante porque estamos testeando coeficientes no significativos


contra otros significativos..

C1.2 (i) El coeficiente en y85 es el cambio proporcional en wage (salario) con respecto de male
(hombres) (female = 0) con cero años de educación (educ = 0). Ello no es específicamente útil
puesto que no estamos interesados en la gente sin educación. Tomemos en cuenta que la dummy
ahora mide los efectos de las binarias que fueron utilizadas como base

(ii) Lo que queremos estimar es θ0 = δ0 + 12δ1; esto es un cambio en el intercepto para hombres
con 12 años de educación, donde también mantenemos los otros factores fijos. Si escribimos δ0 =
θ0 − 12δ1, y lo pegamos en (13.1), y reordenamos, obtendremos

log(wage) = β0 + θ0y85 + β1educ + δ1y85*(educ – 12) + β2exper + β3exper2 + β4union +


β5female + δ5y85*female + u.

Entonces, reemplazamos y85educ en y85*(educ – 12), y luego el coeficiente y error estándar que
queremos está en y85. Ello tiende a ser θ= .339 y ee(θ) =____. El incremento nominal del salario
es 33.9%, y con un intervalo de confianza del 95% es 33.9 ± 1.96(3.4), o cerca del 27.2% a 40.6%.
(Porque el cambio proporcional es largo podríamos usar la ecuación (7.10), el cual implica una
estimación de 40.4%.

(iii) Solo el coeficiente en y85 difiere de la ecuación (13.2). El nuevo coeficiente es –.383 (ee ≈____).
Esto muestra que los salarios reales han caído durante los siete años de estudio, además fue menor
para los que tienen mayor educación. Por ejemplo el cambio proporcional de hombres con 12 años
de educación es –.383 + .0185(12) = −.161, o una caída del 16.1%. Para hombres con 20 años de
educación casi no hubo cambio [–.383 + .0185(20) = –.013].

(iv) El R-cuadrado cuando log(rwage) de la variable dependiente es .356, en comparación con .426
cuando log(wage) es la variable dependiente. Si la SSR (Suma de los Errores al Cuadrado) de la
regresión son iguales pero las R-cuadradas no; entonces la Suma Total de los Errores debe ser
diferente. En este caso las variables dependientes en las dos ecuaciones son diferentes.

(v) En 1978, cerca de 30.6% de los trabajadores de la muestra pertenecían a union. En 1985, solo
cerca del ____ pertenecieron a la unión. Entonces, luego del periodo de siete años, hubo una caída
notable en las membrecías de la unión.

(vi) Cuando y85*union se adiciona a la ecuación, su coeficiente y error estándar son −._____ (se
.06). Esto es prácticamente muy pequeño y el t estadístico es casi cero. No hubo cambio en los
salarios por afiliación en el tiempo.

(vii) No porque, los incisos (v) y (vi) no son probables. Eso implica que mientras el retorno de la
membrecía no cambie (asumiendo que hemos encontrado un efecto causal) la fracción de
personas que alcanza esos beneficios disminuyó.
ISAIARIKI MIYATAKE MEDINA (R1171-1)

13.3 (i) Manteniendo otras cosas constantes, los hogares más alejados del incinerador deberían
valer más, entonces δ1 > 0. Si β1 > 0, entonces el incinerador estaba ubicado lejos de los hogares
más caros.

(ii) La ecuación estimada es

log(price) = 8.06 − .011 y81 + .317 log(dist) + .048 y81*log(dist)

(0.51) (.805) (.052) (.082)

n = 321, R2= ._____.

Mientras δ1= .048 tiene el signo esperado, no es estadísticamente significativo (t estadístico ≈.59).

(iii) Cuando agregamos la lista de las características de las casas a la regresión, el coeficiente en
y81*log(dist) se convierte en .___ (ee = .050). Entonces el efecto estimado es más largo– la
elasticidad de price con respecto a dist es .062 después de que el sitio del incinerador fue elegido
– pero el estadísticot es solamente 1.24. El p-value para la alternativa de una cola H1: δ1 > 0 es
.108, que es más cercano a ser significativo a un nivel de significancia del 10%.

C1.4 (i) Además de maley married, agregamos las variables head, neck, upextr, trunk, lowback,
lowextr, y occdispor tipo de lesión, y manufy construcpor industria. El coeficiente de
afchnge*highearnse convierte en .231 (se ≈ .___), y el efecto estimado y el estadístico t son
ahora mayores que cuando omitimos las variables de control. La estimación .231 implica una
sustancial respuesta a durathacia el cambio en el tope para trabajadores de ingresos altos.

(ii) El R-cuadrado es .041, que significa que estamos explicando solo el ___% de la variación en
log(durat). Significa que hay algunos factores importantes que afectan a log(durat) que no estamos
controlando. Mientras eso significa que predecir log(durat) podría ser muy difícil para un individuo
particular, no significa que exista nada sesgado en δ1: el podría seguir siendo un estimador
insesgado del efecto causal entre el tope de los ingresos por indemnización a los trabajadores.

(iii) La ecuación estimada usando los datos de Michigan es

log(durat)= 1.413 + .097 afchnge+ .169 highearn+ .192 afchngehighearn

(0.057) (.085) (.106) (.154)

n = 1,524, R2= .___.

La estimación de of δ1, .192, es notablemente cercana a la estimación obtenida para Kentucky


(.191). De todas formas, el error estándar para la estimación de Michigan es mucho mayor (.154
comparada con .069). La estimación para Michigan no es estadísticamente significativa inclusive
al nivel del 10% contra δ1 > 0. Aunque tenemos más de 1,500 observaciones, no podemos tener
una estimación muy precisa. (Para Kentucky, tenemos como 5,600 observaciones).

C1.5 (i) Usando pooled MCO obtenemos


ISAIARIKI MIYATAKE MEDINA (R1171-1)

log(rent) = −.569 + .262 d90 + .041 log(pop) + .571 log(avginc) + .0050 pctstu

(.535) (.035) (.023) (.053) (.0010)

n = 128, R2 = ._____.

El coeficiente positivo y muy significativo de d90 significa que, manteniendo el resto de la


ecuación fija, las rentas nominales aumentan cerca del 26% sobre un periodo de 10 años. El
coeficiente en pctstu significa que el aumento de un punto porcentual en pctstu incrementa
rentpor medio por ciento (.5%). El estadísticot de cinco muestra que, al menos basados en el
análisis usual, pctstu es estadísticamente significativo.

(ii) Los errores estándar de la parte (i) no son válidos, a menos que pensemos que ai realmente
no figure en la ecuación. Si ai está en el término de error, los errores entre los dos periodos entre
cada ciudad tienen correlación positiva, y ello invalida los errores estándar y t estadísticos del
MCO.

(iii) La ecuación estimada en diferencias es

Δlog(rent) = .386 + .072 Δlog(pop) + .310 log(avginc) + .0112 Δpctstu

(.037) (.088) (.066) (.0041)

n = 64, R2 = ._____.

El efecto de pctstu es como dos veces mayor al estimado en la ecuación por MCO (pooled MCO).
Ahora, un incremento de un punto porcentual en pctstu es estimado para incrementar las tasas
de renta por 1.1%. Obtuvimos una estimación mucho menos precisa cuando diferenciamos
(además los errores estándar de MCO del inciso (i) están mucho más pequeños por la relación
correlación en los errores entre cada cuidad). Mientras tenemos diferentes ai, habrán otras
variables inobservadas que cambian durante el tiempo y están correlacionadas con Δpctstu.

(iv) Los test de heteroscedasticidad en Δpctstuson menores que en los errores estándar de los
MCO usuales. Ello solo hace a pctstu inclusive más significativo. La correlación serial ya no es
más un problema porque no tenemos un componente temporal en la ecuación de primeras
diferencias.

S-ar putea să vă placă și