Documente Academic
Documente Profesional
Documente Cultură
Respuesta
13.1 Sin cambios en los promedios de cualquier variable explicativa, la tasa de fertilidad promedio
se redujo en .545 entre 1972 y 1984; este es simplemente el coeficiente en y84. Para explicar el
aumento en los niveles promedio de educación, obtenemos un efecto adicional: –.128 (13.3 - 12.2)
≈ – .141. Entonces, la caída en la fertilidad promedio si el nivel de educación promedio aumentó en
1.1 es de .545 + .141 = .686, o aproximadamente dos tercios de un niño por mujer.
13.3 ¿Por qué no se pueden usar primeras diferencias cuando se tienen cortes transversales
independientes en dos años (contrariamente a los datos de panel)?
13.3 No tenemos observaciones repetidas en las mismas unidades de sección transversal en cada
período de tiempo, por lo que no tiene sentido buscar pares para diferenciar. Por ejemplo, en el
Ejemplo 13.1, es muy poco probable que la misma mujer aparezca en más de un año, ya que se
obtienen nuevas muestras aleatorias en cada año. En el Ejemplo 13.3, algunas casas pueden
aparecer en la muestra tanto para 1978 como para 1981, pero la superposición suele ser demasiado
pequeña para realizar un verdadero análisis de datos de panel.
13.5 Suponga que se desea estimar el efecto de varias variables sobre el ahorro anual y se tiene
una base de datos de panel sobre personas, recolectada el 31 de enero de 1990 y el 31 de enero
de 1992. Si se incluye una variable binaria para 1992 y se utiliza la primera diferenciación, ¿es
posible incluir además la edad en el modelo original? Explique.
13.5 No, no podemos incluir la edad como una variable explicativa en el modelo original. Cada
persona en el conjunto de datos del panel es exactamente dos años mayor el 31 de enero de 1992
que el 31 de enero de 1990. Esto significa que Δagei = 2 para todo i. Pero la ecuación que
estimaríamos es de la forma.
donde δ0 es el coeficiente del año ficticio para 1992 en el modelo original. Como sabemos, cuando
tenemos un intercepto en el modelo no podemos incluir una variable explicativa que sea constante
a través de i; esto viola la Asunción MLR.3. Intuitivamente, dado que la edad cambia en la misma
cantidad para todos, no podemos distinguir el efecto de la edad del efecto de tiempo agregado.
13.7 i) Usando la base de datos INJURY.RAW para Kentucky, la ecuación estimada cuando
¿Por qué el coeficiente del término de interacción ahora es mucho mayor que en la ecuación
13.7 (i) No es sorprendente que el coeficiente en el término de interacción cambie poco cuando se
excluya el ingreso de la ecuación porque el coeficiente del alcance en (3.12) es solo .0077 (y su
estadística t es muy pequeña). El aumento de .191 a .198 se explica fácilmente por un error de
muestreo.
(ii) Si se suprime highearn de la ecuación [de modo que 10β = in (3.10)], entonces asumimos que,
antes del cambio de política, no hay diferencia en la duración promedio entre las personas con
mayores ingresos y las que tienen bajos ingresos. Pero la estimación muy grande (.256), altamente
estadísticamente significativa en el alto aprendizaje en (3.12) muestra que esta presunción es falsa.
Antes del cambio de política, el grupo de altos ingresos gastaba alrededor del 29.2% [exp (0.256)-
1=0.292] más tiempo en la compensación por desempleo que el grupo de bajos ingresos. Al eliminar
el alto rendimiento de la regresión, atribuimos a la política un cambio en la diferencia entre los dos
grupos que serían Observado sin ninguna intervención.
C13.1 (i) El estadístico F (con 4 y 1,111 df) es aproximadamente 1.16 y el valor de p ≈ .328, lo que
muestra que las variables del entorno de vida son conjuntamente insignificantes.
(ii) El estadístico F (con 3 y 1,111 df) es aproximadamente 3.01 y el valor de p .029, por lo que las
variables dummy de la región son conjuntamente significativas al nivel del 5%.
(iii) Después de obtener los residuos de OLS, a partir de la estimación del modelo de la Tabla 13.1,
ejecutamos la regresión en y74, y76, ..., y84 utilizando las 1,129 observaciones. La hipótesis nula de
la homoscedasticidad es H0: γ1 = 0, γ2 = 0,…, γ6 = 0. Por lo tanto, solo usamos el estadístico F
habitual para la significación conjunta de los maniquíes del año. El R-cuadrado es aproximadamente
.0153 y F ˆu2ˆu≈ 2.90; con 6 y 1,122 df, el valor p es aproximadamente 0,0082. Por lo tanto, hay
evidencia de heterocedasticidad que es una función del tiempo en el nivel de significación del 1%.
Esto sugiere que, como mínimo, deberíamos calcular los errores estándar, las estadísticas t y las
estadísticas F robustos de heterocedasticidad. También podríamos usar mínimos cuadrados
ponderados (aunque la forma de heteroscedasticidad utilizada aquí puede no ser suficiente; no
depende de la educación, la edad, etc.).
(iv) Agregar y74⋅educ,…, y84⋅educ permite que la relación entre fertilidad y educación sea diferente
en cada año; recuerde, el coeficiente de la interacción se agrega al coeficiente de educ para obtener
la pendiente para el año apropiado. Cuando estos términos de interacción se agregan a la ecuación,
R2 .137. El estadístico F para la significación conjunta (con 6 y 1,105 df) es de aproximadamente
1.48 con un valor de p .18. Por lo tanto, las interacciones no son conjuntamente significativas incluso
en el nivel del 10%. Sin embargo, esto es un poco engañoso. Una ecuación abreviada (que solo
muestra los coeficientes en los términos que involucran a educ) es
C13.3 (i) Otras cosas iguales, los hogares más alejados del incinerador deberían valer más, entonces
>1> 0. Si β1> 0, entonces el incinerador se ubicó más lejos de los hogares más caros.
El coeficiente positivo y muy significativo en d90 simplemente significa que, otras cosas en la
ecuación fija, las rentas nominales aumentaron en más del 26% durante el período de 10 años. El
coeficiente en pctstu significa que un aumento de un punto porcentual en pctstu aumenta la renta
en medio por ciento (.5%). El estadístico t de cinco muestra que, al menos en base al análisis
habitual, pctstu es muy significativo estadísticamente.
(ii) Los errores estándar de la parte (i) no son válidos, a menos que la cosa ai no aparezca realmente
en la ecuación. Si ai está en el término de error, los errores en los dos períodos de tiempo para cada
ciudad están correlacionados positivamente, y esto invalida los errores estándar de OLS y las
estadísticas t habituales.
(ii) La respuesta rápida es que si la habilidad omitida se correlaciona con la temporada, como
sabemos, en los Capítulos 3 y 5, el MCO está sesgado e inconsistente. El hecho de que estemos
agrupados en dos semestres no cambia ese punto básico.
Si pensamos más, la dirección del sesgo no está clara, y aquí es donde la agrupación a lo largo de los
semestres desempeña un papel. Primero, supongamos que usamos solo el término de otoño,
cuando el fútbol está en temporada. Luego, el término de error y la estación se correlacionarían
negativamente, lo que produce un sesgo a la baja en el estimador de MCO de la temporada. Debido
a que se considera que ßseason es negativo, una regresión OLS que usa solo los datos de caída
produce un estimador sesgado hacia abajo. [Cuando solo se usan los datos de otoño, ˆseasonβ =
−.116 (se = .084), que está en la dirección de más sesgo.] Sin embargo, si usamos solo el semestre
de primavera, el sesgo es en la dirección opuesta porque la habilidad y la temporada estaría
correlacionada positivamente (los atletas académicamente más capacitados están en temporada en
la primavera). De hecho, usar solo el semestre de primavera da ˆseasonβ = .00089 (se = .06480),
que es prácticamente igual a cero estadísticamente. Cuando agrupamos los dos semestres, no
podemos, con un análisis mucho más detallado, determinar qué sesgo dominará.
(iii) Las variables sat, hsperc, female, black y white se eliminan porque no varían por semestre. El
intercepto en la primera ecuación diferenciada es el intercepto para el resorte. Tenemos
(iv) Una posibilidad es una medida de la carga del curso. Si alguna fracción de los estudiantes atletas
toma una carga más liviana durante la temporada (para aquellos deportes que tienen una
temporada verdadera), los GPA de término pueden ser más altos, otras cosas iguales. Esto desviaría
los resultados de encontrar un efecto de la temporada en el GPA de término.
C13.9 (i) Cuando sumamos los cambios de las nueve variables de salario logístico a la ecuación
(13.33) obtenemos
Los coeficientes de las variables de justicia penal cambian muy modestamente, y la importancia
estadística de cada variable tampoco se ve afectada.
(ii) Dado que algunos signos son positivos y otros negativos, no todos pueden tener el signo
esperado. Por ejemplo, ¿por qué el coeficiente sobre el salario para transporte, servicios públicos y
comunicaciones (wtuc) es positivo y marginalmente significativo (estadística t t 1.79)? Como es de
esperar, los salarios de fabricación más altos conducen a una delincuencia más baja, pero, aunque
el coeficiente estimado es, con mucho, el más grande en magnitud, no es estadísticamente diferente
de cero (t estadística –1.37). La prueba F para la significación conjunta de las variables salariales,
con 9 y 529 df, arroja F ≈ 1.25 y p-valor .26.
C13.11. (i) Tome los cambios como de costumbre, manteniendo las otras variables fijas: Δmath4it =
β1Δlog (rexppit) = (β1 / 100) ⋅ [100⋅Δlog (rexppit)] ≈ (β1 / 100) ⋅ (% Δrexppit). Entonces, si% Δrexppit
= 10, entonces Δmath4it = (β1 / 100) ⋅ (10) = β1 / 10.
(ii) La ecuación, estimada por OLS agrupados en las primeras diferencias (excepto los maniquíes del
año), es
(v) El error estándar completamente robusto es de aproximadamente 4.94, lo que reduce aún más
la estadística t para Δlog (rexpp). El error estándar completamente robusto es de aproximadamente
5.13, lo que le da a Δlog (rexpp-1) una estadística t de aproximadamente 2.15. El valor p de dos caras
es de aproximadamente .032. log () ˆrexppβΔ1log () ˆrexppβ − Δ
(vi) Podemos usar cuatro años de datos para esta prueba. Al realizar una regresión OLS combinada
de 1ˆˆon ititrr−, utilizando los años 1995, 1996, 1997 y 1998, se obtiene ˆρ = −.423 (se = .019), que
es una fuerte correlación serial negativa.
(vii) La prueba "F" completamente robusta para Δlog (enumerar) y Δlunch, informada por Stata 7.0,
es .93. Con 2 y 549 df, esto se traduce en p-valor = .40. Por lo tanto, estaríamos justificados al
eliminar estas variables, pero no están haciendo ningún daño.
C13.13 (i) Podemos estimar todos los parámetros excepto 0β y 1β: la intercepción para el año base
no se puede estimar, ni tampoco los coeficientes de la variable constante de tiempo educi.
(ii) Queremos probar 0127:, ..., 0Hγγγ =, por lo que hay siete restricciones para probar. Usando FD
(que elimina educi) y obteniendo la estadística F, se obtiene F = .31 (p-value = .952). Por lo tanto, no
hay evidencia de que el retorno a la educación varíe durante este período de tiempo. (Además, cada
coeficiente es individualmente estadísticamente insignificante en el nivel del 25%).
14.5 (i) Para cada estudiante tenemos varias medidas de rendimiento, generalmente tres o cuatro,
el número de clases tomadas por un estudiante que tiene exámenes finales. Cuando especificamos
una ecuación para cada puntaje de examen final estandarizado, los errores en las diferentes
ecuaciones para el mismo estudiante se correlacionarán: los estudiantes que tienen mayor
capacidad (no observada) tienden a hacerlo mejor en todas las pruebas.
Donde como es el efecto del estudiante no observado. Debido a que el puntaje del SAT y el GPA
acumulativo dependen solo del estudiante y no de la clase en particular que está tomando, estos
no tienen un subíndice. Las tasas de asistencia generalmente varían según la clase, al igual que el
indicador de si una clase está en la especialidad del estudiante. El término θc denota diferentes
intercepciones para diferentes clases. A diferencia de un conjunto de datos de panel, donde el
tiempo es el orden natural de los datos dentro de cada unidad de sección transversal, y los efectos
de tiempo agregados se aplican a todas las unidades, es posible que no se necesiten
interceptaciones para las diferentes clases. Si todos los estudiantes tomaron el mismo conjunto de
clases, entonces esto es similar a un conjunto de datos del panel, y nos gustaría poner en diferentes
intercepciones de clase. Pero con los estudiantes que toman diferentes cursos, la clase que
etiquetamos como "1" para el estudiante A no tiene nada que ver con la clase "1" para el estudiante
B. Por lo tanto, las diferentes intercepciones de clase basadas en el orden arbitrario de las clases
para cada estudiante probablemente no son necesario. Podemos reemplazar θc con β0, una
constante de intercepción entre clases.
(iii) Manteniendo la suposición de que el error idiosincrático, usc, no está correlacionado con todas
las variables explicativas, necesitamos la heterogeneidad no observada de los estudiantes, como,
que no esté correlacionada con atndrtesc. La inclusión del puntaje del SAT y el GPA acumulativo
debería ayudar en este sentido, ya que es la parte de la habilidad que no se captura con el SAT y el
cumGPA. En otras palabras, controlar SAT y cumGPA podría ser suficiente para obtener el efecto
ceteris paribus de la asistencia a clase.
(iv) Si los exámenes SAT y cumGPA no son controles suficientes para la capacidad y motivación del
estudiante, como se correlaciona con atndrtesc, y esto provocaría que los OLS agrupados sean
sesgados e inconsistentes. Podríamos usar efectos fijos en su lugar. Dentro de cada alumno,
calculamos los datos degradados, donde, para cada alumno, los medios se calculan en todas las
clases. Las variables SATs y cumGPAs abandonan el análisis.
C14.3 (i) 135 empresas se utilizan en la estimación de FE. Debido a que hay tres años, tendríamos
un total de 405 observaciones si cada empresa tuviera datos sobre todas las variables para los tres
años. En cambio, debido a los datos faltantes, podemos usar solo 390 observaciones en la
estimación de FE. Las estimaciones de efectos fijos son
(ii) El coeficiente de subvención significa que si una empresa recibió una subvención para el año en
curso, capacitó a cada trabajador con un promedio de 34.2 horas más de lo que tendría de otra
manera. Este es un efecto prácticamente grande, y el estadístico t es muy grande.
80
(iii) Dado que el año pasado se usó una beca para pagar la capacitación, tal vez no sea sorprendente
que las becas no se transfieran a más capacitación este año. Sería si la inercia desempeñara un papel
en la formación de los trabajadores.
(iv) El coeficiente de la variable empleados es muy pequeño: un aumento del 10% en el empleo
aumenta las horas previstas por empleado solo en aproximadamente .018. [Recuerde: (.176 / 100)
(% Δemploy).] Esto es muy pequeño, y el estadístico t es prácticamente cero. hrsempΔ≈
C14.5 (i) Las diferentes ocupaciones están sindicadas a tasas diferentes, y los salarios también
difieren según la ocupación. Por lo tanto, si omitimos los indicadores binarios para la ocupación, el
diferencial salarial del sindicato puede simplemente estar recogiendo las diferencias salariales entre
las ocupaciones. Debido a que algunas personas cambian de ocupación durante el período,
deberíamos incluirlas en nuestro análisis.
(ii) Debido a que las nueve categorías ocupacionales (occ1 a occ9) son exhaustivas, debemos elegir
una como grupo base. Por supuesto, el grupo que elegimos no afecta la diferencia salarial sindical
estimada. La estimación del efecto fijo en la unión, con cuatro decimales, es .0804 con error
estándar = .0194. Prácticamente no hay diferencia entre esta estimación y el error estándar y la
estimación y el error estándar sin los controles ocupacionales (= .0800, se = .0193). ˆUnionβ
C14.7 (i) Si hay un efecto disuasorio, entonces β1 <0. El signo de β2 no es del todo obvio, aunque
una posibilidad es que una mejor economía signifique menos crimen en general, incluidos los delitos
violentos (como el tráfico de drogas) que Llevaría a menos asesinatos. Esto implicaría β2> 0.
(ii) Las estimaciones OLS combinadas que utilizan 1990 y 1993 son
Ahora, hay un efecto disuasivo estadísticamente significativo: se estima que 10 ejecuciones más
reducirán la tasa de homicidios en 1.04, o un asesinato por cada 100,000 personas. ¿Es este un gran
efecto? Las ejecuciones son relativamente raras en la mayoría de los estados, pero las tasas de
homicidios también son relativamente bajas en promedio.
81
En 1993, la tasa promedio de homicidios era de aproximadamente 8.7; una reducción de uno sería
no trivial. Para las personas (desconocidas) cuyas vidas podrían salvarse a través de un efecto
disuasorio, parecería importante.
(iv) El error estándar robusto de heteroscedasticidad para Δexeci es .017. Algo sorprendente, esto
está muy por debajo del error estándar no robusto. Si usamos el error estándar robusto, la evidencia
estadística del efecto disuasorio es bastante fuerte (t ≈ −6.1). Véase también Ejercicio de ordenador
13.12.
(v) Texas tuvo con mucho el mayor valor de exec, 34. El siguiente estado más alto fue Virginia, con
11. Estos son totales de tres años.
(vi) Sin Texas en la estimación, obtenemos lo siguiente, con errores estándar robustos a la
heterocedasticidad en [⋅]:
Ahora el efecto disuasorio estimado es menor. Quizás más importante, el error estándar en Δexeci
ha aumentado en una cantidad sustancial. Esto sucede porque cuando abandonamos Texas,
perdemos gran parte de la variación en la variable explicativa clave, Δexeci.
(vii) Cuando aplicamos efectos fijos utilizando los tres años de datos y todos los estados que
obtenemos
El tamaño del efecto disuasorio es solo aproximadamente la mitad que cuando no se usa 1987.
Además, la estadística t, aproximadamente −.34, es muy pequeña. El hallazgo anterior de un efecto
disuasorio no es robusto al período de tiempo utilizado. Curiosamente, agregar otro año de datos
hace que el error estándar en el coeficiente exec aumente notablemente.