Notas para R

13.1. En el ejemplo 13.
1 se hizo el supuesto que los promedios de todos los factores distintos de

educ han permanecido constantes en el tiempo y que el nivel promedio de educación es 12.2 ara
la muestra de 1972 y 13.3 para la muestra de 1984. Utilizando las estimaciones de la tabla 13.1,
calcule el cambio estimado en la fertilidad promedio entre 1972 y 1984. (Asegúrese de considerar
el cambio del intercepto y el cambio en el nivel medio de educación.)
Respuesta
13.1 Sin cambios en los promedios de cualquier variable explicativa, la tasa de fertilidad promedio
se redujo en .545 entre 1972 y 1984; este es simplemente el coeficiente en y84. Para explicar el
aumento en los niveles promedio de educación, obtenemos un efecto adicional: –.128 (13.3 - 12.2)
≈ – .141. Entonces, la caída en la fertilidad promedio si el nivel de educación promedio aumentó en
1.1 es de .545 + .141 = .686, o aproximadamente dos tercios de un niño por mujer.
13.3 ¿Por qué no se pueden usar primeras diferencias cuando se tienen cortes transversales
independientes en dos años (contrariamente a los datos de panel)?
13.3 No tenemos observaciones repetidas en las mismas unidades de sección transversal en cada
período de tiempo, por lo que no tiene sentido buscar pares para diferenciar. Por ejemplo, en el
Ejemplo 13.1, es muy poco probable que la misma mujer aparezca en más de un año, ya que se
obtienen nuevas muestras aleatorias en cada año. En el Ejemplo 13.3, algunas casas pueden
aparecer en la muestra tanto para 1978 como para 1981, pero la superposición suele ser demasiado
pequeña para realizar un verdadero análisis de datos de panel.
13.5 Suponga que se desea estimar el efecto de varias variables sobre el ahorro anual y se tiene
una base de datos de panel sobre personas, recolectada el 31 de enero de 1990 y el 31 de enero
de 1992. Si se incluye una variable binaria para 1992 y se utiliza la primera diferenciación, ¿es
posible incluir además la edad en el modelo original? Explique.
13.5 No, no podemos incluir la edad como una variable explicativa en el modelo original. Cada
persona en el conjunto de datos del panel es exactamente dos años mayor el 31 de enero de 1992
que el 31 de enero de 1990. Esto significa que Δagei = 2 para todo i. Pero la ecuación que
estimaríamos es de la forma.
donde δ0 es el coeficiente del año ficticio para 1992 en el modelo original. Como sabemos, cuando
tenemos un intercepto en el modelo no podemos incluir una variable explicativa que sea constante
a través de i; esto viola la Asunción MLR.3. Intuitivamente, dado que la edad cambia en la misma
cantidad para todos, no podemos distinguir el efecto de la edad del efecto de tiempo agregado.
13.7 i) Usando la base de datos INJURY.RAW para Kentucky, la ecuación estimada cuando
afchnge se omite en la ecuación (13.12) es

¿Es de sorprender que la estimación de la interacción sea muy cercana a aquella de la
ecuación (13.12)? Explique por qué.
ii) Cuando afchnge se incluye pero highearn se omite, el resultado es
¿Por qué el coeficiente del término de interacción ahora es mucho mayor que en la ecuación
(13.12)? [Sugerencia: en la ecuación (13.10), ¿cuál es el supuesto que se hace sobre
los grupos de tratamiento y control si 1 0?]
13.7 (i) No es sorprendente que el coeficiente en el término de interacción cambie poco cuando se
excluya el ingreso de la ecuación porque el coeficiente del alcance en (3.12) es solo .0077 (y su
estadística t es muy pequeña). El aumento de .191 a .198 se explica fácilmente por un error de
muestreo.
(ii) Si se suprime highearn de la ecuación [de modo que 10β = in (3.10)], entonces asumimos que,
antes del cambio de política, no hay diferencia en la duración promedio entre las personas con
mayores ingresos y las que tienen bajos ingresos. Pero la estimación muy grande (.256), altamente
estadísticamente significativa en el alto aprendizaje en (3.12) muestra que esta presunción es falsa.
Antes del cambio de política, el grupo de altos ingresos gastaba alrededor del 29.2% [exp (0.256)-
1=0.292] más tiempo en la compensación por desempleo que el grupo de bajos ingresos. Al eliminar
el alto rendimiento de la regresión, atribuimos a la política un cambio en la diferencia entre los dos
grupos que serían Observado sin ninguna intervención.
C13.1 Utilice la base de datos FERTIL1.RAW para este ejercicio.

i) En la ecuacion estimada del ejemplo 13.1, pruebe si las condiciones de vida a los
16 anos influyen sobre la fertilidad. (El grupo base es una ciudad grande.) Informe el
valor del estadistico F y el valor-p.
ii) Pruebe si la region del pais a los 16 anos (el Sur es el grupo base) influye sobre la
fertilidad.
iii) Sea u el termino de error en la ecuacion de la poblacion. Suponga que piensa que la
varianza de u cambia con el tiempo (pero no con educ, age, etc.). Un modelo que
captura esto es
Usando este modelo, pruebe si hay heterocedasticidad en u. (Sugerencia: su prueba F
debe tener 6 y 1,122 grados de libertad.)
iv) Anada los terminos de interaccion y74_educ, y76_educ, …, y84・educ al modelo estimado
de la tabla 13.1. Explique que representan estos terminos. .Son conjuntamente
significativos?
C13.1 (i) El estadístico F (con 4 y 1,111 df) es aproximadamente 1.16 y el valor de p ≈ .328, lo que
muestra que las variables del entorno de vida son conjuntamente insignificantes.
(ii) El estadístico F (con 3 y 1,111 df) es aproximadamente 3.01 y el valor de p .029, por lo que las
variables dummy de la región son conjuntamente significativas al nivel del 5%.
(iii) Después de obtener los residuos de OLS, a partir de la estimación del modelo de la Tabla 13.1,
ejecutamos la regresión en y74, y76, ..., y84 utilizando las 1,129 observaciones. La hipótesis nula de
la homoscedasticidad es H0: γ1 = 0, γ2 = 0,…, γ6 = 0. Por lo tanto, solo usamos el estadístico F
habitual para la significación conjunta de los maniquíes del año. El R-cuadrado es aproximadamente
.0153 y F û2û≈ 2.90; con 6 y 1,122 df, el valor p es aproximadamente 0,0082. Por lo tanto, hay
evidencia de heterocedasticidad que es una función del tiempo en el nivel de significación del 1%.
Esto sugiere que, como mínimo, deberíamos calcular los errores estándar, las estadísticas t y las
estadísticas F robustos de heterocedasticidad. También podríamos usar mínimos cuadrados
ponderados (aunque la forma de heteroscedasticidad utilizada aquí puede no ser suficiente; no
depende de la educación, la edad, etc.).
(iv) Agregar y74⋅educ,…, y84⋅educ permite que la relación entre fertilidad y educación sea diferente
en cada año; recuerde, el coeficiente de la interacción se agrega al coeficiente de educ para obtener
la pendiente para el año apropiado. Cuando estos términos de interacción se agregan a la ecuación,
R2 .137. El estadístico F para la significación conjunta (con 6 y 1,105 df) es de aproximadamente
1.48 con un valor de p .18. Por lo tanto, las interacciones no son conjuntamente significativas incluso
en el nivel del 10%. Sin embargo, esto es un poco engañoso. Una ecuación abreviada (que solo
muestra los coeficientes en los términos que involucran a educ) es
Tres de los términos de interacción, y78educ, y82⋅⋅educ y y84⋅educ son estadísticamente

significativos en el nivel del 5% frente a una alternativa de dos lados, con el valor de p en el último
es aproximadamente .012. Los coeficientes también son grandes en magnitud. El coeficiente de
educación, que es para el año base, 1972, es pequeño e insignificante, y sugiere poca o ninguna
relación entre la fertilidad y la educación a principios de los años setenta. Las estimaciones
anteriores son consistentes con que la fertilidad está más vinculada a la educación a medida que
pasan los años. La estadística F es insignificante porque estamos probando algunos coeficientes
insignificantes junto con algunos significativos.
C13.3 (i) Otras cosas iguales, los hogares más alejados del incinerador deberían valer más, entonces
>1> 0. Si β1> 0, entonces el incinerador se ubicó más lejos de los hogares más caros.
(ii) La ecuación estimada es
Si bien 1ˆδ = .048 es el signo esperado, no es estadísticamente significativo (t estadístico .59). ≈
(iii) Cuando agregamos la lista de características de alojamiento a la regresión, el coeficiente en

y81⋅log (dist) se convierte en .062 (se = .050). Entonces, el efecto estimado es mayor (la elasticidad
del precio con respecto a dist es .062 después de que se eligió el sitio del incinerador), pero su
estadística t es de solo 1.24. El valor de p para la alternativa unilateral H1: δ1> 0 es de
aproximadamente .108, que está cerca de ser significativo en el nivel del 10%.
C13.5 (i) Usando OLS agrupados obtenemos
El coeficiente positivo y muy significativo en d90 simplemente significa que, otras cosas en la
ecuación fija, las rentas nominales aumentaron en más del 26% durante el período de 10 años. El
coeficiente en pctstu significa que un aumento de un punto porcentual en pctstu aumenta la renta
en medio por ciento (.5%). El estadístico t de cinco muestra que, al menos en base al análisis
habitual, pctstu es muy significativo estadísticamente.
(ii) Los errores estándar de la parte (i) no son válidos, a menos que la cosa ai no aparezca realmente
en la ecuación. Si ai está en el término de error, los errores en los dos períodos de tiempo para cada
ciudad están correlacionados positivamente, y esto invalida los errores estándar de OLS y las
estadísticas t habituales.
(iii) La ecuación estimada en diferencias es

Curiosamente, el efecto de pctstu es más del doble de lo que estimamos en la ecuación OLS
combinada. Ahora, se estima que un aumento de un punto porcentual en pctstu incrementa las
tasas de alquiler en aproximadamente 1.1%. No es sorprendente que obtengamos una estimación
mucho menos precisa cuando diferenciamos (aunque es probable que los errores estándar OLS de
la parte (i) sean demasiado pequeños debido a la correlación serial positiva en los errores dentro de
cada ciudad). Si bien hemos diferenciado ai, puede haber otros inobservables que cambien con el
tiempo y estén relacionados con Δpctstu.
(iv) El error estándar robusto de heterocedasticidad en Δpctstu es de aproximadamente 0,0028, que

en realidad es mucho más pequeño que el error estándar OLS habitual. Esto solo hace que pctstu
sea aún más significativo (estadística t robusta ≈ 4). Tenga en cuenta que la correlación en serie ya
no es un problema porque no tenemos un componente de tiempo en la primera ecuación
diferenciada.
C13.7 (i) La agrupación en semestres y el uso de OLS proporciona
El coeficiente en la temporada implica que, en otras cosas, el promedio de calificaciones de un atleta

es de .027 puntos más bajo cuando su deporte está en la temporada. En una escala de cuatro puntos,
este es un efecto modesto (aunque acumula más de cuatro años de elegibilidad atlética). Sin
embargo, la estimación no es estadísticamente significativa (t estadística −5.5). ≈
(ii) La respuesta rápida es que si la habilidad omitida se correlaciona con la temporada, como
sabemos, en los Capítulos 3 y 5, el MCO está sesgado e inconsistente. El hecho de que estemos
agrupados en dos semestres no cambia ese punto básico.
Si pensamos más, la dirección del sesgo no está clara, y aquí es donde la agrupación a lo largo de los
semestres desempeña un papel. Primero, supongamos que usamos solo el término de otoño,
cuando el fútbol está en temporada. Luego, el término de error y la estación se correlacionarían
negativamente, lo que produce un sesgo a la baja en el estimador de MCO de la temporada. Debido
a que se considera que ßseason es negativo, una regresión OLS que usa solo los datos de caída
produce un estimador sesgado hacia abajo. [Cuando solo se usan los datos de otoño, ˆseasonβ =
−.116 (se = .084), que está en la dirección de más sesgo.] Sin embargo, si usamos solo el semestre
de primavera, el sesgo es en la dirección opuesta porque la habilidad y la temporada estaría
correlacionada positivamente (los atletas académicamente más capacitados están en temporada en
la primavera). De hecho, usar solo el semestre de primavera da ˆseasonβ = .00089 (se = .06480),
que es prácticamente igual a cero estadísticamente. Cuando agrupamos los dos semestres, no
podemos, con un análisis mucho más detallado, determinar qué sesgo dominará.
(iii) Las variables sat, hsperc, female, black y white se eliminan porque no varían por semestre. El
intercepto en la primera ecuación diferenciada es el intercepto para el resorte. Tenemos
Curiosamente, el efecto en la temporada ahora es mayor: se estima que el GPA a término es

aproximadamente .065 puntos más bajo en un semestre que el deporte está en temporada. El
estadístico t es aproximadamente –1.51, lo que da un valor p de un lado de aproximadamente .065.
(iv) Una posibilidad es una medida de la carga del curso. Si alguna fracción de los estudiantes atletas
toma una carga más liviana durante la temporada (para aquellos deportes que tienen una
temporada verdadera), los GPA de término pueden ser más altos, otras cosas iguales. Esto desviaría
los resultados de encontrar un efecto de la temporada en el GPA de término.
C13.9 (i) Cuando sumamos los cambios de las nueve variables de salario logístico a la ecuación
(13.33) obtenemos
Los coeficientes de las variables de justicia penal cambian muy modestamente, y la importancia
estadística de cada variable tampoco se ve afectada.
(ii) Dado que algunos signos son positivos y otros negativos, no todos pueden tener el signo
esperado. Por ejemplo, ¿por qué el coeficiente sobre el salario para transporte, servicios públicos y
comunicaciones (wtuc) es positivo y marginalmente significativo (estadística t t 1.79)? Como es de
esperar, los salarios de fabricación más altos conducen a una delincuencia más baja, pero, aunque
el coeficiente estimado es, con mucho, el más grande en magnitud, no es estadísticamente diferente
de cero (t estadística –1.37). La prueba F para la significación conjunta de las variables salariales,
con 9 y 529 df, arroja F ≈ 1.25 y p-valor .26.
C13.11. (i) Tome los cambios como de costumbre, manteniendo las otras variables fijas: Δmath4it =
β1Δlog (rexppit) = (β1 / 100) ⋅ [100⋅Δlog (rexppit)] ≈ (β1 / 100) ⋅ (% Δrexppit). Entonces, si% Δrexppit
= 10, entonces Δmath4it = (β1 / 100) ⋅ (10) = β1 / 10.
(ii) La ecuación, estimada por OLS agrupados en las primeras diferencias (excepto los maniquíes del
año), es
La variable de gasto contemporáneo, aunque todavía tiene un coeficiente negativo, no es en

absoluto estadísticamente significativa. El coeficiente de la variable de gasto rezagado es muy
estadísticamente significativo e implica que un aumento del 10% en el gasto el año pasado aumenta
la tasa de aprobación de math4 en aproximadamente 1.1 puntos porcentuales. Dado el tiempo de
las pruebas, un efecto retrasado no es sorprendente. En Michigan, el examen de matemáticas de
cuarto grado se administra en enero, por lo que si la preparación para el examen comienza con un
año completo de anticipación, el gasto cuando los estudiantes están en tercer grado sería al menos
en parte importante.
(iv) El error estándar de heterocedasticidad es de aproximadamente 4.28, lo que reduce aún más la
importancia de Δlog (rexpp). El error estándar de heterocedasticidad es de aproximadamente 4.38,
lo que reduce sustancialmente el estadístico t. Aún así, Δlog (rexpp-1) es estadísticamente
significativo en poco más del 1% de nivel de significación frente a una alternativa de dos caras.
(v) El error estándar completamente robusto es de aproximadamente 4.94, lo que reduce aún más
la estadística t para Δlog (rexpp). El error estándar completamente robusto es de aproximadamente
5.13, lo que le da a Δlog (rexpp-1) una estadística t de aproximadamente 2.15. El valor p de dos caras
es de aproximadamente .032. log () ˆrexppβΔ1log () ˆrexppβ − Δ
(vi) Podemos usar cuatro años de datos para esta prueba. Al realizar una regresión OLS combinada
de 1ˆôn ititrr−, utilizando los años 1995, 1996, 1997 y 1998, se obtiene ˆρ = −.423 (se = .019), que
es una fuerte correlación serial negativa.
(vii) La prueba "F" completamente robusta para Δlog (enumerar) y Δlunch, informada por Stata 7.0,
es .93. Con 2 y 549 df, esto se traduce en p-valor = .40. Por lo tanto, estaríamos justificados al
eliminar estas variables, pero no están haciendo ningún daño.
C13.13 (i) Podemos estimar todos los parámetros excepto 0β y 1β: la intercepción para el año base
no se puede estimar, ni tampoco los coeficientes de la variable constante de tiempo educi.
(ii) Queremos probar 0127:, ..., 0Hγγγ =, por lo que hay siete restricciones para probar. Usando FD
(que elimina educi) y obteniendo la estadística F, se obtiene F = .31 (p-value = .952). Por lo tanto, no
hay evidencia de que el retorno a la educación varíe durante este período de tiempo. (Además, cada
coeficiente es individualmente estadísticamente insignificante en el nivel del 25%).
(iii) La estadística F completamente robusta es de aproximadamente 1.00, con un valor de p = .432.

Así que la conclusión realmente no cambia: los jγ son conjuntamente insignificantes.
(iv) El diferencial de unión estimado en 1980 es simplemente el coeficiente de, o aproximadamente,

.106 (10.6%). Para 1987, agregamos los coeficientes en itunionΔtunionΔ y 87tdunionitΔ⋅, o −.041
(−4.1%). La diferencia, −14.7%, es estadísticamente significativa (t = −2.15, ya sea que usemos el
error estándar OLS agrupado habitual o el completamente robusto).
(v) El estadístico F habitual es 1.03 (valor p = .405) y el estadístico robusto a heteroscedasticidad y

correlación serial es 1.15 (valor p = .331). Por lo tanto, cuando probamos todos los términos de
interacción como un grupo (siete de ellos), no rechazamos la nula de que el diferencial de unión fue
constante durante este período. La mayoría de las interacciones son individualmente insignificantes;
de hecho, solo los de 1986 y 1987 son cercanos. Podemos obtener una insignificancia conjunta
agrupando varias variables estadísticamente insignificantes con una o dos variables
estadísticamente significativas. Pero es difícil ignorar el cambio prácticamente grande de 1980 a
1987. (Puede haber un problema en este ejemplo con el supuesto de exogeneidad estricta: tal vez
la afiliación sindical del próximo año dependa de cambios salariales inesperados este año).
Capítulo 14
14.5 (i) Para cada estudiante tenemos varias medidas de rendimiento, generalmente tres o cuatro,
el número de clases tomadas por un estudiante que tiene exámenes finales. Cuando especificamos
una ecuación para cada puntaje de examen final estandarizado, los errores en las diferentes
ecuaciones para el mismo estudiante se correlacionarán: los estudiantes que tienen mayor
capacidad (no observada) tienden a hacerlo mejor en todas las pruebas.
(ii) Un modelo de efectos no observados es
Donde como es el efecto del estudiante no observado. Debido a que el puntaje del SAT y el GPA
acumulativo dependen solo del estudiante y no de la clase en particular que está tomando, estos
no tienen un subíndice. Las tasas de asistencia generalmente varían según la clase, al igual que el
indicador de si una clase está en la especialidad del estudiante. El término θc denota diferentes
intercepciones para diferentes clases. A diferencia de un conjunto de datos de panel, donde el
tiempo es el orden natural de los datos dentro de cada unidad de sección transversal, y los efectos
de tiempo agregados se aplican a todas las unidades, es posible que no se necesiten
interceptaciones para las diferentes clases. Si todos los estudiantes tomaron el mismo conjunto de
clases, entonces esto es similar a un conjunto de datos del panel, y nos gustaría poner en diferentes
intercepciones de clase. Pero con los estudiantes que toman diferentes cursos, la clase que
etiquetamos como "1" para el estudiante A no tiene nada que ver con la clase "1" para el estudiante
B. Por lo tanto, las diferentes intercepciones de clase basadas en el orden arbitrario de las clases
para cada estudiante probablemente no son necesario. Podemos reemplazar θc con β0, una
constante de intercepción entre clases.
(iii) Manteniendo la suposición de que el error idiosincrático, usc, no está correlacionado con todas
las variables explicativas, necesitamos la heterogeneidad no observada de los estudiantes, como,
que no esté correlacionada con atndrtesc. La inclusión del puntaje del SAT y el GPA acumulativo
debería ayudar en este sentido, ya que es la parte de la habilidad que no se captura con el SAT y el
cumGPA. En otras palabras, controlar SAT y cumGPA podría ser suficiente para obtener el efecto
ceteris paribus de la asistencia a clase.
(iv) Si los exámenes SAT y cumGPA no son controles suficientes para la capacidad y motivación del
estudiante, como se correlaciona con atndrtesc, y esto provocaría que los OLS agrupados sean
sesgados e inconsistentes. Podríamos usar efectos fijos en su lugar. Dentro de cada alumno,
calculamos los datos degradados, donde, para cada alumno, los medios se calculan en todas las
clases. Las variables SATs y cumGPAs abandonan el análisis.
SOLUCIONES A LOS EJERCICIOS DE COMPUTACION
C14.1 (i) Esto se hace en el Ejercicio de computadora 13.5 (i).
(ii) Ver Ejercicio de computadora 13.5 (ii).
(iii) Ver Ejercicio de computadora 13.5 (iii).

(iv) Esta es la única parte nueva. Las estimaciones de efectos fijos, reportadas en forma de ecuación,
son
(Hay N = 64 ciudades y T = 2 años). No informamos una intersección porque se elimina por

degradación de tiempo. El coeficiente en y90t es idéntico al intercepto de la primera estimación de
diferencia, y los coeficientes de pendiente y los errores estándar son idénticos a la primera
diferenciación. No informamos una R cuadrada porque ninguna es comparable a la R cuadrada
obtenida de la primera diferenciación.
C14.3 (i) 135 empresas se utilizan en la estimación de FE. Debido a que hay tres años, tendríamos
un total de 405 observaciones si cada empresa tuviera datos sobre todas las variables para los tres
años. En cambio, debido a los datos faltantes, podemos usar solo 390 observaciones en la
estimación de FE. Las estimaciones de efectos fijos son
(ii) El coeficiente de subvención significa que si una empresa recibió una subvención para el año en
curso, capacitó a cada trabajador con un promedio de 34.2 horas más de lo que tendría de otra
manera. Este es un efecto prácticamente grande, y el estadístico t es muy grande.
80
(iii) Dado que el año pasado se usó una beca para pagar la capacitación, tal vez no sea sorprendente
que las becas no se transfieran a más capacitación este año. Sería si la inercia desempeñara un papel
en la formación de los trabajadores.
(iv) El coeficiente de la variable empleados es muy pequeño: un aumento del 10% en el empleo
aumenta las horas previstas por empleado solo en aproximadamente .018. [Recuerde: (.176 / 100)
(% Δemploy).] Esto es muy pequeño, y el estadístico t es prácticamente cero. 􀁬hrsempΔ≈
C14.5 (i) Las diferentes ocupaciones están sindicadas a tasas diferentes, y los salarios también
difieren según la ocupación. Por lo tanto, si omitimos los indicadores binarios para la ocupación, el
diferencial salarial del sindicato puede simplemente estar recogiendo las diferencias salariales entre
las ocupaciones. Debido a que algunas personas cambian de ocupación durante el período,
deberíamos incluirlas en nuestro análisis.
(ii) Debido a que las nueve categorías ocupacionales (occ1 a occ9) son exhaustivas, debemos elegir
una como grupo base. Por supuesto, el grupo que elegimos no afecta la diferencia salarial sindical
estimada. La estimación del efecto fijo en la unión, con cuatro decimales, es .0804 con error
estándar = .0194. Prácticamente no hay diferencia entre esta estimación y el error estándar y la
estimación y el error estándar sin los controles ocupacionales (= .0800, se = .0193). Ûnionβ
C14.7 (i) Si hay un efecto disuasorio, entonces β1 <0. El signo de β2 no es del todo obvio, aunque
una posibilidad es que una mejor economía signifique menos crimen en general, incluidos los delitos
violentos (como el tráfico de drogas) que Llevaría a menos asesinatos. Esto implicaría β2> 0.
(ii) Las estimaciones OLS combinadas que utilizan 1990 y 1993 son
Ahora, hay un efecto disuasivo estadísticamente significativo: se estima que 10 ejecuciones más
reducirán la tasa de homicidios en 1.04, o un asesinato por cada 100,000 personas. ¿Es este un gran
efecto? Las ejecuciones son relativamente raras en la mayoría de los estados, pero las tasas de
homicidios también son relativamente bajas en promedio.
81
En 1993, la tasa promedio de homicidios era de aproximadamente 8.7; una reducción de uno sería
no trivial. Para las personas (desconocidas) cuyas vidas podrían salvarse a través de un efecto
disuasorio, parecería importante.
(iv) El error estándar robusto de heteroscedasticidad para Δexeci es .017. Algo sorprendente, esto
está muy por debajo del error estándar no robusto. Si usamos el error estándar robusto, la evidencia
estadística del efecto disuasorio es bastante fuerte (t ≈ −6.1). Véase también Ejercicio de ordenador
13.12.
(v) Texas tuvo con mucho el mayor valor de exec, 34. El siguiente estado más alto fue Virginia, con
11. Estos son totales de tres años.
(vi) Sin Texas en la estimación, obtenemos lo siguiente, con errores estándar robustos a la
heterocedasticidad en [⋅]:
Ahora el efecto disuasorio estimado es menor. Quizás más importante, el error estándar en Δexeci
ha aumentado en una cantidad sustancial. Esto sucede porque cuando abandonamos Texas,
perdemos gran parte de la variación en la variable explicativa clave, Δexeci.
(vii) Cuando aplicamos efectos fijos utilizando los tres años de datos y todos los estados que
obtenemos
El tamaño del efecto disuasorio es solo aproximadamente la mitad que cuando no se usa 1987.
Además, la estadística t, aproximadamente −.34, es muy pequeña. El hallazgo anterior de un efecto
disuasorio no es robusto al período de tiempo utilizado. Curiosamente, agregar otro año de datos
hace que el error estándar en el coeficiente exec aumente notablemente.
C14.9 (i) Las estimaciones de OLS son

Notas para R

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Notas para R

Încărcat de

Drepturi de autor:

Formate disponibile

13.1. En el ejemplo 13.

1 se hizo el supuesto que los promedios de todos los factores distintos de

afchnge se omite en la ecuación (13.12) es

ecuación (13.12)? Explique por qué.

ii) Cuando afchnge se incluye pero highearn se omite, el resultado es

(13.12)? [Sugerencia: en la ecuación (13.10), ¿cuál es el supuesto que se hace sobre

los grupos de tratamiento y control si 1 0?]

C13.1 Utilice la base de datos FERTIL1.RAW para este ejercicio.

Tres de los términos de interacción, y78educ, y82⋅⋅educ y y84⋅educ son estadísticamente

(ii) La ecuación estimada es

Si bien 1ˆδ = .048 es el signo esperado, no es estadísticamente significativo (t estadístico .59). ≈

(iii) Cuando agregamos la lista de características de alojamiento a la regresión, el coeficiente en

C13.5 (i) Usando OLS agrupados obtenemos

(iii) La ecuación estimada en diferencias es

(iv) El error estándar robusto de heterocedasticidad en Δpctstu es de aproximadamente 0,0028, que

C13.7 (i) La agrupación en semestres y el uso de OLS proporciona

El coeficiente en la temporada implica que, en otras cosas, el promedio de calificaciones de un atleta

Curiosamente, el efecto en la temporada ahora es mayor: se estima que el GPA a término es

La variable de gasto contemporáneo, aunque todavía tiene un coeficiente negativo, no es en

(iii) La estadística F completamente robusta es de aproximadamente 1.00, con un valor de p = .432.

(iv) El diferencial de unión estimado en 1980 es simplemente el coeficiente de, o aproximadamente,

(v) El estadístico F habitual es 1.03 (valor p = .405) y el estadístico robusto a heteroscedasticidad y

(ii) Un modelo de efectos no observados es

SOLUCIONES A LOS EJERCICIOS DE COMPUTACION

C14.1 (i) Esto se hace en el Ejercicio de computadora 13.5 (i).

(ii) Ver Ejercicio de computadora 13.5 (ii).

(iii) Ver Ejercicio de computadora 13.5 (iii).

(Hay N = 64 ciudades y T = 2 años). No informamos una intersección porque se elimina por

C14.9 (i) Las estimaciones de OLS son

S-ar putea să vă placă și