Documente Academic
Documente Profesional
Documente Cultură
Por supuesto, hay que hacer econometra ms all de las microaplicaciones aplicadas de inters
para Silicon Valley y la economa laboral emprica con la que estamos ms comprometidos. Pero
las herramientas que favorecemos son fundamentales para casi cualquier agenda emprica. Las
discusiones profesionales sobre eventos econmicos importantes como la Gran Recesin y las
importantes fusiones de telecomunicaciones son casi siempre argumentos sobre los efectos
causales. Del mismo modo, Janet Yellen y los cientos de investigadores que la apoyan en la
Reserva Federal ansan evidencia confiable sobre si X causa Y.
La investigacin puramente descriptiva sigue siendo importante, y hay un papel para el pronstico
basado en datos. Los econometristas aplicados han estado involucrados desde hace tiempo en
estas reas, pero estas habilidades valiosas son el pan de cada da de disciplinas como las
estadsticas y, cada vez ms, la informtica. Estos esfuerzos no estn donde radica nuestra ventaja
comparativa como economistas. La econometra en su mejor momento se distingue de otras
ciencias de datos por un pensamiento causal claro. Este tipo de pensamiento es, por lo tanto, lo
que enfatizamos en nuestras clases.
Tras una breve descripcin del cambio hacia el trabajo emprico basado en el diseo,
desarrollamos el argumento del cambio al considerar los fundamentos de la instruccin
economtrica, centrndonos en los enfoques antiguos y nuevos de la regresin. Luego
observamos una coleccin de libros de texto clsicos y contemporneos, y una muestra de listas
de lectura contemporneas y contornos de cursos. Es ms probable que las listas de lectura en
nuestra muestra cubran mtodos empricos modernos que los libros actuales lderes en el
mercado. Pero la mayora de los cursos permanecen empantanados en material tcnico aburrido y
obsoleto.
Ambos trabajos se refieren al papel de las escuelas en la generacin de capital humano: Summers
y Wolfe con los efectos de las caractersticas de la escuela primaria en el rendimiento estudiantil;
Dale y Krueger con los efectos de las caractersticas de la universidad en las ganancias de los
graduados. Estas preguntas son de naturaleza similar, pero los anlisis en los dos artculos difieren
notablemente.
Summers y Wolfe (1977) interpretan que su misin es la de modelar el proceso complejo que
genera el rendimiento estudiantil. Comienzan con un modelo general de produccin educativa que
incluye caractersticas no especificadas de los estudiantes, caractersticas de los docentes, insumos
escolares y composicin por pares. El modelo est vagamente motivado por una apelacin a la
teora del capital humano, pero los autores reconocen que los detalles de cmo se producen los
logros siguen siendo misteriosos. Lo que se destaca en este marco es la falta de especificidad: la
regresin de Summers y Wolfe pone el cambio en los puntajes de los exmenes de 3 a 6 grado
en el lado izquierdo, con una lista de 29 caractersticas de estudiantes y escuelas a la derecha. Esta
lista incluye ingresos familiares, coeficiente de inteligencia del estudiante, sexo y raza; la calidad
de la universidad a la que asiste la experiencia del docente y el docente; tamao de la clase e
inscripcin escolar; y medidas de la composicin y el comportamiento de los compaeros.
El trabajo de Summers y Wolfe (1977) es fiel a la misin emprica de los aos setenta, la bsqueda
de un verdadero modelo con un gran nmero de variables explicativas:
Estamos seguros de que los coeficientes describen de manera razonable la relacin entre lograr y
GSES [dotacin gentica y nivel socioeconmico], TQ [calidad del docente], SQ [calidad de la
escuela no docente] y PG [caractersticas del grupo de pares], para este coleccin de 627
estudiantes de escuela primaria.
En el espritu de los anlisis de regresin de amplio alcance de su poca, Summers y Wolfe no
ofrecen un lugar de honor a ningn conjunto particular de variables. Al mismo tiempo, su narrativa
interpreta las estimaciones de regresin como la captura de efectos causales. Sacan conclusiones
de poltica a partir de resultados empricos, sugiriendo, por ejemplo, que las escuelas no usan el
puntaje del Examen Nacional de Maestros para guiar las decisiones de contratacin.
Esta interpretacin de la regresin est en el espritu de la econometra de Stones 'Age, que
tpicamente comienza con una ecuacin de regresin lineal destinada a describir un proceso
econmico, lo que algunos llamaran una "relacin estructural". Muchos autores de esta Era
continan diciendo que en Para obtener estimaciones imparciales o consistentes, el analista debe
suponer que los errores de regresin son independientes de los regresores. Pero dado que todas
las regresiones producen un residuo con esta propiedad de ortogonalidad, para cualquier regresor
incluido en el modelo, es difcil ver cmo esta afirmacin promueve un pensamiento claro sobre
los efectos causales.
La investigacin de Dale y Krueger (2002) tambin comienza con una pregunta sobre las escuelas,
preguntando si los estudiantes que asisten a una universidad ms selectiva ganan ms como
resultado y, como Summers y Wolfe (1977), usa mtodos de regresin de mnimos cuadrados
ordinarios para construir una responder. Sin embargo, el anlisis aqu difiere de tres maneras
importantes. El primero es un enfoque en los efectos causales especficos: no hay ningn esfuerzo
para "explicar los salarios". El estudio de Dale y Krueger compara a los estudiantes que asisten a
universidades ms y menos selectivas. La calidad de la universidad (medida por el puntaje SAT
promedio de las escuelas) es solo un factor que puede cambiar los salarios, seguramente menor
en un sentido R2.
Esta investigacin altamente enfocada se justifica por el hecho de que el anlisis aspira a
responder una pregunta causal que preocupa a los estudiantes, padres y polticos.
La segunda caracterstica distintiva es una estrategia de investigacin destinada a eliminar el sesgo
de seleccin: sin duda, los graduados de las escuelas de lite ganan ms (en promedio) que los que
se fueron a otro lado. Sin embargo, dado que las escuelas de lite seleccionan cuidadosamente a
sus estudiantes, es claro que esta diferencia puede reflejar un sesgo de seleccin. El documento
de Dale y Krueger (2002) esboza una estrategia de investigacin de seleccin en observables
destinada a superar este problema central.
El diseo de investigacin de Dale y Krueger (2002) compara a las personas que enviaron
solicitudes al mismo conjunto de universidades y recibieron las mismas decisiones de admisin.
Dentro de los grupos definidos por las decisiones de solicitud y admisin, los estudiantes que
asisten a diferentes tipos de escuelas son mucho ms similares de lo que seran en una muestra no
restringida. El estudio de Dale y Krueger argumenta que cualquier variacin dentro del grupo en la
selectividad de la escuela atendida es esencialmente fortuita, tan buena como aleatoriamente
asignada, y por lo tanto no relacionada con la habilidad, motivacin, antecedentes familiares y
otros factores relacionados con el potencial de ganancias intrnsecas. Este argumento constituye el
contenido economtrico ms importante del documento de Dale y Krueger.
Una tercera caracterstica importante del estudio de Dale y Krueger (2002) es una clara distincin
entre las causas y los controles en el lado derecho de las regresiones en el corazn de su estudio.
En el paradigma moderno, los regresores no son todos creados iguales. Ms bien, se considera que
solo una variable a la vez tiene efectos causales. Todos los dems son controles incluidos en el
servicio de esta agenda causal focalizada.
En la produccin educativa, por ejemplo, es improbable que los coeficientes de las variables
demogrficas y otras caractersticas de los estudiantes tengan una interpretacin econmica clara.
Por ejemplo, qu deberamos hacer con el coeficiente de IQ en la regresin anterior de Summers-
Wolfe? Este coeficiente revela solo que dos medidas del coeficiente de inteligencia intelectual y la
variable dependiente se correlacionan positivamente despus del ajuste de la regresin para otros
factores. Por otro lado, las caractersticas del entorno escolar, como el tamao de las clases, a
veces pueden ser modificadas por los administradores escolares. De hecho, es posible que
deseemos considerar las implicaciones de los coeficientes de tamao de clase para la poltica
educativa.
La distincin moderna entre variables causales y de control en el lado derecho de una ecuacin de
regresin requiere suposiciones ms matizadas que la declaracin general de ortogonalidad por
regresin-error que es emblemtica de la presentacin economtrica tradicional de la regresin.
Esta diferencia en los roles entre las variables de la mano derecha que podran ser causales y las
que son solo controles debera surgir claramente en las historias de regresin que les contamos a
nuestros estudiantes.
Fuera de control
El paradigma economtrico moderno ejemplificado por Dale y Krueger (2002) trata la regresin
como una estrategia de control emprico diseada para capturar los efectos causales.
Especficamente, la regresin es una casamentera automatizada que produce comparaciones
dentro del grupo: hay una sola variable causal de inters, mientras que otros regresores miden las
condiciones y circunstancias que nos gustara mantener fijas al estudiar los efectos de esta causa.
Al mantener fijas las variables de control, es decir, al incluirlas en un modelo de regresin
multivariable, esperamos dar un coeficiente de regresin sobre la variable causal a ceteris paribus,
interpretacin de manzanas a manzanas.
Les contamos esta historia a estudiantes de pregrado sin matemticas elaboradas, pero las ideas
son sutiles y nuestros alumnos las encuentran desafiantes. Los ejemplos empricos detallados que
muestran cmo la regresin puede usarse para generar conclusiones causales interesantes, tiles
y sorprendentes ayudan a aclarar estas ideas.
Nuestra versin instructiva de la aplicacin Dale and Krueger (2002) pregunta si vale la pena asistir
a una universidad privada, Duke, por ejemplo, en lugar de una escuela estatal como la Universidad
de Carolina del Norte. Esto convierte la selectividad universitaria en un tratamiento binario ms
simple, de modo que podamos emitir los efectos de inters generados por las simples
comparaciones de encendido / apagado. Especficamente, preguntamos si el dinero gastado en la
matrcula universitaria privada se justifica por los aumentos de ganancias futuras. Esto lleva a la
pregunta de cmo utilizar la regresin para estimar el efecto causal de la asistencia privada a la
universidad en las ganancias.
Para empezar, usamos la notacin que distingue entre causa y control.
En este caso, el regresor causal es Pi, una variable ficticia que indica la asistencia a una universidad
privada para el individuo i. Las variables de control se denotan por Xi, o se les dan otros nombres
cuando los controles especficos son dignos de atencin, pero en todos los casos son distintos de
la variable causal privilegiada, Pi. El resultado de inters, Yi, es una medida de las ganancias
aproximadamente 20 aos despus de la inscripcin.
La relacin causal entre la asistencia a la universidad privada y las ganancias se describe en
trminos de resultados potenciales: Y1i, que representa las ganancias del individuo i fueron l o
ella a ser privadas (Pi = 1), y Y0i, representando las ganancias de i despus de una educacin
pblica (Pi = 0). El efecto causal de asistir a una universidad privada para el individuo i es la
diferencia (Y1i - Y0i). Esta diferencia nunca se puede ver; ms bien, solo vemos Y1i o Y0i,
dependiendo del valor de Pi. El objetivo del analista es, por lo tanto, medir un efecto causal
promedio, como E (Y1i - Y0i).
En MIT (donde ambos hemos enseado), pedimos a los estudiantes de econometra de una
universidad privada que consideren su contrafctica personal si hubieran elegido una escuela
pblica en lugar de venir al MIT. Algunos de nuestros estudiantes son personas mayores que han
alineado trabajos con los gustos de Google y Goldman. Muchas de las personas con las que
trabajan en estas empresas, quizs la mayora, se han ido a las escuelas estatales. En vista de este
hecho, les pedimos a nuestros estudiantes que consideren si las universidades privadas al estilo de
MIT realmente marcan la diferencia cuando se trata del xito profesional.
La primera contribucin de un marco causal basado en los posibles resultados es explicar por qu
es probable que las comparaciones ingenuas de los graduados universitarios pblicos y privados
sean engaosas. El segundo es explicar cmo una estrategia de regresin construida
apropiadamente nos lleva a algo mejor.
Tenga en cuenta que esta es una suposicin ms dbil y ms centrada que la presentacin
tradicional, que dice que el trmino de error es independiente de la media de todos los
regresores, es decir, E (i | Pi, Xi) = 0.
En el estudio de Dale y Krueger (2002), la variable Xi identifica las escuelas a las que los
estudiantes universitarios graduados en la muestra haban aplicado y fueron admitidas. El
supuesto de independencia condicional dice que, despus de haber postulado a Duke y UNC y
haber sido admitidos en ambos, aquellos que eligieron asistir a Duke tienen el mismo potencial de
ingresos que aquellos que asistieron a la escuela estatal. Aunque tal condicionamiento no
convierte la asistencia universitaria en un ensayo aleatorizado, proporciona una fuente de control
convincente para las principales fuerzas que confunden la inferencia causal. Los solicitantes se
dirigen a las escuelas en vista de su ambicin y voluntad de realizar el trabajo requerido; Las
oficinas de admisiones miran cuidadosamente la capacidad del solicitante.
Cerramos el ciclo que vincula la inferencia causal con la regresin lineal al introducir una hiptesis
de forma funcional, especficamente que la media condicional de las ganancias potenciales cuando
se asiste a una escuela pblica es una funcin lineal de Xi. Esto se puede escribir formalmente
como E (i | Xi) = Xi. Los textos de Econometra se preocupan mucho por la linealidad y sus
limitaciones, pero consideramos que estos retorcimientos de manos son extraviados. En el diseo
de investigacin de Dale y Krueger, los controles son un conjunto grande de variables ficticias para
todos los posibles grupos de solicitantes. Los controles clave en este caso vienen en la forma de un
modelo saturado, es decir, un conjunto exhaustivo de variables ficticias para todos los valores
posibles de la variable condicionante. Dichos modelos son intrnsecamente lineales. En otros
casos, podemos acercarnos lo ms posible a la funcin media condicional subyacente agregando
trminos e interacciones polinomiales. Cuando las muestras son pequeas, felizmente usamos la
linealidad para interpolar, utilizando los datos a mano de manera ms eficiente. En algunos de los
modelos Dale y Krueger, por ejemplo, los dummies para grupos de escuelas son reemplazados por
un control lineal para la selectividad promedio de las escuelas (es decir, los puntajes SAT promedio
de sus estudiantes).
La combinacin de estos tres ingredientes, los efectos causales constantes, la independencia
condicional y un modelo lineal para posibles resultados condicionados a los controles, produce el
modelo de regresin
que se puede usar para construir estimaciones imparciales y consistentes del efecto causal de la
asistencia a la escuela privada, . La historia causal que nos lleva a este punto revela lo que
queremos decir con y por qu estamos usando la regresin para estimarlo.
Esta ecuacin final se parece a muchas vistas en textos lderes en el mercado. Pero esta aparente
similitud es menos til que una fuente de confusin. En nuestra experiencia, presentar esta
ecuacin y recitar suposiciones sobre la correlacin de los regresores y las nubes ei ms que
aclarar la base para la inferencia causal. En cuanto a las variables de control, la ortogonalidad
residual-regresora est asegurada en lugar de asumida; es decir, el lgebra de regresin hace que
esto suceda. Al mismo tiempo, aunque los controles seguramente no estn correlacionados con
los residuos, es poco probable que los coeficientes de regresin que multiplican los controles
tengan una interpretacin causal. No creemos que los controles sean tan buenos como los
asignados al azar y no nos importa si lo son o no.
Los controles tienen un trabajo que hacer: son la base del reclamo de independencia condicional
que es fundamental para el marco de regresin moderno.
Siempre que los controles hagan que esta afirmacin sea plausible, el coeficiente puede verse
como un efecto causal.
El paradigma de regresin moderno gira en torno a la nocin de que el analista tiene datos sobre
variables de control que generan comparaciones de manzanas para la variable de inters. Dale y
Krueger (2002) explican lo que esto significa en su estudio:
Si, con la condicin de obtener la admisin, los estudiantes eligen asistir a las escuelas por razones
que son independientes de [determinantes de ganancias no observadas] entonces los estudiantes
que fueron aceptados y rechazados por el mismo conjunto de escuelas tendran el mismo valor
esperado de [estos determinantes, el error trmino en su modelo]. En consecuencia, nuestra
solucin propuesta para el problema de seleccin de escuelas es incluir un conjunto irrestricto de
variables ficticias que indiquen grupos de estudiantes que recibieron las mismas decisiones de
admisin (es decir, la misma combinacin de aceptaciones y rechazos) del mismo conjunto de
universidades.
En nuestro anlisis de los datos de Dale y Krueger (informados en el captulo 2 de Angrist y Pischke
2015), las estimaciones de una regresin sin controles muestran un gran efecto de escuela privada
de 13,5 puntos log. Este efecto se reduce a 8.6 puntos de registro despus de controlar los
puntajes SAT propios del alumno, los ingresos de su familia y algunas variables demogrficas ms.
Pero el control de las escuelas a las que un estudiante solicit admisin y que fue admitido
(utilizando muchas variables ficticias) produce un efecto de escuela privada pequeo y
estadsticamente insignificante de menos del 1 por ciento.
Comparar los resultados de la regresin con un nmero creciente de controles de esta manera,
comparando los resultados no controlados, los resultados con los controles crudos y los resultados
con una variable de control que aborda de manera ms plausible el problema del sesgo de
seleccin ofrece informacin valiosa. Estas ideas ayudan a los estudiantes a comprender por qu
es ms probable que el ltimo modelo tenga una interpretacin causal que los dos primeros.
En primer lugar, observamos al analizar estos resultados que el gran diferencial privado
descontrolado en los salarios se debe aparentemente al sesgo de seleccin. Aprendemos esto del
hecho de que el efecto bruto se desvanece despus de controlar los atributos preuniversitarios de
los estudiantes, en este caso, la ambicin y la capacidad, tal como se refleja en el conjunto de
escuelas que un alumno aplica y califica. Por supuesto, an puede haber un sesgo de seleccin en
el contraste privado-pblico condicional en estos controles. Pero debido a que los controles estn
codificados a partir de las decisiones de solicitud y admisin que preceden a las decisiones de
inscripcin a la universidad, no pueden ser consecuencia de la asistencia a la escuela privada.
Deben estar asociados con las diferencias en Y0i que generan un sesgo de seleccin. La
eliminacin de estas diferencias, es decir, la comparacin de estudiantes con Y0i similares, es
probable que genere efectos privados de la escuela que sean menos engaosos que los modelos
ms simples que omitan estos controles.
Tambin mostramos a nuestros estudiantes que despus de condicionar las variables de admisin
y de admisin, las variables de habilidades y antecedentes familiares en forma de puntajes SAT e
ingresos familiares no estn correlacionados con la asistencia a la escuela privada. El hallazgo de
un rendimiento cero de escuela privada es, por lo tanto, notablemente insensible a un mayor
control ms all de un conjunto bsico. Este argumento usa la frmula de sesgo de variables
omitidas, que vemos como una especie de regla de oro para el practicante de regresin moderno.
Nuestras estimaciones de regresin revelan robustez a un mayor control que esperaramos ver en
un ensayo aleatorizado bien administrado.
Usando un argumento similar de tipo de variables omitidas, notamos que incluso si hay otros
factores de confusin que no hemos controlado, aquellos que estn positivamente
correlacionados con la asistencia a la escuela privada tambin se correlacionan positivamente con
las ganancias. Incluso si estas variables permanecen omitidas, su omisin lleva a que las
estimaciones calculadas con las variables disponibles sobreestimen la prima de la escuela privada,
por pequea que sea.
Las aplicaciones empricas como esta demuestran el enfoque moderno de la regresin,
destacando las suposiciones matizadas necesarias para una interpretacin causal de los
parmetros de regresin.
Si se viola el supuesto de independencia condicional, los mtodos de regresin no logran descubrir
los efectos causales y es probable que sean engaosos. De lo contrario, hay esperanza para la
inferencia causal. Por desgracia, los tpicos de regresin que dominan la enseanza economtrica,
incluyendo extensas discusiones sobre suposiciones de regresin clsica, forma funcional,
multicolinealidad y asuntos relacionados con la inferencia estadstica y la eficiencia, tienen poca
importancia al lado de este hecho de vivir o morir sobre diseos de investigacin basados en
regresin.
Lo cual no quiere decir que la inferencia causal usando mtodos de regresin ahora se haya hecho
ms fcil. La pregunta de qu hace una buena variable de control es una de las ms desafiantes en
la prctica emprica. Las variables de control candidatas se deben juzgar segn si hacen que el
supuesto de independencia condicional sea ms plausible, y a menudo es difcil de decir. Por lo
tanto, discutimos muchos ejemplos de regresin con nuestros estudiantes, todos interesantes,
pero algunos ms convincentes que otros. Una preocupacin particular es que no todos los
controles son buenos controles, incluso si estn relacionados con Pi y Yi.
Ejemplos especficos y preguntas para discusin: "Deberas controlar la ocupacin en una
ecuacin salarial para medir el rendimiento econmico de la educacin?": Iluminar el problema
del control negativo y, por lo tanto, garantizar tiempo en el aula (y en nuestros libros, Angrist y
Pischke 2009 , 2015).
Las suposiciones de regresin clsica son tiles para la derivacin de errores estndar de
regresin. Simplifican las matemticas y la frmula resultante revela las caractersticas de los
datos que determinan la precisin estadstica. Sin embargo, esta derivacin requiere poco de
nuestro tiempo de clase. No nos detenemos en las pruebas estadsticas para la validez de las
suposiciones clsicas o en las reparaciones generalizadas de mnimos cuadrados para sus fallas.
Nos parece que la mayor parte de lo que generalmente se ensea sobre la inferencia en una clase
introductoria de licenciatura puede reemplazarse con la frase "usar errores estndar robustos".
Con una advertencia sobre la dependencia ciega de las aproximaciones asintticas, sugerimos a
nuestros estudiantes que sigan la investigacin actual prctica. Como lo sealan White (1980b) y
otros, la frmula robusta aborda las consecuencias estadsticas de heterocedasticidad y no
linealidad en datos transversales. Los errores estndar de Newey y West (1987) tambin pueden
manejar la autocorrelacin en series cronolgicas, mientras que los mtodos de clster abordan la
correlacin entre unidades transversales o en datos de panel (Moulton 1986, Arellano 1987,
Bertrand, Duflo y Mullainathan 2004).
En otra tierra: textos economtricos y enseanza Los libros de texto de econometra tradicional
son escasos en cuanto a ejemplos empricos. En el texto clsico de John-ston (1972), la primera
aplicacin emprica es una regresin bivariada que relaciona las vctimas de la carretera con la
cantidad de vehculos autorizados. Este ejemplo se centra en la computacin, una preocupacin
comprensible en ese momento, pero Johnston no explica por qu la relacin entre vctimas y
licencias es interesante o lo que las estimaciones podran significar. El primer ejemplo emprico de
Gujarati (1978) es ms sustantivo, una funcin de produccin Cobb-Douglas estimada con algunas
observaciones anuales. Las funciones de produccin, relaciones causales implcitas, son un
componente fundamental de la teora econmica. La discusin de Gujarati interpreta tilmente las
magnitudes y considera si las estimaciones pueden ser consistentes con rendimientos constantes a
escala.
Pero esta aplicacin no aparece hasta la pgina 107. Dcadas despus, el trabajo emprico real
todava era escaso en los textos principales, y la presentacin de ejemplos empricos a menudo
permaneca enfocada en tecnicismos matemticos y estadsticos. En un ensayo publicado hace 16
aos en esta revista, Becker y Greene (2001) encuest textos de econometra y enseanza en el
cambio de milenio:
La econometra y las estadsticas a menudo se ensean como ramas de las matemticas, incluso
cuando se ensean en escuelas de negocios ... el enfoque en los libros de texto y materiales de
enseanza es presentar y explicar la teora y los detalles tcnicos con atencin secundaria a las
aplicaciones, que a menudo se fabrican para adaptarse el procedimiento en cuestin ... las
aplicaciones raramente se basan en eventos reportados en peridicos financieros, revistas de
negocios o revistas acadmicas en economa.
Siguiendo una tendencia ms amplia hacia el empirismo en la investigacin econmica
(documentada en Hammermesh 2013 y Angrist, Azoulay, Ellison, Hill y Lu de prxima publicacin),
los textos de hoy son ms empricos que los que han reemplazado. En particular, los textos
economtricos modernos son ms probables que los descritos por Becker y Greene para integrar
ejemplos empricos en todas partes, y a menudo vienen con acceso a sitios web donde los
estudiantes pueden encontrar datos econmicos reales para los conjuntos de problemas y la
prctica.
Pero las noticias en el frente de los libros de texto no son todas buenas. Muchos de los ejemplos
de libros de texto actuales todava son artificiales o estn poco motivados. Ms decepcionante
para nosotros que la desigual calidad de las aplicaciones empricas en la biblioteca de econometra
contempornea es la falta de discusin de las herramientas empricas modernas. Aparte de Stock y
Watson (2015), que se acerca ms a abrazar la agenda moderna, ninguno de los textos de
econometra de pregrado modernos examinados a continuacin menciona mtodos de regresin-
discontinuidad, por ejemplo. Del mismo modo, vemos poca o ninguna discusin sobre las
amenazas a la validez que podran confundir el anlisis de polticas de estilo diferencias en las
diferencias, a pesar de que el trabajo emprico de este tipo es ahora omnipresente. Los textos de
Econometra siguen enfocados en material que es cada vez ms irrelevante para la prctica
emprica.
Para poner estas y otras afirmaciones sobre el contenido de libros de texto sobre una base
emprica ms firme, clasificamos el contenido de 12 libros (enumerados en el Apndice Tabla A1
en lnea), seis de la dcada de 1970 y seis actualmente en gran uso. Nuestra lista de clsicos se
construy identificando ediciones de la dcada de 1970 de los volmenes incluidos en la Tabla 1
de Becker and Green (2001), que enumera los libros de texto de licenciatura de amplio uso cuando
escribieron su ensayo.
Compramos copias de estos primeros libros de primera o segunda edicin. Nuestra lista de textos
clsicos contiene Kmenta (1971), Johnston (1972), Pindyck y Rubinfeld (1976), Gujarati (1978),
Intriligator (1978) y Kennedy (1979). La divisin entre los libros de graduacin y de pregrado fue
ms turbia en la dcada de 1970: a diferencia de los libros de pregrado de la actualidad, algunos
de estos textos ms antiguos usan lgebra lineal. Intriligator (1978), Johnston (1972) y Kmenta
(1971) son notablemente ms avanzados que los otros tres. Por lo tanto, resumimos el contenido
del libro de los 70 con y sin estos tres incluidos.
Nuestros textos contemporneos son los seis libros que figuran con ms frecuencia en las listas de
lectura que se encuentran en el sitio web del Proyecto Open Syllabus
(http://opensyllabusproject.org/).
Especficamente, nuestros lderes modernos del mercado son los que se encuentran en la parte
superior de una lista generada al filtrar el motor de bsqueda "syllabus explorer" del Proyecto
para "Economa" y luego buscar "Econometra". La lista resultante consiste en Kennedy (2008),
Gujarati y Porter (2009), Stock y Watson (2015), Wooldridge (2016), Dougherty (2016) y
Studenmund (2017).
Reconociendo que tal esfuerzo siempre ser imperfecto, clasificamos el contenido del libro en las
categoras que se muestran en la Tabla 1. Este esquema cubre la gran mayora del material en los
libros de nuestra lista, as como en muchos otros que hemos usado o ledo . Nuestro esquema de
clasificacin tambin cubre tres de las herramientas para las cuales el crecimiento en el uso parece
ser ms impresionante en los datos bibliomtricos tabulados por Panhans y Singleton (en
preparacin), especficamente, variables instrumentales, mtodos de regresin discontinuidad y
estimadores de diferencias en diferencias.
Regresin bivariado
Exposicin bsica del modelo de regresin bivariada, interpretacin de los parmetros del modelo
bivariado
Propiedades de regresin
Derivacin de estimadores, supuestos de regresin lineal clsica, propiedades matemticas de
estimadores de regresin como insesgadad y anatoma de regresin, el teorema de Gauss-Markov
Inferencia de regresin
Derivacin de errores estndar para coeficientes y valores pronosticados, pruebas de hiptesis e
intervalos de confianza, R2, anlisis de varianza, discusin e ilustracin del razonamiento
inferencial
Regresin multivariante
Discusin general del modelo de regresin multivariante, interpretacin de parmetros
multivariados
Forma funcional
Discusin de la forma funcional y los problemas de parametrizacin del modelo, incluido el uso de
variables ficticias, registros a la izquierda y a la derecha, modelos de variables dependientes
limitadas, otros modelos de regresin no lineal
Variables instrumentales
Variables instrumentales (IV), mnimos cuadrados de dos etapas (2SLS) y otros estimadores IV de
ecuaciones simples como maximal de informacin maximal limitada (LIML) y estimadores de clase
k, el uso de IV para variables omitidas y problemas de errores en variables
Panel de datos
Tcnicas y temas del panel, incluida la definicin y estimacin de modelos con efectos fijos y
aleatorios, agrupacin de series de tiempo y datos de seccin cruzada, y datos agrupados
Series de tiempo
Cuestiones de series de tiempo, incluidos modelos de demora distribuidos, procesos estocsticos,
modelos de media mvil integrada autorregresiva (ARIMA), autorregresiones de vectores y
pruebas de raz de unidades. Esta categora omite discusiones estrechas de la correlacin en serie
como una violacin de supuestos clsicos.
Efectos causales
Discusin de los efectos causales y la interpretacin causal de las estimaciones economtricas, el
propsito y la interpretacin de los experimentos aleatorios y las amenazas a la interpretacin
causal de las estimaciones economtricas, incluidos los problemas de seleccin de muestras
Nuestra estrategia de clasificacin cuenta pginas dedicadas a cada tema, omitiendo material en
apndices y ejercicios, y omitiendo material de correccin en matemticas y estadstica.
Independientemente, tambin contamos pginas dedicadas a ejemplos empricos reales, es decir,
presentaciones de resultados economtricos calculados utilizando datos econmicos genuinos.
Este esquema para contar ejemplos omite muchas ilustraciones de libros de texto que usan
nmeros inventados.
No se desvanecen
En su mayor parte, los textos heredados tienen una estructura uniforme: comienzan
introduciendo un modelo lineal para una variable de resultado econmico, seguido de cerca por la
afirmacin de que el trmino de error se supone que es independiente de la media o no
correlacionado con los regresores. El propsito de este modelo -ya sea una relacin causal en el
sentido de describir las consecuencias de la manipulacin del regresor, una herramienta de
pronstico estadstico o una funcin de expectativa condicional parametrizada- generalmente no
est claro.
La introduccin de un libro de texto de un modelo lineal con errores ortogonales o medios
independientes suele ir seguida de una lista de supuestos tcnicos como homoscedasticidad,
regresores variables (aunque no estratticos!) Y falta de multicolinealidad. Estas suposiciones se
utilizan para derivar las buenas propiedades estadsticas de la ordinaria estimador de mnimos
cuadrados en el modelo lineal clsico:, frmulas simples insesgamiento para errores estndar, y la
de Gauss-Markov teorema, (en el que los mnimos cuadrados ordinarios se muestra para ser un
mejor lineal estimador insesgado, o AZUL).
Como informamos en la Tabla 2, esta discusin inicial de las propiedades de Regresin consume
un promedio de 11 a 12 por ciento de los libros de texto clsicos. La inferencia de regresin, que
generalmente viene despus, obtiene un promedio de aproximadamente 13 por ciento del espacio
de pgina en estos libros tradicionales.
El tema ms ampliamente cubierto en nuestra taxonoma, que representa aproximadamente el 20
por ciento del material en los libros de texto clsicos, es el fracaso de la Asuncin y las
reparaciones. Esto incluye diagnsticos y primeros auxilios para problemas como autocorrelacin,
heterocedasticidad y multicolinealidad. El alivio para la mayora de estas enfermedades se
presenta en forma de mnimos cuadrados generalizados. Otro tema importante en textos
heredados es el modelo de ecuaciones simultneas, que consume el 14 por ciento del espacio de
pgina en los textos ms elementales. El porcentaje otorgado a los modelos de ecuaciones
simultneas ortodoxas se eleva al 18 por ciento cuando la muestra incluye textos ms avanzados.
Irnicamente, tal vez, las fallas y reparaciones de Asuncin reclaman una parte an mayor de los
clsicos cuando se excluyen los libros ms avanzados. Estos libros ms antiguos tambin dedican
un espacio considerable a la serie de Tiempo, mientras que los datos del Panel reciben poca
atencin en todos los mbitos.
Una caracterstica destacada de la Tabla 2 es la similitud en la distribucin de la cobertura
temtica en los textos economtricos lderes del mercado contemporneo con la distribucin en
los clsicos. Al igual que en la Era de las Piedras, ms de la mitad del material en textos
contemporneos se refiere a las propiedades de Regresin, Inferencia de Regresin, Forma
funcional y Fallas y reparaciones de Asuncin.
El cambio ms claro entre las generaciones de libros es la reduccin del espacio asignado a los
modelos de ecuaciones simultneas. Esto presumiblemente refleja el uso decreciente de un marco
ortodoxo de multi-ecuaciones, especialmente en macroeconoma. La cobertura reducida de
ecuaciones simultneas ha dejado espacio para una atencin modesta a los datos del panel y los
efectos causales, pero la mayor expansin individual ha estado en la cobertura de la forma
funcional (en su mayora, eleccin discreta y modelos de variables dependientes limitados).
Algunos de los volmenes en nuestra lista actual de libros han sido a travs de muchas ediciones,
con primeras ediciones publicadas en la Edad de Piedra. Quizs no sea sorprendente que la
distribucin de temas en Gujarati y Porter (2009) se parezca mucho a la de Gujarati (1978). Pero
los participantes ms recientes en el mercado de libros de texto tambin se desvan un poco de la
plantilla clsica. En el lado positivo, es ms probable que los recientes participantes del mercado
mencionen al menos temas modernos.
La fila inferior de la Tabla 2 revela el uso moderado de ejemplos empricos en la Era de las Piedras:
alrededor del 15 por ciento de las pginas de los clsicos estn dedicadas a ilustraciones que
involucran datos reales. Este promedio oculta una buena cantidad de variacin, que va desde cero
(ningn ejemplo) hasta ms de un tercio del espacio de pgina que cubre las aplicaciones.
Sorprendentemente, el libro de texto con mayor orientacin emprica en nuestra muestra de 12
libros sigue siendo Pindyck y Rubinfeld (1976), uno de los clsicos. Aunque el campo se ha movido
a un contenido emprico promedio de ms del 24 por ciento, ningn texto contemporneo en esta
lista coincide con su cobertura de ejemplos.