Documente Academic
Documente Profesional
Documente Cultură
El camino que va de
la causa al efecto
Joshua D. Angrist
y Jrn-Steffen Pischke
Traduccin de
Dulcinea Otero-Pieiro
Revisin cientfico-tcnica de
David Galad-Enrquez
ISBN: 978-84-941595-0-3
Depsito legal: B. 10.806-2016
Impreso en Espaa
Printed in Spain
Introduccin ..................................................................................... 9
2 Regresin ........................................................................................ 63
2.1 Historia de dos universidades ................................................. 64
2.2 Emparjame y hazme una regresin ...................................... 73
2.3 Ceteris paribus? ........................................................................ 86
Maestros de la econometra: Galton y Yule ................................. 98
Apndice: Teora de la regresin ................................................. 100
De acuerdo con una alarmante tendencia de la que tal vez haya odo
hablar, la proporcin de estudiantes estadounidenses que comple-
tan sus estudios universitarios en el plazo de tiempo estipulado ha
dado un giro brusco a peor. Los polticos y analistas polticos cul-
pan del descenso en los ndices de graduaciones universitarias a una
combinacin nefasta de subida de tasas y los grandes prstamos que
afrontan muchos alumnos para financiar sus estudios. Puede que el
aumento de los prstamos estudiantiles descarre a algunos que en
caso contrario seguiran por buen camino. El hecho de que los es-
tudiantes con ms probabilidad de abandono escolar sean los que
suelen soportar prstamos de mayor cuanta parecera confirmar esta
hiptesis.
Si pudiramos, preferiramos pagar los estudios con riquezas he-
redadas en lugar de hacerlo con dinero prestado. Sin embargo, tal
como analizaremos en detalle, es probable que la formacin potencie
lo suficiente los ingresos como para que la mayora de los graduados
pueda devolver el prstamo. Entonces cmo debera interpretarse
la correlacin negativa que existe entre el importe de la deuda y los
ndices de graduaciones universitarias? Es que el endeudamiento
provoca la desercin de los deudores? El primer interrogante que de-
10
11
12
13
14
Experimentos
aleatorios
Nuestro camino
15
tin de cul deba ser la verdadera funcin del gobierno dentro del
mercado de la asistencia sanitaria tiene muchas vertientes. Una de
ellas es el efecto causal de los seguros mdicos en la salud. Estados
Unidos gasta una proporcin mayor de su producto interior bruto en
atencin sanitaria que otros pases desarrollados y, a pesar de ello, sus
habitantes no gozan de buena salud. Por ejemplo, los estadouniden-
ses tienen ms probabilidad de padecer sobrepeso, y de morir antes,
que sus primos canadienses, quienes dedican a este fin tan slo unas
dos terceras partes de lo que se gasta en Estados Unidos, y este pas
tambin se diferencia de otros pases desarrollados en que no posee
un seguro mdico universal. Tal vez detrs de todo esto haya una
relacin causal.
Los mayores estadounidenses estn cubiertos por un programa
federal llamado Medicare, mientras que parte de la poblacin sin re-
cursos (que incluye a la mayora de las madres solteras, sus hijos y
muchos otros nios sin recursos) est cubierta por Medicaid. Muchos
de los trabajadores pobres ms jvenes han estado mucho tiempo sin
asegurar. De hecho, muchos estadounidenses sin seguro han optado
por no participar en el plan de seguros que proporciona su emplea-
dor.1 Estos trabajadores cuentan, tal vez con acierto, con los servicios
de urgencias de los hospitales, que no se pueden negar a atenderlos,
para resolver sus necesidades de atencin sanitaria. Pero los servicios
de urgencias tal vez no sean los mejores sitios para tratar, por ejem-
plo, una gripe, o para controlar afecciones crnicas como la diabetes
y la hipertensin, ambas muy generalizadas entre los estadouniden-
ses sin recursos. La unidad de urgencias no est obligada a ofrecer
cuidados a largo plazo. Por tanto, es evidente que el seguro mdico
impuesto por el gobierno podra reportar mejoras en la salud. El em-
peo por implantar un seguro mdico universal se debe en parte al
convencimiento de que as ser.
El principio ceteris paribus en este contexto compara la salud de
alguien cubierto por un seguro, con la salud de esa misma persona si
no dispusiera de asistencia mdica gratuita (aparte de la que brindan
los servicios de urgencias). Este cotejo pone de relieve un problema
emprico fundamental: o la gente est asegurada, o no lo est. No
Covering the Uninsured in the United States, Journal of Economic Literature, vol. 46,
n. 3, septiembre de 2008, pginas 571-606.
16
El viajero afirma que aquella eleccin fue decisiva pero, al ser una
sola persona decidiendo, no puede estar seguro de ello. Un viaje pos-
terior o el testimonio de otros viajeros tampoco le aclarara nada.
Puede que nuestro narrador fuera mayor y ms sabio la segunda vez,
y que otros viajeros tuvieran vivencias distintas tomando ese camino.
Lo mismo sucede con cualquier eleccin, incluidas las relacionadas
con los seguros mdicos: estara sano un hombre con una afeccin
cardiaca y sin seguro si tuviera seguro? En la novela Aos luz,2 de
James Salter, el indeciso narrador observa: Los actos destruyen sus
alternativas, esa es la paradoja. No podemos saber qu hay al final de
un camino que no se tom.
En efecto, no se puede, pero hay ciertos indicios que permiten es-
tudiar el asunto. Este captulo presenta algunas pistas sobre caminos
relacionados con seguros mdicos. El punto de partida es la Encuesta
Nacional de Salud (National Health Interview Survey, NHIS), que
se realiza cada ao entre la poblacin estadounidense y proporcio-
2 James Salter, Aos luz, Salamandra, Barcelona, 2013, trad. de Jess Zulaika.
(N. de la T.)
17
captulo, se da informacin detallada sobre esta tabla y la mayor parte del resto de
tablas y figuras del libro.
18
19
Maridos Esposas
Algn SM Ningn SM Diferencia Algn SM Ningn SM Diferencia
A. Estado de salud
Puntuacin de salud 4.01 3.70 .31 4.02 3.62 .39
[.93] [1.01] (.03) [.92] [1.01] (.04)
B. Caractersticas
No blancos .16 .17 .01 .15 .17 .02
(.01) (.01)
Edad 43.98 41.26 2.71 42.24 .39.62 2.62
(.29) (1.30)
Formacin acadmica 14.31 11.56 2.74 14.44 11.80 2.64
(.10) (.11)
Tamao familiar 3.50 3.98 .47 3.49 3.93 .43
(.05) (.05)
Con trabajo .92 .85 .07 .77 .56 .21
(.01) (.02)
Ingresos familiares 106,467 45,656 60,810 106,212 46,385 59,828
(1,355) (1,406)
Tamao de la muestra 8,114 1,281 8264 1,131
Notas: Esta tabla contiene datos sobre caractersticas promedio de parejas casadas aseguradas y
no aseguradas que respondieron la Encuesta Nacional de Salud (NHIS) de 2009. Las columnas
(1), (2), (4) y (5) muestran caractersticas promedio del grupo de individuos especificado en el
encabezamiento de cada columna. Las columnas (3) y (6) dan la diferencia entre la caracterstica
promedio de individuos con y sin seguro mdico (SM). Las desviaciones tpicas figuran entre cor-
chetes; los errores tpicos se dan entre parntesis.
con coma y las cifras superiores al millar, con punto. Sin embargo, en las tablas se
mantienen los datos tal cual los muestran los programas informticos de uso habi-
tual en econometra; es decir, se reserva el punto para indicar decimales y la coma
para los millares. (N. del Ed.)
20
Y1,Khuzdar - Y0,Khuzdar = 1.
Khuzdar Mara
Khalar Moreno
Resultado potencial sin seguro Y0i 3 5
Resultado potencial con seguro Y1i 4 5
Tratamiento (opcin elegida en cuanto a seguro) Di 1 0
Resultado real en cuanto a estado de salud Yi 4 5
Efecto del tratamiento Y1i Y0i 1 0
21
viajar. Como Mara tiene Y0,Mara = Y1,Mara = 5, el efecto causal del segu-
ro en su salud es
Y1,Mara Y0,Mara = 0.
YKhuzdar YMara = 1.
22
1 n 1
= Y1i
n Y0i . (1.1)
n i=1
{
Di = 1 si i tiene seguro
0 en caso contrario.
Ahora podemos escribir Avg n [Yi|Di = 1] para la media entre los ase-
gurados, y Avgn [Yi | Di = 0] para la media entre los no asegurados.
Esas cantidades son medias condicionadas de la situacin en cuanto a
seguro mdico.7
23
24
25
26
27
dice que una media muestral se puede acercar tanto como queramos
a la media verdadera de la poblacin analizada (por ejemplo, la po-
blacin de estudiantes universitarios estadounidenses) simplemente
ampliando el tamao de la muestra.
Para ver esta ley en accin, juegue a los dados.8 Es decir, lance un
dado una vez y anote el resultado. Vuelva a lanzarlo y calcule la me-
dia de ambos resultados. Siga lanzando el dado y sacando medias.
Existen las mismas probabilidades de que salga cualquier nmero
del 1 al 6 (si el dado es perfecto), as que podemos esperar ver cada
valor una cantidad igual de veces si practicamos este juego duran-
te el tiempo suficiente. Como en este caso hay seis posibilidades y
todas son igual de probables, el resultado esperado ser una media
con la misma ponderacin para cada posibilidad, con todos los pe-
sos iguales a 1/6:
(1 61 ) + (2 61 ) + (3 61 ) + (4 16 ) + (5 61 ) + (6 61 )
1+2+3+4+5+6
= = 3,5.
6
Este valor medio de 3,5 se denomina valor esperado, y en este caso
se corresponde con el valor medio que se obtiene tras una cantidad
infinita de lanzamientos de dados perfectos. El concepto de valor es-
perado es importante en nuestro trabajo, de modo que pasamos a dar
su definicin formal.
8 Cubos de seis caras que en cada una de ellas portan desde uno hasta seis pun-
tos. Los telfonos inteligentes incluyen una aplicacin que los simula.
28
29
E[Yi|Di = 1] E[Yi|Di = 0]
= E[Y1i|Di = 1] E[Y0i|Di = 0]
= E[Y0i + |Di = 1] E[Y0i|Di = 0]
= + E[Y0i|Di = 1] E[Y0i|Di = 0]
= .
30
31
Resultados aleatorios
titulado Does Free Care Improve Adults Health? Results from a Randomized Con-
trolled Trial, New England Journal of Medicine, vol. 309, n. 23, 8 de diciembre de
1983, pginas 1.426-1.434. Para consultar un anlisis reciente, vase adems Aviva
Aron-Dine, Liran Einav y Amy Finkelstein, The RAND Health Insurance Exper-
iment, Three Decades Later, Journal of Economic Perspectives, vol. 27, invierno de
2013, pginas 197-222.
32
10 Otras complicaciones del HIE incluyen el hecho de que en lugar de lanzar una
33
34
Notas: Esta tabla describe las caractersticas demogrficas y la salud de base de los sujetos en el
experimento RAND HIE (Health Insurance Experiment, Experimento sobre Seguros Sanitarios).
La columna (1) muestra la media para el grupo al que se asign un seguro catastrfico. Las columnas
(2) a (5) comparan con el grupo anterior las medias para los grupos con seguros de tipo deducible,
en rgimen de copago, con prestaciones gratuitas, o todos juntos. Los errores tpicos se dan entre
parntesis para las columnas (2) a (5). Para la columna (1) constan las desviaciones tpicas entre
corchetes.
35
36
del archivo de uso pblico del estudio HIE, tal como se describe en el apartado de
Notas empricas al final de este libro. Los resultados RAND originales se resumen
en la obra de Joseph P. Newhouse et al., Free for All? Lessons from the RAND Health
Insurance Experiment, Harvard University Press, 1994.
37
Notas: Esta tabla incluye las medias y los efectos del tratamiento en gastos sanitarios y repercusin
en la salud del experimento RAND HIE (Health Insurance Experiment, Experimento sobre Se-
guros Sanitarios). La columna (1) muestra la media para el grupo al que se asign un seguro
catastrfico. Las columnas (2) a (5) comparan con el grupo anterior las medias para los grupos con
seguros de tipo deducible, en rgimen de copago, con prestaciones gratuitas, o todos juntos. Los
errores tpicos se dan entre parntesis para las columnas (2) a (5). Para la columna (1) constan las
desviaciones tpicas entre corchetes.
38
39
40
Evidence from the First Year, Quarterly Journal of Economics, vol. 127, nmero 3,
agosto de 2012, pginas 1057-1106; Katherine Baicker et al., The Oregon Experi-
ment-Effects of Medicaid on Clinical Outcomes, New England Journal of Medicine,
vol. 368, nmero 18, 2 de mayo de 2013, pginas 1713-1722; y Sarah Taubman
et al., Medicaid Increases Emergency Department Use: Evidence from Oregons
Health Insurance Experiment, Science, vol. 343, nmero 6.168, 17 de enero de
2014, pginas 263-268.
13 Por qu no lograron seguro mdico todos los ganadores del sorteo? Algunos
41
(.008)
Notas: Esta tabla incluye la estimacin de los efectos de haber ganado el sorteo del Plan
de Salud de Oregn (OHP, Oregon Health Plan) sobre la cobertura sanitaria y sobre la
utilizacin de los servicios mdicos. Las columnas impares muestran las medias para el
grupo de control. Las columnas pares recogen el coeficiente de la regresin efectuada
por medio de una variable binaria slo sobre los sujetos ganadores del sorteo. Los errores
tpicos figuran entre parntesis.
42
43
44
45
Maestro Joshway: Hay una nica verdad causal que una in-
vestigacin aleatoria tenga la seguridad de revelar?
Pequeo Saltamontes: Veo ahora que puede haber muchas
verdades, Maestro, algunas compatibles, otras contradictorias.
Por tanto, prestamos una atencin especial a los resultados de
dos o ms experimentos de naturaleza similar.
46
armada real y esto hizo que los marineros britnicos recibieran en las colonias ame-
ricanas el apelativo despectivo de lime-juicers (exprimidores de limas), abreviado
luego a limeys, designacin que con el tiempo se extendi a todos los britnicos en
Amrica. (N. de la T.)
15 El experimento de Lind se describe en Duncan P. Thomas, Sailors, Scurvy,
and Science, Journal of the Royal Society of Medicine, vol. 3, 1885, pginas 75-83.
16 Charles S. Peirce y Joseph Jastrow, On Small Differences in Sensation, Mem-
47
48
49
50
Carcter insesgado de la media muestral: E[Y ] = E[Yi]
Medida de la variabilidad
1 n (Y Y)2.
n i
S(Yi)2 =
i =1
51
tarlo con una legra griega, V(Yi) = Y2, que suele leerse como sigma-
i-cuadrado.18
Como las varianzas elevan los datos al cuadrado, pueden alcanzar
valores muy grandes. Si se multiplica una variable por 10, entonces su
varianza crece en un factor 100. Por eso a veces se describe la varia-
bilidad por medio de la raz cuadrada de la varianza: el resultado se
denomina desviacin tpica (o desviacin estndar), se escribe como Y,
y tiene como contrapartida muestral S(Yi), la raz cuadrada de S(Yi) 2.
La varianza constituye un hecho descriptivo acerca de la distri-
bucin de la variable Yi . (Recuerde que la distribucin de una varia-
ble consiste en el conjunto de valores que adopta esa variable, y la
frecuencia relativa con que se observa cada valor en la poblacin, o
se genera por un proceso aleatorio.) Algunas variables slo pueden
adoptar un conjunto reducido de valores (como las variables bina-
rias que se usan para marcar a las familias que cuentan con seguro
mdico), mientras que otras (como los ingresos) tienden a presentar
un abanico amplio de posibilidades y mostrar algunos valores muy
elevados mezclados con muchos otros ms pequeos.
Es importante documentar la variabilidad de las variables con
las que se trabaja. Pero nuestro objetivo ahora va algo ms all. Nos
interesa cuantificar la varianza de las medias muestrales cuando se
toman diversas muestras. Como el valor esperado de la media mues-
tral es E[Yi] (por su carcter insesgado), la varianza de la poblacin
formada por las medias muestrales se puede escribir como
V(Y ) = E [(Y E[Y ])2] = E [(Y E[Yi])2].
52
V(Y ) = V ([ 1
n Yi .
])
Para simplificar esta expresin tenemos en cuenta que el muestreo
aleatorio garantiza que las observaciones individuales dentro de cada
muestra no guardan relacin entre ellas o, en otras palabras, que son
estadsticamente independientes. Esta propiedad crucial nos permite
aprovechar el hecho de que la varianza de una suma de observaciones
estadsticamente independientes, cada una de ellas extrada al azar
a partir de la misma poblacin, es la suma de sus varianzas. Es ms,
dado que todos los Yi proceden de la misma poblacin, cada eleccin
tiene la misma varianza, Y2. Finalmente recurrimos a la propiedad de
que la varianza de una constante (como 1/n) multiplicada por Yi es
igual al cuadrado de esa constante multiplicado por la varianza de Yi .
Teniendo en cuenta todo esto obtenemos:
([ ])
1 n
n
V(Y ) = V
i=1
Yi
1
= 2 Y2 .
n
1 n n Y2 Y2
V(Y ) = 2 Y2 = =
n . (1.5)
n i=1 n2
53
S(Yi)
SE(Y ) =
.
n
Solemos omitir el calificativo estimado al hablar de un estudio
estadstico y sus errores tpicos, pero es lo que tenemos en mente.
Por ejemplo, los nmeros que constan entre parntesis en la tabla
1.4 son los errores tpicos estimados para las diferencias de medias
correspondientes.
54
55
.4
Distribucin de probabilidad
.3
.2
.1
0
4 2 0 2 4
Valor de la variable
56
.3
.2
Fraccin
.1
0
4 2 0 2 4
Indicador t
[Y 2 SE(Y), Y + 2 SE (Y)]
57
.15
.10
Fraccin
.05
0
4 2 0 2 4
Indicador t
.10
.08
.06
Fraccin
.04
.02
0
4 2 0 2 4
Indicador t
58
Emparejamiento19
19 En ingls se usa el trmino matching para este proceso, que en lenguas lati-
59
V(Y 1 Y 0) = V (Y 1) + V(Y 0)
Y2
= +
Y2
n1 n 0 = Y
2 1 1 .
n1 +
n0 [ ]
La segunda de estas igualdades usa la ecuacin (1.5), que da la va-
rianza de muestreo de una media simple. El error tpico que necesi-
tamos es, por tanto,
SE(Y 1 Y 0) = Y
n1 + n1 .
1 0
Para deducir esta expresin se da por supuesto que las varianzas de las
observaciones individuales son las mismas en los grupos de tratamien-
to y de control. Este supuesto permite emplear el smbolo Y2 para la va-
rianza comn. Una frmula algo ms complicada permitira tener en
cuenta varianzas distintas para cada grupo, incluso aunque las medias
fueran las mismas (una idea que recuperaremos al tratar los errores
tpicos de la regresin robusta en el apndice del captulo 2).20
0
i
60
SE (Y 1 Y 0) = S(Yi)
n1 + n1 ,
1 0
(1.7)
Y1 Y 0 .
t() =
SE(Y 1 Y 0)
61
62
Regresin
Nuestro camino
63
64
65
universidades privadas muy prestigiosas del nordeste de EE. UU. (Brown, Columbia,
Cornell, Dartmouth College, Harvard, Pensilvania, Yale y Princeton). (N. de la T.)
2 Aqu se sigue el esquema de puntuacin de las pruebas de acceso a la universidad
de Estados Unidos (SAT) anterior al ao 2005, segn el cual en las notas finales se
suman los puntos obtenidos en matemticas y en expresin oral, cada una de las cuales
toma valores entre 0 y 800, de modo que el mximo combinado asciende a 1600.
66
Pero resulta que hay muchas otras cosas que influyen en los ingre-
sos, aparte del gnero, la universidad o la puntuacin obtenida en
las pruebas de acceso. Como las decisiones sobre a qu universidad
67
68
69
70
71
efectuarse con estos datos. Por ejemplo, cabe construir una media
ponderada que refleje el hecho de que el grupo B incluye dos estu-
diantes, mientras que el grupo A tiene tres. En este caso la media
ponderada se calculara como
( 3
5 )( 2
)
5.000 + 30.000 = 9.000.
5
72
73
Yi = + Pi + Ai + ei . (2.1)
quieren J-1 variables binarias para una descripcin completa de esos grupos. La
categora a la que no le corresponde ninguna variable binaria recibe el nombre de
grupo de referencia.
74
Yi = + Pi + Ai ,
ei = Yi Yi = Yi ( + Pi + Ai).
= 40.000
= 10.000
= 60.000.
75
76
8 Barrons clasifica las facultades en grupos segn el percentil en que caen las
77
150
en Yi = + Pi + jGROUP ji + 1SATi + 2 en PIi + ei (2.2)
j =1
78
9 Otros controles del modelo emprico incluyen variables binarias que marcan
segn gnero, raza, aptitudes deportivas, y estudiantes que obtuvieron el grado uni-
versitario dentro del 10% mejor de su clase. Estas variables no constan en la ecua-
cin (2.2).
79
Regresiones en accin
80
Notas: Esta tabla incluye la estimacin de los efectos que ejerce sobre los ingresos el hecho
de cursar estudios en centros universitarios privados. Cada columna muestra los coefi-
cientes de una regresin del logaritmo de los ingresos con variables binarias que marcan
si se estudi en un centro privado, as como varios controles. Los resultados de las colum-
nas (4)-(6) proceden de modelos que incluyen variables binarias para diversos grupos de
centros segn su nivel selectivo. El tamao de la muestra es de 5.583. Los errores tpicos
constan entre parntesis.
81
10 En EE. UU., los jvenes con dotes atlticas especiales suelen tener grandes fa-
cilidades para acceder a las universidades, tanto pblicas como privadas. (N. de la T.)
82
83
Notas: Esta tabla incluye la estimacin de los efectos que ejerce sobre los ingresos el hecho
de cursar estudios en centros universitarios privados. Cada columna muestra los coefi-
cientes de una regresin del logaritmo de los ingresos con variables binarias que marcan
si se estudi en un centro privado, as como varios controles. El tamao de la muestra es
14.238. Los errores tpicos constan entre parntesis.
84
Notas: Esta tabla incluye la estimacin de los efectos que ejerce sobre los ingresos el ca-
rcter ms o menos selectivo de la universidad. Cada columna muestra los coeficientes de
una regresin del logaritmo de los ingresos con la nota media de acceso del centro don-
de se cursan los estudios, as como varios controles. El tamao de la muestra es 14.238.
Los errores tpicos constan entre parntesis.
85
86
87
Yi = l + l Pi + Ai + e il . (2.3)
Yi = s + s Pi + Ai + e si .
88
que slo lo hizo la mitad de los integrantes del grupo B, con ingre-
sos inferiores. La diferencia de ingresos entre estudiantes de centros
pblicos y privados se debe en parte al hecho de que los estudiantes
del grupo A, en su mayora de centros privados, tienen ingresos su-
periores de todos modos, con independencia de esa circunstancia. Al
incluir una variable binaria que controla la pertenencia al grupo A en
la regresin larga se tiene en cuenta esta diferencia.
Como sugiere esta explicacin, la conexin formal entre los coefi-
cientes de las regresiones simple y larga tiene dos componentes:
Al reunir estas piezas se obtiene la frmula del SVO. Partimos del he-
cho de que
89
Ai = 0 + 1 Pi + ui ,
y que
90
Por qu la omisin del tamao de las familias puede sesgar las esti-
maciones por regresin del efecto de estudiar en centros privados?
Porque las diferencias de ingresos entre los graduados de Harvard
y de U-Mass provienen en parte de diferencias en cuanto a los ta-
maos de las familias entre los dos grupos (es decir, de la relacin
entre FSi y Pi) y del hecho de que las familias ms reducidas estn
correlacionadas con ingresos superiores, incluso despus de intro-
ducir las variables de control presentes en la regresin simple (este
es el efecto de FSi sobre la regresin larga, que incluye igualmente
todos los controles anteriores). La regresin larga tiene en cuenta
el hecho de que los estudiantes que acuden a Harvard proceden de
familias (en promedio) ms pequeas que las de los estudiantes que
fueron a U-Mass, mientras que la regresin simple que omite FSi no
lo tiene en cuenta.
91
en Yi = l + l Pi + jl GROUPji +
j
92
93
94
Variable dependiente
Notas: Esta tabla describe la relacin entre el hecho de cursar estudios en una univer-
sidad privada y las caractersticas personales. Las variables dependientes son la nota
obtenida en las pruebas de acceso a la universidad (dividida entre 100) en las colum-
nas (1)-(3) y el logaritmo de los ingresos de los padres en las columnas (4)-(6). Cada
columna muestra el coeficiente de una regresin de la variable dependiente sobre una
variable binaria que seala si se asisti o no a un centro privado, as como varios con-
troles. El tamao de la muestra es 14.238. Los errores tpicos constan entre parntesis.
95
96
el SVO asociado a los regresores accesibles proporciona una gua acerca del SVO
generado por los regresores de los que no se dispone. Vanse los detalles en su es-
tudio Selection on Observed and Unobserved Variables: Assesing the Efectiveness
of Catholic Schools, Journal of Political Economy, vol. 113, nmero 1, febrero de 2005,
pginas 151-184.
97
98
nal of the Anthropological Institute of Great Britain and Ireland, vol. 15, 1886, pginas
246-263.
16 George Udny Yule, An Investigation into the Causes of Changes in Pauper-
ism in England, Chiefly during the Last Two Intercensal Decades, Journal of the
Royal Statistical Society, vol. 62, nmero 2, enero de 1899, pginas 249-295.
17 Literalmente, casas de trabajo. (N. de la T.)
99
E[Yi|Xi = x],
100
7.2
7.0
Logaritmo de los ingresos semanales
6.8
6.6
6.4
6.2
6.0
5.8
0 2 4 6 8 10 12 14 16 18 20
Aos de formacin acadmica
101
Regresin y la FVEC
102
103
104
C(Yi , Xi)
b = = (2.7)
V(Xi)
= = E[(Yi] E[Yi].
Ajustes y residuos
Yi = Yi + ei .
105
K
ei = Yi Yi = Yi k Xki .
k=1
106
E[Yi|Zi = 0] =
E[Yi|Zi = 1] = + ,
de manera que
= E[Yi|Zi = 1] E[Yi|Zi = 0]
107
Las regresiones ms interesantes son las mltiples, es decir, las que in-
cluyen una variable causal de inters y una o ms variables de control.
Por ejemplo, la ecuacin (2.2) plantea una regresin del logaritmo de
los ingresos sobre una variable binaria que marca si se ha asistido o
no a una universidad privada, en un modelo que incorpora controles
para las aptitudes individuales, el contexto familiar y el nivel selectivo
de los centros en los que se solicita la admisin y en los que se logra el
acceso. Ya hemos explicado que el control de las variables explicativas
se parece al proceso de emparejamiento. Es decir, el coeficiente de
regresin de una variable binaria que indique el acceso a una univer-
sidad privada en un modelo que incluya controles es similar al que
se obtendra si distribuyramos a los estudiantes en celdas sobre la
base de esos mismos controles, comparramos a los estudiantes de
centros pblicos y privados dentro de esas celdas, y luego tomramos
el promedio del conjunto resultante de las comparaciones condicio-
nadas. A continuacin, ofrecemos una leccin de anatoma de la
regresin ms detallada.
Supongamos que la variable causal de inters es X 1i (podra ser
una variable binaria que indicase si se estudi o no en un centro
privado), y que la variable de control es X 2i (podra ser la nota en las
pruebas de acceso a la universidad). Tras cierto esfuerzo se puede lle-
gar a la expresin siguiente para el coeficiente de X 1i en una regresin
con X 2i como control:
~
C(Yi , X 1i)
1 =
~ ,
V(X u)
~
donde X 1i representa el residuo de la regresin de X 1i sobre X 2i :
~
X 1i = 0 + 1 X 2i + X 1i .
108
Anatoma de la regresin
~
C(Yi ,X ki)
k =
~ ,
V(X ki)
~
donde X ki es el residuo de una regresin de Xki sobre las otras K 1
variables explicativas incluidas en el modelo.
La anatoma de la regresin resulta especialmente reveladora
cuando los controles son variables binarias, como en la ecuacin
(2.2). Para los fines de esta explicacin podemos simplificar el mo-
delo de inters para que queden slo variables de control binarias,
es decir,
150
en Yi = + Pi + j GROUPji + ej . (2.9)
j =1
109
Yi = l + l X 1i + X 2i + e il .
110
Yi = s + s X 1i + e il .
s = l + 21 ,
111
s = l + 21, (2.12)
Modelos logartmicos
en Yi = + Pi + ei , (2.13)
112
E[en Yi|Pi] = + Pi .
en Y0i = + ei
en Y1i = + + ei .
Y1i
= en
Y0i ( Y1i Y0i
= en 1 +
Y0i )
= en(1 + %Yp)
%Yp ,
de modo que
113
Y1i Y0i
= exp() 1.
Y0i
< exp() 1,
114
c
n) = 1
SE( ,
n c
6
Y
0
0 2 4 6 8 10
X
115
Igual que el error tpico de una media muestral, los errores tpicos
de una regresin decrecen cuando aumenta el tamao de la mues-
tra. Los errores tpicos crecen (es decir, las estimaciones de la regre-
sin resultan menos precisas) cuando los residuos presentan una va-
rianza grande. Esto no debe sorprender, porque una gran varianza
en los residuos significa que la regresin no da un buen ajuste. Por
otra parte, la variabilidad de los regresores es beneficiosa: cuando
se incrementa X se hace ms precisa la pendiente estimada. Esto se
aprecia en la figura 2.2, la cual revela que al aadir variabilidad a Xi
(en concreto, al aadir las observaciones representadas en gris) se
contribuye a realzar la pendiente que vincula Yi con Xi .
La frmula de la anatoma de la regresin para las regresiones
mltiples se puede trasladar a los errores tpicos. En un modelo mul-
tivariado como este:
k
Yi = + k Xki + ei ,
k=1
~
donde X~k es la desviacin tpica de X ki , el residuo de una regresin
de Xki sobre el resto de regresores. Aadir controles conlleva dos efec-
tos opuestos sobre SE( k). La varianza de los residuos (e en el nu-
merador de la frmula del error tpico) cae cuando se aaden a la
regresin variables explicativas para predecir Yi . Por el contrario, la
~
desviacin tpica de X ki en el denominador de la frmula del error
tpico es menor que la desviacin tpica de X ki , lo que incrementa el
error. El aadido de variables explicativas explica parte de la varia-
cin de otros regresores, y esta variacin se elimina en virtud de la
anatoma de la regresin. La interrelacin entre estos cambios hacia
arriba o hacia abajo puede conducir tanto a una mejora como a un
empeoramiento de la precisin.
Los errores tpicos que se calculan por medio de la ecuacin
(2.15) se consideran hoy da pasados de moda, y no se suelen mos-
trar en pblico. Esa frmula antigua da por supuesto que la varianza
de los residuos no guarda relacin con los regresores o, como dicen
los maestros, los residuos son homocedsticos. Cuando los residuos son
116
1 V(Xkiei)
) =
RSE( . (2.16)
n (X2~ )2 k
~ ~
V(X kiei) = V(X ki)V(ei) = X2~k 2e .
117
Variables
instrumentales
Nuestro camino
119
los efectos a largo plazo del hecho de haberse criado en familias gran-
des o pequeas. Este caso ilustra el mtodo de mnimos cuadrados en
dos etapas (MC2E), un refinamiento del mtodo de VI que constituye
una de nuestras herramientas ms poderosas.
120
de la T.)
2 Vanse los detalles del KIPP en el libro de Jay Mathews Work Hard. Be Nice,
Algonquin Books, 2009. Teach for America fue en 2012 el mayor empleador de gra-
duados en 55 campus universitarios de Estados Unidos, desde la Universidad del
Estado de Arizona hasta Yale.
121
Una lotera
122
4 Joshua D. Angrist et al., Inputs and Impacts in Charter Schools: KIPP Lynn,
American Economic Review Papers and Proceedings, vol. 100, nmero 2, mayo de 2010, p-
ginas 239-243, y Joshua D. Angrist et al., Who Benefits from KIPP?, Journal of Policy
Analysis and Management, vol. 31, nmero 4, otoo de 2012, pginas 837-860.
123
124
Solicitudes en KIPP de
2005 a 2008 (629)
125
Notas: Esta tabla describe los datos de partida de los estudiantes de quinto curso en
Lynn, y refleja los efectos estimados de la oferta de plazas del Knowledge Is Power
Program (KIPP) sobre los solicitantes de Lynn. Las medias aparecen en las columnas
(1), (2) y (4). La columna (3) presenta las diferencias entre las personas agraciadas
y no agraciadas en el sorteo. Se trata de coeficientes procedentes de regresiones que
incluyen controles para grupos de riesgo en la forma de variables binarias que marcan
el ao y el curso de la solicitud, as como la existencia de hermanos solicitantes. La
columna (5) muestra las diferencias entre los estudiantes de KIPP y los solicitantes que
no asistieron a KIPP. Los errores tpicos constan entre parntesis.
126
127
128
129
.48 =
Proporcin Proporcin
matriculada en matriculada en
KIPP: .787 KIPP: .046
130
131
132
133
No agraciados en el sorteo Z i = 0
No asisten a KIPP Asisten a KIPP
Di = 0 Di = 1
No asisten a KIPP Nunca tomadores Retadores
Agraciados en el Di = 0 (Normando)
sorteo Zi = 1 Asisten a KIPP Cumplidores Siempre tomado-
Di = 1 (Camila) res (Silvio)}
Nota: KIPP = Knowledge Is Power Program.
134
and Estimation of Local Average Treatment Effects, Econometrica, vol. 62, nme-
ro 2, marzo de 1994, pginas 467-475. La distincin entre cumplidores, siempre
tomadores y nunca tomadores se detalla en Joshua D. Angrist, Guido W. Imbens y
Donald B. Rubin, Identification of Causal Effects Using Instrumental Variables,
Journal of the American Statistical Association, vol. 91, nmero 434, junio de 1996,
pginas 444-455.
135
= = E[Y1i Y0i|Ci = 1].
Sin supuestos ms estrictos, como que el efecto causal es constante
para todos los sujetos (este sera el modelo descrito por la ecuacin
[1.3] del captulo 1), el ELMT no tiene por qu revelar efectos causa-
les sobre nunca tomadores ni sobre siempre tomadores.
No debera sorprendernos que una variable instrumental no siem-
pre sea til para conocer los efectos sobre personas cuyo estado de
tratamiento no se puede alterar mediante la manipulacin del ins-
trumento. La buena noticia es que la poblacin de cumplidores cons-
tituye el grupo acerca del cual queremos saber algo. En el ejemplo
KIPP los cumplidores son los estudiantes que posiblemente asistieran
a centros KIPP si se ampliara la red de esas escuelas y se ofrecieran as
ms plazas en el sorteo, quiz como consecuencia de la apertura de
centros nuevos en la misma zona. En Massachusetts, donde el nme-
ro de plazas en centros charter est limitado por ley, las consecuencias
de tal ampliacin constituyen un tema de poltica educativa que est
a la orden del da.
Los investigadores y los polticos se interesan a veces por los efec-
tos causales promedio para toda la poblacin tratada, y no slo en
el ELMT. Este efecto causal promedio se denomina efecto del trata-
miento sobre los tratados (TST). El TST se escribe como E[Y1K Y0K|Di =
= 1]. Por norma hay dos maneras de recibir tratamiento, es decir, de
activar la variable Di . Una es recibir tratamiento con independencia
de si el instrumento se activa o no. Como hemos explicado, esta es
la historia de Silvio, siempre tomador. El resto de la poblacin tra-
tada consta de cumplidores a los que de manera aleatoria se asigna
Zi = 1. En el estudio KIPP, la muestra tratada incluye cumplidores
que consiguieron una plaza (como Camila), y siempre tomadores
(como Silvio) que asistieron a centros KIPP con independencia de
todo lo dems. La poblacin de cumplidores a los que se ofreci
plaza al azar es representativa de la poblacin de todos los cumpli-
dores (incluidos aquellos cumplidores que perdieron en el sorteo
y acudieron a escuelas pblicas), pero los efectos sobre los siempre
tomadores no tienen por qu ser los mismos que sobre los cumplido-
res. Cabra imaginar, por ejemplo, que Silvio fuera siempre tomador
porque su madre tuviera la conviccin de que KIPP le cambiar la
vida. El efecto causal que experimente ser por tanto mayor que
136
137
responsable de las muertes en un juicio civil. Luego public un libro titulado If I Did
It: Confessions of the Killer [Si lo hubiera hecho: confesiones del asesino], Beaufort Books,
2007. Nuestro relato de las visitas repetidas de la polica al hogar de los Simpson se
basa en Sara Rimer, The Simpson Case: The Marriage; Handling of 1989 Wife-Bea-
ting Case Was a Terrible Joke, Prosecutor Says [El caso Simpson: el matrimonio;
el fiscal afirma que el desarrollo del caso de la agresin a la esposa fue una broma
atroz], The New York Times, 18 de junio de 1994.
9 El anlisis original del MDVE aparece en Lawrence W. Sherman y Richard A.
Berk, The Specific Deterrent Effects of Arrest for Domestic Assault, American Socio-
logical Review, vol. 49, nmero 2, abril de 1994, pginas 261-272.
138
Tratamiento aplicado
Tratamiento Indulgencia
asignado
Arresto Consejo Separacin Total
Arresto 98.9 (91) 0.0 (0) 1.1 (1) 29.3 (92)
139
140
141
142
143
144
145
12 Vase David Lam, How the World Survived the Population Bomb: Lessons
146
13 Se debate hasta qu punto ha subido el nivel de vida en India. Aun as, los estu-
dios suelen coincidir en que las condiciones han mejorado de manera espectacular
desde 1970 (vase, por ejemplo, Angus Deaton, The Great Escape: Health, Wealth, and
the Origins of Inequality, Princeton University Press, 2013).
14 Gary S. Becker y H. Gregg Lewis, On the Interaction between the Quantity
and Quality of Children, Journal of Political Economy, vol. 81, nmero 2, parte 2,
marzo-abril de 1973, pginas S279-288, y Gary S. Becker y Nigel Tomes, Child En-
dowements and the Quantity and Quality of Children, Journal of Political Economy,
vol. 84, nmero 4, parte 2, agosto de 1976, pginas S143-S162.
147
and Developement Review, vol. 20, nmero 3, septiembre de 1994, pginas 616-620.
16 Cabra pensar que esto slo es cierto en sociedades con acceso a mtodos an-
148
lity Model: The Use of Twins as a Natural Experiment, Econometrica, vol. 48, nme-
ro 1, enero de 1980, pginas 227-240.
149
cantidad y calidad por el maestro Joshway, con sus colegas Victor Lavy
y Analia Schlosser (abreviado el estudio ALS).18 Israel constituye
un caso interesante porque su poblacin es muy diversa, incluyendo
muchas personas nacidas en pases en vas de desarrollo y en familias
grandes. Casi la mitad de la poblacin juda israel es de origen eu-
ropeo, mientras que la otra mitad es oriunda de Asia o frica. En
Israel vive tambin una cantidad notable de rabes, aunque los datos
sobre israeles no judos son menos completos que los disponibles so-
bre los judos. Un rasgo atractivo de la muestra juda israel consiste
en que, aparte de tener ms diversidad tnica y familias mayores que
las que existen en la mayora de los pases desarrollados, se dispone
de informacin sobre las correspondientes familias de origen, inclu-
yendo las edades y sexos de los hermanos. Esta combinacin de datos
tan poco frecuente constituye las bases de la estrategia emprica ALS.
Nos centramos aqu en un grupo de primognitos adultos que
conforman una muestra aleatoria de varones y mujeres nacidos de
madres con al menos dos vstagos. Estos primognitos tienen al me-
nos un hermano o hermana ms joven, pero muchos tienen dos, o
ms. Consideremos una familia en la que el segundo nacimiento
traiga un solo beb. En promedio, esas familias tienen 3,6 hijos. Si
el segundo parto es doble, entonces el tamao medio de la familia
aumenta en 0,32, es decir, en casi un tercio de hijo. Por qu el na-
cimiento de mellizos o gemelos incrementa el tamao de la familia
en un salomnico hijo fraccional? Muchas parejas israeles querran
tener tres o cuatro hijos; el tamao de sus familias no se ve seria-
mente afectado por un parto mltiple, porque pretenden tener ms
de dos hijos, de todos modos. Pero, por otra parte, algunas familias
estn contentas con slo dos hijos. Este ltimo grupo se ve forzado a
aumentar el tamao familiar de dos a tres cuando la cigea les trae
mellizos. Ese diferencial de un tercio de hijo causado por la llegada
de los mellizos refleja una diferencia en cuanto a probabilidades: la
probabilidad de tener un tercer hijo se incrementa desde aproxima-
damente 0,7 cuando el segundo parto es simple, hasta la certeza si
ese parto es mltiple. La cifra 0,3 se debe a que la diferencia entre la
probabilidad 1 y la probabilidad 0,7 es 0,3.
the Casual Link between the Quantity and Quality of Children, Journal of Labor
Economics, vol. 28, nmero 4, octubre de 2010, pginas 773-824.
150
151
Supply: Evidence from Exogenous Variation in Family Size, American Economic Re-
view, vol. 88, nmero 3, junio de 1988, pginas 450-477.
152
153
= .
154
Yi = 0 + Zi + e 0i . (3.4)
155
Di = 1 + Zi + e 1i , (3.5)
i = 1 + Zi .
D (3.6)
i de
La segunda etapa de MC2E plantea una regresin de Yi sobre D
este modo:
i + e 2i.
Yi = 2 + MC2ED
i = 1 + Zi + 1Ai .
D
22 Ya hemos visto una versin de VI con covariables. Los efectos de la oferta de pla-
zas en escuelas KIPP que constan en la columna (3) de la tabla 3.1 proceden de mo-
delos de regresin para la primera fase y para la forma reducida que incluyen covaria-
bles en forma de variables binarias para distintos grupos de riesgo en las solicitudes.
156
i + 2Ai + e 2i ,
Yi = 2 + MC2ED (3.9)
23 Los lectores atentos habrn notado que la variable de tratamiento que estamos
157
i + 2Ai + 2Bi + e 2i
Yi = 2 + MC2ED (3.11)
158
Notas: Esta tabla presenta los coeficientes de una regresin del nmero de hijos
sobre instrumentos y variables explicativas. El tamao de la muestra es 89.445.
Los errores tpicos constan entre parntesis.
159
Yi = 3 + Di + 3Ai + 3Bi + e 3i .
otras covariables se cuentan indicadores del ao del censo, origen tnico de los
progenitores, edad, si no consta el mes de nacimiento, edad de la madre, edad
de la madre la primera vez que dio a luz, y edad de la madre en el momento de
la inmigracin (cuando esto es relevante). Vanse ms detalles en el apartado de
notas empricas.
160
Estimaciones MC2E
Estimaciones Instrumento Instrumento Ambos
MCO parto mltiple igualdad de instrumentos
sexos juntos
Variable (1) (2) (3) (4)
dependiente
Aos de esco- .145 .174 .318 .237
laridad (.005) (.166) (.210) (.128)
Graduado en .029 .030 .001 .017
secundaria (.001) (.028) (.033) (.021)
Acudi a la .023 .017 .078 .048
universidad (.001) (.052) (.054) (.037)
(para edad
24)
Graduado .015 .021 .125 .052
universitario (.001) (.045) (.053) (.032)
(para edad
24)
Notas: Esta tabla presenta las estimaciones por MCO y por MC2E del efecto del ta-
mao familiar sobre la escolaridad. La columna (1) contiene las estimaciones por
MCO. Las columnas (2), (3) y (4) reflejan las estimaciones MC2E construidas
por medio de los instrumentos que se indican en las cabeceras de las columnas. Los
tamaos muestrales son 89.445 para las filas (1) y (2), 50.561 para la fila (3) y 50.535
para la fila (4). Los errores tpicos constan entre parntesis.
161
25 En concreto, el coeficiente estimado por regresin vale 0,145 y cae fuera del
162
Philip G. Wright, The Tariff on Animal and Vegetable Oils, Macmillan Company, 1928.
26
American Economic Review, vol. 19, nmero 1, marzo de 1929, pginas 152-156. La cita
procede de la pgina 155.
163
gression?, Journal of Economic Perspectives, vol. 17, nmero 3, verano de 2003, pginas
177-194.
164
por James H. Stock y Kerry Clark. Vase Philip Wright, the Identification Problem in
Econometrics, and Its Solution, presentado en un acto especial en honor de Philip
Green en el Departamento de Economa de la Universidad Tufts en octubre de 2011
(http://ase.tufts.edu/economics/documents/wrightPhilipAndSewall.pdf), y la tesis
de Kerry Clark The Invention and Reinvention of Instrumental Variables Regresion.
30 Experience. Del libro In Reckless Ecstasy, Asgard Press, 1904, edicin y prlo-
165
Di = 1 + Zi + e 1i .
Yi = 0 + Zi + e 0i .
i + e 2i .
Yi = 0 + D
166
i) C(Yi , 1 + Zi)
C(Yi , D
MC2E = =
V(D i) V(1 + Zi)
C(Yi , Zi)
= = = .
2V(Zi)
167
Los errores tpicos MC2E para un modelo que use Zi como instru-
mento para Di , a la vez que incluye Ai como control, se calculan del
modo siguiente. Primero se construyen los residuos de los MC2E por
medio de
i = Yi 2 MC2EDi 2Ai .
1
MC2E) =
SE(
, (3.13)
D
2Ai .
e 2i = Yi 2 MC2ED
168
169
170
Diseos de regresin
discontinua
Nuestro camino
171
172
300
Cumpleaos 21
250
Nmero de fallecimientos
200
150
100
Cumpleaos 20
50
Cumpleaos 21
Cumpleaos 22
0
30 24 18 12 6 0 6 12 18 24 30
Das desde el cumpleaos
173
115
110
105
100
95
90
85
80
19 20 21 22 23
Edad
174
RD brusca
Da = { 1 si a 21
0 si a < 21.
(4.1)
175
Ma = + Da + a + ea , (4.2)
donde Ma es la tasa de mortalidad en el mes a (de nuevo definimos los
meses como un intervalo de 30 das contado a partir del 21 cumplea-
os). La ecuacin (4.2) incluye la variable binaria de tratamiento, as
como un control lineal sobre la edad en meses. Los valores estimados
de la ecuacin (4.2) generan las lneas trazadas en la figura 4.2. La
pendiente negativa, representada como , refleja el suave declive de la
176
177
Particularidades de la RD
178
1.5 (A)
Resultado (Y)
1.0
0.5
0.0
0.0 .2 .4 .6 .8 1.0
1.5 (B)
Resultado (Y)
1.0
0.5
0.0
0.0 .2 .4 .6 .8 1.0
1.5 (C)
Resultado (Y)
1.0
0.5
0.0
0.0 .2 .4 .6 .8 1.0
Variable mvil (X)
179
Ma = + Da + 1a + 2a 2 + ea ,
Ma = + Da + (a a 0) + [(a a 0)Da] + ea . (4.3)
180
Sin embargo, las estimaciones lejos del umbral implican una extra-
polacin exagerada y deben tomarse con una rodaja de lima y un
puadito de sal. No disponemos de datos sobre tasas de mortalidad
contrafactuales procedentes de un mundo en el que el consumo de
alcohol quedara prohibido para edades superiores a 21 aos. Del mis-
mo modo, si nos apartamos del umbral hacia la izquierda costara
decir qu tasas de mortalidad cabra esperar en un mundo donde se
permitiera beber desde edades muy tempranas. En contraste, parece
razonable afirmar que las personas justo por debajo de la edad de 21
aos proporcionan una buena comparacin contrafactual frente a
quienes estn justo por encima de 21 aos. Esto nos lleva a observar
las estimaciones del parmetro (el efecto causal a la derecha del
umbral) como las ms fiables, incluso aunque el modelo empleado
para la estimacin nos diga mucho ms que eso de manera implcita.
Las tendencias no lineales y los cambios de pendiente en el en-
torno del umbral se pueden combinar en un modelo que tenga este
aspecto:
Ma = + Da + 1(a a 0) + 2(a a 0)2. (4.4)
+ 1[(a a 0)Da] + 2[(a a 0)2Da] + ea.
181
182
110
105
100
95
90
85
80
19 20 21 22 23
Edad
183
mueran por mera intoxicacin etlica, mientras que las muertes por
patologas asociadas al alcohol se producen tan slo a edades avanza-
das. Pero el alcohol mantiene una relacin estrecha con los acciden-
tes de trfico con vehculos motorizados (AVM), la primera causa de
muerte en la gente joven. Si conducir ebrio fuera la causa primaria
de muerte vinculada al consumo de alcohol, entonces deberamos
apreciar un gran incremento en las muertes por AVM junto a un cam-
bio escaso en la mortalidad debida a causas internas. Como en las
pruebas de equilibrio para el experimento RAND HIE de la tabla 1.3
y en el caso del instrumento para la oferta de plazas KIPP del apartado
A de la tabla 3.1, un efecto nulo en los resultados que deberan perma-
necer inalterados por el tratamiento incrementar nuestra confianza
en los efectos causales que estamos persiguiendo.
La tabla 4.1 muestra el banco de pruebas para los resultados rela-
cionados con las distintas causas de muerte. La primera fila presen-
ta estimaciones del total de fallecimientos construidas usando tanto
la ecuacin RD simple (4.2) como la compleja (4.4). Los resultados
constan en las columnas (1) y (2). La segunda fila de la tabla 4.1 re-
vela efectos fuertes del consumo legal de alcohol sobre las muertes
por AVM, efectos lo bastante grandes como para dar cuenta del total
del exceso de muertes relacionadas con la MLDA. Estas estimaciones
son bastante insensibles al hecho de deducirlas con el modelo simple
o con el complejo. Entre las otras causas de muerte que se podran
esperar relacionadas con el consumo de alcohol estn el suicidio y
otras causas externas, lo que incluye accidentes distintos a los de tr-
fico. De hecho, los efectos estimados sobre suicidios y muertes por
otras causas externas (excluyendo los homicidios) tambin presentan
algunos incrementos pequeos, pero estadsticamente significativos,
en el umbral MLDA.
Es importante constatar que las estimaciones que constan en las
columnas (1) y (2) sobre muertes por causas internas (lo que incluye
muertes por cncer y otras enfermedades) son pequeas y no difie-
ren significativamente de cero. Tal como muestra la ltima fila de la
tabla, los efectos de la intoxicacin etlica directa tambin parecen
modestos y de una magnitud similar a la de las causas internas, aun-
que el salto estimado en las muertes por intoxicacin etlica difiera
de cero de un modo estadsticamente significativo. En conjunto, por
tanto, la tabla 4.1 apoya la hiptesis MLDA al mostrar efectos claros
184
Notas: Esta tabla recoge los coeficientes de regresiones de las tasas de mortalidad
especficas por edades en meses y segn su causa, sobre una variable binaria que
marca edades superiores a 21 aos, y aadiendo a la variable binaria controles
de edad, o bien lineales, o bien cuadrticos. Los errores tpicos constan entre
parntesis.
185
40
35
Tasa de mortalidad (cada 100000)
30
Vctimas de accidentes
de trfico
25
20
Muertes por causas internas
15
10
19 20 21 22 23
Edad
186
Ma = + Da + a + ea ;
en una muestra tal que a 0 b a a 0 + b. (4.5)
187
for the Regression Discontinuity Estimator, Review of Economic Studies, vol. 79, n-
mero 3, julio de 2012, pginas 933-959.
188
189
1.0
.8
Fraccin matriculada en BLS
.6
.4
.2
0.0
20 10 0 10 20
Puntuacin en el examen de acceso respecto del umbral BLS
190
1.0
Fraccin matriculada en cualquier escuela
.8
selectiva de Boston
.6
.4
.2
0.0
20 10 0 10 20
Puntuacin en el examen de acceso respecto del umbral BLS
191
RD difusa
rado de la nota ISEE de cada solicitante y su GPA (Grade Point Average, la media de
sus notas finales en cada curso), aunque nos refiramos a esta variable mvil como la
nota ISEE para abreviar. Los puntos proceden de un mtodo de suavizado conocido
como regresin lineal local, que ajusta regresiones a muestras pequeas definidas por
un ancho de banda en el entorno de cada punto. Los valores suavizados son los valo-
res estimados que se generan de este modo. Vanse los detalles en el estudio sobre el
cual basamos nuestro tratamiento del tema: Atila Abdulkadiroglu, Joshua D. Angrist y
Parag Pathak, The Elite Illusion: Achievement Effects at Boston and New York Exam
Schools, Econometrica, vol. 81, nmero 1, enero de 2014, pginas 137-196.
192
2.5
Nota media en matemticas de los pares
2.0
1.5
en cuarto curso
1.0
.5
0.0
.5
20 10 0 10 20
Puntuacin en el examen de acceso respecto del umbral BLS
193
194
Yi = 0 + Di + 0Ri + e 0i . (4.6)
donde Yi es la nota en matemticas del estudiante i en sptimo curso,
Xi la nota en matemticas del estudiante i en cuarto curso, y X (i) re-
presenta la nota media en matemticas de todos los compaeros de
clase del estudiante i en cuarto curso (el subndice (i) nos recuerda
que el estudiante i no se incluye a la hora de calcular el resultado
medio de sus pares). La estimacin que resulta para el coeficiente de
calidad de los pares (1) est alrededor de 0,25, lo que significa que
si se incrementara en una desviacin tpica la habilidad media de
los pares en la escuela secundaria, medida a travs de las notas que
sacaron en primaria y controlando las notas de primaria del propio
estudiante, resultara un incremento de 0,25 en los resultados en la
escuela secundaria.
195
ca, 2014.
196
Yi = Di + 0Ri + e 0i . (4.7)
Aqu Di es una variable binaria que marca a los solicitantes que logran
el acceso, mientras que Ri es la variable mvil que determina si se en-
tra o no. En una muestra de solicitantes de acceso en BLS de sptimo
curso, donde Yi representa las notas de matemticas en secundaria
como en las figuras, esta regresin genera una estimacin de 0,2,
con un error tpico de 0,20, un cero estadstico de libro.
Cmo interpretar esta estimacin de ? Por supuesto, mediante
la lupa de la primera etapa correspondiente! La ecuacin (4.7) es la
forma reducida de un esquema de MC2E donde la variable endgena
sera la calidad media de los pares, X (i). La ecuacin de la primera
etapa vinculada a esta forma reducida es:
X (i) = 1 + Di + 1Ri + e 0i , (4.8)
197
2.5
Nota de matemticas en enseanza secundaria
2.0
1.5
1.0
.5
0.0
.5
20 10 0 10 20
Puntuacin en el examen de acceso respecto del umbral BLS
198
apndice del captulo 5, usamos errores tpicos robustos por grupos para tener en
cuenta el hecho de que los datos contienen observaciones correlacionadas (en este
caso, las notas de sptimo y octavo cursos para cada solicitante BLS estn correla-
cionadas).
199
de clase blancos. A la vez, sabemos que si la calidad de los pares, X (i),
se sustituye por una medida de la proporcin de estudiantes blan-
cos, esto tambin genera un coeficiente de segunda etapa nulo, como
consecuencia del hecho de que la forma reducida subyacente no se ve
alterada por la eleccin del canal causal.
Las universidades selectivas pueden ser distintas tambin en
otros sentidos, porque quiz atraigan a profesores mejores, u ofrez-
can mejores cursos de orientacin universitaria (a nivel de universi-
dad) que los centros pblicos no selectivos. Conviene subrayar que
hay otros aspectos del entorno escolar que pueden cambiar por el
corte en el umbral de admisin de las escuelas selectivas, como los
recursos con que cuenta el centro, y que pueden resultar beneficio-
sos. Esto a su vez sugiere un efecto positivo para cualesquiera varia-
bles omitidas asociadas a las estimaciones MC2E de los efectos de
la calidad de los pares. Dado que las variables omitidas con efectos
positivos probablemente estn correlacionadas positivamente con la
oferta de plaza en el centro selectivo, la estimacin MC2E que usa
las calificaciones en los centros selectivos como instrumento para la
calidad de los pares ser, en todo caso, demasiado grande en com-
paracin con el efecto aislado de los pares que estamos estudiando.
Lo cual torna an ms sorprendente que este efecto estimado resul-
te ser nulo.
Como en cualquier estudio IV, la RD difusa requiere valoracio-
nes slidas de los canales causales a travs de los cuales los instru-
mentos inciden en los resultados. En la prctica hay muchos canales
que pueden transmitir los efectos causales, y en esos casos explo-
ramos las alternativas. Es verosmil que los canales que midamos
no tengan por qu ser los nicos relevantes. El viaje causal nunca
termina, continuamente surgen preguntas nuevas. Pero el esquema
difuso que usa RD para generar instrumentos no es menos til a
este respecto.
200
201
dad por los que pasa la mayora de estudiantes que solicita ingresar
en la universidad.
Los candidatos que triunfan en la competicin de las Becas Nacio-
nales al Mrito consiguen unas notas PSAT por encima de un umbral
(y validan estas notas PSAT si aprueban el SAT, que se hace despus).
Entre estos, algunos reciben una beca concedida por el comit de
filtrado de la competicin, mientras que a los dems se les otorga
un certificado de mrito. Los estudiantes que reciben este certifica-
do, los llamados finalistas del Mrito Nacional, tienen motivos para
alegrarse, porque sus nombres se distribuyen entre las facultades,
universidades y otros patrocinadores de becas. Las facultades que
cuentan con muchos finalistas del Mrito Nacional entre sus estu-
diantes tambin suelen anunciar esta circunstancia. Thistlethwaite y
Campbell se preguntaron si un reconocimiento como el de ser finalis-
ta del Mrito Nacional ejerce algunas consecuencias duraderas entre
quienes lo reciben.
En un trabajo anterior basado en mtodos de emparejamiento
(como los tratados en el captulo 2), Thistlethwaite estim que los
solicitantes que lograron un certificado de mrito tenan 4 puntos
porcentuales ms de probabilidad de aspirar a convertirse en profe-
sores universitarios o investigadores que si no lo hubieran logrado.10
Pero un diseo RD que explotaba las discontinuidades en el entorno
del umbral PSAT para obtener el certificado de mrito mostr una
estimacin estadsticamente no significativa de este resultado, de tan
slo dos puntos. Reproducimos como figura 4.10 la grfica que acom-
paaba a este hallazgo. El reconocimiento pblico por s mismo pa-
rece ejercer un efecto escaso en la eleccin de carrera o en los planes
sobre qu estudiar en la universidad.
Donald Campbell es recordado no slo por inventar la RD, sino
tambin por su ensayo de 1963, Experimental and Quasi-Experi-
mental Designs for Research on Teaching [Diseos experimentales
y casi experimentales para la investigacin sobre la enseanza], es-
crito con Julian C. Stanley y publicado ms tarde en forma de libro.
El ensayo de Campbell y Stanley constituy una exploracin pionera
de los mtodos economtricos explicados en el presente captulo y en
202
46
II Porcentaje que planeaba
cursar tres o ms aos de
Porcentaje de estudiantes que han cumplido
42 estudios de posgrado I
(doctorado o mster)
sus planes de estudio o de carrera
30
I
J
26
22
J
18
(Estudiantes recomendados) (Ganadores del certificado al mrito)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Puntuacin en las pruebas de aptitud de los estudiantes en unidades arbitrarias
tal Designs for Research on Teaching, captulo 5 de Nathaniel L. Gage (ed.), Hand-
book of Research on Teaching, Rand McNally, 1963; y Donald T. Campbell y Thomas
D. Cook, Quasi-Experimentation: Design and Analysis Issues for Field Settings, Houghton
Mifflin, 1979.
203
Diferencias en
diferencias
Nuestro camino
205
206
2 Carmen Reinhart y Kenneth Rogoff, This Time Is Different: Eight Centuries of Fi-
nancial Folly, Princeton University Press, 2009; y Milton Friedman y Anna Schwartz,
A Monetary History of the United States, 1867-1960, Princeton University Press, 1963.
207
Si los bancos son malos, sin duda lo seguirn siendo y se volvern peo-
res si el gobierno los sostiene y los favorece. La mxima cardinal es
que cualquier ayuda actual a un banco malo constituye la manera ms
certera de impedir el establecimiento de un banco bueno en el futuro.3
Bagehot era un darwinista social confeso que crea que los principios
evolucionistas sirven para los asuntos sociales del mismo modo que
para la biologa. Qu decisin tiene ms probabilidades de favorecer
3 Del captulo IV.4 de Walter Bagehot, Lombard Street: A description of the Money
208
209
Mundos paralelos
210
211
Distrito octavo
160
Nmero de bancos activos
140
Distrito sexto
120
Distrito sexto contrafactual
Efecto del tratamiento
100
212
180
160
Nmero de bancos activos
Distrito octavo
140
Distrito sexto
120
100
180
Distrito sexto
140
120
100
Distrito sexto contrafactual
80
213
214
215
Seamos realistas
216
217
Diferencia
1929 1933 (1933-1929)
Apartado A. Nmero de empresas de venta al mayor
Distrito sexto de la Reserva Federal 783 641 142
(Atlanta)
Distrito octavo de la Reserva Federal 930 607 323
(San Luis)
Diferencia (sexto-octavo) 147 34 181
Apartado B. Ventas netas al mayor (millones de $)
Distrito sexto de la Reserva Federal 141 60 81
(Atlanta)
Distrito octavo de la Reserva Federal 245 83 162
(San Luis)
Diferencia (sexto-octavo) 104 23 81
Notas: Esta tabla presenta un anlisis DD de los efectos de la liquidez aportada por la
Reserva Federal sobre el nmero de empresas de venta al mayor y el valor en dlares
de sus ventas, para su comparacin con el anlisis DD de los efectos de la liquidez
sobre la actividad bancaria de la figura 5.1.
218
219
8 Incluimos en los datos un efecto temporal menos que el nmero de aos. Los
efectos temporales miden los cambios en funcin del tiempo respecto de un punto de
partida, normalmente el primer ao de la muestra.
220
221
Yst = + rDDLEGALst
Wyomig 1983
9 He aqu otro modo de ver cmo funciona la notacin. Consideremos una ob-
de modo que la suma de todas las posibles variables binarias estatales capta el efecto de
Nueva York, NY, cuando las observaciones son de Nueva York. Todas las dems va-
riables binarias de la suma son cero. En consecuencia, si t = 1980, entonces tenemos:
1983
j YEARjt = NY.
j =1971
y la suma recoge el efecto anual de 1980 cuando las observaciones son de ese ao.
222
Las muestras que incluyen muchos estados y aos nos permiten rela-
jar el supuesto de que exista una tendencia comn, es decir, podemos
introducir un cierto grado de evolucin distinta en los resultados
223
Notas: Esta tabla muestra las estimaciones mediante regresin DD de los efectos de
la edad mnima legal para el consumo de alcohol (MLDA) sobre las tasas de mor-
talidad (cada 100.000 personas) para edades entre 18 y 20 aos. La tabla muestra
los coeficientes para la proporcin de bebedores legales por estado y ao a partir
de modelos que incluyen controles para los efectos estatales y anuales. Los modelos
usados para construir las estimaciones de las columnas (2) y (4) incluyen tenden-
cias temporales lineales especficas para cada estado. Las columnas (3) y (4) mues-
tran estimaciones mediante mnimos cuadrados ponderados, usando la poblacin
de cada estado como peso. El tamao de la muestra es 714. Se dan los errores tpicos
entre parntesis
Yst = + rDDLEGALst
Wyoming
+ kLEGALks + jYEARjt
k=Alaska
Wyoming
+ k (STATEks t)ks + jYEARjt (5.6)
k=Alaska
224
Hasta ahora y por ahora hemos insistido en que la clave del mto-
do DD est en las tendencias comunes. Cmo es posible, entonces,
que ahora consideremos modelos como el de la ecuacin (5.6), que
relajan este supuesto central de la existencia de una tendencia comn
a todos los estados? Para ver el funcionamiento de tales modelos con-
sideremos una muestra de dos estados: el primero, Alamar, redujo
la MLDA a 18 en 1975, mientras que el estado vecino de Alabastro la
mantuvo en 21. Como punto de partida, la figura 5.4 traza la evolu-
cin de la tendencia comn en ambos estados. Las muertes por cada
100.000 habitantes evolucionan de manera paralela hasta 1975 (casi
todo empeor en los aos setenta, por eso representamos un incre-
mento de la mortalidad). Adems, las tasas de mortalidad dan un
salto por encima de la tendencia comn en Alamar en 1975, cuando
ese estado redujo su MLDA. Dado el paralelismo y las fechas, parece
justo culpar de ese salto a la bajada de la MLDA en Alamar.
La figura 5.5 traza un escenario con una tendencia ms elevada
en Alamar que en Alabastro. Como suceda en los datos de la figura
anterior, una regresin simple DD aplicada a este caso generara unas
estimaciones que nos haran culpar a la MLDA (el contraste post
menos pre en Alamar es mayor que en Alabastro). Pero en este caso
la estimacin DD resultante sera espuria: la diferencia entre las ten-
dencias estatales es previa a la liberalizacin de la MLDA en Alamar
y, por tanto, no puede guardar relacin con la misma.
Por fortuna, tales diferencias de tendencia se pueden representar
por medio de los parmetros de tendencia propia de cada estado, k ,
de la ecuacin (5.6). En los modelos que incluyen controles de las
tendencias estatales especficas, los efectos de la MLDA se reflejan
en desviaciones bruscas sobre tendencias que por lo dems son sua-
ves, incluso cuando esas tendencias no sean comunes. La figura 5.6
muestra cmo una regresin DD capta los efectos del tratamiento
superpuestos a tendencias no comunes. La mortalidad en Alamar
crece a un ritmo mayor que en Alabastro a lo largo del mismo pe-
riodo. Pero el incremento en Alamar resulta especialmente pronun-
ciado entre 1974 y 1975, cuando este estado rebaj su MLDA. El
coeficiente LEGALst de la ecuacin (5.6) capta este hecho, a la vez
que el modelo permite encajar el hecho de que las tasas de morta-
lidad en estados distintos siguieran trayectorias diferentes ya desde
el comienzo.
225
120
110
Mortalidad (cada 100000)
Alamar
100
90
Alabastro
80
1970 1975 1980 1985
Ao
Figura 5.4. Un efecto MLDA en estados con tendencias paralelas.
120
Mortalidad (cada 100000)
110
Alamar
100
90
Alabastro
80
1970 1975 1980 1985
Ao
226
130
120
Mortalidad (cada 100000)
110 Alamar
100
90
Alabastro
80
1970 1975 1980 1985
Ao
227
228
Notas: Esta tabla muestra las estimaciones mediante regresin DD de los efectos
de la edad mnima legal para el consumo de alcohol (MLDA) sobre las tasas de
mortalidad (cada 100.000 personas) para edades entre 18 y 20 aos, incluyendo
controles para los impuestos estatales sobre la cerveza. La tabla indica los coe-
ficientes para la proporcin de bebedores legales por estado y ao, y para los
impuestos sobre la cerveza por estado y ao, a partir de modelos que incluyen
controles para los efectos estatales y anuales. Las variables de fraccin legal y de
impuestos sobre la cerveza se incluyen en un modelo de regresin simple, estima-
do sin tendencias, y que conduce a las estimaciones de las columnas (1) y (2), as
como en otro modelo con tendencias estatales lineales especficas que conduce a
los valores de las columnas (3) y (4). El tamao de la muestra es 700. Los errores
tpicos constan entre parntesis.
Qu ests pesando?
229
diferencias entre los valores ajustados generados por el modelo que se est estiman-
do y la variable dependiente del modelo.
230
subyacente sea lineal. El apndice del captulo 2 aclara, sin embargo, que muchos
modelos de regresin son slo aproximaciones lineales a la verdadera FVEC.
231
232
edicin, 1855.
233
234
235
mless Econometrics, Princeton University Press, 2009. Andrew Jalil aadi grupos al ex-
perimento Misisipi en su anlisis de cientos de condados a ambos lados de la frontera
entre los distritos de la Reserva Federal. Vase Monetary Intervention along the At-
lanta Federal Reserve District Border, Journal of Economic History, vol. 74, nmero 1,
marzo de 2014, pginas 259-273.
236
El valor de
la enseanza
Maestros en accin
237
en Yi = + Si + 1Xi + 2X i2 + ei , (6.1)
Degree in Military Intelligence Aged 91, The Daily Mail, 21 de mayo de 2012.
2 El trabajo de Mincer aparece en su memorable libro Schooling, Experience, and
238
en Yi = + 0,070 Si + ei
(0,002)
239
un declive gradual del crecimiento de los ingresos con la edad. Para ver eso supon-
gamos que incrementamos Xi desde un valor x hasta otro x + 1. El trmino Xi crece
en 1, mientras que Xi2 crece en:
(x + 1)2 x 2 = 2x + 1.
El efecto neto de un incremento de un ao en la experiencia es, pues:
(0,081 1) [0,0012 (2x + 1)] = 0,08 0,0024x.
Se estima, por tanto, que el primer ao de experiencia incrementa los ingresos en casi
un 8%, mientras que el dcimo ao de experiencia lo hace en tan slo alrededor de
un 5,6%. De hecho, el perfil de experiencia, como se denomina a esta relacin, se torna
completamente plano despus de unos 30 aos de experiencia.
240
en Yi = l + l Si + Ai + ei . (6.3)
s l + AS ,
{
sesgo de aptitud
241
242
acadmica se mide mal (y creemos que ocurre con frecuencia), las es-
timaciones en regresiones que incluyen controles de aptitud pueden
resultar ms pequeas de lo que deberan ser.
243
244
245
246
Schooling from a New Sample of Twins, American Economic Review, vol. 84, nmero 5,
diciembre de 1994, pginas 1157-1173, y Orley Ashenfelter y Cecilia Rouse, Income,
Schooling, and Ability: Evidence from a New Sample of Identical Twins, Quarterly
Journal of Economics, vol. 113, nmero 1, febrero de 1998, pginas 253-284.
247
si se aade una variable binaria para cada familia en un modelo en el que no se eje-
cuta la resta, y la muestra incluye a ambos gemelos. Las variables binarias familiares
actan como las de grupos selectivos en la ecuacin (2.2) del captulo 2, o como las
de los estados de la ecuacin (5.5) del apartado 5.2. Cuando hay slo dos observa-
ciones por familia, los modelos que se evalan tras ejecutar la resta entre gemelos
proporcionan una nica observacin por familia, pero generan estimaciones idn-
ticas de los rendimientos de la formacin idnticas a las que se obtienen cuando se
marca con variables binarias a cada familia en una muestra conjunta que incluye a
todos los gemelos.
248
249
Notas: Esta tabla revela las estimaciones sobre rendimientos de la formacin para
los gemelos de Twinsburg. La columna (1) presenta estimaciones mediante MCO
del modelo de niveles. Las estimaciones MCO de los modelos con referencias
cruzadas entre gemelos constan en la columna (2). La columna (3) da las esti-
maciones por MC2E de un modelo de regresin por niveles que usa el informe
del hermano como instrumento para la escolaridad. La columna (4) refleja las
estimaciones mediante MC2E usando la diferencia entre los informes de los her-
manos como instrumento para la diferencia de escolaridad entre gemelos. Los
errores tpicos constan entre parntesis.
250
251
Esa es la ley
252
253
254
255
Variable dependiente
Aos de formacin Logaritmo de los
acadmica ingresos semanales
(1) (2) (3) (4)
A. Estimaciones de la primera etapa y de la forma reducida
El trabajo infantil requiere 7 aos .166 .024 .010 -.013
(.067) (.048) (.011) .011
El trabajo infantil requiere 8 aos .191 .024 .013 .005
(.062) (.051) (.010) .010
El trabajo infantil requiere 9 o ms .400 .016 .046 .008
aos (.098) (.053) (.017) .014
B. Estimaciones de la segunda etapa
Aos de formacin acadmica .124 .399
(.036) (.360)
Variable binaria de estado de naci- No S No S
miento tendencia lineal segn ao
de nacimiento
Notas: Esta tabla muestra las estimaciones mediante MC2E de los rendimientos
de la formacin acadmica usando como instrumentos tres variables binarias que
marcan los aos de escolaridad exigidos por las leyes para permitir el trabajo
infantil. El apartado A refleja las estimaciones de la primera etapa y de la forma
reducida, con controles para los efectos del ao y el estado de nacimiento, as
como variables binarias para el ao del censo. Las columnas (2) y (4) muestran
los resultados de aadir a la lista de controles tendencias lineales estatales espe-
cficas. El apartado B presenta las estimaciones por MC2E de los rendimientos de
la formacin generados por la primera etapa y la forma reducida del apartado A.
El tamao de la muestra es 722343. Los errores tpicos constan entre parntesis.
256
257
258
Affect Schooling and Earnings?, Quarterly Journal of Economics, vol. 106, nmero 4,
noviembre de 1991, pginas 979-1014.
259
3 3 4
1
4 3
12.8 4 3
4 2 1 2
2
3
2 3 1
4
1 4
3
12.6 4 2
2 1 1
1 2 1
3
12.4 2
1
12.2
1930 1931 1932 1933 1934 1935 1936 1937 1938 1939
Ao de nacimiento
5.94
Logaritmo de los ingresos semanales
5.92 4
3 4 3 3 4
3 4 3 4
3 3 4
3 4 2
23
5.90 1 2 2
4
2 1 2
1 4
2 1 1
1 4 1
2 2 2 3
1 1
5.88
1
5.86
1930 1931 1932 1933 1934 1935 1936 1937 1938 1939
Ao de nacimiento
260
= 0,0068
= 0,074.
0,0092
261
Notas: Esta tabla refleja las estimaciones mediante MCO y MC2E de los rendi-
mientos de la formacin acadmica utilizando el trimestre de nacimiento para
construir instrumentos. Las estimaciones de las columnas (3) a (5) proceden de
modelos que incluyen controles para el ao de nacimiento. Las columnas (1) y
(3) presentan las estimaciones MCO. En las columnas (2), (4) y (5) constan las
estimaciones MC2E que usan los instrumentos indicados en la fila tercera de la
tabla. En la segunda fila se da la prueba F sobre el significado conjunto de los ins-
trumentos en las correspondientes regresiones de primera etapa. El tamao de la
muestra es 329.509. Se dan entre parntesis los errores tpicos.
262
Old Questions, New Answers, NBER Working Paper 14573, National Bureau of Eco-
nomic Research, diciembre de 2008. Vase tambin John Bound, David A. Jaeger y
Regina M. Baker, que fueron los primeros en llamar a atencin sobre la posibilidad de
que las estimaciones con instrumentos TDN no admitieran una interpretacin causal
en Problems with Instrumental Variables Estimation When the Correlation between
the Instruments and the Endogeneous Explanatory Variable Is Weak, Journal of the
American Statistical Association, vol. 90, nmero 430, junio de 1995, pginas 443-450.
263
264
265
12 Damon Clark y Paco Martorell, The Signaling Value of a High School Diplo-
ma, Journal of Political Economy, vol. 122, nmero 2, abril de 2014, pginas 282-318.
266
.8
.6
.4
.2
0.0
30 25 20 15 10 5 0 5 10 15
Nota de examen relativa al umbral
18,000
16,000
Ingresos anuales
14,000
12,000
10,000
8,000
30 25 20 15 10 5 0 5 10 15
Nota de examen relativa al umbral
267
268
Yi = + S *i + ei , (6.6)
Si = S *i + mi , (6.7)
269
E[mi] = 0
C(S *i , mi) = C(ei , mi) = 0
C(Yi , S *i )
= .
V(S *i )
C(Yi , S i )
b = , (6.8)
V(S i )
C(Yi , Si)
b =
V(Si)
C( + S *i + e i , S *i + m i )
=
V(Si)
C( + S *i + e i , S *i ) V(S *i )
= = .
V(Si) V(Si)
270
b = r, (6.9)
donde
V(Si) V(S *i )
r = =
V(Si) V(S *i ) + V(mi)
b = (1 r),
Yi = + S *i + Xi + ei , (6.10)
271
~
C(Yi , S i )
b =
~ ,
V(S i )
~
donde S i es el residuo de una regresin de Si sobre Xi .
Aadamos el supuesto (clsico) de que el error de medida, mi , no
est correlacionado con la variable Xi . Entonces el coeficiente de una
regresin de la variable afectada de error Si sobre Xi es el mismo que
el coeficiente de una regresin de S *i sobre Xi (usando las propiedades
de la covarianza y la definicin de coeficiente de regresin), lo que a
su vez implica que:
~ ~
S i = S *i + mi ,
~
donde mi y S *i no estn correlacionadas. Por lo tanto, tenemos que:
~ ~
V(S i) = V(S i) + V(mi),
~
C(Yi , S i )
b =
~
V(S i )
~
V(S i)
=
~* = r , (6.11)
V(S i ) + V(mi)
donde
~
V(S *i )
r =
~ .
V(S i ) + V(mi)
272
~
V(S *i ) V(S *i )
r =
~* < = r.
V(S i ) + V(mi) V(S *i ) + V(mi)
273
Para ver cmo trabaja el sistema VI en este contexto usemos las ecua-
ciones (6.6) y (6.7) para sustituir Yi y Si en la ecuacin (6.12):
C(Yi , Z i) C( + S *i + ei , Z i)
VI = =
C(Si , Z i) C(S *i + mi , Z i)
C(S *i , Z i)
VI = = .
C(S *i , Z i)
274
275
276
277
Tablas
279
280
281
fila (2) del apartado A, de la fila (1), columnas (1) y (2), de la tabla IV;
fila (1) del apartado B, de la fila (2), columnas (5) y (6), de la tabla V; y
fila (2) del apartado B, de la fila (1), columnas (1) y (2), de la tabla V.
Tabla 1.6 Efectos del OHP sobre los indicadores de salud y sobre la
salud financiera
282
Fuentes de los datos. Vanse las notas de la tabla 1.5. Los nmeros
de la fila (1) del apartado A de esta tabla proceden de la fila (2), co-
lumnas (1) y (2), de la tabla IX de Finkelstein et al. (2012). Las cifras
de las columnas (3) y (4) proceden de Katherine Baicker et al., The
Oregon Experiment-Effects of Medicaid on Clinical Outcomes, New
England Journal of Medicine, vol. 368, nmero 18, 2 de mayo de 2013,
pginas 1713-1722.
Las cifras de las columnas (3) y (4) se derivan de las columnas (1)
y (2) del original del modo siguiente:
283
284
Tabla 2.4 Efectos del carcter selectivo de los centros: controles se-
gn la nota media en las pruebas de acceso
Fuentes de los datos. Vanse las notas de la tabla 2.2.
Muestra. Vanse las notas de la tabla 2.3.
Definicin de las variables. Vanse las notas de la tabla 2.3. La va-
riable de nota media de acceso al centro refleja la puntuacin media
285
286
287
288
289
290
291
292
Figuras
293
294
School (BLS) para plazas de sptimo curso desde 1999 hasta 2008. La
muestra se restringe a los estudiantes para los que BLS era la primera
opcin, o bien se convirti en la primera opcin tras eliminar las es-
cuelas en las que el estudiante no logr el acceso.
Definicin de las variables. La variable mvil, etiquetada como
puntuacin en el examen de acceso en la figura, es una media pe-
sada de la puntuacin total ISEE (Examen de Acceso de las Escuelas
Independientes, Independent School Entrance Exam) del solicitan-
te y su GPA (Grade Point Average, la media de sus notas finales en
cada curso). La tasa de matriculacin en escuelas selectivas se calcula
usando datos del curso escolar posterior al de la solicitud.
Notas adicionales de la figura. Los valores de la variable mvil
de la figura se normalizaron sustrayendo la nota ms baja a la que se
ofreci plaza, de manera que el umbral de todos los aos resulta igual
a cero. Las lneas suavizadas de las figuras son valores ajustados por
medio de modelos de regresin estimados en el entorno de cada pun-
to. Estos modelos resuelven una regresin de la variable dependiente
sobre la variable mvil para las observaciones contenidas dentro de
un ancho de banda no paramtrico. Vanse ms detalles en Abdulka-
diroglu et al. (2014).
295
296
297
298
299
300
301
302
303
Los nmeros de pgina que remiten a entradas dentro de figuras van seguidos
de una efe (f); los que remiten a entradas que constan en notas, por una ene
(n); y los que remiten a entradas que aparecen dentro de tablas, por una te (t).
305
306
307
efecto causal, 16-20. Vase adems efec- ELMT. Vase efecto local medio del tra-
to causal promedio; efecto de in- tamiento
tencin de tratamiento; efecto lo- emparejamiento (matching), 67-68, 69-
cal medio del tratamiento; efecto 70, 70t
del tratamiento sobre los tratados empleo. Vanse ingresos; profesin
efecto causal promedio, 22-24 empresas de venta al mayor, 217, 218t
efecto de la intencin de tratamien- ensayo aleatorio:
to, 142-143 ventajas, 11-14, 26, 28-31
efecto local medio del tratamiento, anlisis, 26-31
131-137 sobre los efectos de los seguros m-
en el diseo RD, 181-183 dicos, 26-27, 31-39, 40-45
efecto del tratamiento sobre los historia, 45-48
tratados, 136, 143-145 con cumplimento imperfecto, 138-
efecto de intencin de tratamiento (IT), 145
142-143 sobre respuesta policial a la violen-
efecto de los pares en la formacin aca- cia de gnero, 138-145
dmica, 83, 86, 190, 194-198, 193f, muestras para, 28-29
198f epidemiologa, 232-233
efecto del tratamiento sobre los trata- equilibrio cantidad-calidad. Vase tama-
dos (TST), 136-137, 144-145 o familiar
efecto local medio del tratamiento equilibrio racial en colegios pblicos,
(ELMT), 131-137 199
definicin, 131 equilibrio, comprobacin del, 31, 34-
estimacin, 132 37, 124
validez externa, 136-137 error de medida, 249-252, 264, 269-
efectos anuales. Vase efectos tempo- 274
rales error tpico estimado, 54, 61. Vase ade-
efectos badana, 265-268, 237f ms error tpico
efectos del tratamiento. Vase efecto error tpico robusto por grupos, 235
causal promedio; efecto de inten- error tpico robusto, 116
cin de tratamiento; efecto local error tpico: por grupos, 235
medio del tratamiento; efecto del para la comparacin de medias,
tratamiento sobre los tratados 31, 60
efectos estatales, 221, 222, 253-257 definicin, 54
efectos temporales, 220, 220n, 222- para diferencias en diferencias, 233-
223, 222n 236
Ehrlich, Paul, 146, 147 estimado, 54, 61
Einav, Liran, 32n, 33n con variables instrumentales, 167
elasticidad de los precios con la de- en regresiones, 80, 114-116
manda para la atencin mdica, 32 robusto, 117
identificacin, 163 y el tamao de la muestra, 116
Elder, Todd, 97n y la significancin estadstica, 36,
Ellement, John R., 68n 57-58
308
309
310
311
312
313
314
315
Schlosser, Analia, 150, 150n 88-97, 95t, 111-112, 155, 177, 200,
Schwartz, Anna, 207, 207n 241-241. Vase adems sesgo de se-
SCR (suma cuadrtica de residuos), leccin
105, 230 Sherman, Lawrence W., 138n
seguros mdicos: siempre tomadores, 133-134, 144-145,
Affordable Care Act (Ley de Aten- 153
cin Mdica Asequible), 15 significancin estadstica, 36, 56-58,
beneficios financieros de, 44t, 43- 59-60, 61-62
45 significacin. Vase significacin esta-
efectos de los ensayos aleatorios, dstica
27-28, 31-39, 40-45 Simpson, Nicole Brown, 138
Medicaid, 16, 39-45 Simpson, O. J., 137, 138n
Medicare, 16 Snow, John, 232-233, 233n, 234f
nacionales, 21 sorteos de escuelas charter, 122-123
relacin con la salud, 15-24, 20t, anlisis mediante variables instru-
37-39, 38t, 42-45, 44t mentales de, 122-130, 126t
sujetos no asegurados, 16-17, 19- escuelas charter, 122-130
21, 20t, 21-22, 39 sorteos, Oregon Health Plan (Plan
y el uso de la atencin mdica, 37, de Salud de Oregn), 40-45,
38t, 41-42, 42t, 43-45 42t, 44t
seguros. Vase seguros mdicos Stanley, Julian C, 202, 203n
sesgo de aptitud, 240-243 Stock, James H., 164, 164n, 165n
sesgo de atenuacin, 251-252, 271-272 suicidio, 184, 185t, 223
sesgo de muestra finita en MC2E, 169- suma cuadrtica de residuos (SCR),
170 105, 230
sesgo de seleccin: 12-14 suposicin de independencia, 128-129
debido a mal control, 243-246, 245t SVO. Vase sesgo de variables omitidas
definicin, 12
en el Experimento de Violencia de
Gnero de Minneapolis, 138- t, indicador estadstico:
139, 143-144 definicin, 55
en la asistencia a escuelas charter, distribucin de muestreo de, 55-
125-127, 130-131 59, 57f, 58f
en la eleccin de centro universita- para la comparacin de medias, 61
rio, 64-65, 71, 86, 87-88 para la media muestral, 55
en la estimacin de los rendimien- tabaco, 47-48
tos de la formacin acadmica, Taber, Christopher, 97n
239-241 tabla estado-ao, 223, 230, 231
en mnimos cuadrados en dos eta- tamao familiar:
pas, 168-170. Vase adems sesgo estudio ALS, 150-153, 158-160
de variables omitidas y capital humano de los hijos, 148-
y diferencias de medias, 24-25 162
sesgo de variables omitidas (SVO), y eleccin de universidad, 87-93
316
317
318