Sunteți pe pagina 1din 6

Breve historia de los resultados potenciales

Aplicacin a la inferencia causal


2.1 INTRODUCCIN
El enfoque de la inferencia causal esbozado en el primer captulo tiene
antecedentes importantes en la literatura. En este captulo revisamos
algunos de estos antecedentes para poner en perspectiva el enfoque de
potenciales resultados. Los dos desarrollos iniciales ms importantes, en
sucesin rpida en los aos veinte, son la introduccin de resultados
potenciales en las asignaciones aleatorias de Neyman (Neyman, 1923,
traducido y reimpreso en Neyman, 1990) y la introduccin de la
aleatorizacin como la "base razonada" para la inferencia por Fisher(Fisher,
1988, p.14).
Una vez introducida, la idea bsica de que los efectos causales son las
comparaciones de los resultados potenciales puede parecer obvia, como se
podra esperar, ser un principio establecido desde hace mucho tiempo del
pensamiento cientfico. Sin embargo, aunque las semillas de la idea se
remontan al menos al siglo XVIII, la notacin formal de los resultados
potenciales no fue introducida hasta 1923 por Neyman. Los mismos
estadsticos, al analizar tanto los datos experimentales como
observacionales con el objetivo de inferir los efectos causales, utilizaran
regularmente la notacin de los resultados potenciales en estudios
experimentales pero cambiando la notacin a una puramente en trminos
de resultados observados y realizados para estudios observacionales. Ms
recientemente, en los 70 con el trabajo de Donald Rubin (1974), el lenguaje
y el razonamiento de los resultados potenciales se situaron en primer plano
en los entornos de los estudios observacionales, y tom otro cuarto de siglo
antes de que se encontrara aceptado como una manera natural de evaluar
los efectos causales , independientemente de la configuracin.
Por otra parte, antes del siglo XX parece haber sido slo limitado del
concepto de mecanismo de asignacin. Aunque en la dcada de 1930 se
haba establecido de forma aleatoria en algunas reas de la investigacin
cientfica, especialmente en los experimentos agrcolas, no haba una
declaracin formal para un mecnico de asignacin general y, por lo dems,
ni siquiera los argumentos formales a favor de la asignacin al azar hasta
Fisher (1925).
2.2 RESULTADOS POTENCIALES Y LA ASIGNACIN MECANISMO ANTE
NEYMAN
Antes del siglo XX podemos encontrar semillas de la definicin de resultados
potenciales de efectos causales entre los experimentadores y los filsofos.
Por ejemplo, se puede ver una idea de los resultados potenciales, aunque
an no etiquetados como tales, en las el debate del filsofo y economista
Mill (1973, p.327), quien ofrece:
Si una persona come de un plato en particular, y muere en
consecuencia, eso es, no habra muerto, si no hubiera comido de
ella, la gente sera capaz de decir que comer de ese plato era la
causa de su muerte.
Aplicando la notacin de resultados potenciales a esta cita, Mill parece
considerar los dos posibles resultados, Y (comer del plato) y Y (no comer
plato) para la misma persona. En este caso, el resultado observado, Y
(comer del plato), es "muerte", y Mill postula que si el resultado potencial
alternativo, Y (no comer plato), es "no muerte", entonces se podra inferir
que comer el plato era la fuente (causa) de la muerte.
Del mismo modo, a principios del siglo XX, el padre de muchas de las
estadsticas modernas, Fisher (1918, p.214), argument: Si decimos,
"Este muchacho ha crecido alto porque ha sido bien alimentado," ...
estamos sugiriendo Que probablemente hubiera estado peor
alimentado, y que en este caso hubiera sido ms pequeo.
Aqu tambin vemos una referencia, algo implcita, a dos resultados
potenciales, Y (bien alimentado)= Alto y Y (no bien alimentado) = ms
corto, asociado con una sola unidad, un nio. A pesar de las ideas que
podemos percibir en estas citas, sus autores pueden o no haber querido que
sus palabras significaran cuando elegimos interpretarlas. Por ejemplo, en su
Argumento, Mill pasa a requerir una "conjuncin constante" para asignar la
causalidad - Esto es, para que el plato sea la causa de la muerte, este
resultado debe ocurrir cada vez que es consumido, por esta persona, o
quizs por cualquier persona. Curiosamente, una temprana industria del
tabaco argument utilizando una nocin similar de causalidad: no todo el
que fuma dos o ms paquetes de cigarrillos al da tiene cncer de pulmn,
por lo tanto fumar no causa cncer de pulmn. Jerome Cornfield, el bien
conocido epidemilogo estadounidense que estudi el fumar y cncer de
pulmn tambin luch con esto: "Si los cigarrillos son carcingenos, por
qu No todos los fumadores tienen cncer de pulmn? "(Cornfield, 1959,
p.224) sin los beneficios en el marco de los resultados potenciales. Vase
tambin Rubin (2012).
No importa cun interpretados, sin embargo, no hemos encontrado ningn
escritor temprano que formalmente persiguieron estas intuiciones sobre los
resultados potenciales que definen los efectos causales; en particular- Hasta
que Neyman lo hizo en 1923, nadie desarroll una notacin formal para la
idea de los resultados potenciales. Tampoco se discuti la importancia de los
mecanismos de asignacin, que son necesarios para la evaluacin de los
efectos causales. El primero de estos usos matemticos de la idea de los
resultados potenciales fue introducido por Jerzey Neyman (1923), y slo en
el contexto de un modelo de urna para asignar tratamientos a las parcelas.
La definicin formal general de los efectos causales en trminos de
resultados potenciales, as como la definicin formal del mecanismo de
asignacin, estaba todava a otro medio siglo de distancia.
2.3 NEYMAN (1923) POTENCIAL RESULTADO NOTACIN EN EXPERIMENTOS
ALEATORIOS
Neyman (en la versin traducida de 1990) comienza con una descripcin de
un experimento de campo con m parcelas sobre las cuales se podran
aplicar v variedades. Neyman presenta lo que l llama "Rendimiento
potencial" U ik , donde i indexa la variedad, i = 1,. . ., v y k indica la
parcela, k = 1,. . ., m. Los rendimientos potenciales no son iguales al
rendimiento real o observado porque i indexa todas las variedades y k indica
todas las parcelas, y cada parcela se expone a una sola variedad.

A lo largo de la recoleccin de resultados potenciales, U = { U ik : i = 1,. . .,


V; K = 1,. . ., m} se considera a priori fijo pero desconocido. La "mejor
estimacin" (trmino de Neyman) de la rendimiento de la i-sima variedad
en el campo es el promedio de los resultados potenciales para esa variedad
de todas las m parcelas,
m
1
ai= U ik
N k=1

Neyman llama ai a la "mejor estimacin" debido a su preocupacin por la


definicin de "verdadero rendimiento ", algo con lo que luch nuevamente
en Neyman (1935). Como se defone los potenciales resultados, son los
valores "verdaderos" bajo SUTVA, no las estimaciones de ellos.
Neyman entonces contina describiendo un modelo de urna para
determinar qu variedad cada parcela recibe; este modelo es
estocsticamente idntico al experimento completamente aleatorio con
n=m/ v parcelas expuestas a cada variedad. Seala la falta de
independencia entre las asignaciones para diferentes parcelas implicadas
por este muestreo restringido de tratamientos sin reemplazo (Es decir, si la
parcela k recibe la variedad i, entonces la parcela l es menos probable que
reciba la variedad i), y contina sealando que ciertas frmulas para esta
situacin que se han justificado en la base de la independencia (es decir,
tratar a los U ik como variables aleatorias normales independientes dado
algunos parmetros) necesitan una consideracin ms cuidadosa.

Ahora, an usando la notacin de Neyman, sea x i la media de la muestra


de las n parcelas realmente expuestos a la i-sima variedad, en lugar de
ai , el promedio de los resultados potenciales sobre todos las m parcelas.

Neyman muestra que la expectativa de x ix j , es decir, el valor promedio

de x ix j sobre todas las asignaciones que son posibles bajo sus dibujos

de urna, es aia j . As, la estimacin estndar del efecto de la variedad i

frente a la variedad j, la diferencia en medias observadas, x ix j es


imparcial (sobre asignaciones aleatorias repetidas en las m parcelas) para el
estimador causal aia j , el efecto promedio de la variedad i frente a la
variedad j en todos las m parcelas.
El formalismo de Neyman hizo tres aportaciones: (i) notacin explcita de los
resultados potenciales, (ii) consideracin implcita de algo como la
suposicin de estabilidad, y (iii) consideracin implcita de un modelo para
la asignacin de tratamientos a unidades corresponde a un experimento
completamente al azar. Pero como Speed (1990, p.464) escribe en su
introduccin a la traduccin de Neyman (1923): "Implcito no es explcito; la
aleatorizacin es como un acto fsico, y ms tarde como una base para el
anlisis, todava estaba por ser introducido por Fisher.Sin embargo, la
provisin explcita de la notacin matemtica para los resultados
potenciales fue un gran avance, y despus de la introduccin de Fisher de
experimentos aleatorios en 1925, la notacin de Neyman rpidamente se
convirti en estndar para definir la relacin promedio de los efectos
causales en experimentos aleatorios. Vase, por ejemplo, Pitman (1937),
Welch (1937), McCarthy (1939), Anscombe (1948), Kempthorne (1952,
1955), Brillinger, Jones y Tukey (1978), Hedges y Lehman (1970, sec. 9.4), y
decenas de otros lugares, a menudo asumiendo aditividad como en Cox
(1956, 1958), e incluso en textos introductorios (Freedman, Pisani y Purves,
1978, pgs. 456-458). El propio Neyman, en retrospectiva, siente que el
modelo matemtico fue un avance:
Neyman siempre ha depreciado los trabajos estadsticos que produjo
en Bydogszcz [Que es donde Neyman (1923) se hizo], diciendo que si
hay algn mrito en ellos, es no en las pocas frmulas que dan varias
expectativas matemticas, sino en la construccin de un modelo
probabilstico de ensayos agrcolas que, en ese momento, era una
novedad. (Reid, 1982, pg. 45)
2.4 CONSEJOS ANTERIORES PARA LA ALEATORIZACIN FSICA
La nocin del papel central de la asignacin al azar, aunque no sean
experimentos aleatorios reales, parece haber estado "en el aire" en los aos
20 antes de que se introdujera explcitamente por Fisher. Por ejemplo,
"Student" (Gossett, 1923, pp. 281-282) escribe: "Si ahora las parcelas
haban sido colocadas al azar. . ., y Fisher y MacKenzie (1923, p.473)
escriben "Adems, si todas las parcelas estuvieran indiferenciadas, como si
los nmeros hubieran sido mezclados y se anotan en orden aleatorio
"(vase Rubin, 1990, pgina 477). Un tanto notable, sin embargo, un
psiclogo y filsofo estadounidense, Charles Sanders Peirce, parece haber
propuesto la aleatorizacin fsica dcadas antes, aunque no como una base
para la inferencia, como en Fisher (1925). Especficamente, Peirce y Jastrow
(1885, reimpreso en Stigler, 1980, pp. 75-83) utilizaron la aleatorizacin
fsica para crear secuencias de tratamiento binario (pesos ms pesados
versus pesos ms ligeros) en un experimento psicolgico de medidas
repetidas. El propsito de la aleatorizacin fue crear secuencias tales que
"cualquier posible adivinacin psicolgica de los cambios que el operador
[experimentador] probablemente seleccionara (Stigler, pgs. 79-80). Peirce
tambin parece haber anticipado, a finales de siglo XIX, el concepto de
Neyman de estimacin imparcial cuando se utiliza el muestreo aleatorio y
parece haber pensado incluso en la aleatorizacin como un proceso fsico
(Peirce, 1931). Pero no podemos encontrar ninguna sugerencia para la
aleatorizacin fsica de los tratamientos a las unidades como una base para
la inferencia bajo Fisher (1925).
2.5 FISHER'S (1925) PROPUESTA PARA ALEATORIZAR TRATAMIENTOS A
UNIDADES
Un aspecto interesante del anlisis de Neyman fue que, como se acaba de
mencionar, aunque l desarroll su notacin para tratar los datos como si
surgieran de lo que ms tarde se llamara un experimento aleatoriamente
asignado, no dio el siguiente paso de proponer la necesidad de
aleatorizacin fsica para evaluar de manera creble los efectos causales. En
cambio, Ronald Fisher, en 1925, que primero comprendi esto. Aunque la
distincin puede parecer trivial en retrospectiva, Neyman no lo vio como tal:
En una ocasin, cuando alguien lo perciba como anticipando al
estadstico ingls R. A. Fisher en el uso de la aleatorizacin, se opuso
vigorosamente:
"Trat tericamente un experimento agrcola sin asignacin al azar y
la aleatorizacin se consider un requisito previo al tratamiento
probabilstico de los resultados. Esta no es lo mismo que el
reconocimiento de que sin aleatorizacin un experimento tiene poco
valor independientemente del tratamiento subsiguiente. Este ltimo
punto se debe a Fisher, y yo lo considero como uno de los ms
valiosos logros de Fisher "(Reid, 1982, p.45)
Tambin,
Debido al trabajo de R. A. Fisher, "Student" y sus seguidores, es difcil
aadir algo esencial para el conocimiento actual sobre los
experimentos locales. . . . Uno de los logros ms importantes de la
Escuela inglesa es su mtodo de planificacin de experimentos de
campo conocidos como el mtodo de bloques aleatorios y cuadrados
latinos. (Neyman,1935, pg. 109)
As, independientemente del trabajo de Neyman, Fisher (1925) propuso la
aleatorizacin fsica de unidades y, adems, desarroll un mtodo de
inferencia basado en esta clase especial de mecanismos de asignacin, es
decir, experimentos aleatorios. La asignacin aleatoria se puede hacer, por
ejemplo, eligiendo bolas de una urna, como se describe por Neyman (1923).
Los "niveles de significacin" de Fisher (es decir, p-valores), en el texto
actual introducido y discutidos en el Captulo 5, siguen siendo el estndar
riguroso aceptado para el anlisis de ensayos clnicos aleatorios a
comienzos del siglo XXI y validar los denominados anlisis de la intencin de
tratar, como se analiza en los Captulos 5 y 23.
2.6 LA NOTACIN DE RESULTADOS OBSERVADOS EN OBSERVACION
ESTUDIOS PARA EFECTOS CAUSALES
A pesar de la aceptacin casi inmediata de los experimentos aleatorios, los
valores p de Fisher, y la notacin de Neyman para los resultados potenciales
en el trabajo agrcola y matemtico estadsticos de 1930 en esos
experimentos, estos mismos elementos no se utilizaron para nferencia
causal en estudios observacionales. Entre los cientficos sociales, que casi
exclusivamente usaban datos observados, el trabajo sobre los experimentos
aleatorizados por Fisher, Neyman y otros, recibieron poca o ninguna
atencin, y los investigadores continuaron con modelos de resultados
observados en lugar de pensar en trminos de resultados potenciales.
Incluso entre los estadsticos involucrados en el anlisis de estudios
aleatorizados y no aleatorios de datos de efectos causales, las ideas y el
lenguaje matemtico utilizado para la inferencia causal en el contexto de los
experimentos aleatorios fueron completamente excluidos de la inferencia
causal en los ajustes no aleatorios. El enfoque en este ltimo contina
construyendo modelos estadsticos relacionando el valor observado de la
variable de resultado con las covariables y las variables indicadoras para los
niveles de tratamiento, con los efectos causales definidos en trminos de los
parmetros de estos modelos, una tradicin que aparece originalmente con
Yule (1897).
Este enfoque estim asociaciones, por ejemplo, correlaciones, entre
observaciones variables, y luego intent, utilizando varios argumentos
externos sobre el orden temporal de las variables, para inferir la causalidad,
es decir, para evaluar cul de estas asociaciones podra estar reflejando un
mecanismo causal. En particular, el par de resultados potenciales
(Y i ( 1) ; Y i ( 0) ) , que en nuestro enfoque es fundamental para definir los
efectos causales, fue sustituido por el valor observado de Y para la unidad i,
introducido en la Seccin 1.7.

Y obs
i =Y i ( W i )=W iY i ( 1 ) + ( 1W i )Y i ( 0 ) =
{Y i ( 0 ) si W i=0
Y i ( 1 ) si W i=1

obs
El resultado observado Yi era tpicamente regresado, usando mnimos

cuadrados ordinarios, como en Yule (1897), sobre las covariables Xi y el

indicador para la exposicin al tratamiento, W i . El coeficiente de

regresin de Wi en esta regresin se interpret entonces como la

estimacin del efecto causal de W i=1 frente a W i=0 . Algo


notablemente, bajo condiciones muy especficas, es que este enfoque
funciona como se describe en el Captulo 7. Pero en general no. Esta
tradicin domin la economa, la sociologa, la psicologa, la educacin y
otras ciencias sociales, as como las ciencias biomdicas, como la
epidemiologa, durante ms de un siglo.
De hecho, durante medio siglo despus de Neyman (1923), los estadsticos
que escribieron con gran claridad y conocimiento sobre los experimentos
aleatorios utilizando la notacin de resultados potenciales no lo utiliz al
discutir los estudios no aleatorios para los efectos causales. Por ejemplo,
contrastar la discusin en Cochran y Cox (1956) sobre experimentos con
Cochran (1965) sobre estudios observacionales, y la discusin en Cox (1958)
sobre experimentos con los de Cox y McCullagh (1982) sobre la paradoja del
Seor (que fue discutido utilizando el marco de resultados potencial en el
Captulo 1).

S-ar putea să vă placă și