Sunteți pe pagina 1din 123

Ignacio Lago

la lógica de la
explicaciónenlas
ciencias sociales: una
introducción
metodológica

UNIVERSIDAD

I C E S I biblioteca

083683

U N t V E R S l DAAlianza Editorial
SI '
d i b i iñ T P r j
La lógica de la explicación en las
ciencias sociales: una
introducción metodológica
/

Esta obra ha sido publicada con una subvención de la Dirección General del
Libro, Archivos y Bibliotecas del Ministerio de Cultura para su préstamo público
en Bibliotecas Públicas, de acuerdo con lo previsto en el artículo 37.2 de la Ley
de Propiedad Intelectual.

MINISTERIO
D E CULTURA

Reservados todos los derechos. El contenido de esta obra está protegido por la Ley, que esta­
blece penas de prisión y/o multas, además de las correspondientes indemnizaciones por daños
y perjuicios, para quienes reprodujeren, plagiaren, distribuyeren o comunicaren públicamente,
en todo o en parte, una obra literaria, artística o científica, o su transformación, interpretación
o ejecución artística fijada en cualquier tipo de soporte o comunicada a través de cualquier
medio, sin la preceptiva autorización.

© 'Ignacio L^go Peñas, 2008


© Alianza Editorial, S.A., Madrid, 2008
Calle Juan Ignacio Lúea de Tena, 15; 28027 Madrid; teléf. 91 393 88 88
www. alianzaeditorial.es
ISBN; 978-84-206-9117-6
Depósito legal: M. 56.104-2007
Fotocomposición e impresión: efca , s . a .
Parque Industrial «Las Monjas»
28850 Torrejón de Ardoz (Madrid)
Printed in Spain

SI QUIERE RECIBIR INFORMACIÓN PERIÓDICA SOBRE LAS NOVEDADES DE


ALIANZA EDITORIAL, ENVÍE UN CORREO ELECTRÓNICO A LA DIRECCIÓN:
__________________alianzaeditorial@anaya.es_________________
Para mi madre, Lucrecia Peñas
índice

Agradecimientos................................................................................ 9

1. Presentación.............................................................................. 11

2. Descripción y explicación: el concepto de causa.................... 17

3. El azar en los fenómenos políticos y sociales......................... 29

4. Relaciones causales versus relaciones espurias....................... 33

5. ¿Cómo se pueden estimar los efectos causales?...................... 41

6. ¿Qué significa «explicar» en ciencias sociales?...................... 53


6.1. La explicación estadistica............................................................ 54
6.2. La explicación basada en las leyes de cobertura........................ 59
6.3. La explicación basada en mecanismos causales o sociales...... 62

7. ¿Qué se debe evitar en los diseños de investigación?............ 75


7.1. Errores de especificación en el modelo de explicación............ 75
7.2. El sesgo de selección......................................................................... 82
Le lógica de la explicación en las cieriCia^sod3.1es

7.3. La multicolinealidad...................................................................... 88
7.4. La endogeneidad............................................................................. 91
7.5. La forma funcional: la linealidad por defecto........................... 94

8. E pílo go................................................................................................. 99

9. Preguntas y problem as..................................................................... 101

N o t a s .................................................................................................................... 113

G losario.......................................................................................................... 113

R eferencias................................................................................................... 119
Agradecimientos

En este libro se aúnan los dos yoes de un profesor universitario:


el investigador y el docente. Mi formación como investigador ha
tenido lugar fundamentalmente en el Centro de Estudios Avanza­
dos en Ciencias Sociales (CEACS) del Instituto Juan March de
Madrid. En la larga lista de profesores y estudiantes de los que he
aprendido (y sigo haciéndolo), me gustaría destacar a José Ra­
món Montero, director de mi tesis doctoral, primero; colega y
amigo, después. No me puedo olvidar de la suerte de que mis pri­
meros pasos como investigador fueran de la mano de Guillermo
Márquez en el Departamento de Ciencia Política y de la Admi­
nistración de la Universidad de Santiago de Compostela. Mi ex­
periencia docente la he acumulado en el Departamento de Cien­
cias Políticas y Sociales de la Universitat Pompeu Fabra de
Barcelona. Mariano Torcal y Francesc Pallarás han sido determi­
nantes en mi traslado a Barcelona. Amparo González, Ferran
Martínez y Rubén Ruiz leyeron versiones anteriores de este ma­
nuscrito e hicieron valiosos comentarios y sugerencias. Pero el
origen y destino de este ensayo son los estudiantes de Ciencia Po­
lítica de la Universitat Pompeu Fabra. Su curiosidad, interés y, so­
bre todo, exigencia han sido el estímulo necesario para escribir
estas páginas.
1. Presentación

«Pues si nos importa conocer perfectamente algu­


na relación entre objetos, con toda seguridad es la de
causa y efecto. En ella se fundamentan todos nues­
tros razonamientos acerca de cuestiones de hecho o
existencia. Sólo gracias a ella podemos alcanzar al­
guna seguridad sobre objetos alejados del testimonio
actual de la memoria y los sentidos. La única utili­
dad inmediata de todas las ciencias es enseñarnos
cómo controlar y regular acontecimientos futuros
por medio de sus causas. En todo momento, pues, se
desarrollan nuestros pensamientos e investigaciones
en torno a esta relación.»
David Hume (2003 [1748]: 111)

La tarea fundamental de las ciencias sociales es la explicación,


esto es, mostrar por qué suceden los acontecimientos, por qué
algo cambia a lo largo del tiempo o por qué estados o eventos co­
varían en el tiempo o el espacio. El argumento de este ensayo es
que una explicación adecuada de los fenómenos políticos y so­
ciales debe combinar necesariamente dos elementos: un efecto y
un mecanismo causal. En primer lugar, debe demostrarse la exis­
tencia de una correlación entre la variable dependiente (7 ) y al
menos una independiente (X ) en el sentido de que X incrementa
la probabilidad de que Y ocurra. Debe garantizarse, además, que
esta relación no sea espuria o el resultado de una tercera variable,
Z, que causa simultáneamente Y y X. En segundo lugar, debe es­
pecificarse un mecanismo que describa el proceso a través del
cual una variable influye en la otra o cómo Y es producida por X.
Aunque comprendamos un fenómeno gracias a una teoría, de
poco nos vale si no podemos decir algo sobre su frecuencia o
probabilidad; y, a la inversa, si no somos capaces de señalar

11
La lógica de La explicación en las ciencias codales
■íJiMHffiWíi

cómo tiene lugar la relación entre dos variables, observar su va­


riación conjunta no nos permite saber qué pasa.
El propósito de este ensayo es presentar y discutir la lógica de
una explicación en ciencias sociales. En primer lugar, detallo
cómo se deben diseñar las investigaciones para estimar correcta­
mente un efecto causal o, en otras palabras, para realizar una in­
ferencia causal válida. Esto es, de qué manera se deben usar los
datos para extraer conclusiones generales sobre la causalidad. En
segundo lugar, y de acuerdo con los debates actuales en la filoso­
fía de la ciencia, defiendo que existen dos razones que hacen que
las inferencias causales sean necesarias, pero no suficientes para
tener una explicación en ciencias sociales. Por un lado, dada la
incertidumbre que, por definición, acompaña a las inferencias,
siempre corremos el riesgo de que las relaciones aparentemente
causales que identificamos-entre nuestras variables sean en reali­
dad espurias. Por otro, debemos revelar cuál es la conexión expli­
cativa o causal entre las variables que da lugar a la causalidad,
esto es, cómo se producen las relaciones causales a través de la
acción e interacción de los individuos.
La provisión de un mecanismo causal en una investigación de­
pende de que la teoría que se maneja sea buena. Evidentemente,
se trata de un problema sustantivo, específico de cada pregunta
que se pretende responder, de modo que en un ensayo amplio so­
bre ciencias sociales como éste, sólo se puede reflexionar sobre
sus características e importancia genérica en una explicación. La
realización de inferencias causales, sin embargo, se basa en una
lógica común a todas las investigaciones con ambiciones empíri­
cas, al margen de cuál sea su pregunta o su estilo, cuantitativo o
cualitativo. La presentación de las reglas metodológicas que se
deben seguir y los aspectos que se deben evitar constituye el con­
tenido básico de estas páginas.
El principio fundamental de las investigaciones empíricas en
ciencias sociales es que los argumentos científicos no son opinio­
nes. Aun cuando las conclusiones a las que llega un científico so­
cial puedan coincidir a veces con las intuiciones de un observa­
dor ocasional, esto no significa que tengan la misma valía. Las
■erstac

opiniones no son correctas o incorrectas; las investigaciones


científicas, sí. La diferencia entre ambas no está en el objeto de
estudio, el mismo en los dos casos, sino en el método. Lo que
confiere a la ciencia política, por ejemplo, el rango de ciencia es
el uso de procedimientos de investigación contrastados y acepta­
dos. Sin este contenido metodológico, se queda simplemente en
política y se relega al ámbito de la opinión. Y a la comunidad
científica no le interesan en absoluto nuestras opiniones. Como
ya sabemos desde hace más de un siglo, «la unidad de todas las
ciencias se basa únicamente en su método, no en su materia»
(Pearson, 1892: 16).
Esta importancia decisiva del método no es exclusiva de una o
varias áreas determinadas de las ciencias sociales, sino que se ex­
tiende a todas aquellas que tienen una vocación empírica. Ya se
-estudie la implementación de politicas públicas, el comporta­
miento electoral o los procesos de transición a la democracia, la
lógica inferencia] debe respetar siempre ciertos principios. Para
que una investigación sea capaz de responder correctamente a al­
guna cuestión o hipótesis sobre el comportamiento de las perso­
nas y/o instituciones, es necesario que combine dos elementos:
una buena teoría que nos cuente qué pasa y qué hace o impide
que pase y un preciso diseño de investigación que nos permita
extraer conclusiones o inferencias válidas. Si alguno o ambos
elementos no son adecuados, los resultados de la investigación no
se podrán aceptar.
Sin embargo, pese a que el diseño de investigación es funda­
mental, de manera que pocos dudan ya que debe ser una priori­
dad en las ciencias sociales (King, Keohane y Verba, 2004: 181),
sus principios resultan desconocidos en muchos estudios Este
ensayo reflexiona precisamente sobre cómo se deben emplear los
hechos empíricos para realizar juicios científicos sobre las teorías
y generalizaciones que son el resultado de nuestra investigación.
Es decir, cómo se deben diseñar las investigaciones para que ge­
neren inferencias válidas sobre la vida social y política.
En términos más generales, la metodología consiste en reglas
para conocer el mundo y en técnicas para obtener información
(Sorensen, 1991: 516). Un diseño de investigación es un plan que
muestra, mediante el análisis de un modelo y de unos datos, de
qué manera esperamos utilizar nuestro material para extraer infe­
rencias (King, Keohane y Verba, 2000: 128).
Los diseños de investigación se dividen en experimentales y
no experimentales (Spector, 1981: 7-10). La diferencia entre ellos
tiene que ver con el grado de control que posee el investigador.
En el diseño experimental, los sujetos o unidades de análisis y las
condiciones o variable independiente clave que se estudian son
manipulados por el investigador. Es decir, el investigador hace
algo que afecta a los sujetos estudiados y determina así los efec­
tos de tales manipulaciones. Los diseños experimentales se basan
en la comparación del comportamiento o características de los
sujetos bajo las condiciones que se estudian. El punto clave es
que el investigador.asigna-los-^ujotos -a-la-s-Gondieianes-en-Jugar-
de observarlos en las situaciones que suceden de manera natural.
Por ejemplo, uno puede diseñar un estudio experimental para de­
terminar si las tutorías personalizadas (variable independiente)
aumentan el rendimiento escolar (variable dependiente). Se se­
lecciona aleatoriamente una muestra de estudiantes; la mitad se
asignan al grupo de tratamiento, y la otra mitad, al de no trata­
miento. El primer grupo recibe la educación regular y, además,
tutorías personales, mientras que el segundo sólo recibe la educa­
ción regular. Después de un tiempo, el progreso escolar de ambos
grupos se evalúa. Las posibles diferencias se atribuyen a las tuto­
rías, puesto que esta variable es la única diferencia entre los gru­
pos.
En los diseños no experimentales, el investigador carece de
esa capacidad de manipulación. Ya no se pueden asignar los suje­
tos que se estudian a las condiciones que interesan. En su lugar,
se hacen varias observaciones de los sujetos que de manera natu­
ral se clasifican en las condiciones. Para determinar si las tutorías
personalizadas aumentan el rendimiento escolar, el investigador
selecciona de nuevo una muestra de estudiantes. La mitad de los
estudiantes son elegidos porque han estado recibiendo las tuto­
rías, y la otra mitad, porque no las han estado recibiendo. Después
de un tiempo, se evalúa el progreso escolar de ambos grupos.
Para que las posibles diferencias se puedan atribuir a las tutorías,
el investigador debe reunir información adicional sobre los estu­
diantes para controlar que recibir las tutorías sea la única variable
distinta entre los grupos: es posible que aquellos estudiantes que
siguen las tutorías lo hagan precisamente debido a características
particulares (puede que sean más brillantes o más torpes que los
demás), de modo que las diferencias entre grupos tengan que ver
poco o nada con el tratamiento escolar especial. Es decir, ya exis­
tían antes de que entraran en juego las tutorías.
Finalmente, antes de desgranar la lógica inferencial de las
ciencias sociales, resulta crucial discutir dos cuestiones: la pre­
gunta de la investigación y la falsabilidad de las teorías. En pri­
mer lugar, si bien no existe una regla sobre cómo se debe elegir
un tema de estudio — la imaginación y los intereses personales
son decisivos— , sí se deben satisfacer dos condiciones. Por un
lado, debe tratarse de un asunto relevante tanto para la política o
la sociedad como para la ciencia política o la sociología. Por
ejemplo, estudiar el voto estratégico o útil en la elección del pre­
sidente de una comunidad de vecinos puede resultar interesante
desde un punto de vista teórico, pero carece de interés político.
Por el contrario, analizar la existencia de diferencias entre los dipu­
tados y las diputadas de un parlamento autonómico en España
acerca de sus preferencias sobre la participación política de las
mujeres puede merecer la pena políticamente, pero se antoja que
no tiene demasiado atractivo para la ciencia política2.
En segundo lugar, en ciencias eminentemente empíricas como
la ciencia política o la sociología, la verificación o falsación em­
pírica es fundamental: las teorías hay que formularlas de manera
que sea posible, si están equivocadas, desmentirlas fácilmente. Es
más, «el criterio del estatus científico de una teoría es su falsabi­
lidad o refutabilidad o comprobabilidad» (Popper, 1969: 37).
Para que una teoría sea falsable deben darse las condiciones en
las que sea posible demostrar que es falsa. Estas condiciones de­
ben ser especificadas antes de someterla a prueba, y mantenidas
si la prueba va en contra de la teoría. No deben esgrimirse razo­

15
nes especiales o particulares, interpretaciones ad hoc, para sal­
varla.
La consecuencia inmediata del falsacionismo popperiano es
que hay que elegir conceptos cuyas consecuencias observables
sean fáciles de definir. Así, conceptos como imaginario social o
cultura, útiles para formular teorías, son problemáticos para eva­
luarlas empíricamente dada su complicada medición y observa­
ción5.
El ensayo se organiza de la siguiente manera. Una vez presen­
tadas las líneas maestras, se discute la dicotomía descripción/ex-
plicación y se aclara el concepto de causa. En el apartado 3 se re­
flexiona sobre la importancia del azar en los fenómenos políticos
y sociales y se distingue entre los componentes sistemático y
aleatorio de las observaciones. Los problemas en la estimación
de electos causales y. en particular,-el-riesgo de las-rclaeiones-es-
purias se estudian inmediatamente después. En el apartado 5 se
plantean los supuestos necesarios para estimar efectos causales.
A continuación se presentan las distintas modalidades de explica­
ción en las ciencias sociales y se revisan los problemas más habi­
tuales en el diseño de una investigación: los errores de especifi­
cación en el modelo de explicación, el sesgo de selección, la
multicolinealidad, la endogeneidad y las formas funcionales inco­
rrectas. El libro concluye con un breve epílogo y una selección de
preguntas y problemas, acompañados de sus respuestas, sobre los
principales temas estudiados.
2. Descripción y explicación:
el concepto de causa

Las explicaciones causales no son posibles sin una buena des­


cripción de los fenómenos políticos y sociales que nos cuente
cómo están constituidos o cómo varían en el tiempo, el espacio o
entre grupos o entornos sociales y/o institucionales. Es difícil
plantear una explicación sin que sepamos antes algo sobre el
mundo y qué debe explicarse en función de qué características.
En los términos de Merton (1987: 1-6), se deben «establecer los
fenómenos» antes de avanzar una explicación, esto es, hay que
disponer de evidencia empírica que avale que estos fenómenos
existen en realidad y que tienen la regularidad necesaria para re­
querir y permitir una explicación. Dado el número prácticamente
infinito de hechos que se pueden observar, la descripción posibi­
lita, por un lado, inferir información sobre hechos no observados
a partir de los que sí se han contemplado, y, por otro, distinguir
entre lo que estos hechos tienen de sistemático o regular y de no
sistemático o aleatorio (King, Keohane y Verba, 2000: capítulo 2;
véase también Coleman, 1990; Goldthorpe, 2000). En definitiva,
las explicaciones deben empezar con el análisis de los efectos
—-los fenómenos— para los que se busca explicación, de modo que,
Í.ÓCKes de le explicacíSTí en las ciencias sociales

en palabras de Lieberson (1985: 213-219), los datos muestren


«qué está pasando» antes de explicar «por qué está pasando».
Por ejemplo, en su reciente investigación sobre la formación
de los sistem as de partidos nacionales, Chhibber y Kollman
(2004) dedican los primeros capítulos del libro a describir minu­
ciosamente la evolución del número de partidos en los niveles na­
cional y local o de distrito en Canadá, Estados Unidos, Gran Bre­
taña e India desde 1870, 1800, 1960 y 1870, respectivamente,
hasta la actualidad. Los cuatro países, todos ellos con sistemas
electorales de mayoría relativa en distritos uninominales, mues­
tran significativas fluctuaciones en el número de partidos a lo lar­
go del tiempo. Es decir, existe una pauta sistemática y general
que se desvía de la bien conocida tesis de que en estos sistemas
electorales sólo hay espacio para dos partidos, como se establece
en las leyes de Duvcrger (1 9 8 7 )J . A continuación Chhibber y
Kollman desarrollan una explicación de esta tendencia menos
centrípeta de lo esperado que se basa en las políticas y el papel
del gobierno nacional en relación con los subnacionales.
Sin embargo, las descripciones no van más allá de la observa­
ción de correlaciones; las circunstancias causales que provocan
los fenómenos políticos o sociales en cuestión están ausentes. En
otras palabras, mediante la descripción somos capaces de estable­
cer las regularidades sociales o políticas que constituyen el explá­
nemela o la/s variable/s dependiente/s de nuestro análisis y definir
así con precisión la pregunta de investigación que nos interesa.
Pero no podemos plantear las razones o causas de estas regulari­
dades o efectos.
En las ciencias sociales, la identificación de las causas es el
fundamento para entender los fenómenos y construir una ciencia
explicativa. Como señala Elster (2000: 35), la meta de la investi­
gación debe ser reemplazar por causas pasadas las huellas que
deja en el presente el funcionamiento de esas causas. Las atribu­
ciones causales se realizan precisamente para explicar aconteci­
mientos, para comprender por qué determinados eventos tienen
lugar (Marini y Singer, 1988: 347). Y es que la causalidad es el
principal medio que tenemos para ordenar y comprender el mun­
do. Si no sabemos quién está haciendo qué a quién, no podemos
entender el mundo en el que vivimos, no podemos hacer respon­
sables a las personas y a las instituciones de sus acciones y no
podemos actuar eficazmente (Gerring, 2001: 129). Para poner en
marcha una política pública dirigida a reducir las desigualdades
horizontales en el mercado laboral (esto es, trabajadores de pro­
ductividad equiparable que disfrutan de muy distintas oportuni­
dades laborales) en Europa, por ejemplo, necesitamos saber cuá­
les son sus niveles en cada país. Pero también qué las cansa: la
protección legal frente al despido y el contexto institucional en el
que se introducen los contratos temporales (Polavieja, 2005). E
incluso cuando esta comprensión causal no tenga consecuencias
sociales o políticas, entender los acontecimientos en términos de
relaciones de causa-efecto hace, como señala Pearl (2000: 345),
-que-los sintamos «bajo control». Para Hume (1992 [1738]), cu­
yas palabras sirven de apertura de este ensayo, la causalidad es
simplemente el cemento del universo.
Pese a que el significado de la causalidad se haya discutido
durante siglos, no existe ninguna definición universalmente acep­
tada. Sin duda, esta falta de acuerdo ha supuesto que la metodo­
logía de la investigación social haya estado más bien fragmentada
y que, en consecuencia, las tradiciones «cuantitativa» y «cualita­
tiva» hayan seguido lógicas inferenciales distintas hasta hace
bien poco. Si el libro de King, Keohane y Verba (2000) ha tenido
una acogida tan impresionante en la disciplina2, ha sido precisa­
mente porque se trata del primer gran intento de tender puentes
entre la ciencia política cuantitativa y cualitativa. Y esto no es
sino defender que la lógica de una buena investigación cualitativa
no difiere significativamente de la de una cuantitativa, y al revés.
El punto de encuentro de todas las caracterizaciones de la causa­
lidad es que las relaciones causales se componen al menos de dos
elementos: una causa, que también se suele denominar input, ele­
mento causal, variable independiente, variable exógena o simple­
mente X, y un efecto, que a su vez se conoce también como ontput,
resultado, variable dependiente, variable endógena o simplemente
Y. De este modo, y para que pueda encajar con concepciones deter-
ministas y probabilísticas, que luego veremos, con variables de to­
das las naturalezas o con cualquier tipo de causa compleja, pode­
mos manejar como definición mínima de la causalidad la que ofre­
ce Gerring (2001: 129 y 138; 2005: 169): las «causas» son factores
que incrementan las probabilidades (previas) de que suceda un
acontecimiento o, más formalmente, X puede ser considerado la
causa de Y si (y sólo si) eleva la probabilidad de que Y ocurra.
Aunque suponga tomar partido (provisionalmente) por una
concepción determinista (es decir, las causas son condiciones ne­
cesarias y/o suficientes de los efectos), para tratar la causalidad
como un concepto abstracto o teórico, independiente de los datos
que se utilizan para conocerla, y clarificar así los problemas de la
inferencia causal, en este ensayo se va a definir la causalidad o los
efectos causales en términos contrafácticos. En general, los con­
ceptos de causa se r,onstriiyen .snbre-la-4dea-xiexo.mparar lo que p,n
realidad ha sucedido, bajo ciertas condiciones, con lo que habría
podido suceder bajo otras condiciones particulares diferentes. Por
tanto, el efecto causal de cualquier acción se puede definir como
la diferencia entre el resultado real y el que habría tenido lugar de
acuerdo con la acción contrafáctica distinta. Con mayor precisión,
King, Keohane y Verba (2000: cap. 3) definen el efecto causal
como la diferencia en los valores de la variable dependiente cuan­
do la variable explicativa adopta dos valores distintos y todo lo de­
más sigue igual. En otras palabras, el efecto causal de X es la dife­
rencia en el resultado en Y que tendría lugar si pudiéramos
realizar un experimento perfecto en el que sólo X cambia3.
El quid de esta reproducción hipotética o experimento perfec­
to del que depende la estimación del efecto causal es que todas
las variables independientes deben permanecer constantes en los
dos momentos, a excepción de una: la variable causal principal,
también conocida como clave o de tratamiento. Cuando sucede
esto, el cambio en la variable dependiente en la condición contra­
fáctica en comparación con la real se puede atribuir totalmente a
la variable independiente clave. Esto es,

P A r l - Y h, (i)
2. Descripción y explicación: st concepto de causa

donde Xd es la variable independiente clave, /3, es su efecto cau­


sal, F es la variable dependiente en la situación real y, finalmen­
te, Yh es la variable dependiente en la situación hipotética.
Si, por el contrario, alguna otra variable independiente intervi-
niente o de control también cambia, no podemos saber qué parte
de la diferencia entre Y e Yh se puede atribuir a la variable inde­
pendiente clave y cuál a la de control. Esto es,

P\XCI+ M eo = Yr ~ Yh>de mC)d° 9Ue PlXd = (Yr ~ Yl) ~ M eo (2)

donde Xco es una variable de control y /3, su efecto causal. En fin,


la estimación del efecto causal no es posible cuando varía más de
una variable independiente. Este supuesto de que todas las varia­
bles independientes, excepto la clave, son constantes se conoce
-como «todo lo demás igual» o ceterisparibus.
Para explicar con claridad y de una manera más intuitiva esta
definición de causalidad, podemos utilizar la investigación cuan­
titativa de Criado (2002) sobre las estrategias de campaña de los
partidos en España. Este ejemplo será empleado en varias ocasio­
nes a lo largo del ensayo. Criado estudia el efecto causal de las
visitas a las circunscripciones del candidato del PP, José María
Aznar, sobre los resultados electorales de este partido en las elec­
ciones legislativas de 1996. La variable dependiente es el porcen­
taje de voto que consiguió el PP en cada una de las circunscrip­
ciones españolas. L a variable independiente clave es dicotómica:
Aznar dio al menos un mitin en una circunscripción durante la
campaña electoral o no dio ninguno. Para simplificar la ilustra­
ción, pensemos únicamente en la circunscripción de Madrid, en
la que Aznar sí dio mítines. El PP consiguió allí en 1996 el 49,42
por ciento de los votos a candidaturas: este porcentaje es el valor
de la variable dependiente. Para definir el efecto causal (teórico)
imaginemos que retrocedemos en el tiempo y nos encontramos
en Madrid justo antes de las elecciones. Todo sigue igual, a ex­
cepción de que ahora Aznar decide no dar ningún mitin en esta
circunscripción. El porcentaje de voto que conseguiría el PP en
esta situación hipotética sería Z. La diferencia entre los porcenta-
jes de voto del PP en la situación real, en la que Aznar sí dio míti­
nes, y la simulada, en la que no los dio, esto es, 49,42 - Z, es el
efecto causal de las visitas de Aznar sobre los resultados electo­
rales del PP en Madrid en las elecciones de 1996.
Pero también para la investigación cualitativa esta definición
contrafáctica de la causalidad resulta útil. En su análisis de la
emergencia de la clase social como una variable que explica el
comportamiento electoral en España, Torcal y Chhibber (1995)
demuestran que este hecho depende del cambio estratégico adop­
tado por las elites del PSOE y el PP; en particular, las políticas
económicas y fiscales seguidas por los gobiernos socialistas des­
de 1989 y las propias propuestas en los programas de los dos par­
tidos. Mientras que el PP defiende desde entonces un programa
neoliberal que presta especial atención a la reducción de la carga
fiscal y del consumo -público, el P SG E sitúa-en -un-primer-plaño­
las medidas redistributivas. Con anterioridad, no existían diferen­
cias demasiado significativas en este sentido y, además, no se en­
contraban en el centro del debate político. Imaginemos que vol­
vemos a la competición electoral entre socialistas y populares
existente en España antes de 1989. Supongamos que todo sigue
igual, con la única excepción de que ni las políticas económicas y
fiscales de los gobiernos del PSOE ni los programas de los dos
partidos mayoritarios sufren cambio alguno. Es decir, sus progra­
mas económicos continúan siendo más o menos similares y ape­
nas cuentan en la competición electoral. El efecto causal de las
estrategias de los partidos sería la diferencia entre la importancia
de la clase social en el comportamiento electoral en el escenario
real y en el simulado.
Si bien más adelante me detendré en esta cuestión, debe ad­
vertirse que esta definición contrafáctica de la causalidad no sig­
nifica que la inferencia causal sea fundamentalmente cuantitativa
o basada en los principios del análisis de regresión. Esto es, guia­
da por los objetivos de la investigación cuantitativa, deudora de
los procedimientos cuantitativos y evaluada desde la perspectiva
cuantitativa. En una de las referencias obligadas sobre los análisis
contrafácticos, Fearon (1991: 176, énfasis en el original) sostiene
! ' -

precisamente que el respaldo de una hipótesis causal en la estra­


tegia contrafáctica procede de argumentos sobre lo que podría
haber pasado. Estos argumentos son más creíbles (1) si se invo­
can principios generales, teorías, leyes o regularidades distintas
de la hipótesis que se contrasta; y (2) si se basan en el conoci­
miento de hechos históricos relevantes para un examen contrafác-
tico4.
No obstante, en esta definición contrafáctica de la causalidad
no se contempla la posibilidad de que las diferencias, o al menos
una parte, en la variable dependiente entre la situación real y la
hipotética sean simplemente una consecuencia del azar. Como
nos recuerdan King, Keohane y Verba (2000: 66), la política
siempre conlleva un cierto margen para lo aleatorio o lo imprede­
cible, al igual que el conjunto de la vida social y toda investíga­
la oñTíéñ tífica.
Retomando el ejemplo anterior acerca de la influencia de los
mítines de Aznar sobre los resultados electorales del PP en Ma­
drid en las elecciones de 1996, supongamos que las elecciones se
repiten semanalmente durante varios meses. Aunque la estrategia
de campaña del PP y las variables que estructuran la competición
electoral, como la ideología o la valoración de la situación políti­
ca y económica, por ejemplo, no cambien, cada repetición sema­
nal no registraría el mismo número de votos para cada partido
como consecuencia de ciertas características no sistemáticas o
aleatorias: mal tiempo durante un mitin o el día de las elecciones,
algunos votantes podrían irse de vacaciones, o un discurso de un
candidato podría ser inesperadamente desafortunado. Es decir, la
variable dependiente en una investigación está siempre influida
por variables aleatorias que no podemos controlar porque tienen
una variabilidad impredecible.
De este modo, la definición de causalidad o efecto causal
debe limitarse a los cambios sistemáticos o regulares de la varia­
ble dependiente. El efecto causal puede definirse, pues, como la
diferencia entre el componente sistemático de las observaciones
que se hacen cuando la variable independiente clave tiene un va­
lor y el componente sistemático de las observaciones compara­
Ls !.íí£fk:s de La explicación en las ciencias sociales

bles cuando la variable independiente clave tiene otro valor


(King, Keohane y Verba, 2000: 93).
Esta distinción entre los componentes sistemáticos y no siste­
máticos o aleatorios implica que un investigador no debe esperar­
la existencia de relaciones empíricas exactas entre las variables
en las ciencias sociales. En los análisis estadísticos, que pueden
servir como modelo en este caso, se reconoce explícitamente esta
inexactitud a través de la inclusión de un término de azar o error
en la ecuación y que se conoce como perturbación aleatoria.
Supongamos que queremos explicar los distintos niveles de
los salarios mensuales de los españoles y que la única variable in­
dependiente relevante son los años de estudio 5. Nuestra hipótesis
es que, lógicamente, cuanto mayor sea la inversión en capital hu­
mano que realiza una persona, más elevado será su salario. El
modelo es el siguiente:.............. ..

Y, = 0, + + Ah (3)

Y., el valor de la variable dependiente, el salario mensual, para


el individuo i, tiene dos componentes: (1) el sistemático o no ale­
atorio, j8, + f3nXp donde X es la variable independiente, los años
de estudio, y y /3, son los parámetros de la ecuación: j3, es la
constante o el salario mensual de un individuo que no ha estudia­
do ningún año, mientras que jS2 es la pendiente o la influencia de
cada año de estudio en el salario mensual. En ambos casos, los
signos esperados son positivos. Por un lado, todos los trabajos,
aunque no exijan ningún capital humano, tienen una contrapres­
tación económica y, por otro, cuanto más capital humano acumu­
la una persona, mayor es el salario que debería esperar. Y (2) la
perturbación aleatoria, ¡jl..
L a figura 1 representa la combinación de estos dos compo­
nentes para determinar Y, el salario mensual. X p X2, X3 y X4 son
cuatro hipotéticos valores del número de años de estudio. Si la
relación entre las dos variables fuera perfecta, los valores obser­
vados de Y estarían representados por los puntos Qv Qv Q3 y Q4
que aparecen sobre la línea. Sin embargo, la perturbación aleato-
'escripcton y icaoon; el concepto :at!s«

y . P4

Y = ^ + /3 2X
< q4
,p\-
ir""'" q3
” q2 •
Qi • P3
Pz
+ ^32X i

X, x2 x3 x4 X

fuente : Elaboración propia.

Figura 1. Componentes sistemático y aleatorio en los efectos causales.

ría provoca que los valores verdaderos de Y, P v Pv P 3 y P4, sean


diferentes. En el gráfico, el azar tiene una influencia positiva en
la primera y cuarta observaciones (es decir, estos dos individuos
tienen un sueldo mensual superior al que deberían disfrutar de
acuerdo con sus años de estudio), mientras que tiene una influen­
cia negativa en las observaciones 2 y 3 (es decir, estos dos indivi­
duos tienen un sueldo mensual inferior al que deberían disfrutar
de acuerdo con sus años de estudio).
¿Por qué las personas con los mismos años de estudio no tie­
nen la misma remuneración o, en otras palabras, los puntos no
están en la misma línea? La razón es que algunos individuos tie­
nen más suerte que otros en encontrar mejores trabajos o, si ocu­
pan el mismo puesto en dos empresas similares, algunos tienen
más suerte que otros con sus condiciones laborales y, en particu­
lar, la contraprestación económica que reciben.
Por supuesto, y como veremos más adelante, en la práctica
sólo podemos observar los puntos P. /3p (32 y ¡x. no se conocen.
Precisamente lo que hacemos cuando tratamos de explicar un fe­
¡..8 lógica de ¡,- aiíptkatíéa en las dendasjsc-daies

nómeno es ajustar una línea de acuerdo con nuestra teoría sustan­


tiva lo más cerca posible de la verdadera e inobservable, en este
caso la representada por los puntos Qx a QA. Cuanto más se pa­
rezca la recta que ajustamos a la verdadera, mejor es nuestra ex­
plicación.
Todo esto implica que, aunque en nuestro modelo de explica­
ción se manejen todas las variables independientes relevantes (en
este caso suponemos que el salario es una función exclusivamen­
te de los años de estudio), establezcamos adecuadamente la ma­
nera en que la variable independiente influye en la dependiente y
no hayamos cometido ningún error en la medición de las varia­
bles, nunca seremos capaces de explicar perfectamente la va­
riable dependiente de nuestra investigación: el azar o la suerte
importa y, por definición, no se puede controlar. Todos los fenó­
menos políticos y sociales d e ^ e n d e n ^
toriedad.
De nuevo, un ejemplo cualitativo, como el que plantea Munck
(2004: 118-119), puede ilustrar con más claridad la importancia
de separar los elementos sistemáticos de los aleatorios. En su es­
tudio sobre la construcción de los estados modernos, Ertman
(1997) sostiene que el régimen político del que se dotaron depen­
dió de (a) el tipo de gobierno local durante el primer período de
construcción del estado, (b) el momento del incremento en la
competición geopolítica y (c) la influencia de las asambleas re­
presentativas sobre las infraestructuras administrativas y finan­
cieras. Las experiencias en Europa encajan en este modelo, con
la excepción de Dinamarca. En este país, la competición geopolí­
tica comenzó relativamente tarde y el gobierno local al principio
del período de construcción del estado fue generalmente partici-
pativo, lo que debería haber llevado a Dinam arca a tener un
«constitucionalismo patrimonial». Sin embargo, desarrolló un
«absolutism o burocrático» pese a que contaba con las marcas
tempranas del estado constitucionalista patrimonial. A través de
un estudio detallado, Ertman muestra que Dinamarca se desvió
de este camino para desarrollar el absolutismo burocrático como
consecuencia de la entrada de los caballeros alemanes y la consi-
Descripción y explicación: el. concepto de causa

guíente importación de sus instituciones de gobierno local. La in­


fluencia alemana sería un factor aleatorio al margen del modelo
de explicación basado en los componentes sistemáticos identifi­
cados por Ertman. Su inclusión como una variable de control
permitiría que la experiencia danesa se pudiera integrar en el mo­
delo de explicación.
Si bien la distinción entre los componentes sistemáticos y alea­
torios parece poco intuitiva y difícil de conseguir en la práctica,
es fundamental para la explicación. El componente sistemático
del fenómeno que estudiamos es lo que somos capaces de expli­
car con nuestro modelo causal; el componente aleatorio (o error)
es, por el contrario, lo que no somos capaces de explicar. La in­
vestigación en ciencia política puede verse como el intento de
maximizar el componente sistemático y minimizar el aleatorio.
Cuando un investigador se plantea por primera vez una pregunta,
las observaciones que maneja aparecen exclusivamente como el
resultado de elementos aleatorios: no conoce ninguna variable in­
dependiente que sistemáticamente tenga un efecto en la depen­
diente. Su explicación mejorará a medida que sea capaz de redu­
cir el espacio que ocupa lo aleatorio. En otras palabras, cuanta
menor sea la variación de la variable dependiente que se le esca­
pa de acuerdo con su modelo causal, mejor será su explicación.
Pero no debemos olvidarnos de dos cuestiones centrales en la
investigación social. En primer lugar, la explicación de la varian-
za de Y debe combinarse con el principio de la parsimonia, esto
es, el uso de pocas variables explicativas en una teoría o explica­
ción. Una de las máximas a seguir en una investigación es expli­
car la máxima varianza con el menor número posible de varia­
bles. Como nos recuerda Achen (2002), una especificación
(estadística) que maneje muchas variables, más de tres para
Achen, no resulta útil para la inferencia: no se puede realizar un
análisis cuidadoso de los datos que asegure que el modelo sea
apropiado y que los presupuestos que tiene detrás funcionen
como el investigador desea. Por ejemplo, uno de los principales
atractivos del celebrado estudio de Boix (1999) sobre la selección
de los sistemas electorales en Europa es la parsimonia de su ar­
gumento. La adopción de la representación proporcional frente a
la mayoría absoluta o relativa es una función de la interacción en­
tre la fuerza de los nuevos partidos y la capacidad de los viejos
(especialmente los que están en el poder) para coordinarse y blo­
quear el crecimiento de los primeros.
En segundo lugar, hay que tener cuidado con el criterio de la
explicación de la varianza de Y como medida del éxito de una in­
vestigación. No sólo no es capaz de medir el poder causal de las
variables (y los argumentos teóricos que las avalan), sino que
tampoco es comparable entre muestras distintas (Achen, 1982:
58-61).

28
3. El azar en los fenómenos
políticos y sociales

De acuerdo con la discusión anterior sobre los componentes de


los fenómenos sociales, cuya síntesis se presenta en la ecuación
(3), la variable dependiente, 7, depende en última instancia de la
perturbación aleatoria o término de error, ¡x. Sólo si ¡x es un com­
ponente completamente aleatorio, de modo que no afecta de una
manera regular o sistemática a 7 y a la/s variable/s independien-
te/s, X, se puede estimar con precisión el efecto causal que X tie­
ne sobre 7. Cuando fx pierde esta condición de aleatoriedad, y
tiene una influencia sistemática, bien positiva, bien negativa, so­
bre 7 o X, ya no se puede inferir que el efecto causal de X sea la
diferencia en los valores de 7 cuando X adopta dos valores distin­
tos. ¿Cuándo deja de ser ¡x simplemente azar? Pues en la mayoría
de las ocasiones cuando un investigador se olvida de incorporar
en su modelo sustantivo una variable independiente relevante: su
efecto se traslada al término de azar que, por tanto, ya no es alea­
torio
Para explicar esta idea supongamos que 7, los resultados elec­
torales del PP en las circunscripciones en las elecciones de 1996,
es una función de una única variable independiente, X, la visita

29
, l l II ■>" ' V' '

del candidato José María Aznar a una circunscripción durante la


campaña. A diferencia de las ecuaciones anteriores, para simpli­
ficar el análisis, en este caso se ha omitido el término constante.
Si nos centramos solamente en Madrid, la variable dependien­
te tiene dos posibles valores:

Yr = ^ X + ix r, (4)

donde X = 1, es decir, cuando Aznar visita una circunscripción


(los subíndices r identifican la situación real del análisis contra-
fáctico); y

(5)

donde A = 0, es decir, cuando Aznar rio \dsita lá“ circüjiscripüfóñ'


(los subíndices h identifican la situación hipotética del análisis con-
trafáctico). Puesto que (3¡ * 0 = 0, los resultados electorales del PP
en la situación hipotética son iguales a la perturbación aleatoria, o

Yh = Vh (5a)

Si calculamos la diferencia entre (4) y (5a),

Yr= Yk = lS p + iL -tL » (6)

resulta que el efecto causal de la variable independiente pasa a


ser la diferencia entre los valores de Y una vez que se descuenta
el azar, o

PlX ^ ( Y - Y t) - i i + ^ (7)

Finalmente, si las perturbaciones aleatorias no afectan a Y ni a


X, el efecto causal es simplemente la diferencia entre los resulta­
dos electorales del PP en los dos momentos:

(8)
^ „ _t

Para que efectivamente el azar no tenga ninguna influencia en


Y, ya sea directa o indirectamente a través de X, deben satisfacer­
se dos supuestos. En primer lugar, el valor medio de las perturba­
ciones ¡x debe ser igual a cero o £(/x.) = 0. Este supuesto puede
ilustrarse gráficamente con ayuda de la figura 1. Puede observar­
se que los valores de Y para cada valor de X están distribuidos al­
rededor de la línea que definen los puntos Qv Qr (E y 0 4- algu­
nos de los valores verdaderos de Y, representados por los puntos
P, están por encima de la línea de la relación exacta, y otros están
por debajo. Estas diferencias son causadas por la perturbación
aleatoria.
Lo que el primer supuesto dice es que las variables que no es­
tán incluidas en el modelo de explicación y que, por tanto, apare-,
cen en ¡x no afectan sistemáticamente a Y; es decir, los valores
------positivos de ¡x se cancelan por los negativos, de tal manera que su
efecto promedio sobre Y es cero. En otras palabras, la perturba­
ción aleatoria no tiene una tendencia definida, de modo que no es
sistemática.
En segundo lugar, la variable independiente no está correla­
cionada con las perturbaciones o E(¡x.X.) = 0. Cuando se expresa
la relación entre las variables en una ecuación, como en (3), se
supone que X y (x (que representa, como ya sabemos, la influen­
cia de todas las variables independientes omitidas) tienen una in­
fluencia separada sobre Y. Pero si X y ¡x están correlacionadas,
no es posible determinar sus efectos individuales sobre Y. Si la
correlación es positiva, X aumenta cuando fx aumenta, y disminu­
ye cuando /x disminuye. Y al revés si la correlación es negativa.
En definitiva, es difícil, si no imposible, asegurar cuál es la in­
fluencia de X sobre Y.
En el ejemplo que estamos manejando, supongamos que los
resultados del PP en las circunscripciones no sólo dependen de
sus estrategias de campaña, sino también de cuántos individuos
se declaran de centro-derecha. Puesto que esta segunda variable
independiente no se ha integrado en el modelo, su influencia se
recoge en ¡x. Si la variable de la visita de Aznar a la circunscrip­
ción está correlacionada con la ideología de los votantes de dicha
La lógica de la explicación en las riendas sociales

circunscripción, y esta última se ha excluido de la ecuación, en­


tonces el efecto de la variable de la visita de Aznar sobre los re­
sultados electorales del PP está mal estim ado2. Si las dos varia­
bles tienen una correlación positiva, este efecto causal de la
variable de la visita de Aznar se sobreestimará o se sesgará posi­
tivamente, puesto que está recogiendo parte de la influencia que
la ideologia tiene sobre la variable dependiente. Si la correlación
es negativa, este efecto causal se infraestimará o se sesgará nega­
tivamente. Por supuesto, cuanto mayor sea la correlación, mayor
será el sesgo en la atribución causal.
Dada esta importancia crucial de la perturbación aleatoria en
la estimación de efectos causales, el diseño de la investigación
debe garantizar que se cumplen estos dos supuestos. Si no es así,
la inferencia causal no será válida.
4. Relaciones causales
versus relaciones espurias

En la definición contrafáctica de los efectos causales que se ha


formulado, la causalidad se establece comparando lo que habría
sucedido en Y en una unidad determinada cuando ha estado ex­
puesta a X con lo que habría sucedido si no hubiera estado expues­
ta a X. Como es obvio, el efecto causal formulado en estos térmi­
nos es teórico, puesto que en la realidad no es posible observar la
ocurrencia y la no ocurrencia de X para una unidad y momento
determinados. En consecuencia, si bien la causalidad es un ele­
mento esencial en el razonamiento científico, los intentos de for­
malizarla están basados en constructos mentales que, por defini­
ción, no tienen equivalentes objetivamente definidos en el mundo
en el que vivimos (Arjas, 2001: 59-60).
Por ejemplo, no se pueden conocer con certeza los resultados
electorales del PP en las elecciones generales de 1996 en Madrid
cuando Aznar dio un mitin (la situación real) y cuando no lo dio
(la situación hipotética o contrafáctica). Los valores de la variable
independiente son mutuamente excluyentes: si se observa uno, no
se puede observar el otro. Esto es, Madrid no puede recibir y no
recibir la visita de Aznar durante la campaña electoral de 1996.
ica de ft explfcadén m tai dencias sociaf.es

Esta imposibilidad de que una unidad de Y esté simultánea­


mente expuesta y no expuesta a X es lo que Holland (1986) deno­
mina el problema fundamental de la inferencia causal. Si bien
son necesarias dos observaciones de un determinado caso para
estimar un efecto causal, los investigadores sólo disponen de una
en el mundo real. En definitiva, la atribución de causalidad de­
pende de una comparación con algo que no ha ocurrido. Como
nos recuerdan King, Keohane y Verba al respecto (2000: 90), al
margen de lo perfecto que sea el diseño de la investigación, de la
cantidad de datos que recojamos, de lo perspicaces que sean los
observadores, de lo diligentes que sean los ayudantes y del grado
de control experimental que tengamos, nunca conocemos con ab­
soluta certeza la inferencia causal. Con estas limitaciones de par­
tida, la cuestión central del diseño de investigación es plantear
cómo se pueden realizar estas eomparaeione^Eipotéticas-airavi:s_
del análisis de los casos observados en el mundo real.
Ya sabemos que no podemos volver a poner en marcha la his­
toria en el mismo momento y lugar, dando diferentes valores a
nuestra variable independiente clave en cada ocasión, como exi­
giría la verdadera solución al problema fundamental de la infe­
rencia causal. Por tanto, la causalidad no se puede determinar di­
rectamente, sino que hay que conocerla a partir de los datos
observados y de ciertos supuestos que veremos en detalle más
adelante.
Para solucionar este problema inferencial, el investigador debe
coger las unidades involucradas y comparar la respuesta media de
las unidades expuestas a la variable independiente clave con la
respuesta media de las unidades de control que no están expues­
tas a la variable independiente clave: la diferencia entre las uni­
dades activas y pasivas se considera el efecto causal medio. Por
ejemplo, comparar los resultados electorales medios que consi­
guió el PP en las elecciones generales en 1996 en las circunscrip­
ciones visitadas por Aznar con los alcanzados en las circunscrip­
ciones no visitadas por Aznar.
Pero estos dos universos paralelos que se establecen con los
datos observados, a diferencia de lo que sucedía bajo la condi-
. ' << ■ . . ,

ción contrafáctica, ya no son sólo distintos en la variable inde­


pendiente clave. Hay otras variables que también cambian simul­
táneamente, de modo que no podemos conocer si efectivamente
la diferencia en la variable dependiente entre los dos universos
paralelos se puede atribuir a la diferencia en la variable indepen­
diente clave. La dificultad de establecer causalidad entre X e Y
cuando se utilizan los datos observados, reales, es que tenemos
que comparar unidades que ya no son sólo distintas en la variable
independiente clave, sino también en las de control. Es decir, el
supuesto de «todo lo demás igual», salvo X, en el que se basaba
la concepción contrafáctica de la causalidad, desaparece. Esto su­
pone que ya no podemos estar seguros de que la diferencia en Y
en dos unidades distintas sea una consecuencia del cambio en la
variable independiente clave. También es posible que sea una fun­
ción de otras variables independientes que no son iguales entre las
dos unidades y que necesariamente hay que tener en cuenta.
Si volvemos a nuestro ejemplo e imaginamos que Madrid ha
recibido la visita de Aznar, pero no así Tarragona, la diferencia
entre los resultados del PP entre ambas circunscripciones no sólo
se puede atribuir a esta variable. Es obvio que, al margen de sus
decisiones durante la campaña, el PP siempre consigue mejores
resultados en Madrid que en Tarragona debido, entre otros ele­
mentos, a la distinta importancia del nacionalismo catalán en las
dos circunscripciones.
Para poder realizar una inferencia causal acertada es necesario
que todas las variables independientes intervinientes, excepto la
clave, estén controladas, esto es, mantengan constante su valor;
sólo así se puede comprobar si existe una covariación sistemática
entre la variable dependiente y la variable independiente clave.
Dos ejemplos, uno cualitativo y otro cuantitativo, nos pueden
ayudar a entender mejor la cuestión. En primer lugar, en un re­
ciente artículo, Fernández (2002) plantea que la adopción de po­
líticas de igualdad de oportunidades educativas es una función de
las preferencias de los gobiernos, la variable de control, y, sobre
todo, de los costes electorales asociados a estas políticas educati­
vas, la variable independiente clave. Para estimar el efecto causal
< J . í- '

de la variable independiente clave, Fernández controla la influen­


cia de la otra variable independiente interviniente a través de la
selección de dos países en los años ochenta y primeros noventa,
España y Francia, que tenían gobiernos socialdemócratas. Es de­
cir, puesto que la variable de las preferencias de los gobiernos se
mantiene constante, las diferencias en las políticas educativas de
los dos países tienen que venir explicadas por las diferencias en
los costes electorales asociados, altos en España y bajos en Fran­
cia. Si existe covariación entre estas dos variables, se infiere la
existencia de causalidad; si no la hay, se infiere que no existe
causalidad.
En segundo lugar, supongamos que los resultados electorales
del PP en las circunscripciones españolas en las elecciones legis-
1ativas de 19% no sólo dependen de la visita de Aznar durante la
campaña, la variable independiente clave, sino también de que
una circunscripción haya recibido o no fondos de cohesión
europeos en la legislatura anterior, la variable independiente de
control. La hipótesis en este segundo caso es que en las circuns­
cripciones que han recibido fondos, el PP cosechará peores resul­
tados que en las demás, puesto que los votantes recompensarán al
gobierno, socialista, que consiguió estos fondos. Para estimar el
efecto causal de la variable independiente clave, es necesario
controlar la influencia de la otra variable independiente intervi­
niente. Para ello, se deben comparar, por un lado, los resultados
electorales medios del PP en las circunscripciones que no reciben
fondos europeos y que son visitadas por Aznar durante la campa­
ña con los resultados electorales medios del PP en las circuns­
cripciones que no reciben fondos europeos y que no son visitadas
por Aznar durante la campaña. Y, por otro, los resultados electo­
rales medios del PP en las circunscripciones que reciben fondos
europeos y que son visitadas por Aznar durante la campaña con
los resultados electorales medios del PP en las circunscripciones
que reciben fondos europeos y que no son visitadas por Aznar
durante la campaña. L a diferencia en los resultados electorales
del PP en ambos universos cuando la variable independiente cla­
ve varía es el efecto causal de la visita de Aznar.
4 tvBlBOOr :aúsales versi

El problema clásico de las inferencias causales a partir de los


datos observados es precisamente que la dependencia entre dos
variables puede ser explicada tanto porque una variable es la cau­
sa de la otra como debido a la existencia de una causa común de
ambas variables. Este obstáculo se suele denominar el problema
de las relaciones espurias o de los confundidores. El término
«espurio» se refiere a las relaciones en las que dos o más varia­
bles están estadísticamente unidas (es decir, correlacionadas)
pero no lo están causalmente: esta relación estadística aparece
porque una tercera variable causa las demás. Y el término de los
confundidores se refiere a causas comunes, normalmente no me­
didas, que podrían explicar la correlación observada. Como seña­
lan Kiser y Hechter (1991: 7), la eliminación de las relaciones es-
purias es el problema.fundamenta] para la justificación de la
inferencia causal.
Este problema encuentra una clara y parsimoniosa formula­
ción en Elster (2000: 46-47).

Generalmente con esto último [la explicación espuria] nos referimos a la co­
rrelación entre dos variables que no se origina en una relación causal entre
ellas, sino en su relación común con una tercera [...] El problema de confun­
dir correlación y causación es un problema constante en este modo de expli­
cación estadística y la razón por la que hay que cuidarse de interpretar corre­
laciones como más que indicaciones de que «algo está pasando» que vale la
pena ser observado más en detalle. O quizás el punto debería expresarse ne­
gativamente, que la función del análisis de correlación es que nos permite
descartar una hipótesis causal si la correlación es baja.

Por supuesto, esta discusión sobre la inferencia causal nos lleva a


la bien conocida proposición de que mientras que la correlación
o, más generalmente, la asociación no implica causalidad, la cau­
salidad sí implica algún tipo de asociación. El quid de la cuestión
es cómo garantizar que el grado de asociación que se observa en­
tre las variables X e Y suponga efectivamente que X causa Y,
como se establece en la ecuación (9). Es posible que la probabili­
dad de que tenga lugar Y, dado X, es mayor que la probabilidad
úégicB cíe La ea M ca a sv er Las ciencias seríales

de que tenga lugar, dado no-A, pero esto no es suficiente para de­
mostrar que X es la causa de 7. Por ejemplo, podría pasar que una
tercera variable, Z, sea la causa tanto de X como de Y, de modo
que, si se tiene en cuenta Z, la asociación entre X e Y desaparece
o se debilita, como se apunta en la ecuación (10). Es decir, la su­
puesta conexión entre X e Y es espuria, ya sea total o parcialmente.

X -4 Y (9)
X<-Z-*Y (10)

En general, (1) cuanto mayor sea la correlación entre la varia­


ble independiente omitida, Z, y la incluida, X, y, al mismo tiem­
po, (2) más importante sea el efecto de Z sobre Y, más espuria
será la relación .entre X e .}/. .La-.xazón...es.jque..mQL_un lado, si no se _
tiene en cuenta Z, X asume parte de la influencia de Z en Y, tanto \
más cuanto mayor sea la correlación entre X y Z. Si la correla­
ción entre X y Z es igual a 0, no hay problemas de relaciones es­
purias, puesto que X no asume ninguna parte de la influencia de
Z en Y. Por otro, dado (1), cuanto mayor sea la correlación entre
Z e 7, mayor será la influencia sobre Y que se le atribuye a X. De
este modo, la relación más espuria entre X y Z tendría lugar cuan­
do la correlación entre Z y X y entre Z e 7 es muy alta; por el
contrario, no existiría ningún efecto espurio de X sobre 7, si no
hay ninguna correlación entre Z y X o entre Z e 7.
L a intuición detrás de esta exigencia de que en todos los estu­
dios empíricos con ambiciones causales las potenciales variables
confundidoras deben ser controladas es que una acción tendrá un
efecto causal sobre una respuesta si la respuesta cambia cuando
lo hace la acción y bajo las circunstancias en las que todo lo de­
más que es relevante para el resultado permanece igual.
Veamos algunos ejemplos de relaciones aparentemente causa­
les, que parecen ajustarse por tanto a la ecuación (9), pero que en
realidad son total o parcialmente espurias, es decir, responden al
modelo que define la ecuación (10).
En primer lugar, de acuerdo con el ejemplo propuesto por Els-
ter (2000: 47), cuando hay una alta correlación negativa entre X

I
4. Relaciones; causales versus relBdímss espurlss:

(el porcentaje de miembros de un grupo que están casados) e Y


(la cantidad promedio de caramelos consumidos mensualmente
por cada miembro), podemos sospechar que esto se debe a que
son efectos de una causa común Z: la edad promedio de los
miembros del grupo. Su correlación con X e y es muy elevada.
Por tanto, si Z se mantiene constante, es decir, controlada, la co­
rrelación entre X e Y desaparece y podemos concluir que la
correlación no era legitima.
En segundo lugar, entre los mejores jugadores de tenis del
mundo apenas hay negros. Uno podría estar tentado de concluir
que existe una relación entre la raza y las capacidades para el te­
nis, quizás a causa de cierta superioridad genética de los blancos
para este deporte. Sin embargo, parece evidente que esta correla­
ción es espuria, puesto que está causada por una tercera variable:
-eUbienestar material de las personas y de los países. Sólo aque­
llos individuos que tienen asegurada la satisfacción de sus necesi­
dades básicas y disponen de las instalaciones y de los preparado­
res para desarrollar su potencial innato se pueden convertir en
jugadores profesionales. Y estas dos condiciones sólo se cumplen
para los individuos de rentas medias o elevadas que viven en los
países occidentales, es decir, fundamentalmente para los blancos.
Si pasamos ahora a los ejemplos de relaciones parcialmente
espurias, podemos recurrir a dos investigaciones en ciencia polí­
tica y sociología. Por un lado, las desigualdades de género en la
participación política en España son importantes. Se podría pen­
sar que el hecho de ser hombre o mujer causa que se participe en
mayor o menor medida en política. Pero Morales (1999) demues­
tra que esta relación se debilita mucho, aunque no desaparece,
cuando se tienen en cuenta los recursos socioeconómicos, la po­
sición social, las predisposiciones políticas y las actitudes de los
individuos.
Por otro lado, cuando se observan las diferencias salariales en­
tre sexos, resulta que las mujeres ganan, en promedio, alrededor
de un 30 por ciento menos que los hombres. Por tanto, se podría
concluir que esta diferencia es una consecuencia de la discrimi­
nación sexual. No obstante, Lago (2002) muestra que 12 puntos
, ./ f . 5! "

porcentuales de esta distancia salarial se explican de acuerdo con


las distintas características de hombres y mujeres — nivel de estu­
dios, antigüedad en el trabajo o el número de días de baja— , de
modo que la discriminación real sólo está detrás de los 18 puntos
porcentuales restantes.
En definitiva, para realizar inferencias causales todas las posi­
bles causas espurias de Y deben ser descartadas. Puesto que no
hay oportunidad de manipular todos los factores causales con da­
tos no experimentales, cuando se realizan inferencias causales
sobre los fenómenos sociales a partir de los datos observados
siempre se corre el riesgo de que no sean fiables.
5. ¿Cómo se pueden estimar
los efectos causales?

Siguiendo a King, Keohane y Verba (2000: cap. 3), para realizar


una inferencia causal válida a partir de los datos reales, que ase­
gure que la relación observada entre X q Y no sea total o parcial­
mente espuria, es necesario que se satisfagan dos supuestos ca­
racterísticos de los diseños experimentales: la homogeneidad de
las unidades u homogeneidad causal — es decir, si dos unidades
tienen el mismo valor en la variable independiente clave, el valor
esperado de la variable dependiente será el m ism o = -y IsAnde-.......-
pendencia condicional — es decir, las observaciones que se eli­
gen y los valores que se adjudican a las variables explicativas son
independientes de los valores de la variable dependiente 1. Cuan­
do no se cumpla alguno o ninguno de los dos supuestos, la infe­
rencia causal tendrá graves problemas y no será aceptable.

A. La homogeneidad de las unidades


u homogeneidad causal

Dos unidades son homogéneas cuando resultan iguales en todas


las variables independientes, incluida la clave (esto es, tienen los
, í ' V V '

m ism os valores en todas las variables independientes), y son he­


terogéneas cuando son distintas en alguna variable independiente,
ya sea la clave o alguna de control (esto es, tienen valores dife­
rentes en alguna de las variables independientes). Por tanto, el
supuesto de la homogeneidad causal establece que todas las uni­
dades de análisis que tengan el mismo valor en la variable inde­
pendiente clave tendrán también el mismo valor esperado en la
dependiente, puesto que todo lo demás entre ellas es igual. Es de­
cir, si a todos los casos se les asignaran de una manera contrafác-
tica los mismos valores de la variable independiente clave, todos
tendrían los mismos valores esperados en la variable dependien­
te. Por ejemplo, supongamos que queremos estudiar cómo influ­
ye la visita de Aznar a una circunscripción durante la campaña en
los resultados del PP en las elecciones generales de 1996. Si en
Madrid, que efectivamente ha sido visitada por Aznar, el PP cóiv
sigue el 49,42 por ciento de los votos, por ejemplo, en otra cir­
cunscripción que también haya recibido la visita de Aznar el PP
obtendrá el mismo porcentaje: el 49,42 por ciento. Detrás de este
supuesto está la idea de que los valores de la variable dependien­
te para todos los casos incluidos están producidos por el mismo
modelo causal: después de controlar los valores de las variables
independientes incluidas, cada caso debe tener el mismo valor es­
perado en la variable dependiente2.
En la investigación empírica, y debido a la importancia del
azar, entre otros elementos, se emplea una versión más débil de
este supuesto, más plausible e igualmente aceptable, basada en el
efecto causal constante: una variación similar de los valores de la
variable independiente clave en dos observaciones produce el
mismo efecto causal en unidades diferentes, aunque puede que
los valores de las variables no sean los mismos. En otras pala­
bras, un incremento dado en la variable explicativa produce, bajo
la condición de «todo lo demás igual» o la homogeneidad de las
unidades, una magnitud fija de cambio en la variable dependien­
te. En el ejemplo anterior, la mejora en los resultados electorales
del PP es igual en todas las circunscripciones que hayan sido vi­
sitadas por Aznar, aunque sus niveles sean distintos. Esto es, en
Madrid pasa del 45,00 por ciento de los votos al 49,42, en Ponte­
vedra, del 40,00 por ciento al 44,42, y en Córdoba, del 29,50 por
ciento al 33,92, por ejemplo: el efecto de saltar de una categoría a
otra de la variable independiente clave, la visita de Aznar, supone
siempre que el PP obtenga 4,42 puntos porcentuales más.
Cuando se satisface este supuesto podemos usar los valores
observados de la variable dependiente, en este caso los resultados
electorales del PP, para extraer una inferencia sobre el efecto cau­
sal de la variable independiente clave, la visita de Aznar.
De nuevo, es imprescindible que se satisfaga la cláusula de
«todo lo demás igual» o ceteris paribus. Si hay alguna variable
independiente de control que varía, no se va a cumplir que una
variación similar de los valores de la variable independiente clave
produzca el mismo efecto causal en unidades diferentes. Esta va-
riable que no se controla no tiene que ser igual entre las unida­
des, y de hecho no suele serlo, de modo que en la práctica los va­
lores de la variable dependiente no están producidos por el
mismo modelo causal en todos los casos. Como el efecto sobre Y
de esta variable omitida pasa a contenerse en p, la perturbación
aleatoria pierde su condición de aleatoriedad para tener una in­
fluencia sistemática, bien positiva, bien negativa, y variable sobre
Y entre las unidades. En definitiva, el efecto causal de X sobre Y
ya no es constante, sino que también depende de p. Y p nunca
está, por definición, bajo control.
Si el supuesto de la homogeneidad de las unidades u homoge­
neidad causal no se cumple, y un investigador analiza los datos
como si efectivamente fuera satisfecho, la inferencia sería una
media engañosa que agrupa diferencias entre subgrupos de ca­
sos: esta media no representaría adecuadamente la pauta de cau­
salidad en algún caso determinado. En los términos que hemos
visto, nos encontramos con una relación espuria. Cuando se
afronta un problema como éste, los investigadores deben dividir
la muestra de casos o realizar inferencias dentro de cada subcon­
junto causal o desarrollar un modelo causal más complejo que in­
corpore las diferencias entre estos subconjuntos. El hecho de que
la homogeneidad causal pueda ser garantizada cuando no se sa­
La lógica de la explicación en las ciencias sacíales

tisface a través de estas dos posibilidades significa, como nos re­


cuerdan Collier, Seawright y Munck (2004: 30), que no es sim­
plemente una propiedad de los datos, sino de los datos en rela­
ción con un modelo causal particular.
Las consecuencias de la violación de este supuesto para la es­
timación de efectos causales pueden observarse con los siguien­
tes ejemplos cuantitativo y cualitativo. En primer lugar, uno de
los hallazgos más robustos de la literatura sobre sistemas electo­
rales es que la fragmentación de un sistema de partidos es una
función del número de escaños en juego. Sin embargo, mientras
que en algunos países, como los Estados Unidos, el sistema elec­
toral de mayoría relativa en distritos uninominales ha dado lugar
en la actualidad a un sistema bipartidista, en otros ha producido
sistemas multipartidistas, como en Canadá. Puesto que el supues­
to de la homogeneidad causal no se satisface — una variación de
0, es decir, ninguna variación en el sistema electoral (X) da lugar
a diferencias significativas en el número de partidos (Y )— , si un
investigador analiza los datos como si se cumpliera, su inferencia
sobre el efecto del sistema electoral sobre el sistema de partidos
sería errónea. Al calcular el efecto causal medio, esto es, hallar la
media de los dos casos, no encontraría ninguna relación entre las
dos variables.
En este ejemplo, es evidente que el modelo causal es incom­
pleto, puesto que se está omitiendo una variable tan importante
como la estructura de cleavages. En Canadá, y sobre todo en
Quebec, existen más divisiones sociales políticamente activas
que en los Estados Unidos que acentúan la fragmentación del sis­
tema de partidos, aun cuando el sistema electoral es el mismo.
En segundo lugar, Collier, Seawright y Munck (2004: 30)
ofrecen un ejemplo de la política comparada. En algunos contex­
tos nacionales los trabajadores mejor pagados tienen una mayor
conciencia de clase, mientras que en otros muestran un menor ni­
vel (Przeworski y Teune, 1970: 26). Si se estima un efecto causal
medio sobre estos dos contextos, no se encontraría ninguna rela­
ción significativa entre las dos variables. Resultaría necesario que
el investigador buscara la homogeneidad a través de reconocer

44
8
K«SSB* íSSSS¡
1110 $6 py 00.611 0S11 y13f U)S 6t0€t.C>$ CmlSdX&S

procesos causales distintos entre los grupos de países, pero simi­


lares dentro de ellos. Es decir, en su modelo sustantivo de expli­
cación falta una variable relevante.
Para evaluar el cumplimiento del presupuesto de la homoge­
neidad causal, las investigaciones cuantitativas y cualitativas si­
guen estrategias distintas. Las primeras, y en particular la técnica
estadística más popular, el análisis de regresión, comprueba el
supuesto y, en general, las características de la perturbación alea­
toria a través del análisis de los residuos de las estimaciones esta­
dísticas. En el análisis de regresión, los residuos son la diferencia
entre los valores observados de Y. y los valores predichos de Y
con el modelo teórico propuesto, Y.. Cuando se observan patrones
definidos o sistemáticos en los residuos, la inferencia presenta
problemas3.
___ LasJiTyestigaciones cualitativas, por su parte, tienen otros pro­
cedimientos para evaluar la homogeneidad causal en relación con
un conjunto de casos y un modelo explicativo particular. Cuatro
merecen una atención especial debido a su amplia utilización
(Munck, 2004: 107-111). En primer lugar, el conocimiento pro­
fundo del contexto cultural, histórico y político para aclarar si el
proceso causal identificado en la hipótesis tiene la misma forma
y significado en los distintos casos. En segundo lugar, considerar
los diversos factores que podrían producir heterogeneidad y con­
ceptuarlos como variables adicionales que deben incluirse en el
análisis. Las aproximaciones en este sentido, como el path analy-
sis (Pierson, 2000), por ejemplo, identifican variables que sitúan
a países (u otros casos) en diferentes caminos o trayectorias de
cambio y entrañan procesos causales dispares. Su análisis con­
junto explicaría la existencia de heterogeneidad causal. En tercer
lugar, aplicar diferentes formas de análisis dentro de cada caso
(within-case analysis) para examinar evidencia detenida sobre los
procesos causales que han producido el resultado que nos intere­
sa. Por ejemplo,-si estudiamos los procesos de toma de decisio­
nes, los investigadores cualitativos deben analizar los registros de
conversaciones y reflexión durante el proceso de decisión. Final­
mente, hacer tipologías que ayuden a delimitar el dominio de los

45
casos. Por ejemplo, la tipología de regímenes políticos de Linz
(1975) permite identificar universos de casos en los cuales los
procesos causales funcionan más o menos igual.

B. La independencia condicional

Dada la necesidad de realizar comparaciones reales en lugar de


contrafácticas o hipotéticas, la calidad de la inferencia causal de­
pende de cómo se asignen los casos al grupo de tratamiento o ex­
puesto a la variable independiente clave y al de control o no
expuesto a la variable independiente clave4. El supuesto de la in­
dependencia condicional de asignación y resultado establece que
las observaciones que se eligen y los valores que se adjudican a
las variables explicativas (Xs) soiiindencndiente^ de los de la va-
riable explicada (Y).
En negativo, el supuesto se vulnera si las variables explicati­
vas se eligen en función de reglas que se correlacionan con la va­
riable dependiente — sesgo de selección— o si la variable depen­
diente produce las explicativas — endogeneidad. En positivo,
para que se cumpla el supuesto, las observaciones deben ser asig­
nadas a los grupos de tratamiento y de control de tal manera que,
antes de que se expongan al tratamiento o a la variable indepen­
diente clave, la media esperada de la variable dependiente sea
igual en los dos grupos. Cuando sucede esto último, un investiga­
dor está en condiciones de realizar una inferencia sobre el efecto
causal del tratamiento (X) a través de la comparación de la media
de Y entre las observaciones que han recibido el tratamiento y las
que no lo han recibido. La lógica de este supuesto es que, si se
satisface la independencia condicional, cualquier diferencia entre
el grupo de tratamiento y el de control es una consecuencia de la
variable independiente clave, puesto que todos los demás factores
relevantes están equilibrados entre los dos grupos. Si, por el con­
trario, las observaciones se asignan de modo que las que se en­
cuentran en el grupo de tratamiento tienden a tener una media de
Y distinta de las observaciones del grupo de control, la inferencia
I, l ‘í . K J

causal estará sesgada. Por ejemplo, si las observaciones con un


valor más alto de la variable dependiente tienen una mayor pro­
babilidad de estar en el grupo de tratamiento que las que tienen
un valor más bajo, el investigador sobreestimará el efecto causal
de X. A 1a. inversa, si las observaciones con un valor más bajo de
Y tienen una mayor probabilidad de estar en el grupo de trata­
miento, se infraestimará el efecto causal de A' (Collier, Seawright
y Múñele, 2004: 32-33).
Aunque más adelante se discutirá en detalle cómo debe tener
lugar (y cómo no) la selección de observaciones, algunos ejem­
plos pueden ayudarnos a entender la importancia del supuesto.
En primer lugar, cuando se eligen las observaciones o los valores
de las variables independientes teniendo en cuenta los de la de­
pendiente, se predetermina el resultado de la investigación. Por
Tilaiipló; supóngani().s que queremos conocer cuáles son las opi­
niones de los madrileños sobre el matrimonio entre personas del
mismo sexo. Para obtener la información, preguntamos a los in­
dividuos que salen de misa en la catedral de la Almudena. Como
es evidente, se está vulnerando el supuesto de la independencia
condicional. L os valores de la variable dependiente, las opinio­
nes, se están eligiendo en función de una regla o variable omitida
que está correlacionada con ella, ser católico practicante: las per­
sonas religiosas son más conservadoras en este tema que las que
no lo son y, por tanto, valoran peor el matrimonio entre personas
del mismo sexo. Por tanto, la inferencia descriptiva está sesgada,
puesto que la opinión media esperada de las personas religiosas
(y seleccionadas) es peor que la de las que no lo son (y no selec­
cionadas). En otras palabras, las personas u observaciones esco­
gidas no representan bien la población a la que pertenecen. La
conclusión incorrecta a que llegaremos es que la gran mayoría de
los madrileños están en contra del matrimonio entre homosexua­
les.
Y otro tanto sucede si seleccionamos las observaciones de
acuerdo con los valores de la variable dependiente. En el ejemplo
anterior, la inferencia sobre las opiniones de los madrileños res­
pecto al matrimonio homosexual tampoco sería correcta si sola-
La lát

mente preguntáramos a los que sabemos que tienen opiniones po­


sitivas sobre él, como los propios homosexuales. Todas las perso­
nas seleccionadas lo valorarían bien, sea cual fuera su edad, pero
no representarían adecuadamente al conjunto de los madrileños.
La independencia condiciona] se satisface automáticamente
cuando la selección de las observaciones es aleatoria, puesto que
un criterio aleatorio no se correlaciona, por definición, con las
posibles variables independientes y dependientes. En el ejemplo
anterior, cuando se realiza una encuesta en el domicilio de los
madrileños y todos tienen la misma oportunidad o probabilidad
de ser entrevistados, se asegura el cumplimiento del supuesto.
Las inferencias que hagamos a partir de las observaciones selec­
cionadas serán válidas, siempre y cuando se cumpla también la
homogeneidad causal.
No obstante, en muchas ()casióñes éifláuiwestigacíbrí en“cien---
cia política hay que abandonar la aleatoriedad debido a que el nú­
mero de observaciones que se pueden emplear es pequeño. El nú­
mero de países que han pasado de regímenes autoritarios a
democráticos a través de transiciones pactadas, por ejemplo, es
limitado. En general, como señalan King, Keohane y Verba
(2000: 134), las posibilidades de que un criterio de selección de
las variables se correlacione con alguna variable independiente o
dependiente aumentan a medida que se reduce el número de ob­
servaciones.
Pero también cuando el número de observaciones es grande, es
posible que se viole el supuesto de la independencia condicional.
Supongamos que realizamos una encuesta postelectoral telefóni­
ca sobre las elecciones legislativas en un país poco desarrollado.
Evidentemente, sólo los individuos que tienen una línea de telé­
fono a su nombre pueden ser entrevistados. Como resulta que es­
tos individuos son los que disponen de las rentas más elevadas, el
criterio de selección de las observaciones se correlaciona con una
variable independiente. En efecto, la renta es una variable que in­
fluye positivamente en la probabilidad de votar (Anduiza, 1999),
de modo que en la práctica se seleccionan individuos que tienen
una probabilidad de haber votado más alta que la media del país.
5. ¿Cómo se pueden estimar ios efectos causales?

En segundo lugar, el supuesto de la independencia condicio­


nal también se vulnera en las situaciones de endogeneidad, esto
es, cuando la variable dependiente produce las independientes.
La endogeneidad aparece cuando los valores de nuestras varia­
bles explicativas provienen de nuestra variable dependiente en
lugar de al revés. Es decir, no se sabe con seguridad cuál es la
causa y cuál el efecto y, así, la dirección de la causalidad no
está en absoluto clara. Por ejemplo, supongamos que la hipóte­
sis de un investigador es que estudiar la licenciatura de ciencia
política (Ar) provoca un mayor interés por la política (Y) que
estudiar matemáticas (X). Aunque seguramente esta relación
existe, no se puede obviar que los estudiantes que deciden cur­
sar ciencia política en lugar de matemáticas (Y) lo hacen por­
que tienen un mayor interés por la política {X). Es decir, las di­
ferencias* én elIn te? éS' p'ór la política, o al menos una parte, que
se observan entre los estudiantes una vez que cursan la carrera
ya existían antes de que la comenzaran. Por tanto, no se puede
inferir el efecto causal de la carrera a través de la comparación
directa de los niveles de interés por la política de los indi­
viduos.
L a causa de la endogeneidad está en la correlación de una va­
riable independiente con la perturbación aleatoria en el modelo
causal que evaluamos. Como ya sabemos, esta correlación supo­
ne que la perturbación aleatoria o, más bien, las variables inde­
pendientes que no están incluidas en el modelo causal, y cuyo
efecto pasa a ¡jl, influyen sistemáticamente en el valor de la me­
dia de Y. Es decir, la perturbación aleatoria pasa a ser sistemática.
La variable independiente que está efectivamente en el modelo
causal y se correlaciona con ¡jl o, si se prefiere, con alguna varia­
ble independiente relevante que no se ha tenido en cuenta está re­
cogiendo parte del efecto sobre Y de este factor omitido. En defi­
nitiva, el efecto causal de la variable independiente que aparece
en el modelo causal es incorrecto, puesto que está aumentado o
reducido artificialmente, según corresponda. Evidentemente, las
inferencias causales que se realizan cuando existe un problema
de endogeneidad no son válidas.
Desde una perspectiva formal, la naturaleza de la endogenei-
dad se observa en el siguiente ejemplo. Supongamos que estamos
investigando los determinantes de la inflación de los precios y los
salarios en un país. De acuerdo con un modelo simple establece­
mos que p, la tasa anual de crecimiento de los precios, está rela­
cionada con w, la tasa anual de crecimiento de los salarios. Nues­
tra hipótesis es que los aumentos en w provocan que suba p. Es
decir,

P = 0 , + P 2w + P p 01)

Al mismo tiempo, w está relacionada con p y U, el nivel de


desempleo. Nuestra hipótesis es que cuanto mayor sea el nivel
de desempleo, menos capaces serán los trabajadores de deman­
dar incrementos en los salarios 'cüáñiJb suben los preciosrBsr
decir,

w = a ] + a 2p + a 3U + p w (12)

Como ya sabemos, p, y ¡xw son el componente aleatorio en


cada uno de los modelos. De acuerdo con los dos modelos causa­
les, existe una relación circular: w determina p en la ecuación
(11) y p determina vr en (12). Si sustituimos w en la ecuación
(11) por su modelo en (12), tenemos que:

P = Pi + P 2( a i + «2 P + a 3U + ¿ O + P’p (13)

y, por tanto,

P\ + a \P2 + af í 2U + P'p + ^2 P'w (14)


1 - a 2/32

Si realizamos las operaciones análogas en (12), resulta que

w = a, + a 2(/3, + P 2w + P p) + ol3U + p,w (15)


y, por tanto,

+ a 2/3¡ + a 3U + Oí2f i + ¡xw

Si estimamos 1a. ecuación (11) ignorando el hecho de que w


determina p, la inferencia causal no será correcta. En pocas pala­
bras, puesto que la perturbación aleatoria p influye en p, cuando
p influye a su vez en w, es una causa indirecta de w y, en conse­
cuencia, w y p están correlacionados. De este modo, p no es in­
dependiente de w y, por tanto, el efecto causal de w está «conta­
minado».
Las investigaciones que sufren problemas de endogeneidad no
son extrañas en ciencia política. Por ejemplo, en La ética protes-
4ante y el espíritu del capitalismo, Max Weber sostiene que las
enseñanzas y doctrinas protestantes provocaron el espíritu capita­
lista. Sin embargo, Laitin (1986: 187) plantea que se puede dar la
vuelta a la línea de causalidad: los europeos a los que ya les inte­
resaba romper los límites del espíritu precapitalista bien podrían
haberse apartado de la iglesia católica para alcanzar este propósito.
A su vez, en su discusión de los debates fundamentales sobre
los que se ha articulado la investigación sobre los sistemas elec­
torales, Montero y Lago (2005) señalan que se han estudiado du­
rante décadas como variable dependiente, esto es, como suminis­
tradores de los incentivos, positivos o negativos, para la creación
y permanencia de los partidos políticos. No obstante, si los siste­
mas electorales son tan importantes para explicar cómo se desa­
rrollan los sistemas de partidos, resulta ingenuo pensar que las
elites políticas que deben decidir sobre qué sistema electoral se
adopta no tengan en cuenta sus intereses y preferencias. Dicho de
otra forma, las configuraciones previas de los sistemas de parti­
dos deben contar en los diseños institucionales que realizan los
partidos5.
6. ¿Qué significa «explicar»
en ciencias sociales?

Del mismo modo que no existe una definición de causalidad uni­


versalmente aceptada, tampoco hay un acuerdo general sobre
cómo debe ser o qué debe contener una explicación en ciencias
sociales. Solamente se acepta que las explicaciones dan cuenta de
por qué suceden los acontecimientos, por qué algo cambia a lo
largo del tiempo o por qué estados o acontecimientos covarían en
el tiempo o el espacio.
Ya sabemos que el diseño de investigación o, más ampliamen­
te, la metodología nos aclara cómo plantear las preguntas y llevar
a cabo nuestro estudio para extraer inferencias causales (y descrip­
tivas) válidas. Es decir, nos permite establecer relaciones causales
robustas entre los fenómenos políticos y sociales que estudiamos.
Pero ¿es la causalidad suficiente para tener una explicación en
ciencias sociales? Aunque se pretenda desligar la lógica inferen-
cial de la filosofía de la ciencia, como intentan King, Keohane y
Verba (2000: 13), por ejemplo, se trata de una cuestión central
dadas sus consecuencias cruciales sobre las herramientas meto­
dológicas que se pueden emplear y sobre el propio papel que de­
sempeña la teoría sustantiva en la explicación. No en vano se en-

53
Le CS. Qé te c a m ó n e n l a s d e l e c t e s s a c i a t e c

{i
cuentra en la raíz de la discusión sobre la capacidad de explica­
ción de los estudios cualitativos frente a los cuantitativos'.
En términos generales, en las ciencias sociales existen en la
actualidad al menos tres grandes concepciones o tradiciones so­
bre cómo debe ser una explicación: la puramente estadística, la
de las leyes de cobertura y la basada en los mecanismos causa­
les 2 (Elster, 2000; Goldthorpe, 2001; Hedstróm, 2005: cap. 2;
Hedstrdm y Swedberg, 1998; Little, 1991). Como tendremos oca­
sión de comprobar a continuación, las diferencias entre ellas tie­
nen que ver fundamentalmente con la estrategia analítica que de­
fienden para garantizar que las relaciones aparentemente causales
no sean en realidad espurias. O, en otras palabras, para satisfacer
con la mayor seguridad posible los supuestos de la homogeneidad
de las unidades u homogeneidad causal y la independencia con­
dicional. ___ __ _______________________________

6.1. La explicación estadística

En la explicación estadística, la causalidad se establece a través


de la eliminación de los efectos de las variables confundidoras: si
la relación entre dos variables persiste cuando se controlan (esto
es, cuando se mantienen constantes sus valores) las demás varia­
bles independientes intervinientes, entonces la relación se inter­
preta como un «efecto causal». Así, X es una causa genuina de Y
en la medida en que la dependencia sea robusta. En palabras de
Lazarsfeld (1955: 124-125), uno de los mejores exponentes de la
explicación estadística, «si tenemos una relación entre X e Y que .
no desaparece cuando se tiene en cuenta cualquier otro factor an­
tecedente, entonces la relación original puede llamarse causal».
De acuerdo con Hedstróm (2005: cap. 2), la característica de-
finitoria de la explicación estadística es que una explicación ade­
cuada identifica variables que influyen, bien positiva, bien nega­
tivamente, en la probabilidad de que suceda el acontecimiento
que se intenta explicar. La identificación de estas variables se
basa en la descomposición de los casos u observaciones en dife­

rí 4
, 1 ’ I ' . f,

rentes categorías. Supongamos, retomando un ejemplo anterior,


que deseamos conocer si los resultados electorales del PP en las
circunscripciones en las elecciones generales de 1996 dependen
de la visita de José María Aznar durante al campaña electoral, la
variable independiente clave. Pero sabemos que hay otras varia­
bles independientes que importan; en particular, que una circuns­
cripción haya recibido o no fondos de cohesión europeos. En pri­
mer lugar, dividimos las circunscripciones en dos grupos (por un
lado, las circunscripciones que hayan recibido fondos europeos y
hayan sido visitadas por Aznar, y las circunscripciones que hayan
recibido fondos europeos y no hayan sido visitadas por Aznar;
por otro, las circunscripciones que no hayan recibido fondos eu­
ropeos y hayan sido visitadas por Aznar, y las circunscripciones
que no hayan recibido fondos europeos y no hayan sido visitadas
por Aznar). Si no se observan diferencias en la media de los re­
sultados electorales del PP, nuestra variable dependiente, en cada
uno de los grupos, concluimos que la visita de Aznar a una cir­
cunscripción no importa en los resultados de su partido una vez
que se controla que una circunscripción haya recibido o no fon­
dos europeos. Es decir, la relación que existía entre la visita de
Aznar y los resultados electorales del PP es espuria. Por el con­
trario, si se siguen observando diferencias en los resultados del
PP (esto es, en las circunscripciones que han sido visitadas por
Aznar en cada uno de los grupos señalados los resultados del PP
son mejores que en las que no han sido visitadas), y no se mane­
jan más variables de control, podemos concluir que hay un efecto
causal de X en Y. Por supuesto, esta lógica de descomposición ya
la conocíamos: es la que se aplica en todas las investigaciones,
cualitativas o cuantitativas, para estimar un efecto causal3.
En general, esta variante estadística de la explicación se basa
en la idea de que el comportamiento de los individuos se puede
explicar de acuerdo con «determinantes» individuales y contex­
túales; el propósito del análisis debe ser estimar la influencia cau­
sal de las variables que representan estos determinantes. Así, el
explanandum es la variable dependiente, y el explanans consiste
en una serie de variables independientes: los efectos de estas va-
La lógica de La explicación en las ciencias sociales

riables independientes sobre la dependiente se sugieren y se con­


trastan empíricamente. El explanandum se «explica» en la medi­
da en que sea posible «explicar» la variación de la variable de­
pendiente. El supuesto básico de esta explicación es que las
características de los individuos y del contexto componen un
campo de «fuerzas» en las que el individuo tiene una posición
como variable dependiente. La tarea de las ciencias sociales debe
ser la de determinar la dirección e intensidad de este campo de
fuerzas (Esser, 1996: 159).
Por tanto, la estrategia de la investigación pasa por (1) estable­
cer una serie de relaciones funcionales bivariadas entre una varia­
ble dependiente y varias independientes, basadas en la intuición o
en expectativas formadas de acuerdo con la investigación previa;
(2) demostrar regularidades cuantitativas en un conjunto de ob­
servaciones, y (3) concluir que se dispone de una explicacióITLsá-
tisfactoria de la variación en la variable dependiente porque se
tiene la capacidad de dar cuenta de tal covariación (McKeown,
2004: 151). Si la causalidad se entiende de esta manera, la expli­
cación de los fenómenos políticos y sociales es una cuestión de
inferencia estadística en la que no intervienen otras consideracio­
nes: simplemente se desprende de regularidades empíricas.
Esta idea de que las técnicas estadísticas per se son capaces de
desarrollar explicaciones causales ha recibido numerosas y, en mi
opinión, convincentes críticas. En particular, estas técnicas sólo
pueden mostrar la existencia de relaciones entre las variables,
pero no cómo se producen a través de la acción e interacción de
los individuos. En otras palabras, la conexión explicativa o causal
entre las variables está ausente. Puesto que no hay ninguna justi­
ficación teórica de los efectos de los factores que se manejan, la
probabilidad de una derivación teórica de la relación entre las va­
riables es difícil. Esto plantea inmediatamente el problema de de­
cidir cuáles son las variables independientes que se deben tener
en cuenta (Boudon, 1976; Coleman, 1986; Esser, 1996; Goldt-
horpe, 2001; Hedstrom y Swedberg, 1998; Sorensen, 1998). Y es
que las regularidades estadísticas son difícilmente interpretables
en términos causales. Como nos recuerda Stinchcombe (1968:
«explicar» en rías sociales?7
saawsssssK

13), «un estudiante que tenga dificultades para pensar en al me­


nos tres posibles explicaciones para una correlación en la que
está realmente interesado debería escoger probablemente otra
profesión».
Para explicar las debilidades de esta concepción estadística de
la explicación, podemos retomar el ejemplo que ofrecen
Hedstróm y Swedberg (1996a: 135-136; 1998: 10-11). Tanto en
la ciencia política como en la sociología, la clase social es una
variable que se suele manejar para explicar comportamientos in­
dividuales como el voto o la salud. Sin embargo, la clase no pue­
de influir en el voto o la salud porque no es un agente causal,
sino un constructo analítico, una agregación de categorías ocupa-
cionales. Por tanto, una asociación estadística entre clase y voto,
por ejemplo, nos dice que los individuos de ciertas «clases» tie-
-«©n-u-na- mayor o menor probabilidad de votar a los partidos so-
cialdemócratas, pero no nos cuenta por qué. Para responder a esta
cuestión es necesario mostrar de qué manera se han producido las
diferencias medias en el comportamiento electoral entre los gru­
pos ocupacionales que los investigadores han asignado a diferen­
tes clases.
Si volvemos al ejemplo de las elecciones generales de 1996,
cuando descubrimos que la visita de Aznar a una circunscripción
durante la campaña supone un mejor resultado electoral del PP,
este hallazgo nos lleva inmediatamente a preguntarnos por qué.
¿Se produce, por ejemplo, a causa de que mejora la opinión sobre
Aznar, a causa de que la visita supone un esfuerzo de moviliza­
ción del partido o a causa de la mayor información sobre el PP
que consiguen los votantes a través de los medios de comunica­
ción? No lo podemos saber.
En último término, Glymour et al. (1987: 7) presentan un
ejemplo contundente de los problemas de las explicaciones pura­
mente estadísticas. En la investigación basada en esta concepción
de la explicación, el rendimiento de los modelos se compara con
uno nulo o compuesto exclusivamente por elementos aleatorios y
que defiende la inexistencia de una relación significativa entre
las variables. Lógicamente, se escoge el que mejor funciona. Su-
pongamos que tenemos un sistema con seis variables y que hay
cuatro posibles relaciones entre cada par de variables X e Y: X
afecta a Y, pero no al revés; Y afecta a X, pero no al revés; ambas
se afectan mutuamente, y ninguna tiene influencia sobre la otra.
Dado que las seis variables crean 15 posibles pares de variables,
se pueden identificar 415 relaciones distintas, de modo que hay
415 modelos a contrastar para identificar el que mejor encaja con
los datos. Cuando se muestra que uno de estos modelos funciona
mejor que el modelo nulo, esto no ayuda demasiado a resolver la
cuestión de si se trata del mejor de todos los posibles. Aceptar
«significativamente mejor que la hipótesis nula» como criterio
para una explicación exitosa lleva a una regla perversa para dar
por finalizada y como satisfactoria la investigación: busca en el
universo de especificaciones plausibles a partir de las restriccio­
nes teóricas que existan hasta~que-enGuentr-es-una-que-consiga_ije^
sultados m ejor que la nula, y entonces publícalos. Si en este
ejemplo existen 415 especificaciones entre las que escoger, no
sería una sorpresa descubrir que los modelos publicados sean in­
feriores en términos de su ajuste a los que no han sido descubier­
tos hasta ahora. En fin, el hecho de que un modelo pueda ser
identificado en términos estadísticos no garantiza que sea el me­
jor informe de los procesos causales que tienen lugar.
De nuevo, los clásicos nos ofrecen la pista a seguir. En sus re­
flexiones sobre metodología, Weber señalaba que «la frecuencia
estadística de un comportamiento en modo alguno vuelve a éste
más “ comprensible” ni provisto de sentido, así como la “compren­
sibilidad” óptima nada dice como tal en favor de la frecuencia,
sino que, antes al contrario, las más de las veces una racionalidad
con relación a fines subjetiva, absoluta, implica lo contrario». Por
tanto, «las interpretaciones “provistas de sentido” de una conduc­
ta concreta no son para ella [la sociología], naturalmente, como
tales, aun si presentan la máxima evidencia, otra cosa que meras
hipótesis respecto a la imputación [causal]. Necesitan, por lo tan­
to, de una verificación que empleará llegado el caso los mismos
medios que cualquier otra hipótesis». Es decir, «los datos estadís­
ticos [...] quedan para nosotros “ explicados” sólo cuando reciben
también una efectiva interpretación provista de sentido en el caso
concreto» (Weber, 1973: 185-186).
En definitiva, y como señala Brady (2004: 58), la literatura
sobre estadística es excepcional en definir la causalidad sin dis­
cutir la explicación. Seguramente porque la inferencia descansa
sobre el diseño de investigación y los datos, y no sobre la sustan­
cia de la investigación. De esta manera, no se conoce qué es una
buena explicación más allá de qué es una buena inferencia cau­
sal. La conclusión no puede ser otra que los análisis estadísticos
son cruciales para contrastar empíricamente la validez de nues­
tras explicaciones o para establecer el explanando, pero no pue­
den ser la explicación en sí misma. En palabras de Achen (1982:
7-8), «los métodos estadísticos son simplemente herramientas, y
uno no puede usar bien una herramienta sin un claro propósito en
la mente. De esto se sigue que para hacer un buen análisis de los
datos hay que tomar una posición sobre la naturaleza de la expli­
cación científica en las ciencias sociales».

6.2. La explicación basada en las leyes de cobertura

En las explicaciones basadas en las leyes de cobertura o, con ma­


yor generalidad, en el positivismo se defiende la existencia de
proposiciones generales del tipo «si - entonces», esto es, leyes.
Los resultados se relacionan con elementos antecedentes en una
situación determinada y se establece a continuación que una ob­
servación dada es un ejemplo de un acontecimiento o situación
especificada o cubierta por las leyes generales. La lógica de la ex­
plicación es la siguiente: tenemos un acontecimiento que preten­
demos explicar y nos preguntamos cuáles son las causas de que
haya pasado. Para tener una respuesta adecuada, hay que subsumir
el acontecimiento bajo una ley general. Esto es, explicamos el
acontecimiento apuntando una o varias leyes generales y las con­
diciones que hacen aplicables estas leyes al caso específico.
Dicho de otro manera, un acontecimiento sólo puede conside­
rarse explicado cuando se ha formulado de acuerdo con silogis-
m/jm.

mos que satisfacen tres condiciones: (i) como premisas principa­


les, leyes de cobertura eficaces causalmente; (ii) como premisas
secundarias, condiciones antecedentes abstractas que prevalecen
en determinados momentos y lugares; (iii) las conclusiones se si­
guen como el inexorable o al menos probable resultado de las su­
puestas leyes que operan en los antecedentes especificados (Te-
tlock y Lebow, 2001: 629). Por tanto, la explicación científica de
un acontecimiento consiste en:

1. un conjunto de afirmaciones sobre la ocurrencia de ciertos acontecimien­


tos Cj ... C, en ciertos momentos y lugares;
2. un conjunto de hipótesis universales, tal que la evidencia empírica confir­
me razonablemente las afirmaciones de ambos grupos;
a. la sentencia asegurando que.la ociiii:eiicia.xlel.acoiitecimiento E se puede de-
ducir lógicamente de los dos grupos de afirmaciones (Hempel, 1994: 43-45).

Hempel (1942) plantea el ejemplo del radiador de un coche que


se rompe en una noche fría para ilustrar la lógica de la explica­
ción. Las leyes generales citadas en la explicación deberían alu­
dir a cómo la presión del agua cambia a través de su variación en
temperatura y volumen, y a las condiciones iniciales referidas a
la temperatura durante la noche y la presión a la que estalla el ra­
diador. Una explicación sería adecuada si y sólo si se puede de­
ducir lógicamente de las proposiciones que establecen las leyes y
las condiciones iniciales. Pero quizás un segundo ejemplo sea
más ilustrativo: uno podría decir que Aristóteles murió porque
era humano y todos los humanos son mortales.
Los principios de esta variante de la explicación ya aparecen
formulados en las primeras páginas de la Filosofía Positiva de
Comte (1854):

La primera característica de la Filosofía Positiva es que considera que todos


los fenómenos están sujetos a leyes naturales invariables. Nuestra tarea es
[...] perseguir un descubrimiento adecuado de estas leyes, con la perspectiva
de reducirlos al menor número posible. Cuando especulamos sobre sus cau­
sas, podríamos determinar sin problemas sus orígenes y propósitos. Nuestra

60
nencias sociales

verdadera tarea es analizar adecuadamente las circunstancias de los fenóme­


nos, y conectarlos a través de las relaciones naturales de la sucesión y simili­
tud. La mejor ilustración de esto se encuentra en la doctrina de la gravitación
(Comte, 1854: 5-6).

E incluso Mili (1874: 332) señala que:

un hecho individual se dice que está explicado cuando se apunta su causa,


esto es, cuando se establece la ley o las leyes de causalidad.

En la ciencia política, uno de los más conocidos ejemplos de teo­


rías que se basan en las leyes de cobertura es la explicación de
los efectos de los sistem as electorales de Duverger (1987
[1951]). La ambición de Duverger no era otra que plantear los
sistemas electorales como condición necesaria y a la vez sufi­
ciente para obtener determinadas configuraciones del sistema de
partidos: así, por ejemplo, cuando se adopta un sistema electoral
de mayoría relativa en una sociedad, sea cual fuere su estructura
de cleavages, el resultado habrá de cristalizar en un sistema bi­
partidista. Este planteamiento es ciertamente parsimonioso desde
el punto de vista teórico, lo que constituye el principal activo de
las ya conocidas como leyes de Duverger.
Puesto que Hempel consideraba que las leyes deterministas
eran improbables en las ciencias sociales, las que se pueden invo­
car en nuestra disciplina tienen una naturaleza probabilística, es
decir, establecen que un evento ocurrirá con determinada proba­
bilidad si se cumplen ciertas condiciones previamente explicita-
das. Esto es,

la mayoría de A son B
Xeszl
X es probable que sea B

Aunque hayan sido ampliamente utilizadas, sobre todo las proba-


bilísticas, la principal debilidad de las leyes de cobertura es que
no son capaces de distinguir entre los argumentos causales y los

61
sssses&w

no causales. De acuerdo con el ilustrativo y conocido ejemplo de


Miller (1987: 34):

la explicación causal no se analiza a través del modelo de la ley de cobertura.


[Algunos] contraejemplos son suficientes [...] Cuando un barómetro cae, es
muy probable que tenga lugar un cambio a peor en el tiempo. La alta proba­
bilidad es dictada por las leyes de la meteorología. Pero el tiempo no cambia
debido a que el barómetro caiga.

Pero, además, las leyes de cobertura en ciencias sociales dan lu­


gar a explicaciones imprecisas. Como meras asociaciones esta­
dísticas, las explicaciones no ofrecen más razones que la propia
ley en sí misma. Justifican así la utilización de explicaciones de
caja negra en la medida en que no consideran necesaria la provi-
sión de los mecanismos que conecten la variable dependiente y
la/s independiente/s. En el caso de las leyes de Duverger, por
ejemplo, los procesos causales que producen la correlación entre
sistema electoral y sistema de partidos quedan sin explicar4. En
la medida en que esa generalización estructural cree predecir el
comportamiento de las elites y votantes a partir de la situación en
la que se encuentran, la explicación de cómo los sistemas electo­
rales influyen en las acciones de los actores está ausente.
Como concluye Hedstróm (2005: cap. 2), las leyes de cobertu­
ra no parecen particularmente útiles para las ciencias sociales.
Por un lado, el modelo deductivo no se puede aplicar, puesto que
las leyes deterministas que presupone no existen. Por otro, da lu­
gar a teorías y explicaciones superficiales, debido a que no plan­
tea cuáles son los microfundamentos, acciones e interacciones,
que están detrás.

6.3. La explicación basada en mecanismos causales o


sociales

La idea básica de la aproximación a la causalidad basada en los


mecanismos es que la explicación en ciencias sociales no tiene
6,

lugar a través de la invocación de leyes universales o la identifi­


cación de variables relevantes, sino mediante la provisión de los
procesos (o mecanismos) que producen los fenómenos sociales.
En otras palabras, no sólo se deben apuntar las variables que cau­
san una diferencia sistemática en la probabilidad de que suceda
un acontecimiento; es necesario, además, señalar cómo X causa
Y.
Como nos recuerda Pickel (2004), este debate sobre los meca­
nismos causales es relativamente reciente. Sin embargo, la prime­
ra formulación explícita aparece seguramente en Merton (1967:
106):

el análisis funcional en sociología, como en otras disciplinas como la fisiolo­


gía o la psicología, reclama que se dé cuenta «concreta y detalladamente» de
los meeanismas-que-operan para realizar una función designada. Esto se re­
fiere, no a los mecanismos psicológicos, sino a los mecanismos sociales (por
ejemplo, la segmentación de roles, la protección de demandas sociales, el or­
den jerárquico de valores, la división social del trabajo, leyes rituales y cere­
moniales, etc.). La pregunta básica [es] ¿cuál es el inventario posible en este
momento de mecanismos sociales correspondiente, digamos, al gran inventa­
rio de mecanismos psicológicos? ¿Qué problemas metodológicos están vin­
culados a discernir el funcionamiento de mecanismos sociales?5.

Las definiciones de qué es un mecanismo causal son m uchas6.


En mi opinión, la que mejor y de una manera más parsimoniosa
capta su significado es la que ofrecen Machamer, Darden y Cra-
ver (2000): un mecanismo causal es un concepto que especifica
un conjunto de entidades (actores, procesos o estructuras) y acti­
vidades que está organizado de tal modo que provoca con fre­
cuencia un determinado resultado. Es decir, un mecanismo mues­
tra cómo una variable independiente o input se transforma en la
variable dependiente o output para conectar así los procesos cau­
sales.
Los mecanismos muestran cómo los valores de una variable
independiente influyen en las oportunidades, las creencias y/o los
intereses de los actores, y cómo las acciones e interacciones de
o

fu en te: Hedstróm y Swedberg (1998: 9).

Fig u r a 2. Mecanismos c o m o c o n e x i ó n e n l o s p r o c e s o s c a u s a l e s .

éstos generan los valores de la variable dependiente. Es decir, una


buena teoría no sólo nos cuenta qué pasa sino también qué hace
que pase o qué impide que pase (Bunge, 1997). Si no podemos
decir algo sobre la frecuencia o probabilidad de un tipo específi­
co de situación y sus resallados, no podemos evaluar Ja. relevan­
cia o capacidad explicativa de un mecanismo causal, indepen­
dientemente de lo bien que entendamos teóricamente la situación
particular. Y si no somos capaces de señalar un mecanismo, no
podemos comprender el significado politológico o sociológico de
la covarianza observada entre las variables, al margen de su fuer­
za (Blossfeld, 1996).
Los siguientes ejemplos ilustran el significado de los meca­
nismos causales. En primer lugar, sabemos que la inflación causa
una reducción en el consumo de un bien. El mecanismo que co­
necta la causa y el efecto tiene que ver con las decisiones de los
consumidores racionales: cuando observan el incremento de los
precios, ajustan su consumo para maximizar su utilidad total y,
en consecuencia, reducen su consumo individual del bien en
cuestión. De este modo, el comportamiento racional de los indi­
viduos produce el efecto de un menor consumo agregado.
En segundo lugar, en contra de lo que uno podría esperar da­
dos los vehementes sentimientos contra el tabaco existentes en
los Estados Unidos, el elevado número de fumadores en las calles
de Nueva York hace que estén cubiertas de colillas de cigarrillos.
¿Cómo se puede explicar este resultado aparentemente paradóji­
co? Si fumar está prohibido en las oficinas y no está bien visto en
mmmMkimmxii'M- 1 ' . f N en ciencias sacíales?

las casas, puede predecirse que se incrementará el número de fu­


madores en las calles y, por tanto, el de colillas. Si reconstruimos
la lógica de este razonamiento, podemos observar que descansa
en no menos de tres mecanismos, cuya plausibilidad individual
sostiene la del modelo. La explicación asume, primero, que la
norma contra el tabaco se respeta; segundo, que al menos algu­
nos fumadores no abandonan su adicción incluso con el coste
adicional de tener que hacerlo en el exterior; tercero, que tirar las
colillas en la calle, aunque a nadie le guste, resulta individual­
mente más barato que guardarlas o echarlas en una papelera.
Norma, adicción y racionalidad elemental dan cuenta conjunta­
mente del rompecabezas. Si alguno de estos mecanismos no fun­
cionara o su efecto fuera compensado por otro, la explicación fa­
llaría (Gambetta, 1998: 104-105).
~ Pinuimente, Po 1avieja (2005) estudia las razones que llevaron
a que la desregulación laboral en España inaugurada en 1984 ge­
nerara importantes desigualdades entre los trabajadores de pro­
ductividad equiparable. A través de la revisión de los datos empí­
ricos existentes sobre la distribución de oportunidades entre 1984
y 1997, Polavieja muestra que este efecto depende de (i) la exis­
tencia de elevados costes de despido y (ii) un sistema de negocia­
ción colectiva poco inclusivo, esto es, con una escasa presencia
de los sindicatos en los centros de trabajo y una negociación cen­
trada en la discusión de los salarios y escasamente en las caracte­
rísticas de los contratos de empleo.
¿Por qué es tan importante especificar los mecanismos que
han dado lugar a los resultados observados? De acuerdo con
Hedstróm (2005: cap. 2), se pueden señalar al menos tres razo­
nes. Por un lado, los mecanismos dan lugar a explicaciones más
precisas y comprensibles. Por otro, los mecanismos reducen la
fragmentación de la teoría. Por ejemplo, existen numerosas teorías
(del crimen, los movimientos sociales o la movilización electoral)
que se basan en los mismos principios causales: la acción e inte­
racción entre los individuos. Si nos centramos en los mecanismos
podemos evitar una proliferación innecesaria de conceptos teóri­
cos y conseguir así una similitud estructural entre procesos apa­
La < ' - -

rentemente distintos. Finalmente, es el conocimiento de los me­


canismos lo que nos permite creer que existe una relación causal
entre X e Y, y no simplemente una correlación espuria. Por ejem­
plo, en una reciente investigación, Franco, Álvarez-Dardet y Ruiz
(2004) muestran que, una vez que se controla el efecto del nivel
de riqueza, de las desigualdades o del gasto público de un país, la
democracia aumenta la esperanza de vida de la población y redu­
ce la mortalidad infantil y la materna, en comparación con los
demás tipos de sistemas políticos. Aunque este resultado es ro­
busto desde un punto de vista estadístico, los autores reconocen
que no tienen claro por qué la democracia es buena para la salud.
Por tanto, bien podría ser que la omisión de una variable de con­
trol estuviera provocando este resultado. En particular, es posible
que esta correlación tenga que ver con el hecho de que las demo­
cracias no suelen e'sfáFémméltas en’ p é f f á s 'ciVilFS o eirattracie--
nes de represión militar, pero sí los regímenes no democráticos.
En fin, como los autores no son capaces de señalar un mecanis­
mo causal que explique cómo la democracia afecta a la salud,
siempre nos queda la duda de que esta relación sea en realidad
espuria.
De acuerdo con Merton (1967), las explicaciones basadas en
mecanismos se encuadran en las llamadas teorías de alcance me­
dio, esto es, teorías que se sitúan a medio camino entre las grandes
teorías abstractas y las descripciones ateóricas (Boudon, 1991).
Como aclara Tilly (2001: 23-25), las explicaciones basadas en me­
canismos difieren de las leyes de cobertura en dos cuestiones bási­
cas: (1) niegan que puedan tener lugar repeticiones interesantes de
procesos y estructuras sociales de amplio nivel y (2) aunque los
mecanismos tienen efectos uniformes inmediatos, sus consecuen­
cias agregadas, acumuladas o a largo plazo, varían considerable­
mente en función de las condiciones iniciales y de sus combinacio­
nes con otros mecanismos. Y frente a las meras descripciones,
plantean que las ciencias sociales están en condiciones de identifi­
car pautas causales que se repiten con cierta regularidad.
Los defensores de la explicación basada en los mecanismos
causales se agrupan bajo la etiqueta del llamado «realismo cau­
5, ¿Clisé significa «explican? en ciencias sociales?

sal». Para el realismo causal, apuntar que A causa B es afirmar


que, en el contexto de las fuerzas causales en juego, A da lugar a
B o incrementa la probabilidad de que ocurra a través de un me­
canismo específico. Sus principios son cinco (Little, 1998: 191-
198):

1. Existen relaciones causales entre los fenómenos sociales,


de modo que la explicación causal es la forma central de la
explicación social.
2. Las relaciones causales no están constituidas por regulari­
dades o leyes que conectan los sucesos o fenómenos socia­
les. Por el contrario, las regularidades en el mundo social
no responden a las leyes estrictas o predictivas de la natu­
raleza.
---- 3. I as relaciones sociales causales están formadas por los po­
deres causales de diversas estructuras, condiciones y suce­
sos y los mecanismos causales que llevan de las condicio­
nes antecedentes a los resultados sociales.
4. No hay una causalidad social pura entre m acroestados,
sino hipótesis sobre mecanismos causales que deben ser
construidos a partir de la presentación de los microfunda-
mentos de los procesos que se plantean.
5. Existe diversidad causal en los mecanismos y propiedades
que los científicos sociales distinguen, de manera que des­
de una perspectiva metodológica es defendible el eclecti­
cismo.

Al igual que la causalidad — recordemos que la situación real


y la situación hipotética no se pueden dar simultáneamente— , los
mecanismos causales no son directamente observables. Los me­
canismos son constructos teóricos que se derivan inductivamente
de la evidencia empírica, pero que no se pueden derivar deducti­
vamente de esta evidencia. Nunca podemos mostrar que un me­
canismo particular causó un fenómeno determinado; sólo pode­
mos mostrar que este mecanismo podría haber producido el
fenónemo (Simón, 1979: 71).
Puesto que diferentes teorías producen distintos mecanismos,
¿cómo se puede seleccionar el más apropiado de todos los posi­
bles candidatos? Aunque no existe una regla incuestionable, Ki-
ser y Hetcher (1991: 6-10) apuntan tres criterios para escoger en­
tre mecanismos causales rivales: la plausibilidad, la reducción de
la distancia temporal entre causa y efecto y las implicaciones em­
píricas.
En primer lugar, sólo algunos mecanismos son considerados
plausibles para la comunidad cientifica. Por ejemplo, existe una
fuerte correlación entre el desarrollo económico y los sistemas poli-
ticos democráticos. Pero debido a la incapacidad de especificar me­
canismos causales adecuados, no está claro si estas dos variables es­
tán relacionadas causalmente y, si es así, cuál es X y cuál es Y.
En segundo lugar, puesto que la eliminación de las relaciones
espurias es el desafió fundamental.d é l a l S f e r e ñ C i i F ^ .
mayor sea la reducción de la distancia temporal entre J e Y, me­
jor será el mecanismo. Y es que, cuanto más tiempo pasa entre el
explanans y el explanandum, más probable es que la relación sea
espuria. Por ejemplo, en una de las contribuciones más celebra­
das en la ciencia política en los últimos años, Putnam (1993) de­
muestra que el nivel de rendimiento actual de los gobiernos re­
gionales en Italia depende de la densidad de la vida asociativa de
cada región. En particular, en aquellas comunidades o regiones
en las que imperaron regímenes republicanos y formas de gobier­
no «horizontales» o poco jerarquizadas en la Edad Media, se ha
desarrollado una tradición asociativa y un sistema de gobierno
que han llevado a tener gobiernos regionales satisfactorios en la
actualidad. Sin embargo, la enorme distancia que media entre la
causa y el efecto, varios siglos, hace difícil conectar las dos va­
riables. Precisamente una de las críticas más rotundas a Putnam
es la ausencia de una articulación explícita del mecanismo me­
diante el cual la capacidad de cooperación de la gente en la socie­
dad afecta al rendimiento de las instituciones gubernamentales
existentes (Boix y Posner, 2000).
Finalmente, diferentes mecanismos causales suelen tener dis­
tintas implicaciones empíricas. Un mecanismo se acepta con ma­
fu ¿Qué significa «explicar» en ciencias sociales?

yor seguridad cuando es el único que sugiere la evidencia empíri­


ca que se observa. Por ejemplo, en la explicación del movimiento
de la Tierra se manejaban dos mecanismos contrapuestos: el pto-
lemaico, que planteaba que el Sol era el cuerpo en movimiento y
la Tierra el estático, y el copernicano, que defendía que el Sol era
el objeto estático y la Tierra el móvil. Si los científicos hubieran
tenido la oportunidad de observar el sistema solar desde una pla­
taforma orbital, se habría concluido rápidamente la superioridad
del mecanismo heliocéntrico.
De acuerdo con Coleman (1986, 1990), los mecanismos cau­
sales se agrupan en tres tipos que responden al conocido como
modelo macro-micro-macro. La premisa de este modelo es que
una explicación adecuada del cambio en el nivel agregado exige
mostrar cómo macroestados en un momento en el tiempo influ-
yen en el comportamiento de los actores individuales y cómo las
acciones que realizan estos actores generan nuevos macroesta­
dos en un momento posterior. Las relaciones entre estructuras
son así el resultado contingente de las acciones de unos actores
sujetas a la interacción con las de otros agentes y con el propio
contexto.
El primero de los tres tipos de mecanismos, denominado si-
tuacional o contextual, establece cómo las propiedades de los sis­
temas influyen en las consideraciones u orientaciones de los ac­
tores, esto es, establece cómo las estructuras funcionan como el
contexto social y material que define las condiciones para la ac­
ción. Se trata, pues, de un primer filtro de los comportamientos
compuesto por las restricciones físicas, económicas, culturales,
legales o psicológicas que afronta un individuo y definen su con­
junto de oportunidades. En definitiva, se estudian las relaciones
entre el estado del sistema social, como campo de actividad de
los agentes, y las expectativas y necesidades de éstos. El análisis
situacional de Popper (1997), por ejemplo, se basa en los meca­
nismos macro-micro.
El segundo tipo de mecanismo, denominado cognitivo o de la
formación de la acción, se localiza en el nivel micro y revisa
cómo el individuo asimila el impacto de los eventos en el nivel
- > 1 "

macro. Se pretende mostrar cómo una específica combinación de


deseos individuales, creencias y oportunidades da lugar a una ac­
ción específica o, en otras palabras, describir cómo una persona
que está sujeta a una estructura social en t se comporta en i + 1
de acuerdo con las asunciones sobre sus capacidades cognitivas y
valores, entre otros elementos. Este segundo mecanismo determi­
na qué acción dentro del conjunto de oportunidades se realiza. La
teoría de la elección racional, es, por ejemplo, un tipo ideal de
mecanismo para la acción que establece que los actores, cuando
se enfrentan con una elección entre cursos de acción alternativos,
escogen el mejor de acuerdo con sus intereses.
El último de estos mecanismos, conocido como transforma-
cional o relacional, establece la transición micro-macro y desve­
la cómo los individuos a través de sus acciones o interacciones
generan resultados en el nivel macro, intencióñádámMte^o'iTOT"
Es decir, cuáles son las consecuencias de la acción del actor:
cómo se combina, interfiere o interacciona con las acciones de
otros creando un nuevo contexto o estructura en el que tiene lu­
gar la siguiente acción. La tragedia de los bienes comunales es
un ejemplo bastante extendido de un mecanismo micro-macro:
existen situaciones (la contaminación, el ruido, etc.) en las que
la gente ejerce tal influencia al perseguir sus intereses individua­
les que, desde el punto de vista colectivo, podrían alcanzarse
mejores resultados si se restringieran sus acciones, aunque a na­
die le convenga individualmente la autorrestricción (Hardin,
1968).
La figura 3 muestra un diagrama de este sistema de mecanis­
mos multinivel para ilustrar la explicación de la relación entre el
protestantismo y el capitalismo que plantea Weber en La ética
protestante y el espíritu del capitalismo. La flecha horizontal más
elevada representa la proposición agregada, esto es, la conexión
empírica entre el protestantismo y el capitalismo. Las tres flechas
restantes — la primera empieza en el mismo lugar que la proposi­
ción en el nivel macro y desciende a un nivel inferior, mientras
que la tercera sube hasta el punto final de esta proposición ma­
cro— representan los tres mecanismos entrelazados.
Protestantismo Capitalismo

Figura 3. Proposiciones macro y micronivel: el efecto de la religión en la


..organización económica según Weber.

Las tres proposiciones son las siguientes:

1. El protestantismo genera ciertos valores entre sus partida­


rios.
2. Los individuos con ciertos valores (referidos a la proposi­
ción 1) adoptan las orientaciones hacia el comportamiento
económico.
3. Las orientaciones hacia el comportamiento económico (re­
feridas a la proposición 2) de algunos individuos dan lugar
a la organización económica capitalista en una sociedad.

Por supuesto, analizar los m ecanism os causales requiere,


como apunta Boudon (1998: 198), que se hagan consecuencia de
las acciones de los individuos. La razón para priorizar a los indi­
viduos es que los argumentos que no tienen sentido en el nivel in­
dividual, al margen de que parezcan plausibles, nunca sobreviven
al test del tiempo y al escrutinio en detalle (Geddes, 2003: 221).
Es decir, la explicación basada en los mecanismos causales se
acompaña del principio del individualismo metodológico, esto
La lógica de la explicación en ¡3$ ciencias sodate

es, la doctrina que establece que los fenómenos políticos y socia­


les se deben entender como el resultado de las acciones de los in­
dividuos. Su significado encuentra en Elster (1996: 23) una clara
y parsimoniosa presentación:

La unidad elemental de la vida social es la acción humana individual. Expli­


car las instituciones y el cambio social es demostrar de qué manera surgen
como el resultado de la acción e interacción de los individuos.

El individualismo metodológico se opone, cada vez con menos


discusión, al holismo metodológico, que sostiene que para expli­
car los fenómenos políticos y sociales se debe partir de agrega­
dos o variables sociales: las estructuras sociales determinan la
acción de los individuos. Las diferencias entre las dos propuestas
metodológicas se Hacen patentes en el siguiente ejeiirpfo^obTeda'-
explicación del comportamiento electoral de un individuo. Para
el holismo, que en este caso se asocia con la sociología política y
en particular con el modelo de Columbia, la gran mayoría de los
votantes tienen una predisposición política o de partido anclada
en la tradición familiar y/o identidad social. El voto es una cues­
tión de hábito o herencia: «una persona piensa políticamente tal
como es socialmente. Las características sociales determinan la
predisposición política» (Lazarsfeld et al., 1944: 27). Como ho-
listas, explicamos el voto de un individuo citando las constric­
ciones institucionales y sociales a las que está expuesto y que
determinan su comportamiento: su margen de elección es inexis­
tente.
Por el contrario, para el individualismo, que en este caso va de
la mano de la teoría de la elección racional, un votante reconoce
su propio interés, evalúa a los candidatos alternativos según sus
intereses personales y vota al que mejor valora (Enelow y Hinich,
1984: 3 )7.
El individualismo metodológico tiene dos versiones: \mü fuer­
te, que plantea que los fenómenos políticos y sociales deben ser
explicados exclusivamente en términos de individuos y sus inte­
racciones; y otra débil, que, aunque comparte esta misma posi-
c 1 ' Ja s sociales?

ción ontológica, acepta como parte de la explicación las institu­


ciones y/o las estructuras sociales para incrementar su precisión y
realismo (Udéhn, 2002). En un caso, la acción se reconstruye
como una elección instrumentalmente racional de una unidad in­
dividual autónoma, con la introducción de cualquier elemento
normativo o expresivo, como influencia en las recompensas, tal
como las percibe el agente. En el otro, la acción se reconstruye
como sumisión inteligente a las reglas de juego, en un sentido de
juego que hace que los jugadores no sean autónomos (Hollis,
1998: 282, énfasis en el original).
De acuerdo con la versión débil del individualismo metodológi­
co, una manera simple de explicar una acción es verla como el pro­
ducto final de dos operaciones sucesivas de filtración. Empezamos
con un conjunto grande de todas las acciones posibles que puede
je alfz ar uiTindividuo. El primer filtro está compuesto por todas las
instituciones físicas, económicas, legales y psicológicas a las que
se enfrenta un individuo. Las acciones coherentes con estas restric­
ciones forman un conjunto de oportunidad. El segundo filtro es un
mecanismo que determina qué acción dentro del conjunto de opor­
tunidad será realizada realmente (Elster, 1996: 23).
Las explicaciones basadas en mecanismos son objeto de dos
grandes críticas. La primera, la más habitual, señala que, si esta­
blecemos que una variable explicativa produce otra dependiente,
tendremos que detallar todos los vínculos que hay entre ambas
variables. Es decir, «el mecanismo» no tiene un sentido definiti­
vo, puesto que en cualquier cadena causal entre variables agrega­
das existe un número indefinido de mecanismos. En palabras de
Kincaid (1996: 179):

demandar que citemos los mecanismos detrás de la causalidad macrosocioló-


gica es intrínsecamente ambiguo. ¿Los necesitamos en un nivel de grupo pe­
queño o en el individual? Si nos quedamos con la segunda posibilidad, ¿poi­
qué parar aquí? Siempre podemos, por ejemplo, preguntarnos qué mecanis­
mos provocan el comportamiento individual. Por tanto, estamos obligados a
descubrir los mecanismos neurológicos, luego los bioquímicos, y así sucesi­
vamente 8.
Lo: lógica de 1.a explicación en las aenrias sociales

En otras palabras, los mecanismos nos llevarían a un regreso al


infinito y no parecen ofrecer por sí mismos una definición preci­
sa de la causalidad, relativa a una causa y un efecto.
Esta objeción no parece demasiado importante. Como nos re­
cuerda Gerring (2001: 196), este regreso al infinito en la investi­
gación de la relación causal entre X e Y debe detenerse en el pun­
to en el que llegamos a un proceso o mecanismo generalmente
aceptado. Por ejemplo, para explicar por qué cae una pelota, po­
dríamos decir simplemente «gravedad». Puesto que la gravedad
es un mecanismo ampliamente aceptado, satisfaría las exigencias
de la explicación. Cuando explicamos el comportamiento huma­
no, el mecanismo apropiado suele tomar 1a. forma de un motivo.
La racionalidad instrumental de la teoría de la elección racional,
por ejemplo, es un mecanismo causal último. En fin, las explica­
ciones no pretenden ser cómpTéfás7snm~símp
la cuestión que el investigador se plantea (Levi, 1984: 51).
La segunda crítica, de nuevo según Kincaid (1996: 179-180),
es que existen otras maneras de distinguir entre la causalidad y la
correlación espuria que no tienen que ver con la provisión de me­
canismos. En particular, cuando en un análisis estadístico se in­
troducen variables de control y la correlación no desaparece, po­
demos concluir que la relación es causal. Y otro tanto sucede
cuando se realizan experimentos (Skinner, 1970). Ya hemos dis­
cutido la respuesta a esta objeción cuando se presentó la explica­
ción estadística. Solamente debe recordarse que cualquier expli­
cación en la que no está claro de qué manera X produce Y es
sospechosa de ser espuria. Y precisamente la limitación funda­
mental de la variante estadística de la explicación es que no intro­
duce ninguna noción explícita de los procesos causales subyacen­
tes (Cox, 1992: 297).
7. ¿Qué se debe evitar en
los diseños de investigación?

En este apartado se revisan las causas y consecuencias de los cin­


co problemas más habituales en los diseños de investigación: los
errores de especificación en el modelo de explicación, el sesgo
de selección, la multicolinealidad, la endogeneidad y las formas
funcionales incorrectas. Incurrir en cualquiera de estos errores,
aun cuando el resto de la investigación se haya hecho bien, impo­
sibilita la realización de inferencias descriptivas o causales váli­
das.

7.1. Errores de especificación en el modelo de


explicación

Los errores de especificación tienen lugar cuando en nuestro mo­


delo de explicación faltan o sobran variables independientes. En
un caso, una o más variables independientes relevantes para ex­
plicar la variable dependiente se han omitido, de modo que se in­
curre en un sesgo o error sistemático en la inferencia: cuando hay
sesgo, los errores ya no se cancelan los unos con los otros, como

75
sucede cuando son aleatorios, sino que tienen una tendencia, po­
sitiva o negativa. En el otro, una o más variables irrelevantes para
explicar la variable independiente se han tenido en cuenta, de
modo que se incurre en ineficiencia: el procedimiento analítico
no utiliza toda la información para maximizar nuestra capacidad
de realizar inferencias válidas.
Para establecer las causas y consecuencias de los errores de
especificación, en el cuadro 1 se plantean las cuatro posibles si­
tuaciones en las que se puede encontrar un investigador. En las
columnas, en mayúsculas, se presentan dos posibles modelos teó­
ricos verdaderos e inobservables; el primero, con una única varia­
ble independiente, y el segundo, con dos. En las filas, en minús­
culas, se contienen dos posibles m odelos teóricos propuestos.
Cuando coinciden el modelo verdadero y el propuesto, como en
las casillas 1 y 4, no hay errores de especificación: la explicación
es correcta. Pero cuando sus variables no coinciden, como en las
casillas 2 y 3, aparecen los errores de especificación.

C u a d r o 1. P o sib les re lacio n es en tre el m od elo de


ex p licació n v e rd a d e r o y el e stim a d o
zxmtam

Modelo verdadero

de la teoría
F= 0, + ¡32X 2 + fJi Y = p l + p 1x 1 + p j c i + n
¡ Modelo propuesto

Y = b { + b 2X 2 Correcto Sesgo
1 2

Y = b ] + b 2X , + b 2X 2 Ineficiencia Correcto
3 4

L a primera posibilidad de equivocación es incluir una variable


de más, como pasa en la casilla 3. En el modelo estimado se in-

76
cluye X 3, cuando en realidad no hace falta. La consecuencia de la
inclusión de una variable independiente irrelevante en nuestra ex­
plicación es la ineficiencia, pero no el sesgo. Puesto que en el
modelo verdadero el efecto de X3 es 0, si tenemos en cuenta esta
variable en el análisis encontramos necesariamente que b3 = 0.
Para mostrar de una manera intuitiva qué significa la inefi­
ciencia en una investigación, supongamos que la única variable
independiente que explica los resultados electorales del PP en las
circunscripciones en las elecciones generales de 1996 {Y) es la
visita de Aznar (X). Si tenemos dos circunscripciones idénticas
salvo en esta variable clave — una ha sido visitada por Aznar du­
rante la campaña, la otra no— , se podría estimar el efecto causal
de la visita de Aznar con sólo dos observaciones. Sin embargo,
imaginemos que un investigador piensa (erróneamente) que hay
-una-segunda- -variable independiente que hay que controlar: el he­
cho de que una circunscripción haya recibido fondos de cohesión
europeos. Para estimar el efecto causal de la variable indepen­
diente clave se necesitan ahora al menos cuatro observaciones, de
nuevo bajo el supuesto de que son absolutamente idénticas ex­
cepto en lo que atañe a estas dos variables. En primer lugar, de­
bemos descomponer la variable dependiente en función de la va­
riable independiente de control. Por un lado, hacen falta dos
circunscripciones que se hayan beneficiado de los fondos europeos;
una tiene que haber sido visitada por Aznar y la otra no. Y, por
otro, necesitamos otras dos que no se hayan beneficiado de los
fondos europeos; una tiene que haber sido visitada por Aznar y la
otra no. Como la variable de control es irrelevante, la inferencia
causal sobre el efecto de la visita de Aznar a una circunscripción
en los resultados electorales del PP en 1996 que realizamos es la
misma que antes. Pero hemos tenido que duplicar el número de
observaciones. En otras palabras, hemos sido ineficientes.
La segunda posibilidad de equivocación es excluir una varia­
ble relevante, como pasa en la casilla 2. En el modelo estimado
no aparece Xv cuando en realidad debe ser considerada. La con­
secuencia de la omisión de una variable relevante en nuestra ex­
plicación es el sesgo. Ya sabemos que cuando se omite una varia­

77
La lógica de le explicación en tas ciencias sociales

ble relevante, su impacto en Y, o al menos parte de él, se traslada


al término de error, ¡x. El error deja ser aleatorio, como exige la
estimación correcta de los efectos causales de las variables inde­
pendientes, para convertirse en sistemático. Nuestras inferencias
serán, pues, inválidas.
Como se observa en la figura 4, cuando una variable indepen­
diente relevante se excluye del modelo de explicación, las varia­
bles independientes incluidas y que están correlacionadas con la
excluida recogen parte de su efecto sobre Y. El resultado es el
sesgo en la estimación del efecto causal de las variables indepen­
dientes que aparecen en el modelo. La dirección del sesgo (posi­
tivo o negativo) depende del signo del efecto de la variable ex­
cluida sobre la variable dependiente y del signo del efecto de la/s
variable/s independiente/s incluida/s sobre la dependiente. Por su
parte, la magnitud del sesgo depende de la correlación enlre las
variables independientes incluidas y omitidas. Cuando mayor sea
la correlación entre ellas, más grande será el sesgo debido a que
la variable incluida se apropia de más parte del efecto de la varia­
ble excluida. De esta manera, no existiría sesgo cuando las varia-

.V

f u e n t e : Dougherty (2002: 198).

Figura 4. Consecuencias de la omisión de una variable independiente relevante.


¿Que* se debe evitar en Los diseños de imfesticiadón?

bles explicativas incluida y excluida sean totalmente indepen­


dientes entre sí, esto es, cuando su correlación sea 0 ’. Pero en
términos empíricos es muy improbable que se produzca esta últi­
ma situación.
Para ilustrar los efectos de la omisión de una variable relevan­
te, supongamos que el salario mensual de un individuo depende
de tres variables: sus años de estudio, los años de antigüedad en
la empresa y los días de ausencia injustificados. El modelo ver­
dadero es:

Salario = f3¡ + /32 Estudio + /E, Antigüedad - /S4 Baja + ¡x (17)

El efecto de los años de estudio es positivo (cuanto mayor sea


la acumulación de capital humano, mayor es la contraprestación
-económica),-el de los años de antigüedad en la empresa también
es positivo (cuanto mayor sea el conocimiento de las tareas a de­
sempeñar, mayor es la productividad) y, finalmente, el de los días
de baja laboral es negativo (a más de días de ausencia injustifica­
da, menor es el salario). La correlación entre los años de estudio
y los años de antigüedad es positiva (a los trabajadores mejor for­
mados es a los que más desea retener una empresa) y negativa
entre estas dos variables y los días de baja (los empleados más
cualificados y los trabajadores más ligados a las empresas son los
que menos faltan).
En primer lugar, supongamos que, en lugar de manejar la es­
pecificación (17), un investigador se olvida de las horas de baja
laboral y estima:

Salario = bl + b2 Estudio + ¿>3 Antigüedad + ¡x (18)

Puesto que esta variable omitida tiene una correlación negati­


va con los años de estudio y la antigüedad, el efecto de estas dos
variables sobre el salario se reduce. ¿Por qué? Porque ahora reco­
gen parte de la influencia (negativa) de los días de baja en los sa­
larios. Y si a un efecto positivo se le añade uno negativo, pasa a
ser más pequeño: los coeficientes de los años de estudio y la an­
La lógica de Le explicación sr> Las ciencias sedales

tigüedad seguirán siendo positivos si su efecto positivo propio es


más fuerte que el negativo que pasan a recoger de los días de
baja; y negativo si su efecto positivo propio es más débil que el
negativo de los días de baja que pasan a recoger.
En segundo lugar, supongamos que, en lugar de manejar la es­
pecificación (17), un investigador se olvida de los años de anti­
güedad y estima:

Salario = ó, + ó. Estudio - h3 Baja + /x (19)

Puesto que esta variable omitida tiene una correlación positiva


con los años de estudio y negativa con las horas de baja laboral,
el efecto de estas dos variables sobre el salario se resiente. Ahora
recogen parte de la influencia (positiva) de los años de antigüe­
dad en los salarios. El coeficiente .delos-años-de-estudio,se hará
más grande, debido a que a su efecto propio se le añade parte del
efecto positivo de la antigüedad; mientras que el coeficiente de
las horas de baja laboral seguirá siendo negativo si su efecto ne­
gativo propio es más fuerte que el positivo que pasa a recoger de
la antigüedad; y positivo si su efecto negativo propio es más débil
que el positivo de la antigüedad.
En el cuadro 2 se resume la posible dirección del sesgo de es­
pecificación en el efecto de una variable independiente (A,)
cuando en un modelo con dos variables independientes relevan­
tes, X x y Xv se omite X r
Un ejemplo que no tiene nada que ver con la ciencia puede
ayudarnos a entender mejor las consecuencias de los sesgos de
especificación. Supongamos que dos personas (Xx y X 2) han que­
dado para comer y ya han reservado la cantidad de comida que
van a ingerir ( 7 ) de acuerdo con la estimación que hacen del
hambre de cada uno. Si falta uno de los dos individuos, el otro no
sólo va a comer lo que había previsto, sino también, y debido al
malestar que le produce tirar la comida sobrante, parte de lo que
se habría comido el otro. Cuánto más come respecto a la estima­
ción inicial depende de la cantidad de comida que queda disponi­
ble (esto es, de lo que se habría comido el individuo ausente). Si
C u a d r o 2. P o sib les d ireccion es de los se sg o s en el efecto de
u n a v a ria b le in d ep en d ien te (Y ,) cuan do se om ite
o tr a relev an te (X2)
ama:»;;*.sss^'ása^swv;;v.::v:.'.w>«.«s-
Dil ección de los sesgos Corr (a-j, .v,) > 0 Corr (a ,, X j ) < 0

P2> 0 sesgo positivo sesgo negativo


/3, < 0 sesgo negativo sesgo positivo
puente: Elaboración propia.

la persona que falta a la cita no tenía intención de probar bocado,


esto es, su efecto sobre la comida es 0, su ausencia no influye en
la cantidad de comida que ingiere la persona que sí ha aparecido.
-Sí-la persona que falta a la cita iba a comer mucho, su ausencia sí
influye en la cantidad de comida que ingiere la que sí ha apareci­
do. La dirección de la influencia de su ausencia es positiva, pues­
to que los dos comensales tenían un efecto positivo sobre la co­
mida consumida. Si reemplazamos a nuestros dos individuos por
dos variables independientes, tenemos el resultado de la discu­
sión teórica anterior.
Puesto que los errores de especificación, sobre todo cuando se
omite una variable independiente relevante, tienen consecuencias
tan graves sobre las inferencias causales, ¿cómo se puede deter­
minar cuáles son las que debemos manejar en la explicación de
un fenómeno? L a única manera de asegurar que nuestro modelo
es correcto es tener una buena teoría que nos guíe en la especifi­
cación del modelo. La inclusión o exclusión de variables depende
de la existencia de razones sustantivas para tomar una decisión en
uno u otro sentido. Y los principios del diseño de investigación o
la estadística son de escasa o nula utilidad en esta cuestión. Aun-
> que se siga perfectamente la lógica inferencíal que se presenta en
! este ensayo, las inferencias no serán válidas a menos que nuestra
i teoría sea adecuada. L a metodología no convierte nunca las ma­
las teorías en buenas investigaciones.
La lógica da la explicación en las ciencias sedal

7.2. El sesgo de selección

En la discusión de los supuestos necesarios para realizar inferen­


cias causales válidas, hemos visto que la selección de las obser­
vaciones es crucial. Ya sabemos que para estimar correctamente
el efecto que nuestra variable independiente clave (A',) tiene so­
bre la variable dependiente debe garantizarse la independencia
condicional, esto es, que las observaciones que se eligen y los va­
lores que se adjudican a las variables explicativas sean indepen­
dientes de los valores de la variable dependiente. Esto significa
que si en nuestra selección de observaciones, y antes de que en­
tren en juego las variables independientes, la media de Y en el
grupo que se va exponer a la variable independiente clave es dis­
tinta de la del grupo que no se va a exponer, entonces no se pue­
de atribuir a esta variable clave la diferencia en Y entre los dos
grupos. La relación entre Y y X xestará sesgada: bien se sobreesti­
mará, bien se infraestimará la influencia de la variable indepen­
diente clave. Por tanto, se pueden aceptar como causales relacio­
nes que no son, y a la inversa.
Siempre que la selección de las observaciones sea aleatoria,
como es habitual en una encuesta postelectoral, por ejemplo, o se
tengan en cuenta todas las posibles observaciones, cuando se con­
sideran las 52 circunscripciones españolas en el estudio de la in­
fluencia de la visita de Aznar en los resultados del PP en las elec­
ciones de 1996, por ejemplo, se asegura la satisfacción de la
independencia condicional. Pero en muchas ocasiones no se pue­
de seguir ninguna de estas dos posibilidades y aparece entonces el
riesgo del sesgo de selección. Para conseguir que nuestras inferen­
cias sean válidas cuando hay que escoger observaciones es im­
prescindible que esta selección no esté relacionada con el resulta­
do que se pretende explicar. El sesgo de selección puede definirse,
en este sentido, como un error sistemático que aparece cuando las
observaciones o casos de estudio se seleccionan de acuerdo con
una regla que viola la representatividad de la muestra o cuando al­
gún proceso no aleatorio (normalmente desconocido) asigna las
causas a los casos. En definitiva, seleccionar las observaciones sin
- ~ I ‘ ~ í

estudiar detalladamente sus implicaciones en Y nos puede llevar a


conclusiones erróneas, aun cuando nuestra teoría sea buena y los
demás principios del diseño de investigación sean satisfechos.
Para explicar qué es lo que se puede hacer y qué es lo que no
se puede hacer en la selección de observaciones, en los cuadros
3 y 4 se plantean dos ejemplos. En primer lugar, se presenta la re­
lación verdadera y no observable (y también ficticia) que existe
entre la decisión de votar (Y) y la renta (X) en una población
compuesta por 18 individuos. Como se puede observar, la renta
explica en buena medida que una persona vote o no. Para los in­
dividuos con renta baja, la probabilidad de votar es del 33,3 por
ciento (dos votan y cuatro no), mientras que para los de renta me­
dia y alta esta probabilidad es sensiblemente mayor: un 50 y un
66,7 por ciento, respectivamente. Es decir, cuanto mayor es el ni-
vrel-de Tento,-mayor es la probabilidad de votar. Pasar de una renta
baja a una media y de una media a una alta aumenta esta probabi­
lidad en un 16,66 por ciento en ambos casos.
Supongamos que un investigador desea explicar por qué vota
la gente de esta población y decide estudiar exclusivamente a
aquellos que han votado. Es decir, escoge sus observaciones en
función de la variable dependiente, de modo que elimina la va­
riación en votar: ya sólo hay síes en su estudio. Por tanto, la se­
gunda fila del cuadro 3 ha sido eliminada artificialmente. Con

C u a d r o 3. R elació n en tre v o ta r y la r e n ta *

Renta
Población: 18 individuos
Baja Media Alta

2 3 4
Votar
No 4 3 2

* Los valores de cada casilla indican el número de individuos.


fuente : Elaboración propia.

83
esta selección de observaciones, para los individuos con renta
baja, la probabilidad de votar es del 100 por cien (los dos indivi­
duos considerados han votado), mientras que para los de renta
media y alta esta probabilidad también es del 100 por cien. Es
decir, la renta no explica en absoluto que una persona vote o no:
sea cual sea el nivel de renta, la probabilidad de votar es la m is­
ma. En definitiva, la selección de las observaciones de acuerdo
con la variable dependiente nos ha llevado a realizar una infe­
rencia incorrecta.
En la figura 5 se representa el efecto de la renta sobre la pro­
babilidad de votar cuando existe un sesgo de selección y cuando
no lo hay. La curva es completamente plana cuando incurrimos
en el sesgo, pero claramente positiva cuando no existe este sesgo.
En otras palabras, el efecto causal de X sobre Y ha desaparecido
totalmente como consecuencia de la mala seleeGÍón-de ^obser-va=--
ciones.
Veamos qué sucede si la selección de observaciones se hace
en función de la variable independiente, la renta. Supongamos
que un investigador decide estudiar exclusivamente a aquellos
que tienen rentas bajas y medias. Por tanto, la tercera columna
del cuadro 3 se elimina artificialmente. Con esta selección de ob­
servaciones, para los individuos con renta baja la probabilidad de
votar es del 33,3 por ciento (dos votan y cuatro no), mientras que
para los de renta media es mayor: un 50 por ciento. Es decir, pa­
sar de una renta baja a una media aumenta esta probabilidad en
un 16,66 por ciento. Como se puede comprobar, la inferencia a la
que llegamos es la misma que realizábamos antes cuando estu­
diamos a toda la población. De este modo, la selección de las ob­
servaciones de acuerdo con la variable independiente nos ha lle­
vado a realizar una inferencia correcta. La única diferencia ahora
es que no podemos extender nuestro hallazgo a las personas de
renta alta, pero no introducimos ningún sesgo.
Para estudiar cuáles son las consecuencias de truncar la varia­
ble dependiente, esto es, limitar su variabilidad, pero permitiendo
que tenga alguna variación, en el cuadro 4 se analiza la relación
entre la valoración del gobierno en una escala 0-10 (0 es muy
7, ¿Qué se debe evitar &r tos diseños de investigación?

Figura 5. Sesgo de selección como consecuencia de eliminar la variación en la


variable dependiente.

mal y 10 muy bien) y la ideología en una población de nueve per­


sonas. Como se puede observar, las valoraciones del gobierno (en
este caso socialdemócrata) están muy ligadas a la posición ideo­
lógica. La media de valoración del gobierno de los individuos de
izquierda es 6, 4 la de los de centro y 2 la de los de derecha. Es
decir, cuanto más a la derecha se posiciona un individuo, peor es
La lomes, de is e x p licad en en Las cien cias soccsées

C u a d r o 4. R elació n en tre la v a lo ra c ió n del go b iern o y la


id e o lo g ía *

Ideología
Población: 9 individuos
Izquierda Centro Derecha

Valoración del gobierno (0-10) 4 2 0


6 4 2
8 6 4

* Los valores de cada casilla representan la valoración, no el número de individuos.


fuente: Elaboración propia.

la valoración. En particular, pasar de la izquierda al centro y del


centro a la derecha significa que la valoración del gobierno cae 2
puntos en cada desplazamiento.
Supongamos que un investigador decide estudiar exclusiva­
mente a aquellos que tiene valoraciones iguales o mejores que 4.
Es decir, escoge sus observaciones en función de la variable de­
pendiente, de manera que trunca, aunque no elimina, la variación
en la valoración: ya no hay evaluaciones por debajo de 4. Con
esta selección de observaciones, para los individuos de izquierda,
la media de valoración del gobierno es 6, mientras que para los
de centro es 5 y para los de derecha asciende a 4. E s decir, pasar
de un espacio ideológico a otro significa que la valoración cae
1 punto, cuando en realidad desciende 2. En definitiva, la selec­
ción de las observaciones de acuerdo con la variable dependiente
truncada nos ha llevado a realizar una inferencia incorrecta y a
estimar un efecto causal más débil del real.
En la figura 6 se representa el efecto de la ideología sobre la
valoración del gobierno cuando existe un sesgo de selección y
cuando no lo hay. La curva es más tendida cuando incurrimos en
el sesgo, de modo que el efecto causal estimado parece menor de
lo que es en la realidad.
i v ’ * . . ' t \

fuente : Elaboración propia.

Figura 6. Sesgo de selección como consecuencia de restringir la variación en la


variable dependiente.

Comprobemos qué ocurre si la selección de observaciones se


hace en función de la variable independiente, la ideología. Imagi­
nemos que un investigador decide estudiar exclusivamente a
aquellos que son de izquierda o centro. Por tanto, la tercera co­
lumna del cuadro 4 se elimina artificialmente. Con esta selección
U N I V E R S I D A D
i» ' ií . t e1 .'íi en las ciencias sociales

de observaciones, para los individuos de izquierda la media de la


valoración del gobierno es 6, y para los de centro es 4. Es decir,
pasar de un espacio ideológico a otro disminuye en 2 puntos la
valoración. Como se puede comprobar, la inferencia a la que lle­
gamos es la misma que realizábamos antes cuando estudiamos a
toda la población. La selección de las observaciones de acuerdo
con la variable independiente nos ha llevado a realizar una infe­
rencia correcta. La única diferencia es que ahora no podemos ex­
tender nuestro hallazgo a las personas de derecha, pero no intro­
ducim os ningún sesgo. Debe advertirse, adem ás, que si se
selecciona a los individuos de izquierda y derecha, se puede dejar
fuera a los de centro y llegar a una conclusión con el mismo ca­
rácter general sobre el efecto de la ideología sobre la valoración
del gobierno. Puesto que se satisface la homogeneidad causal, es
suficiente con conocer los dos puntos extremos-pura trazarla-lL
nea que los conecta. Y, por supuesto, esta línea pasa también por
el espacio de centro.
En definitiva, para realizar inferencias causales válidas debe­
mos seleccionar las observaciones en función de las variables in­
dependientes, no en términos de la dependiente. Hay que conse­
guir, en este sentido, (1) que haya cambio en 7 y (2) que no se
trunque 7. Sin embargo, esto no significa que la selección de ob­
servaciones en función de la variable dependiente no se pueda
hacer nunca. Cuando se revisa una teoría que presenta anomalías
empíricas, suele ser útil detenerse en los casos en los que se
constata un resultado negativo para identificar posibles variables
independientes olvidadas. Pero, de nuevo, no se pueden realizar
inferencias basadas en la teoría (Geddes, 2003: 129).

7.3. La multicolinealidad

L a multicolinealidad se refiere a las situaciones en las que la co­


rrelación entre dos (o más) variables independientes en un mode­
lo de explicación es tan alta, que no se puede separar el efecto
que cada una de ellas tiene sobre la variable dependiente. En
>• i"l . - 'estigadóri?

otras palabras, tenemos un problema de multicolinealidad cuan­


do, una vez que se recogen los datos de las observaciones, las va­
riables independientes se mueven conjuntamente de una manera
sistemática.
Por ejemplo, supongamos que deseamos explicar las diferen­
cias en el grado de interés por la política de los españoles. Dos
son las variables independientes que sugiere nuestra teoría: el ni­
vel de estudios (alto o bajo), la clave, y los ingresos (altos o ba­
jos), la de control. En el análisis de los datos que hemos recogido
para una muestra de individuos, resulta que todos los que tienen
un nivel de estudios alto también tienen ingresos altos. O, al re­
vés, no hay nadie con un nivel de estudios alto que tenga unos in­
gresos bajos. En este caso, no hay posibilidad de realizar una in­
ferencia sobre el efecto individual de los estudios y los ingresos.
-Ettando^-siguiendo la -lógica inferencial ya conocida, descompo­
nemos las observaciones de acuerdo con la variable de control,
dentro del grupo de individuos con un nivel de ingresos bajo, to­
dos tienen un nivel de estudios alto. En otras palabras, una vez
aisladas las personas con ingresos bajos, no es posible comparar
el interés por la política medio de los que tienen un nivel de estu­
dios alto y los que tienen uno bajo. Se colapsa el proceso. Y otro
tanto sucede en el grupo de los que tienen ingresos altos.
Formalmente, la multicolinealidad en este ejemplo significa
que tenemos el modelo;

Y= bj + b2 Estudios + Ingresos + ¡i (20)

donde,

Ingresos = c, + c2 Estudios (21)

de modo que ingresos es una función exacta de estudios, esto


es, se relaciona o se puede predecir perfectamente una variable
independiente a partir de la otra.
Si manejamos un ejemplo cualitativo, llegamos a la misma
conclusión sobre la imposibilidad de realizar inferencias sobre el

89
Le léate de la expiícaclóa rsn las riendas seriales

efecto individual de cada una de las variables. Supongamos que


nos interesa conocer por qué algunas transiciones a la democra­
cia tienen éxito y otras no. De acuerdo con nuestra teoría, el éxito
de una transición depende de dos variables independientes: la
existencia de un sistema electoral de representación proporcional,
la clave, y tener un sistema parlamentario, la de control. Cuando
analizamos los n países sobre los que hemos recogido datos, ob­
servamos que los sistemas parlamentarios se combinan siempre
con sistemas electorales de representación proporcional y los pre­
sidenciales con mayoritarios. De nuevo, al dividir los casos de es­
tudio en función de la variable de control, nos encontramos que
entre los países con sistemas parlamentarios no hay ninguno con
un sistema electoral mayoritario. Y a la inversa entre los países
con sistemas electorales presidenciales. En consecuencia, no es
posible comparar la suerte de la transición a la democracicrdentra
de cada grupo.
Los casos más frecuentes de multicolinealidad no son tan ex­
tremos como los que se contienen en estos ejemplos. Lo más ha­
bitual es que las variables independientes estén correlacionadas,
pero no perfectamente. Es muy difícil manejar variables indepen­
dientes que no tengan ninguna correlación. En los dos ejemplos
anteriores, la correlación es 1 (esto es, perfecta) y la multicoli­
nealidad es, por tanto, un problema. En general, cuando la corre­
lación entre las variables independientes supera el umbral de 0,8
en el coeficiente de correlación de Pearson, suele existir un pro­
blema grave de multicolinealidad2.
En este sentido, hay que tener en cuenta dos cuestiones bási­
cas para comprender las implicaciones y soluciones a la multico­
linealidad. Por un lado, se trata de un problema que se refiere a
las variables independientes en la muestra de datos que tenemos,
no necesariamente a toda la población. Si un científico social pu­
diera recoger los datos de acuerdo con un diseño experimental en
su estudio del interés por la política de los españoles, por ejem­
plo, la multicolinealidad desaparecería. Por otro, no se debe con­
cebir como algo que existe o no existe. Por el contrario, la muul-
ticolinealidad es una cuestión de grado, y es este grado el que
7
■ << í ,

determina la importancia del problema que tenemos. Obviamen­


te, como ya sabemos, a medida que su nivel aumenta, sus conse­
cuencias son más graves.
Las soluciones a la multicolinealidad pasan por:

1. Recoger más observaciones de manera que se reduzca la


correlación entre las variables independientes afectadas; en
los ejemplos anteriores, por un lado, habría que intentar in­
corporar individuos con un nivel de estudios alto e ingre­
sos bajos e individuos con un nivel de estudios bajo e
ingresos altos; por otro, añadir países con sistemas electo­
rales de representación proporcional y presidencialismo.
2. No obstante, sobre todo en los estudios cualitativos, a ve­
ces no es posible aumentar el número de observaciones:
-------- ln sp aíseseo n transiciones a la democracia con éxito son
los que son y no se puede añadir ninguno más. La única
solución a la multicolinealidad sería reducir el número de
variables independientes que se manejan en la explicación.
En los ejemplos anteriores, olvidarse de los ingresos y del
tipo de sistema político. Pero el problema que puede apare­
cer ahora, más grave incluso que la multicolinealidad, es el
sesgo por omisión de una variable relevante. Si cada varia­
ble independiente en la ecuación representa un mecanismo
causal distinto, será una mala idea eliminarla.

7.4. La endogeneidad

El significado y las consecuencias de la endogeneidad ya nos re­


sultan conocidos, puesto que se discutieron en la presentación de
uno de los supuestos necesarios para la estimación de efectos
causales: la independencia condicional. La endogeneidad aparece
cuando en nuestra explicación no está claro qué es la causa y qué
es el efecto: los valores de la variable independiente provienen a
veces de la dependiente en lugar de ser una de sus causas. En
otras palabras, la variable independiente también podría aparecer
La *-<p w L ■!'lfi sociales

como 7, y la dependiente, como X. Debido a que ambas variables


se influyen mutuamente, la relación de causalidad es circular o
bidireccional.
Por ejemplo, supongamos que un investigador plantea que los
individuos que mejor valoran a José Luis Rodríguez Zapatero
(A') son los que tienen una mayor propensión a votar al PSOE
(7 ). No parece necesario justificar que los ciudadanos prefieren
a los partidos liderados por personas sobre las que tienen una
buena opinión. Por tanto,

Voto PSOE = /?, + /3, Valoración Zapatero + ¡x (22)

Sin embargo, también parece evidente que los votantes socia­


listas habituales — para simplificar, los que ya apoyaban al PSOE
antes de que Zapatero fuera el lider— tienen una mayorqiropen-
sión a valorar bien a Zapatero que los votantes habituales del PP,
por ejemplo, independientemente de cualquier otra considera­
ción. En pocas palabras, Zapatero es simplemente el máximo re­
presentante de su partido. Es decir,

Valoración Zapatero = /3, + jS2 Voto PSOE + ¡x (23)

L a consecuencia fundamental de la endogeneidad es que no


nos permite realizar atribuciones causales correctas. Y a diferen­
cia de la multicolinealidad, la endogeneidad ya no es sólo un pro­
blema de los datos que manejamos, sino sustantivo o de nuestra
teoría.
En nuestro ejemplo, recogido en la ecuación (22), y debido a
la existencia de endogeneidad, estamos haciendo una estimación
de la influencia de la variable independiente, la valoración de Za­
patero (b2) sobre la probabilidad de votar al PSOE, que es igual a
la influencia correcta (e inobservable) (/32) más un factor de ses­
go, la propensión a valorarlo bien de los votantes socialistas habi­
tuales. Esto es,

E (b 2) = /32 + sesgo (24)


' * * ' i - -s de inr

Esto significa que el efecto causa] estimado de las variables


independientes incluidas, la valoración de Zapatero en (22), está
sesgado. Al omitir una variable independiente relevante, el hecho
de ser votante socialista habitual, correlacionada con la valora­
ción de Zapatero, una parte de su influencia se le atribuye a la
única que se ha considerado. Es decir, no sabemos qué parte del
efecto estimado refleja efectivamente la importancia causal de la
valoración de Zapatero y cuál el hecho de ser un votante socialis­
ta habitual. En fin, el término de azar en (22) ya no es aleatorio,
sino sistemático, puesto que está recogiendo, en una medida in­
determinada, el impacto de ser un votante socialista.
Un segundo ejemplo, en el que se adjudican valores a las va­
riables, puede ayudarnos a entender un poco mejor el problema
de la endogeneidad. Supongamos que un investigador plantea que
i de los licenciados españoles (Y), medido
en una escala de 0 a 10, depende de una única variable indepen­
diente: la carrera que han estudiado. Para simplificar, los que han
cursado ciencia política y, debido a su contacto con la politica
como objeto de estudio, deberían tener un mayor interés por la
política que los que han cursado otra carrera. Cuando el investi­
gador recoge los datos para una muestra representativa de los li­
cenciados españoles, comprueba que los licenciados en ciencia
política tienen un valor medio 8 en la escala de interés por la po­
lítica, mientras que los demás licenciados tienen un valor medio
de 6. Por tanto, infiere que el efecto causal de estudiar ciencia
política en el interés por la política supone dos puntos más.
Sin embargo, parece evidente que la decisión de estudiar cien­
cia política en lugar de otra licenciatura tiene que ver con el he­
cho de que la política sea más o menos atractiva para una perso­
na. Es decir, bien podría ser que el interés por la política (X ) haya
sido la causa de cursar ciencia política en lugar de otra carrera
(7 ). Tenemos, por tanto, un problema de endogeneidad. Si antes
de empezar los estudios universitarios el interés por la política
medio de los futuros estudiantes de ciencia política se situaba en
el punto 7 y el de los estudiantes de otras carreras en 5, esta dife­
rencia de 2 puntos es la misma que observamos una vez termina­
Ls lógica de la expocadón en las dersdas ¡mcíales

da la carrera. Es decir, la licenciatura estudiada no tendría en rea­


lidad ningún efecto sobre el interés por la política, puesto que la
diferencia que constatamos ya existía antes de que entrara enjue­
go la variable independiente. En definitiva, la endogeneidad nos
habría llevado a realizar una inferencia causal inválida o sesgada.
Pero en la práctica, y a diferencia de este ejemplo, no podemos
determinar el efecto de la endogeneidad.
Entre las estrategias para afrontar un problema de endogenei­
dad (King, Keohane y Verba, 2000: 197-206), la que tiene una
aplicación más fácil es, en mi opinión, convertir la endogeneidad
en un sesgo producido por una variable omitida y controlar esta
variable. En el primer ejemplo que estamos manejando, se trata­
ría de que ser votante socialista antes de la elección de Zapatero
se analice como una variable causal anterior a la formación de las
opiniones sobre el líder socialista. Es decir, -habria-que-eontr-olaí-
esta variable, de manera que se comparara la probabilidad media
de votar al PSOE, por un lado, entre los que ya eran votantes so­
cialistas antes de la elección de Zapatero y que valoran bien a Za­
patero y los que lo valoran mal; y, por otro, entre los que no eran
votantes socialistas antes de la elección de Zapatero y que valo­
ran bien a Zapatero y los que lo valoran mal. En el segundo, el
interés por la política inicial o anterior a cursar los estudios uni­
versitarios debería aparecer en el lado derecho de la ecuación.

7.5. La forma funcional: la linealidad por defecto

Todas las teorías sustantivas plantean qué variables independien­


tes se relacionan o explican la dependiente y cuál es la dirección
o signo de su efecto. Por ejemplo, se puede establecer que la ren­
ta de una persona debería tener una influencia positiva en el nú­
mero de veces que se va al cine: a mayor renta, mayor es la inver­
sión en ocio. Sin embargo, pocas teorías políticas o sociales
plantean cómo es la relación entre X e Y, esto es, cuál es la forma
funcional de esta relación. La respuesta empírica más habitual a
este silencio de las teorías es lo que Beck y Jackman (1998) han
7, ¿ O u é js e debe evita:' er> ios diseños de in v e s tig a c ió n ?

denominado la «linealidad por defecto»: Y es una función lineal


de X. Es decir, un incremento igual en X produce siempre el mis­
mo cambio en Y, sea cual sea el valor de X. Por ejemplo, pasar de
0 a 1 mil euros de renta anual tendría el mismo efecto en la pro­
babilidad de votar que pasar de 18 a 19 mil.
El problema de esta linealidad por defecto es que a veces las
variables se relacionan no-Uneaímente. Por ejemplo, en la figura
7a se presenta la relación (ficticia) entre el número de veces que
una persona va al cine al año (Y) y su renta anual medida en mi­
les de euros (X). Como se puede comprobar, las observaciones
no se ajustan demasiado bien a una línea recta, pese a que el
efecto de la renta es positivo. Más bien parece que la relación en­
tre las dos variable es curvilínea: cuando la renta anual es muy
baja, sus incrementos tienen un efecto fuerte en el número de ve-
ces-quense.aSTS| C a ] cine; pero a partir de los 6 mil euros ya no se
va más al cine aunque aumente la renta: se ha alcanzado el um­
bral de saturación.
Si en lugar de una curva se ajusta una línea, se comete un
error de especificación de la forma funcional. Un modelo de ex­
plicación tiene problemas de especificación incorrecta de la for­
ma funcional cuando no plantea adecuadamente cómo es la rela­
ción entre la variable dependiente y las independientes. La
consecuencia no es otra que una estimación sesgada del efecto de
X sobre Y, en nuestro ejemplo del efecto de la renta sobre la asis­
tencia al cine. Ya sabemos que los errores, en este caso los resi­
duos (la diferencia entre los valores observados de Y y los valores
predichos de Y con el modelo teórico propuesto), tienen que ser
aleatorios para que nuestras inferencias causales sean válidas. Y
en la figura 7a no lo son: empiezan siendo negativos, a partir de
la segunda observación pasan a ser positivos, alcanzan un máxi­
mo y comienzan a ser negativos a partir de la octava observación.
En otras palabras, hay una tendencia sospechosa.
Cuando la forma funcional lineal se sustituye por una curvilí­
nea (figura 7b), somos capaces de analizar mejor la relación en­
tre la renta y la asistencia al cine. Y si analizamos de nuevo los
residuos, ahora sí parecen aleatorios: se suceden los positivos y

i
lógica de le expíe csdói'V erf las ciencias sociales

fu en te: Elaboración propia.

Figura 7a. Relación entre la asistencia al cine (K) y la renta anual en miles de
euros (X).

fu en te: Lago y Montero (2005).

Figura 7b. Relación entre la asistencia al cine (Y) y la renta anual en miles de
euros (X).
7, \f ^ .“'i f ' u "jy; n

negativos sin ninguna tendencia definida. En fin, aunque las va­


riables independientes que manejamos son las mismas ahora que
antes, el cambio de la forma funcional nos ha permitido explicar
mejor la variable dependiente.
En la figura 8 se presenta un ejemplo real que se ha extraído
del estudio de Lago y Montero (2005) sobre el sistema electoral
español. La sobrerrepresentación en escaños del partido mayori-
tario en las circunscripciones depende de la magnitud de distrito,
esto es, de cuántos diputados se eligen en cada una. Pero no de
una manera lineal, sino logarítmica: la prima electoral del partido
mayoritario se reduce rápidamente cuando se incrementa el nú­
mero de escaños en juego en las primeras unidades para desace­
lerarse progresivamente.

fu en te: Lago y Montero (2005),

Figura 8. Relación entre las primas electorales del partido mayoritario y la


magnitud de distrito en las elecciones generales de 1977 en España.
¿Cómo podemos saber cuál es la forma funcional adecuada en
la relación entre X e 7? Aunque existen técnicas que nos pueden
ayudar (Fox, 2000), es nuestra teoría la que nos debe dar la res­
puesta. Una buena teoría no sólo nos cuenta qué pasa y qué hace
que pase o qué impide que pase, sino también cómo pasa.
8. Epílogo

En este libro se ha sostenido que la explicación en ciencias socia­


les descansa sobre el establecimiento de un efecto causal y la
provisión de un mecanismo que muestre de qué manera tiene lu­
gar este efecto: la investigación social debe diseñarse para conse­
guir ambos elementos.
La capacidad de plantear un mecanismo causal robusto depen­
de de que la teoría que se maneja sea buena. Se trata, por tanto,
de un problema sustantivo y específico de cada pregunta de in­
vestigación. La realización de inferencias causales se basa en una
lógica común a todos los estudios con ambiciones empíricas, al
margen de cuál sea su pregunta o su estilo, cuantitativo o cualita­
tivo. Y esta lógica pasa por evitar las relaciones espurias a través
del cumplimiento de dos supuestos: la homogeneidad de las uni­
dades o causal y la independencia condicional.
Por un lado, debemos lograr, mediante la introducción de las
variables de control necesarias, que la única diferencia entre dos
unidades tenga que ver con la variable independiente clave. Así
se le podrá atribuir cualquier diferencia en la variable dependien­
te entre las dos unidades. Por otro, cuando se seleccionan las ob-
, . - - r v "

servaciones no se puede predeterminar el resultado, bien sea res­


tringiendo o eliminando la variabilidad de la variable dependien­
te. Escoger las observaciones en función de las variables inde­
pendientes asegura la satisfacción de esta exigencia.
En definitiva, sólo cuando tengamos una buena teoría y haya­
mos seguido la lógica inferencial que se ha desgranado en este
ensayo, tendremos una explicación aceptable. La metodología no
convierte nunca las malas teorías en investigaciones válidas y, a
la inversa, una buena teoría combinada con una metodología de­
fectuosa da lugar a investigaciones inválidas.
9. Preguntas y problemas

1. Un investigador plantea que estudiar la licenciatura de ciencia


política aumenta el interés por la política en comparación con es­
tudiar cualquier otra licenciatura. Cuando observa los datos de
los individuos licenciados, en efecto descubre que a los estudian­
tes de ciencia política en España les interesa más la política que a
los demás universitarios. Discute el argumento y sus resultados
desde un punto de vista metodológico.

En este estudio existe un problema de endogeneidad: la variable in­


dependiente, la licenciatura estudiada, es la causa de la variable
dependiente, el interés por la política, una vez que se ha cursado la
carrera. Pero la variable dependiente es también la causa de la in­
dependiente en un momento anterior, puesto que cuando un indivi­
duo decidió qué carrera estudiar, con seguridad los que tenían un
mayor interés por la política fueron los que acabaron cursando
ciencia política. La inferencia causal que hace el investigador no es
válida y, además, ya que se carece de datos sobre el interés de la
política de los individuos antes de comenzar sus estudios universi­
tarios, no es posible determinar la dirección e intensidad del error.
La logice os í& explicación se; Lis d e o d s i sociales

Para resolver este problema, el investigador debería analizar


las diferencias en el interés por la política de los individuos sólo
durante los años que se cursan los estudios universitarios. La va­
riable dependiente no debería ser el nivel de interés por la políti­
ca al acabar la carrera, sino su diferencia desde el momento en
que se inicia y en que se termina. En otras palabras, el interés
por la política antes de comenzar la carrera debería convertirse
en una variable independiente más.

2. Un investigador está interesado en mostrar cómo influyen los


años de estudio en la remuneración mensual de los trabajadores.
Para realizar su análisis empírico se queda con los trabajadores
que superan el percentil 50 en su salario. Explica las consecuen­
cias de esta decisión sobre la inferencia causal. ¿Qué sucedería
de nuevo en términos de la inferencia causal si escogiera a los
trabajadores que se encuentran por debajo del percentil 50 en los
años de estudio? ¿Por qué?

En el primer caso, se están seleccionando las observaciones, en


este caso los trabajadores, en función de 1a. variable dependiente,
el salario. La consecuencia es la existencia de un sesgo de selec­
ción, debido a que se está predeterminando el resultado. Al res­
tringir la variabilidad de los salarios, ya no es posible encontrar
personas que ganen poco dinero: sea cual sea el nivel de estudios,
todos superan el percentil 50 en su salario La inferencia causal
está sesgada. En el segundo caso, la selección de las observacio­
nes se realiza en función de la variable independiente, los años de
estudio. No se comete, por tanto, ningún error, puesto que el inves­
tigador no predetermina los valores de la variable dependiente. Es
posible que algunos trabajadores con una elevada cualificación
ganen mucho dinero y otros poco. La única consecuencia de la se­
lección de observaciones que se lleva a cabo es que las conclusio­
nes a las que se llega sólo son válidas para los trabajadores que
están por debajo del percentil 50 en los años de estudio, pero no
para todos.
< 'l. - l<

3. Supongamos que en e] año 2006 los accidentes de tráfico en


España alcanzan su nivel más bajo desde que se tienen datos al
respecto, 1980. Además, en el año 2006, por un lado, se ha em­
pleado por primera vez carné por puntos, y, por otro, se aplican
también por primera vez penas de cárcel a todos los individuos
que circulan por encima de la velocidad permitida. El director de
la Dirección General de Tráfico concluye en su informe anual
que el carné por puntos ha resultado un completo éxito, puesto
que ha permitido que los accidentes de tráfico en España hayan
alcanzado su nivel más bajo desde que se tienen datos. Discute la
afirmación del director de la DGT.

Aunque supongamos que la España de 1980 sea igual a la de


2006 en cualquier variable independiente interviniente, ademéis
AeJas-dospus nos interesan, la inferencia que realiza el director
de la DGT no se puede hacer. No existe ningún año en el que se
haya aplicado el carné por puntos y no las penas de cárcel, y a la
inversa. Es decir, no es posible separar el efecto de cada una de
estas variables independientes sobre la dependiente, el número de
accidentes de tráfico. Tenemos un problema de multicolinealidad
perfecta y, por tanto, no se puede hacer una inferencia causal.
Para resolver este problema deberíamos reducir la correlación
entre las dos variables independientes. Una posibilidad, improba­
ble, es conseguir que el gobierno español nos eche una mano y
decida suspender durante algunos años la aplicación de alguna
de las dos medidas. La segunda posibilidad, la que deberíamos
seguir, es buscar datos de otros países en los que sólo se emplee
una de las dos medidas. Pero hay que tener en cuenta que segu­
ramente haya alguna diferencia entre estos países y España en lo
que se refiere a otras variables independientes, como el número
de coches o la velocidad máxima permitida, por ejemplo. Será
necesario controlarlas para poder hacer una inferencia causal
válida.

4. Dada la extraordinaria importancia que las elecciones tienen


en las democracias contemporáneas, el comportamiento electoral
La expiJícadén- en
5KÍ&¡

sólo puede ser una variable dependiente en las investigaciones.


Discute esta afirmación.

Se trata de una afirmación falsa. No hay nada en una variable


que la haga ser dependiente o independiente por definición. Todo
depende de cuál sea la pregunta de investigación que nos plante­
emos. Por ejemplo, nos puede interesar estudiar las razones de
que alguna gente vote o no: el comportamiento electoral es aquí
la variable, dependiente. Pero también nos podría interesar estu­
diar cómo influye el número de votantes en la estabilidad de las
democracias. El comportamiento electoral es ahora la variable
independiente.

5. Un investigador está interesado en mostrar cómo afecta el gas­


to público al crecimiento económico. Para realizar-su análisis-
empírico se queda con los países cuyo gasto público supera el
percentil 60. Explica las consecuencias de esta decisión sobre la
inferencia causal. ¿Qué sucedería de nuevo en términos de la in­
ferencia causal si escogiera países cuyo crecimiento económico
estuviera por encima del 3 por ciento anual (en términos de
PIB)? ¿Por qué?

En el primer caso, se están seleccionando las observaciones, en


este caso los países, en función de la variable independiente, el
gasto público. No se comete, por tanto, ningún error, puesto que el
investigador no predetermina los valores de la variable depen­
diente, el crecimiento económico. Es posible que algunos países
con un elevado gasto público crezcan mucho y otros poco, nada o
en negativo. La única consecuencia de la selección de observacio­
nes que se lleva a cabo es que las conclusiones a las que se llega
sólo son válidas para los países cuyo gasto público está por enci­
ma del percentil 60. En el segundo caso, la selección de las obser­
vaciones se realiza en función de la variable dependiente, el cre­
cimiento económico. La consecuencia es la existencia de un sesgo
de selección, debido a que se está predeterminando el resultado.
Al restringir la variabilidad del crecimiento económico, ya no es
posible encontrar países que crezcan por debajo del 3 por ciento:
sea cual sea el nivel de gasto público, todos los países superan el
3 por ciento de crecimiento. La inferencia causal está sesgada.

6. Un investigador plantea que estar desempleado depende ex­


clusivamente de la acumulación de capital humano de cada indi­
viduo, en particular, los años de estudio que ha realizado. Otro
estudioso del tema le replica que también importa el número de
zanahorias que ingiere un individuo. Discute cuáles pueden ser
las posibles consecuencias de que no aparezca esta segunda va­
riable en el modelo de explicación.

Supongamos que el número de zanahorias que ingiere un indivi­


duo fuera una variable independiente relevante. Su omisión su-
pondria un sesgo eñlá inferencia de la influencia del capital hu­
mano sobre estar desempleado si existiera alguna correlación
entre las dos variables independientes. Así mismo, la dirección
del sesgo dependería del signo de esta correlación. No obstante,
no parece que haya correlación alguna entre las dos variables,
de modo que excluirla no produciría sesgo. Pero no hay ningún
mecanismo causal que nos haga esperar que el número de zana­
horias que ingiere un individuo pueda influir en su situación la­
boral. Esta variable independiente resulta irrelevante y, por lo
tanto, debemos excluirla de nuestro modelo de explicación para
no incurrir en ineficiencia.

7. Puesto que la omisión de variables relevantes suele llevar al


sesgo, un investigador debe tener en cuenta el mayor número po­
sible de variables en su modelo de explicación de un fenómeno.
Discute esta afirmación.

Efectivamente, cuanto mayor sea el número de variables inde­


pendientes que se tiene en cuenta, menos probable es que se in­
curra en un sesgo de especificación. Pero cuando se incluyen en
el modelo de explicación variables irrelevantes, se cae en la ine­
ficiencia. En definitiva, sólo tenemos que considerar las varia-

105
La lógica áe la exptkacism ars tasjríenclas sacíalas

bles que importan, aunque es menos grave la ineficiencia que el


sesgo. Por tanto, en caso de duda acerca de incluir o no una va­
riable, es mejor hacerlo.

8 . ¿Cómo se puede asegurar que una correlación entre dos varia­


bles sea causalidad y no algo espurio?

Por un lado, debe demostrarse que la relación entre las dos va­
riables se mantiene cuando se introducen variables de control. Si
la relación entre ellas desaparece cuando se añade una tercera
variable, esto significa que era espuria. Por otro, debe señalarse
algún mecanismo causal que muestre cómo la variable indepen­
diente influye en la dependiente. Si no somos capaces de hacerlo,
nos queda la duda de que esta relación sea espuria.

9. Supongamos que nos interesa estimar la importancia del nivel


de estudios en el salario de los españoles y que utilizamos una en­
cuesta en la que la selección de los individuos es aleatoria. Un pri­
mer investigador se queda sólo con aquellos individuos que de
acuerdo con la encuesta tienen estudios de bachillerato o universi­
tarios. Un segundo investigador se queda sólo con aquellos indivi­
duos que de acuerdo con la encuesta tienen estudios primarios, de
bachillerato o universitarios. Explica las diferencias en las inferen­
cias que se pueden hacer en cada caso, si crees que existe alguna.

Los dos investigadores están seleccionando las observaciones,


individuos, en términos de la. variable independiente, el nivel de
estudios. No se comete, por tanto, ningún error, puesto que nin­
guno de los dos predetermina los valores de la variable depen­
diente, el salario. La única consecuencia de la selección de ob­
servaciones que se lleva a cabo es que las conclusiones a las que
llega el primer investigador sólo son válidas para los individuos
que tienen estudios de bachillerato o universitarios, mientras que
las del segundo son además válidas para los que cuentan con es­
tudios primarios. Por tanto, el segundo investigador puede exten­
der sus conclusiones a más individuos que el primero.
10. Para que haya una relación causal entre dos variables es ne­
cesario que exista alguna correlación entre ellas. ¿Verdadero o
falso? ¿Por qué?

Verdadero. Del mismo modo que la ausencia de correlación entre


dos variables nos lleva a concluir que no es posible que haya una
relación causal entre ellas, sólo cuando descubrimos alguna co­
rrelación es posible que tengamos causalidad. Pero correlación
no es causalidad. Para que sea así es necesario que demostremos
que no se trata de una relación espuria a través de la inclusión
de variables de control y de la provisión de un mecanismo causal
que plantee de qué manera tiene lugar el supuesto efecto.

11. Supongamos que queremos explicar una variable dependien-


te determinada. U n.investigador plantea un modelo de explica­
ción con tres variables independientes. Un segundo investigador
plantea un modelo de explicación con siete variables indepen­
dientes. ¿Cuál de las dos es mejor? ¿Por qué?

Depende que cuál sea el modelo verdadero o correcto. Si en reali­


dad hacen falta tres variables independientes para explicar la de­
pendiente, el modelo propuesto por el primer investigador es el
correcto. El del segundo investigador tendría un problema de efi­
ciencia, puesto que, al manejar cuatro variables innecesarias, ne­
cesitará más observaciones para llegar al mismo resultado que el
primer investigador. En otras palabras, en este segundo caso la
explicación es mucho menos parsimoniosa. Si, por el contrario,
en realidad hacen falta siete variables independientes para expli­
car la dependiente, el modelo propuesto por el segundo investiga­
dor es el correcto. El del primero tiene varios sesgos por omisión
de variables relevantes, de modo que sus inferencias sobre las va­
riables independientes que tiene en cuenta serán incorrectas.

12. Un investigador está interesado en mostrar cómo influye co­


mer salchichas en el peso. Para realizar su análisis empírico se
queda con los individuos que superan los 80 kilogramos de peso.
Explica las consecuencias de esta decisión sobre la inferencia
causal. ¿Qué sucedería de nuevo en términos de la inferencia cau­
sal si escogiera a los individuos que comen más de 148 salchi­
chas al año? ¿Por qué?

En el primer caso, se están seleccionando las observaciones, en


este caso individuos, en función de la variable dependiente, el
peso. La consecuencia es la existencia de un sesgo de selección,
debido a que se está predeterminando el resultado. Al restringir
la variabilidad del peso, ya no es posible encontrar personas que
tengan un peso inferior a los 80 kilos: sea cual sea el número de
salchichas ingeridas, todos superan los 80 kilos. La inferencia
causal está sesgada. En el segundo caso, la selección de las ob­
servaciones se realiza en función de la variable independiente,
las salchichas ingeridas. No se comete, por tanto,ningúmerjxjr^
puesto que el investigador no predetermina los valores de la va­
riable dependiente. Es posible que entre los individuos que co­
man más de 148 salchichas haya personas gordas y otras delga­
das. La única consecuencia de la selección de observaciones que
se lleva a cabo es que las conclusiones a las que se llega sólo son
válidas para los individuos que comen más de 148 salchichas,
pero no para todos.

13. Un investigador plantea que estudiar un carrera universitaria


aumenta el coeficiente de inteligencia de los individuos. Cuando
observa los datos, descubre que los individuos con estudios uni­
versitarios son más inteligentes que los que no los tienen. Discute
el argumento y sus resultados desde un punto de vista metodoló­
gico, no sustantivo.

En este estudio existe un problema de endogeneidad: la variable


independiente, estudiar una carrera, es la causa de la variable
dependiente, el grado de inteligencia, una vez que se ha cursado
la carrera. Pero la variable dependiente es también la causa de
la independiente en un momento anterior, puesto que los indivi­
duos que estudian una carrera seguramente tenían en términos

2 1
9. Preguntas y problemas

medios una mayor inteligencia que los que no la estudian. La in­


ferencia causal que hace el investigador no es válida y, además,
puesto que se carece de datos sobre la inteligencia de los indivi­
duos antes de comenzar sus estudios universitarios, no es posible
determinar la dirección e intensidad del error.
Para resolver este problema, el investigador debería analizar
las diferencias en la inteligencia de los individuos sólo durante
los años en que se cursan los estudios universitarios. La variable
dependiente no debería ser el coeficiente de. inteligencia al aca­
bar la carrera, sino su diferencia entre el momento en que se ini­
cia y en que se termina.

14. Para determinar si el colesterol depende del ejercicio físico o


simplemente de la genética, un investigador realiza el siguiente
-experimento:una vez seleccionados 70 pares de hermanos geme­
los, uno de ellos es sometido a un intenso entrenamiento deporti­
vo diario durante tres meses, mientras que el otro realiza una vida
completamente sedentaria. Discute la importancia de que el ex­
perimento tenga como sujetos de estudio a hermanos gemelos.

Puesto que los hermanos gemelos son genéticamente iguales, to­


das las variables que pueden influir en el colesterol están perfec­
tamente controladas —son iguales o constantes entre ellos— ex­
cepto una: la variable independiente clave, en este caso el
ejercicio. Cualquier diferencia en la variable dependiente, el co­
lesterol, se puede atribuir al entrenamiento. En fin, la selección
de hermanos gemelos garantiza el supuesto de la homogeneidad
de las unidades o causal.

15. Un investigador está interesado en mostrar cómo influyen los


años de estudio en el número de libros que lee un individuo. Para
realizar su análisis empírico se queda con los individuos que han
leído más de 25 libros al año. Explica las consecuencias de esta
decisión sobre la inferencia causal. ¿Qué sucedería de nuevo en
términos de la inferencia causal si escogiera a los individuos que
tienen menos de 5 años de estudios? ¿Por qué?
f , ' !'■!

En el primer caso, se están seleccionando las observaciones, en


este caso individuos, en función de la variable dependiente, el
número de libros leídos. La consecuencia es la existencia de un
sesgo de selección, debido a que se está predeterminando el re­
sultado. Al restringir la variabilidad del número de libros leídos,
ya no es posible encontrar personas que hayan leído menos de
25 libros al año: sea cual sea el número de años de estudio que
se acumulen, todas las personas superan los 25 libros. La infe­
rencia causal está sesgada. En el segundo caso, la selección de
las observaciones se realiza en función de la variable indepen­
diente, los años de estudio. No se comete, por tanto, ningún error,
puesto que el investigador no predetermina los valores de la va­
riable dependiente. Es posible que entre los individuos que cuen­
tan con menos de 5 años de estudio haya personas que hayan leí­
do muchos libros y otros ninguno.-La-única-c&nsecuencia-deJa.
selección de observaciones que se efectúa es que las conclusio­
nes a las que se llegan sólo son válidas para los individuos que
tienen menos de 5 años de estudios.

16. Un investigador quiere estudiar cómo influye la renta per cá­


pita de un país en la probabilidad de que sea una democracia. Su
hipótesis es que a mayor renta, más probable es la democracia.
Para contrastar su hipótesis, estudia los países de la Unión Euro­
pea. Discute el diseño de la investigación.

Puesto que todos los países de la Unión Europea son democra­


cias, el diseño de investigación contiene un sesgo de selección:
la selección no permite que se produzca ninguna variación en la
variable dependiente, la existencia de democracia. La conclusión
(errónea) a la que se llegaría sería que la renta per cápita no im­
porta en que se establezca una democracia, puesto que todos los
países estudiados, sea cual sea su renta per cápita, son democra­
cias. Para poder estimar adecuadamente este efecto causal sería
necesario que se estudiaran también países no democráticos,
esto es, fuera de la Unión Europea....................................

110
f ¡íU - . . .

17. Un investigador observa que los individuos mayores de 18


años en España dedican menos horas a la semana a practicar de­
porte que los menores de 18. Su conclusión es que el derecho de
sufragio (que se concede a los 18 años) causa una menor propen­
sión a practicar deporte. Discute en términos metodológicos esta
conclusión.

La relación aparentemente causal entre tener el derecho de su­


fragio y el deporte es espuria. No hay ningún mecanismo causal
que pueda justificarla. La correlación entre las dos variables se
debe a que son efectos de una causa común: la edad. Los mayo­
res de 18 años practican menos deporte que los menores de edad
y, al mismo tiempo, son los que pueden votar.

” 18; ^Prescindir de una variable independiente relevante en la ex­


plicación de un fenómeno siempre provoca un sesgo en el efecto
de las restantes variables independientes consideradas. ¿Verdade­
ro o falso? ¿Por qué?

Falso. La omisión de una variable independiente relevante sólo


provoca un sesgo en el efecto de las incluidas cuando existe algu­
na correlación entre ellas: cuanto mayor sea la correlación, ma­
yor será el sesgo. De todos modos, y desde un punto de vista em­
pírico, resulta sumamente difícil encontrar dos variables
independientes relevantes que tengan una correlación igual a
cero.
1
Notas

Capítulo 1
1 Sobre esta crítica, véase Geddes (2003: 5).
2 Para un análisis más detallado de esta cuestión, véase King, Keoha-
ne y Verba (2000: 24-29).
3 Véase King, Keohane y Verba (2000: 107-124).

Capítulo 2
1 Las denominadas leyes de Duverger (Duverger (1987 [1951]: 232-
233) establecen que la representación proporcional conduce a un sistema
pluripartidista con partidos rígidos, estables e independientes; que el sis­
tema de mayoría a dos vueltas tiende a un pluripartidismo con partidos
flexibles, dependientes y relativamente estables, y que el sistema de ma­
yoría relativa conduce a un sistema bipartidista con partidos grandes e
independientes que se alternan.
2 Aunque no exenta de críticas, sobre todo por parte de los especialis­
tas en política comparada (American Política] Science Association,
1995; Brady y Collier, 2004).
3 Elster (2000: 36-42) señala que existen muchas situaciones, como
en las que hay una tercera variable que explica tanto la variable aparente­
mente explicativa como la dependiente, en las que el significado de la
causalidad no puede expresarse mediante enunciados contrafácticos. Si
C es suficiente para A, explica Elster, y necesario para B, el enunciado
contrafáctico de que «si A no hubiera ocurrido, B no habría ocurrido» es
verdadero, pero el causal de que «A causó B» es falso. La condición de
no necesario surge de la posibilidad de causación precedente. Si C no
hubiera producido B en caso de estar A ausente, el enunciado causal si­
gue siendo válido, pero el contrafáctico es falso. No obstante, y como
nos recuerdan King, Keohane y Verba (2000: 246-247), Elster no hace
más que mencionar problemas habituales de las inferencias que, en cier­
ta medida, son siempre inciertas. El propio Elster (2000: 37) reconoce
que los enunciados contrafácticos tienen una función importante en el
análisis causal. De ahí que su argumento, como concluyen King, Keoha­
ne y Verba, sea más convincente si se considera como un conjunto de
valiosas advertencias contra la utilización descuidada de los contrafácti­
cos que como una crítica a su uso.
4 Véase también Weber (1949).
5 Desde luego, este presupuesto es falso, pero resulta útil para simpli­
ficar la discusión.

Capítulo 3
1 El apartado 7 de este ensayo se dedica precisamente a estudiar en qué
condiciones el término de azar de un modelo pierde esta condición.
2 Y no sería extraño que las circunscripciones elegidas para que Az-
nar dé los mítines sean aquellas en las que el PP tiene más seguidores.

Capítulo 5
1 Se podría añadir un tercer supuesto, que King, Keohane y Verba
(2000) plantean menos explícitamente, y que se conoce como la inde­
pendencia de las observaciones, esto es, que el valor de una variable
determinada no está influido por el valor en otra observación. La per­
turbación aleatoria de una observación no debe influir así en la pertur­
bación aleatoria de otra observación. Este supuesto, que en el análisis
de regresión se conoce como no autocorrelación, es importante en los
estudios longitudinales, pero prescindible en los que sólo contemplan
un punto en el tiempo o de sección cruzada. De todos modos, en la
medida en que no invalida las inferencias causales, sino que simple­
mente las hace menos precisas, es menos importante que los otros
dos. Para un revisión de este problema, puede verse Gujarati (1997:
cap. 12).
2 Con mayor precisión, el valor esperado no se refiere al valor que
uno debería anticipar para cada caso analizado, sino al valor medio en
distintas réplicas hipotéticas de cada caso. Recordemos que el azar im­
porta en la definición de los valores de la variable dependiente.
3 Para un repaso sencillo de los problemas inferenciales en el análisis
de regresión, puede verse Gujarati (1997: cap. 8).
4 En realidad, cuando se manejan datos reales, los investigadores no
tienen la capacidad de asignar casos a los grupos de tratamiento y con­
trol. La asignación tiene lugar efectivamente, pero son los propios proce­
sos sociales y políticos los que la realizan. Y los investigadores no sue­
len tener control sobre ellos.
5 Sobre los fundamentos sustantivos de este ejemplo, puede verse
Colomer (2003).

Capítulo 6
1 Véase en este sentido los recientes trabajos de Brady y Collier (2004)
y Johnson (2006), cuya crítica a King y Keohane y Verba (2000) se plan­
tea precisamente en estos términos.
2 Por supuesto, estas modalidades de explicación no son las únicas
que existen, aunque sí las más populares. Elster (2000) distingue tam­
bién..la^ex^icaciónfuncional, basada en el supuesto de que todos los fe­
nómenos sociales y psicológicos deben tener un significado, es decir,
debe haber algún sentido, alguna perspectiva en la que son beneficiosos
para alguien o algo; y que además estos efectos beneficiosos son los que
explican el fenómeno estudiado. Y Bunge (1997) añade la explicación
interpretativa, centrada en el sentido, significado o intención de una ac­
ción.
3 En los estudios cualitativos con pocas observaciones y escasas va­
riables enjuego se lleva a cabo efectivamente esta descomposición. Pero
no en los cuantitativos, puesto que existen técnicas estadísticas, en par­
ticular, la regresión, que permiten controlar simultáneamente todas las
variables independientes.
4 Es también cierto que Duverger (1992 [1950], 38 ss., y 1987
[1951], 235 ss.) señala dos razones teóricas para justificar la eliminación
por la regla mayoritaria de los terceros partidos: el «efecto mecánico» de
infraiTepresentación de los partidos mayoritarios y el «psicológico» de los
votantes que no desean desperdiciar sus votos. Pero de nuevo están
ausentes los microfúndamentos o las condiciones teóricas e instituciona­
les bajo las cuales se alcanzan estos resultados.
5 Funcionalismo puede tener connotaciones negativas para algunos
lectores. Para una aclaración de su significado en la obra de Merton pue­
de verse Mahner y Bunge (2001).
6 Para una revisión crítica puede verse Mahoney (2003).
7 Esta contraposición simplifica mucho la discusión. Para un análisis
preciso y riguroso de la relación entre las dimensiones identitaria y elec­
tiva del comportamiento político, puede verse el reciente libro de Agui-
lar y Chuliá (2007), en particular los capítulos ¿ y ¿.
8 Véase también King, Keoahne y Verba (2000: 96-98).

Capítulo 7
1 En Dougherty (2002: 197-199) se puede encontrar una discusión en
términos formales del problema.
2 Pero, como cualquier regla empírica, hay que tomarla con cautela.
Es posible que una multicolinealidad grave no se refleje en una correla­
ción bivariada; una variable independiente puede ser una combinación
de varias variables independientes en el modelo y, por tanto, su correla­
ción individual con cada una de ellas sea baja.
Glosario

Correlación: Asociación entre dos variables,


j Correlación/relación espuria: Relación aparentemente causal entre la variable
¡ dependiente y la independiente que en realidad no existe, puesto que está cau-
j sada por una tercera variable.
j Explicación: Una afirmación sobre por qué ha sucedido un resultado.
| Hipótesis: Respuesta tentativa o provisional a una pregunta de investigación. En
j el análisis causal, es la conjetura sobre la relación entre una o más variables
¡ independientes y la dependiente.
1 Hipótesis alternativa: Es la hipótesis de nuestro modelo teórico que establece la
existencia de una relación entre dos variables.

I
Hipótesis nula: Es la hipótesis que se quiere rechazar en una investigación y que
normalmente postula que no existe ninguna relación entre dos variables.
Cuando se rechaza, se hace para aceptar la hipótesis alternativa.

Inferencia: El proceso de usar los datos para extraer conclusiones más amplias
sobre conceptos e hipótesis que son el objeto de la investigación.
Inferencia causal: El proceso de conseguir conclusiones sobre la causalidad de
acuerdo con los datos observados.
¡ Inferencia descriptiva: El proceso de conseguir conclusiones descriptivas de
¡ acuerdo con los datos observados.
117
Observación: Los valores de las variables para cada unidad de análisis.
¡ Operacionalización: La transformación de las hipótesis teóricas en operaciones
de investigación empírica.
Lj: lécriea da la explicación &n Las tie n d a s saciaifes

Parsimonia: Usar pocas variables en una teoría o explicación.


Pregunta de investigación: Lo que intentamos comprender en la investigación.
Sesgo: Error sistemático en la inferencia. Cuando existe un sesgo, los errores no
se cancelan y, por tanto, las inferencias no son válidas.
Teoría: Especulación razonada y precisa sobre la respuesta que cabe dar a la pre­
gunta de una investigación e incluso una declaración de por qué tal respuesta
es correcta.
Unidad de análisis: Objetos sobre los que un investigador recoge los datos, como
personas, países o sistemas electorales.
Validez externa: Grado con el que una inferencia causal o descriptiva para un de­
terminado conjunto de casos se puede generalizar a otros casos.
Validez interna: Se refiere a la calidad con la que se miden los conceptos impli­
cados y las relaciones entre ellos dentro del modelo teórico.
Variable: Característica empíricamente observable de algún concepto y que pue­
de tomar más de un valor (si no, es una constante).
Variable dependiente: Lo que se intenta explicar en una investigación.
Variable independiente: Una variable que influye en la variable dependiente.
Variable independiente clave: La variable independiente sobre la que se articula
la teoría que evaluamos empíricamente.
Variable independiente de control: Una variable independiente que también im­
porta para explicar la variable dependiente, pero que no es central en nuestra
teoría.
Referencias

Achen, Christopher H. (1982): Interpreting and Using Regression. Sage Univer-


sity Paper series on Quantitative Applications in the Social Sciences, 07-029.
Beverly Hills y Londres: Sage Pubns.
— (2002): «Toward a new política] methodology: Microfoundations and ART».
Animal Review o f Political Science 5: 423-450.
Aguilar, Susana, y Elisa Chuliá (2007): Identidad y opción: dos formas de enten­
der la política. Madrid: Alianza Editorial.
American Political Science Association (1995): «Symposium on The Qualitative-
Quantitative Disputation: Gary King, Robert O. Keohane, and Sidney Verba’s
Designing Social Inquiry: Scientific Inference in Qualitative Research». Ame­
rican Political Science Review 89: 454-481.
Anduiza, Eva (1999): ¿Individuos o sistemas? Las razones de la abstención en
Europa Occidental. Madrid: Centro de Investigaciones Sociológicas/Siglo
XXI.
Anduiza, Eva, Ismael Crespo y Mónica Méndez (1999): Metodología de la Cien­
cia Política. Madrid: Centro de Investigaciones Sociológicas.
Arjas, Elja (2001): «Causal Analysis and Statistics: A Social Sciences Perspecti-
ve». European SociologicalReview 17: 59-64.
Bartolini, Stefano (1996): «Metodología de la investigación política». En Manual
de ciencia política, comp. Gianfranco Pasquino. Madrid: Alianza Editorial.
Beck, Nathaniel, y Simón Jackman (1998): «Beyond Linearity by Default: Gene-
ralized Additive Models». American Journal o f Political Science 42: 596-627.
La tóales de ls explicación en las ciencias sodales

Levi, Isaac (1984): Decisions and Revisions: Philosophical Essays on Knowledge


and Valué. Nueva York: Cambridge University Press.
Lewis-Beck, Michae) S. (1995): Data Analysis. An Introduction. Sage University
Paper series on Quantitative Applications in the Social Sciences, 07-103. Be-
verly Hills y Londres: Sage Pubns.
Lieberson, Stanley (1985): Makingit Count. The Improvement o f Social Research
and Theory. Berkeley: University of California Press.
Linz, Juan J. (1975): «Totalitarism and Authoritarian Regimes». En Handhook of
Poli ticaI Science, vol. 3, Macropolitical Handhook, eds. Fred Greenstein y
Nelson W. Polsby. Reading, Mass.: Addison-Wesley Press.
Little, Daniel (1991): Varieties o f Social Explanation: An Introduction to the Phi-
losophy o f Social Science. Boulder, Colorado: Westview Press.
— (1998): On the Philosophy o f the Social Sciences. Microfoimdations, Method,
and Causation. New Brunswick, NJ: Transaction Publishers.
— (2005): Causal Mechanisms in Comparative Historical Sociology. Presentado
en la Social Science History Association 2005.
Machamer, Peter, Bindley Dardcn y Cari F. Craver (2000): «Thiñking about me-
chanisms». Philosophy o f the Social Sciences 67: 1-25.
Mahner, Martin, y Mario Bunge (2001): «Function and functionalism: A synthe-
tic perspective». Philosophy ofthe Social Sciences 68: 75-94.
Mahoney, James (2003): Tentative Answers to Questions about Causal Mecha-
nism. Presentado en Annuals Meetings ofthe American Political Science As­
sociation, Philadelphia, PA, 28 de agosto de 2003.
Manheim, Jarol B., y Richard C. Rich (1988): Análisis político empírico. Métodos
de investigación en Ciencia Política. Madrid: Alianza Editorial.
Marini, Margaret, y Burton Singer (1988): «Causality in the Social Sciences». En
Sociological methodology 1988, ed. Clifford Clogg. American Sociological
Association.
McKeown, Timothy J. (2004): «Case Studies and the Limits of Quantitative
Worldview». En Rethinldng Social Inquiiy. Diverse Tools, Shared Standards,
eds. Henry E. Brady y David Collier. Oxford: Rowman & Littlefield Publis­
hers, Inc.
Merton, Robert K. ([1948] 1968): Social Theory and Social Structure. Rev. ed.
Nueva York: Free Press.
— (1967): On Theoretical Sociology. Nueva York: Free Press.
— (1987): «Three fragments from a sociologist’s notebook: establishing the phe-
nomenon, specified ignorance and strategic research materials». Annual Re­
vi ew o f Sociology 13: 1-28.
Mili, John Stuart (1874): A system oflogic, rationative and inductive, being a
connected view of the principies o f evidence and the methods o f scientific in-
vestigation. Nueva York: Harper and Brothers.

124
^ie$^S^-SK^»^«Síi¡6^^1iXtii5e$^s5S^Í^Glk-tiUSiv«i^®^SaSiMi&íS6^SSeS7«S<E5E8®S»Si9asi

Miller, Richard W. (1987): Fací and Method: Explanation, Confirmation, and Re-
ality in the Natural and the Social Sciences. Princeton: Princeton University
Press.
Montero, José Ramón, e Ignacio Lago (2005): «La investigación sobre los siste­
mas electorales: cinco debates y una selección de artículos». Zona Abierta
110-111: 1-35.
Morales, Laura (1999): «Participación política en España: un análisis de las dife­
rencias de género». En Género y ciudadanía. Revisiones desde el ámbito p ri­
vado, eds. Margarita Ortega, Cristina Sánchez y Celia Valiente. Madrid: Insti­
tuto Universitario de Estudios de la Mujer/ Universidad Autónoma de Madrid.
Munck, Gerardo L. (2004): «Tools for Qualitative Research». En Rethinking So­
cial Inquiry. Diverse Tools, Shared Standards, eds. Henry E. Brady y David
Collier. Oxford: Rowman & Littlefield Publishers, lnc.
Pearl, Judea (2000): Causality: Models, Reasoning, and Inference. Cambridge,
MA: Harvard University Press.
Pearson, Karl (1892): The Grammar o f Science. Londres: J. M. Dent & Sons.
JBickül, Andrcas-.(2004): «Systems and Mechanisms. A Symposium on Mario’s
Bunge Philosophy of Social Science». Philosophy o f the Social Sciences 34:
169-181.
Pierson, Paul (2000): «Increasing Returns, Path Dependence, and the Study of
Politics». American Political Science Review 94: 251-267.
Polavieja, Javier G. (2005): «Desregulación parcial y desigualdad horizontal en
España». Revista Internacional de Sociología 41: 9-36.
Popper, Karl R. (1969): Conjectures and Refutations. Londres: Routledge and Ke-
gan Paul.
— (1997): E l mito del marco común. En defensa de la ciencia y la racionalidad.
Barcelona: Paidós.
Przeworski, Adam, y Henry Teune (1970): The Logic o f Comparativa Social In­
quiry. Nueva York: Wiley.
Putnam, Robert D. (1993): Making democracy work. Civic traditions in modern
Italy. Princeton: Princeton University Press.
Rogowski, Ronald (2004): «How Inference in the Social (but Not in the Physical)
Sciences Neglects Theoretical Anomaly». En Rethinking Social Inquiry. D i­
verse Tools, Shared Standards, eds. Henry E. Brady y David Collier. Oxford:
Rowman & Littlefield Publishers, lnc.
Salmón, Wesley (1989): Four Decades o f Scientific Explanation. Minneapolis:
University of Minnesota.
Sartori, Giovanni, y Leonado Morlino (1994): La comparación en las ciencias so­
ciales. Madrid: Alianza Editorial.
Schelling, Thomas C. (1960): The Strategy o f Conflict. Harvard: Harvard Univer­
sity Press.
— (1989): Micromotivos y macroconducta. México: Fondo de Cultura Económica.
La lógica s e la explicación en las ciencias so ciales

Simón, Herbert A. (1979): «The Meaning of Causal Ordering». En Qualitative


and Quantitative Social Research, eds. Robert K. Merton, James S. Coleman
y Peter H. Rossi. Nueva York: The Free Press.
Simón, Herbert A., e Y. Iwasaka (1988): «Causal ordering, comparative statistics,
and near decomposability». Journal of Econometrics 39: 149-173.
Skinner, B. F. (1970): Ciencia y conducta humana. Barcelona: Fontanella.
Sorensen, Aage B. (1991): «Merton and Methodology». Contemporary Sociology
2 0 : 516 - 519 .
— (1998): «Theoretical mechanisms and the empirical study of social procesa».
En Social Mechanisms. An Analytical Approach to Social Theory, eds. Peter
Hedstrom y Richard Swedberg. Cambridge: Cambridge University Press.
Spector, John L. (1981): Research Designs. Sage University Paper series on
Quantitative Applications in the Social Sciences, 07-023. Beverly Hills y Lon­
dres: Sage Pubns.
Steel, Daniel 2004): «Social Mechanisms and Causal Inference». Philosophy of
the Social Sciences 34: 55-78.
Stinchcombe, Arthur L. (1968): Gonm sUng&Kitrt^eorieihJZhfcsqpiJJanm áty-
of Chicago Press.
— (1993): «The Conditions of Fruitfulness of Theorizing about Mechanisms in
Social Sciences». En Social Theory and Social Policy. Essays in Honor o f Ja­
mes S. Coleman, eds. Aage B. Sorensen y Seymour Spilerman. Nueva York:
Praeger.
Tetlock, Philip E., y Richard Ned Lebow (2001): «Polcing counterfactual holes in
covering laws: cognitive styles and historical reasoning». American PoUtical
Science Review 95: 829-843.
Torcal, Mariano, y Pradeep Chhibber (1995): «Elites, cleavages y sistema de par­
tidos en una democracia consolidada: España (1986-1992)». Revista Española
de Investigaciones Sociológicas 69: 7-38.
Udéhn, Lars (2002): «The Changing Face of Methodological Individualism». An­
imal Review of Sociology 28: 479-507.
Weber, Max (1949): «Objective Possibility and Adequate Causation in Historical
Explanation». En The Methodology o f the Social Sciences, Max Weber. Nueva
York: Free Press.
— (1973): Ensayos sobre metodología sociológica. Buenos Aires: Amorrortu.

S-ar putea să vă placă și