La LÓGICA DE LA EXPLICACION EN LAS CIENCIAS SOCIALES PDF

Ignacio Lago
la lógica de la
explicaciónenlas
ciencias sociales: una
introducción
metodológica
UNIVERSIDAD
I C E S I biblioteca
083683
U N t V E R S l DAAlianza Editorial
SI '
d i b i iñ T P r j
La lógica de la explicación en las
ciencias sociales: una
introducción metodológica
/
Esta obra ha sido publicada con una subvención de la Dirección General del
Libro, Archivos y Bibliotecas del Ministerio de Cultura para su préstamo público
en Bibliotecas Públicas, de acuerdo con lo previsto en el artículo 37.2 de la Ley
de Propiedad Intelectual.
MINISTERIO
D E CULTURA
Reservados todos los derechos. El contenido de esta obra está protegido por la Ley, que esta
blece penas de prisión y/o multas, además de las correspondientes indemnizaciones por daños
y perjuicios, para quienes reprodujeren, plagiaren, distribuyeren o comunicaren públicamente,
en todo o en parte, una obra literaria, artística o científica, o su transformación, interpretación
o ejecución artística fijada en cualquier tipo de soporte o comunicada a través de cualquier
medio, sin la preceptiva autorización.
© 'Ignacio L^go Peñas, 2008

© Alianza Editorial, S.A., Madrid, 2008
Calle Juan Ignacio Lúea de Tena, 15; 28027 Madrid; teléf. 91 393 88 88
www. alianzaeditorial.es
ISBN; 978-84-206-9117-6
Depósito legal: M. 56.104-2007
Fotocomposición e impresión: efca , s . a .
Parque Industrial «Las Monjas»
28850 Torrejón de Ardoz (Madrid)
Printed in Spain
SI QUIERE RECIBIR INFORMACIÓN PERIÓDICA SOBRE LAS NOVEDADES DE

ALIANZA EDITORIAL, ENVÍE UN CORREO ELECTRÓNICO A LA DIRECCIÓN:
__________________alianzaeditorial@anaya.es_________________
Para mi madre, Lucrecia Peñas
índice
Agradecimientos................................................................................ 9
1. Presentación.............................................................................. 11
2. Descripción y explicación: el concepto de causa.................... 17
3. El azar en los fenómenos políticos y sociales......................... 29
4. Relaciones causales versus relaciones espurias....................... 33
5. ¿Cómo se pueden estimar los efectos causales?...................... 41
6. ¿Qué significa «explicar» en ciencias sociales?...................... 53

6.1. La explicación estadistica............................................................ 54
6.2. La explicación basada en las leyes de cobertura........................ 59
6.3. La explicación basada en mecanismos causales o sociales...... 62
7. ¿Qué se debe evitar en los diseños de investigación?............ 75

7.1. Errores de especificación en el modelo de explicación............ 75
7.2. El sesgo de selección......................................................................... 82
Le lógica de la explicación en las cieriCia^sod3.1es
7.3. La multicolinealidad...................................................................... 88
7.4. La endogeneidad............................................................................. 91
7.5. La forma funcional: la linealidad por defecto........................... 94
8. E pílo go................................................................................................. 99
9. Preguntas y problem as..................................................................... 101
N o t a s .................................................................................................................... 113
G losario.......................................................................................................... 113
R eferencias................................................................................................... 119
Agradecimientos
En este libro se aúnan los dos yoes de un profesor universitario:

el investigador y el docente. Mi formación como investigador ha
tenido lugar fundamentalmente en el Centro de Estudios Avanza
dos en Ciencias Sociales (CEACS) del Instituto Juan March de
Madrid. En la larga lista de profesores y estudiantes de los que he
aprendido (y sigo haciéndolo), me gustaría destacar a José Ra
món Montero, director de mi tesis doctoral, primero; colega y
amigo, después. No me puedo olvidar de la suerte de que mis pri
meros pasos como investigador fueran de la mano de Guillermo
Márquez en el Departamento de Ciencia Política y de la Admi
nistración de la Universidad de Santiago de Compostela. Mi ex
periencia docente la he acumulado en el Departamento de Cien
cias Políticas y Sociales de la Universitat Pompeu Fabra de
Barcelona. Mariano Torcal y Francesc Pallarás han sido determi
nantes en mi traslado a Barcelona. Amparo González, Ferran
Martínez y Rubén Ruiz leyeron versiones anteriores de este ma
nuscrito e hicieron valiosos comentarios y sugerencias. Pero el
origen y destino de este ensayo son los estudiantes de Ciencia Po
lítica de la Universitat Pompeu Fabra. Su curiosidad, interés y, so
bre todo, exigencia han sido el estímulo necesario para escribir
estas páginas.
1. Presentación
«Pues si nos importa conocer perfectamente algu

na relación entre objetos, con toda seguridad es la de
causa y efecto. En ella se fundamentan todos nues
tros razonamientos acerca de cuestiones de hecho o
existencia. Sólo gracias a ella podemos alcanzar al
guna seguridad sobre objetos alejados del testimonio
actual de la memoria y los sentidos. La única utili
dad inmediata de todas las ciencias es enseñarnos
cómo controlar y regular acontecimientos futuros
por medio de sus causas. En todo momento, pues, se
desarrollan nuestros pensamientos e investigaciones
en torno a esta relación.»
David Hume (2003 [1748]: 111)
La tarea fundamental de las ciencias sociales es la explicación,

esto es, mostrar por qué suceden los acontecimientos, por qué
algo cambia a lo largo del tiempo o por qué estados o eventos co
varían en el tiempo o el espacio. El argumento de este ensayo es
que una explicación adecuada de los fenómenos políticos y so
ciales debe combinar necesariamente dos elementos: un efecto y
un mecanismo causal. En primer lugar, debe demostrarse la exis
tencia de una correlación entre la variable dependiente (7 ) y al
menos una independiente (X ) en el sentido de que X incrementa
la probabilidad de que Y ocurra. Debe garantizarse, además, que
esta relación no sea espuria o el resultado de una tercera variable,
Z, que causa simultáneamente Y y X. En segundo lugar, debe es
pecificarse un mecanismo que describa el proceso a través del
cual una variable influye en la otra o cómo Y es producida por X.
Aunque comprendamos un fenómeno gracias a una teoría, de
poco nos vale si no podemos decir algo sobre su frecuencia o
probabilidad; y, a la inversa, si no somos capaces de señalar
11
La lógica de La explicación en las ciencias codales
■íJiMHffiWíi
cómo tiene lugar la relación entre dos variables, observar su va

riación conjunta no nos permite saber qué pasa.
El propósito de este ensayo es presentar y discutir la lógica de
una explicación en ciencias sociales. En primer lugar, detallo
cómo se deben diseñar las investigaciones para estimar correcta
mente un efecto causal o, en otras palabras, para realizar una in
ferencia causal válida. Esto es, de qué manera se deben usar los
datos para extraer conclusiones generales sobre la causalidad. En
segundo lugar, y de acuerdo con los debates actuales en la filoso
fía de la ciencia, defiendo que existen dos razones que hacen que
las inferencias causales sean necesarias, pero no suficientes para
tener una explicación en ciencias sociales. Por un lado, dada la
incertidumbre que, por definición, acompaña a las inferencias,
siempre corremos el riesgo de que las relaciones aparentemente
causales que identificamos-entre nuestras variables sean en reali
dad espurias. Por otro, debemos revelar cuál es la conexión expli
cativa o causal entre las variables que da lugar a la causalidad,
esto es, cómo se producen las relaciones causales a través de la
acción e interacción de los individuos.
La provisión de un mecanismo causal en una investigación de
pende de que la teoría que se maneja sea buena. Evidentemente,
se trata de un problema sustantivo, específico de cada pregunta
que se pretende responder, de modo que en un ensayo amplio so
bre ciencias sociales como éste, sólo se puede reflexionar sobre
sus características e importancia genérica en una explicación. La
realización de inferencias causales, sin embargo, se basa en una
lógica común a todas las investigaciones con ambiciones empíri
cas, al margen de cuál sea su pregunta o su estilo, cuantitativo o
cualitativo. La presentación de las reglas metodológicas que se
deben seguir y los aspectos que se deben evitar constituye el con
tenido básico de estas páginas.
El principio fundamental de las investigaciones empíricas en
ciencias sociales es que los argumentos científicos no son opinio
nes. Aun cuando las conclusiones a las que llega un científico so
cial puedan coincidir a veces con las intuiciones de un observa
dor ocasional, esto no significa que tengan la misma valía. Las
■erstac
opiniones no son correctas o incorrectas; las investigaciones

científicas, sí. La diferencia entre ambas no está en el objeto de
estudio, el mismo en los dos casos, sino en el método. Lo que
confiere a la ciencia política, por ejemplo, el rango de ciencia es
el uso de procedimientos de investigación contrastados y acepta
dos. Sin este contenido metodológico, se queda simplemente en
política y se relega al ámbito de la opinión. Y a la comunidad
científica no le interesan en absoluto nuestras opiniones. Como
ya sabemos desde hace más de un siglo, «la unidad de todas las
ciencias se basa únicamente en su método, no en su materia»
(Pearson, 1892: 16).
Esta importancia decisiva del método no es exclusiva de una o
varias áreas determinadas de las ciencias sociales, sino que se ex
tiende a todas aquellas que tienen una vocación empírica. Ya se
-estudie la implementación de politicas públicas, el comporta
miento electoral o los procesos de transición a la democracia, la
lógica inferencia] debe respetar siempre ciertos principios. Para
que una investigación sea capaz de responder correctamente a al
guna cuestión o hipótesis sobre el comportamiento de las perso
nas y/o instituciones, es necesario que combine dos elementos:
una buena teoría que nos cuente qué pasa y qué hace o impide
que pase y un preciso diseño de investigación que nos permita
extraer conclusiones o inferencias válidas. Si alguno o ambos
elementos no son adecuados, los resultados de la investigación no
se podrán aceptar.
Sin embargo, pese a que el diseño de investigación es funda
mental, de manera que pocos dudan ya que debe ser una priori
dad en las ciencias sociales (King, Keohane y Verba, 2004: 181),
sus principios resultan desconocidos en muchos estudios Este
ensayo reflexiona precisamente sobre cómo se deben emplear los
hechos empíricos para realizar juicios científicos sobre las teorías
y generalizaciones que son el resultado de nuestra investigación.
Es decir, cómo se deben diseñar las investigaciones para que ge
neren inferencias válidas sobre la vida social y política.
En términos más generales, la metodología consiste en reglas
para conocer el mundo y en técnicas para obtener información
(Sorensen, 1991: 516). Un diseño de investigación es un plan que
muestra, mediante el análisis de un modelo y de unos datos, de
qué manera esperamos utilizar nuestro material para extraer infe
rencias (King, Keohane y Verba, 2000: 128).
Los diseños de investigación se dividen en experimentales y
no experimentales (Spector, 1981: 7-10). La diferencia entre ellos
tiene que ver con el grado de control que posee el investigador.
En el diseño experimental, los sujetos o unidades de análisis y las
condiciones o variable independiente clave que se estudian son
manipulados por el investigador. Es decir, el investigador hace
algo que afecta a los sujetos estudiados y determina así los efec
tos de tales manipulaciones. Los diseños experimentales se basan
en la comparación del comportamiento o características de los
sujetos bajo las condiciones que se estudian. El punto clave es
que el investigador.asigna-los-ûjotos -a-la-s-Gondieianes-en-Jugar-
de observarlos en las situaciones que suceden de manera natural.
Por ejemplo, uno puede diseñar un estudio experimental para de
terminar si las tutorías personalizadas (variable independiente)
aumentan el rendimiento escolar (variable dependiente). Se se
lecciona aleatoriamente una muestra de estudiantes; la mitad se
asignan al grupo de tratamiento, y la otra mitad, al de no trata
miento. El primer grupo recibe la educación regular y, además,
tutorías personales, mientras que el segundo sólo recibe la educa
ción regular. Después de un tiempo, el progreso escolar de ambos
grupos se evalúa. Las posibles diferencias se atribuyen a las tuto
rías, puesto que esta variable es la única diferencia entre los gru
pos.
En los diseños no experimentales, el investigador carece de
esa capacidad de manipulación. Ya no se pueden asignar los suje
tos que se estudian a las condiciones que interesan. En su lugar,
se hacen varias observaciones de los sujetos que de manera natu
ral se clasifican en las condiciones. Para determinar si las tutorías
personalizadas aumentan el rendimiento escolar, el investigador
selecciona de nuevo una muestra de estudiantes. La mitad de los
estudiantes son elegidos porque han estado recibiendo las tuto
rías, y la otra mitad, porque no las han estado recibiendo. Después
de un tiempo, se evalúa el progreso escolar de ambos grupos.
Para que las posibles diferencias se puedan atribuir a las tutorías,
el investigador debe reunir información adicional sobre los estu
diantes para controlar que recibir las tutorías sea la única variable
distinta entre los grupos: es posible que aquellos estudiantes que
siguen las tutorías lo hagan precisamente debido a características
particulares (puede que sean más brillantes o más torpes que los
demás), de modo que las diferencias entre grupos tengan que ver
poco o nada con el tratamiento escolar especial. Es decir, ya exis
tían antes de que entraran en juego las tutorías.
Finalmente, antes de desgranar la lógica inferencial de las
ciencias sociales, resulta crucial discutir dos cuestiones: la pre
gunta de la investigación y la falsabilidad de las teorías. En pri
mer lugar, si bien no existe una regla sobre cómo se debe elegir
un tema de estudio — la imaginación y los intereses personales
son decisivos— , sí se deben satisfacer dos condiciones. Por un
lado, debe tratarse de un asunto relevante tanto para la política o
la sociedad como para la ciencia política o la sociología. Por
ejemplo, estudiar el voto estratégico o útil en la elección del pre
sidente de una comunidad de vecinos puede resultar interesante
desde un punto de vista teórico, pero carece de interés político.
Por el contrario, analizar la existencia de diferencias entre los dipu
tados y las diputadas de un parlamento autonómico en España
acerca de sus preferencias sobre la participación política de las
mujeres puede merecer la pena políticamente, pero se antoja que
no tiene demasiado atractivo para la ciencia política2.
En segundo lugar, en ciencias eminentemente empíricas como
la ciencia política o la sociología, la verificación o falsación em
pírica es fundamental: las teorías hay que formularlas de manera
que sea posible, si están equivocadas, desmentirlas fácilmente. Es
más, «el criterio del estatus científico de una teoría es su falsabi
lidad o refutabilidad o comprobabilidad» (Popper, 1969: 37).
Para que una teoría sea falsable deben darse las condiciones en
las que sea posible demostrar que es falsa. Estas condiciones de
ben ser especificadas antes de someterla a prueba, y mantenidas
si la prueba va en contra de la teoría. No deben esgrimirse razo
15
nes especiales o particulares, interpretaciones ad hoc, para sal
varla.
La consecuencia inmediata del falsacionismo popperiano es
que hay que elegir conceptos cuyas consecuencias observables
sean fáciles de definir. Así, conceptos como imaginario social o
cultura, útiles para formular teorías, son problemáticos para eva
luarlas empíricamente dada su complicada medición y observa
ción5.
El ensayo se organiza de la siguiente manera. Una vez presen
tadas las líneas maestras, se discute la dicotomía descripción/ex-
plicación y se aclara el concepto de causa. En el apartado 3 se re
flexiona sobre la importancia del azar en los fenómenos políticos
y sociales y se distingue entre los componentes sistemático y
aleatorio de las observaciones. Los problemas en la estimación
de electos causales y. en particular,-el-riesgo de las-rclaeiones-es-
purias se estudian inmediatamente después. En el apartado 5 se
plantean los supuestos necesarios para estimar efectos causales.
A continuación se presentan las distintas modalidades de explica
ción en las ciencias sociales y se revisan los problemas más habi
tuales en el diseño de una investigación: los errores de especifi
cación en el modelo de explicación, el sesgo de selección, la
multicolinealidad, la endogeneidad y las formas funcionales inco
rrectas. El libro concluye con un breve epílogo y una selección de
preguntas y problemas, acompañados de sus respuestas, sobre los
principales temas estudiados.
2. Descripción y explicación:
el concepto de causa
Las explicaciones causales no son posibles sin una buena des

cripción de los fenómenos políticos y sociales que nos cuente
cómo están constituidos o cómo varían en el tiempo, el espacio o
entre grupos o entornos sociales y/o institucionales. Es difícil
plantear una explicación sin que sepamos antes algo sobre el
mundo y qué debe explicarse en función de qué características.
En los términos de Merton (1987: 1-6), se deben «establecer los
fenómenos» antes de avanzar una explicación, esto es, hay que
disponer de evidencia empírica que avale que estos fenómenos
existen en realidad y que tienen la regularidad necesaria para re
querir y permitir una explicación. Dado el número prácticamente
infinito de hechos que se pueden observar, la descripción posibi
lita, por un lado, inferir información sobre hechos no observados
a partir de los que sí se han contemplado, y, por otro, distinguir
entre lo que estos hechos tienen de sistemático o regular y de no
sistemático o aleatorio (King, Keohane y Verba, 2000: capítulo 2;
véase también Coleman, 1990; Goldthorpe, 2000). En definitiva,
las explicaciones deben empezar con el análisis de los efectos
—-los fenómenos— para los que se busca explicación, de modo que,
Í.ÓCKes de le explicacíSTí en las ciencias sociales
en palabras de Lieberson (1985: 213-219), los datos muestren

«qué está pasando» antes de explicar «por qué está pasando».
Por ejemplo, en su reciente investigación sobre la formación
de los sistem as de partidos nacionales, Chhibber y Kollman
(2004) dedican los primeros capítulos del libro a describir minu
ciosamente la evolución del número de partidos en los niveles na
cional y local o de distrito en Canadá, Estados Unidos, Gran Bre
taña e India desde 1870, 1800, 1960 y 1870, respectivamente,
hasta la actualidad. Los cuatro países, todos ellos con sistemas
electorales de mayoría relativa en distritos uninominales, mues
tran significativas fluctuaciones en el número de partidos a lo lar
go del tiempo. Es decir, existe una pauta sistemática y general
que se desvía de la bien conocida tesis de que en estos sistemas
electorales sólo hay espacio para dos partidos, como se establece
en las leyes de Duvcrger (1 9 8 7 )J . A continuación Chhibber y
Kollman desarrollan una explicación de esta tendencia menos
centrípeta de lo esperado que se basa en las políticas y el papel
del gobierno nacional en relación con los subnacionales.
Sin embargo, las descripciones no van más allá de la observa
ción de correlaciones; las circunstancias causales que provocan
los fenómenos políticos o sociales en cuestión están ausentes. En
otras palabras, mediante la descripción somos capaces de estable
cer las regularidades sociales o políticas que constituyen el explá
nemela o la/s variable/s dependiente/s de nuestro análisis y definir
así con precisión la pregunta de investigación que nos interesa.
Pero no podemos plantear las razones o causas de estas regulari
dades o efectos.
En las ciencias sociales, la identificación de las causas es el
fundamento para entender los fenómenos y construir una ciencia
explicativa. Como señala Elster (2000: 35), la meta de la investi
gación debe ser reemplazar por causas pasadas las huellas que
deja en el presente el funcionamiento de esas causas. Las atribu
ciones causales se realizan precisamente para explicar aconteci
mientos, para comprender por qué determinados eventos tienen
lugar (Marini y Singer, 1988: 347). Y es que la causalidad es el
principal medio que tenemos para ordenar y comprender el mun
do. Si no sabemos quién está haciendo qué a quién, no podemos
entender el mundo en el que vivimos, no podemos hacer respon
sables a las personas y a las instituciones de sus acciones y no
podemos actuar eficazmente (Gerring, 2001: 129). Para poner en
marcha una política pública dirigida a reducir las desigualdades
horizontales en el mercado laboral (esto es, trabajadores de pro
ductividad equiparable que disfrutan de muy distintas oportuni
dades laborales) en Europa, por ejemplo, necesitamos saber cuá
les son sus niveles en cada país. Pero también qué las cansa: la
protección legal frente al despido y el contexto institucional en el
que se introducen los contratos temporales (Polavieja, 2005). E
incluso cuando esta comprensión causal no tenga consecuencias
sociales o políticas, entender los acontecimientos en términos de
relaciones de causa-efecto hace, como señala Pearl (2000: 345),
-que-los sintamos «bajo control». Para Hume (1992 [1738]), cu
yas palabras sirven de apertura de este ensayo, la causalidad es
simplemente el cemento del universo.
Pese a que el significado de la causalidad se haya discutido
durante siglos, no existe ninguna definición universalmente acep
tada. Sin duda, esta falta de acuerdo ha supuesto que la metodo
logía de la investigación social haya estado más bien fragmentada
y que, en consecuencia, las tradiciones «cuantitativa» y «cualita
tiva» hayan seguido lógicas inferenciales distintas hasta hace
bien poco. Si el libro de King, Keohane y Verba (2000) ha tenido
una acogida tan impresionante en la disciplina2, ha sido precisa
mente porque se trata del primer gran intento de tender puentes
entre la ciencia política cuantitativa y cualitativa. Y esto no es
sino defender que la lógica de una buena investigación cualitativa
no difiere significativamente de la de una cuantitativa, y al revés.
El punto de encuentro de todas las caracterizaciones de la causa
lidad es que las relaciones causales se componen al menos de dos
elementos: una causa, que también se suele denominar input, ele
mento causal, variable independiente, variable exógena o simple
mente X, y un efecto, que a su vez se conoce también como ontput,
resultado, variable dependiente, variable endógena o simplemente
Y. De este modo, y para que pueda encajar con concepciones deter-
ministas y probabilísticas, que luego veremos, con variables de to
das las naturalezas o con cualquier tipo de causa compleja, pode
mos manejar como definición mínima de la causalidad la que ofre
ce Gerring (2001: 129 y 138; 2005: 169): las «causas» son factores
que incrementan las probabilidades (previas) de que suceda un
acontecimiento o, más formalmente, X puede ser considerado la
causa de Y si (y sólo si) eleva la probabilidad de que Y ocurra.
Aunque suponga tomar partido (provisionalmente) por una
concepción determinista (es decir, las causas son condiciones ne
cesarias y/o suficientes de los efectos), para tratar la causalidad
como un concepto abstracto o teórico, independiente de los datos
que se utilizan para conocerla, y clarificar así los problemas de la
inferencia causal, en este ensayo se va a definir la causalidad o los
efectos causales en términos contrafácticos. En general, los con
ceptos de causa se r,onstriiyen .snbre-la-4dea-xiexo.mparar lo que p,n
realidad ha sucedido, bajo ciertas condiciones, con lo que habría
podido suceder bajo otras condiciones particulares diferentes. Por
tanto, el efecto causal de cualquier acción se puede definir como
la diferencia entre el resultado real y el que habría tenido lugar de
acuerdo con la acción contrafáctica distinta. Con mayor precisión,
King, Keohane y Verba (2000: cap. 3) definen el efecto causal
como la diferencia en los valores de la variable dependiente cuan
do la variable explicativa adopta dos valores distintos y todo lo de
más sigue igual. En otras palabras, el efecto causal de X es la dife
rencia en el resultado en Y que tendría lugar si pudiéramos
realizar un experimento perfecto en el que sólo X cambia3.
El quid de esta reproducción hipotética o experimento perfec
to del que depende la estimación del efecto causal es que todas
las variables independientes deben permanecer constantes en los
dos momentos, a excepción de una: la variable causal principal,
también conocida como clave o de tratamiento. Cuando sucede
esto, el cambio en la variable dependiente en la condición contra
fáctica en comparación con la real se puede atribuir totalmente a
la variable independiente clave. Esto es,
P A r l - Y h, (i)
2. Descripción y explicación: st concepto de causa
donde Xd es la variable independiente clave, /3, es su efecto cau

sal, F es la variable dependiente en la situación real y, finalmen
te, Yh es la variable dependiente en la situación hipotética.
Si, por el contrario, alguna otra variable independiente intervi-
niente o de control también cambia, no podemos saber qué parte
de la diferencia entre Y e Yh se puede atribuir a la variable inde
pendiente clave y cuál a la de control. Esto es,
P\XCI+ M eo = Yr ~ Yh>de mC)d° 9Ue PlXd = (Yr ~ Yl) ~ M eo (2)
donde Xco es una variable de control y /3, su efecto causal. En fin,

la estimación del efecto causal no es posible cuando varía más de
una variable independiente. Este supuesto de que todas las varia
bles independientes, excepto la clave, son constantes se conoce
-como «todo lo demás igual» o ceterisparibus.
Para explicar con claridad y de una manera más intuitiva esta
definición de causalidad, podemos utilizar la investigación cuan
titativa de Criado (2002) sobre las estrategias de campaña de los
partidos en España. Este ejemplo será empleado en varias ocasio
nes a lo largo del ensayo. Criado estudia el efecto causal de las
visitas a las circunscripciones del candidato del PP, José María
Aznar, sobre los resultados electorales de este partido en las elec
ciones legislativas de 1996. La variable dependiente es el porcen
taje de voto que consiguió el PP en cada una de las circunscrip
ciones españolas. L a variable independiente clave es dicotómica:
Aznar dio al menos un mitin en una circunscripción durante la
campaña electoral o no dio ninguno. Para simplificar la ilustra
ción, pensemos únicamente en la circunscripción de Madrid, en
la que Aznar sí dio mítines. El PP consiguió allí en 1996 el 49,42
por ciento de los votos a candidaturas: este porcentaje es el valor
de la variable dependiente. Para definir el efecto causal (teórico)
imaginemos que retrocedemos en el tiempo y nos encontramos
en Madrid justo antes de las elecciones. Todo sigue igual, a ex
cepción de que ahora Aznar decide no dar ningún mitin en esta
circunscripción. El porcentaje de voto que conseguiría el PP en
esta situación hipotética sería Z. La diferencia entre los porcenta-
jes de voto del PP en la situación real, en la que Aznar sí dio míti
nes, y la simulada, en la que no los dio, esto es, 49,42 - Z, es el
efecto causal de las visitas de Aznar sobre los resultados electo
rales del PP en Madrid en las elecciones de 1996.
Pero también para la investigación cualitativa esta definición
contrafáctica de la causalidad resulta útil. En su análisis de la
emergencia de la clase social como una variable que explica el
comportamiento electoral en España, Torcal y Chhibber (1995)
demuestran que este hecho depende del cambio estratégico adop
tado por las elites del PSOE y el PP; en particular, las políticas
económicas y fiscales seguidas por los gobiernos socialistas des
de 1989 y las propias propuestas en los programas de los dos par
tidos. Mientras que el PP defiende desde entonces un programa
neoliberal que presta especial atención a la reducción de la carga
fiscal y del consumo -público, el P SG E sitúa-en -un-primer-plaño
las medidas redistributivas. Con anterioridad, no existían diferen
cias demasiado significativas en este sentido y, además, no se en
contraban en el centro del debate político. Imaginemos que vol
vemos a la competición electoral entre socialistas y populares
existente en España antes de 1989. Supongamos que todo sigue
igual, con la única excepción de que ni las políticas económicas y
fiscales de los gobiernos del PSOE ni los programas de los dos
partidos mayoritarios sufren cambio alguno. Es decir, sus progra
mas económicos continúan siendo más o menos similares y ape
nas cuentan en la competición electoral. El efecto causal de las
estrategias de los partidos sería la diferencia entre la importancia
de la clase social en el comportamiento electoral en el escenario
real y en el simulado.
Si bien más adelante me detendré en esta cuestión, debe ad
vertirse que esta definición contrafáctica de la causalidad no sig
nifica que la inferencia causal sea fundamentalmente cuantitativa
o basada en los principios del análisis de regresión. Esto es, guia
da por los objetivos de la investigación cuantitativa, deudora de
los procedimientos cuantitativos y evaluada desde la perspectiva
cuantitativa. En una de las referencias obligadas sobre los análisis
contrafácticos, Fearon (1991: 176, énfasis en el original) sostiene
! ' -
precisamente que el respaldo de una hipótesis causal en la estra

tegia contrafáctica procede de argumentos sobre lo que podría
haber pasado. Estos argumentos son más creíbles (1) si se invo
can principios generales, teorías, leyes o regularidades distintas
de la hipótesis que se contrasta; y (2) si se basan en el conoci
miento de hechos históricos relevantes para un examen contrafác-
tico4.
No obstante, en esta definición contrafáctica de la causalidad
no se contempla la posibilidad de que las diferencias, o al menos
una parte, en la variable dependiente entre la situación real y la
hipotética sean simplemente una consecuencia del azar. Como
nos recuerdan King, Keohane y Verba (2000: 66), la política
siempre conlleva un cierto margen para lo aleatorio o lo imprede
cible, al igual que el conjunto de la vida social y toda investíga
la oñTíéñ tífica.
Retomando el ejemplo anterior acerca de la influencia de los
mítines de Aznar sobre los resultados electorales del PP en Ma
drid en las elecciones de 1996, supongamos que las elecciones se
repiten semanalmente durante varios meses. Aunque la estrategia
de campaña del PP y las variables que estructuran la competición
electoral, como la ideología o la valoración de la situación políti
ca y económica, por ejemplo, no cambien, cada repetición sema
nal no registraría el mismo número de votos para cada partido
como consecuencia de ciertas características no sistemáticas o
aleatorias: mal tiempo durante un mitin o el día de las elecciones,
algunos votantes podrían irse de vacaciones, o un discurso de un
candidato podría ser inesperadamente desafortunado. Es decir, la
variable dependiente en una investigación está siempre influida
por variables aleatorias que no podemos controlar porque tienen
una variabilidad impredecible.
De este modo, la definición de causalidad o efecto causal
debe limitarse a los cambios sistemáticos o regulares de la varia
ble dependiente. El efecto causal puede definirse, pues, como la
diferencia entre el componente sistemático de las observaciones
que se hacen cuando la variable independiente clave tiene un va
lor y el componente sistemático de las observaciones compara
Ls !.íí£fk:s de La explicación en las ciencias sociales
bles cuando la variable independiente clave tiene otro valor

(King, Keohane y Verba, 2000: 93).
Esta distinción entre los componentes sistemáticos y no siste
máticos o aleatorios implica que un investigador no debe esperar
la existencia de relaciones empíricas exactas entre las variables
en las ciencias sociales. En los análisis estadísticos, que pueden
servir como modelo en este caso, se reconoce explícitamente esta
inexactitud a través de la inclusión de un término de azar o error
en la ecuación y que se conoce como perturbación aleatoria.
Supongamos que queremos explicar los distintos niveles de
los salarios mensuales de los españoles y que la única variable in
dependiente relevante son los años de estudio 5. Nuestra hipótesis
es que, lógicamente, cuanto mayor sea la inversión en capital hu
mano que realiza una persona, más elevado será su salario. El
modelo es el siguiente:.............. ..
Y, = 0, + + Ah (3)
Y., el valor de la variable dependiente, el salario mensual, para

el individuo i, tiene dos componentes: (1) el sistemático o no ale
atorio, j8, + f3nXp donde X es la variable independiente, los años
de estudio, y y /3, son los parámetros de la ecuación: j3, es la
constante o el salario mensual de un individuo que no ha estudia
do ningún año, mientras que jS2 es la pendiente o la influencia de
cada año de estudio en el salario mensual. En ambos casos, los
signos esperados son positivos. Por un lado, todos los trabajos,
aunque no exijan ningún capital humano, tienen una contrapres
tación económica y, por otro, cuanto más capital humano acumu
la una persona, mayor es el salario que debería esperar. Y (2) la
perturbación aleatoria, ¡jl..
L a figura 1 representa la combinación de estos dos compo
nentes para determinar Y, el salario mensual. X p X2, X3 y X4 son
cuatro hipotéticos valores del número de años de estudio. Si la
relación entre las dos variables fuera perfecta, los valores obser
vados de Y estarían representados por los puntos Qv Qv Q3 y Q4
que aparecen sobre la línea. Sin embargo, la perturbación aleato-
'escripcton y icaoon; el concepto :at!s«
y . P4
Y = ^ + /3 2X
< q4
,p\-
ir""'" q3
” q2 •
Qi • P3
Pz
+ ^32X i
X, x2 x3 x4 X
fuente : Elaboración propia.
Figura 1. Componentes sistemático y aleatorio en los efectos causales.
ría provoca que los valores verdaderos de Y, P v Pv P 3 y P4, sean

diferentes. En el gráfico, el azar tiene una influencia positiva en
la primera y cuarta observaciones (es decir, estos dos individuos
tienen un sueldo mensual superior al que deberían disfrutar de
acuerdo con sus años de estudio), mientras que tiene una influen
cia negativa en las observaciones 2 y 3 (es decir, estos dos indivi
duos tienen un sueldo mensual inferior al que deberían disfrutar
de acuerdo con sus años de estudio).
¿Por qué las personas con los mismos años de estudio no tie
nen la misma remuneración o, en otras palabras, los puntos no
están en la misma línea? La razón es que algunos individuos tie
nen más suerte que otros en encontrar mejores trabajos o, si ocu
pan el mismo puesto en dos empresas similares, algunos tienen
más suerte que otros con sus condiciones laborales y, en particu
lar, la contraprestación económica que reciben.
Por supuesto, y como veremos más adelante, en la práctica
sólo podemos observar los puntos P. /3p (32 y ¡x. no se conocen.
Precisamente lo que hacemos cuando tratamos de explicar un fe
¡..8 lógica de ¡,- aiíptkatíéa en las dendasjsc-daies
nómeno es ajustar una línea de acuerdo con nuestra teoría sustan

tiva lo más cerca posible de la verdadera e inobservable, en este
caso la representada por los puntos Qx a QA. Cuanto más se pa
rezca la recta que ajustamos a la verdadera, mejor es nuestra ex
plicación.
Todo esto implica que, aunque en nuestro modelo de explica
ción se manejen todas las variables independientes relevantes (en
este caso suponemos que el salario es una función exclusivamen
te de los años de estudio), establezcamos adecuadamente la ma
nera en que la variable independiente influye en la dependiente y
no hayamos cometido ningún error en la medición de las varia
bles, nunca seremos capaces de explicar perfectamente la va
riable dependiente de nuestra investigación: el azar o la suerte
importa y, por definición, no se puede controlar. Todos los fenó
menos políticos y sociales d e ^ e n d e n ^
toriedad.
De nuevo, un ejemplo cualitativo, como el que plantea Munck
(2004: 118-119), puede ilustrar con más claridad la importancia
de separar los elementos sistemáticos de los aleatorios. En su es
tudio sobre la construcción de los estados modernos, Ertman
(1997) sostiene que el régimen político del que se dotaron depen
dió de (a) el tipo de gobierno local durante el primer período de
construcción del estado, (b) el momento del incremento en la
competición geopolítica y (c) la influencia de las asambleas re
presentativas sobre las infraestructuras administrativas y finan
cieras. Las experiencias en Europa encajan en este modelo, con
la excepción de Dinamarca. En este país, la competición geopolí
tica comenzó relativamente tarde y el gobierno local al principio
del período de construcción del estado fue generalmente partici-
pativo, lo que debería haber llevado a Dinam arca a tener un
«constitucionalismo patrimonial». Sin embargo, desarrolló un
«absolutism o burocrático» pese a que contaba con las marcas
tempranas del estado constitucionalista patrimonial. A través de
un estudio detallado, Ertman muestra que Dinamarca se desvió
de este camino para desarrollar el absolutismo burocrático como
consecuencia de la entrada de los caballeros alemanes y la consi-
Descripción y explicación: el. concepto de causa
guíente importación de sus instituciones de gobierno local. La in

fluencia alemana sería un factor aleatorio al margen del modelo
de explicación basado en los componentes sistemáticos identifi
cados por Ertman. Su inclusión como una variable de control
permitiría que la experiencia danesa se pudiera integrar en el mo
delo de explicación.
Si bien la distinción entre los componentes sistemáticos y alea
torios parece poco intuitiva y difícil de conseguir en la práctica,
es fundamental para la explicación. El componente sistemático
del fenómeno que estudiamos es lo que somos capaces de expli
car con nuestro modelo causal; el componente aleatorio (o error)
es, por el contrario, lo que no somos capaces de explicar. La in
vestigación en ciencia política puede verse como el intento de
maximizar el componente sistemático y minimizar el aleatorio.
Cuando un investigador se plantea por primera vez una pregunta,
las observaciones que maneja aparecen exclusivamente como el
resultado de elementos aleatorios: no conoce ninguna variable in
dependiente que sistemáticamente tenga un efecto en la depen
diente. Su explicación mejorará a medida que sea capaz de redu
cir el espacio que ocupa lo aleatorio. En otras palabras, cuanta
menor sea la variación de la variable dependiente que se le esca
pa de acuerdo con su modelo causal, mejor será su explicación.
Pero no debemos olvidarnos de dos cuestiones centrales en la
investigación social. En primer lugar, la explicación de la varian-
za de Y debe combinarse con el principio de la parsimonia, esto
es, el uso de pocas variables explicativas en una teoría o explica
ción. Una de las máximas a seguir en una investigación es expli
car la máxima varianza con el menor número posible de varia
bles. Como nos recuerda Achen (2002), una especificación
(estadística) que maneje muchas variables, más de tres para
Achen, no resulta útil para la inferencia: no se puede realizar un
análisis cuidadoso de los datos que asegure que el modelo sea
apropiado y que los presupuestos que tiene detrás funcionen
como el investigador desea. Por ejemplo, uno de los principales
atractivos del celebrado estudio de Boix (1999) sobre la selección
de los sistemas electorales en Europa es la parsimonia de su ar
gumento. La adopción de la representación proporcional frente a
la mayoría absoluta o relativa es una función de la interacción en
tre la fuerza de los nuevos partidos y la capacidad de los viejos
(especialmente los que están en el poder) para coordinarse y blo
quear el crecimiento de los primeros.
En segundo lugar, hay que tener cuidado con el criterio de la
explicación de la varianza de Y como medida del éxito de una in
vestigación. No sólo no es capaz de medir el poder causal de las
variables (y los argumentos teóricos que las avalan), sino que
tampoco es comparable entre muestras distintas (Achen, 1982:
58-61).
28
3. El azar en los fenómenos
políticos y sociales
De acuerdo con la discusión anterior sobre los componentes de

los fenómenos sociales, cuya síntesis se presenta en la ecuación
(3), la variable dependiente, 7, depende en última instancia de la
perturbación aleatoria o término de error, ¡x. Sólo si ¡x es un com
ponente completamente aleatorio, de modo que no afecta de una
manera regular o sistemática a 7 y a la/s variable/s independien-
te/s, X, se puede estimar con precisión el efecto causal que X tie
ne sobre 7. Cuando fx pierde esta condición de aleatoriedad, y
tiene una influencia sistemática, bien positiva, bien negativa, so
bre 7 o X, ya no se puede inferir que el efecto causal de X sea la
diferencia en los valores de 7 cuando X adopta dos valores distin
tos. ¿Cuándo deja de ser ¡x simplemente azar? Pues en la mayoría
de las ocasiones cuando un investigador se olvida de incorporar
en su modelo sustantivo una variable independiente relevante: su
efecto se traslada al término de azar que, por tanto, ya no es alea
torio
Para explicar esta idea supongamos que 7, los resultados elec
torales del PP en las circunscripciones en las elecciones de 1996,
es una función de una única variable independiente, X, la visita
29
, l l II ■>" ' V' '
del candidato José María Aznar a una circunscripción durante la

campaña. A diferencia de las ecuaciones anteriores, para simpli
ficar el análisis, en este caso se ha omitido el término constante.
Si nos centramos solamente en Madrid, la variable dependien
te tiene dos posibles valores:
Yr = ^ X + ix r, (4)
donde X = 1, es decir, cuando Aznar visita una circunscripción

(los subíndices r identifican la situación real del análisis contra-
fáctico); y
(5)
donde A = 0, es decir, cuando Aznar rio \dsita lá“ circüjiscripüfóñ'

(los subíndices h identifican la situación hipotética del análisis con-
trafáctico). Puesto que (3¡ * 0 = 0, los resultados electorales del PP
en la situación hipotética son iguales a la perturbación aleatoria, o
Yh = Vh (5a)
Si calculamos la diferencia entre (4) y (5a),
Yr= Yk = lS p + iL -tL » (6)
resulta que el efecto causal de la variable independiente pasa a

ser la diferencia entre los valores de Y una vez que se descuenta
el azar, o
PlX ^ ( Y - Y t) - i i + ^ (7)
Finalmente, si las perturbaciones aleatorias no afectan a Y ni a

X, el efecto causal es simplemente la diferencia entre los resulta
dos electorales del PP en los dos momentos:
(8)
^ „ _t
Para que efectivamente el azar no tenga ninguna influencia en

Y, ya sea directa o indirectamente a través de X, deben satisfacer
se dos supuestos. En primer lugar, el valor medio de las perturba
ciones ¡x debe ser igual a cero o £(/x.) = 0. Este supuesto puede
ilustrarse gráficamente con ayuda de la figura 1. Puede observar
se que los valores de Y para cada valor de X están distribuidos al
rededor de la línea que definen los puntos Qv Qr (E y 0 4- algu
nos de los valores verdaderos de Y, representados por los puntos
P, están por encima de la línea de la relación exacta, y otros están
por debajo. Estas diferencias son causadas por la perturbación
aleatoria.
Lo que el primer supuesto dice es que las variables que no es
tán incluidas en el modelo de explicación y que, por tanto, apare-,
cen en ¡x no afectan sistemáticamente a Y; es decir, los valores
------positivos de ¡x se cancelan por los negativos, de tal manera que su
efecto promedio sobre Y es cero. En otras palabras, la perturba
ción aleatoria no tiene una tendencia definida, de modo que no es
sistemática.
En segundo lugar, la variable independiente no está correla
cionada con las perturbaciones o E(¡x.X.) = 0. Cuando se expresa
la relación entre las variables en una ecuación, como en (3), se
supone que X y (x (que representa, como ya sabemos, la influen
cia de todas las variables independientes omitidas) tienen una in
fluencia separada sobre Y. Pero si X y ¡x están correlacionadas,
no es posible determinar sus efectos individuales sobre Y. Si la
correlación es positiva, X aumenta cuando fx aumenta, y disminu
ye cuando /x disminuye. Y al revés si la correlación es negativa.
En definitiva, es difícil, si no imposible, asegurar cuál es la in
fluencia de X sobre Y.
En el ejemplo que estamos manejando, supongamos que los
resultados del PP en las circunscripciones no sólo dependen de
sus estrategias de campaña, sino también de cuántos individuos
se declaran de centro-derecha. Puesto que esta segunda variable
independiente no se ha integrado en el modelo, su influencia se
recoge en ¡x. Si la variable de la visita de Aznar a la circunscrip
ción está correlacionada con la ideología de los votantes de dicha
La lógica de la explicación en las riendas sociales
circunscripción, y esta última se ha excluido de la ecuación, en

tonces el efecto de la variable de la visita de Aznar sobre los re
sultados electorales del PP está mal estim ado2. Si las dos varia
bles tienen una correlación positiva, este efecto causal de la
variable de la visita de Aznar se sobreestimará o se sesgará posi
tivamente, puesto que está recogiendo parte de la influencia que
la ideologia tiene sobre la variable dependiente. Si la correlación
es negativa, este efecto causal se infraestimará o se sesgará nega
tivamente. Por supuesto, cuanto mayor sea la correlación, mayor
será el sesgo en la atribución causal.
Dada esta importancia crucial de la perturbación aleatoria en
la estimación de efectos causales, el diseño de la investigación
debe garantizar que se cumplen estos dos supuestos. Si no es así,
la inferencia causal no será válida.
4. Relaciones causales
versus relaciones espurias
En la definición contrafáctica de los efectos causales que se ha

formulado, la causalidad se establece comparando lo que habría
sucedido en Y en una unidad determinada cuando ha estado ex
puesta a X con lo que habría sucedido si no hubiera estado expues
ta a X. Como es obvio, el efecto causal formulado en estos térmi
nos es teórico, puesto que en la realidad no es posible observar la
ocurrencia y la no ocurrencia de X para una unidad y momento
determinados. En consecuencia, si bien la causalidad es un ele
mento esencial en el razonamiento científico, los intentos de for
malizarla están basados en constructos mentales que, por defini
ción, no tienen equivalentes objetivamente definidos en el mundo
en el que vivimos (Arjas, 2001: 59-60).
Por ejemplo, no se pueden conocer con certeza los resultados
electorales del PP en las elecciones generales de 1996 en Madrid
cuando Aznar dio un mitin (la situación real) y cuando no lo dio
(la situación hipotética o contrafáctica). Los valores de la variable
independiente son mutuamente excluyentes: si se observa uno, no
se puede observar el otro. Esto es, Madrid no puede recibir y no
recibir la visita de Aznar durante la campaña electoral de 1996.
ica de ft explfcadén m tai dencias sociaf.es
Esta imposibilidad de que una unidad de Y esté simultánea

mente expuesta y no expuesta a X es lo que Holland (1986) deno
mina el problema fundamental de la inferencia causal. Si bien
son necesarias dos observaciones de un determinado caso para
estimar un efecto causal, los investigadores sólo disponen de una
en el mundo real. En definitiva, la atribución de causalidad de
pende de una comparación con algo que no ha ocurrido. Como
nos recuerdan King, Keohane y Verba al respecto (2000: 90), al
margen de lo perfecto que sea el diseño de la investigación, de la
cantidad de datos que recojamos, de lo perspicaces que sean los
observadores, de lo diligentes que sean los ayudantes y del grado
de control experimental que tengamos, nunca conocemos con ab
soluta certeza la inferencia causal. Con estas limitaciones de par
tida, la cuestión central del diseño de investigación es plantear
cómo se pueden realizar estas eomparaeioneÊipotéticas-airavi:s_
del análisis de los casos observados en el mundo real.
Ya sabemos que no podemos volver a poner en marcha la his
toria en el mismo momento y lugar, dando diferentes valores a
nuestra variable independiente clave en cada ocasión, como exi
giría la verdadera solución al problema fundamental de la infe
rencia causal. Por tanto, la causalidad no se puede determinar di
rectamente, sino que hay que conocerla a partir de los datos
observados y de ciertos supuestos que veremos en detalle más
adelante.
Para solucionar este problema inferencial, el investigador debe
coger las unidades involucradas y comparar la respuesta media de
las unidades expuestas a la variable independiente clave con la
respuesta media de las unidades de control que no están expues
tas a la variable independiente clave: la diferencia entre las uni
dades activas y pasivas se considera el efecto causal medio. Por
ejemplo, comparar los resultados electorales medios que consi
guió el PP en las elecciones generales en 1996 en las circunscrip
ciones visitadas por Aznar con los alcanzados en las circunscrip
ciones no visitadas por Aznar.
Pero estos dos universos paralelos que se establecen con los
datos observados, a diferencia de lo que sucedía bajo la condi-
. ' << ■ . . ,
ción contrafáctica, ya no son sólo distintos en la variable inde

pendiente clave. Hay otras variables que también cambian simul
táneamente, de modo que no podemos conocer si efectivamente
la diferencia en la variable dependiente entre los dos universos
paralelos se puede atribuir a la diferencia en la variable indepen
diente clave. La dificultad de establecer causalidad entre X e Y
cuando se utilizan los datos observados, reales, es que tenemos
que comparar unidades que ya no son sólo distintas en la variable
independiente clave, sino también en las de control. Es decir, el
supuesto de «todo lo demás igual», salvo X, en el que se basaba
la concepción contrafáctica de la causalidad, desaparece. Esto su
pone que ya no podemos estar seguros de que la diferencia en Y
en dos unidades distintas sea una consecuencia del cambio en la
variable independiente clave. También es posible que sea una fun
ción de otras variables independientes que no son iguales entre las
dos unidades y que necesariamente hay que tener en cuenta.
Si volvemos a nuestro ejemplo e imaginamos que Madrid ha
recibido la visita de Aznar, pero no así Tarragona, la diferencia
entre los resultados del PP entre ambas circunscripciones no sólo
se puede atribuir a esta variable. Es obvio que, al margen de sus
decisiones durante la campaña, el PP siempre consigue mejores
resultados en Madrid que en Tarragona debido, entre otros ele
mentos, a la distinta importancia del nacionalismo catalán en las
dos circunscripciones.
Para poder realizar una inferencia causal acertada es necesario
que todas las variables independientes intervinientes, excepto la
clave, estén controladas, esto es, mantengan constante su valor;
sólo así se puede comprobar si existe una covariación sistemática
entre la variable dependiente y la variable independiente clave.
Dos ejemplos, uno cualitativo y otro cuantitativo, nos pueden
ayudar a entender mejor la cuestión. En primer lugar, en un re
ciente artículo, Fernández (2002) plantea que la adopción de po
líticas de igualdad de oportunidades educativas es una función de
las preferencias de los gobiernos, la variable de control, y, sobre
todo, de los costes electorales asociados a estas políticas educati
vas, la variable independiente clave. Para estimar el efecto causal
< J . í- '
de la variable independiente clave, Fernández controla la influen

cia de la otra variable independiente interviniente a través de la
selección de dos países en los años ochenta y primeros noventa,
España y Francia, que tenían gobiernos socialdemócratas. Es de
cir, puesto que la variable de las preferencias de los gobiernos se
mantiene constante, las diferencias en las políticas educativas de
los dos países tienen que venir explicadas por las diferencias en
los costes electorales asociados, altos en España y bajos en Fran
cia. Si existe covariación entre estas dos variables, se infiere la
existencia de causalidad; si no la hay, se infiere que no existe
causalidad.
En segundo lugar, supongamos que los resultados electorales
del PP en las circunscripciones españolas en las elecciones legis-
1ativas de 19% no sólo dependen de la visita de Aznar durante la
campaña, la variable independiente clave, sino también de que
una circunscripción haya recibido o no fondos de cohesión
europeos en la legislatura anterior, la variable independiente de
control. La hipótesis en este segundo caso es que en las circuns
cripciones que han recibido fondos, el PP cosechará peores resul
tados que en las demás, puesto que los votantes recompensarán al
gobierno, socialista, que consiguió estos fondos. Para estimar el
efecto causal de la variable independiente clave, es necesario
controlar la influencia de la otra variable independiente intervi
niente. Para ello, se deben comparar, por un lado, los resultados
electorales medios del PP en las circunscripciones que no reciben
fondos europeos y que son visitadas por Aznar durante la campa
ña con los resultados electorales medios del PP en las circuns
cripciones que no reciben fondos europeos y que no son visitadas
por Aznar durante la campaña. Y, por otro, los resultados electo
rales medios del PP en las circunscripciones que reciben fondos
europeos y que son visitadas por Aznar durante la campaña con
los resultados electorales medios del PP en las circunscripciones
que reciben fondos europeos y que no son visitadas por Aznar
durante la campaña. L a diferencia en los resultados electorales
del PP en ambos universos cuando la variable independiente cla
ve varía es el efecto causal de la visita de Aznar.
4 tvBlBOOr :aúsales versi
El problema clásico de las inferencias causales a partir de los

datos observados es precisamente que la dependencia entre dos
variables puede ser explicada tanto porque una variable es la cau
sa de la otra como debido a la existencia de una causa común de
ambas variables. Este obstáculo se suele denominar el problema
de las relaciones espurias o de los confundidores. El término
«espurio» se refiere a las relaciones en las que dos o más varia
bles están estadísticamente unidas (es decir, correlacionadas)
pero no lo están causalmente: esta relación estadística aparece
porque una tercera variable causa las demás. Y el término de los
confundidores se refiere a causas comunes, normalmente no me
didas, que podrían explicar la correlación observada. Como seña
lan Kiser y Hechter (1991: 7), la eliminación de las relaciones es-
purias es el problema.fundamenta] para la justificación de la
inferencia causal.
Este problema encuentra una clara y parsimoniosa formula
ción en Elster (2000: 46-47).
Generalmente con esto último [la explicación espuria] nos referimos a la co
rrelación entre dos variables que no se origina en una relación causal entre
ellas, sino en su relación común con una tercera [...] El problema de confun
dir correlación y causación es un problema constante en este modo de expli
cación estadística y la razón por la que hay que cuidarse de interpretar corre
laciones como más que indicaciones de que «algo está pasando» que vale la
pena ser observado más en detalle. O quizás el punto debería expresarse ne
gativamente, que la función del análisis de correlación es que nos permite
descartar una hipótesis causal si la correlación es baja.
Por supuesto, esta discusión sobre la inferencia causal nos lleva a

la bien conocida proposición de que mientras que la correlación
o, más generalmente, la asociación no implica causalidad, la cau
salidad sí implica algún tipo de asociación. El quid de la cuestión
es cómo garantizar que el grado de asociación que se observa en
tre las variables X e Y suponga efectivamente que X causa Y,
como se establece en la ecuación (9). Es posible que la probabili
dad de que tenga lugar Y, dado X, es mayor que la probabilidad
úégicB cíe La ea M ca a sv er Las ciencias seríales
de que tenga lugar, dado no-A, pero esto no es suficiente para de
mostrar que X es la causa de 7. Por ejemplo, podría pasar que una
tercera variable, Z, sea la causa tanto de X como de Y, de modo
que, si se tiene en cuenta Z, la asociación entre X e Y desaparece
o se debilita, como se apunta en la ecuación (10). Es decir, la su
puesta conexión entre X e Y es espuria, ya sea total o parcialmente.
X -4 Y (9)
X<-Z-*Y (10)
En general, (1) cuanto mayor sea la correlación entre la varia

ble independiente omitida, Z, y la incluida, X, y, al mismo tiem
po, (2) más importante sea el efecto de Z sobre Y, más espuria
será la relación .entre X e .}/. .La-.xazón...es.jque..mQL_un lado, si no se _
tiene en cuenta Z, X asume parte de la influencia de Z en Y, tanto \
más cuanto mayor sea la correlación entre X y Z. Si la correla
ción entre X y Z es igual a 0, no hay problemas de relaciones es
purias, puesto que X no asume ninguna parte de la influencia de
Z en Y. Por otro, dado (1), cuanto mayor sea la correlación entre
Z e 7, mayor será la influencia sobre Y que se le atribuye a X. De
este modo, la relación más espuria entre X y Z tendría lugar cuan
do la correlación entre Z y X y entre Z e 7 es muy alta; por el
contrario, no existiría ningún efecto espurio de X sobre 7, si no
hay ninguna correlación entre Z y X o entre Z e 7.
L a intuición detrás de esta exigencia de que en todos los estu
dios empíricos con ambiciones causales las potenciales variables
confundidoras deben ser controladas es que una acción tendrá un
efecto causal sobre una respuesta si la respuesta cambia cuando
lo hace la acción y bajo las circunstancias en las que todo lo de
más que es relevante para el resultado permanece igual.
Veamos algunos ejemplos de relaciones aparentemente causa
les, que parecen ajustarse por tanto a la ecuación (9), pero que en
realidad son total o parcialmente espurias, es decir, responden al
modelo que define la ecuación (10).
En primer lugar, de acuerdo con el ejemplo propuesto por Els-
ter (2000: 47), cuando hay una alta correlación negativa entre X
I
4. Relaciones; causales versus relBdímss espurlss:
(el porcentaje de miembros de un grupo que están casados) e Y

(la cantidad promedio de caramelos consumidos mensualmente
por cada miembro), podemos sospechar que esto se debe a que
son efectos de una causa común Z: la edad promedio de los
miembros del grupo. Su correlación con X e y es muy elevada.
Por tanto, si Z se mantiene constante, es decir, controlada, la co
rrelación entre X e Y desaparece y podemos concluir que la
correlación no era legitima.
En segundo lugar, entre los mejores jugadores de tenis del
mundo apenas hay negros. Uno podría estar tentado de concluir
que existe una relación entre la raza y las capacidades para el te
nis, quizás a causa de cierta superioridad genética de los blancos
para este deporte. Sin embargo, parece evidente que esta correla
ción es espuria, puesto que está causada por una tercera variable:
-eUbienestar material de las personas y de los países. Sólo aque
llos individuos que tienen asegurada la satisfacción de sus necesi
dades básicas y disponen de las instalaciones y de los preparado
res para desarrollar su potencial innato se pueden convertir en
jugadores profesionales. Y estas dos condiciones sólo se cumplen
para los individuos de rentas medias o elevadas que viven en los
países occidentales, es decir, fundamentalmente para los blancos.
Si pasamos ahora a los ejemplos de relaciones parcialmente
espurias, podemos recurrir a dos investigaciones en ciencia polí
tica y sociología. Por un lado, las desigualdades de género en la
participación política en España son importantes. Se podría pen
sar que el hecho de ser hombre o mujer causa que se participe en
mayor o menor medida en política. Pero Morales (1999) demues
tra que esta relación se debilita mucho, aunque no desaparece,
cuando se tienen en cuenta los recursos socioeconómicos, la po
sición social, las predisposiciones políticas y las actitudes de los
individuos.
Por otro lado, cuando se observan las diferencias salariales en
tre sexos, resulta que las mujeres ganan, en promedio, alrededor
de un 30 por ciento menos que los hombres. Por tanto, se podría
concluir que esta diferencia es una consecuencia de la discrimi
nación sexual. No obstante, Lago (2002) muestra que 12 puntos
, ./ f . 5! "
porcentuales de esta distancia salarial se explican de acuerdo con

las distintas características de hombres y mujeres — nivel de estu
dios, antigüedad en el trabajo o el número de días de baja— , de
modo que la discriminación real sólo está detrás de los 18 puntos
porcentuales restantes.
En definitiva, para realizar inferencias causales todas las posi
bles causas espurias de Y deben ser descartadas. Puesto que no
hay oportunidad de manipular todos los factores causales con da
tos no experimentales, cuando se realizan inferencias causales
sobre los fenómenos sociales a partir de los datos observados
siempre se corre el riesgo de que no sean fiables.
5. ¿Cómo se pueden estimar
los efectos causales?
Siguiendo a King, Keohane y Verba (2000: cap. 3), para realizar

una inferencia causal válida a partir de los datos reales, que ase
gure que la relación observada entre X q Y no sea total o parcial
mente espuria, es necesario que se satisfagan dos supuestos ca
racterísticos de los diseños experimentales: la homogeneidad de
las unidades u homogeneidad causal — es decir, si dos unidades
tienen el mismo valor en la variable independiente clave, el valor
esperado de la variable dependiente será el m ism o = -y IsAnde-.......-
pendencia condicional — es decir, las observaciones que se eli
gen y los valores que se adjudican a las variables explicativas son
independientes de los valores de la variable dependiente 1. Cuan
do no se cumpla alguno o ninguno de los dos supuestos, la infe
rencia causal tendrá graves problemas y no será aceptable.
A. La homogeneidad de las unidades

u homogeneidad causal
Dos unidades son homogéneas cuando resultan iguales en todas

las variables independientes, incluida la clave (esto es, tienen los
, í ' V V '
m ism os valores en todas las variables independientes), y son he

terogéneas cuando son distintas en alguna variable independiente,
ya sea la clave o alguna de control (esto es, tienen valores dife
rentes en alguna de las variables independientes). Por tanto, el
supuesto de la homogeneidad causal establece que todas las uni
dades de análisis que tengan el mismo valor en la variable inde
pendiente clave tendrán también el mismo valor esperado en la
dependiente, puesto que todo lo demás entre ellas es igual. Es de
cir, si a todos los casos se les asignaran de una manera contrafác-
tica los mismos valores de la variable independiente clave, todos
tendrían los mismos valores esperados en la variable dependien
te. Por ejemplo, supongamos que queremos estudiar cómo influ
ye la visita de Aznar a una circunscripción durante la campaña en
los resultados del PP en las elecciones generales de 1996. Si en
Madrid, que efectivamente ha sido visitada por Aznar, el PP cóiv
sigue el 49,42 por ciento de los votos, por ejemplo, en otra cir
cunscripción que también haya recibido la visita de Aznar el PP
obtendrá el mismo porcentaje: el 49,42 por ciento. Detrás de este
supuesto está la idea de que los valores de la variable dependien
te para todos los casos incluidos están producidos por el mismo
modelo causal: después de controlar los valores de las variables
independientes incluidas, cada caso debe tener el mismo valor es
perado en la variable dependiente2.
En la investigación empírica, y debido a la importancia del
azar, entre otros elementos, se emplea una versión más débil de
este supuesto, más plausible e igualmente aceptable, basada en el
efecto causal constante: una variación similar de los valores de la
variable independiente clave en dos observaciones produce el
mismo efecto causal en unidades diferentes, aunque puede que
los valores de las variables no sean los mismos. En otras pala
bras, un incremento dado en la variable explicativa produce, bajo
la condición de «todo lo demás igual» o la homogeneidad de las
unidades, una magnitud fija de cambio en la variable dependien
te. En el ejemplo anterior, la mejora en los resultados electorales
del PP es igual en todas las circunscripciones que hayan sido vi
sitadas por Aznar, aunque sus niveles sean distintos. Esto es, en
Madrid pasa del 45,00 por ciento de los votos al 49,42, en Ponte
vedra, del 40,00 por ciento al 44,42, y en Córdoba, del 29,50 por
ciento al 33,92, por ejemplo: el efecto de saltar de una categoría a
otra de la variable independiente clave, la visita de Aznar, supone
siempre que el PP obtenga 4,42 puntos porcentuales más.
Cuando se satisface este supuesto podemos usar los valores
observados de la variable dependiente, en este caso los resultados
electorales del PP, para extraer una inferencia sobre el efecto cau
sal de la variable independiente clave, la visita de Aznar.
De nuevo, es imprescindible que se satisfaga la cláusula de
«todo lo demás igual» o ceteris paribus. Si hay alguna variable
independiente de control que varía, no se va a cumplir que una
variación similar de los valores de la variable independiente clave
produzca el mismo efecto causal en unidades diferentes. Esta va-
riable que no se controla no tiene que ser igual entre las unida
des, y de hecho no suele serlo, de modo que en la práctica los va
lores de la variable dependiente no están producidos por el
mismo modelo causal en todos los casos. Como el efecto sobre Y
de esta variable omitida pasa a contenerse en p, la perturbación
aleatoria pierde su condición de aleatoriedad para tener una in
fluencia sistemática, bien positiva, bien negativa, y variable sobre
Y entre las unidades. En definitiva, el efecto causal de X sobre Y
ya no es constante, sino que también depende de p. Y p nunca
está, por definición, bajo control.
Si el supuesto de la homogeneidad de las unidades u homoge
neidad causal no se cumple, y un investigador analiza los datos
como si efectivamente fuera satisfecho, la inferencia sería una
media engañosa que agrupa diferencias entre subgrupos de ca
sos: esta media no representaría adecuadamente la pauta de cau
salidad en algún caso determinado. En los términos que hemos
visto, nos encontramos con una relación espuria. Cuando se
afronta un problema como éste, los investigadores deben dividir
la muestra de casos o realizar inferencias dentro de cada subcon
junto causal o desarrollar un modelo causal más complejo que in
corpore las diferencias entre estos subconjuntos. El hecho de que
la homogeneidad causal pueda ser garantizada cuando no se sa
La lógica de la explicación en las ciencias sacíales
tisface a través de estas dos posibilidades significa, como nos re

cuerdan Collier, Seawright y Munck (2004: 30), que no es sim
plemente una propiedad de los datos, sino de los datos en rela
ción con un modelo causal particular.
Las consecuencias de la violación de este supuesto para la es
timación de efectos causales pueden observarse con los siguien
tes ejemplos cuantitativo y cualitativo. En primer lugar, uno de
los hallazgos más robustos de la literatura sobre sistemas electo
rales es que la fragmentación de un sistema de partidos es una
función del número de escaños en juego. Sin embargo, mientras
que en algunos países, como los Estados Unidos, el sistema elec
toral de mayoría relativa en distritos uninominales ha dado lugar
en la actualidad a un sistema bipartidista, en otros ha producido
sistemas multipartidistas, como en Canadá. Puesto que el supues
to de la homogeneidad causal no se satisface — una variación de
0, es decir, ninguna variación en el sistema electoral (X) da lugar
a diferencias significativas en el número de partidos (Y )— , si un
investigador analiza los datos como si se cumpliera, su inferencia
sobre el efecto del sistema electoral sobre el sistema de partidos
sería errónea. Al calcular el efecto causal medio, esto es, hallar la
media de los dos casos, no encontraría ninguna relación entre las
dos variables.
En este ejemplo, es evidente que el modelo causal es incom
pleto, puesto que se está omitiendo una variable tan importante
como la estructura de cleavages. En Canadá, y sobre todo en
Quebec, existen más divisiones sociales políticamente activas
que en los Estados Unidos que acentúan la fragmentación del sis
tema de partidos, aun cuando el sistema electoral es el mismo.
En segundo lugar, Collier, Seawright y Munck (2004: 30)
ofrecen un ejemplo de la política comparada. En algunos contex
tos nacionales los trabajadores mejor pagados tienen una mayor
conciencia de clase, mientras que en otros muestran un menor ni
vel (Przeworski y Teune, 1970: 26). Si se estima un efecto causal
medio sobre estos dos contextos, no se encontraría ninguna rela
ción significativa entre las dos variables. Resultaría necesario que
el investigador buscara la homogeneidad a través de reconocer
44
8
K«SSB* íSSSS¡
1110 $6 py 00.611 0S11 y13f U)S 6t0€t.C>$ CmlSdX&S
procesos causales distintos entre los grupos de países, pero simi

lares dentro de ellos. Es decir, en su modelo sustantivo de expli
cación falta una variable relevante.
Para evaluar el cumplimiento del presupuesto de la homoge
neidad causal, las investigaciones cuantitativas y cualitativas si
guen estrategias distintas. Las primeras, y en particular la técnica
estadística más popular, el análisis de regresión, comprueba el
supuesto y, en general, las características de la perturbación alea
toria a través del análisis de los residuos de las estimaciones esta
dísticas. En el análisis de regresión, los residuos son la diferencia
entre los valores observados de Y. y los valores predichos de Y
con el modelo teórico propuesto, Y.. Cuando se observan patrones
definidos o sistemáticos en los residuos, la inferencia presenta
problemas3.
___ LasJiTyestigaciones cualitativas, por su parte, tienen otros pro
cedimientos para evaluar la homogeneidad causal en relación con
un conjunto de casos y un modelo explicativo particular. Cuatro
merecen una atención especial debido a su amplia utilización
(Munck, 2004: 107-111). En primer lugar, el conocimiento pro
fundo del contexto cultural, histórico y político para aclarar si el
proceso causal identificado en la hipótesis tiene la misma forma
y significado en los distintos casos. En segundo lugar, considerar
los diversos factores que podrían producir heterogeneidad y con
ceptuarlos como variables adicionales que deben incluirse en el
análisis. Las aproximaciones en este sentido, como el path analy-
sis (Pierson, 2000), por ejemplo, identifican variables que sitúan
a países (u otros casos) en diferentes caminos o trayectorias de
cambio y entrañan procesos causales dispares. Su análisis con
junto explicaría la existencia de heterogeneidad causal. En tercer
lugar, aplicar diferentes formas de análisis dentro de cada caso
(within-case analysis) para examinar evidencia detenida sobre los
procesos causales que han producido el resultado que nos intere
sa. Por ejemplo,-si estudiamos los procesos de toma de decisio
nes, los investigadores cualitativos deben analizar los registros de
conversaciones y reflexión durante el proceso de decisión. Final
mente, hacer tipologías que ayuden a delimitar el dominio de los
45
casos. Por ejemplo, la tipología de regímenes políticos de Linz
(1975) permite identificar universos de casos en los cuales los
procesos causales funcionan más o menos igual.
B. La independencia condicional
Dada la necesidad de realizar comparaciones reales en lugar de

contrafácticas o hipotéticas, la calidad de la inferencia causal de
pende de cómo se asignen los casos al grupo de tratamiento o ex
puesto a la variable independiente clave y al de control o no
expuesto a la variable independiente clave4. El supuesto de la in
dependencia condicional de asignación y resultado establece que
las observaciones que se eligen y los valores que se adjudican a
las variables explicativas (Xs) soiiindencndiente^ de los de la va-
riable explicada (Y).
En negativo, el supuesto se vulnera si las variables explicati
vas se eligen en función de reglas que se correlacionan con la va
riable dependiente — sesgo de selección— o si la variable depen
diente produce las explicativas — endogeneidad. En positivo,
para que se cumpla el supuesto, las observaciones deben ser asig
nadas a los grupos de tratamiento y de control de tal manera que,
antes de que se expongan al tratamiento o a la variable indepen
diente clave, la media esperada de la variable dependiente sea
igual en los dos grupos. Cuando sucede esto último, un investiga
dor está en condiciones de realizar una inferencia sobre el efecto
causal del tratamiento (X) a través de la comparación de la media
de Y entre las observaciones que han recibido el tratamiento y las
que no lo han recibido. La lógica de este supuesto es que, si se
satisface la independencia condicional, cualquier diferencia entre
el grupo de tratamiento y el de control es una consecuencia de la
variable independiente clave, puesto que todos los demás factores
relevantes están equilibrados entre los dos grupos. Si, por el con
trario, las observaciones se asignan de modo que las que se en
cuentran en el grupo de tratamiento tienden a tener una media de
Y distinta de las observaciones del grupo de control, la inferencia
I, l ‘í . K J
causal estará sesgada. Por ejemplo, si las observaciones con un

valor más alto de la variable dependiente tienen una mayor pro
babilidad de estar en el grupo de tratamiento que las que tienen
un valor más bajo, el investigador sobreestimará el efecto causal
de X. A 1a. inversa, si las observaciones con un valor más bajo de
Y tienen una mayor probabilidad de estar en el grupo de trata
miento, se infraestimará el efecto causal de A' (Collier, Seawright
y Múñele, 2004: 32-33).
Aunque más adelante se discutirá en detalle cómo debe tener
lugar (y cómo no) la selección de observaciones, algunos ejem
plos pueden ayudarnos a entender la importancia del supuesto.
En primer lugar, cuando se eligen las observaciones o los valores
de las variables independientes teniendo en cuenta los de la de
pendiente, se predetermina el resultado de la investigación. Por
Tilaiipló; supóngani().s que queremos conocer cuáles son las opi
niones de los madrileños sobre el matrimonio entre personas del
mismo sexo. Para obtener la información, preguntamos a los in
dividuos que salen de misa en la catedral de la Almudena. Como
es evidente, se está vulnerando el supuesto de la independencia
condicional. L os valores de la variable dependiente, las opinio
nes, se están eligiendo en función de una regla o variable omitida
que está correlacionada con ella, ser católico practicante: las per
sonas religiosas son más conservadoras en este tema que las que
no lo son y, por tanto, valoran peor el matrimonio entre personas
del mismo sexo. Por tanto, la inferencia descriptiva está sesgada,
puesto que la opinión media esperada de las personas religiosas
(y seleccionadas) es peor que la de las que no lo son (y no selec
cionadas). En otras palabras, las personas u observaciones esco
gidas no representan bien la población a la que pertenecen. La
conclusión incorrecta a que llegaremos es que la gran mayoría de
los madrileños están en contra del matrimonio entre homosexua
les.
Y otro tanto sucede si seleccionamos las observaciones de
acuerdo con los valores de la variable dependiente. En el ejemplo
anterior, la inferencia sobre las opiniones de los madrileños res
pecto al matrimonio homosexual tampoco sería correcta si sola-
La lát
mente preguntáramos a los que sabemos que tienen opiniones po

sitivas sobre él, como los propios homosexuales. Todas las perso
nas seleccionadas lo valorarían bien, sea cual fuera su edad, pero
no representarían adecuadamente al conjunto de los madrileños.
La independencia condiciona] se satisface automáticamente
cuando la selección de las observaciones es aleatoria, puesto que
un criterio aleatorio no se correlaciona, por definición, con las
posibles variables independientes y dependientes. En el ejemplo
anterior, cuando se realiza una encuesta en el domicilio de los
madrileños y todos tienen la misma oportunidad o probabilidad
de ser entrevistados, se asegura el cumplimiento del supuesto.
Las inferencias que hagamos a partir de las observaciones selec
cionadas serán válidas, siempre y cuando se cumpla también la
homogeneidad causal.
No obstante, en muchas ()casióñes éifláuiwestigacíbrí en“cien---
cia política hay que abandonar la aleatoriedad debido a que el nú
mero de observaciones que se pueden emplear es pequeño. El nú
mero de países que han pasado de regímenes autoritarios a
democráticos a través de transiciones pactadas, por ejemplo, es
limitado. En general, como señalan King, Keohane y Verba
(2000: 134), las posibilidades de que un criterio de selección de
las variables se correlacione con alguna variable independiente o
dependiente aumentan a medida que se reduce el número de ob
servaciones.
Pero también cuando el número de observaciones es grande, es
posible que se viole el supuesto de la independencia condicional.
Supongamos que realizamos una encuesta postelectoral telefóni
ca sobre las elecciones legislativas en un país poco desarrollado.
Evidentemente, sólo los individuos que tienen una línea de telé
fono a su nombre pueden ser entrevistados. Como resulta que es
tos individuos son los que disponen de las rentas más elevadas, el
criterio de selección de las observaciones se correlaciona con una
variable independiente. En efecto, la renta es una variable que in
fluye positivamente en la probabilidad de votar (Anduiza, 1999),
de modo que en la práctica se seleccionan individuos que tienen
una probabilidad de haber votado más alta que la media del país.
5. ¿Cómo se pueden estimar ios efectos causales?
En segundo lugar, el supuesto de la independencia condicio

nal también se vulnera en las situaciones de endogeneidad, esto
es, cuando la variable dependiente produce las independientes.
La endogeneidad aparece cuando los valores de nuestras varia
bles explicativas provienen de nuestra variable dependiente en
lugar de al revés. Es decir, no se sabe con seguridad cuál es la
causa y cuál el efecto y, así, la dirección de la causalidad no
está en absoluto clara. Por ejemplo, supongamos que la hipóte
sis de un investigador es que estudiar la licenciatura de ciencia
política (Ar) provoca un mayor interés por la política (Y) que
estudiar matemáticas (X). Aunque seguramente esta relación
existe, no se puede obviar que los estudiantes que deciden cur
sar ciencia política en lugar de matemáticas (Y) lo hacen por
que tienen un mayor interés por la política {X). Es decir, las di
ferencias* én elIn te? éS' p'ór la política, o al menos una parte, que
se observan entre los estudiantes una vez que cursan la carrera
ya existían antes de que la comenzaran. Por tanto, no se puede
inferir el efecto causal de la carrera a través de la comparación
directa de los niveles de interés por la política de los indi
viduos.
L a causa de la endogeneidad está en la correlación de una va
riable independiente con la perturbación aleatoria en el modelo
causal que evaluamos. Como ya sabemos, esta correlación supo
ne que la perturbación aleatoria o, más bien, las variables inde
pendientes que no están incluidas en el modelo causal, y cuyo
efecto pasa a ¡jl, influyen sistemáticamente en el valor de la me
dia de Y. Es decir, la perturbación aleatoria pasa a ser sistemática.
La variable independiente que está efectivamente en el modelo
causal y se correlaciona con ¡jl o, si se prefiere, con alguna varia
ble independiente relevante que no se ha tenido en cuenta está re
cogiendo parte del efecto sobre Y de este factor omitido. En defi
nitiva, el efecto causal de la variable independiente que aparece
en el modelo causal es incorrecto, puesto que está aumentado o
reducido artificialmente, según corresponda. Evidentemente, las
inferencias causales que se realizan cuando existe un problema
de endogeneidad no son válidas.
Desde una perspectiva formal, la naturaleza de la endogenei-
dad se observa en el siguiente ejemplo. Supongamos que estamos
investigando los determinantes de la inflación de los precios y los
salarios en un país. De acuerdo con un modelo simple establece
mos que p, la tasa anual de crecimiento de los precios, está rela
cionada con w, la tasa anual de crecimiento de los salarios. Nues
tra hipótesis es que los aumentos en w provocan que suba p. Es
decir,
P = 0 , + P 2w + P p 01)
Al mismo tiempo, w está relacionada con p y U, el nivel de

desempleo. Nuestra hipótesis es que cuanto mayor sea el nivel
de desempleo, menos capaces serán los trabajadores de deman
dar incrementos en los salarios 'cüáñiJb suben los preciosrBsr
decir,
w = a ] + a 2p + a 3U + p w (12)
Como ya sabemos, p, y ¡xw son el componente aleatorio en

cada uno de los modelos. De acuerdo con los dos modelos causa
les, existe una relación circular: w determina p en la ecuación
(11) y p determina vr en (12). Si sustituimos w en la ecuación
(11) por su modelo en (12), tenemos que:
P = Pi + P 2( a i + «2 P + a 3U + ¿ O + P’p (13)
y, por tanto,
P\ + a \P2 + af í 2U + P'p + ^2 P'w (14)

1 - a 2/32
Si realizamos las operaciones análogas en (12), resulta que
w = a, + a 2(/3, + P 2w + P p) + ol3U + p,w (15)

y, por tanto,
+ a 2/3¡ + a 3U + Oí2f i + ¡xw
Si estimamos 1a. ecuación (11) ignorando el hecho de que w

determina p, la inferencia causal no será correcta. En pocas pala
bras, puesto que la perturbación aleatoria p influye en p, cuando
p influye a su vez en w, es una causa indirecta de w y, en conse
cuencia, w y p están correlacionados. De este modo, p no es in
dependiente de w y, por tanto, el efecto causal de w está «conta
minado».
Las investigaciones que sufren problemas de endogeneidad no
son extrañas en ciencia política. Por ejemplo, en La ética protes-
4ante y el espíritu del capitalismo, Max Weber sostiene que las
enseñanzas y doctrinas protestantes provocaron el espíritu capita
lista. Sin embargo, Laitin (1986: 187) plantea que se puede dar la
vuelta a la línea de causalidad: los europeos a los que ya les inte
resaba romper los límites del espíritu precapitalista bien podrían
haberse apartado de la iglesia católica para alcanzar este propósito.
A su vez, en su discusión de los debates fundamentales sobre
los que se ha articulado la investigación sobre los sistemas elec
torales, Montero y Lago (2005) señalan que se han estudiado du
rante décadas como variable dependiente, esto es, como suminis
tradores de los incentivos, positivos o negativos, para la creación
y permanencia de los partidos políticos. No obstante, si los siste
mas electorales son tan importantes para explicar cómo se desa
rrollan los sistemas de partidos, resulta ingenuo pensar que las
elites políticas que deben decidir sobre qué sistema electoral se
adopta no tengan en cuenta sus intereses y preferencias. Dicho de
otra forma, las configuraciones previas de los sistemas de parti
dos deben contar en los diseños institucionales que realizan los
partidos5.
6. ¿Qué significa «explicar»
en ciencias sociales?
Del mismo modo que no existe una definición de causalidad uni

versalmente aceptada, tampoco hay un acuerdo general sobre
cómo debe ser o qué debe contener una explicación en ciencias
sociales. Solamente se acepta que las explicaciones dan cuenta de
por qué suceden los acontecimientos, por qué algo cambia a lo
largo del tiempo o por qué estados o acontecimientos covarían en
el tiempo o el espacio.
Ya sabemos que el diseño de investigación o, más ampliamen
te, la metodología nos aclara cómo plantear las preguntas y llevar
a cabo nuestro estudio para extraer inferencias causales (y descrip
tivas) válidas. Es decir, nos permite establecer relaciones causales
robustas entre los fenómenos políticos y sociales que estudiamos.
Pero ¿es la causalidad suficiente para tener una explicación en
ciencias sociales? Aunque se pretenda desligar la lógica inferen-
cial de la filosofía de la ciencia, como intentan King, Keohane y
Verba (2000: 13), por ejemplo, se trata de una cuestión central
dadas sus consecuencias cruciales sobre las herramientas meto
dológicas que se pueden emplear y sobre el propio papel que de
sempeña la teoría sustantiva en la explicación. No en vano se en-
53
Le CS. Qé te c a m ó n e n l a s d e l e c t e s s a c i a t e c
{i
cuentra en la raíz de la discusión sobre la capacidad de explica
ción de los estudios cualitativos frente a los cuantitativos'.
En términos generales, en las ciencias sociales existen en la
actualidad al menos tres grandes concepciones o tradiciones so
bre cómo debe ser una explicación: la puramente estadística, la
de las leyes de cobertura y la basada en los mecanismos causa
les 2 (Elster, 2000; Goldthorpe, 2001; Hedstróm, 2005: cap. 2;
Hedstrdm y Swedberg, 1998; Little, 1991). Como tendremos oca
sión de comprobar a continuación, las diferencias entre ellas tie
nen que ver fundamentalmente con la estrategia analítica que de
fienden para garantizar que las relaciones aparentemente causales
no sean en realidad espurias. O, en otras palabras, para satisfacer
con la mayor seguridad posible los supuestos de la homogeneidad
de las unidades u homogeneidad causal y la independencia con
dicional. ___ __ _______________________________
6.1. La explicación estadística
En la explicación estadística, la causalidad se establece a través

de la eliminación de los efectos de las variables confundidoras: si
la relación entre dos variables persiste cuando se controlan (esto
es, cuando se mantienen constantes sus valores) las demás varia
bles independientes intervinientes, entonces la relación se inter
preta como un «efecto causal». Así, X es una causa genuina de Y
en la medida en que la dependencia sea robusta. En palabras de
Lazarsfeld (1955: 124-125), uno de los mejores exponentes de la
explicación estadística, «si tenemos una relación entre X e Y que .
no desaparece cuando se tiene en cuenta cualquier otro factor an
tecedente, entonces la relación original puede llamarse causal».
De acuerdo con Hedstróm (2005: cap. 2), la característica de-
finitoria de la explicación estadística es que una explicación ade
cuada identifica variables que influyen, bien positiva, bien nega
tivamente, en la probabilidad de que suceda el acontecimiento
que se intenta explicar. La identificación de estas variables se
basa en la descomposición de los casos u observaciones en dife
rí 4
, 1 ’ I ' . f,
rentes categorías. Supongamos, retomando un ejemplo anterior,

que deseamos conocer si los resultados electorales del PP en las
circunscripciones en las elecciones generales de 1996 dependen
de la visita de José María Aznar durante al campaña electoral, la
variable independiente clave. Pero sabemos que hay otras varia
bles independientes que importan; en particular, que una circuns
cripción haya recibido o no fondos de cohesión europeos. En pri
mer lugar, dividimos las circunscripciones en dos grupos (por un
lado, las circunscripciones que hayan recibido fondos europeos y
hayan sido visitadas por Aznar, y las circunscripciones que hayan
recibido fondos europeos y no hayan sido visitadas por Aznar;
por otro, las circunscripciones que no hayan recibido fondos eu
ropeos y hayan sido visitadas por Aznar, y las circunscripciones
que no hayan recibido fondos europeos y no hayan sido visitadas
por Aznar). Si no se observan diferencias en la media de los re
sultados electorales del PP, nuestra variable dependiente, en cada
uno de los grupos, concluimos que la visita de Aznar a una cir
cunscripción no importa en los resultados de su partido una vez
que se controla que una circunscripción haya recibido o no fon
dos europeos. Es decir, la relación que existía entre la visita de
Aznar y los resultados electorales del PP es espuria. Por el con
trario, si se siguen observando diferencias en los resultados del
PP (esto es, en las circunscripciones que han sido visitadas por
Aznar en cada uno de los grupos señalados los resultados del PP
son mejores que en las que no han sido visitadas), y no se mane
jan más variables de control, podemos concluir que hay un efecto
causal de X en Y. Por supuesto, esta lógica de descomposición ya
la conocíamos: es la que se aplica en todas las investigaciones,
cualitativas o cuantitativas, para estimar un efecto causal3.
En general, esta variante estadística de la explicación se basa
en la idea de que el comportamiento de los individuos se puede
explicar de acuerdo con «determinantes» individuales y contex
túales; el propósito del análisis debe ser estimar la influencia cau
sal de las variables que representan estos determinantes. Así, el
explanandum es la variable dependiente, y el explanans consiste
en una serie de variables independientes: los efectos de estas va-
La lógica de La explicación en las ciencias sociales
riables independientes sobre la dependiente se sugieren y se con

trastan empíricamente. El explanandum se «explica» en la medi
da en que sea posible «explicar» la variación de la variable de
pendiente. El supuesto básico de esta explicación es que las
características de los individuos y del contexto componen un
campo de «fuerzas» en las que el individuo tiene una posición
como variable dependiente. La tarea de las ciencias sociales debe
ser la de determinar la dirección e intensidad de este campo de
fuerzas (Esser, 1996: 159).
Por tanto, la estrategia de la investigación pasa por (1) estable
cer una serie de relaciones funcionales bivariadas entre una varia
ble dependiente y varias independientes, basadas en la intuición o
en expectativas formadas de acuerdo con la investigación previa;
(2) demostrar regularidades cuantitativas en un conjunto de ob
servaciones, y (3) concluir que se dispone de una explicacióITLsá-
tisfactoria de la variación en la variable dependiente porque se
tiene la capacidad de dar cuenta de tal covariación (McKeown,
2004: 151). Si la causalidad se entiende de esta manera, la expli
cación de los fenómenos políticos y sociales es una cuestión de
inferencia estadística en la que no intervienen otras consideracio
nes: simplemente se desprende de regularidades empíricas.
Esta idea de que las técnicas estadísticas per se son capaces de
desarrollar explicaciones causales ha recibido numerosas y, en mi
opinión, convincentes críticas. En particular, estas técnicas sólo
pueden mostrar la existencia de relaciones entre las variables,
pero no cómo se producen a través de la acción e interacción de
los individuos. En otras palabras, la conexión explicativa o causal
entre las variables está ausente. Puesto que no hay ninguna justi
ficación teórica de los efectos de los factores que se manejan, la
probabilidad de una derivación teórica de la relación entre las va
riables es difícil. Esto plantea inmediatamente el problema de de
cidir cuáles son las variables independientes que se deben tener
en cuenta (Boudon, 1976; Coleman, 1986; Esser, 1996; Goldt-
horpe, 2001; Hedstrom y Swedberg, 1998; Sorensen, 1998). Y es
que las regularidades estadísticas son difícilmente interpretables
en términos causales. Como nos recuerda Stinchcombe (1968:
«explicar» en rías sociales?7
saawsssssK
13), «un estudiante que tenga dificultades para pensar en al me

nos tres posibles explicaciones para una correlación en la que
está realmente interesado debería escoger probablemente otra
profesión».
Para explicar las debilidades de esta concepción estadística de
la explicación, podemos retomar el ejemplo que ofrecen
Hedstróm y Swedberg (1996a: 135-136; 1998: 10-11). Tanto en
la ciencia política como en la sociología, la clase social es una
variable que se suele manejar para explicar comportamientos in
dividuales como el voto o la salud. Sin embargo, la clase no pue
de influir en el voto o la salud porque no es un agente causal,
sino un constructo analítico, una agregación de categorías ocupa-
cionales. Por tanto, una asociación estadística entre clase y voto,
por ejemplo, nos dice que los individuos de ciertas «clases» tie-
-«©n-u-na- mayor o menor probabilidad de votar a los partidos so-
cialdemócratas, pero no nos cuenta por qué. Para responder a esta
cuestión es necesario mostrar de qué manera se han producido las
diferencias medias en el comportamiento electoral entre los gru
pos ocupacionales que los investigadores han asignado a diferen
tes clases.
Si volvemos al ejemplo de las elecciones generales de 1996,
cuando descubrimos que la visita de Aznar a una circunscripción
durante la campaña supone un mejor resultado electoral del PP,
este hallazgo nos lleva inmediatamente a preguntarnos por qué.
¿Se produce, por ejemplo, a causa de que mejora la opinión sobre
Aznar, a causa de que la visita supone un esfuerzo de moviliza
ción del partido o a causa de la mayor información sobre el PP
que consiguen los votantes a través de los medios de comunica
ción? No lo podemos saber.
En último término, Glymour et al. (1987: 7) presentan un
ejemplo contundente de los problemas de las explicaciones pura
mente estadísticas. En la investigación basada en esta concepción
de la explicación, el rendimiento de los modelos se compara con
uno nulo o compuesto exclusivamente por elementos aleatorios y
que defiende la inexistencia de una relación significativa entre
las variables. Lógicamente, se escoge el que mejor funciona. Su-
pongamos que tenemos un sistema con seis variables y que hay
cuatro posibles relaciones entre cada par de variables X e Y: X
afecta a Y, pero no al revés; Y afecta a X, pero no al revés; ambas
se afectan mutuamente, y ninguna tiene influencia sobre la otra.
Dado que las seis variables crean 15 posibles pares de variables,
se pueden identificar 415 relaciones distintas, de modo que hay
415 modelos a contrastar para identificar el que mejor encaja con
los datos. Cuando se muestra que uno de estos modelos funciona
mejor que el modelo nulo, esto no ayuda demasiado a resolver la
cuestión de si se trata del mejor de todos los posibles. Aceptar
«significativamente mejor que la hipótesis nula» como criterio
para una explicación exitosa lleva a una regla perversa para dar
por finalizada y como satisfactoria la investigación: busca en el
universo de especificaciones plausibles a partir de las restriccio
nes teóricas que existan hasta~que-enGuentr-es-una-que-consiga_ije^
sultados m ejor que la nula, y entonces publícalos. Si en este
ejemplo existen 415 especificaciones entre las que escoger, no
sería una sorpresa descubrir que los modelos publicados sean in
feriores en términos de su ajuste a los que no han sido descubier
tos hasta ahora. En fin, el hecho de que un modelo pueda ser
identificado en términos estadísticos no garantiza que sea el me
jor informe de los procesos causales que tienen lugar.
De nuevo, los clásicos nos ofrecen la pista a seguir. En sus re
flexiones sobre metodología, Weber señalaba que «la frecuencia
estadística de un comportamiento en modo alguno vuelve a éste
más “ comprensible” ni provisto de sentido, así como la “compren
sibilidad” óptima nada dice como tal en favor de la frecuencia,
sino que, antes al contrario, las más de las veces una racionalidad
con relación a fines subjetiva, absoluta, implica lo contrario». Por
tanto, «las interpretaciones “provistas de sentido” de una conduc
ta concreta no son para ella [la sociología], naturalmente, como
tales, aun si presentan la máxima evidencia, otra cosa que meras
hipótesis respecto a la imputación [causal]. Necesitan, por lo tan
to, de una verificación que empleará llegado el caso los mismos
medios que cualquier otra hipótesis». Es decir, «los datos estadís
ticos [...] quedan para nosotros “ explicados” sólo cuando reciben
también una efectiva interpretación provista de sentido en el caso
concreto» (Weber, 1973: 185-186).
En definitiva, y como señala Brady (2004: 58), la literatura
sobre estadística es excepcional en definir la causalidad sin dis
cutir la explicación. Seguramente porque la inferencia descansa
sobre el diseño de investigación y los datos, y no sobre la sustan
cia de la investigación. De esta manera, no se conoce qué es una
buena explicación más allá de qué es una buena inferencia cau
sal. La conclusión no puede ser otra que los análisis estadísticos
son cruciales para contrastar empíricamente la validez de nues
tras explicaciones o para establecer el explanando, pero no pue
den ser la explicación en sí misma. En palabras de Achen (1982:
7-8), «los métodos estadísticos son simplemente herramientas, y
uno no puede usar bien una herramienta sin un claro propósito en
la mente. De esto se sigue que para hacer un buen análisis de los
datos hay que tomar una posición sobre la naturaleza de la expli
cación científica en las ciencias sociales».
6.2. La explicación basada en las leyes de cobertura
En las explicaciones basadas en las leyes de cobertura o, con ma

yor generalidad, en el positivismo se defiende la existencia de
proposiciones generales del tipo «si - entonces», esto es, leyes.
Los resultados se relacionan con elementos antecedentes en una
situación determinada y se establece a continuación que una ob
servación dada es un ejemplo de un acontecimiento o situación
especificada o cubierta por las leyes generales. La lógica de la ex
plicación es la siguiente: tenemos un acontecimiento que preten
demos explicar y nos preguntamos cuáles son las causas de que
haya pasado. Para tener una respuesta adecuada, hay que subsumir
el acontecimiento bajo una ley general. Esto es, explicamos el
acontecimiento apuntando una o varias leyes generales y las con
diciones que hacen aplicables estas leyes al caso específico.
Dicho de otro manera, un acontecimiento sólo puede conside
rarse explicado cuando se ha formulado de acuerdo con silogis-
m/jm.
mos que satisfacen tres condiciones: (i) como premisas principa

les, leyes de cobertura eficaces causalmente; (ii) como premisas
secundarias, condiciones antecedentes abstractas que prevalecen
en determinados momentos y lugares; (iii) las conclusiones se si
guen como el inexorable o al menos probable resultado de las su
puestas leyes que operan en los antecedentes especificados (Te-
tlock y Lebow, 2001: 629). Por tanto, la explicación científica de
un acontecimiento consiste en:
1. un conjunto de afirmaciones sobre la ocurrencia de ciertos acontecimien

tos Cj ... C, en ciertos momentos y lugares;
2. un conjunto de hipótesis universales, tal que la evidencia empírica confir
me razonablemente las afirmaciones de ambos grupos;
a. la sentencia asegurando que.la ociiii:eiicia.xlel.acoiitecimiento E se puede de-
ducir lógicamente de los dos grupos de afirmaciones (Hempel, 1994: 43-45).
Hempel (1942) plantea el ejemplo del radiador de un coche que

se rompe en una noche fría para ilustrar la lógica de la explica
ción. Las leyes generales citadas en la explicación deberían alu
dir a cómo la presión del agua cambia a través de su variación en
temperatura y volumen, y a las condiciones iniciales referidas a
la temperatura durante la noche y la presión a la que estalla el ra
diador. Una explicación sería adecuada si y sólo si se puede de
ducir lógicamente de las proposiciones que establecen las leyes y
las condiciones iniciales. Pero quizás un segundo ejemplo sea
más ilustrativo: uno podría decir que Aristóteles murió porque
era humano y todos los humanos son mortales.
Los principios de esta variante de la explicación ya aparecen
formulados en las primeras páginas de la Filosofía Positiva de
Comte (1854):
La primera característica de la Filosofía Positiva es que considera que todos

los fenómenos están sujetos a leyes naturales invariables. Nuestra tarea es
[...] perseguir un descubrimiento adecuado de estas leyes, con la perspectiva
de reducirlos al menor número posible. Cuando especulamos sobre sus cau
sas, podríamos determinar sin problemas sus orígenes y propósitos. Nuestra
60
nencias sociales
verdadera tarea es analizar adecuadamente las circunstancias de los fenóme

nos, y conectarlos a través de las relaciones naturales de la sucesión y simili
tud. La mejor ilustración de esto se encuentra en la doctrina de la gravitación
(Comte, 1854: 5-6).
E incluso Mili (1874: 332) señala que:
un hecho individual se dice que está explicado cuando se apunta su causa,

esto es, cuando se establece la ley o las leyes de causalidad.
En la ciencia política, uno de los más conocidos ejemplos de teo

rías que se basan en las leyes de cobertura es la explicación de
los efectos de los sistem as electorales de Duverger (1987
[1951]). La ambición de Duverger no era otra que plantear los
sistemas electorales como condición necesaria y a la vez sufi
ciente para obtener determinadas configuraciones del sistema de
partidos: así, por ejemplo, cuando se adopta un sistema electoral
de mayoría relativa en una sociedad, sea cual fuere su estructura
de cleavages, el resultado habrá de cristalizar en un sistema bi
partidista. Este planteamiento es ciertamente parsimonioso desde
el punto de vista teórico, lo que constituye el principal activo de
las ya conocidas como leyes de Duverger.
Puesto que Hempel consideraba que las leyes deterministas
eran improbables en las ciencias sociales, las que se pueden invo
car en nuestra disciplina tienen una naturaleza probabilística, es
decir, establecen que un evento ocurrirá con determinada proba
bilidad si se cumplen ciertas condiciones previamente explicita-
das. Esto es,
la mayoría de A son B
Xeszl
X es probable que sea B
Aunque hayan sido ampliamente utilizadas, sobre todo las proba-

bilísticas, la principal debilidad de las leyes de cobertura es que
no son capaces de distinguir entre los argumentos causales y los
61
sssses&w
no causales. De acuerdo con el ilustrativo y conocido ejemplo de

Miller (1987: 34):
la explicación causal no se analiza a través del modelo de la ley de cobertura.

[Algunos] contraejemplos son suficientes [...] Cuando un barómetro cae, es
muy probable que tenga lugar un cambio a peor en el tiempo. La alta proba
bilidad es dictada por las leyes de la meteorología. Pero el tiempo no cambia
debido a que el barómetro caiga.
Pero, además, las leyes de cobertura en ciencias sociales dan lu

gar a explicaciones imprecisas. Como meras asociaciones esta
dísticas, las explicaciones no ofrecen más razones que la propia
ley en sí misma. Justifican así la utilización de explicaciones de
caja negra en la medida en que no consideran necesaria la provi-
sión de los mecanismos que conecten la variable dependiente y
la/s independiente/s. En el caso de las leyes de Duverger, por
ejemplo, los procesos causales que producen la correlación entre
sistema electoral y sistema de partidos quedan sin explicar4. En
la medida en que esa generalización estructural cree predecir el
comportamiento de las elites y votantes a partir de la situación en
la que se encuentran, la explicación de cómo los sistemas electo
rales influyen en las acciones de los actores está ausente.
Como concluye Hedstróm (2005: cap. 2), las leyes de cobertu
ra no parecen particularmente útiles para las ciencias sociales.
Por un lado, el modelo deductivo no se puede aplicar, puesto que
las leyes deterministas que presupone no existen. Por otro, da lu
gar a teorías y explicaciones superficiales, debido a que no plan
tea cuáles son los microfundamentos, acciones e interacciones,
que están detrás.
6.3. La explicación basada en mecanismos causales o

sociales
La idea básica de la aproximación a la causalidad basada en los

mecanismos es que la explicación en ciencias sociales no tiene
6,
lugar a través de la invocación de leyes universales o la identifi

cación de variables relevantes, sino mediante la provisión de los
procesos (o mecanismos) que producen los fenómenos sociales.
En otras palabras, no sólo se deben apuntar las variables que cau
san una diferencia sistemática en la probabilidad de que suceda
un acontecimiento; es necesario, además, señalar cómo X causa
Y.
Como nos recuerda Pickel (2004), este debate sobre los meca
nismos causales es relativamente reciente. Sin embargo, la prime
ra formulación explícita aparece seguramente en Merton (1967:
106):
el análisis funcional en sociología, como en otras disciplinas como la fisiolo

gía o la psicología, reclama que se dé cuenta «concreta y detalladamente» de
los meeanismas-que-operan para realizar una función designada. Esto se re
fiere, no a los mecanismos psicológicos, sino a los mecanismos sociales (por
ejemplo, la segmentación de roles, la protección de demandas sociales, el or
den jerárquico de valores, la división social del trabajo, leyes rituales y cere
moniales, etc.). La pregunta básica [es] ¿cuál es el inventario posible en este
momento de mecanismos sociales correspondiente, digamos, al gran inventa
rio de mecanismos psicológicos? ¿Qué problemas metodológicos están vin
culados a discernir el funcionamiento de mecanismos sociales?5.
Las definiciones de qué es un mecanismo causal son m uchas6.

En mi opinión, la que mejor y de una manera más parsimoniosa
capta su significado es la que ofrecen Machamer, Darden y Cra-
ver (2000): un mecanismo causal es un concepto que especifica
un conjunto de entidades (actores, procesos o estructuras) y acti
vidades que está organizado de tal modo que provoca con fre
cuencia un determinado resultado. Es decir, un mecanismo mues
tra cómo una variable independiente o input se transforma en la
variable dependiente o output para conectar así los procesos cau
sales.
Los mecanismos muestran cómo los valores de una variable
independiente influyen en las oportunidades, las creencias y/o los
intereses de los actores, y cómo las acciones e interacciones de
o
fu en te: Hedstróm y Swedberg (1998: 9).
Fig u r a 2. Mecanismos c o m o c o n e x i ó n e n l o s p r o c e s o s c a u s a l e s .
éstos generan los valores de la variable dependiente. Es decir, una

buena teoría no sólo nos cuenta qué pasa sino también qué hace
que pase o qué impide que pase (Bunge, 1997). Si no podemos
decir algo sobre la frecuencia o probabilidad de un tipo específi
co de situación y sus resallados, no podemos evaluar Ja. relevan
cia o capacidad explicativa de un mecanismo causal, indepen
dientemente de lo bien que entendamos teóricamente la situación
particular. Y si no somos capaces de señalar un mecanismo, no
podemos comprender el significado politológico o sociológico de
la covarianza observada entre las variables, al margen de su fuer
za (Blossfeld, 1996).
Los siguientes ejemplos ilustran el significado de los meca
nismos causales. En primer lugar, sabemos que la inflación causa
una reducción en el consumo de un bien. El mecanismo que co
necta la causa y el efecto tiene que ver con las decisiones de los
consumidores racionales: cuando observan el incremento de los
precios, ajustan su consumo para maximizar su utilidad total y,
en consecuencia, reducen su consumo individual del bien en
cuestión. De este modo, el comportamiento racional de los indi
viduos produce el efecto de un menor consumo agregado.
En segundo lugar, en contra de lo que uno podría esperar da
dos los vehementes sentimientos contra el tabaco existentes en
los Estados Unidos, el elevado número de fumadores en las calles
de Nueva York hace que estén cubiertas de colillas de cigarrillos.
¿Cómo se puede explicar este resultado aparentemente paradóji
co? Si fumar está prohibido en las oficinas y no está bien visto en
mmmMkimmxii'M- 1 ' . f N en ciencias sacíales?
las casas, puede predecirse que se incrementará el número de fu

madores en las calles y, por tanto, el de colillas. Si reconstruimos
la lógica de este razonamiento, podemos observar que descansa
en no menos de tres mecanismos, cuya plausibilidad individual
sostiene la del modelo. La explicación asume, primero, que la
norma contra el tabaco se respeta; segundo, que al menos algu
nos fumadores no abandonan su adicción incluso con el coste
adicional de tener que hacerlo en el exterior; tercero, que tirar las
colillas en la calle, aunque a nadie le guste, resulta individual
mente más barato que guardarlas o echarlas en una papelera.
Norma, adicción y racionalidad elemental dan cuenta conjunta
mente del rompecabezas. Si alguno de estos mecanismos no fun
cionara o su efecto fuera compensado por otro, la explicación fa
llaría (Gambetta, 1998: 104-105).
~ Pinuimente, Po 1avieja (2005) estudia las razones que llevaron
a que la desregulación laboral en España inaugurada en 1984 ge
nerara importantes desigualdades entre los trabajadores de pro
ductividad equiparable. A través de la revisión de los datos empí
ricos existentes sobre la distribución de oportunidades entre 1984
y 1997, Polavieja muestra que este efecto depende de (i) la exis
tencia de elevados costes de despido y (ii) un sistema de negocia
ción colectiva poco inclusivo, esto es, con una escasa presencia
de los sindicatos en los centros de trabajo y una negociación cen
trada en la discusión de los salarios y escasamente en las caracte
rísticas de los contratos de empleo.
¿Por qué es tan importante especificar los mecanismos que
han dado lugar a los resultados observados? De acuerdo con
Hedstróm (2005: cap. 2), se pueden señalar al menos tres razo
nes. Por un lado, los mecanismos dan lugar a explicaciones más
precisas y comprensibles. Por otro, los mecanismos reducen la
fragmentación de la teoría. Por ejemplo, existen numerosas teorías
(del crimen, los movimientos sociales o la movilización electoral)
que se basan en los mismos principios causales: la acción e inte
racción entre los individuos. Si nos centramos en los mecanismos
podemos evitar una proliferación innecesaria de conceptos teóri
cos y conseguir así una similitud estructural entre procesos apa
La < ' - -
rentemente distintos. Finalmente, es el conocimiento de los me

canismos lo que nos permite creer que existe una relación causal
entre X e Y, y no simplemente una correlación espuria. Por ejem
plo, en una reciente investigación, Franco, Álvarez-Dardet y Ruiz
(2004) muestran que, una vez que se controla el efecto del nivel
de riqueza, de las desigualdades o del gasto público de un país, la
democracia aumenta la esperanza de vida de la población y redu
ce la mortalidad infantil y la materna, en comparación con los
demás tipos de sistemas políticos. Aunque este resultado es ro
busto desde un punto de vista estadístico, los autores reconocen
que no tienen claro por qué la democracia es buena para la salud.
Por tanto, bien podría ser que la omisión de una variable de con
trol estuviera provocando este resultado. En particular, es posible
que esta correlación tenga que ver con el hecho de que las demo
cracias no suelen e'sfáFémméltas en’ p é f f á s 'ciVilFS o eirattracie--
nes de represión militar, pero sí los regímenes no democráticos.
En fin, como los autores no son capaces de señalar un mecanis
mo causal que explique cómo la democracia afecta a la salud,
siempre nos queda la duda de que esta relación sea en realidad
espuria.
De acuerdo con Merton (1967), las explicaciones basadas en
mecanismos se encuadran en las llamadas teorías de alcance me
dio, esto es, teorías que se sitúan a medio camino entre las grandes
teorías abstractas y las descripciones ateóricas (Boudon, 1991).
Como aclara Tilly (2001: 23-25), las explicaciones basadas en me
canismos difieren de las leyes de cobertura en dos cuestiones bási
cas: (1) niegan que puedan tener lugar repeticiones interesantes de
procesos y estructuras sociales de amplio nivel y (2) aunque los
mecanismos tienen efectos uniformes inmediatos, sus consecuen
cias agregadas, acumuladas o a largo plazo, varían considerable
mente en función de las condiciones iniciales y de sus combinacio
nes con otros mecanismos. Y frente a las meras descripciones,
plantean que las ciencias sociales están en condiciones de identifi
car pautas causales que se repiten con cierta regularidad.
Los defensores de la explicación basada en los mecanismos
causales se agrupan bajo la etiqueta del llamado «realismo cau
5, ¿Clisé significa «explican? en ciencias sociales?
sal». Para el realismo causal, apuntar que A causa B es afirmar

que, en el contexto de las fuerzas causales en juego, A da lugar a
B o incrementa la probabilidad de que ocurra a través de un me
canismo específico. Sus principios son cinco (Little, 1998: 191-
198):
1. Existen relaciones causales entre los fenómenos sociales,

de modo que la explicación causal es la forma central de la
explicación social.
2. Las relaciones causales no están constituidas por regulari
dades o leyes que conectan los sucesos o fenómenos socia
les. Por el contrario, las regularidades en el mundo social
no responden a las leyes estrictas o predictivas de la natu
raleza.
---- 3. I as relaciones sociales causales están formadas por los po
deres causales de diversas estructuras, condiciones y suce
sos y los mecanismos causales que llevan de las condicio
nes antecedentes a los resultados sociales.
4. No hay una causalidad social pura entre m acroestados,
sino hipótesis sobre mecanismos causales que deben ser
construidos a partir de la presentación de los microfunda-
mentos de los procesos que se plantean.
5. Existe diversidad causal en los mecanismos y propiedades
que los científicos sociales distinguen, de manera que des
de una perspectiva metodológica es defendible el eclecti
cismo.
Al igual que la causalidad — recordemos que la situación real

y la situación hipotética no se pueden dar simultáneamente— , los
mecanismos causales no son directamente observables. Los me
canismos son constructos teóricos que se derivan inductivamente
de la evidencia empírica, pero que no se pueden derivar deducti
vamente de esta evidencia. Nunca podemos mostrar que un me
canismo particular causó un fenómeno determinado; sólo pode
mos mostrar que este mecanismo podría haber producido el
fenónemo (Simón, 1979: 71).
Puesto que diferentes teorías producen distintos mecanismos,
¿cómo se puede seleccionar el más apropiado de todos los posi
bles candidatos? Aunque no existe una regla incuestionable, Ki-
ser y Hetcher (1991: 6-10) apuntan tres criterios para escoger en
tre mecanismos causales rivales: la plausibilidad, la reducción de
la distancia temporal entre causa y efecto y las implicaciones em
píricas.
En primer lugar, sólo algunos mecanismos son considerados
plausibles para la comunidad cientifica. Por ejemplo, existe una
fuerte correlación entre el desarrollo económico y los sistemas poli-
ticos democráticos. Pero debido a la incapacidad de especificar me
canismos causales adecuados, no está claro si estas dos variables es
tán relacionadas causalmente y, si es así, cuál es X y cuál es Y.
En segundo lugar, puesto que la eliminación de las relaciones
espurias es el desafió fundamental.d é l a l S f e r e ñ C i i F ^ .
mayor sea la reducción de la distancia temporal entre J e Y, me
jor será el mecanismo. Y es que, cuanto más tiempo pasa entre el
explanans y el explanandum, más probable es que la relación sea
espuria. Por ejemplo, en una de las contribuciones más celebra
das en la ciencia política en los últimos años, Putnam (1993) de
muestra que el nivel de rendimiento actual de los gobiernos re
gionales en Italia depende de la densidad de la vida asociativa de
cada región. En particular, en aquellas comunidades o regiones
en las que imperaron regímenes republicanos y formas de gobier
no «horizontales» o poco jerarquizadas en la Edad Media, se ha
desarrollado una tradición asociativa y un sistema de gobierno
que han llevado a tener gobiernos regionales satisfactorios en la
actualidad. Sin embargo, la enorme distancia que media entre la
causa y el efecto, varios siglos, hace difícil conectar las dos va
riables. Precisamente una de las críticas más rotundas a Putnam
es la ausencia de una articulación explícita del mecanismo me
diante el cual la capacidad de cooperación de la gente en la socie
dad afecta al rendimiento de las instituciones gubernamentales
existentes (Boix y Posner, 2000).
Finalmente, diferentes mecanismos causales suelen tener dis
tintas implicaciones empíricas. Un mecanismo se acepta con ma
fu ¿Qué significa «explicar» en ciencias sociales?
yor seguridad cuando es el único que sugiere la evidencia empíri

ca que se observa. Por ejemplo, en la explicación del movimiento
de la Tierra se manejaban dos mecanismos contrapuestos: el pto-
lemaico, que planteaba que el Sol era el cuerpo en movimiento y
la Tierra el estático, y el copernicano, que defendía que el Sol era
el objeto estático y la Tierra el móvil. Si los científicos hubieran
tenido la oportunidad de observar el sistema solar desde una pla
taforma orbital, se habría concluido rápidamente la superioridad
del mecanismo heliocéntrico.
De acuerdo con Coleman (1986, 1990), los mecanismos cau
sales se agrupan en tres tipos que responden al conocido como
modelo macro-micro-macro. La premisa de este modelo es que
una explicación adecuada del cambio en el nivel agregado exige
mostrar cómo macroestados en un momento en el tiempo influ-
yen en el comportamiento de los actores individuales y cómo las
acciones que realizan estos actores generan nuevos macroesta
dos en un momento posterior. Las relaciones entre estructuras
son así el resultado contingente de las acciones de unos actores
sujetas a la interacción con las de otros agentes y con el propio
contexto.
El primero de los tres tipos de mecanismos, denominado si-
tuacional o contextual, establece cómo las propiedades de los sis
temas influyen en las consideraciones u orientaciones de los ac
tores, esto es, establece cómo las estructuras funcionan como el
contexto social y material que define las condiciones para la ac
ción. Se trata, pues, de un primer filtro de los comportamientos
compuesto por las restricciones físicas, económicas, culturales,
legales o psicológicas que afronta un individuo y definen su con
junto de oportunidades. En definitiva, se estudian las relaciones
entre el estado del sistema social, como campo de actividad de
los agentes, y las expectativas y necesidades de éstos. El análisis
situacional de Popper (1997), por ejemplo, se basa en los meca
nismos macro-micro.
El segundo tipo de mecanismo, denominado cognitivo o de la
formación de la acción, se localiza en el nivel micro y revisa
cómo el individuo asimila el impacto de los eventos en el nivel
- > 1 "
macro. Se pretende mostrar cómo una específica combinación de

deseos individuales, creencias y oportunidades da lugar a una ac
ción específica o, en otras palabras, describir cómo una persona
que está sujeta a una estructura social en t se comporta en i + 1
de acuerdo con las asunciones sobre sus capacidades cognitivas y
valores, entre otros elementos. Este segundo mecanismo determi
na qué acción dentro del conjunto de oportunidades se realiza. La
teoría de la elección racional, es, por ejemplo, un tipo ideal de
mecanismo para la acción que establece que los actores, cuando
se enfrentan con una elección entre cursos de acción alternativos,
escogen el mejor de acuerdo con sus intereses.
El último de estos mecanismos, conocido como transforma-
cional o relacional, establece la transición micro-macro y desve
la cómo los individuos a través de sus acciones o interacciones
generan resultados en el nivel macro, intencióñádámMteô'iTOT"
Es decir, cuáles son las consecuencias de la acción del actor:
cómo se combina, interfiere o interacciona con las acciones de
otros creando un nuevo contexto o estructura en el que tiene lu
gar la siguiente acción. La tragedia de los bienes comunales es
un ejemplo bastante extendido de un mecanismo micro-macro:
existen situaciones (la contaminación, el ruido, etc.) en las que
la gente ejerce tal influencia al perseguir sus intereses individua
les que, desde el punto de vista colectivo, podrían alcanzarse
mejores resultados si se restringieran sus acciones, aunque a na
die le convenga individualmente la autorrestricción (Hardin,
1968).
La figura 3 muestra un diagrama de este sistema de mecanis
mos multinivel para ilustrar la explicación de la relación entre el
protestantismo y el capitalismo que plantea Weber en La ética
protestante y el espíritu del capitalismo. La flecha horizontal más
elevada representa la proposición agregada, esto es, la conexión
empírica entre el protestantismo y el capitalismo. Las tres flechas
restantes — la primera empieza en el mismo lugar que la proposi
ción en el nivel macro y desciende a un nivel inferior, mientras
que la tercera sube hasta el punto final de esta proposición ma
cro— representan los tres mecanismos entrelazados.
Protestantismo Capitalismo
Figura 3. Proposiciones macro y micronivel: el efecto de la religión en la

..organización económica según Weber.
Las tres proposiciones son las siguientes:
1. El protestantismo genera ciertos valores entre sus partida

rios.
2. Los individuos con ciertos valores (referidos a la proposi
ción 1) adoptan las orientaciones hacia el comportamiento
económico.
3. Las orientaciones hacia el comportamiento económico (re
feridas a la proposición 2) de algunos individuos dan lugar
a la organización económica capitalista en una sociedad.
Por supuesto, analizar los m ecanism os causales requiere,

como apunta Boudon (1998: 198), que se hagan consecuencia de
las acciones de los individuos. La razón para priorizar a los indi
viduos es que los argumentos que no tienen sentido en el nivel in
dividual, al margen de que parezcan plausibles, nunca sobreviven
al test del tiempo y al escrutinio en detalle (Geddes, 2003: 221).
Es decir, la explicación basada en los mecanismos causales se
acompaña del principio del individualismo metodológico, esto
La lógica de la explicación en ¡3$ ciencias sodate
es, la doctrina que establece que los fenómenos políticos y socia

les se deben entender como el resultado de las acciones de los in
dividuos. Su significado encuentra en Elster (1996: 23) una clara
y parsimoniosa presentación:
La unidad elemental de la vida social es la acción humana individual. Expli

car las instituciones y el cambio social es demostrar de qué manera surgen
como el resultado de la acción e interacción de los individuos.
El individualismo metodológico se opone, cada vez con menos

discusión, al holismo metodológico, que sostiene que para expli
car los fenómenos políticos y sociales se debe partir de agrega
dos o variables sociales: las estructuras sociales determinan la
acción de los individuos. Las diferencias entre las dos propuestas
metodológicas se Hacen patentes en el siguiente ejeiirpfoôbTeda'-
explicación del comportamiento electoral de un individuo. Para
el holismo, que en este caso se asocia con la sociología política y
en particular con el modelo de Columbia, la gran mayoría de los
votantes tienen una predisposición política o de partido anclada
en la tradición familiar y/o identidad social. El voto es una cues
tión de hábito o herencia: «una persona piensa políticamente tal
como es socialmente. Las características sociales determinan la
predisposición política» (Lazarsfeld et al., 1944: 27). Como ho-
listas, explicamos el voto de un individuo citando las constric
ciones institucionales y sociales a las que está expuesto y que
determinan su comportamiento: su margen de elección es inexis
tente.
Por el contrario, para el individualismo, que en este caso va de
la mano de la teoría de la elección racional, un votante reconoce
su propio interés, evalúa a los candidatos alternativos según sus
intereses personales y vota al que mejor valora (Enelow y Hinich,
1984: 3 )7.
El individualismo metodológico tiene dos versiones: \mü fuer
te, que plantea que los fenómenos políticos y sociales deben ser
explicados exclusivamente en términos de individuos y sus inte
racciones; y otra débil, que, aunque comparte esta misma posi-
c 1 ' Ja s sociales?
ción ontológica, acepta como parte de la explicación las institu

ciones y/o las estructuras sociales para incrementar su precisión y
realismo (Udéhn, 2002). En un caso, la acción se reconstruye
como una elección instrumentalmente racional de una unidad in
dividual autónoma, con la introducción de cualquier elemento
normativo o expresivo, como influencia en las recompensas, tal
como las percibe el agente. En el otro, la acción se reconstruye
como sumisión inteligente a las reglas de juego, en un sentido de
juego que hace que los jugadores no sean autónomos (Hollis,
1998: 282, énfasis en el original).
De acuerdo con la versión débil del individualismo metodológi
co, una manera simple de explicar una acción es verla como el pro
ducto final de dos operaciones sucesivas de filtración. Empezamos
con un conjunto grande de todas las acciones posibles que puede
je alfz ar uiTindividuo. El primer filtro está compuesto por todas las
instituciones físicas, económicas, legales y psicológicas a las que
se enfrenta un individuo. Las acciones coherentes con estas restric
ciones forman un conjunto de oportunidad. El segundo filtro es un
mecanismo que determina qué acción dentro del conjunto de opor
tunidad será realizada realmente (Elster, 1996: 23).
Las explicaciones basadas en mecanismos son objeto de dos
grandes críticas. La primera, la más habitual, señala que, si esta
blecemos que una variable explicativa produce otra dependiente,
tendremos que detallar todos los vínculos que hay entre ambas
variables. Es decir, «el mecanismo» no tiene un sentido definiti
vo, puesto que en cualquier cadena causal entre variables agrega
das existe un número indefinido de mecanismos. En palabras de
Kincaid (1996: 179):
demandar que citemos los mecanismos detrás de la causalidad macrosocioló-

gica es intrínsecamente ambiguo. ¿Los necesitamos en un nivel de grupo pe
queño o en el individual? Si nos quedamos con la segunda posibilidad, ¿poi
qué parar aquí? Siempre podemos, por ejemplo, preguntarnos qué mecanis
mos provocan el comportamiento individual. Por tanto, estamos obligados a
descubrir los mecanismos neurológicos, luego los bioquímicos, y así sucesi
vamente 8.
Lo: lógica de 1.a explicación en las aenrias sociales
En otras palabras, los mecanismos nos llevarían a un regreso al

infinito y no parecen ofrecer por sí mismos una definición preci
sa de la causalidad, relativa a una causa y un efecto.
Esta objeción no parece demasiado importante. Como nos re
cuerda Gerring (2001: 196), este regreso al infinito en la investi
gación de la relación causal entre X e Y debe detenerse en el pun
to en el que llegamos a un proceso o mecanismo generalmente
aceptado. Por ejemplo, para explicar por qué cae una pelota, po
dríamos decir simplemente «gravedad». Puesto que la gravedad
es un mecanismo ampliamente aceptado, satisfaría las exigencias
de la explicación. Cuando explicamos el comportamiento huma
no, el mecanismo apropiado suele tomar 1a. forma de un motivo.
La racionalidad instrumental de la teoría de la elección racional,
por ejemplo, es un mecanismo causal último. En fin, las explica
ciones no pretenden ser cómpTéfás7snm~símp
la cuestión que el investigador se plantea (Levi, 1984: 51).
La segunda crítica, de nuevo según Kincaid (1996: 179-180),
es que existen otras maneras de distinguir entre la causalidad y la
correlación espuria que no tienen que ver con la provisión de me
canismos. En particular, cuando en un análisis estadístico se in
troducen variables de control y la correlación no desaparece, po
demos concluir que la relación es causal. Y otro tanto sucede
cuando se realizan experimentos (Skinner, 1970). Ya hemos dis
cutido la respuesta a esta objeción cuando se presentó la explica
ción estadística. Solamente debe recordarse que cualquier expli
cación en la que no está claro de qué manera X produce Y es
sospechosa de ser espuria. Y precisamente la limitación funda
mental de la variante estadística de la explicación es que no intro
duce ninguna noción explícita de los procesos causales subyacen
tes (Cox, 1992: 297).
7. ¿Qué se debe evitar en
los diseños de investigación?
En este apartado se revisan las causas y consecuencias de los cin

co problemas más habituales en los diseños de investigación: los
errores de especificación en el modelo de explicación, el sesgo
de selección, la multicolinealidad, la endogeneidad y las formas
funcionales incorrectas. Incurrir en cualquiera de estos errores,
aun cuando el resto de la investigación se haya hecho bien, impo
sibilita la realización de inferencias descriptivas o causales váli
das.
7.1. Errores de especificación en el modelo de

explicación
Los errores de especificación tienen lugar cuando en nuestro mo

delo de explicación faltan o sobran variables independientes. En
un caso, una o más variables independientes relevantes para ex
plicar la variable dependiente se han omitido, de modo que se in
curre en un sesgo o error sistemático en la inferencia: cuando hay
sesgo, los errores ya no se cancelan los unos con los otros, como
75
sucede cuando son aleatorios, sino que tienen una tendencia, po
sitiva o negativa. En el otro, una o más variables irrelevantes para
explicar la variable independiente se han tenido en cuenta, de
modo que se incurre en ineficiencia: el procedimiento analítico
no utiliza toda la información para maximizar nuestra capacidad
de realizar inferencias válidas.
Para establecer las causas y consecuencias de los errores de
especificación, en el cuadro 1 se plantean las cuatro posibles si
tuaciones en las que se puede encontrar un investigador. En las
columnas, en mayúsculas, se presentan dos posibles modelos teó
ricos verdaderos e inobservables; el primero, con una única varia
ble independiente, y el segundo, con dos. En las filas, en minús
culas, se contienen dos posibles m odelos teóricos propuestos.
Cuando coinciden el modelo verdadero y el propuesto, como en
las casillas 1 y 4, no hay errores de especificación: la explicación
es correcta. Pero cuando sus variables no coinciden, como en las
casillas 2 y 3, aparecen los errores de especificación.
C u a d r o 1. P o sib les re lacio n es en tre el m od elo de

ex p licació n v e rd a d e r o y el e stim a d o
zxmtam
Modelo verdadero
de la teoría
F= 0, + ¡32X 2 + fJi Y = p l + p 1x 1 + p j c i + n
¡ Modelo propuesto
Y = b { + b 2X 2 Correcto Sesgo
1 2
Y = b ] + b 2X , + b 2X 2 Ineficiencia Correcto
3 4
L a primera posibilidad de equivocación es incluir una variable

de más, como pasa en la casilla 3. En el modelo estimado se in-
76
cluye X 3, cuando en realidad no hace falta. La consecuencia de la
inclusión de una variable independiente irrelevante en nuestra ex
plicación es la ineficiencia, pero no el sesgo. Puesto que en el
modelo verdadero el efecto de X3 es 0, si tenemos en cuenta esta
variable en el análisis encontramos necesariamente que b3 = 0.
Para mostrar de una manera intuitiva qué significa la inefi
ciencia en una investigación, supongamos que la única variable
independiente que explica los resultados electorales del PP en las
circunscripciones en las elecciones generales de 1996 {Y) es la
visita de Aznar (X). Si tenemos dos circunscripciones idénticas
salvo en esta variable clave — una ha sido visitada por Aznar du
rante la campaña, la otra no— , se podría estimar el efecto causal
de la visita de Aznar con sólo dos observaciones. Sin embargo,
imaginemos que un investigador piensa (erróneamente) que hay
-una-segunda- -variable independiente que hay que controlar: el he
cho de que una circunscripción haya recibido fondos de cohesión
europeos. Para estimar el efecto causal de la variable indepen
diente clave se necesitan ahora al menos cuatro observaciones, de
nuevo bajo el supuesto de que son absolutamente idénticas ex
cepto en lo que atañe a estas dos variables. En primer lugar, de
bemos descomponer la variable dependiente en función de la va
riable independiente de control. Por un lado, hacen falta dos
circunscripciones que se hayan beneficiado de los fondos europeos;
una tiene que haber sido visitada por Aznar y la otra no. Y, por
otro, necesitamos otras dos que no se hayan beneficiado de los
fondos europeos; una tiene que haber sido visitada por Aznar y la
otra no. Como la variable de control es irrelevante, la inferencia
causal sobre el efecto de la visita de Aznar a una circunscripción
en los resultados electorales del PP en 1996 que realizamos es la
misma que antes. Pero hemos tenido que duplicar el número de
observaciones. En otras palabras, hemos sido ineficientes.
La segunda posibilidad de equivocación es excluir una varia
ble relevante, como pasa en la casilla 2. En el modelo estimado
no aparece Xv cuando en realidad debe ser considerada. La con
secuencia de la omisión de una variable relevante en nuestra ex
plicación es el sesgo. Ya sabemos que cuando se omite una varia
77
La lógica de le explicación en tas ciencias sociales
ble relevante, su impacto en Y, o al menos parte de él, se traslada

al término de error, ¡x. El error deja ser aleatorio, como exige la
estimación correcta de los efectos causales de las variables inde
pendientes, para convertirse en sistemático. Nuestras inferencias
serán, pues, inválidas.
Como se observa en la figura 4, cuando una variable indepen
diente relevante se excluye del modelo de explicación, las varia
bles independientes incluidas y que están correlacionadas con la
excluida recogen parte de su efecto sobre Y. El resultado es el
sesgo en la estimación del efecto causal de las variables indepen
dientes que aparecen en el modelo. La dirección del sesgo (posi
tivo o negativo) depende del signo del efecto de la variable ex
cluida sobre la variable dependiente y del signo del efecto de la/s
variable/s independiente/s incluida/s sobre la dependiente. Por su
parte, la magnitud del sesgo depende de la correlación enlre las
variables independientes incluidas y omitidas. Cuando mayor sea
la correlación entre ellas, más grande será el sesgo debido a que
la variable incluida se apropia de más parte del efecto de la varia
ble excluida. De esta manera, no existiría sesgo cuando las varia-
.V
f u e n t e : Dougherty (2002: 198).
Figura 4. Consecuencias de la omisión de una variable independiente relevante.

¿Que* se debe evitar en Los diseños de imfesticiadón?
bles explicativas incluida y excluida sean totalmente indepen

dientes entre sí, esto es, cuando su correlación sea 0 ’. Pero en
términos empíricos es muy improbable que se produzca esta últi
ma situación.
Para ilustrar los efectos de la omisión de una variable relevan
te, supongamos que el salario mensual de un individuo depende
de tres variables: sus años de estudio, los años de antigüedad en
la empresa y los días de ausencia injustificados. El modelo ver
dadero es:
Salario = f3¡ + /32 Estudio + /E, Antigüedad - /S4 Baja + ¡x (17)
El efecto de los años de estudio es positivo (cuanto mayor sea

la acumulación de capital humano, mayor es la contraprestación
-económica),-el de los años de antigüedad en la empresa también
es positivo (cuanto mayor sea el conocimiento de las tareas a de
sempeñar, mayor es la productividad) y, finalmente, el de los días
de baja laboral es negativo (a más de días de ausencia injustifica
da, menor es el salario). La correlación entre los años de estudio
y los años de antigüedad es positiva (a los trabajadores mejor for
mados es a los que más desea retener una empresa) y negativa
entre estas dos variables y los días de baja (los empleados más
cualificados y los trabajadores más ligados a las empresas son los
que menos faltan).
En primer lugar, supongamos que, en lugar de manejar la es
pecificación (17), un investigador se olvida de las horas de baja
laboral y estima:
Salario = bl + b2 Estudio + ¿>3 Antigüedad + ¡x (18)
Puesto que esta variable omitida tiene una correlación negati

va con los años de estudio y la antigüedad, el efecto de estas dos
variables sobre el salario se reduce. ¿Por qué? Porque ahora reco
gen parte de la influencia (negativa) de los días de baja en los sa
larios. Y si a un efecto positivo se le añade uno negativo, pasa a
ser más pequeño: los coeficientes de los años de estudio y la an
La lógica de Le explicación sr> Las ciencias sedales
tigüedad seguirán siendo positivos si su efecto positivo propio es

más fuerte que el negativo que pasan a recoger de los días de
baja; y negativo si su efecto positivo propio es más débil que el
negativo de los días de baja que pasan a recoger.
En segundo lugar, supongamos que, en lugar de manejar la es
pecificación (17), un investigador se olvida de los años de anti
güedad y estima:
Salario = ó, + ó. Estudio - h3 Baja + /x (19)
Puesto que esta variable omitida tiene una correlación positiva

con los años de estudio y negativa con las horas de baja laboral,
el efecto de estas dos variables sobre el salario se resiente. Ahora
recogen parte de la influencia (positiva) de los años de antigüe
dad en los salarios. El coeficiente .delos-años-de-estudio,se hará
más grande, debido a que a su efecto propio se le añade parte del
efecto positivo de la antigüedad; mientras que el coeficiente de
las horas de baja laboral seguirá siendo negativo si su efecto ne
gativo propio es más fuerte que el positivo que pasa a recoger de
la antigüedad; y positivo si su efecto negativo propio es más débil
que el positivo de la antigüedad.
En el cuadro 2 se resume la posible dirección del sesgo de es
pecificación en el efecto de una variable independiente (A,)
cuando en un modelo con dos variables independientes relevan
tes, X x y Xv se omite X r
Un ejemplo que no tiene nada que ver con la ciencia puede
ayudarnos a entender mejor las consecuencias de los sesgos de
especificación. Supongamos que dos personas (Xx y X 2) han que
dado para comer y ya han reservado la cantidad de comida que
van a ingerir ( 7 ) de acuerdo con la estimación que hacen del
hambre de cada uno. Si falta uno de los dos individuos, el otro no
sólo va a comer lo que había previsto, sino también, y debido al
malestar que le produce tirar la comida sobrante, parte de lo que
se habría comido el otro. Cuánto más come respecto a la estima
ción inicial depende de la cantidad de comida que queda disponi
ble (esto es, de lo que se habría comido el individuo ausente). Si
C u a d r o 2. P o sib les d ireccion es de los se sg o s en el efecto de
u n a v a ria b le in d ep en d ien te (Y ,) cuan do se om ite
o tr a relev an te (X2)
ama:»;;*.sss^'ása^swv;;v.::v:.'.w>«.«s-
Dil ección de los sesgos Corr (a-j, .v,) > 0 Corr (a ,, X j ) < 0
P2> 0 sesgo positivo sesgo negativo

/3, < 0 sesgo negativo sesgo positivo
puente: Elaboración propia.
la persona que falta a la cita no tenía intención de probar bocado,

esto es, su efecto sobre la comida es 0, su ausencia no influye en
la cantidad de comida que ingiere la persona que sí ha aparecido.
-Sí-la persona que falta a la cita iba a comer mucho, su ausencia sí
influye en la cantidad de comida que ingiere la que sí ha apareci
do. La dirección de la influencia de su ausencia es positiva, pues
to que los dos comensales tenían un efecto positivo sobre la co
mida consumida. Si reemplazamos a nuestros dos individuos por
dos variables independientes, tenemos el resultado de la discu
sión teórica anterior.
Puesto que los errores de especificación, sobre todo cuando se
omite una variable independiente relevante, tienen consecuencias
tan graves sobre las inferencias causales, ¿cómo se puede deter
minar cuáles son las que debemos manejar en la explicación de
un fenómeno? L a única manera de asegurar que nuestro modelo
es correcto es tener una buena teoría que nos guíe en la especifi
cación del modelo. La inclusión o exclusión de variables depende
de la existencia de razones sustantivas para tomar una decisión en
uno u otro sentido. Y los principios del diseño de investigación o
la estadística son de escasa o nula utilidad en esta cuestión. Aun-
> que se siga perfectamente la lógica inferencíal que se presenta en
! este ensayo, las inferencias no serán válidas a menos que nuestra
i teoría sea adecuada. L a metodología no convierte nunca las ma
las teorías en buenas investigaciones.
La lógica da la explicación en las ciencias sedal
7.2. El sesgo de selección
En la discusión de los supuestos necesarios para realizar inferen

cias causales válidas, hemos visto que la selección de las obser
vaciones es crucial. Ya sabemos que para estimar correctamente
el efecto que nuestra variable independiente clave (A',) tiene so
bre la variable dependiente debe garantizarse la independencia
condicional, esto es, que las observaciones que se eligen y los va
lores que se adjudican a las variables explicativas sean indepen
dientes de los valores de la variable dependiente. Esto significa
que si en nuestra selección de observaciones, y antes de que en
tren en juego las variables independientes, la media de Y en el
grupo que se va exponer a la variable independiente clave es dis
tinta de la del grupo que no se va a exponer, entonces no se pue
de atribuir a esta variable clave la diferencia en Y entre los dos
grupos. La relación entre Y y X xestará sesgada: bien se sobreesti
mará, bien se infraestimará la influencia de la variable indepen
diente clave. Por tanto, se pueden aceptar como causales relacio
nes que no son, y a la inversa.
Siempre que la selección de las observaciones sea aleatoria,
como es habitual en una encuesta postelectoral, por ejemplo, o se
tengan en cuenta todas las posibles observaciones, cuando se con
sideran las 52 circunscripciones españolas en el estudio de la in
fluencia de la visita de Aznar en los resultados del PP en las elec
ciones de 1996, por ejemplo, se asegura la satisfacción de la
independencia condicional. Pero en muchas ocasiones no se pue
de seguir ninguna de estas dos posibilidades y aparece entonces el
riesgo del sesgo de selección. Para conseguir que nuestras inferen
cias sean válidas cuando hay que escoger observaciones es im
prescindible que esta selección no esté relacionada con el resulta
do que se pretende explicar. El sesgo de selección puede definirse,
en este sentido, como un error sistemático que aparece cuando las
observaciones o casos de estudio se seleccionan de acuerdo con
una regla que viola la representatividad de la muestra o cuando al
gún proceso no aleatorio (normalmente desconocido) asigna las
causas a los casos. En definitiva, seleccionar las observaciones sin
- ~ I ‘ ~ í
estudiar detalladamente sus implicaciones en Y nos puede llevar a

conclusiones erróneas, aun cuando nuestra teoría sea buena y los
demás principios del diseño de investigación sean satisfechos.
Para explicar qué es lo que se puede hacer y qué es lo que no
se puede hacer en la selección de observaciones, en los cuadros
3 y 4 se plantean dos ejemplos. En primer lugar, se presenta la re
lación verdadera y no observable (y también ficticia) que existe
entre la decisión de votar (Y) y la renta (X) en una población
compuesta por 18 individuos. Como se puede observar, la renta
explica en buena medida que una persona vote o no. Para los in
dividuos con renta baja, la probabilidad de votar es del 33,3 por
ciento (dos votan y cuatro no), mientras que para los de renta me
dia y alta esta probabilidad es sensiblemente mayor: un 50 y un
66,7 por ciento, respectivamente. Es decir, cuanto mayor es el ni-
vrel-de Tento,-mayor es la probabilidad de votar. Pasar de una renta
baja a una media y de una media a una alta aumenta esta probabi
lidad en un 16,66 por ciento en ambos casos.
Supongamos que un investigador desea explicar por qué vota
la gente de esta población y decide estudiar exclusivamente a
aquellos que han votado. Es decir, escoge sus observaciones en
función de la variable dependiente, de modo que elimina la va
riación en votar: ya sólo hay síes en su estudio. Por tanto, la se
gunda fila del cuadro 3 ha sido eliminada artificialmente. Con
C u a d r o 3. R elació n en tre v o ta r y la r e n ta *
Renta
Población: 18 individuos
Baja Media Alta
2 3 4
Votar
No 4 3 2
* Los valores de cada casilla indican el número de individuos.

83
esta selección de observaciones, para los individuos con renta
baja, la probabilidad de votar es del 100 por cien (los dos indivi
duos considerados han votado), mientras que para los de renta
media y alta esta probabilidad también es del 100 por cien. Es
decir, la renta no explica en absoluto que una persona vote o no:
sea cual sea el nivel de renta, la probabilidad de votar es la m is
ma. En definitiva, la selección de las observaciones de acuerdo
con la variable dependiente nos ha llevado a realizar una infe
rencia incorrecta.
En la figura 5 se representa el efecto de la renta sobre la pro
babilidad de votar cuando existe un sesgo de selección y cuando
no lo hay. La curva es completamente plana cuando incurrimos
en el sesgo, pero claramente positiva cuando no existe este sesgo.
En otras palabras, el efecto causal de X sobre Y ha desaparecido
totalmente como consecuencia de la mala seleeGÍón-de ôbser-va=--
ciones.
Veamos qué sucede si la selección de observaciones se hace
en función de la variable independiente, la renta. Supongamos
que un investigador decide estudiar exclusivamente a aquellos
que tienen rentas bajas y medias. Por tanto, la tercera columna
del cuadro 3 se elimina artificialmente. Con esta selección de ob
servaciones, para los individuos con renta baja la probabilidad de
votar es del 33,3 por ciento (dos votan y cuatro no), mientras que
para los de renta media es mayor: un 50 por ciento. Es decir, pa
sar de una renta baja a una media aumenta esta probabilidad en
un 16,66 por ciento. Como se puede comprobar, la inferencia a la
que llegamos es la misma que realizábamos antes cuando estu
diamos a toda la población. De este modo, la selección de las ob
servaciones de acuerdo con la variable independiente nos ha lle
vado a realizar una inferencia correcta. La única diferencia ahora
es que no podemos extender nuestro hallazgo a las personas de
renta alta, pero no introducimos ningún sesgo.
Para estudiar cuáles son las consecuencias de truncar la varia
ble dependiente, esto es, limitar su variabilidad, pero permitiendo
que tenga alguna variación, en el cuadro 4 se analiza la relación
entre la valoración del gobierno en una escala 0-10 (0 es muy
7, ¿Qué se debe evitar &r tos diseños de investigación?
Figura 5. Sesgo de selección como consecuencia de eliminar la variación en la

variable dependiente.
mal y 10 muy bien) y la ideología en una población de nueve per

sonas. Como se puede observar, las valoraciones del gobierno (en
este caso socialdemócrata) están muy ligadas a la posición ideo
lógica. La media de valoración del gobierno de los individuos de
izquierda es 6, 4 la de los de centro y 2 la de los de derecha. Es
decir, cuanto más a la derecha se posiciona un individuo, peor es
La lomes, de is e x p licad en en Las cien cias soccsées
C u a d r o 4. R elació n en tre la v a lo ra c ió n del go b iern o y la

id e o lo g ía *
Ideología
Población: 9 individuos
Izquierda Centro Derecha
Valoración del gobierno (0-10) 4 2 0

6 4 2
8 6 4
* Los valores de cada casilla representan la valoración, no el número de individuos.

fuente: Elaboración propia.
la valoración. En particular, pasar de la izquierda al centro y del

centro a la derecha significa que la valoración del gobierno cae 2
puntos en cada desplazamiento.
Supongamos que un investigador decide estudiar exclusiva
mente a aquellos que tiene valoraciones iguales o mejores que 4.
Es decir, escoge sus observaciones en función de la variable de
pendiente, de manera que trunca, aunque no elimina, la variación
en la valoración: ya no hay evaluaciones por debajo de 4. Con
esta selección de observaciones, para los individuos de izquierda,
la media de valoración del gobierno es 6, mientras que para los
de centro es 5 y para los de derecha asciende a 4. E s decir, pasar
de un espacio ideológico a otro significa que la valoración cae
1 punto, cuando en realidad desciende 2. En definitiva, la selec
ción de las observaciones de acuerdo con la variable dependiente
truncada nos ha llevado a realizar una inferencia incorrecta y a
estimar un efecto causal más débil del real.
En la figura 6 se representa el efecto de la ideología sobre la
valoración del gobierno cuando existe un sesgo de selección y
cuando no lo hay. La curva es más tendida cuando incurrimos en
el sesgo, de modo que el efecto causal estimado parece menor de
lo que es en la realidad.
i v ’ * . . ' t \
Figura 6. Sesgo de selección como consecuencia de restringir la variación en la

variable dependiente.
Comprobemos qué ocurre si la selección de observaciones se

hace en función de la variable independiente, la ideología. Imagi
nemos que un investigador decide estudiar exclusivamente a
aquellos que son de izquierda o centro. Por tanto, la tercera co
lumna del cuadro 4 se elimina artificialmente. Con esta selección
U N I V E R S I D A D
i» ' ií . t e1 .'íi en las ciencias sociales
de observaciones, para los individuos de izquierda la media de la

valoración del gobierno es 6, y para los de centro es 4. Es decir,
pasar de un espacio ideológico a otro disminuye en 2 puntos la
valoración. Como se puede comprobar, la inferencia a la que lle
gamos es la misma que realizábamos antes cuando estudiamos a
toda la población. La selección de las observaciones de acuerdo
con la variable independiente nos ha llevado a realizar una infe
rencia correcta. La única diferencia es que ahora no podemos ex
tender nuestro hallazgo a las personas de derecha, pero no intro
ducim os ningún sesgo. Debe advertirse, adem ás, que si se
selecciona a los individuos de izquierda y derecha, se puede dejar
fuera a los de centro y llegar a una conclusión con el mismo ca
rácter general sobre el efecto de la ideología sobre la valoración
del gobierno. Puesto que se satisface la homogeneidad causal, es
suficiente con conocer los dos puntos extremos-pura trazarla-lL
nea que los conecta. Y, por supuesto, esta línea pasa también por
el espacio de centro.
En definitiva, para realizar inferencias causales válidas debe
mos seleccionar las observaciones en función de las variables in
dependientes, no en términos de la dependiente. Hay que conse
guir, en este sentido, (1) que haya cambio en 7 y (2) que no se
trunque 7. Sin embargo, esto no significa que la selección de ob
servaciones en función de la variable dependiente no se pueda
hacer nunca. Cuando se revisa una teoría que presenta anomalías
empíricas, suele ser útil detenerse en los casos en los que se
constata un resultado negativo para identificar posibles variables
independientes olvidadas. Pero, de nuevo, no se pueden realizar
inferencias basadas en la teoría (Geddes, 2003: 129).
7.3. La multicolinealidad
L a multicolinealidad se refiere a las situaciones en las que la co

rrelación entre dos (o más) variables independientes en un mode
lo de explicación es tan alta, que no se puede separar el efecto
que cada una de ellas tiene sobre la variable dependiente. En
>• i"l . - 'estigadóri?
otras palabras, tenemos un problema de multicolinealidad cuan

do, una vez que se recogen los datos de las observaciones, las va
riables independientes se mueven conjuntamente de una manera
sistemática.
Por ejemplo, supongamos que deseamos explicar las diferen
cias en el grado de interés por la política de los españoles. Dos
son las variables independientes que sugiere nuestra teoría: el ni
vel de estudios (alto o bajo), la clave, y los ingresos (altos o ba
jos), la de control. En el análisis de los datos que hemos recogido
para una muestra de individuos, resulta que todos los que tienen
un nivel de estudios alto también tienen ingresos altos. O, al re
vés, no hay nadie con un nivel de estudios alto que tenga unos in
gresos bajos. En este caso, no hay posibilidad de realizar una in
ferencia sobre el efecto individual de los estudios y los ingresos.
-Ettando^-siguiendo la -lógica inferencial ya conocida, descompo
nemos las observaciones de acuerdo con la variable de control,
dentro del grupo de individuos con un nivel de ingresos bajo, to
dos tienen un nivel de estudios alto. En otras palabras, una vez
aisladas las personas con ingresos bajos, no es posible comparar
el interés por la política medio de los que tienen un nivel de estu
dios alto y los que tienen uno bajo. Se colapsa el proceso. Y otro
tanto sucede en el grupo de los que tienen ingresos altos.
Formalmente, la multicolinealidad en este ejemplo significa
que tenemos el modelo;
Y= bj + b2 Estudios + Ingresos + ¡i (20)
donde,
Ingresos = c, + c2 Estudios (21)
de modo que ingresos es una función exacta de estudios, esto

es, se relaciona o se puede predecir perfectamente una variable
independiente a partir de la otra.
Si manejamos un ejemplo cualitativo, llegamos a la misma
conclusión sobre la imposibilidad de realizar inferencias sobre el
89
Le léate de la expiícaclóa rsn las riendas seriales
efecto individual de cada una de las variables. Supongamos que

nos interesa conocer por qué algunas transiciones a la democra
cia tienen éxito y otras no. De acuerdo con nuestra teoría, el éxito
de una transición depende de dos variables independientes: la
existencia de un sistema electoral de representación proporcional,
la clave, y tener un sistema parlamentario, la de control. Cuando
analizamos los n países sobre los que hemos recogido datos, ob
servamos que los sistemas parlamentarios se combinan siempre
con sistemas electorales de representación proporcional y los pre
sidenciales con mayoritarios. De nuevo, al dividir los casos de es
tudio en función de la variable de control, nos encontramos que
entre los países con sistemas parlamentarios no hay ninguno con
un sistema electoral mayoritario. Y a la inversa entre los países
con sistemas electorales presidenciales. En consecuencia, no es
posible comparar la suerte de la transición a la democracicrdentra
de cada grupo.
Los casos más frecuentes de multicolinealidad no son tan ex
tremos como los que se contienen en estos ejemplos. Lo más ha
bitual es que las variables independientes estén correlacionadas,
pero no perfectamente. Es muy difícil manejar variables indepen
dientes que no tengan ninguna correlación. En los dos ejemplos
anteriores, la correlación es 1 (esto es, perfecta) y la multicoli
nealidad es, por tanto, un problema. En general, cuando la corre
lación entre las variables independientes supera el umbral de 0,8
en el coeficiente de correlación de Pearson, suele existir un pro
blema grave de multicolinealidad2.
En este sentido, hay que tener en cuenta dos cuestiones bási
cas para comprender las implicaciones y soluciones a la multico
linealidad. Por un lado, se trata de un problema que se refiere a
las variables independientes en la muestra de datos que tenemos,
no necesariamente a toda la población. Si un científico social pu
diera recoger los datos de acuerdo con un diseño experimental en
su estudio del interés por la política de los españoles, por ejem
plo, la multicolinealidad desaparecería. Por otro, no se debe con
cebir como algo que existe o no existe. Por el contrario, la muul-
ticolinealidad es una cuestión de grado, y es este grado el que
7
■ << í ,
determina la importancia del problema que tenemos. Obviamen

te, como ya sabemos, a medida que su nivel aumenta, sus conse
cuencias son más graves.
Las soluciones a la multicolinealidad pasan por:
1. Recoger más observaciones de manera que se reduzca la

correlación entre las variables independientes afectadas; en
los ejemplos anteriores, por un lado, habría que intentar in
corporar individuos con un nivel de estudios alto e ingre
sos bajos e individuos con un nivel de estudios bajo e
ingresos altos; por otro, añadir países con sistemas electo
rales de representación proporcional y presidencialismo.
2. No obstante, sobre todo en los estudios cualitativos, a ve
ces no es posible aumentar el número de observaciones:
-------- ln sp aíseseo n transiciones a la democracia con éxito son
los que son y no se puede añadir ninguno más. La única
solución a la multicolinealidad sería reducir el número de
variables independientes que se manejan en la explicación.
En los ejemplos anteriores, olvidarse de los ingresos y del
tipo de sistema político. Pero el problema que puede apare
cer ahora, más grave incluso que la multicolinealidad, es el
sesgo por omisión de una variable relevante. Si cada varia
ble independiente en la ecuación representa un mecanismo
causal distinto, será una mala idea eliminarla.
7.4. La endogeneidad
El significado y las consecuencias de la endogeneidad ya nos re

sultan conocidos, puesto que se discutieron en la presentación de
uno de los supuestos necesarios para la estimación de efectos
causales: la independencia condicional. La endogeneidad aparece
cuando en nuestra explicación no está claro qué es la causa y qué
es el efecto: los valores de la variable independiente provienen a
veces de la dependiente en lugar de ser una de sus causas. En
otras palabras, la variable independiente también podría aparecer
La *-<p w L ■!'lfi sociales
como 7, y la dependiente, como X. Debido a que ambas variables

se influyen mutuamente, la relación de causalidad es circular o
bidireccional.
Por ejemplo, supongamos que un investigador plantea que los
individuos que mejor valoran a José Luis Rodríguez Zapatero
(A') son los que tienen una mayor propensión a votar al PSOE
(7 ). No parece necesario justificar que los ciudadanos prefieren
a los partidos liderados por personas sobre las que tienen una
buena opinión. Por tanto,
Voto PSOE = /?, + /3, Valoración Zapatero + ¡x (22)
Sin embargo, también parece evidente que los votantes socia

listas habituales — para simplificar, los que ya apoyaban al PSOE
antes de que Zapatero fuera el lider— tienen una mayorqiropen-
sión a valorar bien a Zapatero que los votantes habituales del PP,
por ejemplo, independientemente de cualquier otra considera
ción. En pocas palabras, Zapatero es simplemente el máximo re
presentante de su partido. Es decir,
Valoración Zapatero = /3, + jS2 Voto PSOE + ¡x (23)
L a consecuencia fundamental de la endogeneidad es que no

nos permite realizar atribuciones causales correctas. Y a diferen
cia de la multicolinealidad, la endogeneidad ya no es sólo un pro
blema de los datos que manejamos, sino sustantivo o de nuestra
teoría.
En nuestro ejemplo, recogido en la ecuación (22), y debido a
la existencia de endogeneidad, estamos haciendo una estimación
de la influencia de la variable independiente, la valoración de Za
patero (b2) sobre la probabilidad de votar al PSOE, que es igual a
la influencia correcta (e inobservable) (/32) más un factor de ses
go, la propensión a valorarlo bien de los votantes socialistas habi
tuales. Esto es,
E (b 2) = /32 + sesgo (24)

' * * ' i - -s de inr
Esto significa que el efecto causa] estimado de las variables

independientes incluidas, la valoración de Zapatero en (22), está
sesgado. Al omitir una variable independiente relevante, el hecho
de ser votante socialista habitual, correlacionada con la valora
ción de Zapatero, una parte de su influencia se le atribuye a la
única que se ha considerado. Es decir, no sabemos qué parte del
efecto estimado refleja efectivamente la importancia causal de la
valoración de Zapatero y cuál el hecho de ser un votante socialis
ta habitual. En fin, el término de azar en (22) ya no es aleatorio,
sino sistemático, puesto que está recogiendo, en una medida in
determinada, el impacto de ser un votante socialista.
Un segundo ejemplo, en el que se adjudican valores a las va
riables, puede ayudarnos a entender un poco mejor el problema
de la endogeneidad. Supongamos que un investigador plantea que
i de los licenciados españoles (Y), medido
en una escala de 0 a 10, depende de una única variable indepen
diente: la carrera que han estudiado. Para simplificar, los que han
cursado ciencia política y, debido a su contacto con la politica
como objeto de estudio, deberían tener un mayor interés por la
política que los que han cursado otra carrera. Cuando el investi
gador recoge los datos para una muestra representativa de los li
cenciados españoles, comprueba que los licenciados en ciencia
política tienen un valor medio 8 en la escala de interés por la po
lítica, mientras que los demás licenciados tienen un valor medio
de 6. Por tanto, infiere que el efecto causal de estudiar ciencia
política en el interés por la política supone dos puntos más.
Sin embargo, parece evidente que la decisión de estudiar cien
cia política en lugar de otra licenciatura tiene que ver con el he
cho de que la política sea más o menos atractiva para una perso
na. Es decir, bien podría ser que el interés por la política (X ) haya
sido la causa de cursar ciencia política en lugar de otra carrera
(7 ). Tenemos, por tanto, un problema de endogeneidad. Si antes
de empezar los estudios universitarios el interés por la política
medio de los futuros estudiantes de ciencia política se situaba en
el punto 7 y el de los estudiantes de otras carreras en 5, esta dife
rencia de 2 puntos es la misma que observamos una vez termina
Ls lógica de la expocadón en las dersdas ¡mcíales
da la carrera. Es decir, la licenciatura estudiada no tendría en rea

lidad ningún efecto sobre el interés por la política, puesto que la
diferencia que constatamos ya existía antes de que entrara enjue
go la variable independiente. En definitiva, la endogeneidad nos
habría llevado a realizar una inferencia causal inválida o sesgada.
Pero en la práctica, y a diferencia de este ejemplo, no podemos
determinar el efecto de la endogeneidad.
Entre las estrategias para afrontar un problema de endogenei
dad (King, Keohane y Verba, 2000: 197-206), la que tiene una
aplicación más fácil es, en mi opinión, convertir la endogeneidad
en un sesgo producido por una variable omitida y controlar esta
variable. En el primer ejemplo que estamos manejando, se trata
ría de que ser votante socialista antes de la elección de Zapatero
se analice como una variable causal anterior a la formación de las
opiniones sobre el líder socialista. Es decir, -habria-que-eontr-olaí-
esta variable, de manera que se comparara la probabilidad media
de votar al PSOE, por un lado, entre los que ya eran votantes so
cialistas antes de la elección de Zapatero y que valoran bien a Za
patero y los que lo valoran mal; y, por otro, entre los que no eran
votantes socialistas antes de la elección de Zapatero y que valo
ran bien a Zapatero y los que lo valoran mal. En el segundo, el
interés por la política inicial o anterior a cursar los estudios uni
versitarios debería aparecer en el lado derecho de la ecuación.
7.5. La forma funcional: la linealidad por defecto
Todas las teorías sustantivas plantean qué variables independien

tes se relacionan o explican la dependiente y cuál es la dirección
o signo de su efecto. Por ejemplo, se puede establecer que la ren
ta de una persona debería tener una influencia positiva en el nú
mero de veces que se va al cine: a mayor renta, mayor es la inver
sión en ocio. Sin embargo, pocas teorías políticas o sociales
plantean cómo es la relación entre X e Y, esto es, cuál es la forma
funcional de esta relación. La respuesta empírica más habitual a
este silencio de las teorías es lo que Beck y Jackman (1998) han
7, ¿ O u é js e debe evita:' er> ios diseños de in v e s tig a c ió n ?
denominado la «linealidad por defecto»: Y es una función lineal

de X. Es decir, un incremento igual en X produce siempre el mis
mo cambio en Y, sea cual sea el valor de X. Por ejemplo, pasar de
0 a 1 mil euros de renta anual tendría el mismo efecto en la pro
babilidad de votar que pasar de 18 a 19 mil.
El problema de esta linealidad por defecto es que a veces las
variables se relacionan no-Uneaímente. Por ejemplo, en la figura
7a se presenta la relación (ficticia) entre el número de veces que
una persona va al cine al año (Y) y su renta anual medida en mi
les de euros (X). Como se puede comprobar, las observaciones
no se ajustan demasiado bien a una línea recta, pese a que el
efecto de la renta es positivo. Más bien parece que la relación en
tre las dos variable es curvilínea: cuando la renta anual es muy
baja, sus incrementos tienen un efecto fuerte en el número de ve-
ces-quense.aSTS| C a ] cine; pero a partir de los 6 mil euros ya no se
va más al cine aunque aumente la renta: se ha alcanzado el um
bral de saturación.
Si en lugar de una curva se ajusta una línea, se comete un
error de especificación de la forma funcional. Un modelo de ex
plicación tiene problemas de especificación incorrecta de la for
ma funcional cuando no plantea adecuadamente cómo es la rela
ción entre la variable dependiente y las independientes. La
consecuencia no es otra que una estimación sesgada del efecto de
X sobre Y, en nuestro ejemplo del efecto de la renta sobre la asis
tencia al cine. Ya sabemos que los errores, en este caso los resi
duos (la diferencia entre los valores observados de Y y los valores
predichos de Y con el modelo teórico propuesto), tienen que ser
aleatorios para que nuestras inferencias causales sean válidas. Y
en la figura 7a no lo son: empiezan siendo negativos, a partir de
la segunda observación pasan a ser positivos, alcanzan un máxi
mo y comienzan a ser negativos a partir de la octava observación.
En otras palabras, hay una tendencia sospechosa.
Cuando la forma funcional lineal se sustituye por una curvilí
nea (figura 7b), somos capaces de analizar mejor la relación en
tre la renta y la asistencia al cine. Y si analizamos de nuevo los
residuos, ahora sí parecen aleatorios: se suceden los positivos y
i
lógica de le expíe csdói'V erf las ciencias sociales
fu en te: Elaboración propia.
Figura 7a. Relación entre la asistencia al cine (K) y la renta anual en miles de
euros (X).
fu en te: Lago y Montero (2005).
Figura 7b. Relación entre la asistencia al cine (Y) y la renta anual en miles de
euros (X).
7, \f ^ .“'i f ' u "jy; n
negativos sin ninguna tendencia definida. En fin, aunque las va

riables independientes que manejamos son las mismas ahora que
antes, el cambio de la forma funcional nos ha permitido explicar
mejor la variable dependiente.
En la figura 8 se presenta un ejemplo real que se ha extraído
del estudio de Lago y Montero (2005) sobre el sistema electoral
español. La sobrerrepresentación en escaños del partido mayori-
tario en las circunscripciones depende de la magnitud de distrito,
esto es, de cuántos diputados se eligen en cada una. Pero no de
una manera lineal, sino logarítmica: la prima electoral del partido
mayoritario se reduce rápidamente cuando se incrementa el nú
mero de escaños en juego en las primeras unidades para desace
lerarse progresivamente.
fu en te: Lago y Montero (2005),
Figura 8. Relación entre las primas electorales del partido mayoritario y la

magnitud de distrito en las elecciones generales de 1977 en España.
¿Cómo podemos saber cuál es la forma funcional adecuada en
la relación entre X e 7? Aunque existen técnicas que nos pueden
ayudar (Fox, 2000), es nuestra teoría la que nos debe dar la res
puesta. Una buena teoría no sólo nos cuenta qué pasa y qué hace
que pase o qué impide que pase, sino también cómo pasa.
8. Epílogo
En este libro se ha sostenido que la explicación en ciencias socia

les descansa sobre el establecimiento de un efecto causal y la
provisión de un mecanismo que muestre de qué manera tiene lu
gar este efecto: la investigación social debe diseñarse para conse
guir ambos elementos.
La capacidad de plantear un mecanismo causal robusto depen
de de que la teoría que se maneja sea buena. Se trata, por tanto,
de un problema sustantivo y específico de cada pregunta de in
vestigación. La realización de inferencias causales se basa en una
lógica común a todos los estudios con ambiciones empíricas, al
margen de cuál sea su pregunta o su estilo, cuantitativo o cualita
tivo. Y esta lógica pasa por evitar las relaciones espurias a través
del cumplimiento de dos supuestos: la homogeneidad de las uni
dades o causal y la independencia condicional.
Por un lado, debemos lograr, mediante la introducción de las
variables de control necesarias, que la única diferencia entre dos
unidades tenga que ver con la variable independiente clave. Así
se le podrá atribuir cualquier diferencia en la variable dependien
te entre las dos unidades. Por otro, cuando se seleccionan las ob-
, . - - r v "
servaciones no se puede predeterminar el resultado, bien sea res

tringiendo o eliminando la variabilidad de la variable dependien
te. Escoger las observaciones en función de las variables inde
pendientes asegura la satisfacción de esta exigencia.
En definitiva, sólo cuando tengamos una buena teoría y haya
mos seguido la lógica inferencial que se ha desgranado en este
ensayo, tendremos una explicación aceptable. La metodología no
convierte nunca las malas teorías en investigaciones válidas y, a
la inversa, una buena teoría combinada con una metodología de
fectuosa da lugar a investigaciones inválidas.
9. Preguntas y problemas
1. Un investigador plantea que estudiar la licenciatura de ciencia

política aumenta el interés por la política en comparación con es
tudiar cualquier otra licenciatura. Cuando observa los datos de
los individuos licenciados, en efecto descubre que a los estudian
tes de ciencia política en España les interesa más la política que a
los demás universitarios. Discute el argumento y sus resultados
desde un punto de vista metodológico.
En este estudio existe un problema de endogeneidad: la variable in

dependiente, la licenciatura estudiada, es la causa de la variable
dependiente, el interés por la política, una vez que se ha cursado la
carrera. Pero la variable dependiente es también la causa de la in
dependiente en un momento anterior, puesto que cuando un indivi
duo decidió qué carrera estudiar, con seguridad los que tenían un
mayor interés por la política fueron los que acabaron cursando
ciencia política. La inferencia causal que hace el investigador no es
válida y, además, ya que se carece de datos sobre el interés de la
política de los individuos antes de comenzar sus estudios universi
tarios, no es posible determinar la dirección e intensidad del error.
La logice os í& explicación se; Lis d e o d s i sociales
Para resolver este problema, el investigador debería analizar

las diferencias en el interés por la política de los individuos sólo
durante los años que se cursan los estudios universitarios. La va
riable dependiente no debería ser el nivel de interés por la políti
ca al acabar la carrera, sino su diferencia desde el momento en
que se inicia y en que se termina. En otras palabras, el interés
por la política antes de comenzar la carrera debería convertirse
en una variable independiente más.
2. Un investigador está interesado en mostrar cómo influyen los

años de estudio en la remuneración mensual de los trabajadores.
Para realizar su análisis empírico se queda con los trabajadores
que superan el percentil 50 en su salario. Explica las consecuen
cias de esta decisión sobre la inferencia causal. ¿Qué sucedería
de nuevo en términos de la inferencia causal si escogiera a los
trabajadores que se encuentran por debajo del percentil 50 en los
años de estudio? ¿Por qué?
En el primer caso, se están seleccionando las observaciones, en

este caso los trabajadores, en función de 1a. variable dependiente,
el salario. La consecuencia es la existencia de un sesgo de selec
ción, debido a que se está predeterminando el resultado. Al res
tringir la variabilidad de los salarios, ya no es posible encontrar
personas que ganen poco dinero: sea cual sea el nivel de estudios,
todos superan el percentil 50 en su salario La inferencia causal
está sesgada. En el segundo caso, la selección de las observacio
nes se realiza en función de la variable independiente, los años de
estudio. No se comete, por tanto, ningún error, puesto que el inves
tigador no predetermina los valores de la variable dependiente. Es
posible que algunos trabajadores con una elevada cualificación
ganen mucho dinero y otros poco. La única consecuencia de la se
lección de observaciones que se lleva a cabo es que las conclusio
nes a las que se llega sólo son válidas para los trabajadores que
están por debajo del percentil 50 en los años de estudio, pero no
para todos.
< 'l. - l<
3. Supongamos que en e] año 2006 los accidentes de tráfico en

España alcanzan su nivel más bajo desde que se tienen datos al
respecto, 1980. Además, en el año 2006, por un lado, se ha em
pleado por primera vez carné por puntos, y, por otro, se aplican
también por primera vez penas de cárcel a todos los individuos
que circulan por encima de la velocidad permitida. El director de
la Dirección General de Tráfico concluye en su informe anual
que el carné por puntos ha resultado un completo éxito, puesto
que ha permitido que los accidentes de tráfico en España hayan
alcanzado su nivel más bajo desde que se tienen datos. Discute la
afirmación del director de la DGT.
Aunque supongamos que la España de 1980 sea igual a la de

2006 en cualquier variable independiente interviniente, ademéis
AeJas-dospus nos interesan, la inferencia que realiza el director
de la DGT no se puede hacer. No existe ningún año en el que se
haya aplicado el carné por puntos y no las penas de cárcel, y a la
inversa. Es decir, no es posible separar el efecto de cada una de
estas variables independientes sobre la dependiente, el número de
accidentes de tráfico. Tenemos un problema de multicolinealidad
perfecta y, por tanto, no se puede hacer una inferencia causal.
Para resolver este problema deberíamos reducir la correlación
entre las dos variables independientes. Una posibilidad, improba
ble, es conseguir que el gobierno español nos eche una mano y
decida suspender durante algunos años la aplicación de alguna
de las dos medidas. La segunda posibilidad, la que deberíamos
seguir, es buscar datos de otros países en los que sólo se emplee
una de las dos medidas. Pero hay que tener en cuenta que segu
ramente haya alguna diferencia entre estos países y España en lo
que se refiere a otras variables independientes, como el número
de coches o la velocidad máxima permitida, por ejemplo. Será
necesario controlarlas para poder hacer una inferencia causal
válida.
4. Dada la extraordinaria importancia que las elecciones tienen

en las democracias contemporáneas, el comportamiento electoral
La expiJícadén- en
5KÍ&¡
sólo puede ser una variable dependiente en las investigaciones.

Discute esta afirmación.
Se trata de una afirmación falsa. No hay nada en una variable

que la haga ser dependiente o independiente por definición. Todo
depende de cuál sea la pregunta de investigación que nos plante
emos. Por ejemplo, nos puede interesar estudiar las razones de
que alguna gente vote o no: el comportamiento electoral es aquí
la variable, dependiente. Pero también nos podría interesar estu
diar cómo influye el número de votantes en la estabilidad de las
democracias. El comportamiento electoral es ahora la variable
independiente.
5. Un investigador está interesado en mostrar cómo afecta el gas

to público al crecimiento económico. Para realizar-su análisis-
empírico se queda con los países cuyo gasto público supera el
percentil 60. Explica las consecuencias de esta decisión sobre la
inferencia causal. ¿Qué sucedería de nuevo en términos de la in
ferencia causal si escogiera países cuyo crecimiento económico
estuviera por encima del 3 por ciento anual (en términos de
PIB)? ¿Por qué?

este caso los países, en función de la variable independiente, el
gasto público. No se comete, por tanto, ningún error, puesto que el
investigador no predetermina los valores de la variable depen
diente, el crecimiento económico. Es posible que algunos países
con un elevado gasto público crezcan mucho y otros poco, nada o
en negativo. La única consecuencia de la selección de observacio
nes que se lleva a cabo es que las conclusiones a las que se llega
sólo son válidas para los países cuyo gasto público está por enci
ma del percentil 60. En el segundo caso, la selección de las obser
vaciones se realiza en función de la variable dependiente, el cre
cimiento económico. La consecuencia es la existencia de un sesgo
de selección, debido a que se está predeterminando el resultado.
Al restringir la variabilidad del crecimiento económico, ya no es
posible encontrar países que crezcan por debajo del 3 por ciento:
sea cual sea el nivel de gasto público, todos los países superan el
3 por ciento de crecimiento. La inferencia causal está sesgada.
6. Un investigador plantea que estar desempleado depende ex

clusivamente de la acumulación de capital humano de cada indi
viduo, en particular, los años de estudio que ha realizado. Otro
estudioso del tema le replica que también importa el número de
zanahorias que ingiere un individuo. Discute cuáles pueden ser
las posibles consecuencias de que no aparezca esta segunda va
riable en el modelo de explicación.
Supongamos que el número de zanahorias que ingiere un indivi

duo fuera una variable independiente relevante. Su omisión su-
pondria un sesgo eñlá inferencia de la influencia del capital hu
mano sobre estar desempleado si existiera alguna correlación
entre las dos variables independientes. Así mismo, la dirección
del sesgo dependería del signo de esta correlación. No obstante,
no parece que haya correlación alguna entre las dos variables,
de modo que excluirla no produciría sesgo. Pero no hay ningún
mecanismo causal que nos haga esperar que el número de zana
horias que ingiere un individuo pueda influir en su situación la
boral. Esta variable independiente resulta irrelevante y, por lo
tanto, debemos excluirla de nuestro modelo de explicación para
no incurrir en ineficiencia.
7. Puesto que la omisión de variables relevantes suele llevar al

sesgo, un investigador debe tener en cuenta el mayor número po
sible de variables en su modelo de explicación de un fenómeno.
Discute esta afirmación.
Efectivamente, cuanto mayor sea el número de variables inde

pendientes que se tiene en cuenta, menos probable es que se in
curra en un sesgo de especificación. Pero cuando se incluyen en
el modelo de explicación variables irrelevantes, se cae en la ine
ficiencia. En definitiva, sólo tenemos que considerar las varia-
105
La lógica áe la exptkacism ars tasjríenclas sacíalas
bles que importan, aunque es menos grave la ineficiencia que el

sesgo. Por tanto, en caso de duda acerca de incluir o no una va
riable, es mejor hacerlo.
8 . ¿Cómo se puede asegurar que una correlación entre dos varia

bles sea causalidad y no algo espurio?
Por un lado, debe demostrarse que la relación entre las dos va
riables se mantiene cuando se introducen variables de control. Si
la relación entre ellas desaparece cuando se añade una tercera
variable, esto significa que era espuria. Por otro, debe señalarse
algún mecanismo causal que muestre cómo la variable indepen
diente influye en la dependiente. Si no somos capaces de hacerlo,
nos queda la duda de que esta relación sea espuria.
9. Supongamos que nos interesa estimar la importancia del nivel

de estudios en el salario de los españoles y que utilizamos una en
cuesta en la que la selección de los individuos es aleatoria. Un pri
mer investigador se queda sólo con aquellos individuos que de
acuerdo con la encuesta tienen estudios de bachillerato o universi
tarios. Un segundo investigador se queda sólo con aquellos indivi
duos que de acuerdo con la encuesta tienen estudios primarios, de
bachillerato o universitarios. Explica las diferencias en las inferen
cias que se pueden hacer en cada caso, si crees que existe alguna.
Los dos investigadores están seleccionando las observaciones,

individuos, en términos de la. variable independiente, el nivel de
estudios. No se comete, por tanto, ningún error, puesto que nin
guno de los dos predetermina los valores de la variable depen
diente, el salario. La única consecuencia de la selección de ob
servaciones que se lleva a cabo es que las conclusiones a las que
llega el primer investigador sólo son válidas para los individuos
que tienen estudios de bachillerato o universitarios, mientras que
las del segundo son además válidas para los que cuentan con es
tudios primarios. Por tanto, el segundo investigador puede exten
der sus conclusiones a más individuos que el primero.
10. Para que haya una relación causal entre dos variables es ne
cesario que exista alguna correlación entre ellas. ¿Verdadero o
falso? ¿Por qué?
Verdadero. Del mismo modo que la ausencia de correlación entre

dos variables nos lleva a concluir que no es posible que haya una
relación causal entre ellas, sólo cuando descubrimos alguna co
rrelación es posible que tengamos causalidad. Pero correlación
no es causalidad. Para que sea así es necesario que demostremos
que no se trata de una relación espuria a través de la inclusión
de variables de control y de la provisión de un mecanismo causal
que plantee de qué manera tiene lugar el supuesto efecto.
11. Supongamos que queremos explicar una variable dependien-

te determinada. U n.investigador plantea un modelo de explica
ción con tres variables independientes. Un segundo investigador
plantea un modelo de explicación con siete variables indepen
dientes. ¿Cuál de las dos es mejor? ¿Por qué?
Depende que cuál sea el modelo verdadero o correcto. Si en reali

dad hacen falta tres variables independientes para explicar la de
pendiente, el modelo propuesto por el primer investigador es el
correcto. El del segundo investigador tendría un problema de efi
ciencia, puesto que, al manejar cuatro variables innecesarias, ne
cesitará más observaciones para llegar al mismo resultado que el
primer investigador. En otras palabras, en este segundo caso la
explicación es mucho menos parsimoniosa. Si, por el contrario,
en realidad hacen falta siete variables independientes para expli
car la dependiente, el modelo propuesto por el segundo investiga
dor es el correcto. El del primero tiene varios sesgos por omisión
de variables relevantes, de modo que sus inferencias sobre las va
riables independientes que tiene en cuenta serán incorrectas.
12. Un investigador está interesado en mostrar cómo influye co

mer salchichas en el peso. Para realizar su análisis empírico se
queda con los individuos que superan los 80 kilogramos de peso.
Explica las consecuencias de esta decisión sobre la inferencia
causal. ¿Qué sucedería de nuevo en términos de la inferencia cau
sal si escogiera a los individuos que comen más de 148 salchi
chas al año? ¿Por qué?

este caso individuos, en función de la variable dependiente, el
peso. La consecuencia es la existencia de un sesgo de selección,
debido a que se está predeterminando el resultado. Al restringir
la variabilidad del peso, ya no es posible encontrar personas que
tengan un peso inferior a los 80 kilos: sea cual sea el número de
salchichas ingeridas, todos superan los 80 kilos. La inferencia
causal está sesgada. En el segundo caso, la selección de las ob
servaciones se realiza en función de la variable independiente,
las salchichas ingeridas. No se comete, por tanto,ningúmerjxjr^
puesto que el investigador no predetermina los valores de la va
riable dependiente. Es posible que entre los individuos que co
man más de 148 salchichas haya personas gordas y otras delga
das. La única consecuencia de la selección de observaciones que
se lleva a cabo es que las conclusiones a las que se llega sólo son
válidas para los individuos que comen más de 148 salchichas,
pero no para todos.
13. Un investigador plantea que estudiar un carrera universitaria

aumenta el coeficiente de inteligencia de los individuos. Cuando
observa los datos, descubre que los individuos con estudios uni
versitarios son más inteligentes que los que no los tienen. Discute
el argumento y sus resultados desde un punto de vista metodoló
gico, no sustantivo.
En este estudio existe un problema de endogeneidad: la variable

independiente, estudiar una carrera, es la causa de la variable
dependiente, el grado de inteligencia, una vez que se ha cursado
la carrera. Pero la variable dependiente es también la causa de
la independiente en un momento anterior, puesto que los indivi
duos que estudian una carrera seguramente tenían en términos
2 1
9. Preguntas y problemas
medios una mayor inteligencia que los que no la estudian. La in

ferencia causal que hace el investigador no es válida y, además,
puesto que se carece de datos sobre la inteligencia de los indivi
duos antes de comenzar sus estudios universitarios, no es posible
determinar la dirección e intensidad del error.
Para resolver este problema, el investigador debería analizar
las diferencias en la inteligencia de los individuos sólo durante
los años en que se cursan los estudios universitarios. La variable
dependiente no debería ser el coeficiente de. inteligencia al aca
bar la carrera, sino su diferencia entre el momento en que se ini
cia y en que se termina.
14. Para determinar si el colesterol depende del ejercicio físico o

simplemente de la genética, un investigador realiza el siguiente
-experimento:una vez seleccionados 70 pares de hermanos geme
los, uno de ellos es sometido a un intenso entrenamiento deporti
vo diario durante tres meses, mientras que el otro realiza una vida
completamente sedentaria. Discute la importancia de que el ex
perimento tenga como sujetos de estudio a hermanos gemelos.
Puesto que los hermanos gemelos son genéticamente iguales, to

das las variables que pueden influir en el colesterol están perfec
tamente controladas —son iguales o constantes entre ellos— ex
cepto una: la variable independiente clave, en este caso el
ejercicio. Cualquier diferencia en la variable dependiente, el co
lesterol, se puede atribuir al entrenamiento. En fin, la selección
de hermanos gemelos garantiza el supuesto de la homogeneidad
de las unidades o causal.
15. Un investigador está interesado en mostrar cómo influyen los

años de estudio en el número de libros que lee un individuo. Para
realizar su análisis empírico se queda con los individuos que han
leído más de 25 libros al año. Explica las consecuencias de esta
decisión sobre la inferencia causal. ¿Qué sucedería de nuevo en
términos de la inferencia causal si escogiera a los individuos que
tienen menos de 5 años de estudios? ¿Por qué?
f , ' !'■!

este caso individuos, en función de la variable dependiente, el
número de libros leídos. La consecuencia es la existencia de un
sesgo de selección, debido a que se está predeterminando el re
sultado. Al restringir la variabilidad del número de libros leídos,
ya no es posible encontrar personas que hayan leído menos de
25 libros al año: sea cual sea el número de años de estudio que
se acumulen, todas las personas superan los 25 libros. La infe
rencia causal está sesgada. En el segundo caso, la selección de
las observaciones se realiza en función de la variable indepen
diente, los años de estudio. No se comete, por tanto, ningún error,
puesto que el investigador no predetermina los valores de la va
riable dependiente. Es posible que entre los individuos que cuen
tan con menos de 5 años de estudio haya personas que hayan leí
do muchos libros y otros ninguno.-La-única-c&nsecuencia-deJa.
selección de observaciones que se efectúa es que las conclusio
nes a las que se llegan sólo son válidas para los individuos que
tienen menos de 5 años de estudios.
16. Un investigador quiere estudiar cómo influye la renta per cá

pita de un país en la probabilidad de que sea una democracia. Su
hipótesis es que a mayor renta, más probable es la democracia.
Para contrastar su hipótesis, estudia los países de la Unión Euro
pea. Discute el diseño de la investigación.
Puesto que todos los países de la Unión Europea son democra

cias, el diseño de investigación contiene un sesgo de selección:
la selección no permite que se produzca ninguna variación en la
variable dependiente, la existencia de democracia. La conclusión
(errónea) a la que se llegaría sería que la renta per cápita no im
porta en que se establezca una democracia, puesto que todos los
países estudiados, sea cual sea su renta per cápita, son democra
cias. Para poder estimar adecuadamente este efecto causal sería
necesario que se estudiaran también países no democráticos,
esto es, fuera de la Unión Europea....................................
110
f ¡íU - . . .
17. Un investigador observa que los individuos mayores de 18

años en España dedican menos horas a la semana a practicar de
porte que los menores de 18. Su conclusión es que el derecho de
sufragio (que se concede a los 18 años) causa una menor propen
sión a practicar deporte. Discute en términos metodológicos esta
conclusión.
La relación aparentemente causal entre tener el derecho de su

fragio y el deporte es espuria. No hay ningún mecanismo causal
que pueda justificarla. La correlación entre las dos variables se
debe a que son efectos de una causa común: la edad. Los mayo
res de 18 años practican menos deporte que los menores de edad
y, al mismo tiempo, son los que pueden votar.
” 18; ^Prescindir de una variable independiente relevante en la ex

plicación de un fenómeno siempre provoca un sesgo en el efecto
de las restantes variables independientes consideradas. ¿Verdade
ro o falso? ¿Por qué?
Falso. La omisión de una variable independiente relevante sólo

provoca un sesgo en el efecto de las incluidas cuando existe algu
na correlación entre ellas: cuanto mayor sea la correlación, ma
yor será el sesgo. De todos modos, y desde un punto de vista em
pírico, resulta sumamente difícil encontrar dos variables
independientes relevantes que tengan una correlación igual a
cero.
1
Notas
Capítulo 1
1 Sobre esta crítica, véase Geddes (2003: 5).
2 Para un análisis más detallado de esta cuestión, véase King, Keoha-
ne y Verba (2000: 24-29).
3 Véase King, Keohane y Verba (2000: 107-124).
Capítulo 2
1 Las denominadas leyes de Duverger (Duverger (1987 [1951]: 232-
233) establecen que la representación proporcional conduce a un sistema
pluripartidista con partidos rígidos, estables e independientes; que el sis
tema de mayoría a dos vueltas tiende a un pluripartidismo con partidos
flexibles, dependientes y relativamente estables, y que el sistema de ma
yoría relativa conduce a un sistema bipartidista con partidos grandes e
independientes que se alternan.
2 Aunque no exenta de críticas, sobre todo por parte de los especialis
tas en política comparada (American Política] Science Association,
1995; Brady y Collier, 2004).
3 Elster (2000: 36-42) señala que existen muchas situaciones, como
en las que hay una tercera variable que explica tanto la variable aparente
mente explicativa como la dependiente, en las que el significado de la
causalidad no puede expresarse mediante enunciados contrafácticos. Si
C es suficiente para A, explica Elster, y necesario para B, el enunciado
contrafáctico de que «si A no hubiera ocurrido, B no habría ocurrido» es
verdadero, pero el causal de que «A causó B» es falso. La condición de
no necesario surge de la posibilidad de causación precedente. Si C no
hubiera producido B en caso de estar A ausente, el enunciado causal si
gue siendo válido, pero el contrafáctico es falso. No obstante, y como
nos recuerdan King, Keohane y Verba (2000: 246-247), Elster no hace
más que mencionar problemas habituales de las inferencias que, en cier
ta medida, son siempre inciertas. El propio Elster (2000: 37) reconoce
que los enunciados contrafácticos tienen una función importante en el
análisis causal. De ahí que su argumento, como concluyen King, Keoha
ne y Verba, sea más convincente si se considera como un conjunto de
valiosas advertencias contra la utilización descuidada de los contrafácti
cos que como una crítica a su uso.
4 Véase también Weber (1949).
5 Desde luego, este presupuesto es falso, pero resulta útil para simpli
ficar la discusión.
Capítulo 3
1 El apartado 7 de este ensayo se dedica precisamente a estudiar en qué
condiciones el término de azar de un modelo pierde esta condición.
2 Y no sería extraño que las circunscripciones elegidas para que Az-
nar dé los mítines sean aquellas en las que el PP tiene más seguidores.
Capítulo 5
1 Se podría añadir un tercer supuesto, que King, Keohane y Verba
(2000) plantean menos explícitamente, y que se conoce como la inde
pendencia de las observaciones, esto es, que el valor de una variable
determinada no está influido por el valor en otra observación. La per
turbación aleatoria de una observación no debe influir así en la pertur
bación aleatoria de otra observación. Este supuesto, que en el análisis
de regresión se conoce como no autocorrelación, es importante en los
estudios longitudinales, pero prescindible en los que sólo contemplan
un punto en el tiempo o de sección cruzada. De todos modos, en la
medida en que no invalida las inferencias causales, sino que simple
mente las hace menos precisas, es menos importante que los otros
dos. Para un revisión de este problema, puede verse Gujarati (1997:
cap. 12).
2 Con mayor precisión, el valor esperado no se refiere al valor que
uno debería anticipar para cada caso analizado, sino al valor medio en
distintas réplicas hipotéticas de cada caso. Recordemos que el azar im
porta en la definición de los valores de la variable dependiente.
3 Para un repaso sencillo de los problemas inferenciales en el análisis
de regresión, puede verse Gujarati (1997: cap. 8).
4 En realidad, cuando se manejan datos reales, los investigadores no
tienen la capacidad de asignar casos a los grupos de tratamiento y con
trol. La asignación tiene lugar efectivamente, pero son los propios proce
sos sociales y políticos los que la realizan. Y los investigadores no sue
len tener control sobre ellos.
5 Sobre los fundamentos sustantivos de este ejemplo, puede verse
Colomer (2003).
Capítulo 6
1 Véase en este sentido los recientes trabajos de Brady y Collier (2004)
y Johnson (2006), cuya crítica a King y Keohane y Verba (2000) se plan
tea precisamente en estos términos.
2 Por supuesto, estas modalidades de explicación no son las únicas
que existen, aunque sí las más populares. Elster (2000) distingue tam
bién..laêxîcaciónfuncional, basada en el supuesto de que todos los fe
nómenos sociales y psicológicos deben tener un significado, es decir,
debe haber algún sentido, alguna perspectiva en la que son beneficiosos
para alguien o algo; y que además estos efectos beneficiosos son los que
explican el fenómeno estudiado. Y Bunge (1997) añade la explicación
interpretativa, centrada en el sentido, significado o intención de una ac
ción.
3 En los estudios cualitativos con pocas observaciones y escasas va
riables enjuego se lleva a cabo efectivamente esta descomposición. Pero
no en los cuantitativos, puesto que existen técnicas estadísticas, en par
ticular, la regresión, que permiten controlar simultáneamente todas las
variables independientes.
4 Es también cierto que Duverger (1992 [1950], 38 ss., y 1987
[1951], 235 ss.) señala dos razones teóricas para justificar la eliminación
por la regla mayoritaria de los terceros partidos: el «efecto mecánico» de
infraiTepresentación de los partidos mayoritarios y el «psicológico» de los
votantes que no desean desperdiciar sus votos. Pero de nuevo están
ausentes los microfúndamentos o las condiciones teóricas e instituciona
les bajo las cuales se alcanzan estos resultados.
5 Funcionalismo puede tener connotaciones negativas para algunos
lectores. Para una aclaración de su significado en la obra de Merton pue
de verse Mahner y Bunge (2001).
6 Para una revisión crítica puede verse Mahoney (2003).
7 Esta contraposición simplifica mucho la discusión. Para un análisis
preciso y riguroso de la relación entre las dimensiones identitaria y elec
tiva del comportamiento político, puede verse el reciente libro de Agui-
lar y Chuliá (2007), en particular los capítulos ¿ y ¿.
8 Véase también King, Keoahne y Verba (2000: 96-98).
Capítulo 7
1 En Dougherty (2002: 197-199) se puede encontrar una discusión en
términos formales del problema.
2 Pero, como cualquier regla empírica, hay que tomarla con cautela.
Es posible que una multicolinealidad grave no se refleje en una correla
ción bivariada; una variable independiente puede ser una combinación
de varias variables independientes en el modelo y, por tanto, su correla
ción individual con cada una de ellas sea baja.
Glosario
Correlación: Asociación entre dos variables,

j Correlación/relación espuria: Relación aparentemente causal entre la variable
¡ dependiente y la independiente que en realidad no existe, puesto que está cau-
j sada por una tercera variable.
j Explicación: Una afirmación sobre por qué ha sucedido un resultado.
| Hipótesis: Respuesta tentativa o provisional a una pregunta de investigación. En
j el análisis causal, es la conjetura sobre la relación entre una o más variables
¡ independientes y la dependiente.
1 Hipótesis alternativa: Es la hipótesis de nuestro modelo teórico que establece la
existencia de una relación entre dos variables.
I
Hipótesis nula: Es la hipótesis que se quiere rechazar en una investigación y que
normalmente postula que no existe ninguna relación entre dos variables.
Cuando se rechaza, se hace para aceptar la hipótesis alternativa.
Inferencia: El proceso de usar los datos para extraer conclusiones más amplias
sobre conceptos e hipótesis que son el objeto de la investigación.
Inferencia causal: El proceso de conseguir conclusiones sobre la causalidad de
acuerdo con los datos observados.
¡ Inferencia descriptiva: El proceso de conseguir conclusiones descriptivas de
¡ acuerdo con los datos observados.
117
Observación: Los valores de las variables para cada unidad de análisis.
¡ Operacionalización: La transformación de las hipótesis teóricas en operaciones
de investigación empírica.
Lj: lécriea da la explicación &n Las tie n d a s saciaifes
Parsimonia: Usar pocas variables en una teoría o explicación.

Pregunta de investigación: Lo que intentamos comprender en la investigación.
Sesgo: Error sistemático en la inferencia. Cuando existe un sesgo, los errores no
se cancelan y, por tanto, las inferencias no son válidas.
Teoría: Especulación razonada y precisa sobre la respuesta que cabe dar a la pre
gunta de una investigación e incluso una declaración de por qué tal respuesta
es correcta.
Unidad de análisis: Objetos sobre los que un investigador recoge los datos, como
personas, países o sistemas electorales.
Validez externa: Grado con el que una inferencia causal o descriptiva para un de
terminado conjunto de casos se puede generalizar a otros casos.
Validez interna: Se refiere a la calidad con la que se miden los conceptos impli
cados y las relaciones entre ellos dentro del modelo teórico.
Variable: Característica empíricamente observable de algún concepto y que pue
de tomar más de un valor (si no, es una constante).
Variable dependiente: Lo que se intenta explicar en una investigación.
Variable independiente: Una variable que influye en la variable dependiente.
Variable independiente clave: La variable independiente sobre la que se articula
la teoría que evaluamos empíricamente.
Variable independiente de control: Una variable independiente que también im
porta para explicar la variable dependiente, pero que no es central en nuestra
teoría.
Referencias
Achen, Christopher H. (1982): Interpreting and Using Regression. Sage Univer-

sity Paper series on Quantitative Applications in the Social Sciences, 07-029.
Beverly Hills y Londres: Sage Pubns.
— (2002): «Toward a new política] methodology: Microfoundations and ART».
Animal Review o f Political Science 5: 423-450.
Aguilar, Susana, y Elisa Chuliá (2007): Identidad y opción: dos formas de enten
der la política. Madrid: Alianza Editorial.
American Political Science Association (1995): «Symposium on The Qualitative-
Quantitative Disputation: Gary King, Robert O. Keohane, and Sidney Verba’s
Designing Social Inquiry: Scientific Inference in Qualitative Research». Ame
rican Political Science Review 89: 454-481.
Anduiza, Eva (1999): ¿Individuos o sistemas? Las razones de la abstención en
Europa Occidental. Madrid: Centro de Investigaciones Sociológicas/Siglo
XXI.
Anduiza, Eva, Ismael Crespo y Mónica Méndez (1999): Metodología de la Cien
cia Política. Madrid: Centro de Investigaciones Sociológicas.
Arjas, Elja (2001): «Causal Analysis and Statistics: A Social Sciences Perspecti-
ve». European SociologicalReview 17: 59-64.
Bartolini, Stefano (1996): «Metodología de la investigación política». En Manual
de ciencia política, comp. Gianfranco Pasquino. Madrid: Alianza Editorial.
Beck, Nathaniel, y Simón Jackman (1998): «Beyond Linearity by Default: Gene-
ralized Additive Models». American Journal o f Political Science 42: 596-627.
La tóales de ls explicación en las ciencias sodales
Levi, Isaac (1984): Decisions and Revisions: Philosophical Essays on Knowledge

and Valué. Nueva York: Cambridge University Press.
Lewis-Beck, Michae) S. (1995): Data Analysis. An Introduction. Sage University
Paper series on Quantitative Applications in the Social Sciences, 07-103. Be-
verly Hills y Londres: Sage Pubns.
Lieberson, Stanley (1985): Makingit Count. The Improvement o f Social Research
and Theory. Berkeley: University of California Press.
Linz, Juan J. (1975): «Totalitarism and Authoritarian Regimes». En Handhook of
Poli ticaI Science, vol. 3, Macropolitical Handhook, eds. Fred Greenstein y
Nelson W. Polsby. Reading, Mass.: Addison-Wesley Press.
Little, Daniel (1991): Varieties o f Social Explanation: An Introduction to the Phi-
losophy o f Social Science. Boulder, Colorado: Westview Press.
— (1998): On the Philosophy o f the Social Sciences. Microfoimdations, Method,
and Causation. New Brunswick, NJ: Transaction Publishers.
— (2005): Causal Mechanisms in Comparative Historical Sociology. Presentado
en la Social Science History Association 2005.
Machamer, Peter, Bindley Dardcn y Cari F. Craver (2000): «Thiñking about me-
chanisms». Philosophy o f the Social Sciences 67: 1-25.
Mahner, Martin, y Mario Bunge (2001): «Function and functionalism: A synthe-
tic perspective». Philosophy ofthe Social Sciences 68: 75-94.
Mahoney, James (2003): Tentative Answers to Questions about Causal Mecha-
nism. Presentado en Annuals Meetings ofthe American Political Science As
sociation, Philadelphia, PA, 28 de agosto de 2003.
Manheim, Jarol B., y Richard C. Rich (1988): Análisis político empírico. Métodos
de investigación en Ciencia Política. Madrid: Alianza Editorial.
Marini, Margaret, y Burton Singer (1988): «Causality in the Social Sciences». En
Sociological methodology 1988, ed. Clifford Clogg. American Sociological
Association.
McKeown, Timothy J. (2004): «Case Studies and the Limits of Quantitative
Worldview». En Rethinldng Social Inquiiy. Diverse Tools, Shared Standards,
eds. Henry E. Brady y David Collier. Oxford: Rowman & Littlefield Publis
hers, Inc.
Merton, Robert K. ([1948] 1968): Social Theory and Social Structure. Rev. ed.
Nueva York: Free Press.
— (1967): On Theoretical Sociology. Nueva York: Free Press.
— (1987): «Three fragments from a sociologist’s notebook: establishing the phe-
nomenon, specified ignorance and strategic research materials». Annual Re
vi ew o f Sociology 13: 1-28.
Mili, John Stuart (1874): A system oflogic, rationative and inductive, being a
connected view of the principies o f evidence and the methods o f scientific in-
vestigation. Nueva York: Harper and Brothers.
124
îe$^S^-SK^»^«Síi¡6^^1iXtii5e$^s5S^Í^Glk-tiUSiv«i^®^SaSiMi&íS6^SSeS7«S<E5E8®S»Si9asi
Miller, Richard W. (1987): Fací and Method: Explanation, Confirmation, and Re-
ality in the Natural and the Social Sciences. Princeton: Princeton University
Press.
Montero, José Ramón, e Ignacio Lago (2005): «La investigación sobre los siste
mas electorales: cinco debates y una selección de artículos». Zona Abierta
110-111: 1-35.
Morales, Laura (1999): «Participación política en España: un análisis de las dife
rencias de género». En Género y ciudadanía. Revisiones desde el ámbito p ri
vado, eds. Margarita Ortega, Cristina Sánchez y Celia Valiente. Madrid: Insti
tuto Universitario de Estudios de la Mujer/ Universidad Autónoma de Madrid.
Munck, Gerardo L. (2004): «Tools for Qualitative Research». En Rethinking So
cial Inquiry. Diverse Tools, Shared Standards, eds. Henry E. Brady y David
Collier. Oxford: Rowman & Littlefield Publishers, lnc.
Pearl, Judea (2000): Causality: Models, Reasoning, and Inference. Cambridge,
MA: Harvard University Press.
Pearson, Karl (1892): The Grammar o f Science. Londres: J. M. Dent & Sons.
JBickül, Andrcas-.(2004): «Systems and Mechanisms. A Symposium on Mario’s
Bunge Philosophy of Social Science». Philosophy o f the Social Sciences 34:
169-181.
Pierson, Paul (2000): «Increasing Returns, Path Dependence, and the Study of
Politics». American Political Science Review 94: 251-267.
Polavieja, Javier G. (2005): «Desregulación parcial y desigualdad horizontal en
España». Revista Internacional de Sociología 41: 9-36.
Popper, Karl R. (1969): Conjectures and Refutations. Londres: Routledge and Ke-
gan Paul.
— (1997): E l mito del marco común. En defensa de la ciencia y la racionalidad.
Barcelona: Paidós.
Przeworski, Adam, y Henry Teune (1970): The Logic o f Comparativa Social In
quiry. Nueva York: Wiley.
Putnam, Robert D. (1993): Making democracy work. Civic traditions in modern
Italy. Princeton: Princeton University Press.
Rogowski, Ronald (2004): «How Inference in the Social (but Not in the Physical)
Sciences Neglects Theoretical Anomaly». En Rethinking Social Inquiry. D i
verse Tools, Shared Standards, eds. Henry E. Brady y David Collier. Oxford:
Rowman & Littlefield Publishers, lnc.
Salmón, Wesley (1989): Four Decades o f Scientific Explanation. Minneapolis:
University of Minnesota.
Sartori, Giovanni, y Leonado Morlino (1994): La comparación en las ciencias so
ciales. Madrid: Alianza Editorial.
Schelling, Thomas C. (1960): The Strategy o f Conflict. Harvard: Harvard Univer
sity Press.
— (1989): Micromotivos y macroconducta. México: Fondo de Cultura Económica.
La lógica s e la explicación en las ciencias so ciales
Simón, Herbert A. (1979): «The Meaning of Causal Ordering». En Qualitative

and Quantitative Social Research, eds. Robert K. Merton, James S. Coleman
y Peter H. Rossi. Nueva York: The Free Press.
Simón, Herbert A., e Y. Iwasaka (1988): «Causal ordering, comparative statistics,
and near decomposability». Journal of Econometrics 39: 149-173.
Skinner, B. F. (1970): Ciencia y conducta humana. Barcelona: Fontanella.
Sorensen, Aage B. (1991): «Merton and Methodology». Contemporary Sociology
2 0 : 516 - 519 .
— (1998): «Theoretical mechanisms and the empirical study of social procesa».
En Social Mechanisms. An Analytical Approach to Social Theory, eds. Peter
Hedstrom y Richard Swedberg. Cambridge: Cambridge University Press.
Spector, John L. (1981): Research Designs. Sage University Paper series on
Quantitative Applications in the Social Sciences, 07-023. Beverly Hills y Lon
dres: Sage Pubns.
Steel, Daniel 2004): «Social Mechanisms and Causal Inference». Philosophy of
the Social Sciences 34: 55-78.
Stinchcombe, Arthur L. (1968): Gonm sUng&KitrtêorieihJZhfcsqpiJJanm áty-
of Chicago Press.
— (1993): «The Conditions of Fruitfulness of Theorizing about Mechanisms in
Social Sciences». En Social Theory and Social Policy. Essays in Honor o f Ja
mes S. Coleman, eds. Aage B. Sorensen y Seymour Spilerman. Nueva York:
Praeger.
Tetlock, Philip E., y Richard Ned Lebow (2001): «Polcing counterfactual holes in
covering laws: cognitive styles and historical reasoning». American PoUtical
Science Review 95: 829-843.
Torcal, Mariano, y Pradeep Chhibber (1995): «Elites, cleavages y sistema de par
tidos en una democracia consolidada: España (1986-1992)». Revista Española
de Investigaciones Sociológicas 69: 7-38.
Udéhn, Lars (2002): «The Changing Face of Methodological Individualism». An
imal Review of Sociology 28: 479-507.
Weber, Max (1949): «Objective Possibility and Adequate Causation in Historical
Explanation». En The Methodology o f the Social Sciences, Max Weber. Nueva
York: Free Press.
— (1973): Ensayos sobre metodología sociológica. Buenos Aires: Amorrortu.

La LÓGICA DE LA EXPLICACION EN LAS CIENCIAS SOCIALES PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

La LÓGICA DE LA EXPLICACION EN LAS CIENCIAS SOCIALES PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Ignacio Lago

© 'Ignacio L^go Peñas, 2008

SI QUIERE RECIBIR INFORMACIÓN PERIÓDICA SOBRE LAS NOVEDADES DE

2. Descripción y explicación: el concepto de causa.................... 17

3. El azar en los fenómenos políticos y sociales......................... 29

4. Relaciones causales versus relaciones espurias....................... 33

5. ¿Cómo se pueden estimar los efectos causales?...................... 41

6. ¿Qué significa «explicar» en ciencias sociales?...................... 53

7. ¿Qué se debe evitar en los diseños de investigación?............ 75

9. Preguntas y problem as..................................................................... 101

En este libro se aúnan los dos yoes de un profesor universitario:

«Pues si nos importa conocer perfectamente algu­

La tarea fundamental de las ciencias sociales es la explicación,

cómo tiene lugar la relación entre dos variables, observar su va­

opiniones no son correctas o incorrectas; las investigaciones

Las explicaciones causales no son posibles sin una buena des­

en palabras de Lieberson (1985: 213-219), los datos muestren

donde Xd es la variable independiente clave, /3, es su efecto cau­

P\XCI+ M eo = Yr ~ Yh>de mC)d° 9Ue PlXd = (Yr ~ Yl) ~ M eo (2)

donde Xco es una variable de control y /3, su efecto causal. En fin,

precisamente que el respaldo de una hipótesis causal en la estra­

bles cuando la variable independiente clave tiene otro valor

Y., el valor de la variable dependiente, el salario mensual, para

fuente : Elaboración propia.

Figura 1. Componentes sistemático y aleatorio en los efectos causales.

ría provoca que los valores verdaderos de Y, P v Pv P 3 y P4, sean

nómeno es ajustar una línea de acuerdo con nuestra teoría sustan­

guíente importación de sus instituciones de gobierno local. La in­

De acuerdo con la discusión anterior sobre los componentes de

del candidato José María Aznar a una circunscripción durante la

donde X = 1, es decir, cuando Aznar visita una circunscripción

donde A = 0, es decir, cuando Aznar rio \dsita lá“ circüjiscripüfóñ'

Si calculamos la diferencia entre (4) y (5a),

Yr= Yk = lS p + iL -tL » (6)

resulta que el efecto causal de la variable independiente pasa a

Finalmente, si las perturbaciones aleatorias no afectan a Y ni a

Para que efectivamente el azar no tenga ninguna influencia en

circunscripción, y esta última se ha excluido de la ecuación, en­

En la definición contrafáctica de los efectos causales que se ha

Esta imposibilidad de que una unidad de Y esté simultánea­

ción contrafáctica, ya no son sólo distintos en la variable inde­

de la variable independiente clave, Fernández controla la influen­

El problema clásico de las inferencias causales a partir de los

Por supuesto, esta discusión sobre la inferencia causal nos lleva a

En general, (1) cuanto mayor sea la correlación entre la varia­

(el porcentaje de miembros de un grupo que están casados) e Y

porcentuales de esta distancia salarial se explican de acuerdo con

Siguiendo a King, Keohane y Verba (2000: cap. 3), para realizar

A. La homogeneidad de las unidades

Dos unidades son homogéneas cuando resultan iguales en todas

m ism os valores en todas las variables independientes), y son he­

tisface a través de estas dos posibilidades significa, como nos re­

procesos causales distintos entre los grupos de países, pero simi­

Dada la necesidad de realizar comparaciones reales en lugar de

causal estará sesgada. Por ejemplo, si las observaciones con un

mente preguntáramos a los que sabemos que tienen opiniones po­

En segundo lugar, el supuesto de la independencia condicio­

Al mismo tiempo, w está relacionada con p y U, el nivel de

Como ya sabemos, p, y ¡xw son el componente aleatorio en

P\ + a \P2 + af í 2U + P'p + ^2 P'w (14)

Si realizamos las operaciones análogas en (12), resulta que

w = a, + a 2(/3, + P 2w + P p) + ol3U + p,w (15)

+ a 2/3¡ + a 3U + Oí2f i + ¡xw

«Pues si nos importa conocer perfectamente algu

cómo tiene lugar la relación entre dos variables, observar su va

Las explicaciones causales no son posibles sin una buena des

donde Xd es la variable independiente clave, /3, es su efecto cau

precisamente que el respaldo de una hipótesis causal en la estra

nómeno es ajustar una línea de acuerdo con nuestra teoría sustan

guíente importación de sus instituciones de gobierno local. La in

circunscripción, y esta última se ha excluido de la ecuación, en

Esta imposibilidad de que una unidad de Y esté simultánea

ción contrafáctica, ya no son sólo distintos en la variable inde

de la variable independiente clave, Fernández controla la influen

En general, (1) cuanto mayor sea la correlación entre la varia

m ism os valores en todas las variables independientes), y son he

tisface a través de estas dos posibilidades significa, como nos re

procesos causales distintos entre los grupos de países, pero simi

mente preguntáramos a los que sabemos que tienen opiniones po

En segundo lugar, el supuesto de la independencia condicio

Del mismo modo que no existe una definición de causalidad uni

riables independientes sobre la dependiente se sugieren y se con

13), «un estudiante que tenga dificultades para pensar en al me

En las explicaciones basadas en las leyes de cobertura o, con ma

mos que satisfacen tres condiciones: (i) como premisas principa

1. un conjunto de afirmaciones sobre la ocurrencia de ciertos acontecimien

verdadera tarea es analizar adecuadamente las circunstancias de los fenóme

En la ciencia política, uno de los más conocidos ejemplos de teo

Pero, además, las leyes de cobertura en ciencias sociales dan lu

lugar a través de la invocación de leyes universales o la identifi

el análisis funcional en sociología, como en otras disciplinas como la fisiolo

las casas, puede predecirse que se incrementará el número de fu

rentemente distintos. Finalmente, es el conocimiento de los me

yor seguridad cuando es el único que sugiere la evidencia empíri

1. El protestantismo genera ciertos valores entre sus partida

es, la doctrina que establece que los fenómenos políticos y socia

La unidad elemental de la vida social es la acción humana individual. Expli

ción ontológica, acepta como parte de la explicación las institu

En este apartado se revisan las causas y consecuencias de los cin

Los errores de especificación tienen lugar cuando en nuestro mo

bles explicativas incluida y excluida sean totalmente indepen

Puesto que esta variable omitida tiene una correlación negati

En la discusión de los supuestos necesarios para realizar inferen

mal y 10 muy bien) y la ideología en una población de nueve per