Documente Academic
Documente Profesional
Documente Cultură
la lógica de la
explicaciónenlas
ciencias sociales: una
introducción
metodológica
UNIVERSIDAD
I C E S I biblioteca
083683
U N t V E R S l DAAlianza Editorial
SI '
d i b i iñ T P r j
La lógica de la explicación en las
ciencias sociales: una
introducción metodológica
/
Esta obra ha sido publicada con una subvención de la Dirección General del
Libro, Archivos y Bibliotecas del Ministerio de Cultura para su préstamo público
en Bibliotecas Públicas, de acuerdo con lo previsto en el artículo 37.2 de la Ley
de Propiedad Intelectual.
MINISTERIO
D E CULTURA
Reservados todos los derechos. El contenido de esta obra está protegido por la Ley, que esta
blece penas de prisión y/o multas, además de las correspondientes indemnizaciones por daños
y perjuicios, para quienes reprodujeren, plagiaren, distribuyeren o comunicaren públicamente,
en todo o en parte, una obra literaria, artística o científica, o su transformación, interpretación
o ejecución artística fijada en cualquier tipo de soporte o comunicada a través de cualquier
medio, sin la preceptiva autorización.
Agradecimientos................................................................................ 9
1. Presentación.............................................................................. 11
7.3. La multicolinealidad...................................................................... 88
7.4. La endogeneidad............................................................................. 91
7.5. La forma funcional: la linealidad por defecto........................... 94
8. E pílo go................................................................................................. 99
N o t a s .................................................................................................................... 113
G losario.......................................................................................................... 113
R eferencias................................................................................................... 119
Agradecimientos
11
La lógica de La explicación en las ciencias codales
■íJiMHffiWíi
15
nes especiales o particulares, interpretaciones ad hoc, para sal
varla.
La consecuencia inmediata del falsacionismo popperiano es
que hay que elegir conceptos cuyas consecuencias observables
sean fáciles de definir. Así, conceptos como imaginario social o
cultura, útiles para formular teorías, son problemáticos para eva
luarlas empíricamente dada su complicada medición y observa
ción5.
El ensayo se organiza de la siguiente manera. Una vez presen
tadas las líneas maestras, se discute la dicotomía descripción/ex-
plicación y se aclara el concepto de causa. En el apartado 3 se re
flexiona sobre la importancia del azar en los fenómenos políticos
y sociales y se distingue entre los componentes sistemático y
aleatorio de las observaciones. Los problemas en la estimación
de electos causales y. en particular,-el-riesgo de las-rclaeiones-es-
purias se estudian inmediatamente después. En el apartado 5 se
plantean los supuestos necesarios para estimar efectos causales.
A continuación se presentan las distintas modalidades de explica
ción en las ciencias sociales y se revisan los problemas más habi
tuales en el diseño de una investigación: los errores de especifi
cación en el modelo de explicación, el sesgo de selección, la
multicolinealidad, la endogeneidad y las formas funcionales inco
rrectas. El libro concluye con un breve epílogo y una selección de
preguntas y problemas, acompañados de sus respuestas, sobre los
principales temas estudiados.
2. Descripción y explicación:
el concepto de causa
P A r l - Y h, (i)
2. Descripción y explicación: st concepto de causa
Y, = 0, + + Ah (3)
y . P4
Y = ^ + /3 2X
< q4
,p\-
ir""'" q3
” q2 •
Qi • P3
Pz
+ ^32X i
X, x2 x3 x4 X
28
3. El azar en los fenómenos
políticos y sociales
29
, l l II ■>" ' V' '
Yr = ^ X + ix r, (4)
(5)
Yh = Vh (5a)
PlX ^ ( Y - Y t) - i i + ^ (7)
(8)
^ „ _t
Generalmente con esto último [la explicación espuria] nos referimos a la co
rrelación entre dos variables que no se origina en una relación causal entre
ellas, sino en su relación común con una tercera [...] El problema de confun
dir correlación y causación es un problema constante en este modo de expli
cación estadística y la razón por la que hay que cuidarse de interpretar corre
laciones como más que indicaciones de que «algo está pasando» que vale la
pena ser observado más en detalle. O quizás el punto debería expresarse ne
gativamente, que la función del análisis de correlación es que nos permite
descartar una hipótesis causal si la correlación es baja.
de que tenga lugar, dado no-A, pero esto no es suficiente para de
mostrar que X es la causa de 7. Por ejemplo, podría pasar que una
tercera variable, Z, sea la causa tanto de X como de Y, de modo
que, si se tiene en cuenta Z, la asociación entre X e Y desaparece
o se debilita, como se apunta en la ecuación (10). Es decir, la su
puesta conexión entre X e Y es espuria, ya sea total o parcialmente.
X -4 Y (9)
X<-Z-*Y (10)
I
4. Relaciones; causales versus relBdímss espurlss:
44
8
K«SSB* íSSSS¡
1110 $6 py 00.611 0S11 y13f U)S 6t0€t.C>$ CmlSdX&S
45
casos. Por ejemplo, la tipología de regímenes políticos de Linz
(1975) permite identificar universos de casos en los cuales los
procesos causales funcionan más o menos igual.
B. La independencia condicional
P = 0 , + P 2w + P p 01)
w = a ] + a 2p + a 3U + p w (12)
P = Pi + P 2( a i + «2 P + a 3U + ¿ O + P’p (13)
y, por tanto,
53
Le CS. Qé te c a m ó n e n l a s d e l e c t e s s a c i a t e c
{i
cuentra en la raíz de la discusión sobre la capacidad de explica
ción de los estudios cualitativos frente a los cuantitativos'.
En términos generales, en las ciencias sociales existen en la
actualidad al menos tres grandes concepciones o tradiciones so
bre cómo debe ser una explicación: la puramente estadística, la
de las leyes de cobertura y la basada en los mecanismos causa
les 2 (Elster, 2000; Goldthorpe, 2001; Hedstróm, 2005: cap. 2;
Hedstrdm y Swedberg, 1998; Little, 1991). Como tendremos oca
sión de comprobar a continuación, las diferencias entre ellas tie
nen que ver fundamentalmente con la estrategia analítica que de
fienden para garantizar que las relaciones aparentemente causales
no sean en realidad espurias. O, en otras palabras, para satisfacer
con la mayor seguridad posible los supuestos de la homogeneidad
de las unidades u homogeneidad causal y la independencia con
dicional. ___ __ _______________________________
rí 4
, 1 ’ I ' . f,
60
nencias sociales
la mayoría de A son B
Xeszl
X es probable que sea B
61
sssses&w
Fig u r a 2. Mecanismos c o m o c o n e x i ó n e n l o s p r o c e s o s c a u s a l e s .
75
sucede cuando son aleatorios, sino que tienen una tendencia, po
sitiva o negativa. En el otro, una o más variables irrelevantes para
explicar la variable independiente se han tenido en cuenta, de
modo que se incurre en ineficiencia: el procedimiento analítico
no utiliza toda la información para maximizar nuestra capacidad
de realizar inferencias válidas.
Para establecer las causas y consecuencias de los errores de
especificación, en el cuadro 1 se plantean las cuatro posibles si
tuaciones en las que se puede encontrar un investigador. En las
columnas, en mayúsculas, se presentan dos posibles modelos teó
ricos verdaderos e inobservables; el primero, con una única varia
ble independiente, y el segundo, con dos. En las filas, en minús
culas, se contienen dos posibles m odelos teóricos propuestos.
Cuando coinciden el modelo verdadero y el propuesto, como en
las casillas 1 y 4, no hay errores de especificación: la explicación
es correcta. Pero cuando sus variables no coinciden, como en las
casillas 2 y 3, aparecen los errores de especificación.
Modelo verdadero
de la teoría
F= 0, + ¡32X 2 + fJi Y = p l + p 1x 1 + p j c i + n
¡ Modelo propuesto
Y = b { + b 2X 2 Correcto Sesgo
1 2
Y = b ] + b 2X , + b 2X 2 Ineficiencia Correcto
3 4
76
cluye X 3, cuando en realidad no hace falta. La consecuencia de la
inclusión de una variable independiente irrelevante en nuestra ex
plicación es la ineficiencia, pero no el sesgo. Puesto que en el
modelo verdadero el efecto de X3 es 0, si tenemos en cuenta esta
variable en el análisis encontramos necesariamente que b3 = 0.
Para mostrar de una manera intuitiva qué significa la inefi
ciencia en una investigación, supongamos que la única variable
independiente que explica los resultados electorales del PP en las
circunscripciones en las elecciones generales de 1996 {Y) es la
visita de Aznar (X). Si tenemos dos circunscripciones idénticas
salvo en esta variable clave — una ha sido visitada por Aznar du
rante la campaña, la otra no— , se podría estimar el efecto causal
de la visita de Aznar con sólo dos observaciones. Sin embargo,
imaginemos que un investigador piensa (erróneamente) que hay
-una-segunda- -variable independiente que hay que controlar: el he
cho de que una circunscripción haya recibido fondos de cohesión
europeos. Para estimar el efecto causal de la variable indepen
diente clave se necesitan ahora al menos cuatro observaciones, de
nuevo bajo el supuesto de que son absolutamente idénticas ex
cepto en lo que atañe a estas dos variables. En primer lugar, de
bemos descomponer la variable dependiente en función de la va
riable independiente de control. Por un lado, hacen falta dos
circunscripciones que se hayan beneficiado de los fondos europeos;
una tiene que haber sido visitada por Aznar y la otra no. Y, por
otro, necesitamos otras dos que no se hayan beneficiado de los
fondos europeos; una tiene que haber sido visitada por Aznar y la
otra no. Como la variable de control es irrelevante, la inferencia
causal sobre el efecto de la visita de Aznar a una circunscripción
en los resultados electorales del PP en 1996 que realizamos es la
misma que antes. Pero hemos tenido que duplicar el número de
observaciones. En otras palabras, hemos sido ineficientes.
La segunda posibilidad de equivocación es excluir una varia
ble relevante, como pasa en la casilla 2. En el modelo estimado
no aparece Xv cuando en realidad debe ser considerada. La con
secuencia de la omisión de una variable relevante en nuestra ex
plicación es el sesgo. Ya sabemos que cuando se omite una varia
77
La lógica de le explicación en tas ciencias sociales
.V
C u a d r o 3. R elació n en tre v o ta r y la r e n ta *
Renta
Población: 18 individuos
Baja Media Alta
2 3 4
Votar
No 4 3 2
83
esta selección de observaciones, para los individuos con renta
baja, la probabilidad de votar es del 100 por cien (los dos indivi
duos considerados han votado), mientras que para los de renta
media y alta esta probabilidad también es del 100 por cien. Es
decir, la renta no explica en absoluto que una persona vote o no:
sea cual sea el nivel de renta, la probabilidad de votar es la m is
ma. En definitiva, la selección de las observaciones de acuerdo
con la variable dependiente nos ha llevado a realizar una infe
rencia incorrecta.
En la figura 5 se representa el efecto de la renta sobre la pro
babilidad de votar cuando existe un sesgo de selección y cuando
no lo hay. La curva es completamente plana cuando incurrimos
en el sesgo, pero claramente positiva cuando no existe este sesgo.
En otras palabras, el efecto causal de X sobre Y ha desaparecido
totalmente como consecuencia de la mala seleeGÍón-de ^obser-va=--
ciones.
Veamos qué sucede si la selección de observaciones se hace
en función de la variable independiente, la renta. Supongamos
que un investigador decide estudiar exclusivamente a aquellos
que tienen rentas bajas y medias. Por tanto, la tercera columna
del cuadro 3 se elimina artificialmente. Con esta selección de ob
servaciones, para los individuos con renta baja la probabilidad de
votar es del 33,3 por ciento (dos votan y cuatro no), mientras que
para los de renta media es mayor: un 50 por ciento. Es decir, pa
sar de una renta baja a una media aumenta esta probabilidad en
un 16,66 por ciento. Como se puede comprobar, la inferencia a la
que llegamos es la misma que realizábamos antes cuando estu
diamos a toda la población. De este modo, la selección de las ob
servaciones de acuerdo con la variable independiente nos ha lle
vado a realizar una inferencia correcta. La única diferencia ahora
es que no podemos extender nuestro hallazgo a las personas de
renta alta, pero no introducimos ningún sesgo.
Para estudiar cuáles son las consecuencias de truncar la varia
ble dependiente, esto es, limitar su variabilidad, pero permitiendo
que tenga alguna variación, en el cuadro 4 se analiza la relación
entre la valoración del gobierno en una escala 0-10 (0 es muy
7, ¿Qué se debe evitar &r tos diseños de investigación?
Ideología
Población: 9 individuos
Izquierda Centro Derecha
7.3. La multicolinealidad
donde,
89
Le léate de la expiícaclóa rsn las riendas seriales
7.4. La endogeneidad
i
lógica de le expíe csdói'V erf las ciencias sociales
Figura 7a. Relación entre la asistencia al cine (K) y la renta anual en miles de
euros (X).
Figura 7b. Relación entre la asistencia al cine (Y) y la renta anual en miles de
euros (X).
7, \f ^ .“'i f ' u "jy; n
105
La lógica áe la exptkacism ars tasjríenclas sacíalas
Por un lado, debe demostrarse que la relación entre las dos va
riables se mantiene cuando se introducen variables de control. Si
la relación entre ellas desaparece cuando se añade una tercera
variable, esto significa que era espuria. Por otro, debe señalarse
algún mecanismo causal que muestre cómo la variable indepen
diente influye en la dependiente. Si no somos capaces de hacerlo,
nos queda la duda de que esta relación sea espuria.
2 1
9. Preguntas y problemas
110
f ¡íU - . . .
Capítulo 1
1 Sobre esta crítica, véase Geddes (2003: 5).
2 Para un análisis más detallado de esta cuestión, véase King, Keoha-
ne y Verba (2000: 24-29).
3 Véase King, Keohane y Verba (2000: 107-124).
Capítulo 2
1 Las denominadas leyes de Duverger (Duverger (1987 [1951]: 232-
233) establecen que la representación proporcional conduce a un sistema
pluripartidista con partidos rígidos, estables e independientes; que el sis
tema de mayoría a dos vueltas tiende a un pluripartidismo con partidos
flexibles, dependientes y relativamente estables, y que el sistema de ma
yoría relativa conduce a un sistema bipartidista con partidos grandes e
independientes que se alternan.
2 Aunque no exenta de críticas, sobre todo por parte de los especialis
tas en política comparada (American Política] Science Association,
1995; Brady y Collier, 2004).
3 Elster (2000: 36-42) señala que existen muchas situaciones, como
en las que hay una tercera variable que explica tanto la variable aparente
mente explicativa como la dependiente, en las que el significado de la
causalidad no puede expresarse mediante enunciados contrafácticos. Si
C es suficiente para A, explica Elster, y necesario para B, el enunciado
contrafáctico de que «si A no hubiera ocurrido, B no habría ocurrido» es
verdadero, pero el causal de que «A causó B» es falso. La condición de
no necesario surge de la posibilidad de causación precedente. Si C no
hubiera producido B en caso de estar A ausente, el enunciado causal si
gue siendo válido, pero el contrafáctico es falso. No obstante, y como
nos recuerdan King, Keohane y Verba (2000: 246-247), Elster no hace
más que mencionar problemas habituales de las inferencias que, en cier
ta medida, son siempre inciertas. El propio Elster (2000: 37) reconoce
que los enunciados contrafácticos tienen una función importante en el
análisis causal. De ahí que su argumento, como concluyen King, Keoha
ne y Verba, sea más convincente si se considera como un conjunto de
valiosas advertencias contra la utilización descuidada de los contrafácti
cos que como una crítica a su uso.
4 Véase también Weber (1949).
5 Desde luego, este presupuesto es falso, pero resulta útil para simpli
ficar la discusión.
Capítulo 3
1 El apartado 7 de este ensayo se dedica precisamente a estudiar en qué
condiciones el término de azar de un modelo pierde esta condición.
2 Y no sería extraño que las circunscripciones elegidas para que Az-
nar dé los mítines sean aquellas en las que el PP tiene más seguidores.
Capítulo 5
1 Se podría añadir un tercer supuesto, que King, Keohane y Verba
(2000) plantean menos explícitamente, y que se conoce como la inde
pendencia de las observaciones, esto es, que el valor de una variable
determinada no está influido por el valor en otra observación. La per
turbación aleatoria de una observación no debe influir así en la pertur
bación aleatoria de otra observación. Este supuesto, que en el análisis
de regresión se conoce como no autocorrelación, es importante en los
estudios longitudinales, pero prescindible en los que sólo contemplan
un punto en el tiempo o de sección cruzada. De todos modos, en la
medida en que no invalida las inferencias causales, sino que simple
mente las hace menos precisas, es menos importante que los otros
dos. Para un revisión de este problema, puede verse Gujarati (1997:
cap. 12).
2 Con mayor precisión, el valor esperado no se refiere al valor que
uno debería anticipar para cada caso analizado, sino al valor medio en
distintas réplicas hipotéticas de cada caso. Recordemos que el azar im
porta en la definición de los valores de la variable dependiente.
3 Para un repaso sencillo de los problemas inferenciales en el análisis
de regresión, puede verse Gujarati (1997: cap. 8).
4 En realidad, cuando se manejan datos reales, los investigadores no
tienen la capacidad de asignar casos a los grupos de tratamiento y con
trol. La asignación tiene lugar efectivamente, pero son los propios proce
sos sociales y políticos los que la realizan. Y los investigadores no sue
len tener control sobre ellos.
5 Sobre los fundamentos sustantivos de este ejemplo, puede verse
Colomer (2003).
Capítulo 6
1 Véase en este sentido los recientes trabajos de Brady y Collier (2004)
y Johnson (2006), cuya crítica a King y Keohane y Verba (2000) se plan
tea precisamente en estos términos.
2 Por supuesto, estas modalidades de explicación no son las únicas
que existen, aunque sí las más populares. Elster (2000) distingue tam
bién..la^ex^icaciónfuncional, basada en el supuesto de que todos los fe
nómenos sociales y psicológicos deben tener un significado, es decir,
debe haber algún sentido, alguna perspectiva en la que son beneficiosos
para alguien o algo; y que además estos efectos beneficiosos son los que
explican el fenómeno estudiado. Y Bunge (1997) añade la explicación
interpretativa, centrada en el sentido, significado o intención de una ac
ción.
3 En los estudios cualitativos con pocas observaciones y escasas va
riables enjuego se lleva a cabo efectivamente esta descomposición. Pero
no en los cuantitativos, puesto que existen técnicas estadísticas, en par
ticular, la regresión, que permiten controlar simultáneamente todas las
variables independientes.
4 Es también cierto que Duverger (1992 [1950], 38 ss., y 1987
[1951], 235 ss.) señala dos razones teóricas para justificar la eliminación
por la regla mayoritaria de los terceros partidos: el «efecto mecánico» de
infraiTepresentación de los partidos mayoritarios y el «psicológico» de los
votantes que no desean desperdiciar sus votos. Pero de nuevo están
ausentes los microfúndamentos o las condiciones teóricas e instituciona
les bajo las cuales se alcanzan estos resultados.
5 Funcionalismo puede tener connotaciones negativas para algunos
lectores. Para una aclaración de su significado en la obra de Merton pue
de verse Mahner y Bunge (2001).
6 Para una revisión crítica puede verse Mahoney (2003).
7 Esta contraposición simplifica mucho la discusión. Para un análisis
preciso y riguroso de la relación entre las dimensiones identitaria y elec
tiva del comportamiento político, puede verse el reciente libro de Agui-
lar y Chuliá (2007), en particular los capítulos ¿ y ¿.
8 Véase también King, Keoahne y Verba (2000: 96-98).
Capítulo 7
1 En Dougherty (2002: 197-199) se puede encontrar una discusión en
términos formales del problema.
2 Pero, como cualquier regla empírica, hay que tomarla con cautela.
Es posible que una multicolinealidad grave no se refleje en una correla
ción bivariada; una variable independiente puede ser una combinación
de varias variables independientes en el modelo y, por tanto, su correla
ción individual con cada una de ellas sea baja.
Glosario
I
Hipótesis nula: Es la hipótesis que se quiere rechazar en una investigación y que
normalmente postula que no existe ninguna relación entre dos variables.
Cuando se rechaza, se hace para aceptar la hipótesis alternativa.
Inferencia: El proceso de usar los datos para extraer conclusiones más amplias
sobre conceptos e hipótesis que son el objeto de la investigación.
Inferencia causal: El proceso de conseguir conclusiones sobre la causalidad de
acuerdo con los datos observados.
¡ Inferencia descriptiva: El proceso de conseguir conclusiones descriptivas de
¡ acuerdo con los datos observados.
117
Observación: Los valores de las variables para cada unidad de análisis.
¡ Operacionalización: La transformación de las hipótesis teóricas en operaciones
de investigación empírica.
Lj: lécriea da la explicación &n Las tie n d a s saciaifes
124
^ie$^S^-SK^»^«Síi¡6^^1iXtii5e$^s5S^Í^Glk-tiUSiv«i^®^SaSiMi&íS6^SSeS7«S<E5E8®S»Si9asi
Miller, Richard W. (1987): Fací and Method: Explanation, Confirmation, and Re-
ality in the Natural and the Social Sciences. Princeton: Princeton University
Press.
Montero, José Ramón, e Ignacio Lago (2005): «La investigación sobre los siste
mas electorales: cinco debates y una selección de artículos». Zona Abierta
110-111: 1-35.
Morales, Laura (1999): «Participación política en España: un análisis de las dife
rencias de género». En Género y ciudadanía. Revisiones desde el ámbito p ri
vado, eds. Margarita Ortega, Cristina Sánchez y Celia Valiente. Madrid: Insti
tuto Universitario de Estudios de la Mujer/ Universidad Autónoma de Madrid.
Munck, Gerardo L. (2004): «Tools for Qualitative Research». En Rethinking So
cial Inquiry. Diverse Tools, Shared Standards, eds. Henry E. Brady y David
Collier. Oxford: Rowman & Littlefield Publishers, lnc.
Pearl, Judea (2000): Causality: Models, Reasoning, and Inference. Cambridge,
MA: Harvard University Press.
Pearson, Karl (1892): The Grammar o f Science. Londres: J. M. Dent & Sons.
JBickül, Andrcas-.(2004): «Systems and Mechanisms. A Symposium on Mario’s
Bunge Philosophy of Social Science». Philosophy o f the Social Sciences 34:
169-181.
Pierson, Paul (2000): «Increasing Returns, Path Dependence, and the Study of
Politics». American Political Science Review 94: 251-267.
Polavieja, Javier G. (2005): «Desregulación parcial y desigualdad horizontal en
España». Revista Internacional de Sociología 41: 9-36.
Popper, Karl R. (1969): Conjectures and Refutations. Londres: Routledge and Ke-
gan Paul.
— (1997): E l mito del marco común. En defensa de la ciencia y la racionalidad.
Barcelona: Paidós.
Przeworski, Adam, y Henry Teune (1970): The Logic o f Comparativa Social In
quiry. Nueva York: Wiley.
Putnam, Robert D. (1993): Making democracy work. Civic traditions in modern
Italy. Princeton: Princeton University Press.
Rogowski, Ronald (2004): «How Inference in the Social (but Not in the Physical)
Sciences Neglects Theoretical Anomaly». En Rethinking Social Inquiry. D i
verse Tools, Shared Standards, eds. Henry E. Brady y David Collier. Oxford:
Rowman & Littlefield Publishers, lnc.
Salmón, Wesley (1989): Four Decades o f Scientific Explanation. Minneapolis:
University of Minnesota.
Sartori, Giovanni, y Leonado Morlino (1994): La comparación en las ciencias so
ciales. Madrid: Alianza Editorial.
Schelling, Thomas C. (1960): The Strategy o f Conflict. Harvard: Harvard Univer
sity Press.
— (1989): Micromotivos y macroconducta. México: Fondo de Cultura Económica.
La lógica s e la explicación en las ciencias so ciales