Sunteți pe pagina 1din 12

249

10. La ordenadn y el anlisis de los datos


248

Introduccin a los mtodos de la sociologa emprica

cipal fuente de fallos, una deficiencia relativamente elevada en la


codificacin puede ser la consecuencia de instrucciones no lo suficientemente precisas; sobre todo, de una definicin y delimitacin
impre~isas de las diversas categoras. Los fallos de esta clase pueden
reducIrse a posteriori mediante una precisin de las instrucciones
de codificacin y recodificacin de cada una de las preguntas.
En el recuento bsico se averiguan, en primer trmino las distribuciones simples de frecuencias para todas las dimensiones inc!uidas en la investigacin. A efectos de la clasificacin pluridimensIOnal de los datos se han de desarrollar procedimientos de recuento
en consonancia con los planteamientos de la investigacin. Estos inclican qu variables han de correlacionarse. Los resultados del recuento se anotan en tablas vacas elaboradas previamente siempre
que la mquina no indique por s misma los resultados. La interpretacin verbal de una tabla es ms fcil si se transforman las
cifras absolutas en porcentajes, que se calculan en la direccin de
l~ variable independiente (entre otras razones, porque se la consldera presunto factor causal). Una vez que se ha anotado a la variable independiente en la cabeza de la tabla (arriba) los porcentajes
habrn de referirse a las sumas marginales inferiores, esto es, completar ~l 100 por 100 hacia abajo. Pero si la variable independiente ha SIdo anotada a un lado (a la izquierda), los porcentajes habrn
de sumar el 100 por 100 hacia la derecha 1.
Describiremos ahora algunos procedimientos de evaluacin de
datos ya elaborados (codificados, recontados y tabulados). Prescindiremos del problema de la validez, ya discutido en captulos precedentes y que sigue siendo, de todas maneras, un problema bsico, sobre todo para la interpretacin de los resultados de investigaciones
empricas. Cuanto ms dudosa sea la validez de los datos, tanto menor sentido tendr la aplicacin de refinados procedimientos de evaluacin. El nivel de medicin de los datos cndiciona la naturaleza
de su evaluacin. Si los datos fueron medidos a nivel nominal u
ordinal -algo muy frecuente-, se ha de emplear el anlisis de
tablas, al que nos referiremos en el apartado siguiente. Naturalmente, el anlisis de tablas puede aplicarse igualmente a datos medidos
a nivel de nmeros racionales o cardinales (escalas racionales o
de intervalo), aunque en estos casos se perdera informacin. Este
inconveniente se evita con ayuda del anlisis de regresin, que slo
puede manejarse para dimensiones medidas cardinal o racionalmente.
Haremos referencia sumaria del mismo en este captulo. En el es1 Buenos ejen:p10s para correcta y equivocada formulacin de porcentajes
los da H. 2eisel, Say it with Figures, Nueva York, 1957, captulos 1 y 2.

tudio de relaciones entre datos no cuantitativos (nominales u ordinales) y cuantitativos se recurre al anlisis de tablas o, cuando la
variable medida cuantitativamente es la variable dependiente, al
anlisis de variancia, examinado en el captulo 9.
2.

Anlisis de tablas

La forma ms sencilla de tabla es la distribucin unidimensional


de frecuencia, que proporciona datos meramente descriptivos. Si los
datos se obtuvieron por muestreo se puede: 1) averiguar el intervalo
de confianza, y 2) comprobar la significacin de los resultados
(vid. captulo 3). Con ello se establece exclusivamente en qu medida la distribucin de frecuencias en la muestra refleja la verdadera distribucin de valores de las propiedades en el universo. Por
el contrario, para es.tablecer relaciones entre variables es preciso
confeccionar y analizar tablas pluridimensionales.
a) Relaciones causales.-Como se expuso en el captulo precedente, nicamente datos obtenidos por va experimental permiten,
en sentido estricto, inferir nexos causales. A partir de una relacin
empricamente establecida entre dos o ms variables, slo en base
a ciertos supuestos tericos se podr comprobar cul de ellas es la
variable dependiente y cul la independiente.
Sin adentrarnos en la problemtica de la teora de la ciencia relacionada con el concepto de causalidad 2, entenderemos aqu por
relacin causal (como ya indicamos en el captulo anterior, vid. pgina 221) una relacin de' efectos asimtrica.
Hemos de distinguir tres formas fundamentales de relaciones causales:
I

1) Monocausal: X determina a Y. Grficamente: X --.,. Y.


2) Pluricausal: X e Y determinan a Z. Grficamente:

2 Se puede observar una exposicin de las diferentes concepdones en torno


a la causalidad en E. Nagel, The Structure of 5cience, Londres, 1961, captulo 10.

250

Introduccin a los mtodos de la sodologa emprica

3) La cadena causal: X determina a Y, e Y determina a Z.


Grficamente: X ~ Y ~ Z. Y recibe en esta ordenacin la denominacin de variable interviniente.
Una relacin monocausal puede averiguarse con ayuda de una
tabla bidimensional. Una relacin pluricausal con dos variables independientes y una cadena causal con tres miembros pueden expresarse por medio de una tabla tridimensional. Ms adelante se expondr el procedimiento.
na reaccin causal es de naturaleza determinista cuando pueda
establecerse la siguiente ordenacin: (l) La variable X produce Y:
Grficamente: X ~ Y. (2) Si no se presenta la variable X tampoco
existe Y: Grficamente: ~ X ~ ~ Y (~ = signo de negacin).
Si se dan (1) Y (2), X es la causa determinista de Y
Si la variable Z es producida conjuntamente por dos variables
independientes, X e Y, podr establecerse la siguiente ordenacin:
( 1) X e Y ~ Z, (2) ~ X pero Y ~ ~ Z, (3) X pero ~ Y ~ ~ Z 3.
Por ejemplo: En caso de un alto nivel de aspiraciones, el fracaso
genera insatisfaccin. Ms brevemente: Fracaso (= X) y nivel de
aspiraciones elevado (= Y) generan insatisfaccin (= Z). Si falta una
de las dos variables independientes, el fracaso o el nivel elevado
de aspiraciones, no se producir insatisfaccin.
Cuando el investigador no conoce la segunda variable independiente -en el ejemplo: el nivel de aspiracin- y slo contempla
la relacin entre X, el fracaso, y Z, la insatisfaccin, observar, pongamos por caso, que, en un determinado nmero de encuestados testigos del fracaso, 70 por 100 estn insatisfechos y 30 por 100 satisfechos. El fracaso, pues, slo produce la insatisfaccin con una
probabilidad del 70 por 100 (p
0,7). Esta es una relacin causal
estocstica. En el ejemplo, la probabilidad de que surja la insatisfaccin est determinada por la probabilidad con la que el fracaso
acompaa al elevado nivel de aspiraciones. De los encuestados que
haban tenido un fracaso el 70 por 100 tena un nivel elevado de
aspiraciones, frente al 30 por 100 restante. Estas circunstancias son
muy de tenerse en cuenta por el investigador social.
Una relacin entre dos o ms variables aparece como estocstica
cuando no incluye en su investigacin todas las variables independientes implicadas. Ante una relacin estocstica, el investigador
habr de reflexionar qu factores causales adicionales ha pasado por
alto e incluirlos en el complejo factorial. Si ha encontrado los factores causales verdaderos, podr pronosticar el efecto Z con mayor

3 Vid. al respecto la exposicin de R. L. Ackoff, Scientilic Metbod, Nueva


York, 1962, pgs. 16 y ss.

10. La ordenacin y el anlisis de los datos

251

probabilidad (mayor p) que hasta entonces. El objetivo de alcanzar


un 100 por 100 de probabilidad, esto es, descubrir una relacin determinista, slo se logra en casos excepcionales; sin embargo, no
debe descartarse una buena aproximacin.
Este proceder est presidido por la creencia de que el mundo
est determinado, por ms que no consigamos demostrar completamente esta determinacin. A esta concepcin de la relacin estocstica se le opone otra segn la cual una relacin estocstica no es
consecuencia de la incapacidad de descubrir otros factores adicionales, sino que est fundamentada en la naturaleza del objeto. En este
sentido, no sera posible transformar las relaciones estocsticas en
relaciones deterministas. En estas pginas no podemos hacer ms
que aludir a esta discusin, que ha tenido lugar sobre todo en el
campo de la fsica ,1.
b) El descubrimiento de relaciones monocausales en tablas bidimensionales.-Supongamos que en una investigacin realizada entre empleados se ha descubierto que el 60 por 100 de ellos poseen
un intenso, y el 40 por 100, un dbil sentimiento de impotencia social
(sentirse abandonados a las decisiones de otras personas). Sospechamos que el sentimiento de impotencia de los empleados guarda
relacin, en cuanto a su intensidad, con la carrera profesional, de
manera que quienes desde hace tiempo no han tenido ningn ascenso poseen un intenso sentimiento de impotencia, mientras que quienes han ascendido recientemente lo poseen en grado escaso. Esta
hiptesis se puede comprobar en una tabla bidimensional (grabado 3).
La tabla hay que leerla de la manera siguiente: 400 empleados con
un intenso sentimiento de impotencia no han tenido ningn ascenso
desde hace mucho tiempo; 200 que ... , etc. Se impone ahora la
siguiente pregunta: Permite esta tabla confirmar la hiptesis formulada anteriormente?
La anterior pregunta puede contestarse con ayuda de tres procedimien tos diferentes:

1) Averiguacin de si en la tabla se da o no un cruzamiento.


2) Prueba de significacin estadstica.
3) Clculo de un coeficiente de correlacin.
El primer procedimiento es ptico; los otros dos, de clculo.
1 Observaciones detalladas sobre este tema se encuentran en E. Nagel, The
Structure 01 Science, op. cit., captulo 10.

252

Introduccin a los mtodos de la sociologa emprica

Hace ya tiempo que no ha experimentado


ningn ascenso profesional

1--

. rn'ol~~
Sentimiento de impotencia

253

10. La ordenacin y el anlisis de los datos

y cuando los valores numricos de la tabla difieren muy poco


entre s.
El test de significacin: A la tabla 3 se le puede aplicar muy
bien una prueba de ji-cuadradq. La frmula es la siguiente:
ji-cuadrado

400*_~10_0-l-~5~0_0~

- - - 1 -. .

(fa -

Fa)2

Fa

+ ... +

(fb -

Fb)2

Fb

(fk-Fk?
Fk

(1)

siendo:

Ascendido recientemente

200

300

500

~~~~~~-~-~-~-~----+---r--S' . ~
600

400

I 1.000
1

GRABADO

fa, fb)
Fa) Fb)

, fk = Valor numrico del cuadro a) b) ... ) k.


, Fk = Valor esperado, esto es, valor numrico que se
dara en los cuadros a) b) ...) k si no existiera
ningn tipo de relacin entre las dos dimensiones
tabuladas.

El valor esperado se calcula segn la frmula:

3.-Tabla bidimensional.

Rk Sk
Fk=---

Cruzamiento: En una tabla de doble entrada se da un cruzamiento cuando los valores mayores de la primera y segunda columna, as
como los menores, se entrecruzan. En la tabla 3, dos flechas indican
ese cruzamiento, que puede interpretarse como sigue: La mayora
de quienes tienen un intenso sentimiento de impotencia hace ya
tiempo que no han ascendido profesionalmente. Y la mayora de
quienes tienen un dbil sentimiento de impotencia han tenido un
ascenso reciente. As, pues, este cruzamiento apunta a una relacin
qe, si se dispone de la correspondiente teora, puede ser interpretada como relacin causal.
El cruzamiento es un medio muy cmodo, pero imperfecto,
de descubrir relaciones causales. La plasticidad visual puede desaparecer tan pronto como una dimensin adopte ms de dos valores 5
5 En una tabla bidimensional cuyas dos dimensiones se encuentran divididas en ms de dos clases, pero ambas en el mismo nmero de clases, el
cruzamiento puede ser reconocido a travs de la circunstancia de que en una
de las diagonales de la tabla se encuentren las cifras mayores y en la otra
las pequeas, pero slo si ambas dimensiones son de naturaleza ordinal.

(2)

siendo:
Rk = Suma marginal de fila de k cuadros.
Sk = Suma marginal de columna de k cuadros.
N = Suma total de casos incluidos en la tabla.
Para el cuadro a de la tabla 3 el valor esperado es:

Fa

500 . 600 = 300


1.000

Aplicando la prueba de ji-cuadrado para la tabla 3 de acuerdo


con las anteriores frmulas (1) y (2), se obtiene el siguiente valor
de ji-cuadrado = 116,6. Para la interpretacin de este valor se han
de determinar los grados de libertad (smbolo: di = degree of
freedom ).

di =

(Nmero de las filas - 1) . (Nmero de las


columnas -1)

(3)

Introduccin a los mtodos de la sociologa emprica

254

De donde para la tabla 3 resulta:

df

= (2 -

1) . (2 -

1)

=1

Puede consultarse luego una tabla de ji-cuadrado en cualquier


manual de estadstica 6. Con un grado de libertad y un valor
ji-cuadrado = 116,6, el nivel de seguridad alcanza un valor del 99,9
por 100 7 La interpretacin verbal de este resultado puede expresarse as: Existe una probabilidad del 99,9 por 100 de que las dimensiones reunidas en la tabla 3 se encuentren en relacin.
Ms exactamente: la hiptesis nula de que en la tabla 3 no
se da ninguna relacin, sino slo una distribucin aleatoria de los
valores numricos (expresados por los valores esperados Fa, ... , Fd)
puede ser rechazada con un 99,9 por 100 de seguridad.
La prueba ji-cuadrado ha puesto, pues, de manifiesto una covariancia de las dos dimensiones, pero no puede determinar si la misma
haya de interpretarse como una relacin causal. Esto slo lo puede,
como ya se dijo, la teora de la que, explcita o implcitamente, dispone el investigador social.
El coeficiente de correlacin; El tercer procedimiento que hay
para determinar la existencia de una relacin se refiere al clculo de
un coeficiente de correlacin. Este coeficiente da informacin sobre
la intensidad de la relacin, mientras que la prueba de significacin lo hace sobre la seguridad de la relacin. La prueba de significacin indica con qu seguridad puede afirmar el investigador la existencia de relacin. El coeficiente indica en qu medida guardan una
relacin mutua las dimensiones (sin dar informacin sobre la seguridad con que cabe afirmar tal relacin) 8.
Hay una amplia serie de coeficientes de correlacin. Cada uno
de ellos debe aplicarse exclusivamente bajo muy determinadas condiciones. A continuacin aparece una lista de los coeficientes de
correlacin ms usuales -sin recurrir a las frmulas (en parte, com6 Vid. entre otros H. M. Blalock, Social Statistics, Nueva York, 1960, pgina 452.
7 En la tabla de ji-cuadrado con df = 1, por lo general se encuentra 10,8
como valor mximo. En este valor se da un nivel de seguridad del 99,9 por 100.
Puesto que el valor ji-cuadrado para la tabla 3 es 116,6, en este caso el
nivel de seguridad ha de ser de por lo menos el 99,9 por 100. Las tablas de
ji-cuadrado normales (tales como las que figuran en los manuales) no van,
sin embargo, ms all de un nivel de seguridad del 99,9 por 100.
s De todas maneras no es que el coeficiente de correlacin y la significacin sean independientes. El valor de ji-cuadrado, por ejemplo, va incluido
en la frmula de diversos coeficientes de correlacin (por ejemplo, en el coeficiente de contingencia C).

255

10. La ordenacin y el anlisis de los datos

plicadas) de cada uno de ellos-, que pueden consultarse en un


manual de estadstica.
Denominacin del
coeficiente
de correlacin

Condiciones de aplicacin

(1) Coeficiente de
contingencia (C).
(2) ).. (lambda).

Ambas dimensiones han de


ser nominales y pueden adoptar
tantos valores como se quiera.

Peatman, p. 136.
Zeldtich, p. 176.

Coeficiente phi q>.

Ambas dimensiones han de ser


nominales y estar dicotomizadas,
esto es: adoptando dos valores
(tabla de doble entrada).

Peatman, p. 135.

( 1) Coeficiente de co-

Ambas dimensiones han de ser


ordinilles, pudiendo adoptar muchos valores.

Siegel, pp. 202 Y ss.,


213 y ss., 229 y ss.

Correlacin eta.

Una dimensin ha de ser nominal y adoptar ms de dos valores; la otra ha de ser racional
y adoptar varios valores.

Peatman, p. 132.

Correlacin punto
biseriaL

Una dimensin ha de ser nominal y estar dicotomizada; la


otra ha de ser racional y adoptar diversos valores.

Peatman, p. 143.

Correlacin biseriaL

Una dimensin ha de ser racional y estar dicotomizada; la


otra ha de ser racional y adoptar diversos valores.

Peatman, p. 126.

Correlacin triseriaL

Una dimensin ha de ser racional y tricotmica; la otra, racional y adoptar diferentes valores.

Peatman, p. 128.

Correlacin tetracrIca.

Ambas dimensiones son racionales y estn dicotomizadas (tabla de doble

Peatman, p. 130.

Coeficiente de correlacin producto-momento de Pearsons.

Ambas dimensiones son racionales y adoptan diversos valores.

Peatman, p. 93.

relacin de rangos de Spearman.


(2) Coeficiente 't'
(tau) de Kendall.
(3) Coeficiente de
concordancia ( w )
de Kendall.
(4) Y (gamma).

La frmula se puede
encontrar, p. ej., en 9

9.1. G. Peatman, I~ttroduction to Applied Statistics, Nueva York, 1968'


S. Slege1, Nonparametrzc Statistics for the Behavioral Sciences, Nueva York,
1956; M. Ze1ditch, jr., Sociological Statistics, Nueva York, 1959.

.~.

256

Introduccin a los mtodos de la sociologa emprica

No existen coeficientes de correlacin para cada combinacin


de datos de distintos niveles de medicin. En tales casos, la dimensin de mayor valor ha de rebajarse al nivel de la otra variable
dentro de la relacin investigada. El orden que ha de seguirse en
esa reduccin es el siguiente: racional ~ ordinal ~ nominal.
La formulacin verbal de los resultados sigue al descubrimiento,
con una determinada seguridad, de la correlacin, ms o menos
fuerte, de las dimensiones de la tabla. En adecuacin a los objetivos
perseguidos, no se trabaja con valores ~bsolutos, sino con tantos
por ciento. En la formulacin de los resultados se expresa adems
cul de las dos variables se considera independiente y cul como
dependiente. En la interpretacin de la tabla 3 podra, pues, hacerse
la siguiente formulacin: la mayor.a (80 por 100) de los empleados
que desde hace mucho tiempo no han ascendido profesionalmente
poseen un intenso sentimiento de impotencia, mientras que la mayora (60 por 100) de quienes han experimentado recientemente
un ascenso posee un dbil sentimiento de impotencia (y, anlogamente, en lo que se refiere a los dos cuadros restantes de la tabla,
b y c). Puesto que aqu se trata de una relacin estocstica, el mismo
resultado podra tambin ser expresado de la siguiente manera: Si
hace tiempo que no han ascendido profesionalmente, los empleados
tendrn un sentimiento de impotencia intenso, con una probabilidad p = 0,8 (80 por 100 de probabilidad), mientras que si han
ascendido recientemente su sentimiento de impotencia ser dbil,
con una probabilidad p
0,6 (60 por 100 de probabilidad). La
estructura general de una relacin causal estocstica entre dos variables se puede expresar en los siguientes trminos: Para todas las
unidades de una determinada clase vale que si X adopta un valor Xl,
y adoptar, con una determinada probabilidad (p), un valor Y;
con otra determinada probabilidad (P2), un valor Y2 .( etc., hasta Yn),
y que si X adopta un valor X2, Y adoptar, con una probabilidad ...
(como anteriormente, y as hasta llegar a Xn ).

Ejercicios

Responder a las seis preguntas siguientes, relacionadas con las


tablas que figuran a continuacin:
1) Cul es el factor independiente y cul el dependiente?
2) En qu direccin se han de calcular los tantos por ciento?
Situar 100 por 100 en la tabla.
3) Es posible establecer un cruzamiento en la tabla?
4) Calcular la significacin de la relacin (prueba de ji-cuadrado).

257

10. La ordenacin y el anlisis de los datos

5) Qu coeficiente se ha de emplear para el clculo de la medida de la relacin?


6) Interpretar la relacin establecida en trminos estocsticos.
Tabla 1
Mtodo de educacin
empleado por los padres

Exito profesional de los hijos

Autoritario

Liberal

Bueno

lOO

300

Malo

200

200

Tabla 2
Grado de satisfaccin
laboral
Bajo
Salario del trabajador (en DM)

Normal Elevado

Menos de 500

100

100

50

501-700

100

150

100

701-900

50

100

100

Ms de 900

10

20

50

c) La tabla tridimensional.-No pocas veces albergar el investigador la sospecha de que el nexo hallado por medio de la tabla
bidimensional no corresponde a ninguna relacin monocausal. Es
posible que para el objeto investigado fuera ms adecuado el modelo
multicausal descrito en la pgina 251 o el modelo de cadena causal;
esto es, cabe aadir a la relacin bifactorial una tercera variable que
acte como segunda variable independiente o como variable intervi
niente. Cabe tambin la posibilidad de que la relacin encontrada
en la tabla bidimensional sea engaosa, que se trate de una correlacin esprea 9a. En cualquier caso, ser muy razonable introducir una
9a El trmino de correlacin esprea es algo desafortunado porque ambas
variables guardan una relacin que no es slo aparente, sino tambin Hctica.
Aparente lo es slo la posibilidad de una interpretacin. causal brindada por
una relacin correlativa, pues en el caso de la correlacin aparente no se da
precisamente ninguna relacin causal.

Introduccin a los mtodos de la sociologa emprica

258

tercera variable en la tabla bidimensional, con lo que sta se convierte


en tridimensional. Esta variable es denominada habitualmente variable de prueba, debiendo comprobar si la relacin bifactorial encontrada es autntica, esprea o insuficiente (insuficiente, porque en
realidad acta otra variable, ya sea adicionalmente, corno variable independiente o corno variable interviniente). Corno variables de prueba
pueden introducirse todas las dems dimensiones consideradas en la
investigacin. Claro est, es una tarea cuyo dominio requiere un
computador siempre que se trate de un elevado nmero de variables.
Ahora bien, habr muchas variables que ya a priori, en virtud de
consideraciones de ndole terica, aparezcan corno irrelevantes para
la relacin en cuestin, de manera que el investigador se puede limitar a unas pocas variables de test consideradas corno relevantes.
Mediante la introduccin de variables de prueba pueden formarse cinco configuraciones de varillbles:
1) Correlacin esprea: La variable de prueba descubre que
las dos variables originarias slo guardan una relacin aparente.
2) Intervencin: La variable de prueba se introduce en calidad
de variable interviniente entre las dos variables originarias.

3) Multicausalidad: La variable de prueba se convierte en una


segunda variable independiente.
4) Confirmacin: Mediante la introduccin de variables de
prueba no se puede demostrar ni correlacin aparente, ni intervencin, ni multicausalidad. La variable introducida ha confirmado,
pues, la relacin monocausal originaria. Ahora bien, puede ocurrir
que otra variable, introducida a fines de comprobacin, evidencie
corno correlacin aparente o intervencin la relacin monocausal originaria. Una confirmacin es, pues, algo muy relativo.
5) Aparente no-correlacin: En la tabla bidimensional originaria no se puede descubrir ninguna relacin. Tras la introduccin de
una variable de prueba se averigua una relacin multicausal.
En 10 sucesivo examinaremos, una tras otra, esas cinco posi.
bilidades.
Correlacin esprea: Lazarsfeld lO ofrece el siguiente ejemplo ilustrativo: Cuanto mayor sea el nmero de vehculos de bomberos
presentes en un incendio, tanto mayor sern los daos. En realidad,
es la amplitud del fuego la que determina tanto el nmero de
Lazarsfeld, Evidence and Inference in Social Research, en: D. Ler
ner, Evidence and Inlerence, pg. 129.
10

259

10. La ordenacin y el anlisis de los datos

vehculos de bomberos que acuden corno la amplitud de los daos.


La estructura de la correlacin esprea se representa grficamente
en el grabado 4.

GRABADO

4.-CorreLacin esprea.

Explicacin de smbolos:
X
= Variable independiente originaria, esto es: variable que fue considerada
como independiente en la tabla bidimensional originaria.
y
= Variable dependiente originaria.
t
= Variable de test.
~ = Relacin casual.
- - - - = Correlacin.

La correlacin entre X e Y, establecida en la tabla bidimensional originaria, no responde a ninguna relacin causal, sino que fue
producida por la repercusin de t sobre X e Y. La correlacin aparente descansa, pues, sobre el siguiente principio: Una variacin en t
provoca variaciones tanto en X corno en Y. Por esta razn, X e Y
covaran sin que exista una relacin causal entre ellas. En base al
siguiente ejemplo se muestra cmo cabe descubrir una correlacin
aparente.
Salud mental 11
Mala
Buena
Actitud ante

Negativa

450

400

850

la empresa

Positiva

400

900

1.300

850

1.300

2.150

GRABADO

5.

11 Con respecto al desarrollo de una escala de salud mental vid. T. S. Langner, S. T. Michael, Lile Stress and Mental Realth, The Free Press of Glencoe,
Londres, 1963, pgs. 42 y 43.

Introduccin a los mtodos de la sociologa emprica

260

En la tabla 5 se puede constatar incluso pticamente una relacin entre la salud mental de los trabajadores y su actitud ante la
empresa. Existe un cruzamiento. La comprobacin de la significacin de la relacin es: ji-cuadrado = 105. Por tanto, cabe afirmar
la relacin con una seguridad de 99,9 por 100. Al calcular la correlacin (correlacin tetracnica) se obtiene rt 0,35 12. Como variable de prueba se introduce ahora la satisfaccin laboral (grabado 6), de manera que, en su doble valoracin de mala y buena,
se combinen entre s las variables originarias (en este caso, salud
mental y actitud ante la empresa), respectivamente. De esta manera
se mantiene constante la variable de prueba en cada uno de sus
dos valores.

al

Satisfaccin laboral

1) La situacin de partida es una tabla bidimensional para


X e Y, en la que se estableci una correlacin significativa.
2)

Se introduce una variable de prueba t.

3)

Se mantiene constante la variable de prueba.

[XV; td = 0, [XY; t2] = 0, ... [XY; tu] """" O

Buena
salud mental

Mala

Buena

Mala

Buena

Actitud ante

Negativa

400

200

50

200

la empresa

Positiva

200

100

200

800

GRABADO

de prueba adopta ms de dos valores, aparecern, en consecuencia,


ms tablas parciales y ms coeficientes de correlacin iguales o prximos a cero. Si atribuimos a los valores de la variable de test
los smbolos tI, t2 ... tn, y a la correlacin condicionada entre X 'e Y
bajo uno de estos valores, el smbolo [XV; tI], etc., se podra decir,
resumidamente:

4) Las correlaciones condicionadas deben ser iguales o prXImas a cero:

b)

Mala
salud mental

261

10. La ordenacin y el anliJis de los datos

6.

Del princlplO de la correlacin esprea anteriormente expuesto


se sigue que en X e Y no puede aparecer ninguna vanaClOn si se
mantiene constante la variable t o su condicionante. Tampoco se
puede constatar entonces ninguna correlacin de X e Y. En el ejemplo aqu utilizado se observaran, por lo tanto, coeficientes de correlacin iguales o prximos a cero en las dos tablas parciales 6a)
y 6b), como realmente ocurre en este caso. Ambos coeficientes de
correlacin reciben la denominacin de coeficientes de correlacin
condicionados.
El ejemplo aqu expuesto es muy sencillo. La tcnica para descubrir una correlacin esprea sigue siendo la misma aun en el caso
de que las tres variables adopten ms de dos valores. Si la variable
12 Aqu se supone que la actitud y la salud se miden por medio de una
escala racional.

o, en su caso, un test de significacin ha de confirmar la hiptesis nula para cada una de las tablas parciales.
Con ello no se cuenta todava con ningn indicio seguro de
la existencia de una correlacin esprea. Ha de darse un quinto y
decisivo paso, que explicaremos a continuacin del apartado siguiente.
La intervencin: La estructura de la intervencin puede representarse grficamente de la siguiente manera:

-----------

0--+ Qr----..:
-0
_--"

'"'---_...-'

,../........

.........

/'

El principio de intervencin es el siguiente: Una variacin en X


provoca una variacin en t, que, a su vez, ocasiona una variacin
en y. As, pues, X e Y cavaran, dando lugar a una correlacin
significativa en la tabla bidimensional de X e Y, que, no obstante,
no responde a ninguna relacin causal inmediata.
Mediante el anlisis estadstico y de tablas no puede estblecerse ninguna diferencia entre la correlacin esprea v la intervencin,
pues una y otra se presentan de la misma manera en ambos procedimientos analticos. Sin embargo, resulta difcil de apreciar

Introduccin a los mtodos de la sociologa emprica

262

cuando se da otra forma algo distinta a la representacin grfica de la


estructura de la intervencin;

263

10. La ordenacin y el anlss de los datos

Ahora bien, puede ser que el verdadero factor causal del absentismo sea la cantidad de trabajo domstico, que en la mayora
de las mujeres casadas (pero no en todas) es mayor que en la mayora de las solteras. La relacin sera, pues, la siguiente:

Estado civil ~ Trabajo en el hogar -+ Absentismo laboral


(bajo/alto)
(soltera/casada)
(poco/mucho)

La nica diferencia con respecto a la correlacin esprea reside


en la direccin de la flecha causal de X a t. Ahora bien, la direccin causal de una relacin no puede determinarse por medio
de anlisis estadstico, esto es, mediante correlaciones y clculos de
significacin. Por eso, la representacin de las intervenciones y de
las correlaciones aparentes en el anlisis estadstico es la misma.
Ofrecemos a continuacin un ejemplo 13 de intervencin. En un
estudio de sociologa industrial se constat la existencia de una relacin entre el estado civil de las trabajadoras (= variable X) y la
frecuencia de su absentismo (= variable Y), en el sentido de que
las mujeres casadas faltaban al trabajo con ms frecuencia que las
solteras (grabado 7).
Estado civil
Soltera

GRABADO

Trabajo en el hogar

Casada

1.000

600

1.600

Alto

600

1.000

1.600

1.600

1.600

3.200

7.

i: El ejemplo, en forma algo modificada, est tomado de H. Zese1, Prob1eme der Aufschlsse1ung, en: R. Kong (ed.), Das Interview, Co10na, 1957,
pgna 305.

b)

a)

Poco

Mucho

Estado civil

Estado cvil

'ioltera

Casada

Soltera

Casada

Bajo

900

300

100

300

Alto

300

100

300

900

Absentismo laboral

Bajo
Absentismo

. De ser esto as, las mujeres con mucho trabajo en el hogar, haCiendo caso omiso del estado civil, deberan faltar al trabajo en la
fbrica con ms frecuencia que las mujeres con pocas faenas domsticas. La cantidad de stas es introducida como variable de prueba
mantenindola constante en sus dos valores poco y mucho. E~
amhas tablas parciales de la tabla tridimensional resultante (grabado 8) no debera aparecer ya ninguna covariancia entre estado civil
y ausencia al trabajo, puesto que entre ambas variables no existe
ninguna relacin inmediata. No resulta difcil percatarse de que ambas
correlaciones condicionadas, en la tabla 8, valen cero.

GRABADO

8.

Hasta aqu los pasos del anlisis son exactamente los mismos
que en el caso de la correlacin esprea. Tambin es el mismo el
indicio de los valores iguales o prximos a cero de las correlaciones condicionadas. En base a ese indicio tan slo se puede negar
la presencia de una relacin monocausal o multicausal inmediata,
pero no puede diferenciarse entre una correlacin esprea y una
intervencin. Esta diferenciacin es tarea propia de la teora del
investigador social, puesto que la direccin causal de la relacin entre

264

Introduccin a los mtodos de la sociologa emprica

y t no puede determinarse sin un experimento, y slo mediante


un anlisis estadstico. As, pues, a los pasos enunciados en la pgina 263 se ha de aadir un quinto:
5) La teora ha de decidir si la repercusin causal va de X a t
(intervencin) o de t a X (correlacin aparente).
Multicausalidad. El principio de multicausalidad es el siguiente:
la variable X provoca Y -pero no en exclusiva-o A ella se aade,
como una variable independiente adicional, t. Para la exposicin
subsiguiente imagnese el caso ms sencillo de multicausalidad, en
el que las dos variables independientes X y t actan aditivamente
sobre Y. Esta relacin puede representarse grficamente de la manera siguiente:

10. La ordenacin y el anlisis de los datos

265

tracrico). Se supone que en esta correlacin la satisfaccin profesional acta de variable independiente. Manifiestamente, la satisfaccin general depende tambin de otros factores. Un factor de esta
clase podra ser la satisfaccin con las relaciones primarias (familia,
crculo de amistades). Esta variable es introducida como variable t
de prueba (grabado 10). Las relaciones en ambas tablas parciales
son altamente significativas, los coeficientes de correlacin condicionados son r = 0,87 (tabla lOa) y r = 0,39 tabla 10b); correlacin tetracrica). Estos valores apuntan a una relacin multicausal
por las siguientes razones:
a)

b)

Satisfaccin con las relaciones primarias

Ejemplo: En una tabla bidimensional (grabado 9) se estableci


una relacin entre satisfaccin profesional (X) y satisfaccin general (Y).
Satisfaccin profesional
Pequea

Grande

Pequea

280

120

400

Grande

170

380

550

450

500

950

Satisfaccin general

GRABADO

9.

Para la tabla se averigu un valor ji-cuadrado de 140 (seguridad


del 99,9 por 100) y un coeficiente de correlacin de rt = 0,58 (te-

Grande

Satisfaccin
profesional

Satisfaccin
profesional

Pequea

Grande

Pequea

Grande

Pequea

no

20

150

100

Grande

30

120

140

260

Satisfaccin general

GRABADO

Pequea

10.

La relacin entre X e Y es perturbada por la simultnea


actuacin de t en la medida en que una variacin en t puede conducir a una variacin en Y, aun en el caso de ausencia de variacin
en X. Por ello la correlacin entre X e Y se hace menor de lo que
sera si se mantuviera constante t y se excluyera as una variacin
en Y condicionada por l. Si, por consiguiente, se mantiene t constante, como ocurre en la tabla 10, una de las dos correlaciones
condicionadas de X e Y ha de ser ms intensa que la tal bidimensional inicial. Los coeficientes de correlacin calculados para nuestro
ejemplo reflejan exactamente este caso.
A fin de averiguar la importancia relativa de las dos variables
independientes a efectos de la determinacin de Y, se comparan los
coeficientes de correlacin para la relacin entre X e Y y entre t e Y.
(Para poder calcular este ltimo ha de confeccionarse la correspondiente tabla bidimensional a partir de los datos de la tabla 10.)
Si el coeficiente de correlacin para XY es ms elevado que para
tY, X ser el factor relativamente ms fuerte (y viceversa).

Introduccin a los mtodos de la sociologa emprica

266

Si se introduce en XY una variable de prueba totalmente irrelevante (como el tamao del pie de los encuestados, pongamos por
caso) que no guarde vnculo alguno ni con Y ni con X, ninguna
de las correlaciones condicionadas de la tabla tridimensional ser
mayor que la correlacin entre X e Y. En este caso debe desecharse
el supuesto de una relacin multicausal.
En resumen: Cabe suponer una relacin multicausal cuando se
dan las siguientes condiciones 1:1:

La combinacin no aditiva aparece al investigador bajo dos


formas, de las que ofreceremos sendos ejemplos.
En una investigacin sobre los mtodos de educacin de los
padres se obtuvieron los siguientes resultados:

1) La combinacin aditiva, que ya ha sido examinada a


ttulo de ejemplo: Cada una de las variables independientes est
en situacin de actuar sobre la variable dependiente.
2) La combinacin no aditiva: Cada uno de los factores
slo puede actuar sobre la variable dependiente si se presenta conjuntamente con la otra variable independiente (o con las otras, en
su caso).
14

La explicacin de estos smbolos se encuentra en la pgina 263.

b) Padre

a) Madre

Grado
de autoritarismo

1) Ambas variables independientes, X y t, no guardan entre s


ninguna relacin: [Xt] = O.

2) Por lo menos una de las correlaciones condicionadas es (significativamente) mayor que la correlacin originaria entre X e Y:
[XV; ti] mayor que [XV].
Si ambas correlaciones, [XY ; ti] Y [XY] han de calcularse
por frmulas de correlacin diversas (entre otras razones, porque
t posea tal vez un nivel de medicin distinto al de _X e Y), las
mismas no seran ya comparables. La segunda condicin es la siguiente: Por lo menos dos de las diversas correlaciones condicionadas [XY; tJ ... [XY; t n ] han de registrar valores significativamente
diferentes.
El modelo de multicausalidad exige que las variables independientes no tengan relacin entre s; esto es, que no guarden correlacin. Ahora bien, sta se da con alguna frecuencia. En ese caso,
el investigador debe bien expresar claramente que la estructura
multicausal de la relacin investigada no es segura, o bien buscar
la causa de la correlacin entre X y t introduciendo ms variables.
En el caso de multicausalidad, dos o ms variables independientes repercuten, mediante su combinacin, en una variable der:endiente. El tipo de la combinacin puede ser diverso. Es pOSIble
distinguir los siguientes:

267

10. La ordenacin y el anlisis de los datos

Educacin por
medio de
GRABADO

Grado
de autoritarismo

Bajo

Alto

Bajo

Alto

Castigos corporales

10

50

50

50

Castigos no-corporales

60

40

30

30

11.

Si se considera a todos los padres en conjunto, puede apreciarse


una relacin de intensidad media entre su grado de autoritarismo
(variable independiente) y la aplicacin de castigos corporales (variable dependiente). Ahora bien, si se distingue entre los padres
por el sexo, resulta que esa relacin slo vale para las madres, pero
no para los padres. La correlacin condicionada en el grupo de las
madres es ms intensa que la relacin general entre autoritarismo y
mtodos de educacin, mientras que la correlacin condicionada en
el grupo de los padres es igual a cero.
La variable autoritarismo solamente puede actuar sobre la variable clase de educacin cuando aparece en conjuncin con un
valor determinado de la segunda variable independiente (sexo).
Un segundo ejemplo 15 se recoge en el grabado 12. En una ~r~
mera fase se clasific a los colleges americanos de manera bIdImensional segn: a) la intensidad de la presin poltica que sobre
ellos se haba ejercido en el perodo de McCarthy (variable independiente X), y b) la intensidad con la que la. direc~in de cada
uno de ellos apoy al cuerpo docente en su resIstencIa contra esa
presin (variable dependiente Y). Como puede apreciarse en el resumen del grabado 12, entre esas variables, consideradas por s sola~,
slo se da una dbil relacin. Ahora bien, tan pronto como se dIferenci a los colleges por su condicin de instituciones pblicas
o de instituciones privadas (segunda variable independiente t), se puso
15 El ejemplo procede del libro de P. F. Lazarsfeld y W. Thielens, The
Academic Mind, Glencoe, Ill., 1958, pg. 185.

268

Introduccin a los mtodos de la sociologa emprica

de manifiesto una clara relacin que discurra, en ambos subarupos, en direccin opuesta. As, pues, el respectivo valor de la v:riable t determina la direccin de la variacin de X en Y.
a)

La direccin
apoy
GRABADO

intensamente
dbilmente

Presin sobre

b) Presin sobre

los colleges pblicos

los colleges privados

intensa

intensa

dbil

dbil

10

11

10

12.

Las relaci~nes de esta clase revisten un inters terico especial


en cuanto que representan una especificacin de los factores que
en la formulacin de una relacin bidimensional caen habitualmente
?ajo la cl~sula de coeteris paribus. El descubrimiento de seme
Jantes relacIOnes supone una precisin del mbito de validez de los
enunciados generales. La mayora de las relaciones monocausales
(y un~ buena parte. de no-correlaciones aparentes) pueden serlo de
este tIpo en la medIda que no se haya demostrado su condicin de
correlacin esprea o intervencin.
La confirmacin: Una variable de prueba confirma la existencia
de relacin monocausal entre dos variables cuando su introduccin
no puede descubrir ni una correlacin esprea, ni una intervencin
ni una relacin multicausal. Por lo dems, la confirmacin slo e~
vlida en funcin de la variable particular introducida con finalidades
de comprobacin. Una confirmacin nunca puede, pues, ser completa,
puesto que no es posible introducir todos los factores con finalidades de comprobacin. Puede considerarse satisfactoria si se introdujeron sin xito todos aquellos factores que, segn la teora implcita
o explcita del investigador social, hubieran podido ejercer hipotticamente una influencia.
Se puede constatar una confirmacin con respecto a una
variable de prueba cuando -al contrario que en la correlacin
aparente y en la intervencin- los dos coeficientes condicionados
de correl.acin de .la tabla tridimensional no son iguales o prximos
a cero. SI no son Iguales a cero no ha de ocurrir tampoco -como en
la multicausalidad- que uno de los dos coeficientes de correlacin
condicionados sea mayor que la correlacin originaria [XY] o, en
su caso, que las correlaciones condicionadas sean desiguales entre s.

269

10. La ordenacin y el anlisis de los datos

Resumiendo: Se da una confirmacin en relacin con una variable de prueba si


1) las correlaciones condicionadas son mayores que cero, y
2) ninguna de ellas es mayor que la correlacin originaria [XY]
o, en su caso, todas las correlaciones condicionadas son
iguales 16.

La aparente no-correlacin: En muchas ocasiones el investigador


no puede, en un principio, demostrar en una tabla bidimensional, la
existencia de una correlaccin supuesta por consideraciones tericas.
Esta no-correlacin no debe significar, sin embargo, ninguna refutacin de su hiptesis, pues puede serlo slo aparente. La relacin de
hecho existente puede verse alterada por la actuacin de otro factor, de tal manera que no se manifieste en la tabla bidimensional.
Pero, si se mantuviera ese factor constante a base de introduci~lo
como variable de prueba, la relacin se hara manifiesta (correlacIOnes en las tablas parciales). A partir de la tabla 13 cabe construir
un ejemplo. Si se rene en una tabla bidimensional satisfaccin general y satisfaccin en las relaciones primarias resulta una correlacin muy prxima a cero. Ahora bien, si S introduce la satisfaccin
profesional como tercera variable y se la mantiene constante (vid.
grabado 13), se pone de manifiesto en las tablas parciales la relacin
buscada. A las consideraciones tericas del investigador corresponder
decidir qu variables de prueba hayan de introducirse en el intento de
descubrir el carcter meramente aparente de una no-correlacin.
b)

a)

Satisfaccin profesional
Grande

Pequea

Satisfaccin
con las relaciones
primarias
Pequea
Pequea
Satisfaccin general
Grande

130 L
30

Grande

Pequea

Grande

150

20

lOO

140

120

260

r = 0,50
GRABADO

Satisfaccin
con las relaciones
primarias

r = 0,32

13

16 En el caso de confirmacin ideal, todas las correlaciones parciales son


iguales a la correlacin originaria: [XY, tI] = [XY, t2] = ... = [XY. In] =

270

Introduccin a los mtodos de la sociologa emprica

Ejercicios
1) Calcular las correlaciones y las correlaciones condicionadas
para las tablas siguientes (*).
2) Determinar la estructura de la respectiva relacin factorial.
3) Interpretar verbalmente la relacin encontrada.
4) En caso de relacin multicausal, calcular la importancia relativa de las variables independientes.

Como tercera variable se introduce la procedencia social del escolar (se compuso el ndice correspondiente).

Insatisfaccin laboral

Pequea

50

20

Grande

40

40

Pertenencia de clase
Clases bajas
Rendimiento
Malo
Status

Bajo

sociomtrico

Elevado

Clases medias
Rendimiento

Bueno

Malo

22

12

18

Malo

Bueno

10

10

Tabla III: Establecer la relacin entre el objetivo educacional


manifestado por los padres y su actitud poltica:
Actitud poltica

Seguridad del puesto de trabajo


Objetivo
educacional

Pequea

Grande

Monotona

Monotona

Satisfaccin

Pequea

30

laboral

Grande

10

Grande

Pequea

Grande

10

20

10

30

20

Conservadora

Progresista

El nio bueno

32

24

El nio independiente

24

75

Como tercera variable se introduce el grado de autoritarismo de


los padres.
Grado de autoritarismo

Tabla II: Ha de establecerse la relacin entre rendimiento en el


deporte y status sociomtrico entre escolares.

Bajo
Elevado
Actitud pOltica Actitud poltica
Conser- Progre- Conser- Progre.
vadora
sista vadora
sista

Rendimiento
en el deporte
Malo

Bueno

Status

Bajo

40

20

sociomtrico

Elevado

20

30

Clases altas
Rendimiento

Bueno

Como tercer factor se introduce la variable seguridad experimentada:

Pequea

e)

b)

a)

Tabla I: Se ha de investigar la relacin entre insatisfaccin laboral y monotona del trabajo:


Monotona del trabajo
Grande
Pequea

271

10. La ordenacin y el anlisis de los datos

= [XY]. Las correlaciones parciales son, pues, todas mayores que cero (1a primera condicin de arriba) y ninguna es mayor que la correlacin originaria
(segunda condicin de las anteriormente enunciadas).
l' En caso de que no se puedan hacer clculos exactos de correlacin, los
ejercicios tambin podran resolverse, si bien con menor exactitud, mediante el
examen ptico de las tablas.

Objetivo
educacional

3.

El nio bueno
El nio independiente

12

30

12

12

70

12

Anlisis contextual

En este captulo nos hemos limitado casi exclusivamente a. ejemplos en los que se trataba de relaciones entre dos.o .tres att1but~s
individuales. Por principio, sin embargo, los procedImIentos de ana-

S-ar putea să vă placă și