Sunteți pe pagina 1din 31

INTRODUCCIN AL ANLISIS

MULTIDIMENSIONAL NO-METRICO

Juan Javier Snchez Carrin

1. Introduccin

El modelo de las escalas multidimensionales que vamos a considerar es


una extensin de las ideas subyacentes a los modelos de escalas unidimensio-
nales, aplicable a aquellos casos en que la variabilidad de los estmulos anali-
zados (por ejemplo, los coches, detergentes, naciones, etc., que juzgan los
entrevistados) se produce respecto de varias dimensiones.
Dado un nmero de estmulos que difieren respecto de una serie de
propiedades o dimensiones se trata de ver cul es el nmero mnimo de estas
dimensiones que permite explicar la variabilidad de los estmulos y cules son
sus coordenadas (parmetros-) en esas mismas dimensiones. A diferencia de las
escalas unidimensionales, que permiten observar las propiedades de los estmu-
los slo en relacin a un valor numrico, susceptible de variar a lo largo de
un continuo, el anlisis multidimensional permite analizar la complejidad de
los estmulos mediante su representacin en un espacio de dos, tres o ms
dimensiones.
En el espacio multidimensional los estmulos estn representados por pun-
tos, correspondiendo su posicin al grado o cantidad de atributo complejo

RS
29/65 pp. 167-210
JUAN JAVIER SNCHEZ CARRION

que aqullos posean 1 ; mientras que la distancia entre dos estmulos (entre
dos puntos en el espacio) est en funcin de su grado de (di)similaridad:
cuanto ms semejantes sean, ms prximos estarn en el espacio.
El inters del anlisis multidimensional no-mtrico, frente al mtrico, ra-
dica en el hecho de que en el primero slo es necesario hacer supuestos no-
mtricos sobre la naturaleza de los datos (se asume que son de nivel ordinal:
el orden de (di)similaridad entre los estmulos),-mientras que en la solucin
del anlisis (las distancias entre los estmulos en un espacio r dimensional)
se recupera la informacin mtrica subyacente a los mismos. Esto es posible,
tal como sealan Coxon y Jones (1984), debido al avance tcnico que supuso
la demostracin hecha por Shepard de que las constricciones meramente no
mtricas (esto es, informacin ordinal en los datos), si se imponen en nmero
suficiente ponen lmites muy estrechos a las posibles soluciones del anlisis
(en este contexto se entiende por solucin la proyeccin de los estmulos en
un nmero de ejes de referencia: por ejemplo, las latitudes y longitudes de
los puntos). Tan rgidos son los lmites impuestos en la solucin por las cons-
tricciones ordinales que es posible identificar la mejor solucin mtrica (las
proyecciones de los estmulos en los ejes de referencia definidos a un nivel
de intervalos iguales de medida) para datos meramente ordinales. Dada la
dificultad de encontrar en las ciencias sociales datos de tipo interval o mtri-
co y el inters de las soluciones de esta naturaleza, la bondad del mtodo
queda justificada.
Segn los diferentes modelos de escalas multidimensionales no-mtricas el
proceso de medicin difiere. En el modelo bsico, que es el que vamos a ex-
plicar en este artculo, la variabilidad que se observa en las respuestas de los
entrevistados a la hora de evaluar los estmulos se adscribe a la propia varia-
bilidad de los estmulos 2. Slo se miden los estmulos, tratando de lograr
que sea en el menor nmero posible de dimensiones. Se desprecia la singula-
ridad de las respuestas de cada uno de los entrevistados y se calcula una eva-
luacin media para el conjunto.
En el anlisis de las diferencias individuales y en el anlisis de las prefe-
rencias individuales las diferencias que hay en las respuestas de los entrevista-
dos tambin se tienen en cuenta, considerando que no slo hay variabilidad en
los estmulos sino tambin en su percepcin por parte de los sujetos, por lo
1 Algunos atributos o propiedades de los estmulos son unidimensionales, tal
es el caso de la longitud, la temperatura o el peso, mientras que otros son multi-
dimensionales, valga como ejemplo la posicin espacial o el color. La posicin
espacial viene determinada por la longitud y la latitud, o la abcisa y la orde-
nada, suponiendo un espacio de dos dimensiones; el color viene definido por el
brillo y la saturacin. A estos segundos atributos son a los que nos referimos al
hablar de atributos complejos. Para una definicin ms exhaustiva de los con-
ceptos estmulo, atributo, dimensin, etc., vase TORGENSON (1958, pp. 247 y ss.).
2 Los entrevistados podran decir que Espaa y Mxico son dos pases ms
semejantes que Espaa y Japn; es decir, que respecto de alguna(s) propiedad(es)
o caracterstica(s) de los pases los tres aparecen como diferentes a los ojos de
los entrevistados.

188
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

que ambos (estmulos y sujetos) son objetos de medicin3. En el primer caso


(las diferencias individuales) vemos cmo perciben los mismos estmulos dife-
rentes sujetos; y en el segundo (anlisis de las preferencias) se estudia cules
son las preferencias, frente a un grupo de estmulos, de cada uno de los entre-
vistados (vase una ilustracin de ambos modelos en Coxon y Jones, 1984).
Al margen de las diferencias mencionadas, tal como seala Shepard (1972,
pgina 1), las diversas tcnicas de escalas multidimensionales coinciden en que
a) pretenden mostrar cualquier estructura subyacente a una matriz de
datos, y
b) tratan de representar esta estructura de forma que sea mucho ms ac-
cesible al ojo humano, especialmente en forma de figura geomtrica.

En el resto de este artculo vamos a desarrollar un ejemplo original si-


guiendo en parte la exposicin de Rabinowitz (1975), que permitir ilustrar
el fundamento del anlisis multidimensional no mtrico. Explicaremos el mo-
delo analtico bsico y abordaremos los problemas que se plantean a la hora
de interpretar los resultados del anlisis.

2. Ejemplo ilustrativo

Supongamos que estamos interesados en conocer la imagen de cinco pa-


ses: Egipto, Espaa, Japn, Mxico y Polonia. Obtendramos una informa-
cin de inters si pidiramos a los entrevistados que clasificaran a los pases
por parejas, en funcin del grado de semejanza que vieran en ellos. Si el en-
trevistado organiza su imagen de los pases segn un criterio de ricos y pobres,
podemos esperar que perciba como ms semejantes a los pases de igual renta;
si ve los pases segn un criterio de pertenencia a los bloques, igualmente
podemos esperar que site ms prximos los pases que pertenecen a un
mismo bloque; y as podra ocurrir con cada una de las dimensiones que el
individuo en cuestin juzgara pertinentes a la hora de clasificar a los pases,
influyendo todas ellas en su clasificacin (ordenacin) de los pases.
Con el fin de proceder a la clasificacin pedimos a los entrevistados que
punten en una escala de 0 a 100 cada pareja posible de pases, entendiendo
que dos pases totalmente iguales recibirn la puntacin mnima, mientras que
el 100 se reserva para aquella pareja de pases totalmente diferentes. Presen-

3 El mismo grupo de la nota anterior podra decir que Espaa y Mxico son
dos pases ms semejantes que Espaa y Japn, en parte porque los pases son
"objetivamente" diferentes, pero tambin en parte porque ellos tienen una visin
"particular" de los mismos, con lo cual habra que medir las variabilidades de
los estmulos y de los sujetos. Por lo tanto, no basta con hacer una evaluacin
media de las puntuaciones que dan los entrevistados, sino que hay que conside-
rar las respuestas individuales o por grupos homogneos.

189
JUAN JAVIER SNCHEZ CARRION

tamos los resultados obtenidos en forma de matriz triangular, puesto que


esta misma matriz ser la que sirva de input para el anlisis de los datos
mediante ordenador (tabla 1).

TABLA 1
Matriz de datos. Cada nmero es la media de los valores asignados
por los entrevistados a cada pareja

Egipto Espaa Japn Mxico Polonia


1 2 3 4 5
-H 1 1 1 1
Egipto 1 -
Espaa 2 - 70

Japn 3 -- 95 89
Mxico 4 -- 40 50 80
Polonia 5 -- 75 80 90 70

Segn estos datos, Egipto y Mxico son los pases ms semejantes, mien-
tras que Japn y Egipto son los ms diferentes; entre medias quedan las ocho
restantes parejas. De la informacin contenida en la matriz slo vamos a
retener la ordenacin de las parejas de pases, olvidndonos de las diferencias
numricas entre ellas.
La ordenacin de pases por parejas nos dice poco sobre su clasificacin
y los criterios subyacentes a esta clasificacin. Sin embargo, si utilizamos esta
ordenacin para representar los cinco pases en un espacio, la estructura
subyacente a la percepcin de los pases por parte de los individuos quedara
ms clara. Esta representacin tendra en cuenta la similaridad de los pases
en orden a su colocacin: cuanto ms similares sean dos naciones ms prxi-
mas estarn en el espacio, y su localizacin vendr dada por una serie de pa-
rmetros tantos como dimensiones tuviera el espacio representacional.
Segn estos criterios, es posible construir una escala con tales datos
sobre una sola dimensin? Habra que colocar los nombres de los pases en un
continuo, respetando el principio de que cuanto ms similares sean dos pa-
ses, ms prximos estarn en el espacio.
Como los pases ms diferentes son Japn y Egipto, stos estarn en los
extremos de la escala. A continuacin colocaramos el par ms similar, Mxico-
Egipto; por tanto, ambos debern de aparecer uno junto a otro en la escala
(vase grfico 1). Consideremos ahora la colocacin del punto correspondiente
a Espaa: nuestro pas aparece como ms semejante a Mxico y Egipto, por

190
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

este orden; por tanto, colocndolo en el lugar en que aparece en el grfico 1


satisface esta condicin y al mismo tiempo se mantiene que Mxico y Egipto
sean los pases ms prximos de todos.

GRFICO 1
Representacin de los puntos en una dimensin

Egipto Mxico Espaa Japn


1 4 2 3
-H 1 1

p3 p, p>

Hasta ahora vemos que los cuatro primeros puntos se pueden colocar en
un eje (una sola dimensin). Veamos qu pasa cuando intentamos sita a
Polonia. Este pas aparece como ms cercano a Mxico, por ello habr que
colocarlo ms cerca de Mxico que de ningn otro pas. Supongamos que lo
colocamos en P\. En esta situacin cumple la condicin mencionada pero
rompe la condicin de que Mxico y Egipto sean los dos pases ms seme-
jantes, ya que ahora la distancia que les separa es mayor que la existente
entre Mxico y P\. Si lo colocamos en P2 se respeta la condicin de que Egip-
to y Mxico sean los pases ms semejantes pero se incumple la condicin de
que Mxico sea el pas ms semejante a Polonia, por cuanto que ahora Es-
paa aparece ms prxima a Pi que Mxico. Podramos tratar de situar a
Polonia en P3. En este caso lo que pasa es que se rompe la condicin de que
Mxico y Egipto sean los pases ms semejantes. Vemos, pues, que no hay
solucin a la representacin grfica de los puntos en una sola dimensin; se
hace necesario recurrir a un espacio de ms dimensiones. Cuntas? Probe-
mos una nueva solucin tratando de situar los pases en un espacio de dos
dimensiones.
En el grfico 2 colocamos los cinco puntos en un espacio bidimensional,
distribuidos de forma arbitraria. En este caso tampoco la configuracin res-
ponde al orden de las respuestas. Japn y Espaa aparecen como los pases
ms lejanos, mientras que en la ordenacin de los entrevistados los ms dife-
rentes son Japn y Egipto. Tendramos, pues, que ir moviendo los puntos de
forma tal que fueran satisfaciendo el criterio de la escala. Para ello podemos
ejecutar los desplazamientos de forma intuitiva o bien encontrar un procedi-
miento analtico que nos ayude en estos movimientos. Segn el primero de los
mtodos tendramos que ir moviendo cada punto, teniendo en cuenta que

191
JUAN JAVIER SNCHEZ CARRION

GRFICO 2
Representacin (arbitraria) de los puntos en dos dimensiones

Polonia
X

Japn . Mjico* Espaa


x
X x
X
Egipto

est interrelacionado con todos los dems y que por tanto la variacin de un
punto (pas) afecta a las distancias que mantiene con el resto. Mientras el
nmero de estmulos sea pequeo, el mtodo es viable; pero a partir de tres
puntos resulta prcticamente imposible encontrar la solucin de forma intuiti-
tiva. El mtodo correcto sera crear una serie de valores que nos guiasen en
los movimientos. A estos valores les vamos a llamar las disparidades (dispa-
rities). A
Kruskal (1964) define las disparidades, da, como una secuencia monto-
na de nmeros, elegidos tan prximos a las distancias entre los estmulos, da,
como sea posible, y que se utilizan como referencia para medir la no-monoto-
na de estos valores. Se trata de un conjunto de valores que han de ser mo-
ntonos respecto de los datos y que al mismo tiempo minimicen la suma de
cuadrados %(d^ - da)2 Dicho de otra manera, las disparidades son una trans-
formacin montona de los datos que al mismo tiempo han de asemejarse a
las distancias entre los n estmulos en un sentido mnimo cuadrtico.
Segn la definicin de las disparidades vemos que para su clculo es ne-
cesario conocer la distancia entre los puntos y explicar qu es la no-monoto-
na de las distancias. Las distancias entre los puntos son fcilmente calcula-
bles. En el modelo Euclideo 4 la distancia entre dos puntos en un espacio de r
dimensiones es igual a:
r
/ \1/2
2
ij= 2 (aim-ajm) )
\m = )

* Existen otros modelos espaciales, como por ejemplo el de Attneave, pero


nosotros slo vamos a referirnos en este artculo al espacio Euclideo. Sobre los
modelos espaciales vase TORGENSON (1958, pp. 251-259).

192
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

es la distancia entre los estmulos i y j (i, ; = 1 , ..., n)


m es un subndice para los ejes ortogonales del espacio (m=l, ..., r)
es la proyeccin del estmulo / en el eje m

Sabiendo las coordenadas de los puntos en el espacio del grfico 2 basta


utilizar esta frmula para calcular sus distancias. Por ejemplo, siendo las coor-
denadas de Polonia (2.7,1-6) y las de Japn (4.0, .5), la distancia entre am-
bos pases es

Cuando tenemos un espacio de dos dimensiones se puede resolver el pro-


blema simplemente utilizando una regla. Si medimos la distancia que hay en-
tre Polonia y Japn en la figura 2 vemos que coincide con la distancia que
acabamos de calcular. Procediendo de esta manera construimos el grfico 3,
donde cada punto del grfico representa una pareja de pases.

GRFICO 3
Distancias entre los puntos en funcin de las (di)similaridades

Mx.-Egip. -
Mx.-Esp.
Esp.-Egip.
Mx.-Pol.
(di)simi- Egip.-Pol.
laridades Pol.-Esp.
Mx.-Jap.
Jap.-Esp.
Pol.-Jap.
Jap.-Egip.

Distancias

En la ordenada aparecen las parejas por orden de semejanza, mientras que


en la abcisa se muestran las distancias entre las parejas.
El otro concepto al que se haca referencia en la definicin que hace Krus-
kal de las disparidades es el de monotona de las distancias. Ello quiere
decir que la lnea que une los puntos del grfico 3 ha de ser montona; es
decir, que siempre se ha de mover de arriba abajo y de izquierda a dere-

193
JUAN JAVIER SNCHEZ CARRION

cha. Este es un requisito del anlisis multidimensional no-mtrico: las distan-


cias en la solucin han de ser una transformacin montona de las relaciones
de (di)similaridad entre los estmulos (a mayor disimilaridad entre los estmu-
los mayor distancia entre los mismos).
La exigencia de monotona en las distancias entre los estmulos es una
de las diferencias bsicas entre el anlisis no-mtrico y el mtrico, donde se
hace necesario que las distancias entre los estmulos sean una transformacin
lineal de las distancias que se obtienen en los datos 5.
Volviendo a nuestro ejemplo vemos en el grfico 3 que a partir de la pa-
reja Japn-Espaa se rompe la monotona. Precisamente, con el fin de lograr
que la lnea de esta figura sea una funcin montona (a mayor disimilaridad
mayor distancia) nos vamos a servir de las disparidades. El grfico 4 muestra
las disparidades. Esta lnea se construye de tal forma que sea tan semejante a
la lnea de las distancias como sea posible, con la restriccin de que nunca
se mueva hacia abajo y hacia la izquierda, preservando de esta manera la mo-
notona. En el apartado siguiente ofrecemos la explicacin de su clculo.

GRFICO 4
Disparidades entre los puntos

Mx.-Egip..
Mx.-Esp.
Esp.-Egip.
y
Mx.-Pol. .
(di)simi- Egip.-Pol. .
\
laridades pol.-Esp.
Mx.-Jap.
L
Jap.-Esp.
Pol.-Jap.
\
Jap.-Egip.
I
*
Disparidades

s En el modelo mtrico, a partir de las (di)similaridades entre los estmulos


hay que obtener las distancias entre ellos (distancias en los datos) (vase nota 12);
estas distancias son las que sirven para predecir (mediante una regresin lineal)
las distancias entre los estmulos, y por tanto, mediante la comparacin entre
las distancias previstas y las distancias reales se llega a sopesar la bondad de la
solucin obtenida. Para obtener una explicacin de cmo se obtienen las distan-
cias entre los estmulos a partir de los datos originales, vase el captulo sobre
escalas multidimensionales en la obra de TORGENSON (1958, cap. 11). Una exposi-
cin completa del mtodo mtrico se puede ver en el libro que acabamos de
mencionar o en BUGEDA (1973, 1974).

194
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

3. Procedimiento analtico

3.1. Regresin montona de las (di)similaridades


Hemos indicado que la estrategia utilizada para calcular la representacin
espacial de los puntos va a consistir en el clculo de unos valores, las dispari-
dades, a partir de las (di)similaridades en los datos y las distancias entre los
puntos en el espacio, moviendo posteriormente los puntos con objeto de ha-
cer que esas distancias se aproximen a las disparidades. Puesto que en el m-
todo no-mtrico los valores de las (di)similaridades no son cantidades aritm-
ticas slo se usa la informacin contenida en el orden existente entre los
estmulos, las disparidades, que s son mtricas, nos sirven de referencia
para ver en qu medida la solucin espacial obtenida se ajusta a la informacin
que tenemos de partida. Es decir, dada una informacin sobre el orden de las
parejas de estmulos tenemos que encontrar una configuracin euclidea de pun-
tos (representativa de los estmulos) cuyas distancias resulten tan prximas
como sea posible a las disparidades.
Estas disparidades se pueden obtener de dos formas: segn el mtodo
de los mnimos cuadrados, desarrollado por Kruskal; y segn el mtodo
del rank image, debido a Guttman
Siguiendo a Kruskal, nuestros cinco estmulos generan 10 parejas de (di)si-
milaridades, cuyo orden es el que aparece en la tabla 2.

TABLA 2
Matriz de (di)similaridades

Egipto Espaa Japn Mxico Polonia


1 2 3 4 5

Egipto 1 X
Espaa 2 3 X
Japn 3 10 8 X
Mxico 4 1 2 7 X
Polonia 5 5 6 9 4 X

Siendo las distancias entre los puntos, di, las que aparecen en el grfico 2, la
A

forma de calcular las disparidades, di, sera la siguiente (tabla 3):


En tanto no se rompa la monotona de la sucesin reproducimos como
disparidades los valores de las distancias. Al llegar al punto noveno, el cons-
tituido por la pareja (5.3) vemos que la sucesin decrece de 8.1 a 6.9, por

195
JUAN JAVIER SNCHEZ CARRION

lo que la monotona se rompe. Para calcular las disparidades correspondientes


a estos puntos tenemos que calcular la media de los dos pares, con lo cual
el valor obtenido, 7.5, mantiene el criterio de monotona. En la dcima
distancia vemos que de nuevo se rompe la monotona; si como en el caso
anterior calculsemos la media de las dos distancias (7.5 y 6.6), el valor
obtenido, 7.05, al ser inferior a los 7.5 precedentes rompera el criterio de
monotona; por ello, lo que hacemos es calcular la media de los tres valores
(8.1, 6.9 y 6.6), siendo este valor, 7.2, el que utilizamos como disparidad.
De esta forma es como se obtuvo la lnea de las disparidades en el grfico 4.

TABLA 3
Clculo de las disparidades segn el mtodo de Kruskal

(pareja) 4,1 4,2 2,1 5,4 5,1 5,2 4,3 3,2 5,3 3,1
[(di)similaridad] 8 1 2 3 4 5 6 7 8 9 10
(distancia) d,/ 0.8 1.2 1.6 1.8 2.5 2.6 7.0 8.1 6.9 6.6
(disparidad) , 0.8 1.2 1.6 1.8 2.5 2.6 7.0 7.5 7.5
i i

7.05 7.05
i
7.2 7.2 7.2

Segn el mtodo de Guttman (1968), y para los mismos datos, lo que


se hace para obtener las disparidades es intercambiar los valores de las dis-
tancias, dij, con objeto de mantener el orden de disimilaridades,5iy (tabla 4).

TABLA 4
Clculo de las disparidades segn el mtodo de Guttman

(pareja) 4,1 4,2 2,1 5,4 5,1 5,2 4,3 3,2 5,3 3,1
(disimilaridad) 1 2 3 4 5 6 7 8 9 10
(distancia) di/ 0.8 1.2 1.6 1.8 2.5 2.6 7.0 8.1 6.9 6.6
(disparidad) d* 0.8 1.2 1.6 1.8 2.5 2.6 6.6 6.9 7.0 8.1
ij

Una vez calculadas las disparidades, utilizamos estos valores para mover
los puntos en el espacio con objeto de que las distancias entre los mismos sean
lo ms semejantes posible a las disparidades. Y el criterio empleado ser el de

196
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

detenerse en el proceso de ver la diferencia entre las distancias y las disparida-


des, y mover los puntos con objeto de reducir esta diferencia, cuando la suma
de los cuadrados de las diferencias sea mnima. A la cantidad obtenida en
esta operacin es lo que se llama el Stress.
Segn la tabla 3, si queremos que las distancias sean una funcin mon-
tona de las disimilaridades hemos de mover los puntos (3,2), (5,3) y (3,1)
segn nos indican las disparidades; ello se consigue haciendo que las distan-
cias entre 3 y 2 (Japn y Espaa) disminuya y aumenten las relativas a 5,3
(Polonia y Japn) y 3,1 (Japn y Egipto). Siguiendo estas indicaciones cons-
truiramos una nueva representacin, y para saber si era correcta volveramos
a repetir el procedimiento precedente: clculo de las distancias, clculo de
las disparidades y clculo del stress. El procedimiento concluira cuando el
Stress fuera pequeo.

3.2. El stress {medida de la bondad del ajuste)

A partir de los datos de la tabla 3, segn Kruskal el stress sera


4
A partir de los datos de la tabla 4, segn Guttman el stress sera

Estas frmulas del Stress tienen algunas propiedades que no son conve-
nientes. En el caso de que una solucin particular se redujese en una cantidad
constante, K, el Stress se reducira tambin por un factor de K2. Por tanto,
la forma de minimizar el Stress consistira en hacer la representacin muy
pequea. Con objeto de evitar esta situacin es necesario utilizar un elemento
que mantenga el Stress invariante ante los cambios de escala en la represen-
tacin espacial. De los diferentes factores posibles nos vamos a referir aqu
a dos, definiendo segn se use uno u otro el Stress 1 o el Stress 2.

? S (da - da)2
i i
Stress 1= ,
/ ;

X 2 (da - da)2
i i
Stress 2 =
? 2 (da - d)2
i j

media de la distancia de todos los pares.

197
JUAN JAVIER SNCHEZ CARRION

Estas frmulas del Stress permiten medir la bondad del ajuste de la re-
presentacin espacial con relacin a las disimilaridades que tenamos como
informacin de partida. Por tanto, si fijamos unos valores indicativos de lo
que sera un buen ajuste, podemos saber cundo terminar el proceso de
movimiento de los puntos con objeto de llegar a la solucin final 6 .
Una vez calculado el Stress estamos en condiciones de dar solucin ana-
ltica: a) al problema de encontrar una representacin espacial que respete
las disimilaridades, y b) al procedimiento de mover los puntos en las sucesi-
vas representaciones obtenidas, con objeto de ir disminuyendo el Stress. Ana-
lticamente, el primer problema se resuelve encontrando una solucin espacial
(una configuracin) cuyo Stress sea mnimo 7. Con relacin al segundo pro-
blema se puede pensar que cada configuracin est representada por un nico
punto 8 y que el Stress mide el ajuste de la configuracin con los datos
originales; de este modo el conjunto de puntos se puede ver como una fun-
cin del Stress (vase grfico 5).

GRFICO 5
Representacin de los puntos-configuracin como funcin del Stress

stress

configuracin

El mtodo utilizado por Kruskal 9 para pasar de una representacin espa-


cial a la siguiente, consiste en determinar la pendiente de la funcin, G ia , con

6
En el apartado 4.2 se proporcionan estos valores indicativos.
7 En esta parte seguimos la exposicin que sobre el tema hace COXON (1978;
pgs. 20-26).
8 La configuracin consiste en nxr parmetros las coordenadas de los n
puntos en las r dimensiones. Un "espacio de configuraciones" se puede concep-
tualizar como un espacio nxr dimensional donde cada parmetro acta como una
coordenada que fija una configuracin particular como un punto en ese espacio.
9 Se puede ver otro mtodo diferente para modificar la configuracin, des-
arrollado por GUTTMAN-LINGOES y ROSKAM, en COXON (1978; pgs. 26-29).

198
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

respecto a la configuracin actual; es decir, hallar la derivada del Stress con


respecto a la configuracin:

S = valor del stress


i = subndice dado a los estmulos (i = 1, 2, ..., n)
a subndice dado a las dimensiones (a=lf 2, ..., r)
Xia = coordenadas del estmulo i en la dimensin a

Si la configuracin se mueve en la direccin de la pendiente negativa,


tendr que hacer ms pequeo el Stress de la siguiente configuracin. Cuando
la pendiente sea cero, es que se ha alcanzado un mnimo 10 y el proceso se
puede dar por concluido.
Una vez calculada la pendiente n el problema est en determinar cunto
hay que mover la configuracin en la direccin de un Stress ms pequeo. Si
se elige una cantidad (step size) muy pequea, se gastar ms tiempo de clcu-
lo; mientras que si movemos mucho la configuracin, podemos pasarnos del
mnimo global buscado. En la medida en que no hay una solucin analtica
a este problema, cada programa utiliza sus propias reglas.
Finalmente, una vez determinada la cantidad en que hay que mover la
configuracin y la pendiente, la frmula para calcular las nuevas coordenadas
es como sigue:

Nueva X,-fl = Vieja X,-fl : Pendiente


Norming factor
Norming factor es el tamao relativo de la pendiente (comparada con otras
pendientes).
Step size es el tamao del movimiento hecho en la configuracin.

10 Puede tratarse de un mnimo "local" y no de un mnimo "global". La forma


de determinar cul es el caso consiste en ver, cuando la derivada parcial del
Stress es cero, el tamao del Stress. Si el Stress es "suficientemente pequeo"
podemos decir que estamos ante un mnimo global, en caso contrario tendramos
un mnimo local.
11 LINGOES y ROSKAM (1971; pg. 29) expresan la ecuacin para su clculo de
la siguiente forma:
dS 1 t,
Gia= = 2(1 52) (Xia-Xja)
dXia 2d2;. 5 / dti
Tomado de COXON (1978; pg. 25).

199
JUAN JAVIER SNCHEZ CARRION

3.3. La eleccin de la configuracin inicial

En el ejemplo sobre los pases decamos que la configuracin inicial se


obtena por el procedimiento de colocar los cinco puntos en un espacio eu-
clideo bidimensional de forma totalmente arbitraria. A partir de aqu bamos
moviendo los puntos con objeto de lograr una solucin ms adecuada (mni-
mo Stress). Esta no sera sino una de las posibles formas de dar comienzo
el proceso, atribuible a Kruskal (1964, 120).
Alternativamente, Shepard (1962, 133) sugiere el uso de una malla
regular, en la que todos los puntos estn separados entre s por la misma
distancia (vase grfico 6), y a partir de aqu comenzar los sucesivos movi-
mientos de los puntos hasta alcanzar la solucin final.

GRFICO 6
Ejemplo de configuracin inicial atribuible a Shepard

X X X X X X

X X X X X

X X X X X X

X X X X X X

Un tercer mtodo consiste en tratar la informacin original segn el m-


todo de anlisis multidimensional clsico de Torgerson 12. De esta forma, la
solucin del anlisis clsico puede servir como configuracin inicial del an-
lisis no mtrico.
12 En el anlisis multidimensional clsico, siguiendo el ejemplo de Torgerson
sobre la percepcin de los colores, se trata de obtener, a partir de los juicios de
similaridad entre los colores, y mediante el mtodo completo de las triadas, las
distancias entre los mismos. Estas distancias son comparativas, referidas a un
origen arbitrario, por lo que no pueden ser utilizadas en un modelo especial ya
que la configuracin estara en funcin del cero arbitrario que seleccionsemos.
Con objeto de superar este problema hay que transformar estas distancias com-
parativas en absolutas. Para ello hay que encontrar una constante, c, en la ecua-
cin
dj = h, + c
d = distancia absoluta entre los estmulos (i, j = 1, 2 ..., n)
hj = distancia comparativa entre los estmulos (i, j = 1, 2 ..., n)
que permita la representacin de los estmulos en un espacio Euclideo de la
menor dimensionalidad posible.
La matriz de distancias absolutas, DO, se transforma en una matriz de pro-
ductos escalares, B*, referidos al "centroide" de todos los puntos. Despus esta
matriz se somete a un anlisis factorial, con objeto de obtener la matriz de coor-

200
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-MTRICO

Cuando en el anlisis clsico las distancias comparativas entre los estmu-


los no tengan error y la constante aditiva que se utiliza para calcular las
distancias absolutas haya sido bien elegida, la solucin final, tras el scaling
no-mtrico, no ganar mucho con relacin a la configuracin inicial es decir,
nos podamos haber ahorrado el anlisis no-mtrico. Pero en el caso contra-
rio, el anlisis no-mtrico mejorar la configuracin inicial (la solucin del
anlisis clsico).
Es importante la eleccin de la configuracin inicial, pues una mala con-
figuracin causara:
1. Un uso prolongado del ordenador debido a la necesidad de efectuar
un mayor nmero de iteraciones hasta lograr una solucin satisfac-
toria.
2. Una mayor probabilidad de encontrar una solucin que sea un mni-
mo local (vase grfico 5).

Estratgicamente es preferible, en general, la utilizacin de una configu-


racin inicial racional y no elegida al azar.
Como resumen de esta parte, y antes de entrar en los problemas que
se plantean a la hora del diagnstico y de la interpretacin de la solucin
obtenida, conviene considerar el siguiente esquema-resumen preparado por
Charles Jones (1979):

3.4. Resumen del procedimiento

Dados unos datos en forma de una matriz cuadrada y simtrica con Vi N


(N-l) (di)similaridades (una para cada par de estmulos), hay una solucin
espacial en la cual los estmulos son puntos con coordenadas en un pequeo
nmero de dimensiones.
Ahora bien, la distancia entre los puntos (estmulos) en esta solucin
espacial est relacionada con sus correspondientes (di)similaridades por:

a) Una funcin lineal (en el anlisis mtrico).


b) Una funcin montona (en el anlisis no-mtrico).

denadas X de los estmulos en las diferentes dimensiones o ejes. Resumiendo:


Distancia en los Datos DO -> productos escalares B* -> clculo - X (config.)
valores
y vectores
propios
Para una exposicin detallada vase TORUESON (1958) y BUGEDA (1973 y 1974).

201
JUAN JAVIER SNCHEZ CARRION

O
0)

(distancias en la locucin) (distancias en los datos)


Anlisis No-Mtrico Anlisis Mtrico

Procedimiento
*- Construir una (Nueva)
configuracin inicial
Calcular la distancia entre los puntos
Calcular la desviacin de la monotonicidad (stress)
Calcular la derivada parcial del stress para encontrar Mnimo
la direccin del movimiento (pendiente negativa) local
Son las derivadas parciales igual a cero?
S ... Es el stress "suficientemente" pequeo?
S ... Final
i
No ... Mover la No ...
configuracin *
en direccin de la
pendiente

4. El problema de la interpretacin

Hasta aqu nos hemos limitado a ofrecer el modelo bsico del anlisis
multidimensional. Siguiendo los pasos indicados se llegara a una solucin
que sera preciso interpretar. Tres problemas surgiran entonces.
En primer lugar, con objeto de facilitar la comprensin hasta ahora he-
mos recurrido a un ejemplo en el que se utilizaba un espacio bidimensional.
No siempre ser ste el caso y en cada anlisis habr que determinar el n-
mero de dimensiones necesarias para representar la configuracin de estmulos.
Por otra parte, el nmero de dimensiones est relacionado con el error
que estemos dispuestos a cometer. Habida cuenta que todo conjunto n de
objetos se puede representar en un espacio n dimensional, nosotros lo que

202
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

pretendemos es ganar en la interpretacin reduciendo ese nmero de dimen-


siones, aun a costa de forzar algo la representacin. Ese error vendr
determinado por el Stress. El lmite del valor que puede alcanzar el Stress
ser otro tema que habr que examinar.
Por ltimo, una vez determinado el nmero de dimensiones, hay que in-
terpretar su significado con objeto de dar un sentido al anlisis; ste ser el
ltimo punto que consideraremos.

4.1. El nmero de dimensiones

Como seala Shepard (1972, 9), el nmero de dimensiones que se pueden


elegir en un anlisis multidimensional constituye un punto de equilibrio entre
la bondad del ajuste y la visualizacin y economa (parsimonia) obtenida
con la solucin. Cuanto mayor es el nmero de dimensiones mejor es el ajuste
y por tanto menor es el stress; pero al mismo tiempo, cuando aumenta el
nmero de dimensiones se pierde la ventaja que tiene el anlisis multidi-
mensional para representar grficamente la estructura subyacente a un con-
junto de datos, ya que resulta imposible de ver una solucin en ms de dos o
tres dimensiones. Y no slo eso, sino que tambin se pierde el inters del
anlisis basado en su capacidad para reducir la informacin a un nmero
de dimensiones menor que el de los datos disponibles.
El valor obtenido por el Stress en una solucin con diferentes dimensiones
se puede utilizar para fijar el nmero de dimensiones ms apropiado al caso.
Si representamos grficamente el valor del Stress para un nmero determi-
nado de dimensiones (vase grfico 7), se puede tomar como solucin el
nmero de dimensiones a partir del cual la curva deja de decrecer marcada-
mente.

GRFICO 7
Valor del Stress segn el nmero de dimensiones

1 2 3
dimensiones

203
JUAN JAVIER SNCHEZ CARRION

En el grfico 7 se puede ver que el nmero de tres dimensiones sera el


apropiado. Sin embargo, este criterio habra que relacionarlo con los niveles
del valor del Stress para los tres dimensiones, lo que consideraremos al ocu-
parnos del tamao del Stress.
Existe igualmente una tabla, diseada por Spence y Graef, con los valores
esperados del Stress para matrices de datos generadas en dimensiones verda-
deras (de una a cinco dimensiones), con cinco diferentes niveles de error y
para un nmero de puntos que va de 12 a 36. En el anlisis, el valor del stress
correspondiente a las soluciones de una a cinco dimensiones se compara con
estas tablas, pudiendo determinarse el nmero ms correcto de dimensiones
de la solucin y el porcentaje de error. Cada uno de los valores esperados del
Stress representa la media de un nmero de valores estimados en diferentes
estudios de Monte Cario. Toda la tabla est incorporada en una subrutina
llamada MSPACE, que se incluye en algunas versiones del programa no-
mtrico MINISSA. Para una descripcin del mtodo vase I. Spence y
J. Graef (1974) y I. Spence y F. W. Young (1978).
En el anlisis de los datos de los cinco pases hemos utilizado el pro-
grama MINISSA, incorporado en el paquete MDS (X), obteniendo las posi-
bles soluciones en espacios de una a cinco dimensiones. Debido al pequeo
nmero de estmulos que utilizamos, a partir de dos dimensiones el stress
se hace igual a cero, por lo que elegimos este espacio bidimensional como
solucin final.
El programa necesario para el anlisis consta de una serie de sencillas
instrucciones, que incluimos a continuacin;

TABLA 5
Sentencias del programa MINISSA

RUN AME JAVIER


N OF STIMULI 5
PRINT DATA YES
INPUT FORMAT (4F2.0)
PARAMETERS MIND (1), MAXD (5), DATA (1), OUTPUT (1)
READ MATRIX

INPUT MATRIX

ROW 2 70.00000
ROW 3 95.00000 39.00000
ROW 4 40.00000 50.00000 80.00000
ROW 5 75.00000 80.00000 90.00000 70.00000

COMPUTE

204
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

Entre otra informacin el output del anlisis proporciona las coordena-


das de la solucin, las distancias entre los puntos y su representacin espa-
cial. La tabla 6 y el grfico 8 muestran esta informacin (aplazamos la inter-
pretacin de los resultados hasta el apartado 4.3).

TABLA 6
a) Coordenadas de los cinco punios en dos dimensiones, b) Distancias entre
los cinco puntos

Fina 1 configura txon


J 2

1 0.6479 0.1689
2 0.3494 0.6836
3 1.5342 0.1296
4 0.3512 0.1988
5 - 0.1856 1.1809
MEAN 0.0000 0.0
SIGMA 0.7815 06240

Distances
2 2 3
2 0.5950
3 2.1824 1.9634
4 0.2981 0.4849 1.8357
5 14267 1.8717 2,1622 1.3896
b)

4.2. Tamao del Stress


Tal como sealbamos, el Stress mide la bondad del ajuste obtenido (la
linealidad o monotonicidad, segn se trate de un anlisis mtrico o no-
mtrico), entre las (di)similaridades de los datos y las distancias entre los
puntos en la solucin. Igualmente afirmbamos que el Stress debera ser
suficientemente pequeo. Con objeto de poder utilizar un criterio para
determinar los lmites aceptables que puede alcanzar el Stress, Kruskal ofreci
la siguiente tabla:
Stress

0.01 = Excelente
0.01 a 0.05 = Bueno
0.05 a 0.10 = Correcto
0.10 a 0.15 = Moderado
0.15 =Pobre

205
DIMENSIN
2
-tOO -90 -80 -70 -60 -50 -40 -30 -20 -10 * 10 50 60 80
1 00
1 00
96
76
92
72
88
68
84
84
Polonia 80
80
76 5 76
72 72
68 68
64 64
60 60
56 56
52 52
48 48
44 44
40 40
36 36 S; cj
>
32 32
28
2
28
24 24
20 20
16 16 O
12 12
8
4 5* Tj
O DIMENSIN 1
z
o
o -4
-8
-1 2
Egipto Mjico
4
3
Japn
-4
-8
- 12
8 X
w
- 16
00
-16
-20 -20
-24 -24
-28
-32
-28
-32
S
-36 -36 Sr 2
-40 Espaa -40
-44 -44
-48 -48
-52
-56
-52
-56
a
-60 -60
-64 -64
-68 -68
-72 -72
-76 -76
-80 -80
-84 -84
-88 -88
-92 -92
-96 -96
-1 00 -100

-100 -90 -80 -70 -60 -50 -40 -30 -20 -10 10 20 30 40 50 60 80 90 100
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

La tabla tiene validez tratndose del anlisis no-mtrico y utilizando el


Stress 1. Es decir, la tabla no tiene una utilidad general, pues existe toda
una serie de factores que condicionan el tamao del Stress, haciendo que su
valor sea relativo. Como factores que determinan que el Stress sea ms
pequeo, podemos considerar:

El uso del anlisis no-mtrico (tiene un Stress inferior) frente al an-


lisis mtrico.
A

El uso de la d {monotonicidad dbil) ofrece un Stress inferior al uso


de <T (monotonicidad fuerte).
El enfoque primario de los empates (ties) frente al enfoque se-
cundario 13.
El Stress 1 frente al Stress 2.
Utilizando un nmero elevado de dimensiones el Stress es menor.
En un anlisis con un nmero pequeo de puntos tambin el Stress
es menor que en el caso de que existan muchos puntos. Sin embargo,
esta consideracin hay que relacionarla con la recomendacin de utilizar,
al menos, doce puntos en el anlisis; y ello porque es necesario que
exista un nmero mnimo de puntos a fin de que las constricciones
impuestas sean suficientes para que la informacin ordinal pueda deter-
minar un resultado mtrico.

13 Digamos brevemente que uno de los problemas que se plantean en el an-


lisis no mtrico es la existencia de parejas de puntos con (di)similaridades y/o
disparidades iguales (con empates). Esto plantea problemas, pues la nica informa-
cin de que disponemos para calcular la solucin es el orden entre las (di)simi-
laridades y entre las disparidades, y este orden lo perdemos por el hecho de que
hay varias (di)similaridades y disparidades que son iguales.
4,1 4,2 5,4 2,1 5,1 5,2 4,3 3,2 5,3 3,1
1 2 3 3 5 6 6 8 9 10
d .8 1.2 1.8 1.6 2.5 2.6 7.0 8.1 6.9 6.8
u
$1 .8 1.2 1.7 1.7 2.5 2.6 7.0 7.2 7.2 7.2

Tomando los datos originales (tabla 1) y representndolos en la tabla anterior,


segn el enfoque "primario" para el caso de las disparidades iguales a 1.7, la
solucin consistira en cambiar el 1.7, 1.7 por 1.6 y 1.8; o lo que es lo mismo,
alternar el orden de los puntos (5,4 y 2,1).
En el enfoque "secundario" dejaramos los valores sin cambiar. En el enfoque
primario, pues, se rompen los empates (ties) con objeto de reducir el stress;
mientras que en el "secundario" se dejan los empates tal como estn, con lo cual
se tiende a aumentar el stress. En cualquier caso, cuando existen muchos em-
pates (ties) en los datos es preciso el anlisis mtrico y el uso del enfoque "se-
cundario"; y en ltima instancia rechazar los datos.
El programa que hemos utilizado, MINISSA, hace uso del enfoque primario;
por esa razn ya de partida, en el grfico 3, hemos colocado el punto 2,1 antes
que el 5,4. Igual argumento sirve para justificar la colocacin del punto 5,2 an-
tes que el 4,3.

207
JUAN JAVIER SNCHEZ CARRION

Estas consideraciones sobre el Stress hacen ver que antes de interpretar


la solucin obtenida es conveniente examinar la calidad de la solucin;
a esta operacin es a lo que Coxon llama el diagnstico. Se tratara, en de-
finitiva, de hacer lo mismo que en cualquier anlisis de la regresin: no basta
con ver los coeficientes de regresin, sino que hay que mirar la posible exis-
tencia de heteroscedasticidad, multiconinealidad y/o autocorrelacin de los
datos, factores que son los que en definitiva justificarn la validez del an-
lisis. En este sentido, Coxon sugiere tambin que antes de interpretar la so-
lucin obtenida en el anlisis multidimensional se haga un diagrama de dis-
persin, para ver el ajuste de los puntos a la lnea de regresin (montona
en nuestro caso).

GRFICO 9
Diagrama de Shepard
b

X X

(disimilaridades) x x

(distancias)

A simple vista, la existencia de algunos puntos, como el 2.1 (vase gr-


fico 9), nos puede sugerir que parte del Stress est causado por la contribu-
cin de estos puntos, que una vez suprimidos pueden hacer que el tamao
del Stress sea aceptable 14.
Tal como indicbamos en el apartado 4.1, en nuestro ejemplo el Stress
tiene un valor de cero a partir de dos dimensiones (vase tabla 7).
Sin embargo, siempre que se utilice un nmero tan pequeo de puntos
hay que ser precavido a la hora de observar el valor del Stress, pues la in-
terpretacin de este valor depende del nmero de estmulos, I, y de la dimen-

w Analticamente, se puede detectar la existencia de estos puntos "malos"


calculando el valor de los residuos para cada punto (vase grf. 9) (d; dPjk), don-
de djk puede ser c? o d*.
Aquellos puntos que tienen un residuo grande son los que contribuyen prin-
cipalmente a que el tamao del stress tambin sea grande.

208
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

TABLA 7
Valores de Stress utilizando Stress 1 y d (DSTAR)

METRIC IS EUCLIDEAN
DSTAR IS USED
ITER GRADIENT ANGLE
1

2 DIMENSIONS
ANGLE FACTOR IS USED
RAW STRESS DHAT STRESS DHAT
0.0 0.0
SFORM 1 SOFT SQUEEZE
RAW STRESS DSTAR COEF. ALIEN DSTAR
0.0 0.0

sionalidad, R, de la solucin. Kruskal y Wish (1978) indican que slo a partir


de que I>4R cabe decir que la interpretacin del Stress es independiente
de / y de R. Como ejemplo, los autores mencionados sealan que en una so-
lucin de siete objetos en tres dimensiones cabe esperar que datos generados
al azar lleven a un Stress tan pequeo como 0.02 en un 50 por 100 de las
ocasiones (A. C , p. 52). Por tanto, reiteramos que las consideraciones previas
sobre el Stress son vlidas siempre y cuando / sea relativamente grande res-
pecto de R.
Una vez determinado el nmero de dimensiones y realizado el diagns-
tico de la solucin obtenida, se estara en condiciones de pasar a su inter-
pretacin.

4.3. Interpretacin de la configuracin

Para determinar el significado de las diferentes dimensiones pueden uti-


lizarse dos mtodos diferentes. Segn el primero, y a semejanza con la inter-
pretacin tradicional en el anlisis factorial, se tratara de ver los cluster de
puntos y, tras rotar los ejes segn algn criterio 15, determinar lo que parece
ms probable que signifiquen las dimensiones. En la solucin del anlisis
multidimensional los ejes obtenidos para localizar los puntos son arbitrarios,
ya que cualquier rotacin deja invariantes las distancias entre los puntos.
Por ello, es perfectamente factible rotar los ejes o incluso reflejarlos, sin
que se altere la solucin.
!5 El criterio utilizado ser hacer que los ejes pasen por los cluster de pun-
tos de modo que las coordenadas sean grandes o, alternativamente, prximas a
cero - el equivalente al criterio de "estructura simple" (simple structure) en an-
lisis factorial.

209
JUAN JAVIER SNCHEZ CABRION

La necesidad de rotar los ejes es mayor cuando la solucin viene dada en


un nmero elevado de dimensiones, ya que en este caso se hace difcil la in-
terpretacin de los resultados a simple vista.
Un segundo mtodo, que permite interpretar las dimensiones con mayor
garanta, est basado en la utilizacin de algn criterio externo a la propia
configuracin. Junto a la recogida de la informacin pertinente para el anli-
sis multidimensional se trata de obtener informacin sobre la puntuacin
de los estmulos respecto a una o varias propiedades. Estas propiedades pos-
teriormente se representarn en la configuracin mediante nuevos ejes, com-
probando si las proyecciones de los puntos sobre stos son similares o dife-
rentes a las proyecciones de los puntos sobre el eje que queremos interpretar.
En caso afirmativo, el eje interno (dimensin obtenida en el anlisis multi-
dimensional) se puede interpretar como la propiedad representada por el eje
externo. En caso de que no coincidan, la configuracin se puede interpretar en
funcin del eje de las propiedades (olvidndonos de las dimensiones o tratan-
do de encontrar su interpretacin por otro camino).
Supongamos que el resultado del anlisis multidimensional para M puntos
es una matriz, X, de coordenadas en un espacio de r dimensiones.
Si tenemos las puntuaciones para cada uno de los M puntos respecto a al-
guna propiedad, P, se tratara de ver cmo se relaciona sta con X. En trmi-
nos analticos se trata de un problema de regresin mltiple, donde la pro-
piedad es la variable dependiente y las columnas X son las variables in-
dependientes.

La ecuacin de regresin vendra dada por

propiedad = biejej + b2ejen + ... + bTejer + error

donde las b son los coeficientes de regresin no estandarizados.


En la representacin, la pendiente del nuevo eje de la propiedad vendra
determinado por el cociente bilb\, en el caso de que slo hubiera dos dimen-
siones (vase grfico 10) 16 ; y la bondad del ajuste estara en funcin del
coeficiente de correlacin mltiple 17.
El nmero de propiedades a utilizar es opcional; en lneas generales hay
dos alternativas: se puede utilizar un nmero de propiedades semejante al
nmero de dimensiones y tratar de verificar alguna hiptesis sobre el signi-

16 En general, la direccin de los ejes externos vendr determinada por el co-


seno direccional, cuando los coeficientes estn normalizados; es decir, cuando
252=1. En esta circunstancia el cos^,=bi.
i i
17
Slo en caso de existir una correlacin elevada est justificado utilizar la
propiedad como ayuda para la interpretacin de la solucin.

210
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

ficado de estas dimensiones 18, o bien se puede utilizar un nmero superior


de propiedades con una intencin exploratoria 19.

GRFICO 10
Direccin del eje de la propiedad

Este anlisis de las propiedades se puede hacer mediante cualquier pro-


grama de regresin mltiple o bien utilizando el programa PROFIT (Pro-
per ty Fitting), diseado a tal efecto.
En nuestro ejemplo, junto con la informacin sobre las semejanzas entre
los pases se han puntuado los cinco pases en dos escalas diferentes, ambas
con un recorrido de 0 a 10 puntos. Una escala meda la riqueza de los pa-
ses (RPC), de acuerdo con la opinin de los entrevistados, y otra su alinea-
miento con los bloques (USA y la URSS). En el primer caso un valor de
cero significaba que el pas en cuestin era considerado como muy pobre
y diez, muy rico; y en el segundo, cero significaba total alineamiento con
los Estados Unidos de Amrica y diez total alineamiento con la Unin So-
vitica. Las puntuaciones de los cinco pases en las dos escalas fueron las si-
guientes:

is Un ejemplo de este tipo se ofrece en el mencionado artculo de RABINOWITZ


(1975), tratando de interpretar las dos dimensiones del anlisis de las similaridades
entre los polticos en trminos de "afiliacin a un partido" y "corriente ideolgica".
En el caso extremo, una superposicin de los ejes internos (las dimensiones) y ex-
ternos (las propiedades) permitira interpretar las dimensiones en trminos de esas
propiedades.
19 El estudio de SHERMAN y DOWDLE (1974), en el que se utilizan hasta un total
de 32 propiedades, de las que 10 quedan como significativas, es un buen ejemplo de
este tipo de anlisis.

211
JUAN JAVIER SNCHEZ CARRION

Riqueza Alineamiento

Egipto . 3 3
Espaa 5 1
Japn .. 9 1
Mxico 5 3
Polonia 6 8

Utilizando la riqueza como variable dependiente se calcularon los coefi-


cientes de regresin mltiple para la ecuacin
riqueza=^ + i (dimensin I) + b2 (dimensin II) + error

Igual se hizo cuando la escala de alineamiento con los bloques era la va-
riable dependiente:
alineamiento =za+b\ (dimensin l) + b2 (dimensin II)+error
Los resultados obtenidos se reflejan en la tabla 8.

TABLA 8
Coeficientes de las regresiones mltiples de las escalas en las dimensiones

Coef. de regresin
Coef. de
Normalizados correla-
Escalas No estandarizados (cosenos cin
direccionales) mltiple

DIM. I DIM. II DIM. I DIM. II

Riqueza 2.3733 .5137 .9774 .2114 .960


Alineamiento -1.08 3.8686 -.269 .963 .998

La direccin de los ejes correspondientes a las escalas viene determinada


por los cocientes 2/^1 de cada ecuacin, o por los eos 0 = (donde i es el
coeficiente de regresin normalizado de mayor valor en cada ecuacin). El
eje riqueza forma un ngulo de 12.2 grados con el eje horizontal:

= b2/b{ = .5137/2.3733= .216


are tag .216=12.2 grados
o cosdi= .9114
are eos .9774=12.2 grados

212
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

El eje alineamiento forma un ngulo de 15.6 grados con el eje vertical


(dimensin II):
tagt2 = b2/bi = 3.8686/ 1.08 = 3.582
are tag 3.582 = 74.4 grados; y su complemento 15.6
o cos02= .963
are eos .963 = 15.6 grados

El grfico 11 muestra la localizacin de las dos escalas en el plano defi-


nido por las dos dimensiones.
Puesto que los coeficientes de correlacin mltiple tienen un valor muy
elevado (.960 y .998 para la primera y la segunda escala, respectivamente),
lo que significa que las coordenadas predicen bien los valores de las escalas,
podemos interpretar las dimensiones obtenidas en el anlisis como la rique-
za y el alineamiento de los pases. Nuestra percepcin de los pases en
cuestin, sin coincidir exactamente con la de los entrevistados, parece confir-
mar los resultados del anlisis: en el eje horizontal tenemos a Egipto como
pas ms pobre y a Japn como pas ms rico; en el eje vertical, por un
lado aparece Polonia, pas perteneciente al bloque de los pases socialistas, y
por el otro Espaa y Japn, pases ambos ligados a los Estados Unidos.
Complementariamente a la interpretacin de nuestros resultados en tr-
minos de dimensiones, se pueden observar los grupos de pases que se forman,
interpretndolos en lnea con el anlisis de cluster. As, en nuestro anlisis
se aprecia la existencia de cuatro grupos o clusters de puntos: el primero
constituido por Egipto y Mxico, y los otros tres formados por Polonia, Ja-
pn y Espaa, respectivamente. La interpretacin de estos grupos se hara
apoyndonos en el conocimiento que tenemos del significado de las dimen-
siones,

Programas de Ordenador

La mayora de los programas informticos de escalas multidimensionales


se encuentran en la serie MDS(X), desarrollada por un equipo de la Univer-
sidad de Edimburgo y del University College de Cardiff. En esta serie se
halla la siguiente relacin de programas:

CANDECOMP (CANonical DECOMPosition).


HICLUS (HIerarchical CLUStering).
INDSCAL-S (INDIvidual Differences SCALing).
MDPREF (MultiDimensional PREFerence Scaling).
MINICPA (Michigan-Israel-Nijmegen Integrated Series: Conditional
Proximity Analysis).

213
DIMENSIN
2
-fOO -90 -80 -70 -60 -50 -40 -30 -20 -10 * 10 90 100

100 1 00
76 96
72 92
88
88 84
84
80
80
76
76
72 72
68 68 K M

64 64
60 60
56 56
52 52
48 48
44 44
40 40
36 36
32 32
28 28
24 24
20 20
16 16
N) 12
12
8 8 5" >
lO l-fj
4 4
DIMENSIN
-4
-8 Egipto 3
-4
-8
t 8 3
-1 2 Japn. - 12
- 16
-16
-20 -20 g
-24 -24
-28 -28 o
-32 -32
-36 -36 3
-40 Espaa -40
-44 -44
-48 -48 ~"
-52 -52
-56 -56 ^b
-60 -60
-64 -64
-68 -68
-72 -72
-76 * -76
-80 -80
-84 -84
-88 -88
-92 -92
-96 -96
-1 00 -100
-100 -90 -80 -70 -60 -50 -40 -30 -20 -10
INTRODUCCIN AL ANLISIS MULTIDIMENSIONAL NO-METRICO

MINIRSA (MINI Rectangular Smallest Space Analysis).


MINISSA (Michigan-Israel-Nijmegen Interated Smallest Space Analysis).
MRSCAL (MetRic SCAling).
MVNDS (Mximum Variance Non-Dimensional Scaling).
PARAMAP (PARAmetric MAPping).
PINDIS (Procustrean INdividual DIfferences Scaling).
PREFMAP (PREFerence MAPping).
PROFIT (PROperty FITting).
TRISOSCAL (TRIadic Similarities Ordinal SCAling).
UNICON (UNIdimensional CONjoint measurement).

La serie est implementada en el centro de procesos de datos de la Uni-


versidad Complutense de Madrid.

BIBLIOGRAFA

BUGEDA, Jos: "La medida multidimensional de la opinin", Revista Espaola de


la Opinin Pblica, 34, pp. 37-66, 1973.
- La medida de las ciencias sociales, Madrid, Confederacin Espaola de las Ca-
jas de Ahorro, 1974.
COXON, A. P. M.: Multidimensional Scaling, ECPR Summer School Monograph,
Univ. de Essex (Inglaterra), 1975.
Elementary Introduction to Multidimensional Scaling MDS (X) Project, Draft
Paper, Univ. de Cardiff (Gran Bretaa), 1978.
The user's guide to multidimensional scaling, Londres, Heinemann, 1982.
y C. L. JONES: The images of occupational prestige, Londres, Macmillan, 1978.
y C. L. JONES: "Multidimensional scaling", en D. MCKAY, N. SCHOFIELD y
P. WHITLEY (eds.): Data analysis and the social sciences, Londres, France Pinter,
pp. 171-225, 1983.
y C. L. JONES: "Escalas multidimensionales", en SNCHEZ CARRIN (ed.): Tc-
nicas de anlisis multivariable en las ciencias sociales, Madrid, CIS, 1984.
GUTTMAN, Louis: "A general non metric technique for finding the smallest coor-
dinate space for a configuration of points", Psychometrika, 33, 469-506, 1968.
JONES, C. L.: Multidimensional scaling, notas del curso sobre el mismo tema de
la Universidad de Essex (Inglaterra), 1979.
KRUSKAL, J. B., y M. WISH: Multidimensional scaling, Londres y Beverly Hills,
Sage, 1978.
"Multidimensional scaling by optimizing goodness of fit to a non-metric hy-
pothesis", Psychometrika, 29, 1-27, 1964.
LINGOES, J. C, y E. E. ROSKAM: "A mathematical and empirical analysis of two
multidimensional scaling algorithms", Psychometrika, suplemento monogrfico,
pp. 1-93. Reimpreso con correcciones en LINGOES y otros (eds.): Geometric re-
presentations of relational data, Ann Arbor, Matheis Press, pp. 371-473, 1973.
MARTNEZ, M.: "Escalas multidimensionales para el anlisis de atributos", CU-
PEMA, vol. 1, nm. 11, pp 29-39, 1975.
MAC DONALD, K. L: "MDSCAL and distances between socio-economic groups", en
HOPE, K. (ed.): The analysis of social mobility, Oxford, Clarendon Press, 1972.

215
JUAN JAVIER SNCHEZ CARRION

RABINOWITZ, G. B.: "An introduction to non-metric multidimensional scaling",


American Journal of Political Science, vol. 19, pp. 343-390, 1975.
SHEPARD, R. N.; A. K. ROMNEY y S. B. NERLOVE: Multidimensional scaling: theory
and applications in the behavioral sciences, vol. 1: teora; vol. 2: aplicaciones.
Londres, Seminar Press, 1972.
SHERMAN, R. C, y M. D. DOWDLES: "The perception of crime and punishment: a
multidimensional scaling analysis", Social Science Research, vol. 3, pp. 109-
126, 1974.
SPENCE, L, y J. GRAEF: "The determination of the underlying dimensionality of
an empirically obtained matrix of proximities", Mult. Behav. Res., vol. 9, n-
mero 3, pp. 331-341, 1974.
SPENCE, I., y F. W. YOUNG: "Monte-Cario studies in non-metric scaling", Psycho-
metrika, vol. 43, nm. 1, pp. 115-117, 1978.
TORGENSON, W. A.: Theory and methods of scaling, Nueva York, Willey and
Sons, 1958.
VICENS, Jos: "Anlisis multidimensional no-mtrico en Marketing", CUPEMA,
vol. 3, nm. 1, pp. 83-120.

216
NOTAS DE INVESTIGACIN

S-ar putea să vă placă și