Sunteți pe pagina 1din 27

Ejemplo con SPSS

Anlisis de cluster (conglomerados)


ANLISIS DE CLUSTER JERRQUICO EN SPSS
DEFINICIN DEL PROBLEMA A INVESTIGAR. El objetivo del anlisis de
conglomerados es identificar grupos homogneos de casos considerando una
serie de criterios.
Los mtodos jerrquicos se caracterizan porque comienzan con casos
individuales que van siendo clasificados hasta formar un nico conglomerado.

Ejemplo 1. En la tabla se presenta la actividad de las salas de proyeccin por


Comunidades Autnomas, datos INE de 1998.

Los casos a agrupar son las Comunidades Autnomas (CCAA) y los criterios para
realizar esta agrupacin estn relacionados con la actividad de los cines durante
1998.
La actividad se refiere: al nmero de cines, nmero de pelculas proyectadas
(ttulos), nmero de espectadores de pelculas espaolas, nmero de
espectadores de pelculas extranjeras y recaudacin obtenida en miles de
pesetas
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
El anlisis comienza con una primera descripcin del fenmeno a investigar.

Una correcta aplicacin del Anlisis Cluster requiere que se cumplan tres
requisitos bsicos:
a. Ausencia de correlacin entre las variables.
b. Nmero de variables no muy elevado.
c. Que las variables no se encuentren medidas en unidades diferentes.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
(a) Ausencia de correlacin entre las variables.
Si las variables se encuentran correladas se corre el peligro de incluir informacin
redundante que se debe evitar en todo momento. Por este motivo es importante analizar la
matriz de correlaciones antes de proseguir con el estudio. Cuando existe correlacin entre
las variables se utiliza una medida (distancia de Mahalanobis) para compensar la
correlacin. Cuando no existe correlacin entre variables esta distancia es similar a la
distancia eucldea.
Para analizar la existencia de correlacin (Analizar/Correlaciones/Bivariadas):

Se detecta una elevada relacin de la variable Recaudacin con el resto de las variables del
modelo, relaciones significativas al 0,01 por lo que se precede a eliminarlas del modelo.
Para ello, en lugar de la variable Recaudacin se utiliza la variable Gasto medio por
espectador.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
(c) Diferencia de mtricas de las variables.
La mtrica de las variables se soluciona estandarizando (o tipificando) todas las unidades a
tratar.

[as variables guardadas estandarizadas comienzan con la letra Z:


ZCinesR, ZPeliculasR, ZPelis_EspaaR, ZPelis_ExtranR, ZGasto_medio
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
CONGLOMERADO EN DOS FASES:
Est pensado para anlisis con un nmero grande de individuos, que pueden tener
problemas de clasificacin con otros procedimientos.
Tiene la particularidad que permite trabajar conjuntamente con variables de tipo
mixto (cualitativas y cuantitativas).
Puede realizarse cuando el nmero de cluster (conglomerado) es conocido a priori
y tambin cuando no se conoce.

CONGLOMERADOS NO JERRQUICOS:
Se puede aplicar slo a variables cuantitativas y requiere conocer el nmero de
conglomerados a priori.
Puede realizarse para un nmero de objetos relativamente grande pues no
requiere el clculo de todas las posibles distancias.

CONGLOMERADOS JERRQUICOS:
Se utiliza para variables cuantitativas o cualitativas.
No se conoce el nmero de conglomerados a priori y cuando el nmero de
objetos no es muy grande.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
Por ltimo, existe la posibilidad de transformar las medidas de distancia, pudiendo elegir entre:
Valores absolutos: Considera el valor absoluto de la distancia, eliminando el signo. Interesante
cuando interesa la magnitud de la distancia y no su signo.
Cambiar el signo: Transforma medidas de distancia en medidas de similitud, y viceversa.
Cambiar escala al rango 01: estandariza los valores restando el valor de la distancia menor y
dividiendo despus entre el rango, consiguiendo de esta forma convertir todas las medidas al
rango 01.

Historial de conglomeracin: Presenta el proceso de elaboracin de los agrupamientos, mostrando


los casos (o variables) combinados en cada etapa y la distancia entre cada uno.
Matriz de distancias: Proporciona las distancias o similaridades entre los casos (o variables).
Conglomerado de pertenencia: Indica el conglomerado al que se asigna cada caso. El investigador
puede seleccionar una solucin nica, o un rango de soluciones para conocer cmo vara la
composicin de los grupos en funcin del nmero final de conglomerados. En este ejemplo se ha
optado por la segunda opcin, buscando conocer el conglomerado de pertenencia de cada
Comunidad Autnoma cuando se solicitan 3, 4 y 5 grupos.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
Los coeficientes de la matriz de distancias indican la distancia entre las Comunidades
Autnomas considerando las variables del anlisis, de modo que cuanto mayor sea el
coeficiente entre dos Comunidades existir mayor distancia entre ellas, y en consecuencia
sern ms diferentes.

Un anlisis detallado de los coeficientes de la tabla revela una gran similitud en la


actividad de los cines de Cantabra y La Rioja (con una distancia de 0,105). Otras
Comunidades con pautas parecidas son Galicia y Pas Vasco (con una distancia de 0,292).
Las Comunidades ms diferentes en cuanto a la actividad cinematogrfica son Catalua y
Cantabra (con una distancia de 44,3).

Conviene retener esta informacin para realizar un seguimiento del proceso de formacin
de los agrupamientos, con la ayuda del Historial de Aglomeracin, as como su
representacin grfica (Dendograma). Resaltar que las Comunidades ms similares son
Cantabria (nmero 6) y La Rioja (nmero 17), y por esto son las primeras que se unen en
el Historial de Aglomeracin.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
Se observa que Cantabria (6) y La Rioja (17) son las primeras Comunidades que
se unen en el Historial de Aglomeracin. De la ltima columna (Prxima etapa)
se desprende que este primer agrupamiento volver a ser utilizado en la etapa 5.
Una vez realizado el primer conglomerado, el programa vuelve a recalcular una
nueva matriz de distancias entre los 16 elementos restantes, es decir los 15
elementos y la agrupacin (Cantabria La Rioja). Este primer cluster volver a ser
utilizado en la etapa 5.

En la segunda etapa se efecta un agrupamiento con las Comunidades 12 y 16


(Galicia, Pas Vasco), a una distancia de 0,198. Este segundo conglomerado
(cluster) volver a ser utilizado en la etapa 7.
En la tercera etapa se unen las Comunidades de Asturias (3) y Navarra (15), a
una distancia de 0,355, este tercer cluster volver a ser utilizado en la etapa 8.
En la cuarta etapa se produce la unin de Canarias (5) y Murcia (14), a una
distancia de 0,518, cluster que volver a ser utilizado en la etapa 6.
En la novena etapa se produce la unin de Andaluca (1) y Valencia (10), a una
distancia de 3,586, cluster que volver a ser utilizado en la etapa 13.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
Hasta ahora se ha tratado de agrupamientos simples formados por dos
Comunidades, pero es posible tambin formar clusters con la unin de
agrupamientos anteriores.
Esto se produce por primera vez en la etapa 5, donde el conglomerado 6
(Cantabria) que se uni al 17 (La Rioja) en la primera etapa se une al
conglomerado 11 (Extremadura). De modo que en este momento se produce
un agrupamiento entre (Cantabria La Rioja Extremadura), a una distancia
0,836, cluster que volver a ser utilizado en la etapa 12.
En la etapa 6 se unen los conglomerados 2 (Aragn) y 5 (que se uni al 14 en la
cuarta etapa), produciendo el agrupamiento (Aragn Canarias Murcia), a
una distancia de 1,250, cluster que ser utilizado de nuevo en la etapa 10.
En la etapa 7 se unen los conglomerados 7 (Castilla La Mancha) y 12 (que se
uni al 16 en la segunda etapa), produciendo el agrupamiento CastillaLa
Mancha Galicia Pas Vasco, a una distancia 1,801, cluster que volver a ser
utilizado en la etapa 11.
En la etapa 8 se unen los conglomerados 3 (Asturias) que se uni al
conglomerado 15 (Navarra) en la tercera etapa y 4 (Baleares), produciendo el
agrupamiento Asturias Navarra Baleares, a una distancia 2,448, cluster que
volver a ser utilizado en la etapa 12.
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS
ANLISIS DE CLUSTER JERRQUICO EN SPSS

El primer conglomerado, formado por tres Comunidades Autnomas, presenta una cuota de pantalla de pelculas
espaolas (pelculas espaolas/total de espectadores) del 10%. El gasto medio por espectador es de 584 pesetas.
El segundo conglomerado, formado por trece Comunidades Autnomas, destaca por el pequeo nmero de salas
de cine (por debajo de la media nacional), siendo la que menos pelculas estrena, presenta una cuota de pantalla de
pelculas espaolas del 12,7%. El gasto medio por espectador es de 563 pesetas, el ms bajo de todos los
conglomerados.
El tercer conglomerado, formado por una Comunidad Autnoma, presenta una cuota de pantalla de pelculas
espaolas del 6,2%, el ms bajo de todos los conglomerados. El gasto medio por espectador es de 2988 pesetas, el
ms alto de los conglomerados.

S-ar putea să vă placă și