Sunteți pe pagina 1din 12

ANALIZA CORESPONDENTELOR MULTIPLE

Analiza Corespondenţelor Multiple


Analiza corespondenţelor multiple conduce la găsirea unei soluţii în care cazurile din
aceeaşi categorie sunt grupate împreună, iar instanţele din categorii diferite sunt grupate
separat. Astfel, categoriile împart obiectele (cazurile) în subgrupe omogene.

Variabilele sunt considerate a fi omogene atunci când clasifică obiectele din aceeaşi
categorie în aceleaşi subgrupe.

Pentru o soluţie unidimensională, analiza multiplă a corespondenţelor atribuie valori


“optimal scale” (cuantificări ale categoriilor) fiecărei categorii a variabilei astfel încât,
per ansamblu, în medie, categoriile să aibă împrăştiere maximă. Pentru o soluţie
bidimensională, această analiză găseşte un al doilea set de cuantificări ale categoriilor
fiecărei variabile, fără vreo legătură cu primul set, încercând din nou să determine o
împrăştiere maximă şamd. Întrucât categoriile variabilei primesc atâtea scoruri câte
dimensiuni are soluţia, variabilele din analiză sunt presupuse a fi nominale multiple la
nivel de “optimal scaling”.

De asemenea, analiza corespondenţelor multiple atribuie scoruri şi cazurilor astfel încât


cuantificările categoriei reprezintă mediile (sau centroizii) scorurilor obiectelor din acea
categorie.

Analiza corespondenţelor multiple mai poartă denumirea de analiza omogenităţii sau dual
scaling. Ea conduce la rezultate comparabile, dar nu identice celor de la analiza
corespondenţelor cu două variabile. Analiza corespondenţelor determină un output unic
care reproduce conformitatea şi calitatea reprezantării soluţiei. O altă diferenţă între cele
două proceduri este aceea că datele de intrare pentru analiza corespondenţelor multiple
sunt sub forma unei matrici în care rândurile reprezintă obiecte, iar coloanele sunt
variabile; în cazul analizei corespondenţelor datele de intrare pot să fie sub forma
aceleiaşi matrici, a unei matrici de proximitate sau a unui tabel de contingenţă, care este o
matrice agregată în care rândurile şi coloanele reprezintă categorii ale variabilelor.

Consideraţii asupra datelor. Valorile variabilelor nominale sunt întotdeauna convertite în


numere întregi pozitive, crescător, în ordine alfanumerică.

Prezumţii. Datele trebuie să conţină cel puţin trei cazuri valide. Analiza se bazează pe
date întregi pozitive. Opţiunea de discretizare va acţiona automat asupra unei variabile cu
valori fracţionale grupându-le în categorii cu o distribuţie apropiată de cea normală şi va
converti valorile nominale în numere întregi pozitive. Se pot însă specifica şi alte scheme
de discretizare.

1
ANALIZA CORESPONDENTELOR MULTIPLE

Pentru exemplificare am aplicat analiza corepondentelor multiple asupra unui set de date
care contine informatii despre tigari. Urmatorul tabel cuprinde variabilele analizate:

Numele variabilei Eticheta Valori


brand brand A,B,C,D
category category 100’s, king size, regular size
flavor flavor full flavor, lights, super lights, ultra lights
pack type pack type hinge lid box, round corner box, soft pack,
Z-lighter pack
price price low, medium, premium
menthol menthol menthol, no menthol
length length 72, 73, 84, 85, 100

Din meniul SPSS alegem Optimal Scaling.

Analiza omogenităţii poate să determine câte o soluţie pentru mai multe dimensiuni.
Numărul maxim de dimensiuni este egal fie cu numărul categoriilor minus numărul
variabilelor fără date missing, fie cu numărul observaţiilor minus unu (se alege valoarea
cea mai mică). Totuşi, rar se utilizează numărul maxim de dimensiuni. Un număr mai mic
de dimensiuni este mai uşor de interpretat, iar după un anumit număr de dimensiuni
volumul asociaţiilor suplimentare devine neglijabil. De obicei se utilizează soluţii cel
mult tri-dimensionale.

2
ANALIZA CORESPONDENTELOR MULTIPLE

Model Summary

Variance Accounted For


Cronbach's Total
Dimension Alpha (Eigenvalue) Inertia
1 .801 3.007 .501
2 .784 2.886 .481
Total 5.893 .982
Mean .793a 2.947 .491
a. Mean Cronbach's Alpha is based on the mean
Eigenvalue.

Soluţia explică aproape toata varianţa din date astfel: 50.1% în prima dimensiune,
respectiv 48.1% în cea de-a doua.

Cele două dimensiuni împreună furnizează o interpretare în termeni de distanţe. Dacă o


variabilă discriminează bine, obiectele vor fi aproape de categoriile la care aparţin. Ideal
ar fi ca obiectele din aceeaşi categorie să se situeze aproape unele de altele (adică ar
trebui să aibă scoruri similare), iar categoriile diferitelor variabile vor fi “vecine” dacă
aparţin aceloraşi obiecte (adică, două obiecte care au scoruri similare pentru o variabilă ar
trebui să se asocieze şi în raport cu alte variabile din soluţie).

Pentru fiecare variabilă în parte s-a realizat câte un grafic în care etichetele reprezintă
valorile variabilei.

3
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by BRAND

A B
0 D D
B C
D
Dimension 2

-5 C

-10

C C

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.


Distanţa unui obiect faţă de origine reflectă variaţia de la pattern-ul comun de răspuns.
Acesta corespunde celei mai frecvente Cases
categorii pentru
Weighted fiecare variabilă. Obiectele cu
by Weight
multe caracteristici care corespund celor mai frecvente categorii se regăsesc aproape de
origine. Dimpotrivă, obiectele cu caracteristici unice sunt localizate departe de origine.

Analizand graficul de mai sus se poate observa ca prima dimensiune separa brandurile A,
B si C de brandul D. Cea de-a doua dimensiune nu discrimineaza atat de bine brandurile.

In continuare putem urmari cum se comporta variabilele in raport cu cele doua


dimensiuni. Pentru fiecare variabila se calculeaza niste masuri de discriminare care
reprezinta varianta in acea dimensiune.

Asadar, prima dimensiune se gaseste in legatura cu variabila flavor, iar cea de-a doua
dimensiune se afla in legatura cu variabila category. Variabilele length si pack type au
valori mari pentru ambele dimensiuni => indica o buna discriminare in ambele cazuri.

Variabilele menthol si price sunt situate aproape de origine, deci nu au deloc putere de
discriminare.

4
ANALIZA CORESPONDENTELOR MULTIPLE

Discrimination Measures

1.0
CATEGORY LENGTH
PACK TYPE

Dimension 2 0.8

0.6

0.4

0.2

PRICE
MENTHOL FLAVOR
0.0
0.0 0.2 0.4 0.6 0.8 1.0

Dimension 1

Variable Principal Normalization.

5
ANALIZA CORESPONDENTELOR MULTIPLE

Gradul de imprastiere a categoriilor pentru fiecare variabila reflecta varianta, respective


cat de bine variabila este discriminata pe dimensiuni.

De asemenea, o variabila ale carei categorii sunt mai indepartate are o putere de
discriminare mai mare decat o variabila cu categorii apropiate.

Joint Plot of Category Points

2
CATEGORY
LOW
85 MEDIUM
100 MENTHOL
KING SIZE
HINGE
LIGHTSLID BOX FLAVOR
0 ULTRA LIGHTS 84
LENGTH
FULL SOFT
100'S FLAVOR
NO PACK
MENTHOL
PREMIUM
ROUND CORNER BOXSUPER LIGHTS MENTHOL
-2 PACK TYPE
PRICE

-4
Dimension 2

72
-6

-8

-10
REGULAR SIZE

-12 73

Z-LIGHTER PACK
-14
-2 0 2 4 6 8 10

Dimension 1
Variable Principal Normalization.

6
ANALIZA CORESPONDENTELOR MULTIPLE

Graficul privind variabila length arata ca dimensiunea 2 separa obiectele cu lungime mica
de cele cu lungime mare.

Object Points Labeled by LENGTH

85 85
0 84 84
85 85
84
Dimension 2

-5 72

-10

73 73

73

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight


Similar, se poate observa pe urmatoarele grafice modul in care se grupeaza obiectele in
functie de categoriile fiecarei variabile.

7
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by CATEGORY

KING SIZE
0 KING SIZE KING SIZE
KING
KING SIZE
SIZE
KING SIZE
Dimension 2

-5 REGULAR SIZE

-10

REGULAR SIZE

REGULAR SIZE

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

8
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by PACK TYPE

HINGE LID BOX


0 ROUND CORNER BOX
HINGE LID BOX
ROUND CORNER BOX
Dimension 2

-5 HINGE LID BOX

-10

Z-LIGHTER PACK

Z-LIGHTER PACK

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

9
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by FLAVOR

FULL FLAVOR
0 ULTRA LIGHTS ULTRA LIGHTS
FULL
FULL FLAVOR
FLAVOR
ULTRA LIGHTS
Dimension 2

-5 LIGHTS

-10

FULL FLAVOR

FULL FLAVOR

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

10
ANALIZA CORESPONDENTELOR MULTIPLE

Asa cum am precizat deja, variabila price nu reuseste sa separe prea bine obiectele pe
niciuna dintre dimensiuni.

Object Points Labeled by PRICE

LOW LOW
MEDIUM
0 PREMIUM PREMIUM
PREMIUM
PREMIUM
Dimension 2

-5 PREMIUM

-10

PREMIUM

PREMIUM

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

11
ANALIZA CORESPONDENTELOR MULTIPLE

Aceeasi este si situatia variabilei menthol (asemenea variabilei price).

Object Points Labeled by MENTHOL

NO MENTHOL
0 NO MENTHOL NO MENTHOL
NO MENTHOL
NO MENTHOL
Dimension 2

-5 NO MENTHOL

-10

NO MENTHOL

NO MENTHOL

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

12