Sunteți pe pagina 1din 12

ANALIZA CORESPONDENTELOR MULTIPLE

Analiza Corespondenelor Multiple


Analiza corespondenelor multiple conduce la gsirea unei soluii n care cazurile din
aceeai categorie sunt grupate mpreun, iar instanele din categorii diferite sunt grupate
separat. Astfel, categoriile mpart obiectele (cazurile) n subgrupe omogene.

Variabilele sunt considerate a fi omogene atunci cnd clasific obiectele din aceeai
categorie n aceleai subgrupe.

Pentru o soluie unidimensional, analiza multipl a corespondenelor atribuie valori


optimal scale (cuantificri ale categoriilor) fiecrei categorii a variabilei astfel nct,
per ansamblu, n medie, categoriile s aib mprtiere maxim. Pentru o soluie
bidimensional, aceast analiz gsete un al doilea set de cuantificri ale categoriilor
fiecrei variabile, fr vreo legtur cu primul set, ncercnd din nou s determine o
mprtiere maxim amd. ntruct categoriile variabilei primesc attea scoruri cte
dimensiuni are soluia, variabilele din analiz sunt presupuse a fi nominale multiple la
nivel de optimal scaling.

De asemenea, analiza corespondenelor multiple atribuie scoruri i cazurilor astfel nct


cuantificrile categoriei reprezint mediile (sau centroizii) scorurilor obiectelor din acea
categorie.

Analiza corespondenelor multiple mai poart denumirea de analiza omogenitii sau dual
scaling. Ea conduce la rezultate comparabile, dar nu identice celor de la analiza
corespondenelor cu dou variabile. Analiza corespondenelor determin un output unic
care reproduce conformitatea i calitatea reprezantrii soluiei. O alt diferen ntre cele
dou proceduri este aceea c datele de intrare pentru analiza corespondenelor multiple
sunt sub forma unei matrici n care rndurile reprezint obiecte, iar coloanele sunt
variabile; n cazul analizei corespondenelor datele de intrare pot s fie sub forma
aceleiai matrici, a unei matrici de proximitate sau a unui tabel de contingen, care este o
matrice agregat n care rndurile i coloanele reprezint categorii ale variabilelor.

Consideraii asupra datelor. Valorile variabilelor nominale sunt ntotdeauna convertite n


numere ntregi pozitive, cresctor, n ordine alfanumeric.

Prezumii. Datele trebuie s conin cel puin trei cazuri valide. Analiza se bazeaz pe
date ntregi pozitive. Opiunea de discretizare va aciona automat asupra unei variabile cu
valori fracionale grupndu-le n categorii cu o distribuie apropiat de cea normal i va
converti valorile nominale n numere ntregi pozitive. Se pot ns specifica i alte scheme
de discretizare.

1
ANALIZA CORESPONDENTELOR MULTIPLE

Pentru exemplificare am aplicat analiza corepondentelor multiple asupra unui set de date
care contine informatii despre tigari. Urmatorul tabel cuprinde variabilele analizate:

Numele variabilei Eticheta Valori

brand brand A,B,C,D

category category 100s, king size, regular size

flavor flavor full flavor, lights, super lights, ultra lights

pack type pack type hinge lid box, round corner box, soft pack,
Z-lighter pack

price price low, medium, premium

menthol menthol menthol, no menthol

length length 72, 73, 84, 85, 100

Din meniul SPSS alegem Optimal Scaling.

Analiza omogenitii poate s determine cte o soluie pentru mai multe dimensiuni.
Numrul maxim de dimensiuni este egal fie cu numrul categoriilor minus numrul

2
ANALIZA CORESPONDENTELOR MULTIPLE

variabilelor fr date missing, fie cu numrul observaiilor minus unu (se alege valoarea
cea mai mic). Totui, rar se utilizeaz numrul maxim de dimensiuni. Un numr mai mic
de dimensiuni este mai uor de interpretat, iar dup un anumit numr de dimensiuni
volumul asociaiilor suplimentare devine neglijabil. De obicei se utilizeaz soluii cel
mult tri-dimensionale.

Model Summary

Variance Accounted For


Cronbach's Total
Dimension Alpha (Eigenvalue) Inertia
1 .801 3.007 .501
2 .784 2.886 .481
Total 5.893 .982
Mean .793a 2.947 .491
a. Mean Cronbach's Alpha is based on the mean
Eigenvalue.

Soluia explic aproape toata variana din date astfel: 50.1% n prima dimensiune,
respectiv 48.1% n cea de-a doua.

Cele dou dimensiuni mpreun furnizeaz o interpretare n termeni de distane. Dac o


variabil discrimineaz bine, obiectele vor fi aproape de categoriile la care aparin. Ideal
ar fi ca obiectele din aceeai categorie s se situeze aproape unele de altele (adic ar
trebui s aib scoruri similare), iar categoriile diferitelor variabile vor fi vecine dac
aparin acelorai obiecte (adic, dou obiecte care au scoruri similare pentru o variabil ar
trebui s se asocieze i n raport cu alte variabile din soluie).

Pentru fiecare variabil n parte s-a realizat cte un grafic n care etichetele reprezint
valorile variabilei.

3
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by BRAND

A B
0 D D
B C
D

Dimension 2

-5 C

-10

C C

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

Distana unui obiect fa de origine reflect variaia de la pattern-ul comun de rspuns.


Acesta corespunde celei mai frecvente categorii pentru fiecare variabil. Obiectele cu
multe caracteristici care corespund celor mai frecvente categorii se regsesc aproape de
origine. Dimpotriv, obiectele cu caracteristici unice sunt localizate departe de origine.

Analizand graficul de mai sus se poate observa ca prima dimensiune separa brandurile A,
B si C de brandul D. Cea de-a doua dimensiune nu discrimineaza atat de bine brandurile.

In continuare putem urmari cum se comporta variabilele in raport cu cele doua


dimensiuni. Pentru fiecare variabila se calculeaza niste masuri de discriminare care
reprezinta varianta in acea dimensiune.

Asadar, prima dimensiune se gaseste in legatura cu variabila flavor, iar cea de-a doua
dimensiune se afla in legatura cu variabila category. Variabilele length si pack type au
valori mari pentru ambele dimensiuni => indica o buna discriminare in ambele cazuri.

Variabilele menthol si price sunt situate aproape de origine, deci nu au deloc putere de
discriminare.

4
ANALIZA CORESPONDENTELOR MULTIPLE

Discrimination Measures

1.0
CATEGORY LENGTH
PACK TYPE

0.8
Dimension 2

0.6

0.4

0.2

PRICE
MENTHOL FLAVOR
0.0
0.0 0.2 0.4 0.6 0.8 1.0

Dimension 1

Variable Principal Normalization.

5
ANALIZA CORESPONDENTELOR MULTIPLE

Gradul de imprastiere a categoriilor pentru fiecare variabila reflecta varianta, respective


cat de bine variabila este discriminata pe dimensiuni.

De asemenea, o variabila ale carei categorii sunt mai indepartate are o putere de
discriminare mai mare decat o variabila cu categorii apropiate.

Joint Plot of Category Points

2
CATEGORY
LOW
85 MEDIUM
100 MENTHOL
KING SIZE
HINGE
LIGHTSLID BOX FLAVOR
0 ULTRA LIGHTS 84
LENGTH
FULL SOFT
100'S FLAVOR
NO PACK
MENTHOL
PREMIUM
ROUND CORNER BOX SUPER LIGHTS MENTHOL
-2 PACK TYPE
PRICE

-4
Dimension 2

72
-6

-8

-10
REGULAR SIZE

-12 73

Z-LIGHTER PACK
-14
-2 0 2 4 6 8 10

Dimension 1
Variable Principal Normalization.

6
ANALIZA CORESPONDENTELOR MULTIPLE

Graficul privind variabila length arata ca dimensiunea 2 separa obiectele cu lungime mica
de cele cu lungime mare.

Object Points Labeled by LENGTH

85 85
0 84 84
85 85
84
Dimension 2

-5 72

-10

73 73

73

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

Similar, se poate observa pe urmatoarele grafice modul in care se grupeaza obiectele in


functie de categoriile fiecarei variabile.

7
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by CATEGORY

KING SIZE
0 KING SIZE KING SIZE
KING
KING SIZE
SIZE
KING SIZE

Dimension 2

-5 REGULAR SIZE

-10

REGULAR SIZE

REGULAR SIZE

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

8
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by PACK TYPE

HINGE LID BOX


0 ROUND CORNER BOX
HINGE
HINGE LID
LID BOX
BOX
ROUND CORNER BOX

Dimension 2

-5 HINGE LID BOX

-10

Z-LIGHTER PACK

Z-LIGHTER PACK

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

9
ANALIZA CORESPONDENTELOR MULTIPLE

Object Points Labeled by FLAVOR

FULL FLAVOR
0 ULTRA LIGHTS ULTRA LIGHTS
FULL
FULL FLAVOR
FLAVOR
ULTRA LIGHTS

Dimension 2

-5 LIGHTS

-10

FULL FLAVOR

FULL FLAVOR

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

10
ANALIZA CORESPONDENTELOR MULTIPLE

Asa cum am precizat deja, variabila price nu reuseste sa separe prea bine obiectele pe
niciuna dintre dimensiuni.

Object Points Labeled by PRICE

LOW MEDIUM
LOW
0 PREMIUM PREMIUM
PREMIUM
PREMIUM
Dimension 2

-5 PREMIUM

-10

PREMIUM

PREMIUM

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

11
ANALIZA CORESPONDENTELOR MULTIPLE

Aceeasi situatia se intalneste si in cazul variabilei menthol (asemenea variabilei price).

Object Points Labeled by MENTHOL

NO MENTHOL
0 NO MENTHOL NO MENTHOL
NO
NO MENTHOL
MENTHOL
NO MENTHOL
Dimension 2

-5 NO MENTHOL

-10

NO MENTHOL

NO MENTHOL

-2 0 2 4 6 8 10

Dimension 1

Variable Principal Normalization.

Cases Weighted by Weight

12

S-ar putea să vă placă și