Sunteți pe pagina 1din 15

Scalarea multidimensională în SPSS

Exemplu: Analiza termenilor ce definesc gradul de rudenie

Autorii Rosenberg şi Kim (1975) au analizat 15 termeni ce exprimă gradul de rudenie


(aunt, brother, cousin, daughter, father, granddaughter, grandfather, grandmother, grandson,
mother, nephew, niece, sister, son, uncle).

În studiul lor, Rosenberg şi Kim (1975) au cerut la 4 grupe de studenţi (2 grupe de fete
şi 2 grupe de băieţi) să aranjeze aceşti termeni în funcţie de asemănările dintre ei.

Două grupe (o grupă de fete şi o grupă de băieţi) au fost solicitate să aranjeze termenii
de două ori folosind un alt criteriu decât prima dată.

Astfel, s-au obţinut în total 6 „surse” de date, prezentate în tabelul următor.

Tabelul 1. Sursa structurii datelor privind gradul de rudenie


Sursa Genul Condiţia Volumul eşantionului
1 Feminin O singură aranjare 85
2 Masculin O singură aranjare 85
3 Feminin Prima aranjare 80
4 Feminin A doua aranjare 80
5 Masculin Prima aranjare 80
6 Masculin A doua aranjare 80

Matricele 15 x 15 cu valori binare ale tuturor subiecţilor au fost însumate în cadrul


fiecărui grup şi s-au obţinut 6 matrice agregate. Matricele de disimilaritate 15 x 15 au fost
construite scăzând valorile însumate din numărul total de persoane din grup.

Datele sunt disponibile în fişierul kinship_dat.sav.

S-au construit şi 3 variabile independente ce vor fi folosite ca variabile externe în


analiză.

Variabilele independente sunt: gender, gener (generaţia), şi degree (gradul de


separare) şi vor fi folosite pentru interpretarea dimensiunilor soluţiei. Variabilele
independente sunt construite astfel:

 gender. 1 = masculin, 2 = feminin, 9 = lipsă (pentru cousin)


 gener. Numărul de generaţii faţă de respondent, unde numerele negative corespund
generaţiilor anterioare. De exemplu, grandparents sunt –2, grandchildren sunt 2, şi
siblings sunt 0.
 degree. Numărul gradelor de separare din arborele genealogic.

Variabilele externe sunt disponibile în fişierul kinship_var.sav.


Alegerea numărului de dimensiuni
Pentru alegerea numărului de dimensiuni ale soluţiei, putem folosi graficul de tip crosă
(Scree plot).

1. Pentru crearea graficului de tip crosă:

Analyze > Scale > Multidimensional Scaling (PROXSCAL)...

Figura 1. Fereastra de dialog Data Format

2. Se optează pentru Multiple matrix sources în grupul Number of Sources.


3. Se foloseşte butonul Define.

.
Figura 2. Fereastra de dialog Multidimensional Scaling

4. Se selectează variabilele de la Aunt până la Uncle în câmpul variabilelor de


proximitate.
5. Se alege variabila sourceid ca variabilă de identificare a sursei.
6. Se foloseşte butonul Model.

Figura 3. Fereastra de dialog Model

7. Se alege 10 ca număr maxim de dimensiuni.


8. Se foloseşte butonul Continue.
9. Se foloseşte butonul Restrictions în fereastra de dialog Multidimensional Scaling.
Figura 4. Fereastra de dialog Restrictions

10. Se optează pentru Linear combination of independent variables.


11. Se alege fişierul cu variabilele independente cu butonul File.
12. Se alege fişierul kinship_var.sav.
13. Se aleg variabilele gender, gener, şi degree ca variabile de restricţie.

Se observă că variabila gender are o valoare lipsă: 9 = valoare lipsă (pentru cousin).
Metoda tratează această valoare ca fiind validă. Prin urmare, transformarea liniară implicită
nu este potrivită. Se foloseşte în schimb transformarea nominală.

14. Se selectează variabila gender.


15. Din listă se alege Nominal from the Independent Variable Transformations.
16. Se foloseşte butonul Change.
17. Se foloseşte butonul Continue.
18. Se foloseşte butonul Plots din fereastra de dialog Multidimensional Scaling.
Figura 5. Fereastra de dialog Plots

19. În fereastra de dialog Plots, se bifează Stress.


20. Se face click pe Continue.
21. Se face click pe OK în fereastra de dialog Multidimensional Scaling.

Figura 6. Scree plot

Metoda prezintă soluţiile de la 2 dimensiuni până la 10 dimensiuni. Graficul de tip


crosă prezintă valoarea normalizată a stresului pentru soluţia corespunzătoare fiecărei
dimensiuni. Din grafic se observă că o creştere a numărului de dimensiuni la de 2 la 3 şi de la
3 la 4 duce la o îmbunătăţire a valorii stresului. După 4, îmbunătăţirea este destul de mică.

Pentru analiza datelor vom folosi soluţia cu 3 dimensiuni deoarece rezultatele sunt mai
uşor de interpretat.
Soluţia cu 3 dimensiuni
1. Pentru a obţine soluţia cu 3 dimensiuni, deschidem fereastra de dialog
Multidimensional Scaling şi alegem Model.

Figura 1. Fereastra de dialog Model

2. În fereastra de dialog, se introduce valoarea 3 pentru numărul minim şi numărul


maxim de dimensiuni.
3. Se face click pe butonul Continue.
4. Se face click pe Options în fereastra de dialog Multidimensional Scaling.
Figura 2. Fereastra de dialog Options

5. Se alege Custom pentru configuraţia iniţială (Configuraţia dintr-o analiză precedentă


este disponibilă în fişierul kinship_ini.sav.).
6. Se alege fişierul kinship_ini.sav pentru citirea variabilelor.
7. Se aleg variabilele dim01, dim02, şi dim03 în câmpul variabilelor selectate.
8. Se face click pe Continue.
9. Se foloseşte butonul Plots în fereastra de dialog Multidimensional Scaling.

Figura 3. Fereastra de dialog Plots


10. În fereastra de dialog Plots, se bifează Original vs. transformed proximities şi
Transformed independent variables.
11. Se face click pe Continue.
12. Se face click pe Output în fereastra de dialog Multidimensional Scaling.

Figura 4. Output dialog box

13. În fereastra de dialog Output, se selectează Input data, Stress decomposition, şi


Variable and dimension correlations în grupul Display.
14. Se face click pe Continue.
15. Se face click pe OK în fereastra Multidimensional Scaling.
Indicatorii Stress-ului
Stresul şi indicatorii de ajustare prezintă informaţii despre calitatea soluţiei: cât de bine
distanţele originale sunt aproximate de distanţele din soluţia SMD.

Figura 1. Stresul şi indicatorii de ajustare

Prin SMD, se minimizează valoarea stresului brut normalizat.

Valorile stresului (cele 4 valori) măsoară gradul de neconcordanţă a soluţiei cu datele


originale. O valoare mai mică a stresului (valoarea minimă este 0, iar valoarea maximă este 1)
arată o ajustare mai bună.

Dispersion accounted for şi Tucker’s coefficient of congruence măsoară calitatea


ajustării datelor.

Valoarea DAF este egală cu 1 minus valoarea stresului brut normalizat şi este un
indicator al ajustării globale a modelului. Cu cât valoarea DAF este mai mare, cu atât
ajustarea este mai bună.

Coeficientul Tucker’s coefficient of congruence se calculează ca rădăcină pătrată din


DAF. Cu cât valoarea coeficientului este mai mare, cu atât calitatea ajustării este mai bună.
Figura 2. Descompunerea stresului brut normalizat

Descompunerea stresului ne ajută să identificăm care sunt sursele şi obiectele care


contribuie mai mult la valoarea stresului.

Sursele care contribuie mai mult la valoarea stresului sunt sursele 1 şi 2 (grupele care
au aranjat termenii o singură dată). Studenţii care au aranjat termenii de două ori au avut în
vedere anumiţi factori pentru prima sortare şi alţi factori pentru a doua sortare.

Obiectele care contribuie mai mult la valoarea stresului sunt Brother, Granddaughter,
Grandfather, Grandmother, Grandson, şi Sister. Aceştia sunt termenii cu o valoare a gradului
de separare egal cu 2. Sunt persoanele care nu fac parte din nucleul familial (Mother, Father,
Daughter, Son) dar sunt totuşi mai apropiate decât alte rudenii. Această poziţie intermediară
poate explica sortarea diferită a acestor termeni.
Coordonatele finale în spaţiul comun
Reprezentarea vizuală a legăturilor dintre obiecte este observată în graficul comun.

Figura 1. Coordonatele în spaţiul comun (harta perceptuală)

Graficul obiectelor pe dimensiunile 1 şi 3 arată că dimensiunea 1 (axa Ox) este


corelată cu variabila gender. De la stânga la dreapta se observă că dimensiunea 1 separă
termenii feminini de termenii masculini, iar termenul Cousin se observă în mijloc.

Dimensiunea 3 (pe axa Oy) este corelată cu gener. De jos în sus, valorile de pe axă
corespund cu termenii care sunt mai în vârstă (arborele genealogic).

Dacă observăm obiectele pe dimensiunile 2 şi 3, atunci dimensiunea 2 (axa Oy)


corespunde variabilei degree, unde valorile mai mari pe axă corespund cu termenii care sunt
mai îndepărtaţi de „nucleul” familial.
Soluţia cu 3 dimensiuni fără transformări implicite
În soluţia anterioară am folosit transformările implicite pentru proximităţi şi
transformări Interval pentru variabilele independente gener şi degree.

Putem opta pentru o transformare ordinală în loc de transformare liniară.

1. Pentru scalarea proximităţilor şi transformarea variabilelor gener, şi degree prin


opţiunea Ordinal deschidem fereastra Multidimensional Scaling şi alegem Model.

Figura 1. Fereastra de dialog Model

2. În fereastra de dialog Model, se alege Ordinal în grupul Proximity Transformations.


3. Se face click pe Continue.
4. Se face click pe Restrictions în fereastra de dialog Multidimensional Scaling.
Figura 2. Fereastra de dialog Restrictions

5. În fereastra de dialog Restrictions, se alege gener şi degree.


6. Se alege Ordinal (keep ties) din lista Independent Variable Transformations.
7. Se face click pe Change.
8. Se face click pe Continue.
9. Se face click pe OK în fereastra de dialog Multidimensional Scaling.
Graficul transformărilor
Dacă graficele sunt aproximativ liniare, atunci transformarea liniară este potrivită.

Se poate verifica valoarea stresului pentru a vedea o posibilă îmbunătăţire a ajustării şi


graficul spaţiului comun pentru o interpretare mai bună.

Figura 1. Transformed proximities

Stress Measures

Valoarea stresului pentru soluţia curentă susţin scalarea proximităţilor la nivel ordinal.

Figura 1. Stress and fit measures

Valoarea stresului brut normalizat pentru soluţia anterioară a fost 0.06234. Prin
scalarea variabilelor în soluţia curentă stresul se înjumătăţeşte la 0.03137.
Final Coordinates of the Common Space
Graficele spaţiului comun oferă în esenţă aceeaşi interpretare a dimensiunilor ca
soluţia precedentă.

Figura 1. Common space coordinates

Discuţii
Este mai potrivit să tratăm proximităţile ca variabile ordinale deoarece indicatorul
stres s-a îmbunătăţit.

O posibilă îmbunătăţire a modelului poate fi să opţiunea “untie” pentru variabilele


ordinale, adică să permitem ca la valori echivalente ale variabilelor originale să ocorespundă
valori transformate diferite. De exemplu, pentru sursa 1, proximităţile dintre Aunt şi Son, şi
dintre Aunt şi Grandson sunt egale cu 85. Prin opţiunea “tied” pentru variabilele ordinale, se
impune ca valorile transformate ale acestor proximităţi să fie echivalente, deşi nu există un
motiv anume pentru a asuma acest lucru. Prin opţiunea „untied”, se permite ca proximităţile
să nu fie legate între ele şi se elimină această restricţie care nu este necesară.