Documente Academic
Documente Profesional
Documente Cultură
Utilizare
CondiŃii
Aranjarea datelor
1/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Rezultate
2/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Utilizare
Acest test se utilizează atunci când se doreşte compararea a două proporŃii obŃinute
pentru o variabilă dihotomică.
Exemplu: În urma unui studiu cu privire la interesul faŃă de fenomenele paranormale,
efectuat în rândul studenŃilor de la Universitate, comparativ cu studenŃii de la Politehnică, se
înregistrează următoarele rezultate1:
• La psihologie: 25 studenŃi „nu cred” în fenomenele paranormale, iar 175
„cred”
• La politehnică: 124 „nu cred” în fenomenele paranormale, iar 32 „cred”
Problema cercetării este dacă diferenŃa dintre cei „cred” în fenomenele paranormale
din cele două categorii de studenŃi este semnificativă.
Aranjarea datelor
Datele pot fi introduse fie caz cu caz, existând o variabilă pentru opinia faŃă de
fenomenele paranormale şi una pentru tipul de instituŃie de învăŃământ, fie ca în imaginea de
mai jos, care presupune o prealabilă sintetizare a datelor:
Este important de reŃinut faptul că toate variabilele trebuie să fie numerice. În baza de
date de mai sus, variabila paranorm ia valoarea 1 pentru „cred” şi valoarea 2 pentru
„nu cred”, iar variabila stud_la are valoarea 1 pentru Universitate şi 2 pentru
Politehnică.
Valorile variabilelor au fost etichetate corespunzător, iar afişarea etichetelor în locul
valorilor, în celulele tabelului de date, a fost obŃinută cu setarea View-Value labels
din meniul SPSS Data Editor. De reŃinut că, deşi afişează etichetele, SPSS va opera în
calcule cu valorile.
1
Datele nu sunt reale
3/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Efectul de ponderare (weight) a unei variabile rămâne activ atâta timp cât nu se
ponderează o altă variabilă sau nu se anulează ponderarea efectuată. La salvarea
fişierului se salvează şi variabila ponderată. Includerea variabilei ponderate în diverse
proceduri de analiză are efecte specifice.
Dacă datele ar fi fost introduse în baza de date caz cu caz, operaŃia Wheight nu ar mai
fi fost necesară.
Rezultate
4/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
175 32
pa − pb = − = 0.875 − 0.205 = +0.67
200 156
Decizia statistică se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normală, pentru test unilateral sau bilateral. În cazul nostru, pentru test
bilateral, cu alfa=0.05, z calculat (12.71) este mai mare decât z critic (1.96), fapt care permite
respingerea ipotezei de nul şi confirmarea ipotezei că studenŃii de la Universitate „cred” într-o
măsură semnificativ mai mare în fenomenele paranormale decât studenŃii de la Politehnică.
A. 3 Testul semnului
Utilizare
Testul semnelor este utilizat pentru a testa diferenŃa dintre valori, utilizându-se
semnul diferenŃei şi nu valoarea acesteia, atunci când ambele valori sunt măsurate pentru
aceiaşi subiecŃi. Dacă nu ar exista nici o diferenŃă între valorile perechi, atunci numărul
diferenŃelor pozitive ar trebui să fie egal cu cel al diferenŃelor negative. Cu cât numărul
diferenŃelor de un anumit semn este mai mare, comparativ cu cel al diferenŃelor de semn opus,
cu atât creşte probabilitatea ca diferenŃa dintre variabile să fie statistic semnificativă.
Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării,
subiecŃilor (N=8) li se cere să memoreze cuvinte dintr-o listă, înainte si după introducerea
unui factor motivant. Dat fiind faptul că numărul subiecŃilor este prea mic pentru asumarea
normalităŃii distribuŃiei de eşantionare, se alege testul semnului în locul testului t pentru
eşantioane dependente.
CondiŃii
Variabilele vor fi de tip numeric, iar valorile exprimate în aceeaşi unitate de măsură,
pentru a se putea face diferenŃa lor.
Aranjarea datelor
Imaginea de mai jos conŃine variabilele „inainte” şi „dupa”, care vor fi analizate.
5/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Rezultate
Tabelul Sign Test cuprinde numărul diferenŃelor pozitive, respectiv negative, pentru
cazurile din baza de date. În cazul nostru, există 7 diferenŃe pozitive şi nici o diferenŃă
negativă.
6/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Utilizare
Testul chi-pătrat este utilizat pentru evidenŃierea gradului de asociere între două
variabile categoriale.
Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaŃilor, pasageri
într-un avion care a suferit un accident la aterizare, fără victime, diagnosticaŃi cu sindrom de
stres posttraumatic (PTSD). FrecvenŃele absolute sunt cele din următorul tabel de
corespondenŃă:
Femei BărbaŃi
PTSD 40 20
Non-PTSD 10 30
Problema cercetării este dacă incidenŃa PTSD este în legătură cu caracteristica de sex.
CondiŃii
• Variabile categoriale, care pot fi exprimate, fie prin valori numerice, fie prin
valori de tip string (caracter tipăribil)
• Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecŃi care
să fie incluşi în mai mult de o celulă de tabel).
• Este recomandabil ca frecvenŃa aşteptată să nu ia valori mai mici de 5 (sau,
cel puŃin, în nu mai mult de 20% din celule).
• Nici o celulă nu trebuie să aibă frecvenŃa aşteptată 0..
Aranjarea datelor
Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau când
există deja o statistică globală a fenomenului PTSD în raport cu sexul.
7/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, atât pentru sex cât şi pentru PTSD, valorile fiind
etichetate. Faptul că în celule apar etichetele şi nu valorile, se obŃine prin setarea Data-Value
Labels.
Procedura: Statistics-Summarize-Crosstabs...
Rezultate
8/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) şi, în
special, pragul de semnificaŃie al acestuia (p=0.000 care va fi citit ca p<0.001). În cazul
particular al acestui exemplu, unde tabelul de corespondenŃă este format din două linii şi două
coloane, valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction (15.04) cu
valoarea aferentă a pragului de semnificaŃie: p<0.0005.
Valoarea lui p pentru testului chi-pătrat fiind mai mică decât nivelul alfa 0.05, se
respinge ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenŃă mai mare a reacŃiei
de stres posttraumatic la femei decât la bărbaŃi.
9/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Utilizare
Aranjarea datelor
10/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Procedura: Statstics-NonParametric-Tests-Chi-Square...
Rezultate
Utilizare
11/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
evaluare a depresiei. Acelaşi chestionar a fost aplicat din nou, peste trei zile. Obiectivele
studiului sunt:
a. verificarea ipotezei că cele două tipuri de drog (Ecstasy şi alcool) au efecte
depresante diferite între ele;
b. Ecstazi are un efect depresant pe termen lung, mai mare decât alcoolul.
În acest scop vor trebui comparate valorile la depresie ale celor două grupuri. Această
analiză va fi efectuată atât pentru valorile depresiei de la prima măsurare cât şi pentru cele de
la a doua evaluare a depresiei (după trei zile).
Aranjarea datelor
Se cuvine să precizăm că, în mod normal, datele de acest tip ar conduce la utilizarea
testului t pentru eşantioane independente. Cu toate acestea, având în vedere volumul foarte
mic al eşantionului, utilizarea unui test neparametric este de preferat.
12/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Rezultate
Tabelul Ranks oferă informaŃii sintetice despre cele două variabile: volumul
grupurilor, media rangurilor şi suma rangurilor.
Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele două
variabile testate simultan, depresia imediată şi remanentă. Valorile de interes din tabel sunt
cele ale lui Z şi nivelul de încredere p. În cazul nostru, se observă că depresia imediată nu
diferă semnificativ în funcŃie de tipul de drog utilizat, în timp ce depresia remanentă este
semnificativ diferită, mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool
(conform datelor din tabelul anterior).
Utilizare
13/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
consumatori (Ecstasy, respectiv alcool) în cele două momente diferite (imediat şi după trei
zile).
Dacă testul Mann-Whitney a verificat ipoteza diferenŃei dintre categorii de
consumatori (eşantioane independente), testul Wilcoxon va permite testarea ipotezei că
depresia este diferită de la un moment la altul în cadrul fiecărei categorii de consumatori în
parte (eşantioane dependente).
Facem precizarea că aceste două teste nu trebuie întotdeauna utilizate împreună,
succesiv, ca în exemplul acestui studiu. Dacă facem aici acest lucru, este numai pentru că ne-
am propus două obiective distincte, fiecare fiind testat cu o procedură diferită, în funcŃie de
natura eşantioanelor comparate.
Aranjarea datelor
În locul setării implicite Analyze all cases, do not create groups, se bifează opŃiunea
Compare groups şi se declară variabila ale cărei valori vor servi drept criteriu de împărŃire a
bazei de date în grupuri de analiză separată (în cazul nostru, tipul de drog) prin trecerea ei în
zona Groups Based on:. Efectul acestei acŃiuni este acela că toate prelucrările care vor fi
efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin valorile
variabilei.
OperaŃiunea de împărŃire a bazei de date nu are semne vizibile pe ecran, fapt care
poate face să fie uitată şi, astfel, atunci când se revine la prelucrări care ar trebui să
implice toată baza de date rezultatele vor fi incorecte. De aceea, se va avea în vedere
revenirea la setarea Analyze all cases, do not create groups atunci prelucrarea pe
grupuri a bazei de date nu mai este becesară.
14/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Se bifează opŃiunea pentru testul Wilcoxon (care este, de fapt, cea implicită)
Rezultate
Tabelul Ranks oferă informaŃii sintetice despre rangurile pozitive şi negative pentru
cele două grupuri, numărul subiecŃilor, media rangurilor şi suma lor.
Tabelul Test Statistics prezintă valorile comparative ale depresiei pentru cele două
grupuri. Aşa cum se observă, diferenŃa este semnificativă (p=0.007) în cazul consumatorilor
de Ecstasy şi nesemnificativă (p=0.053), în cazul consumatorilor de alcool. Concluzia
generală a studiului este aceea că Ecstasy, comparativ cu alcoolul, are un efect depresiv mai
mare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul Wilcoxon).
Aducem aminte că testul Wilcoxon presupune calcularea a două valori, T(+) pentru
diferenŃa pozitivă a rangurilor şi T(-) pentru diferenŃa negativă a rangurilor, cea mai mică
dintre ele fiind considerată valoarea testului. În exemplul nostru, testul Wilcoxon pentru
Ecstazy a fost calculat "pe baza rangurilor negative" (vezi nota a. de sub tabel), ceea ce
înseamnă că acestea au fost mai puŃine, iar cele pozitive au fost mai multe. Ori, diferentele
pozitive de rang exprima valori ale depresiei mai mari după trei zile decât după o zi. Asta,
deoarece SPSS atribuie rangul 1 valorii celei mai mici, şi rangul cel mai mare valorii celei
15/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
mai mari din distribuŃie. Ca urmare, este corect să concluzionăm că rezultatul testului indică o
valoare semnificativ mai mare a depresiei după trei zile decât după o zi.
Utilizare
16/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Rezultate
Rezultatul testului, afişat în tabelul Test Statistics se exprimă printr-o valoare chi-
pătrat (6.33) cu două grade de libertate şi p=0.042. Ca urmare, ipoteza de nul poate fi
respinsă. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de familie)
îşi pune amprenta asupra expresivităŃii emoŃionale a copiilor de vârstă preşcolară.
Utilizare
Testul Friedman se utilizează pentru testarea diferenŃei de rang în cazul unei variabile
măsurate repetat, de mai mult de două ori, pe acelaşi grup de subiecŃi. El este echivalentul
testului ANOVA pentru măsurări repetate, pentru date parametrice. Dacă este utilizat pentru
doar două măsurări repetate, rezultatul său este echivalent cu al testului Wilcoxon.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti.
Capacitatea de memorare de cuvinte este măsurată la trei înălŃimi diferite: 1000m, 3000m şi
6000m. Problema cercetării este dacă diferenŃa de performanŃă de memorare corespunzătoare
celor trei înălŃimi este semnificativă. Dat fiind volumul extrem de mic am eşantionului (N=5),
efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul le testul Friedman este
pe deplin justificat.
Aranjarea datelor
17/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Se setează opŃiunea Friedman, iar variabilele testate sunt trecute în lista Test
Variables:
Rezultate
Primul tabel prezintă media rangurilor pe înălŃimi (rangul 1 este atribuit valorii celei
mai mici). În al doilea tabel găsim valoarea testului Friedman exprimată în valori chi-pătrat
(8.40), având un nivel de semnificaŃie p=0.015. Acest rezultat permite respingerea ipotezei
de nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălŃimea (pe cele trei
niveluri avute în vedere).
Utilizare
Aranjarea datelor
18/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
Procedura: Statistics-Corelation-Bivariate
Rezultate
19/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)
sunt dublate. Este de la sine înŃeles că în practică nu vom utiliza decât unul dintre aceşti
coeficienŃi de corelaŃie a rangurilor.
Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaŃia
dintre memorie şi decizie la acelaşi palier de înălŃime. Pentru a fi mai vizibile, am îngroşat
valorile utile analizei. În jumătatea de sus a tabelului, avem corelaŃiile pentru testul Kendall
iar în jumătatea de jos pe cele ale testului Spearman.
Testul Kendall al corelaŃiei dintre memorie şi decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienŃilor de corelaŃie este extrem de
important să se ia în considerare, simultan, semnul şi semnificaŃia variaŃiei valorilor. În cazul
nostru, valori mari ale memoriei, înseamnă o capacitate de memorare mai bună iar valori mari
ale timpului de decizie înseamnă capacitate de decizie mai proastă (sub aspectul vitezei,
desigur). În consecinŃă, un coeficient de corelaŃie negativ între aceste variabile indică, de fapt,
o variaŃie concomitentă pozitivă a memoriei şi vitezei deciziei (când capacitatea de memorare
scade, şi decizia este mai lentă, timpul de decizie fiind mai mare).
Analiza coeficienŃilor din tabelul de mai sus arată existenŃa unei corelaŃii de rang
semnificative (p<0.05) între memorie şi decizie la toate palierele de înălŃime.
Dacă facem comparaŃia dintre coeficienŃii Spearman şi Kendal, vom vedea că, deşi ei
diferă valoric, semnificaŃiile se află, în toate cazurile, de aceeaşi parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficienŃi rămâne la
latitudinea cercetătorului.
20/20
Actualizat la: 08.11.2006/12:13:21