Sunteți pe pagina 1din 27

Capitolul 12 Testele neparametrice pentru date ordinale

Doi studeni discutau ntr-o diminea n drum spre facultate despre performanele
sportivilor romni la Jocurile Olimpice de la Rio din 2016, subiectul principal fiind importana
condiiilor de pregtire i a antrenamentului intensiv n perioada copilriei. Ambii studeni erau
de acord c performana poate fi obinut doar dac antrenamentele sunt desfurate dup
strategii moderne i folosind tehnologii de ultim or n pregtirea fizic i a recuperrii de dup
efort. ns, aveau opinii diferite n ceea ce privete rolul antrenamentelor intensive n timpul
copilriei.
- Cred c antrenamentele intensive pentru copii care fac sport de performan sunt decisive
n obinerea performanei.
- Nu cred. Sunt sigur c printre finalitii probelor de la Jocurile Olimpice sunt sportivi care
nu au fcut antrenamente intensive cnd erau copii.
- n regul. Se pare c avem opinii diferite. Hai s operaionalizm expresia antrenamente
intensive n timpul copilriei.
- S spunem c antrenament intensiv ar nsemna mai mult de dou ore n fiecare zi, iar prin
copilrie ne referim la perioada 10-12 ani.
- Da, pare rezonabil. Acum, hai s alegem un sport i s facem o analiz. Propun s
discutm despre juctorii de tenis, deoarece competiiile sunt sptmnale i clasamentul
este uor de neles.
- Sunt de acord. Populaia discuiei noastre o reprezint juctorii de tenis de performan,
iar primii 20 de sportivi vor servi ca eantion.
- Aceti sportivi trebuie mprii n dou grupuri pe care s le comparm: cei care au fcut
antrenamente intensive n copilrie i cei care nu au fcut acest lucru. Variabila
dependent este poziia n clasament a juctorului.
- Ne trebuie un test statistic pentru a testa dac diferena dintre mediile poziiilor n
clasament este semnificativ statistic.
- Testul t pentru eantioane independente nu poate fi utilizat deoarece scorurile variabilei
dependente trebuie s se distribuie normal (s ndeplineasc condiia de normalitate). n
cazul nostru distribuia este dreptunghiular, fiecare scor avnd frecvena de 1. n plus,
variabila dependent este msurat pe scal ordinal.
- Cred c un test neparametric este potrivit pentru a compara poziiile n clasament ale
sportivilor.

n capitolele anterioare au fost prezentate testele statistice parametrice, care sunt mult mai
des utilizate n practic, fiind mai solide i asigurnd o ncredere mai mare n interpretarea
rezultatelor. Acestea dispun de o putere mai mare i reduc probabilitatea erorii de tip II. n acelai
timp, testele parametrice solicit ndeplinirea unor condiii pentru a putea fi utilizate (eantion
suficient de mare, variabila dependent trebuie s fie msurat pe scal I/R i s se distribuie
normal). Atunci cnd una din aceste condiii nu este ndeplinit trebui utilizat o alt categorie de
teste statistice, denumite teste neparametrice. Atunci cnd valorile variabilei dependente sunt
msurate pe scal I/R are loc o transformare a acestora n ranguri. Astfel, fiecare valoare este
nlocuit cu poziia (locul) pe care l ocup n distribuie n funcie de mrime. Mai departe se
obine o distribuie cu valori msurate pe scal ordinal.
Utilizarea testelor neparametrice solicit parcurgerea unor etape pe care le cunoatem, paii
utilizai n testarea ipotezelor: emiterea ipotezei de nul, a ipotezei alternative, colectarea datelor,
calcularea probabilitii ca ipoteza de nul s fie adevrat i redactarea i interpretarea rezultatelor.
Cunoscnd aceste raionamente, n seciunile urmtoare vor fi prezentate testele neparametrice
corespunztoare testelor detaliate n capitolele anterioare. Tabelul 12.1 prezint corespondena
dintre testele neparametrice i cele parametrice alturi de contextul n care se aplic aceste teste.

Tabelul 12.1 Corespondena dintre testele parametrice i cele neparametrice


Teste parametrice Teste neparametrice Contextul de cercetare
Testul t pentru Mann-Whitney U Se utilizeaz pentru a testa
eantioane semnificaia statistic a
independente diferenei dintre dou
eantioane independente.
Testul t pentru Wilcoxon Se utilizeaz pentru a testa
eantioane semnificaia statistic a
dependente diferenei dintre dou
eantioane perechi.
ANOVA One-Way Kruskal-Wallis Se utilizeaz pentru a testa
semnificaia statistic a
diferenei dintre mai mult de
dou eantioane
independente.
Corelaia Pearson Spearmans rs Descrie variabilitatea
comun a dou variabile.
ANOVA pentru Friedman Se utilizeaz pentru a testa
msurtori repetate semnificaia statistic a
diferenei dintre mai mult de
dou eantioane
dependente.
Mai exist i alte teste neparametrice pe lng cele care vor fi studiate n acest capitol. Sprent
i Smeeton (2007) au publicat lucrarea Applied Nonparametric Statistical Method n care prezint
multe dintre aceste tehnici. Testele descrise de cei doi autori pot fi utilizate n economie, cercetarea
spaiului cosmic, comer i economie, medicin i n aplicaii ale disciplinelor tradiionale.
Din unele puncte de vedere testele neparametrice i cele parametrice sunt asemntoare, iar
n alte privine sunt diferite. Similaritile sunt urmtoarele:
1. Au acelai obiectiv: de a determina probabilitatea ca eantioanele s provin din aceeai
populaie.
2. Ambele categorii de teste solicit selectarea aleatorie a eantionului.
3. Testele se bazeaz pe logica ipotezei de nul. Dac probabilitatea ipotezei de nul este mai
mic dect pragul vom accepta ipoteza alternativ (a cercetrii).

n ceea ce privete diferenele, testele parametrice ca scorurile obinute la nivelul


eantionului s se distribuie normal, n timp ce testele neparametrice nu solicit acest lucru. De
asemenea, n cazul testelor parametrice ipoteza de nul susine c media eantionului este egal cu
media populaiei sau c eantioanele comparate au aceeai medie. n cazul testelor neparametrice
ipoteza de nul afirm c distribuiile sunt asemntoare. Deoarece distribuiile pot s difere n
ceea ce privete forma, variabilitatea, tendina central sau din toate aceste puncte de vedere,
interpretarea respingerii ipotezei de nul nu este att de clar n cazul testelor neparametrice.
n literatura de specialitate, testele neparametrice mai sunt cunoscute i sub denumirea de
teste libere de distribuie (Spatz, 1992). Deoarece unii autori nu sunt de acord cu aceast
denumire, vom folosi termenul de teste neparametrice.

12.1 Testul Mann-Whitney U

12.1.1 Exemplul de calcul

Acest test este utilizat pentru a determina dac dou seturi de date extrase din eantioane
independente provin din aceeai populaie. Astfel, nelegem c este testul statistic care ar putea fi
utilizat de cei doi studeni pentru a testa dac antrenamentele intensive din copilrie sunt decisive
n obinerea performanei n sport. S ne imaginm c cei doi studeni reuesc s i duc la bun
sfrit cercetarea i obin informaii despre tipul de antrenament desfurat de primii 20 de
tenismeni n perioada 10 12 ani. n tabelul 12.2 sunt prezentate datele recoltate de cei doi studeni.

Tabelul 12.2 Intensitatea antrenamentelor n copilrie pentru primii 20 de tenismeni


Sportiv Poziia n Antrenament
clasament intensiv
N.D. 1 Nu
A.M. 2 Da
R.F. 3 Nu
S.W. 4 Da
R.N. 5 Da
M.R. 6 Da
K.N. 7 Da
T.B. 8 Nu
M.C. 9 Nu
D.T. 10 Da
J.W.T 11 Nu
G.M 12 Nu
D.F 13 Da
D.G. 14 Nu
R.G. 15 Nu
N.K 16 Nu
R.B.A. 17 Da
F.L. 18 Da
B.T. 19 Nu
P.C. 20 Da

Ipoteza de nul susine c distribuia sportivilor care au practicat antrenamente in perioada


copilriei este asemntoare cu a sportivilor care nu s-au antrenat intensiv. n schimb, ipoteza
cercetrii afirm c distribuiilor celor dou categorii de sportivi sunt diferite. Procedura de calcul
solicit calcularea a dou valori U, una pentru grupul sportivilor cu antrenamente intensive (1) i
una pentru sportivii care nu s-au antrenat intensiv (2).
" " + 1
" = " ' + "
2
(formula 12.1)

' ' + 1
' = " ' + '
2
(formula 12.2)

N1 i N2 reprezint volumele celor dou eantioane.


R1 i R2 reprezint suma rangurilor pentru fiecare dintre cele dou grupuri.

Rangul se refer la poziia n distribuie a fiecrui participant, n cazul nostru a fiecrui


sportiv. Astfel, primul sportiv are rangul 1, sportivul de pe locul 4 are rangul 4 .a.m.d. n
continuare vom calcula suma rangurilor pentru cele dou grupuri.

" = 2 + 4 + 5 + 6 + 7 + 10 + 13 + 17 + 18 + 20 " = 102

' = 1 + 3 + 8 + 9 + 11 + 12 + 14 + 15 + 16 + 19 ' = 108

Astfel valorile U1, respectiv U2 vor fi:

10 10 + 1 110
" = 10 10 + 102 " = 100 + 102 "
2 2
= 100 + 55 102 " = 53

10 10 + 1 110
' = 10 10 + 108 ' = 100 + 108 '
2 2
= 100 + 55 108 ' = 47

Valoarea testului Mann-Whitney este dat de valoarea calculat U cea mai mic. Pentru
exemplul nostru valoarea testului Mann-Whitney este U = 47. Decizia statistic se ia prin
compararea valorii U calculate (47) cu valoarea critic U din Anexa 6. Aceasta se va citi n funcie
de nivelul la intersecia dintre N1 i N2. Pentru un prag = 0,05 valoarea Ucitic = 23.
n cazul testului Mann-Whitney decizia statistic se ia dup un principiu opus celui cu care
ne-am obinuit la testele anterioare. Astfel:
Dac Ucalculat > Ucritic se accept ipoteza de nul.
Dac Ucalculat Ucritic se respinge ipoteza de nul.

Deoarece Ucalculat (47) este mai mare dect Ucritic (23) vom accepta ipoteza de nul i vom
respinge ipoteza cercetrii. Concluzia este c performana tenismenilor nu difer semnificativ n
funcie de practicarea antrenamentelor intensive n copilrie.

Atunci cnd volumul unui eantion cuprinde cel puin 21 de participani vom lua decizia
statistic folosindu-ne de curba normal z. Astfel, se va calcula o valoare z cu ajutorul formulei
12.3.
+ 9
=
9
(formula 12.3)
U reprezint valoarea calculat cea mai mic.
c = 0,5.
= =
U = > ?
'
=> =? (=> B =? B")
U =
"'

Cnd folosim scorul z, pentru a lua decizia statistic vom compara valoarea calculat a lui z
cu valorile critice de pe curba normal.

Tabelul 12.3 Criteriile deciziei statistice pentru scorul z


Accept H0 Resping H0
0,05 unilateral z < 1,65 z 1,65
0,05 bilateral z < 1,96 z 1,96
0,01 unilateral z < 2,33 z 2,33
0,01 bilateral z < 2,58 z 2,58

De cele mai multe ori suntem n situaia de a aplica un test neparametric fr a avea acces
direct la rangurile participanilor, aa cum a fost n cazul celor doi studeni, datele fiind exprimate
pe scal de interval/raport. ntr-o astfel de situaie realizm o transformare a valorilor nregistrate
n ranguri.
S ne imaginm c un psiholog dorete s studieze n ce msur muzica clasic are un efect
asupra capacitii de memorare. El selecteaz un eantion de 27 de studeni crora le d spre
memorare o list de cuvinte. Participanii sunt mprii n dou grupuri: 15 studeni au memorat
lista ascultnd muzic clasic, iar 12 au memorat lista ntr-un mediu fr fundal sonor. n tabelul
12.5 se regsesc valorile nregistrate de cercettor n urma recoltrii datelor. Rangurile sunt
atribuite n funcie de poziia respondentului dup ordonarea cresctoare sau descresctoare a
valorilor. Putem atribui rangul cel mai mic scorului cel mai mare (primul loc este ocupat de
respondentul cu cea mai bun performan), dar la fel de bine putem atribui rangul cel mai mare
respondentului cu scorul cel mai mare. Cnd valorile sunt distincte fiecare primete un rang propriu
i nu are importan cum atribuim rangul. n schimb, trebuie s fim ateni cum distribuim rangurile
atunci cnd dou sau mai multe valori sunt identice. Aceast atribuire se poate face n trei moduri,
iar tabelul 12.4 cuprinde exemplificarea acestora. n SPSS, cu ajutorul procedurii Transform
Rank Cases putem folosi oricare dintre metodele prezeatate.
atribuirea rangului mediu toate valorile identice primesc un rang egal cu media aritmetic
a rangurilor cuvenite scorurilor identice. De exemplu, dac avem dou valori identice, iar
pentru prima primul rang disponibil este 10, iar pentru a doua 11, vom atribui ambelor
valori rangul 10,5. Urmtoarea valoare va primi rangul 12.
Atribuirea rangului cel mai mic sau a celui mai mare toate valorile identice primesc
rangul cel mai mic (cel ce corespunde primei valori) sau rangul cel mai mare (cel care
corespunde ultimei valori identice). Folosind exemplul de mai sus, fie ambele valori
primesc rangul 10, fie primesc rangul 11. Urmtoarea valoare va primi rangul 12.
Atribuirea secvenial presupune ca valorile identice s primeasc primul rang disponibil,
iar valoarea distinct ce urmeaz primete rangul imediat urmtor. n exemplul nostru,
valorile identice primesc rangul 8, iar urmtoarea valoare distinct primete rangul 9. n
urma unei astfel de atribuiri va rezulta un numr de ranguri mai mic dect numrul valorilor
din distribuie.

Tabelul 12.4 Atribuirea rangurilor pentru valori identice


Scor Rangul mediu Rangul mic Rangul mare Rang secvenial
22 1 1 1 1
21 2,5 2 3 2
21 2,5 2 3 2
20 4 4 4 3
19 6 5 7 4
19 6 5 7 4
19 6 5 7 4
18 8,5 8 9 5
18 8,5 8 9 5
17 10 10 10 6
16 11 11 11 7
14 12 12 12 8
12 13 13 13 9

Revenind la exemplul cu efectul muzicii clasice asupra memoriei, vom atribui rangurile
folosind metoda rangului mediu i vom ncepe prin a atribui rangul cel mai mic valorii celei mai
mari (cele mai multe cuvinte memorate primesc poziia 1).

Tabelul 12.5 Cuvintele memorate, rangurile i condiia experimental


Cuvinte Condiia de
Rang
memorate memorare
24 1 Fr muzic
23 2,5 Cu muzic
23 2,5 Cu muzic
22 4,5 Cu muzic
22 4,5 Fr muzic
21 6,5 Fr muzic
21 6,5 Cu muzic
20 8,5 Cu muzic
20 8,5 Cu muzic
19 10 Fr muzic
18 11,5 Fr muzic
18 11,5 Fr muzic
17 13 Cu muzic
16 14,5 Cu muzic
16 14,5 Cu muzic
15 16 Fr muzic
14 18 Cu muzic
14 18 Fr muzic
14 18 Cu muzic
12 20 Fr muzic
11 21,5 Cu muzic
11 21,5 Fr muzic
10 23 Fr muzic
9 24,5 Cu muzic
9 24,5 Fr muzic
8 26 Cu muzic
7 27 Cu muzic

n continuare vom calcula valoarea testului Mann-Whitney. Pentru respondenii care au fcut
parte din eantionul care au memorat ascultnd muzic clasic oferim codul 1, iar pe cei care nu
au avut fond muzical n momentul memorrii i notm cu 2. n prima etap vom calcula suma
rangurilor pentru cele dou eantioane.


" = 2,5 + 2,5 + 4,5 + 6,5 + 8,5 + 8,5 + 13 + 14,5 + 14,5 + 18 + 18 + 21,5 + 24,5

+ 26 + 27 " = 210

' = 1 + 4,5 + 6,5 + 10 + 11,5 + 11,5 + 16 + 18 + 20 + 21,5 + 23 + 24,5

' = 168

Acum putem calcula valorile U1, respectiv U2.

" " + 1 15 15 + 1
" = " ' + " " = 15 12 + 210 "
2 2
240
= 180 + 210 " = 180 + 120 210 " = 90
2

' ' + 1 12 12 + 1
' = " ' + ' ' = 15 12 + 168 '
2 2
156
= 180 + 168 ' = 180 + 78 168 ' = 90
2

Pentru a fi siguri c rangurile au fost atribuite corect i c nu s-a greit


la calcule se pot face dou verificri. n primul rnd, rangul ultimei
valori trebuie s fie egal cu volumul total al eantionului (N1 + N2).
Apoi, " + ' trebuie s fie egal cu N*(N+1)/2.
Deoarece U1 = U2 este de la sine neles c valoarea calculat a testului este 90. Aceast
valoare va fi comparat cu valoarea critic tabelar care se va citi la intersecia coloanei 15 cu linia
12, pentru = 0,05. Astfel, Ucritic = 49. Ca urmare a faptului c Ucalculat (90) este mai mare dect
Ucritic (49) vom accepta ipoteza de nul i vom respinge ipoteza cercetrii. n concluzie,
performana mnezic pe fondul muzicii clasice nu este semnificativ diferit de cea obinut n
condiii de linite.

12.1.2 Testul Mann-Whitney cu SPSS

Dup cum ne-am obinuit, nainte de a aplica testul statistic trebuie conceput baza de date.
Aceasta se construiete la fel ca n cazul testului t pentru eantioane independente. Vom crea
variabila performan (tip numeric, scal de interval/raport) i variabila condiie (cu etichetarea
convenional 1 = cu muzic i 2 = fr muzic), dup care vom introduce datele din tabelul 12.5.

Transformarea n valorilor variabilei performan (msurat pe scal I/R) n ranguri se


realizeaz cu ajutorul procedurii Rank Cases din meniul Transform. Apoi vom muta variabila pe
care dorim s o transformm (performan) n seciunea Variables. n seciunea Assign Rank 1
to, prin selectarea opiunii Largest Value vom atribui rangul 1 valorii celei mai mari. n meniul
Rank Types prin bifarea opiunii Rank vom face atribui valorilor rangul mediu, precum n tabelul
12.4. La finalizarea operaiunii n baza de date va aprea automat variabila Rperform care
cuprinde rangurile valorilor introduse pentru variabila performan.
Pentru a aplica testul folosim meniul Analyze Nonparametric Test Legacy Dialogs
2 Independent Samples. n zona Test Variable List vom trece variabila dependent, iar n
zona Grouping Variable vom insera variabila independent. Apoi intrm n caseta Define
Groups, unde la Group 1 vom trece eticheta eantionului care a memorat cuvintele pe fond
muzical, iar la Group 2 vom trece eticheta grupului care a memorat fr fundal sonor.
n fereastra de afiare a rezultatelor, tabelul Ranks ne prezint statistica descriptiv pentru
variabila dependent innd cont de ranguri.

N reprezint volumul eantionului.


Mean Rank afieaz media rangurilor pentru fiecare dintre cele dou grupuri.
Sum of Rank reprezint suma rangurilor din fiecare eantion.

Tabelul Test Statistics afieaz valoarea calculat a testului i probabilitatea asociat a


acestuia.
Mann-Whitney U reprezint valoarea calculat a testului.
Wilcoxon W reprezint valoarea calculat a testului Wilcoxon (un test ce funcioneaz
dup un algoritm de calcul asemntor cu Mann-Whitney).
Z este o convertire a valorii calculate a testului Wilcoxon ce poate fi comparat cu valorile
critice ale curbei normale.
Asym. Sig. (2-tailed) este probabilitatea asociat testului. Atunci cnd aceasta este mai
mic sau egal cu pragul vom respinge ipoteza de nul, iar cnd este mai mare dect
vom accepta ipoteza de nul. n cazul nostru, probabilitatea asociat testului (1,00) este mai
mare dect 0,05 i vom accepta ipoteza de nul.

12.2 Testul Wilcoxon

12.2.1 Exemplu de calcul

Acest test este echivalentul neparametric al testului t pentru eantioane dependente. n


Capitolul 8 am specificat faptul c exist trei situaii n care poate fi utilizat un astfel de test:
repetri msurate (nainte-dup), perechi naturale i modelul intra-subiect. Este important s
cunoatem contextul n care se aplic acest test pentru a putea face distincia ntre testul Wilcoxon
i testul Mann-Whitney.
Rezultatul testului Wilcoxon este o valoare T, care nu trebuie confundat cu scorul standard
T, i care se interpreteaz prin compararea cu valoarea critic tabelar. Aceasta din urm este
stabilit n funcie de volumul eantionului (N) i pragul (Anexa 7). Procedura de calcul a testului
Wilcoxon presupune parcurgerea unor pai, unii fiind asemntori cu cei de la testul Mann-
Whitney, alii fiind diferii.

Psihologul unei fabrici este interesat s studieze efectul concediului de odihn asupra
productivitii n munc ( = 0,05, bilateral). Acesta msoar productivitatea timp de o sptmn
nainte de plecarea n concediu a angajailor i o sptmn dup revenirea la locul de munc. n
tabelul 12.6 sunt sintetizate datele strnse de psiholog. Procedura de calcul se desfoar astfel:
Se calculeaz diferena dintre rezultatele obinute la a doua msurtoare i cele obinute la
prima evaluare.
Diferena obinut este transformat n valoare absolut astfel nct toate diferenele vor
deveni pozitive.
Rezultatele obinute la etapa anterioar sunt transformate n ranguri folosind una din
metodele descrise la testul Mann-Whitney. n tabelul 12.6 s-a utilizat atribuirea rangului
mediu, rangul 1 fiind atribuit valorii celei mai mici.
Atunci cnd avem o diferen egal cu 0 aceasta nu se ia n considerare i volumul
eantionului scade cu 1. Atunci cnd aveam dou diferene egale cu 0, una primete rangul
1,5, iar cea de a doua va primi rangul +1,5. Cnd sunt trei diferene egale cu 0, una din ele
este eliminat, iar celelalte dou primesc rangurile +1,5, respectiv -1,5. Ali autori
recomand eliminarea diferenelor egale cu 0 i reducerea volumului eantionului cu
numrul de perechi egale. Programul SPSS elimin perechile egale atunci cnd calculeaz
acest test statistic.
Se noteaz semnul diferenei obinute n prima etap.
Se calculeaz suma rangurilor pentru diferenele pozitive T(+), respectiv cele negative T(-
).
Valoarea cea mai mic reprezint valoarea calculat a testului i va fi comparat cu
valoarea critic.

Tabelul 12.6 Procedura de calcul pentru testul Wilcoxon


nainte Dup Dup - nainte Modulul Rangul Semnul
diferenei diferenei diferenei
14 14 0 0 Eliminat
20 10 -10 10 8 -
16 19 3 3 2 +
15 10 -5 5 5 -
17 12 -5 5 5 -
19 19 0 0 Eliminat
10 14 4 4 3 +
15 10 -5 5 5 -
17 9 -8 8 7 -
16 18 2 2 1 +

T + = 2 + 3 + 1 T(+) = 6
T = 8 + 5 + 5 + 5 + 7 T() = 30

Valoarea calculat a testului este valoarea T cea mai mic, n exemplul nostru 6. Valoarea
critic tabelar o vom citi n Anexa 8 n funcie de volumul eantionului (N = 8) i = 0,05
bilateral. Astfel, Tcritic este egal cu 4. Decizia statistic se i-a ntr-o manier asemntoare cu cea
de la testul Mann-Whitney. Ipoteza de nul afirm c suma rangurilor pozitive este egal cu suma
rangurilor negative.
Atunci cnd valoarea calculat este mai mic sau egal cu valoarea critic, se respinge
ipoteza de nul, iar ipoteza cercetrii se confirm.
Cnd valoare calculat este mare dect valoarea critic, se accept ipoteza de nul, iar
ipoteza cercetrii nu se confirm.

n exemplul nostru, valoarea calculat este T(+) = 6. Aceasta este mai mare dect valoarea
Tcritic = 4. Prin urmare, acceptm ipoteza de nul i respingem ipoteza cercetrii. Vom concluziona
c nu exist diferene semnificative ntre performana angajailor nainte de a pleca n concediu i
cea obinut la revenirea la locul de munc.
Atunci cnd exist diferene semnificative ntre cele dou perechi de valori, concluziile
trebuie enunate n funcie de modul n care au fost atribuite rangurile, deoarece vom ine cont de
valoarea care a primit rangul 1. n cazul nostru, rangul 1 a fost atribuit valorii celei mai mici.
Deoarece suma rangurilor pentru diferenele negative este 30, iar cea pentru diferenele pozitive
este 6 putem nelege c angajaii au performat mai slab la revenirea din concediu, diferena fiind
nesemnificativ statistic.

La fel ca n cazul testului Mann-Whitney, atunci cnd avem un eantion cu mai mult de 50
de participani calculm un scor Z pe care l vom compara cu valorile critice tabelare ale lui z n
funcie de nivelul lui .
+ H
=
H
(formula 12.4)
T = este valoarea calculat a testului Wilcoxon (cea mai mic sum a rangurilor).
c = 0,5.
= (=B")
H =
I
= =B" ('=B")
H =
'I

12.2.2 Testul Wilcoxon n SPSS

Aranjarea bazei de date implic crearea a dou variabile care vor primi rezultatele
nregistrate n evaluarea performanei nainte de concediu (nainte), respectiv la revenirea din
concediu (dup).

Aplicarea testului Wilcoxon se face din meniul Analyze Nonparametric Tests


Legacy Dialogs 2 Related Samples. Variabilele vor fi mutate n zona Test Pairs n csuele
Variable 1, respectiv Variable 2. Indiferent cum vom poziiona cele dou variabile n zona Test
Pairs, SPSS va face diferena Variable 2 Variable 1.
n fereastra OutPut, tabelul Ranks prezint informaii descriptive despre rangurile negative
i negative (numrul de cazuri, media, respectiv suma rangurilor). Ties indic numrul de perechi
egale.

n tabelul Test Statistics sunt afiate rezultatele testului. Z (-1,689) reprezint o transformare
a scorului obinut prin nsumarea rangurilor pozitive, acestea avnd valoarea cea mai mic.
Reamintim c valoarea calculat a testului este dat de suma rangurilor cea mai mic. Asymp. Sig.
(2-tailed) este probabilitatea asociat testului. Deoarece aceasta din urm este mai mare dect =
0,05 vom accepta ipoteza de nul i vom concluziona c nu exist diferene semnificative la nivelul
performanei angajailor la ntoarcerea din concediu.
12.3 Testul Kruskal-Wallis pentru mai mult de dou eantioane independente

12.3.1 Exemplu de calcul

Acest test este echivalentul neparametric al testului de analiz de varian uni-factorial


(ANOVA One-Way). Presupunem c un psiholog este interesat s studieze dac exerciiile fizice
au un rol asupra depresiei ( = 0,01). Acesta i mparte pe cei 15 pacieni cu depresie n trei grupuri:
n unul n care pacienii nu vor face exerciii fizice, n al doilea eantion participanii care vor
alerga uor timp de 20 de minute i un grup n care participanii vor alerga uor timp de 45 de
minute. Variabila independent este grupul experimental (1 = fr exerciii; 2 = 20 de minute; 3 =
45 de minute), n timp ce scorul obinut la chestionarul pentru evaluarea depresiei este variabila
dependent. Datele nregistrate de psiholog se regsesc n tabelul 12.7. Avnd n vedere c
psihologul aplic un chestionar pentru a msura depresia, trebuie s transformm scorurile obinute
n ranguri. Acestea vor fi calculate prin atribuirea rangului mediu, fr a ine cont de grupul din
care fac parte valorile i prin atribuirea rangului 1 valorii celei mai mici.

Tabel 12.7 Scorul pentru depresie i rangul corespunztor


Grup experimental Scor depresie Rang
Fr exerciii 33 11
Fr exerciii 38 14,5
Fr exerciii 25 3,5
Fr exerciii 29 7
Fr exerciii 30 9
20 de minute 34 12
20 de minute 36 13
20 de minute 38 14,5
20 de minute 23 2
20 de minute 16 1
45 de minute 30 9
45 de minute 28 6
45 de minute 27 5
45 de minute 25 3,5
45 de minute 30 9

Formula de calcul pentru testul Kruskal-Wallis este:


12 K'
= 3 ( + 1)
( + 1) K
(formula 12.5)

N reprezint volumul total al eantionului.


Tc este suma rangurilor care va fi calculat pentru fiecare grup.
nc este volumul fiecrui grup (n1 + n2 ++ nk = N)

Acum vom calcula suma rangurilor pentru fiecare grup.


" = 11 + 14,5 + 3,5 + 7 + 9 " = 45
' = 12 + 13 + 14,5 + 2 + 1 ' = 42,5
M = 9 + 6 + 5 + 3,5 + 9 M = 32,5

Revenind la formula de mai sus i nlocuind valorile corespunztoare obinem:


12 45' 42,5' 32,5'
= + + 3 16
15 16 5 5 5
12
= 405 + 361,25 + 211,25 48 = 0,05 977,5 48
240
= 48,875 48 = 0,875

IMPORTANT

Scorul H poate avea doar valori mai mari sau egale cu 0. Cu ct valoarea scorului H este mai
mare cu att grupurile supuse comparaiei sunt mai diferite ntre ele.

Scorul H calculat va fi comparat cu valoarea critic tabelar. Pentru situaiile n care cel puin
unul din eantioane are minim 6 participani, valoarea critic se citete din tabelul de la Anexa 8
n funcie de numrul de grade de libertate (df = numrul de grupuri - 1) i pragul . Atunci cnd
toate eantioanele au sub 6 participani valoarea critic se citete dintr-un tabel special (Anexa 9)
n funcie de volumul fiecrui grup i nivelul pragului . Vom citi din tabel valoarea critic de la
intersecia linie cu cte 5 participani n fiecare grup (ultima linie) cu coloana pentru = 0,01.
Astfel, valoarea critic este egal cu 8,00. Decizia statistic se ia astfel:
Atunci cnd valoarea calculat este mai mic dect valoarea critic acceptm ipoteza de
nul i respingem ipoteza cercetrii.
Atunci cnd valoarea calculat este mai mare sau egal cu valoarea critic vom respinge
ipoteza de nul i ipoteza cercetrii se confirm.

n exemplul nostru H = 0,875 este mai mic dect Hcritic = 8,00 i vom accepta ipoteza de nul.
n concluzie nivelul depresiei pacienilor nu difer semnificativ n funcie de timpul petrecut
efectund exerciii fizice.

12.3.2 Testul Kruskal-Wallis n SPSS

Plecnd de la exemplul de mai sus, baza de date se construiete n aceeai manier c la


ANOVA uni-factorial (vezi capitolul 9.3). Vom introduce dou variabile: variabila independent
grup cu etichetele (1 = fr exerciii fizice; 2 = 20 de minute; 3 = 45 de minute) i variabila
dependent depresie.

Testul se aplic folosind meniul Analyze Nonparametric Tests Legacy Dialogs


K Independent Samples. n seciunea Test Type este bifat opiunea corespunztoare testului
Kruskal-Wallis. Variabila dependent (depresie) va fi mutat n zona Test Variable List, iar
variabila independent (grup) este mutat n zona Define Range. Acionnd butonul Define Range
vom introduce domeniul de valori corespunztor variabilei independente. n exemplul nostru
Minimum 1 i Maximum 3.
n OutPut, tabelul Ranks ne prezin statisticile descriptive pentru variabila descriptiv
(numrul de participani i media rangurilor), separat pentru fiecare grup. Deoarece rangul 1 a fost
atribuit valorii celei mai mici vom putem nelege c cu ct media rangurilor pentru un grup este
mai mare cu att nivelul depresiei pentru acel grup este mai crescut. Tabelul Test Statistics
cuprinde rezultatele testului Kruskal-Wallis. Chi-Squqre (0,884) reprezint valoarea calculat a
testului; df (2) ne indic numrul de grade de libertate i Asymp. Sig. (0,643), simbolizat cu p,
este probabilitatea asociat testului. Deoarece p este mai mare dect pragul = 0,01 vom accepta
ipoteza de nul i vom respinge ipoteza cercetrii. Prin urmare, nivelul depresiei pacienilor nu
difer semnificativ n funcie de durata exerciiilor fizice, dei se observ o scdere a nivelului
depresiei pe msur ce timpul alocat exerciiilor fizice crete.

12.4 Testul Friedman pentru msurtori repetate

12.4.1 Exemplu de calcul

Testul Friedman este utilizat n situaia n care dorim s comparm rezultatele obinute n cel
puin trei condiii pe acelai eantion. Echivalentul parametric al acestui test este ANOVA pentru
msurtori repetate (vezi capitolul 14). S ne imaginm c un profesor este interesat s studieze
anxietatea studenilor nainte de a intra n sesiune. Acesta selecteaz un eantion de 10 studeni
crora le msoar anxietatea n la nceputul fiecrei sesiuni pe parcursul celor trei ani de studii.
Prin urmare, profesorul msoar anxietatea studenilor n ase momente. Datele colectate sunt
sintetizate n Tabelul 12.8. Pentru acest studiu este ales un = 0,05.

Tabelul 12.8 Nivelul de anxietate naintea sesiunilor de examene


ID Semestrul Semestrul Semestrul Semestrul Semestrul Semestrul
I II III IV V VI
1 32 47 24 62 51 22
2 52 52 54 57 67 26
3 56 56 37 36 58 30
4 45 39 64 47 60 35
5 51 52 23 33 34 54
6 34 63 43 43 66 34
7 25 53 33 24 36 63
8 40 25 57 49 62 28
9 42 48 48 45 52 49
10 50 47 69 31 49 64
Datele nregistrate trebuie transformate n ranguri, atribuirea realizndu-se la nivelul fiecrui
participant. Se va atribui rangul 1 valorii celei mai mici, iar pentru valorile egale se va atribui
rangul mediu. De exemplu, n cazul primului participant vom atribui rangul 1 pentru valoarea 22,
rangul 2 pentru scorul 24, 3 pentru 32, 4 pentru 47, 5 pentru 51 i 6 pentru 62. n cazul celui de al
doilea participant atribuim 1 pentru 26, 2,5 pentru cele dou scoruri 52, 4 pentru 54, 5 pentru 57
i 6 pentru 67. n tabelul 12.9 se regsesc scorurile la anxietate transformate n ranguri.

Tabelul 12.9 Transformarea n ranguri a scorurilor la anxietate


ID Semestrul Semestrul Semestrul Semestrul Semestrul Semestrul
I II III IV V VI
1 3 4 2 6 5 1
2 2,5 2,5 4 5 6 1
3 4,5 4,5 3 2 6 1
4 3 2 6 4 5 1
5 4 5 1 2 3 6
6 1,5 5 3,5 3,5 6 1,5
7 2 5 3 1 4 6
8 3 1 5 4 6 2
9 1 3,5 3,5 2 6 5
10 4 2 6 1 3 5

Valoarea testului Friedman se calculeaz cu formula:

12 K
O = P' 3 ( + 1)
+1 PQ"
(formula 12.6)
N reprezint numrul participanilor.
c este numrul msurrilor repetate.
Ti este suma rangurilor pentru fiecare msurare.

Mai departe vom calcula suma rangurilor pentru fiecare msurare.


" = 3 + 2,5 + 4,5 + 3 + 4 + 1,5 + 2 + 3 + 1 + 4 " = 28,5
' = 4 + 2,5 + 4,5 + 2 + 5 + 5 + 5 + 1 + 3,5 + 2 ' = 34,5
M = 2 + 4 + 3 + 6 + 1 + 3,5 + 3 + 5 + 3,5 + 6 M = 37
I = 6 + 5 + 2 + 4 + 2 + 3,5 + 1 + 4 + 2 + 1 I = 30,5
R = 5 + 6 + 6 + 5 + 3 + 6 + 4 + 6 + 6 + 3 I = 50
S = 1 + 1 + 1 + 1 + 6 + 1,5 + 6 + 2 + 5 + 5 I = 29,5

nlocuind valorile existente n formul obinem urmtoarea valoare a testului:


12
O = 28,5' + 34,5' + 37' + 30,5' + 50' + 29,5' 3 10 7 O
10 6 7
12
= 812,25 + 1190,25 + 1369 + 930,25 + 2500 + 870,25 210 O
420
12
= 7672 210 O = 219,2 210 O = 9,2
420

La fel ca n cazul testului Kruskal-Wallis, valoarea calculat a testului Friedman este ma


mare egal cu 0. Valoarea critic se citete din Anexa 8 n funcie de numrul de grade de libertate
(numrul de msurtori - 1) i pragul . Astfel, valoarea critic este egal cu 11,07. Decizia
statistic se ia astfel:
Atunci cnd valoarea calculat este mai mic dect valoarea critic acceptm ipoteza de
nul i respingem ipoteza cercetrii.
Atunci cnd valoarea calculat este mai mare sau egal cu valoarea critic vom respinge
ipoteza de nul i ipoteza cercetrii se confirm.

n cazul nostru, valoarea calculat (9,2) este mai mic dect cea critic (11,07) i lum
decizia de a accepta ipoteza de nul i de a respinge ipoteza cercetrii. n concluzie, nivelul de
anxietate al studenilor nu se modific semnificativ de la o sesiune la alta.

12.4.2 Testul Friedman n SPSS

n baza de date vom introduce ase variabile care vor reprezenta momentele n care am
msurat anxietatea studenilor i vor primi valorile din tabelul 11.8.

Testul se aplic folosind meniul Analyze Nonparametric Tests Legacy Dialogs


K Related Samples. Cele ase variabilele care reprezint momentele msurrii anxietii
studenilor vor fi mutate n zona Test Variables. n seciunea Test Type este bifat opiunea
Friedman.
n fereastra de afiare a rezultatelor, tabelul Ranks afieaz media rangurilor pentru fiecare
msurare. Deoarece rangul 1 a fost atribuit valorii celei mai mici vom putem nelege c cu ct
media rangurilor pentru un grup este mai mare cu att nivelul anxietii este mai ridicat. Tabelul
Test Statistics cuprinde rezultatele testului Friedman. Chi-Squqre (9,333) reprezint valoarea
calculat a testului; df (5) ne indic numrul de grade de libertate i Asymp. Sig. (0,096) este
probabilitatea asociat testului. Deoarece p este mai mare dect pragul = 0,05 vom accepta
ipoteza de nul i vom respinge ipoteza cercetrii. Prin urmare, nivelul anxietii studenilor nu este
semnificativ diferit de la o sesiune la alta .

12.5. Coeficientul de corelaie Spearman (rs)

12.5.1 Exemplu de calcul

n capitolul 10 am descris corelaia ca fiind o metod ce descrie variabilitatea comun a dou


variabile, n ce msur valorile unei variabile sunt asociate cu scorurile mari sau mici ale alte
variabile. De asemenea, coeficientul de corelaie poate lua valori de la +1,00 (pentru corelaiile
perfect pozitive) la -1,00 (pentru corelaiile perfect negative), valoarea 0,00 indicnd lipsa unei
relaii liniare ntre variabile.
Coeficientul de corelaie Spearman se noteaz cu rs i este utilizat pentru a arta corelaia
dintre dou seturi de date ordinale. Acest coeficient de corelaie este similar coeficientului Pearson
i va fi utilizat i pentru date cantitative (msurate pe scal de interval/raport) atunci cnd
eantionul este mic (mai puin de 30 de respondeni). Coeficientul de corelaie Spearman ia valori
cuprinse n intervalul (-1 / +1), interpretarea fiind identic cu cea de la coeficientul Pearson.

Un psiholog este interesat s studieze dac exist o relaie ntre vechimea n munc i stresul
de lupt la militari. Acesta selecteaz 10 militari crora le aplic un chestionar pentru a putea
evalua stresul de lupt. Pentru a lua decizia statistic, psihologul utilizeaz un prag = 0,05
bilateral.

Tabel 12.10 Datele i rangurile pentru vechimea n munc i stresul de lupt


ID Vechime Stres de Rang Rang stres D D2
lupt vechime de lupt (R1 R2)
1 9 27 9 5 4 16
2 5 33 6 9 -3 9
3 4 34 4,5 10 -5,5 30,25
4 2 18 1,5 2 -0,5 0,25
5 7 31 7 8 -1 1
6 10 17 10 1 9 81
7 4 29 4,5 6 -1,5 2,25
8 8 20 8 3 5 25
9 2 26 1,5 4 -2,5 6,25
10 3 30 3 7 -4 16

Pentru a calcula valoarea coeficientului de corelaie Spearman se parcurg urmtorii pai:


1. Valorile celor dou variabile vor fi transformate n ranguri. Acestea se atribuie separat
pentru fiecare variabil. n acest exemplu vom folosi atribuirea rangului mediu i valoarea
cea mai mic va primi rangul 1.
2. Se va calcula diferena dintre cele dou perechi de ranguri (R1 R2).
3. Diferenele obinute n etapa anterioar vor fi ridicate la ptrat. Rezultatele obinute n urma
ridicrii la ptrat vor fi adunate (D2).

Formula de calcul pentru corelaia Spearman este:


6 '
U = 1
( ' 1)
(formula 12.7)

N reprezint numrul de participani


D este suma diferenelor dintre ranguri

' = 16 + 9 + 30,25 + 0,25 + 1 + 81 + 2,25 + 25 + 6,25 + 16 ' = 187


6 187 1122
U = U = 1 U = 1 1,133 U = 0,133
10 99 990

Valoarea calculat se compar cu valoarea critic pentru a lua decizia statistic. Valoarea
critic se citete din Anexa 10 n funcie de volumul eantionului (N) i pragul stabilit. Pentru
exemplul nostru, rscritic este 0,648. Decizia statistic se ia astfel:
Atunci cnd valoarea calculat este mai mic dect valoarea critic acceptm ipoteza de
nul i respingem ipoteza cercetrii.
Atunci cnd valoarea calculat este mai mare sau egal cu valoarea critic vom respinge
ipoteza de nul i ipoteza cercetrii se confirm.

n cazul nostru, valoarea calculat (-0,133) este mai mic dect cea critic (0,648) i lum
decizia de a accepta ipoteza de nul i de a respinge ipoteza cercetrii. n concluzie, nu exist o
corelaie semnificativ statistic ntre stresul de lupt i vechimea n munc a militarilor.

12.5.2 Coeficientul de corelaie Spearman n SPSS

Baza de date necesar aplicrii corelaiei Spearman se realizeaz ntr-o manier identic cu
cea de la corelaia Pearson. Vom introduce dou variabile (vechime i stres) pentru care vom
aduga valorile din tabelul 12.10.

Testul statistic se aplic din meniul Analyze Correlate Bivariate. Se va deschide o


caset de dialog unde variabilele pe care dorim s le supunem analizei de corelaie vor fi mutate
n zona Variables. n secinea Correlation Coeffcients vom debifa Pearson (opiune care este
setat implicit) i vom bifa testul Spearman. Modul de verificare a ipotezei este bilateral (Two-
tailed). Reamintim faptul c opiunea Flag significant corrlations va marca cu un asterisc (*)
coeficienii de corelaie semnificativi pentru = 0,05 i cu dou asteriscuri (**) coeficienii de
corelaie semnificativi pentru = 0,01.
La afiarea rezultatelor, tabelul Correlations este identic cu cel de la corelaia Pearson. n
exemplul nostru, se observ un indice de corelaie Spearman, rs = -0,14, nesemnificativ statistic p
(0,699) fiind mai mare dect pragul = 0,05. Acest rezultat confirm ipoteza de nul, stresul de
lupt al militarilor nefiind asociat cu vechimea n munc a acestora.

Exerciii

1. Managerul unui hotel este interesat s studieze satisfacia turitilor fa de mncarea care
le este servit n timpul sptmnii. n acest sens, selecteaz un eantion de turiti, acetia
fiind rugai, timp de o sptmn, s acorde note de la 1 (nu mi-a plcut deloc) pn la 10
(mi-a plcut foarte mult) pentru calitatea hranei din ziua respectiv. Datele nregistrate se
regsesc n tabelul de mai jos. Exist diferene semnificative n ceea ce privete calitatea
mncrii pe parcursul unei sptmni?

Luni Mari Miercuri Joi Vineri Smbt Duminic


9 9 7 9 4 7 8
5 7 9 4 6 10 7
10 4 9 5 6 8 5
5 5 9 4 9 8 5
10 6 9 7 3 4 6
10 6 8 10 7 10 3
4 4 7 5 8 7 8
a. Menionai testul statistic utilizat.
b. Stabilii ipoteza cercetrii.
c. Prezentai procedura de calcul i luai decizia statistic.
d. Menionai procedura de aplicare a testului n SPSS i interpretai rezultatele obinute.

2. Psihologul unui penitenciar a citit dosarele mai multor persoane private de libertate i este
interesat s afle dac acetia se deosebesc n ceea ce privete IQ-ul n funcie de tipul
infraciunii comise. Faptele comise sunt mprite n trei categorii: mpotriva proprietii,
mpotriva persoanei i infraciuni economice. n tabelul de mai jos sunt notate scorurile
IQ nregistrate de psiholog. Persoanele private de libertate se deosebesc la nivelul
inteligenei n funcie de tipul infraciunii?

mpotriva proprietii mpotriva persoanei Infraciuni economice


89 84 96
95 102 103
80 102 120
89 85 114
103 115 118
113 106 109
93 104 90
103 120 81
95 92 101
86 120 108

a. Menionai testul statistic utilizat.


b. Stabilii ipoteza cercetrii.
c. Prezentai procedura de calcul i luai decizia statistic.
d. Menionai procedura de aplicare a testului n SPSS i interpretai rezultatele obinute.

3. Profesorul de statistic dorete s studieze efectul agreabilitii cadrului didactic asupra


notelor pe care le obin studenii la examenul final. Astfel, selecteaz dou grupe de
studeni cu care abordeaz dou stiluri de predare. La una din grupe abordeaz o atitudine
prietenoas i se folosete de glume pentru a exemplifica noiunile predate, iar la cealalt
grup adopt un stil rigid i explic conceptele numai n termeni tiinifici. n tabelul de
mai jos sunt nregistrate notele studenilor. Agreabilitatea profesorului are efect asupra
notelor studenilor?

Agreabil Rigid
8 4
7 5
9 10
4 9
8 7
5 4
6 5
10 6
6 8
5 6
4 6
7 3

a. Menionai testul statistic utilizat.


b. Stabilii ipoteza cercetrii.
c. Prezentai procedura de calcul i luai decizia statistic.
d. Menionai procedura de aplicare a testului n SPSS i interpretai rezultatele obinute.

4. Un tnr pasionat de tenis urmrete clasamentul juctorilor i observ datele din tabelul
de mai jos. Exist o legtur ntre poziia n clasament i vrsta juctorilor de tenis?

Poziia Vrsta
1 28
2 28
3 30
4 29
5 25
6 24
7 34
8 29
9 30
10 22

a. Menionai testul statistic utilizat.


b. Stabilii ipoteza cercetrii.
c. Prezentai procedura de calcul i luai decizia statistic.
d. Menionai procedura de aplicare a testului n SPSS i interpretai rezultatele obinute.

5. ntr-un centru de reeducare pentru minori se implementeaz un program de optimizare a


atitudinii fa de lege. nainte de a ncepe cursurile educatorii msoar atitudinea fa de
lege a minorilor, urmnd ca la finalizarea programului s aib loc o nou evaluare.
Programul de optimizare a atitudinii fa de lege a fost eficient?

nainte Final
20 23
15 18
25 22
22 22
16 16
18 20
17 20
16 19
15 19
21 22

a. Menionai testul statistic utilizat.


b. Stabilii ipoteza cercetrii.
c. Prezentai procedura de calcul i luai decizia statistic.
d. Menionai procedura de aplicare a testului n SPSS i interpretai rezultatele obinute.

S-ar putea să vă placă și