Documente Academic
Documente Profesional
Documente Cultură
Având în vedere modelele de cercetare la care ne-am raportat până acum, vom
regăsi, pentru fiecare dintre ele, teste statistice pentru date ordinale, după cum urmează:
Într-o situaţie de acest gen este aplicabil testul „Mann-Whitney U” pentru date
ordinale. Pe ultima coloană a fiecărui tabel găsim transformarea în ranguri a valorilor
variabilei dependente. Atribuirea rangurilor în mod descrescător sau crescător este
nerelevantă. Dacă toate valorile sunt distincte, fiecare valoare primeşte un rang distinct.
Atunci când există valori identice, valorile respective primesc un rang egal cu media
aritmetică a rangurilor cuvenite. Se poate alege şi soluţia atribuirii tuturor valorilor
identice primul rang cuvenit (ranguri ex aequo).
1
Desemnat uneori şi sub numele „Wilcoxon-Mann-Withney”, sau „testul U”
Masculin2 „Premiu” Rang Feminin „Premiu” Rang
(mil. lei) „premiu” (mil. lei) „premiu”
1 9 26 2 3 27
1 34 22 2 17 25
1 35 21 2 26 24
1 43 18.5 2 32 23
1 56 14 2 36 20
1 61 12 2 43 18.5
1 62 11 2 44 17
1 64 10 2 47 16
1 67 9 2 51 15
1 67 9 2 59 13
1 70 7 nB=10 ΣRB= 198.5
1 75 6
1 80 5
1 87 4
1 88 3
1 110 2
1 200 1
nA=17 ΣRA=180.5
respectiv,
unde:
nA şi nB reprezintă volumul celor două grupuri independente care
compun eşantionul
ΣRA şi ΣRB reprezintă suma rangurilor pentru fiecare din cele două grupuri
Vom observa că expresia din mijlocul formulei exprimă chiar suma rangurilor de
la 1 la nA, respectiv, de la 1 la nB. Dacă, de exemplu, toate rangurile grupului A ar fi mai
mici decât ale grupului B (fără nici o suprapunere între valorile celor două grupuri),
atunci acest termen al formulei ar fi egal cu ΣRA, iar UA ar fi egal cu nA*nB. În acest caz
UB ar fi egal cu 0, deoarece
2
Valoarea “1” este un cod numeric convenţional asociat genului masculine, iar “2” un
cod convenţional pentru genul feminine. Utilizarea lor aici are doar scopul de a sugera că
“genul” este variabila independentă a cercetării şi primeşte două valori. Atunci când se va
utiliza un program statistic pentru calcularea testului, variabila independentă va trebui să
fie creată, cu valorile aferente, ca în acest exemplu.
UA+UB=nA*nB. Dacă însă rangurile unui grup tind să se grupeze spre zona superioară
(sau inferioară), atunci valoarea U a acelui grup va fi cu atât mai mare (sau mai mică)
decât nA*nB. Pe această particularitate se bazează evaluarea semnificaţiei diferenţei dintre
rangurile celor două grupuri.
respectiv,
Valoarea testului Mann-Whitney este dată de valoarea U cea mai mică, în cazul
nostru UB (26.5).
Decizia statistică se ia prin compararea valorii U celei mai mici cu valoarea
citită în tabelul valorilor critice pentru testul Mann-Whitney U, în funcţie de nivelul alfa,
nA şi nB (Anexa 7).
Practic, în cazul testului U decizia statistică se ia astfel:
• Se respinge ipoteza de nul dacă valoarea U calculată este mai mică sau
egală cu valoarea critică tabelară.
• Se acceptă ipoteza de nul dacă valoarea U calculată este mai mare decât
valoarea critică tabelară.
Logica acestei decizii pare să fie contrară raţionamentului aplicat în cazul altor
teste statistice, unde, pentru a respinge ipoteza de nul, trebuie să avem o valoare
calculată mai mare decât cea critică. Să ne gândim însă că în cazul testului Mann-
Whitney considerăm drept valoare calculată una dintre cele dintre două valori U, şi
anume pe aceea care este mai mică. Ipoteza de nul afirmă că cele două sume ar trebui să
fie egale, dacă diferenţa dintre suma rangurilor celor două eşantioane comparate ar fi
nesemnificativă. Cu cât una dintre valorile U calculate, este mai mică, cu atât cealaltă
sumă este mai mare. În consecinţă, o valoare U calculată mai mică sau egală cu U critic,
justifică respingerea ipotezei de nul.
3
Desigur, nu se poate invoca neapărat o discriminare de sex în acordarea primelor dacă
poziţiile profesionale ocupate de subiecţii cercetării sunt diferite. Rezultatul poate sugera,
însă, că bărbaţii ocupă poziţii profesionale mai înalte decât femeile.
Valoarea lui z astfel obţinută este comparată cu valorile critice tabelare de pe
curba normală, corespunzătoare nivelului alfa ales, unilateral sau bilateral.
Publicarea rezultatului
La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:
- volumul grupurilor comparate (nA şi nB)
- valoarea testului (U)
- pragul de semnificaţie (p).
EXERCIŢII
Datele cercetării:
(valorile exprimă scorul la trăsătura "feminitate")
Pentru evaluarea diferenţei la nivel de ranguri între mai mult de două eşantioane
independente se utilizează testul Kruskal-Wallis. Acesta poate fi asimilat unei analize de
varianţă pentru date ordinale.
Să presupunem că dorim să vedem dacă există diferenţe în abilitatea de a
rezolva o sarcină de reprezentare spaţială la trei categorii profesionale aeronautice,
piloţi (grup 1), controlori de trafic aerian (grup 2) şi navigatori de bord (grup 3). În
acest scop a fost aplicat un test de reprezentare spaţială unui număr de şase piloţi, trei
controlori de trafic şi patru navigatori de bord. Rezultatul este unul numeric (scorul la
test), dar, dat fiind numărul foarte mic al subiecţilor, aplicarea testului ANOVA este
nepotrivită. Ca urmare, alegem soluţia conversiei rezultatelor în valori de rang (pentru
toate grupurile luate împreună) şi utilizăm un test pentru date ordinale. Datele pentru
acest exemplu sunt prezentate în tabelul următor:
unde:
H este valoarea calculată a testului K-W
N este volumul total al eşantionului
n este volumul grupurilor (N=n1+n2+n3+...+nk)
K este numărul grupurilor independente
T este suma rangurilor care va fi calculată pentru fiecare grup
Înlocuind valorile corespunzătoare exemplului, obţinem:
Valorile distribuţiei de nul ale lui H urmează forma distribuţiei chi-pătrat care,
ne amintim, are originea în valoarea 0. Cu cât sumele rangurilor pentru cele k grupuri
sunt mai diferite între ele, cu atât valoarea testului este mai mare şi, potenţial, mai
aproape de o variaţie semnificativă. Diferenţele mici dintre rangurile grupurilor conduc
spre valori ale testului care tind spre 0 şi, implicit, nesemnificative. Valoarea critică a
testului se citeşte din tabelul distribuţiei chi-pătrat pentru df=k-1. Există totuşi o excepţie,
atunci când nici unul din grupurile comparate nu este mai mare de 6, situaţie în care
decizia se ia cu ajutorul unei tabele speciale. În cazul nostru există un grup cu mai mult
de cinci subiecţi. Ca urmare, scorul critic pentru alfa=0.05 şi 2 grade de libertate este
5.99. Deoarece H calculat este mai mic decât H critic, suntem nevoiţi să acceptăm
ipoteza de nul şi să concluzionăm că cele trei categorii de subiecţi nu sunt diferite sub
aspectul capacităţii de reprezentare spaţială.
EXERCIŢII
Dacă avem subiecţi evaluaţi de două ori, pe o scală de interval, iar variabilele
nu întrunesc condiţiile pentru utilizarea testului t al diferenţelor pentru eşantioane
dependente, se poate apela la testul Wilcoxon. Acesta este un test care, deşi se aplică pe
scale de interval/raport, utilizează proceduri de tip neparametric, apelând la diferenţele
dintre valorile perechi şi la ordonarea lor. Este, din acest punct de vedere, un test de
date ordinale.
Exemplu
Un psiholog evaluează frecvenţa conduitelor agresive după prezentarea unui film
care are incluşi stimuli subliminali cu semnificaţie agresivă. Frecvenţa conduitelor agresive
este măsurată înainte şi după vizionarea filmului. Rezultatele sunt sintetizate în tabelul
următor.
Cod „Înainte” „După” „după”-„înainte” Modulul Rangul Semnul
Subiect diferenţei diferenţei Diferenţei
1 9 8 -1 1 7.5 -
2 14 17 3 3 5.5 +
3 10 17 7 7 2.0 +
4 11 12 1 1 7.5 +
5 12 15 3 3 5.5 +
6 9 13 4 4 3.5 +
7 10 14 4 4 3.5 +
8 14 2 -12 12 1.0 -
Coloanele tabelului prezintă etapele procedurii de calcul:
• se calculează diferenţa dintre variabilele supuse testării
• dacă sunt diferenţe nule, se elimină
• se iau în considerare diferenţele în valoare absolută
• se construiesc rangurile pentru diferenţele în valoare absolută
• se marchează semnul diferenţelor pentru fiecare pereche de valori
Din acest punct calcularea valorilor testului este simplă. Se calculează două
valori T, astfel: T(-), prin însumarea rangurilor diferenţelor negative, şi T(+), prin
însumarea rangurilor diferenţelor pozitive. Valoarea cea mai mică dintre ele este rezultatul
testului Wilcoxon, al cărui nivel de semnificaţie se află prin compararea cu valorile critice
dintr-o tabelă specială (Anexa 8), în funcţie de nivelul alfa ales şi de volumul eşantionului
(N). Testul se fundamentează pe ideea că atunci când ipoteza nulă este adevărată, ar trebui
ca suma rangurilor pentru diferenţele pozitive să fie egală cu suma rangurilor pentru
diferenţele negative. Pe măsură ce diferenţa dintre cele două sume este mai mare, ne
îndepărtăm de condiţia ipotezei de nul.
Decizia statistică pentru acest test se ia în felul următor:
• atunci când valoarea calculată este mai mică sau egală decât valoarea
critică tabelară, ipoteza de nul se respinge, iar ipoteza cercetării se
confirmă;
• atunci când valoarea calculată este mai mare decât valoarea critică
tabelară, ipoteza de nul se acceptă, iar ipoteza cercetării nu se confirmă.
Logica acestei decizii este similară celei aplicate în cazul testului Mann-
Whitney. Valoarea calculată a testului este valoarea T cea mai mică, fie cea pozitivă,
fie cea negativă. Ipoteza de nul afirmă că cele două sume ar trebui să fie egale, dacă
diferenţa dintre prima şi a doua măsurare ar fi nesemnificativă. Cu cât una dintre valorile
T calculate, fie cea cu plus, fie cea
cu minus, este mai mică, cu atât cealaltă sumă este mai mare. În consecinţă, un T
calculat mai mic sau egal cu T critic justifică respingerea ipotezei de nul.
Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urmă devine
rezultatul testului. Valoarea calculată (8.5) este mai mare decât valoarea critică (4)
pentru N=8 şi alfa=0.5 bilateral. Ca urmare, suntem nevoiţi să acceptăm ipoteza de nul,
considerând neconfirmată ipoteza cercetării. Concluzia cercetării, pentru exemplul dat,
este aceea că datele studiului nu confirmă existenţa unei relaţii între prezenţa stimulilor
subliminali şi frecvenţa conduitelor agresive, după vizionarea filmului.
Consideraţii finale
Atunci când rezultatul testului este semnificativ, enunţarea concluziei şi
interpretarea rezultatului vor ţine cont de modul de atribuire a rangurilor, cu alte cuvinte,
dacă rangul 1 a fost atribuit valorii celei mai mari, sau celei mai mici.
O problemă apare atunci când există diferenţe egale cu zero între rangurile perechi
(valori de rang egal). Unii statisticieni recomandă eliminarea cazurilor care dau diferenţe
egale cu zero şi, implicit, reducerea volumului eşantionului cu aceste cazuri. O
abordare mai riguroasă este aceea de a păstra valorile zero, dar atribuind arbitrar semnul
+ la jumătate dintre ele şi semnul – la cealaltă jumătate. În situaţia în care există un
număr impar de diferenţe egale cu zero între rangurile celor două evaluări, se va elimina
una dintre ele (reducând N cu 1), după care se aplică regula enunţată anterior.
EXERCIŢII
Având în vedere numărul mic al subiecţilor cercetării din tema pentru acasă de la
testul t pentru eşantioane dependente, refaceţi calculele utilizând testul Wilcoxon:
Ne propunem să scoatem în evidenţă efectul stresului temporal (criza de timp)
asupra performanţei de operare numerică. În acest scop, selectăm un eşantion de subiecţi
cărora le cerem să efectueze un test de calcule aritmetice în două condiţii experimentale
diferite: prima, în condiţii de timp nelimitat, cu recomandarea de a lucra cât mai corect; a
doua, în condiţii de timp limitat, cu condiţia de a lucra cât mai repede şi mai corect în
acelaşi timp.
Rezultatele celor două reprize sunt cele din tabelul alăturat. Să se rezolve
următoarele sarcini:
Fără criză de Cu criză de
timp timp
67 65
79 73
83 70
80 85
99 93
95 88
80 72
100 69
Care sunt valoarea testului, decizia statistică şi concluzia cercetării în acest caz?
EXERCIŢII
Datele cercetării:
(valorile semnifică lungimea şirului memorat)
Subiectul Cifre Litere Cifre/Litere
A 6 5 6
B 8 7 5
C 7 7 4
D 8 5 8
E 6 4 7
F 7 6 5
Exemplu:
Problema cercetării. Într-un studiu cu privire la ameliorarea sistemului de
evaluare a personalului, doi instructori urmează un program special de armonizare a
evaluării. La sfârşitul programului ei sunt puşi să ierarhizeze personalul unui
compartiment de muncă (N=10) din punctul de vedere al performanţei profesionale.
Ipoteza cercetării. (pentru test bilateral) Evaluările celor doi instructori vor fi
concordante.
Ipoteza de nul. Între evaluările celor doi instructori nu există nici o legătură
Criteriile deciziei statistice:
• alfa= 0.05
• rS critic se citeşte într-un tabel special pentru coeficientul Spearman (Anexa 9).
Valoarea se citeşte la intersecţia dintre linia corespunzătoare lui N (în acest caz
nu se
folosesc gradele de libertate) cu coloana corespunzătoare tipului de test (unilateral,
bilateral) şi a nivelului α. Înregistrăm rS critic =0.648
Datele cercetării:
Angajaţi RANG RANG Diferenţa (D) D2
Instructor Instructor (R1-R2)
I II
A 3 2 1 1
B 1 3 -2 4
C 7 5 2 4
D 6 4 2 4
E 10 10 0 0
F 5 8 -3 9
G 9 7 2 4
H 8 9 -1 1
I 4 6 -2 4
J 2 1 1 1
2
2D =32
Formula de calcul pentru coeficientul de corelaţie a rangurilor Spearman este:
Dacă probabilitatea aferentă valorii calculate a testului este mai mare decât
0.05, coeficientul de corelaţie va fi considerat nesemnificativ (are şanse prea mari să
rezulte din întâmplare). Aceasta nu înseamnă că nu există o corelaţie între cele două
variabile, ci doar că datele noastre nu au putut să o pună în evidenţă.
Calcularea coeficientului de determinare (rS2) în cazul corelaţiei Spearman nu este
uzuală, deşi există autori care o acceptă.
Formula 5.7 nu este considerată adecvată pentru situaţiile în care variabilele supuse
corelaţiei prezintă multe ranguri ex-aequo. De aceea, un test alternativ pentru asocierea
variabilelor ordinale este coeficientul de corelaţie a rangurilor Kendall tau. La fel ca şi
coeficientul Spearman, Kendal tau ia valori între -1 şi +1. Similarităţile se opresc însă
aici, deoarece coeficientul Kendall se calculează pe o cale diferită şi se fundamentează pe
o estimare a parametrului populaţiei. Aceasta estimare se calculează ca probabilitatea
concordanţei minus probabilitatea discordanţei dintre
rangurile perechi. Nu vom analiza în amănunt procedura de calcul, dar vom prezenta
modul de obţinere a coeficientului Kendall cu ajutorul programului SPSS în secţiunea
următoare.
Ambii coeficienţi sunt larg utilizaţi în studiile statistice, făcând, în acelaşi timp,
şi obiectul unor dispute între statisticieni. Adesea, coeficientul Kendall este considerat
mai adecvat datorită faptului că distribuţia acestuia se apropie de forma normală
începând de la volume mai mici ale eşantioanelor. Chiar dacă, în calcule, pe aceleaşi
date, cu cei doi coeficienţi se obţin valori uşor diferite, decizia statistică nu este, de
obicei, diferită.
EXERCIŢII
Datele cercetării:
(valorile din tabel exprimă poziţia de rang atribuită de instructori fiecărui elev)
nA/nB α 5 6 8 10 12 14 16 18 20
3 0.05 0 1 2 3 4 5 6 7 8
0.01 - - - 0 1 1 2 2 3
4 0.05 1 2 4 5 7 9 11 12 14
0.01 - 0 1 2 3 4 5 6 8
5 0.05 2 3 6 8 11 13 15 18 20
0.01 0 1 2 4 6 7 9 11 13
6 0.05 3 5 8 11 14 17 21 24 27
0.01 1 2 4 6 9 11 13 16 18
8 0.05 6 8 13 17 22 26 31 36 41
0.01 2 4 7 11 15 18 22 26 30
10 0.05 8 11 17 23 29 36 42 48 55
0.01 4 6 11 16 21 26 31 37 42
12 0.05 11 14 22 29 37 45 53 61 69
0.01 6 9 15 21 27 34 41 47 54
14 0.05 13 17 26 36 45 55 64 74 83
0.01 7 11 18 26 34 42 50 58 67
16 0.05 15 21 31 42 53 64 75 86 98
0.01 9 13 22 31 41 50 60 70 79
18 0.05 18 24 36 48 61 74 86 99 112
0.01 11 16 26 37 47 58 70 81 92
20 0.05 20 27 41 55 69 83 98 112 127
0.01 13 18 30 42 54 67 79 92 105
(sursa: Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom)
14
Anexa 8. Valorile critice pentru testul Wilcoxon
15
Anexa 9. Valorile critice pentru testul de corelaţie a rangurilor
(Spearman)
test unilateral
alfa=0.05 alfa=0.025 alfa= 0,01 alfa=0.005
N
test bilateral
alfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01
5 0,900 - - -
6 0,829 0,886 0,943 -
7 0,714 0,786 0,893 -
8 0,643 0,738 0,833 0,881
9 0,600 0,683 0,783 0,833
10 0,564 0,648 0,745 0,794
11 0,523 0,623 0,736 0,818
12 0,497 0,591 0,703 0,780
13 0,475 0,566 0,673 0,745
14 0,457 0,545 0,646 0,716
15 0,441 0,525 0,623 0,689
16 0,425 0,507 0,601 0,666
17 0,412 0,490 0,582 0,645
18 0,399 0,476 0,564 0,625
19 0,388 0,462 0,549 0,608
20 0,377 0,450 0,534 0,591
21 0,368 0,438 0,521 0,576
22 0,359 0,428 0,508 0,562
23 0,351 0,418 0,496 0,549
24 0,343 0,409 0,485 0,537
25 0,336 0,400 0,475 0,526
26 0,329 0,392 0,465 0,515
27 0,323 0,385 0,456 0,505
28 0,317 0,377 0,448 0,496
29 0,311 0,370 0,440 0,487
30 0,305 0,364 0,432 0,478
(sursa: http://www.netnam.vn/unescocourse/index.htm)
16