Sunteți pe pagina 1din 17

M.

Popa – Teste statistice neparametrice pentru date ordinale

TESTE STATISTICE PE TRU DATE ORDI ALE


Conf. dr. M. Popa

Testele statistice pentru date ordinale se utilizează în următoarele situaţii:

a) Atunci când variabila dependentă este exprimată pe scală de tip ordinal. În acest caz
valorile nu au proprietăţi de interval, dar exprimă poziţia fiecăreia în raport cu cealaltă.
b) Atunci când variabila dependentă este măsurată pe scală de interval/raport, dar
distribuţia ei nu respectă condiţiile impuse de testele parametrice. În această situaţie se efectuează
transformare de rang, adică înlocuieşte fiecare valoare a distribuţiei cu poziţia pe care o are în
cadrul distribuţiei, sub aspectul ordinii de mărime. Noua distribuţie rezultată poate fi supusă
analizei statistice cu teste neparametrice ordinale.

Având în vedere modelele de cercetare la care ne-am raportat până acum, vom regăsi,
pentru fiecare dintre ele, teste statistice pentru date ordinale, după cum urmează:

Testul Mann-Whitney (U)


1
pentru două eşantioane independente

Să luăm în considerare următoarea problemă: un psiholog care lucrează într-o mare bancă
doreşte să vadă dacă există o diferenţă între premiile băneşti anuale primite de femeile şi bărbaţii
angajaţi ai băncii. În tabelele de mai jos se află nivelurile primelor şi rangurile acestora în raport
cu întreaga distribuţie a primelor, indiferent de sex.
Problema este una tipică pentru a fi rezolvată cu testul t al diferenţei dintre mediile a două
eşantioane independente. Avem o variabilă independentă de tip nominal-dihotomic şi una
dependentă, de tip interval/raport. Din păcate, analiza preliminară a variabilei dependente
(„primă”) relevă abateri mari de la condiţiile de normalitate (un indice de boltire, kurtosys, de
peste 7) precum şi o slabă reprezentativitate a mediei, ambele datorate, mai ales, prezenţei unei
valori extreme (o primă de 200 mil. lei). După ce verificăm corectitudinea valorii respective,
ajungem la concluzia că ea nu poate fi eliminată şi, ca urmare, nu este recomandabilă utilizarea
unui test parametric.
Într-o situaţie de acest gen este aplicabil testul „Mann-Whitney U” pentru date ordinale.
Pe ultima coloană a fiecărui tabel găsim transformarea în ranguri a valorilor variabilei
dependente. Rangul reprezintă poziția pe care o are o anumită valoare după ordonarea variabilei
descrescător sau descrescător. Atribuirea rangului cel mai mare valorii celei mai mari, sau valorii
celei mai mici, nu este nerelevantă. Oricare dintre variante conduce la acelaşi rezultat, dar trebuie
reflectată corespunzător în interpretarea finală. Dacă toate valorile sunt distincte, fiecare valoare
primeşte un rang propriu. Atunci când există valori identice, vom avea aşa numitele ranguri ex-
aequo, care pot fi calculate, opţional, în două moduri:
a) Atribuirea rangului mediu. Toarte valorile identice primesc un rang egal cu media
aritmetică a rangurilor cuvenite valorilor identice. De exemplu, dacă avem două valori identice,
iar primei valori i-ar corespunde rangul 8, celei de-a doua i-ar reveni rangul 9, putem atribui
ambelor valori rangul 8.5. Apoi, următoarea valoare distinctă va primi rangul 10, şi aşa mai
departe.
b) Atribuirea rangului cel mai mic sau a celui mai mare. Toate valorile identice
primesc, fie primul rang, fie ultimul, din cele corepsunzătoare valorilor identice. În exemplul de
1
Desemnat uneori şi sub numele „Wilcoxon-Mann-Withney”, sau „testul U”

1
Actualizat la: 1/2/2007 9:10 PM
M. Popa - Teste neparametrice pentru date ordinale

la punctul a), atât prima cât şi a doua valoare pot primi rangul 8 sau rangul 9. Mai departe,
urmatoarea valoare distinctă va primi rangul 10, şi aşa mai departe.
c) Atribuirea secvenţială. Valorile identice primesc primul rang disponibil, iar
urmatoarea valoare distinctă primeşte rangul următor. În acest fel, rezultă mai puţine ranguri
decât numărul valorilor distribuţiei.

Exemplificarea modului de obţinere a rangurilor ex-aequo:


Valoare (a) (b) (b) (c)
Medie Rang mic Rang mare Secvenţial
10 1 1 1 1
15 3 2 4 2
15 3 2 4 2
15 3 2 4 2
16 5 5 5 3
20 6 6 6 4

Alegerea unuia sau altuia din aceste moduri de atribuire a rangurilor ex-aequo este la
latitudinea analistului. Programul SPSS oferă opţiunea alegerii oricăreia dintre ele.
În cazul datelor de mai jos am optat pentru ranguri ex-aequo calculate pe baza mediei
rangurilor:
„Premiu” Rang „Premiu” Rang
Masculin2 Feminin
(mil. lei) „premiu” (mil. lei) „premiu”
1 9 26 2 3 27
1 34 22 2 17 25
1 35 21 2 26 24
1 43 18.5 2 32 23
1 56 14 2 36 20
1 61 12 2 43 18.5
1 62 11 2 44 17
1 64 10 2 47 16
1 67 9 2 51 15
1 67 9 2 59 13
1 70 7 nB=10 ΣRB=198.5
1 75 6
1 80 5
1 87 4
1 88 3
1 110 2
1 200 1
nA=17 ΣRA=180.5

Atenţie, premiile celor două grupuri sunt aranjate aici în două tabele diferite, doar pentru
a favoriza obţinerea valorilor de calcul. În realitate, valorile premiului anual trebuie văzute ca

2
Valoarea “1” este un cod numeric convenţional asociat genului masculin, iar “2” un cod convenţional
pentru genul feminin. Utilizarea lor aici are doar scopul de a sugera că “genul” este variabila independentă
a cercetării şi primeşte două valori. Atunci când se va utiliza un program statistic pentru calcularea testului,
variabila independentă va trebui să fie creată, cu valorile aferente, ca în acest exemplu.

2
M. Popa - Teste neparametrice pentru date ordinale

fiind plasate pe o singură distribuţie, iar rangurile stabilite în raport cu toate valorile, indiferent de
apartenenţa lor la un grup sau altul.

Procedura de calcul:
Se calculează două valori U, corespunzătoare grupurilor A (masculin) şi B (feminin),
astfel:

n A * (n A + 1)
U A = n A * nB + − ΣR A
2 (formula 5.1)

respectiv,

n B * (n B + 1)
U B = n A * nB + − ΣR B
2 (formula 5.2)

unde:
nA şi nB reprezintă volumul celor două grupuri independente care compun
eşantionul
ΣRA şi ΣRB reprezintă suma rangurilor pentru fiecare din cele două grupuri

Vom observa că expresia din mijlocul formulei exprimă chiar suma rangurilor de la 1 la
nA, respectiv, de la 1 la nB. Dacă, de exemplu, toate rangurile grupului A ar fi mai mici decât ale
grupului B (fără nici o suprapunere între valorile celor două grupuri), atunci acest termen al
formulei ar fi egal cu ΣRA, iar UA ar fi egal cu nA*nB. În acest caz UB ar fi egal cu 0, deoarece
UA+UB=nA*nB. Dacă însă rangurile unui grup tind să se grupeze spre zona superioară (sau
inferioară), atunci valoarea U a acelui grup va fi cu atât mai mare (sau mai mică) decât nA*nB. Pe
această particularitate se bazează evaluarea semnificaţiei diferenţei dintre rangurile celor două
grupuri.

Pentru exemplu nostru:

17 * 18
U A = 17 *10 + − 180.5 = 170 + 153 − 180.5 = 142.5
2

respectiv,

10 *11
U B = 17 * 10 + − 198.5 = 170 + 55 − 198.5 = 26.5
2

Valoarea testului Mann-Whitney este dată de valoarea U cea mai mică, în cazul nostru UB
(26.5).
Decizia statistică se ia prin compararea valorii U celei mai mici cu valoarea citită în
tabelul valorilor critice pentru testul Mann-Whitney U, în funcţie de nivelul alfa, nA şi nB (Anexa
7).
Practic, în cazul testului U decizia statistică se ia astfel:
• Se respinge ipoteza de nul dacă valoarea U calculată este mai mică sau egală cu
valoarea critică tabelară.

3
M. Popa - Teste neparametrice pentru date ordinale

• Se acceptă ipoteza de nul dacă valoarea U calculată este mai mare decât valoarea
critică tabelară.

Logica acestei decizii pare să fie contrară raţionamentului aplicat în cazul altor teste
statistice, unde, pentru a respinge ipoteza de nul, trebuie să avem o valoare calculată mai mare
decât cea critică. Să ne gândim însă că în cazul testului Mann-Whitney considerăm drept valoare
calculată una dintre cele dintre două valori U, şi anume pe aceea care este mai mică. Ipoteza de
nul afirmă că cele două sume ar trebui să fie egale, dacă diferenţa dintre suma rangurilor celor
două eşantioane comparate ar fi nesemnificativă. Cu cât una dintre valorile U calculate, este mai
mică, cu atât cealaltă sumă este mai mare. În consecinţă, o valoare U calculată mai mică sau egală
cu U critic, justifică respingerea ipotezei de nul.

În general, tabelele de decizie pentru testul Mann-Whitney nu acoperă decât parţial


situaţiile posibile şi nu trec de valori ale lui nA şi nB mai mari de 20. Pentru exemplul nostru
valoarea critică corespunzătoare pentru U0.05;17:10=48 (dacă preferăm aproximarea, mai
conservatoare, nA=18).
Deoarece UB<U0.05;17:10 ipoteza de nul se respinge şi se acceptă ipoteza cercetării. Ca
urmare, concluzia cercetării este aceea că nivelul primelor anuale este semnificativ diferit pentru
bărbaţi faţă de femei3.
Afirmam mai sus că tabelele statistice pentru testul Mann-Whitney U nu se referă la
grupuri mai mari de 20. Aceasta deoarece, de la acest volum în sus, distribuţia valorilor testului
poate fi aproximată de curba normală z, iar testul poate fi calculat cu formula următoare:

ΣR A − 0.5 * n A * (  + 1)
z=
n A * n B * (  + 1) / 12
(formula 5.3)

unde N=nA+nB

Valoarea lui z astfel obţinută este comparată cu valorile critice tabelare de pe curba
normală, corespunzătoare nivelului alfa ales, unilateral sau bilateral.

Publicarea rezultatului
La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:
- volumul grupurilor comparate (nA şi nB)
- valoarea testului (U)
- pragul de semnificaţie (p).

***

3
Desigur, nu se poate invoca neapărat o discriminare de sex în acordarea primelor dacă poziţiile
profesionale ocupate de subiecţii cercetării sunt diferite. Rezultatul poate sugera, însă, că bărbaţii ocupă
poziţii profesionale mai înalte decât femeile.

4
M. Popa - Teste neparametrice pentru date ordinale

TEMA PENTRU ACASĂ

Un cercetător doreşte să verifice dacă băieţii crescuţi de către mame singure manifestă un
nivel mai ridicat al trăsăturii „feminitate” decât băieţii crescuţi în familii bi-parentale. Primul grup
(A) cuprinde 10 subiecţi, al doilea, (B) este format din 8 subiecţi.
Evaluarea „feminităţii” s-a făcut pe baza unui chestionar specializat, cotat cu un scor
numeric. Numărul subiecţilor nu permite aplicarea unui test t pentru eşantioane independente,
motiv pentru care se decide utilizarea testului Mann-Whitney (U).

Datele cercetării:
(valorile exprimă scorul la trăsătura "feminitate")

Provenienţa Scor „feminitate” Care este valoarea testului Mann-Whitney (U)?


A 14 Care este decizia statistică şi ce concluzie trage
cercetătorul?
A 12
A 15
A 9
A 10
A 13
A 15
A 11
A 14
A 12
B 10
B 7
B 12
B 8
B 6
B 4
B 3
B 5

5
M. Popa - Teste neparametrice pentru date ordinale

Testul Kruskal-Wallis
pentru mai mult de două eşantioane independente
Pentru evaluarea diferenţei la nivel de ranguri între mai mult de două eşantioane
independente se utilizează testul Kruskal-Wallis. Acesta poate fi asimilat unei analize de varianţă
pentru date ordinale.
Să presupunem că dorim să vedem dacă există diferenţe în abilitatea de a rezolva o
sarcină de reprezentare spaţială la trei categorii profesionale aeronautice, piloţi (grup 1),
controlori de trafic aerian (grup 2) şi navigatori de bord (grup 3). În acest scop a fost aplicat un
test de reprezentare spaţială unui număr de şase piloţi, trei controlori de trafic şi patru navigatori
de bord. Rezultatul este unul numeric (scorul la test), dar, dat fiind numărul foarte mic al
subiecţilor, aplicarea testului ANOVA este nepotrivită. Ca urmare, alegem soluţia conversiei
rezultatelor în valori de rang (pentru toate grupurile luate împreună) şi utilizăm un test pentru date
ordinale. Datele pentru acest exemplu sunt prezentate în tabelul următor:

Scor
Grup
reprez. rang
profesional
spaţială
1 23 2
1 16 6
1 15 7
1 10 11
1 9 12
1 21 3
2 18 5
2 14 8
2 11 10
3 25 1
3 19 4
3 13 9
3 7 13

Tabelul prezintă datele cercetării. Variabila „grup” este una de tip nominal, fiecare din
cele trei grupuri fiind codificat cu o valoare convenţională (1=pilot, 2=controlor de trafic,
3=navigator de bord). Variabila „scor reprez.spaţială”, este de tip numeric şi reprezintă scorul la
test. Variabila „rang” conţine poziţia a fiecărui subiect sub aspectul reprezentării spaţiale, în
raport cu toate valorile înregistrate.

Formula de calcul pentru testul Kruskal-Wallis (notat cu H) este următoarea:

k 
Ti 
2
12  − 3 * (  + 1)
H= *∑ 
 * (  + 1) i =1  ni 
(formula 5.4)

unde:
H este valoarea calculată a testului K-W
N este volumul total al eşantionului
n este volumul grupurilor (N=n1+n2+n3+...+nk)
K este numărul grupurilor independente
T este suma rangurilor care va fi calculată pentru fiecare grup

6
M. Popa - Teste neparametrice pentru date ordinale

Înlocuind valorile corespunzătoare exemplului, obţinem:

12  412 23 2 27 2 
H= *  + +  − 3 * 14 = 0.06593 * 638,74 − 42 = 0,1121
13 * 14  6 3 4 

Valorile distribuţiei de nul ale lui H urmează forma distribuţiei chi-pătrat care, ne
amintim, are originea în valoarea 0. Cu cât sumele rangurilor pentru cele k grupuri sunt mai
diferite între ele, cu atât valoarea testului este mai mare şi, potenţial, mai aproape de o variaţie
semnificativă. Diferenţele mici dintre rangurile grupurilor conduc spre valori ale testului care tind
spre 0 şi, implicit, nesemnificative. Valoarea critică a testului se citeşte din tabelul distribuţiei chi-
pătrat pentru df=k-1. Există totuşi o excepţie, atunci când nici unul din grupurile comparate nu
este mai mare de 6, situaţie în care decizia se ia cu ajutorul unei tabele speciale. În cazul nostru
există un grup cu mai mult de cinci subiecţi. Ca urmare, scorul critic pentru alfa=0.05 şi 2 grade
de libertate este 5.99. Deoarece H calculat este mai mic decât H critic, suntem nevoiţi să
acceptăm ipoteza de nul şi să concluzionăm că cele trei categorii de subiecţi nu sunt diferite sub
aspectul capacităţii de reprezentare spaţială.

***

TEMA PENTRU ACASĂ

Având în vedere faptul că volumul foarte redus al eşantionului (N=6), analizaţi prin
intermediul testului Kruskal-Wallis datele temei pe care aţi avut-o la testul ANOVA.
Un psiholog trebuie să recomande unui patiser culoarea glazurii pentru un nou tip de
prăjitură, având de ales între verde, roşu şi galben. În acest scop alege 18 subiecţi, cărora le cere
să efectueze o sarcină plictisitoare având la îndemână platouri cu prăjituri glazurate. Subiecţii
sunt împărţiţi în trei grupe, fiecare primind prăjituri de o singură culoare. După un timp, numără
câte prăjituri a mâncat fiecare subiect din cele trei grupuri şi construieşte tabelul următor.

Verde Roşu Galben


3 3 2
7 4 0
1 5 4
0 6 6
9 4 4
2 6 1

Care este valoarea testului şi ce decizie ia cercetătorul?

7
M. Popa - Teste neparametrice pentru date ordinale

Testul Wilcoxon
pentru două eşantioane perechi
Dacă avem subiecţi evaluaţi de două ori, pe o scală de interval, iar variabilele nu
întrunesc condiţiile pentru utilizarea testului t al diferenţelor pentru eşantioane dependente, se
poate apela la testul Wilcoxon. Acesta este un test care, deşi se aplică pe scale de interval/raport,
utilizează proceduri de tip neparametric, apelând la diferenţele dintre valorile perechi şi la
ordonarea lor. Este, din acest punct de vedere, un test de date ordinale.

Exemplu
Un psiholog evaluează frecvenţa conduitelor agresive după prezentarea unui film care are
incluşi stimuli subliminali cu semnificaţie agresivă. Frecvenţa conduitelor agresive este măsurată
înainte şi după vizionarea filmului. Rezultatele sunt sintetizate în tabelul următor.

Cod Modulul Rangul Semnul


„Înainte” „După” „după”-„înainte”
Subiect diferenţei diferenţei Diferenţei
1 9 8 -1 1 7.5 -
2 14 17 3 3 5.5 +
3 10 17 7 7 2.0 +
4 11 12 1 1 7.5 +
5 12 15 3 3 5.5 +
6 9 13 4 4 3.5 +
7 10 14 4 4 3.5 +
8 14 2 -12 12 1.0 -

Coloanele tabelului prezintă etapele procedurii de calcul:


• se calculează diferenţa dintre variabilele supuse testării
• dacă sunt diferenţe nule, se elimină
• se iau în considerare diferenţele în valoare absolută
• se construiesc rangurile pentru diferenţele în valoare absolută
• se marchează semnul diferenţelor pentru fiecare pereche de valori

Din acest punct calcularea valorilor testului este simplă. Se calculează două valori T,
astfel: T(-), prin însumarea rangurilor diferenţelor negative, şi T(+), prin însumarea rangurilor
diferenţelor pozitive. Valoarea cea mai mică dintre ele este rezultatul testului Wilcoxon, al cărui
nivel de semnificaţie se află prin compararea cu valorile critice dintr-o tabelă specială (Anexa 8),
în funcţie de nivelul alfa ales şi de volumul eşantionului (N). Testul se fundamentează pe ideea că
atunci când ipoteza nulă este adevărată, ar trebui ca suma rangurilor pentru diferenţele pozitive să
fie egală cu suma rangurilor pentru diferenţele negative. Pe măsură ce diferenţa dintre cele două
sume este mai mare, ne îndepărtăm de condiţia ipotezei de nul.
Decizia statistică pentru acest test se ia în felul următor:
• atunci când valoarea calculată este mai mică sau egală decât valoarea critică
tabelară, ipoteza de nul se respinge, iar ipoteza cercetării se confirmă;
• atunci când valoarea calculată este mai mare decât valoarea critică tabelară,
ipoteza de nul se acceptă, iar ipoteza cercetării nu se confirmă.

Logica acestei decizii este similară celei aplicate în cazul testului Mann-Whitney.
Valoarea calculată a testului este valoarea T cea mai mică, fie cea pozitivă, fie cea negativă.
Ipoteza de nul afirmă că cele două sume ar trebui să fie egale, dacă diferenţa dintre prima şi a
doua măsurare ar fi nesemnificativă. Cu cât una dintre valorile T calculate, fie cea cu plus, fie cea

8
M. Popa - Teste neparametrice pentru date ordinale

cu minus, este mai mică, cu atât cealaltă sumă este mai mare. În consecinţă, un T calculat mai
mic sau egal cu T critic justifică respingerea ipotezei de nul.
Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urmă devine rezultatul
testului. Valoarea calculată (8.5) este mai mare decât valoarea critică (4) pentru N=8 şi alfa=0.5
bilateral. Ca urmare, suntem nevoiţi să acceptăm ipoteza de nul, considerând neconfirmată
ipoteza cercetării. Concluzia cercetării, pentru exemplul dat, este aceea că datele studiului nu
confirmă existenţa unei relaţii între prezenţa stimulilor subliminali şi frecvenţa conduitelor
agresive, după vizionarea filmului.

Aproximarea normală a distribuţiei testului Mann-Whitney

Ca şi în cazul testului Mann-Whitney, pentru eşantioane mai mari de 20 distribuţia de nul


a testului Wilcoxon poate fi aproximată prin distribuţia normală. Formula de calcul pentru acest
caz este următoarea:

T − [n * (n + 1)] / 4
Z=
n * (n + 1) * (2n + 1) / 24
(formula 5.5)

Exceptând situaţiile în care se operează pe eşantioane mici, ca în exemplul de mai sus,


calculele sunt destul de laborioase. Din fericire, toate programele avansate de statistică oferă
proceduri pentru calcularea automată a acestor teste statistice.

Consideraţii finale

Atunci când rezultatul testului este semnificativ, enunţarea concluziei şi interpretarea


rezultatului vor ţine cont de modul de atribuire a rangurilor, cu alte cuvinte, dacă rangul 1 a fost
atribuit valorii celei mai mari, sau celei mai mici.

O problemă apare atunci când există diferenţe egale cu zero între rangurile perechi (valori
de rang egal). Unii statisticieni recomandă eliminarea cazurilor care dau diferenţe egale cu zero
şi, implicit, reducerea volumului eşantionului cu aceste cazuri. O abordare mai riguroasă este
aceea de a păstra valorile zero, dar atribuind arbitrar semnul + la jumătate dintre ele şi semnul – la
cealaltă jumătate. În situaţia în care există un număr impar de diferenţe egale cu zero între
rangurile celor două evaluări, se va elimina una dintre ele (reducând N cu 1), după care se aplică
regula enunţată anterior.

****

TEMA PENTRU ACASĂ

Având în vedere numărul mic al subiecţilor cercetării din tema pentru acasă de la testul t
pentru eşantioane dependente, refaceţi calculele utilizând testul Wilcoxon:
Ne propunem să scoatem în evidenţă efectul stresului temporal (criza de timp) asupra
performanţei de operare numerică. În acest scop, selectăm un eşantion de subiecţi cărora le cerem
să efectueze un test de calcule aritmetice în două condiţii experimentale diferite: prima, în condiţii
de timp nelimitat, cu recomandarea de a lucra cât mai corect; a doua, în condiţii de timp limitat,
cu condiţia de a lucra cât mai repede şi mai corect în acelaşi timp.
Rezultatele celor două reprize sunt cele din tabelul alăturat. Să se rezolve următoarele
sarcini:

9
M. Popa - Teste neparametrice pentru date ordinale

Fără Cu
criză de timp criză de timp
67 65
79 73
83 70
80 85
99 93
95 88
80 72
100 69

Care sunt valoarea testului, decizia statistică şi concluzia cercetării în acest caz?

Testul Friedman
pentru măsurări repetate
Să presupunem că un psiholog doreşte să studieze relaţia dintre stilurile de conducere
(laissez-faire, democratic şi autoritar) asupra nivelului de satisfacţie profesională. În acest scop el
poate constitui un grup de cercetare pe care să îl supună, în momente succesive, celor trei tipuri
de conducere. Un alt model ar putea fi constituirea a trei eşantioane perechi, astfel constituite
încât fiecărui subiect dintr-un eşantion să îi corespundă câte un subiect „echivalent” din fiecare
dintre celelalte două eşantioane (criteriile de echivalenţă pot fi: sexul, vârsta, nivelul de
inteligenţă, gardul de motivare, etc.).
Dar, oricare dintre variantele pe care l-ar alege cercetătorul, din punct de vedere statistic
el ar obţine o structură de date identică: trei serii de evaluări ale satisfacţiei (variabila
dependentă), pentru aceiaşi subiecţi (sau perechi de subiecţi) corespunzătoare celor trei stiluri de
conducere. Dacă variabila dependentă ar fi măsurată pe o scală de interval/raport, testul
parametric adecvat este unul pe care nu l-am tratat până acum, „ANOVA pentru măsurări
repetate”. În lipsa lui, şi presupunând că variabila dependentă nu întruneşte condiţiile unui test
parametric, soluţia problemei este testul Friedman pentru date ordinale. Pentru aplicarea lui este
suficient ca valorile variabilei dependente să fie ordonate după rang, ca în tabelul alăturat. Facem
precizarea că, în acest caz, ordonarea după rang se face la nivelul fiecărui set de evaluări perechi:

Democratic Laissez-faire Autocratic


1 1 2 3
2 2 1 3
3 1 2 3
4 1 2 3
5 1 2 3
6 2 1 3
=6 T1=8 T2=10 T3=18

Testul Friedman (Fr) pune în evidenţă în ce măsură rangurile evaluărilor repetate diferă cu
adevărat (statistic semnificativ) unele de altele, după formula:

10
M. Popa - Teste neparametrice pentru date ordinale

c
12
* ∑ Ti − 3 *  * (c + 1)
2
Fr =
 * c * (c + 1) i =1 (formula 5.6)
unde:
c este numărul măsurărilor repetate
N este volumul seturilor de evaluări perechi
Ti este suma rangurilor corespunzătoare fiecărui moment de măsurare

La fel ca şi în cazul testului H (Kruskal-Wallis), distribuţia de nul a testului Friedman


urmează forma distribuţiei chi-pătrat pentru df=c-1.
Introducem valorile cercetării în formulă:

Fr =
12
6 *3* 4
( )
* 8 2 + 10 2 + 18 2 − 3 * 6 * 4 = 0,1666 * 488 - 72 = 9.3

Valoarea critică tabelară (vezi tabela chi-pătrat) pentru df=3-1=2, este 5.99. Valoarea
calculată fiind mai mare, se respinge ipoteza de nul şi se consideră confirmată ipoteza cercetării:
nivelul satisfacţiei profesionale variază semnificativ în funcţie de stilul de conducere.
Testul Friedman poate fi aplicat şi în cazul a doar două măsurări, situaţie în care devine
similar testului semnului. La fel ca şi celelalte teste pentru date ordinale, el este afectat de
existenţa rangurilor atribuite ex-aequo, pentru valori identice. În astfel de cazuri este
recomandabilă aplicarea unei corecţii în formula de calcul, pe care nu o vom prezenta aici, în
speranţa că utilizarea programelor specializate va face, oricum, corecţiile necesare.

***

TEMA PENTRU ACASĂ

Un neurofiziolog doreşte să verifice dacă există o relaţie între leziunea cerebrală stângă şi
tipul de deficit de memorie de scurtă durată, în trei tipuri de sarcină diferite: cifre, litere, litere şi
cifre amestecate.
Un număr de cinci subiecţi cu leziune cerebrală stângă au efectuat teste de memorie
distincte, pe şiruri de cifre, litere şi combinaţii de cifre şi litere. Performanţa înregistrată
marchează şirul cel mai lung memorat pentru fiecare test în parte.

Datele cercetării:
(valorile semnifică lungimea şirului memorat)
Subiectul Cifre Litere Cifre/Litere
A 6 5 6
B 8 7 5
C 7 7 4
D 8 5 8
E 6 4 7
F 7 6 5

Care este valoarea testului Friedman?


Care este decizia statistică şi ce concluzie trage cercetătorul?

11
M. Popa - Teste neparametrice pentru date ordinale

Coeficientul de corelaţie pentru date ordinale (Spearman)


Testele Wilcoxon şi Friedman sunt utilizate pentru a pune în evidenţă diferenţele dintre
două sau mai multe eşantioane perechi (situaţie care, de regulă, se referă la măsurări repetate pe
aceiaşi subiecţi). Atunci când avem două variabile ordinale şi suntem interesaţi în evaluarea
gradului de asociere între ele, vom utiliza un test similar coeficientului de corelaţie pentru date de
interval care este coeficientul de corelaţie a rangurilor (Spearman).
Aşa cum ne amintim, coeficientul de corelaţie Pearson (r) ne dă măsura intensităţii
legăturii dintre două variabile exprimate pe scale de tip interval/raport. Mecanismul de calcul se
bazează pe transformarea valorilor ambelor variabile în scoruri z, adică pe convertirea acestora în
„distanţă standard” faţă de medie. Pentru datele de tip ordinal, modalitatea de calcul a
coeficientului de corelaţie se bazează pe poziţia relativă a unei valori faţă de celelalte.
Coeficientul de corelaţie a rangurilor Spearman (rS) are acelaşi domeniu de variaţie (-1/+1) şi se
interpretează în acelaşi mod ca şi coeficientul de corelaţie pentru date parametrice Pearson.

Exemplu:
Problema cercetării. Într-un studiu cu privire la ameliorarea sistemului de evaluare a
personalului, doi instructori urmează un program special de armonizare a evaluării. La sfârşitul
programului ei sunt puşi să ierarhizeze personalul unui compartiment de muncă (N=10) din
punctul de vedere al performanţei profesionale.
Ipoteza cercetării. (pentru test bilateral) Evaluările celor doi instructori vor fi
concordante.
Ipoteza de nul. Între evaluările celor doi instructori nu există nici o legătură
Criteriile deciziei statistice:
• alfa= 0.05
• rS critic se citeşte într-un tabel special pentru coeficientul Spearman (Anexa 9).
Valoarea se citeşte la intersecţia dintre linia corespunzătoare lui N (în acest caz nu se
folosesc gradele de libertate) cu coloana corespunzătoare tipului de test (unilateral, bilateral) şi a
nivelului α. Înregistrăm rS critic =0.648

Datele cercetării:
RA G RA G
Diferenţa (D)
Angajaţi Instructor Instructor D2
(R1-R2)
I II
A 3 2 1 1
B 1 3 -2 4
C 7 5 2 4
D 6 4 2 4
E 10 10 0 0
F 5 8 -3 9
G 9 7 2 4
H 8 9 -1 1
I 4 6 -2 4
J 2 1 1 1
ΣD2=32

12
M. Popa - Teste neparametrice pentru date ordinale

Formula de calcul pentru coeficientul de corelaţie a rangurilor Spearman este:

6 * ∑ D2
rS = 1 −
 * (  2 − 1) (formula 5.7)

În care, prin înlocuirea cu valorile cercetării, obţinem:

6 * 32 192
rS = 1 − =1− = 1 − 0.19 = 0.81
10 * (100 − 1) 990

Decizia statistică: rS calculat (0.81)≥ rS critic (0.684). Ipoteza de nul se respinge.


Concluzia cercetării: Evaluările celor doi instructori sunt semnificativ concordante.
Programul de instruire a avut efectul scontat.

Interpretarea coeficientului de corelaţie Spearman

În principiu, acesta se interpretează la fel ca şi coeficientul Pearson.

rS= 0 Cele două variabile nu variază concomitent, deloc


Cele două variabile tind să crească sau să scadă concomitent, într-o anumită
0 > rS > 1
măsură
rS = 1.0 Corelaţie pozitivă perfectă
-1 > rS > 0 În timp ce o variabilă tinde să crească, cealaltă tinde să descrească
rS = -1.0 Corelaţie negativă perfectă

Dacă probabilitatea aferentă valorii calculate a testului este mai mare decât 0.05,
coeficientul de corelaţie va fi considerat nesemnificativ (are şanse prea mari să rezulte din
întâmplare). Aceasta nu înseamnă că nu există o corelaţie între cele două variabile, ci doar că
datele noastre nu au putut să o pună în evidenţă.
Calcularea coeficientului de determinare (rS2) în cazul corelaţiei Spearman nu este uzuală,
deşi există autori care o acceptă.

Când se utilizează coeficientul de corelaţie Spearman:

• Atunci când ambele variabile sunt de tip ordinal


• Atunci când una dintre variabile este de tip ordinal şi cealaltă este de tip interval/raport.
În acest caz, variabila interval/raport se transformă mai întâi în valori de ordine de rang
• Atunci când ambele variabile sunt de tip interval/raport dar una sau ambele, prezintă
valori extreme. În acest caz, prin transformarea în ordine de rang a celor două distribuţii,
valorile extreme sunt anihilate, ele urmând să participe la corelaţie prin simpla poziţie în
distribuţie şi nu prin nivelul lor absolut.

Formula 5.7 nu este considerată adecvată pentru situaţiile în care variabilele supuse corelaţiei
prezintă multe ranguri ex-aequo. De aceea, un test alternativ pentru asocierea variabilelor ordinale
este coeficientul de corelaţie a rangurilor Kendall tau. La fel ca şi coeficientul Spearman, Kendal
tau ia valori între -1 şi +1. Similarităţile se opresc însă aici, deoarece coeficientul Kendall se
calculează pe o cale diferită şi se fundamentează pe o estimare a parametrului populaţiei. Aceasta
estimare se calculează ca probabilitatea concordanţei minus probabilitatea discordanţei dintre

13
M. Popa - Teste neparametrice pentru date ordinale

rangurile perechi. Nu vom analiza în amănunt procedura de calcul, dar vom prezenta modul de
obţinere a coeficientului Kendall cu ajutorul programului SPSS în secţiunea următoare.
Ambii coeficienţi sunt larg utilizaţi în studiile statistice, făcând, în acelaşi timp, şi
obiectul unor dispute între statisticieni. Adesea, coeficientul Kendall este considerat mai adecvat
datorită faptului că distribuţia acestuia se apropie de forma normală începând de la volume mai
mici ale eşantioanelor. Chiar dacă, în calcule, pe aceleaşi date, cu cei doi coeficienţi se obţin
valori uşor diferite, decizia statistică nu este, de obicei, diferită.

***

TEMA PENTRU ACASĂ

Într-o şcoală de pilotaj a fost organizat un curs de optimizare a evaluării elevilor de către
instructori, cu scopul de a se uniformiza criteriile de evaluare.
După terminarea cursului, doi instructori sunt puşi să efectueze, fiecare, un număr de ore
de zbor cu aceiaşi 10 elevi, după care li se cere să facă o ierarhie a lor.

Datele cercetării:
(valorile din tabel exprimă poziţia de rang atribuită de instructori fiecărui elev)

Elev Instructor 1 Instructor 2


A 3 3
B 1 2
C 7 6
D 6 7
E 10 10
F 5 4
G 9 8
H 8 9
I 4 5
J 2 1

Care este valoarea corelaţiei dintre evaluările celor doi instructori?


Care este decizia statistică şi concluzia cercetării în acest caz?

14
M. Popa - Teste neparametrice pentru date ordinale

A EXE

Anexa 7. Tabelul valorilor critice pentru testul Mann-Whitney U

nA/nB α 5 6 8 10 12 14 16 18 20
0.05 0 1 2 3 4 5 6 7 8
3
0.01 - - - 0 1 1 2 2 3
0.05 1 2 4 5 7 9 11 12 14
4
0.01 - 0 1 2 3 4 5 6 8
0.05 2 3 6 8 11 13 15 18 20
5
0.01 0 1 2 4 6 7 9 11 13
0.05 3 5 8 11 14 17 21 24 27
6
0.01 1 2 4 6 9 11 13 16 18
0.05 6 8 13 17 22 26 31 36 41
8
0.01 2 4 7 11 15 18 22 26 30
0.05 8 11 17 23 29 36 42 48 55
10
0.01 4 6 11 16 21 26 31 37 42
0.05 11 14 22 29 37 45 53 61 69
12
0.01 6 9 15 21 27 34 41 47 54
0.05 13 17 26 36 45 55 64 74 83
14
0.01 7 11 18 26 34 42 50 58 67
0.05 15 21 31 42 53 64 75 86 98
16
0.01 9 13 22 31 41 50 60 70 79
0.05 18 24 36 48 61 74 86 99 112
18
0.01 11 16 26 37 47 58 70 81 92
0.05 20 27 41 55 69 83 98 112 127
20
0.01 13 18 30 42 54 67 79 92 105
(sursa: Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom)

15
M. Popa - Teste neparametrice pentru date ordinale

Anexa 8. Valorile critice pentru testul Wilcoxon

ivel de semnificaţie pentru test unilateral


0.025 0.01 0.005

ivel de semnificaţie pentru test bilateral
0.05 0.02 0.01
6 0 - -
7 2 0 -
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68
(sursa : Clocotici V., Stan A., 2000, Statistică aplicată în psihologie, Polirom)

16
M. Popa - Teste neparametrice pentru date ordinale

Anexa 9. Valorile critice pentru testul de corelaţie a rangurilor (Spearman)

test unilateral
alfa=0.05 alfa=0.025 alfa=0.01 Alfa=0.005
N
test bilateral
alfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01
5 0,900 - - -
6 0,829 0,886 0,943 -
7 0,714 0,786 0,893 -
8 0,643 0,738 0,833 0,881
9 0,600 0,683 0,783 0,833
10 0,564 0,648 0,745 0,794
11 0,523 0,623 0,736 0,818
12 0,497 0,591 0,703 0,780
13 0,475 0,566 0,673 0,745
14 0,457 0,545 0,646 0,716
15 0,441 0,525 0,623 0,689
16 0,425 0,507 0,601 0,666
17 0,412 0,490 0,582 0,645
18 0,399 0,476 0,564 0,625
19 0,388 0,462 0,549 0,608
20 0,377 0,450 0,534 0,591
21 0,368 0,438 0,521 0,576
22 0,359 0,428 0,508 0,562
23 0,351 0,418 0,496 0,549
24 0,343 0,409 0,485 0,537
25 0,336 0,400 0,475 0,526
26 0,329 0,392 0,465 0,515
27 0,323 0,385 0,456 0,505
28 0,317 0,377 0,448 0,496
29 0,311 0,370 0,440 0,487
30 0,305 0,364 0,432 0,478

(sursa: http://www.netnam.vn/unescocourse/index.htm)

17