Sunteți pe pagina 1din 2

Analiza bivariat - teste nonparametrice (Mann-Whitney U)

S presupunem c vrem s comparm, din nou, dou populaii n privina unei variabile
continue, numerice (de exemplu TA ale studenilor de la medicin i de la educaie fizic i
sport), vrnd s vedem dac exist vreo diferen a TA ntre cele dou faculti. Dup cum am
mai spus, n primul rnd va trebui s vedem dac distribuia valorilor tensionale n cele dou
grupuri are o distribuie normal (Gaussian). Dac distribuia este normal, atunci putem
aplica linitii un test statistic parametric (Student, sau t); acest test compar, practic, ntre ei
parametrii TA celor dou populaii, adic mediile i deviaiile standard.
Dac ns distribuia nu este normal (simetric), atunci trebuie s folosim teste
nonparametrice, care nu utilizeaz n nici un fel media sau deviaia standard (de altfel, dup
cum am artat mai demult, dac distribuia nu este normal, nici nu are sens s calculm
media sau deviaia standard, pentru c ele nu au nici o semnificaie, i nu putem s le folosim
nici pentru descrierea populaiei).
Testele nonparametrice nu in cont de valoarea variabilelor, ci numai de ordinea lor (rank
tests), adic dac sunt mai mari sau mai mici una fa de cealalt, indiferent de ordinul de
mrime.
n Tabelul 1, avem TA ale dou eantioanelor de studeni de la cele dou faculti.
Tabelul 1. TA ale studenilor de la medicin i educaie fizic.
Medicin (M)
120
135
140
110
Educaie fizic (E)
120
110
130
135

120
140

135

Pentru a compara cele dou populaii, le aranjm n ordinea mrimii, indiferent din ce grup
fac parte (Tabelul 2).
Tabelul 2. TA ale studenilor, aezate n ordine.
TA
110 110 120 120 120
Facultatea
E
M
E
M
M
Ordinea (Rank)
1
2
3
4
5
Ordinea*
1,5
1,5
4
4
4

130
E
6
6

135
E
7
8

135
M
8
8

135
M
9
8

140
E
10
10,5

140
M
11
10,5

Pentru valorile care sunt egale, numrul de ordine va fi media numerelor, deci cei doi studeni
cu TA=110, vor primi numrul de ordine 1,5 (media dintre 1 i 2), cei trei studeni cu TA=120
vor primi numrul de ordine 4 (media numerelor 3, 4 i 5), cei trei studeni cu TA=135 vor
primi numerele de ordine 8 (media numerelor 7, 8 i 9), iar cei doi studeni cu TA=140 vor
primi numerele de ordine 10,5 (media dintre 10 i 11). Dup aceasta, adunm separat
numerele de ordine pentru fiecare facultate, i obinem 1,5+4+4+8+8+10,5=36=U, pentru
mediciniti, i 1,5+4+6+8+10,5=30=U, pentru studenii de la ANEFS, deci UU, aadar
valorile TA de la medicin sunt ntr-un numr mai mare de ori mai mari dect cele ale
studenilor de la ANEFS. Rmne doar s vedem dac aceast diferen este semnificativ
statistic, sau altfel spus, care este probabilitatea ca, n cazul unui eantion de 11 studeni
(5+6), TA a studenilor la medicin s fie de cel puin 36 de ori mai mare dect cea a
studenilor de la ANEFS, i de cel mult 30 de ori mai mic, numai din ntmplare. Cei care se
pricep la matematic, pot calcula c aceast probabilitate este de 46,3%, deci p=0,463, aadar
nesemnificativ.

Tot teste nonparametrice se folosesc i pentru comparaia variabilelor ordinale. S ne


nchipuim c doi colegi cardiologi se ceart, fiecare susinnd c el ngrijete pacieni mai
gravi cu insuficien cardiac. Pentru a verifica acest lucru, evalum toi pacienii internai n
saloanele lor n decurs de 3 luni, i i comparm din punctul de vedere al insuficienei
cardiace, cuantificat prin clasificarea NYHA a dispneei.
Tabelul 3. Pacienii cu insuficien cardiac internai
Clasa NYHA
I
II
Cardiolog 1 (nr pacieni)
1
2
Cardiolog 2 (nr pacieni)
0
1

III
5
3

IV
4
6

Urmnd acelai drum de mai sus, aezm cei 22 pacieni n ordine (Tabelul 4).
Tabelul 4.
Clasa
NYHA
Cardiolog
Ordine
Ordine*
Clasa
NYHA
Cardiolog
Ordine
Ordine*

II

II

II

III

III

III

III

III

III

III

C1
1
1

C1
2
3

C1
3
3

C2
4
3

C1
5
8,5

C1
6
8,5

C1
7
8,5

C1
8
8,5

C1
9
8,5

C2
10
8,5

C2
11
8,5

III

IV

IV

IV

IV

IV

IV

IV

IV

IV

IV

C2
12
8,5

C1
13
17,5

C1
14
17,5

C1
15
17,5

C1
16
17,5

C2
17
17,5

C2
18
17,5

C2
19
17,5

C2
20
17,5

C2
21
17,5

C2
22
17,5

Adunnd numerele de ordine (ranks), obinem 119,5 pentru primul cardiolog, i 133,5 pentru
al doilea, deci cel de-al doilea pare s aib pacieni cu un grad mai mare de insuficien
cardiac. Probabilitatea ca aceast succesiune s apar din ntmplare, iar ntre pacienii celor
doi cardiologi s nu fie nici o diferen, este de 11%, deci p=0,11, nesemnificativ statistic.
nseamn c ori nu exist nici o diferen, ori exist o diferen, dar eantionul nu a fost destul
de mare pentru a o evidenia (nu a existat destul putere statistic).
Pentru valori mperecheate ale variabilelor (de exemplu clasa NYHA nainte i dup
tratament), se folosete varianta nonparametric a testului Student mperecheat (paired), care
este testul Wilcoxon. Principiul de funcionare este asemntor celor expuse mai sus.
Dup cum se vede, n urma testelor neparametrice putem testa numai semnificaia statistic
(vom avea un p), fr o diferen a mediilor cu interval de ncredere 95%.

S-ar putea să vă placă și