Sunteți pe pagina 1din 5

Analiza bivariat II. Compararea mediilor.

Dac ne aducem aminte de ce am spus mai nainte, tim c nu are rost s vorbim despre medie
dect n cazul variabilelor numerice continue cu distribuie normal (Gaussian), i mai tim
de asemenea c orice populaie cu o astfel de distribuie este descris complet prin medie i
deviaia standard: atunci cnd cunoatem aceti doi parametri, putem s reconstituim
populaia.
n consecin, n cazul n care comparm dou populaii cu distribuie normal, comparm, de
fapt, de fiecare dat mediile i deviaiile standard ale acelor populaii.

c
Figura 1. Trei comparaii de ntre populaii cu distribuie normal. a) Nu se poate spune dac

exist o diferen ntre cele dou populaii, gradul de suprapunere este foarte mare. b)
Diferena dintre medii este mai mare dect la a), populaiile par mai diferite. c) dei
diferena dintre medii este aceeai ca la b), populaiile par net diferite (deviaia standard
este mai mic).
Se vede cum diferena dintre dou populaii cu distribuie normal (Gaussian) este cu att
mai evident cu ct diferena dintre medii este mai mare, iar deviaia standard este mai mic
(Figura 1). De aici se deduce cu uurin faptul c, atunci cnd vrem s demonstrm o
diferen ntre dou populaii cu distribuie normal, pentru aceeai putere statistic, avem
nevoie de un eantion cu att mai mare cu ct diferena dintre medii este mai mic, iar
deviaia standard este mai mare.
S presupunem c vrem s vedem dac este vreo diferen ntre TA ale studenilor la medicin
i ASE. Pentru aceasta, extragem la ntmplare cte un eantion de 10 studeni din bazele de
date ale celor dou universiti i le msurm TA - rezultatele n Tabelul 1.
TA ASE
TA medicin
110
122
140

120
124
104

120
124
95
93
105
104
110

144
134
110
132
100
98
110

Tabelul 1. Valorile TA la 20 de studeni de la ASE i medicin.


Dac introducem datele n programul InStat (GraphPad Software, www.graphpad.com), n
pagina urmtoare programul calculeaz parametrii din Figura 2.

Figura 2. Msura tendinei centrale i a dispersiei n cele dou loturi.


Vedem, astfel, c media TA este mai mare la studenii de la medicin (117,6 mmHg) fa de
cei de la ASE (112,3 mmHg), iar distribuia valorilor a trecut testul de normalitate
Kolmogorov-Smirnov (KS), p>0,10, ceea ce nseamn c distribuia este Gaussian, aadar
putem aplica teste statistice parametrice (testul Student, t) (foarte posibil ca testul de
normalitate, care este tot un test statistic, s nu fi dat rezultat semnificativ statistic din lips de
putere statistic, eantionul fiind foarte mic!).
Urmtoarea fereastr a programului InStat, care este unul foarte prietenos i te duce din
aproape n aproape, este redat n Figura 3.

Figura 3. Alegerea tipului de test statistic potrivit.


Vom efectua un test nemperecheat, pentru c eantioanele sunt independente. Presupunem c
distribuia este Gaussian, deci aplicm un test parametric (i anume testul t, al lui Student), i
de asemenea vedem din Figura 2 c deviaiile standard sunt relativ egale (nu am spus pn
acum, dar i aceasta este o condiie pentru aplicarea testelor parametrice).
n privina celei de a treia opiuni, vom bifa varianta p bidirecional, care vedem c este i
cea recomandat (am fi putut bifa p unidirecional dac porneam de la ipoteza c TA la
medicin este mai mare dect cea de la ASE, sau invers, i nu ne-ar fi interesat dect
demonstrarea sau infirmarea acestui fapt; ipoteza noastr nu este ns unidirecional, ci
bidirecional, adic vrem s vedem dac TA ale studenilor de la ASE i medicin sunt
diferite, fr s facem presupuneri asupra grupului care are TA mai mare. Pentru aceleai
date, p bidirecional = 2p unidirecional, aadar dac vrem s obinem semnificaie statistic,
avem anse mai mari cu p unidirecional, dar vedei c de obicei nu este corect.)
Chiar dac distribuiile sunt normale, este posibil ca deviaiile standard ale celor dou grupuri s fie
mult diferite. Atunci grupurile pot fi comparate printr-un test t pentru variane inegale.

Figura 3. Rezultatele testului t.


n Figura 3 vedem rezultatele principale ale testului t nemperecheat, pe baza cruia ar trebui
s rspundem la ntrebarea: difer semnificativ mediile TA ale studenilor de la medicin i
ASE?
Rspunsul este NU, pentru c:
1. P=0,4412 (deci mai mare dect limita convenional de semnificaie statistic de 0,05)
2. Diferena dintre medii a fost de 5,3 mmHg (mai mare la studenii de la medicin), ns
intervalul de ncredere a fost (-8,8; 19,4), aadar, n realitate, diferena de TA se afl
ntre cu 8,8mmHg mai mare la studenii de la ASE, pn la cu 19,4 mmHg mai mare
la studenii de la medicin, i n concluzie nu putem trana pentru unii sau alii dintre
studeni (intervalul de ncredere 95% include valoarea 0, care este valoarea neutr
pentru o diferen).
Iar mai jos vedem c se aplic i un test statistic care ne arat c diferena dintre deviaiile
standard ale TA n cele dou grupuri nu este semnificativ, deci putem utiliza linitii testul
parametric.

Figura 4. Aspectul bazei de date n SPSS.


n Figura 4 se observ aezarea datelor n SPSS, alt program
statistic, n care fiecare coloan corespunde unei variabile
(coloana 1 = TA, coloana 2 = facultatea, la care cu 1 s-a
codificat medicina i cu 2 ASE ).

Independent Samples Test


Levene's
Test for
Equality of
Variances

t-test for Equality of Means


95% Confidence Interval of the Difference

F
TA

Sig.

Sig. (2-tailed)

Mean Difference

Lower

Upper

,441

5,300

-8,839

19,439

,441

5,300

-8,847

19,447

Equal variances
assumed
Equal variances
not assumed

,292 ,596

Figura 5. Rezultatele aceluiai test, n SPSS. Se vede (coloana a treia) cum deviaiile standard
(sau varianele) sunt egale la cele dou grupuri (p=0,596), citim rezultatele de pe rndul de
deasupra, care sunt practic aceleai cu cele date de programul InStat (diferena dintre mediile
TA este de 5,3 mmHg, cu un interval de ncredere 95% ntre -8,8 i 19,4 mmHg i p = 0,441).

S-ar putea să vă placă și