Sunteți pe pagina 1din 36

Testarea diferenei dintre mai mult de dou medii:

ANaliza de VArian unifactorial (ANOVA)


M. Popa

Modelul de cercetare
Testul t pentru eantioane independente:
diferena dintre mediile a dou loturi de de subieci diferii
n dou condiii diferite (de ex.: practicare-nepracticare TA; masculin-feminin,
etc.)
Exist i situaii n care se pune problema semnificaiei diferenei

dintre mai mult de dou medii

diferenele constatate la un test de cunotine statistice ntre cele 5 grupe ale

unui an de studiu, difer semnificativ?

Variabila dependent
performana la testul de cunotine (scal I-R)
Variabila independent
grupele de studiu (scal nominal)

De ce nu aplicm repetat testul t?


Argumente periferice
volum mare de calcule (pe msur ce crete numrul categoriilor)
problema cercetrii vizeaz relaia dintre variabila dependent i variabila

independent (grupele de studiu)

ar fi bine s putem utiliza un singur test, nu mai multe

Argumentul esenial:
cumulul de eroare de tip I peste alfa=0.05
Exemplu
testm relaia dintre nivelul performanei i trei metode de antrenament
avem trei categorii ale cror medii ar trebui comparate dou cte dou
se cumuleaz o cantitate total de eroare de tip I de 0.15 adic
0.05+0.05+0.05

Soluia:
ANALIZA DE VARIAN
(ANalysis Of VAriance - ANOVA)

ANOVA unifactorial (One-way ANOVA)


ANOVA factorial (Two-way ANOVA)

ANOVA unifactorial
(One-way ANOVA)
variabil dependent
scal de interval/raport
O singur variabil independent
de tip categorial (nominal sau ordinal)
este denumit factor
are trei sau mai multe valori (niveluri)
exemple
Nivelul anxietii n raport cu trei categorii de fumtori (1-10 igri zilnic,

11-20 igri i 21-30 igri).


Timpul de rspuns la un strigt de ajutor, n funcie de natura vocii
persoanelor care solicit ajutorul (copil, femeie, brbat).
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n
funcie de tipul de liceu absolvit (real, umanist, agricol, artistic)

ANOVA factorial
variabil dependent
msurat pe scal I/R
dou sau mai multe variabile independente (factori)
fiecare cu dou sau mai multe valori msurate pe o scal nominal sau ordinal
exemple
Nivelul anxietii n raport cu intensitatea fumatului (1-10 igri zilnic, 11-20

igri i 21-30 igri), i cu genul (masculin, feminin). n acest caz, problema


cercetrii este dac intensitatea fumatului i caracteristica de sex au, mpreun, o
relaie cu nivelul anxietii.
Timpul de rspuns la un strigt de ajutor n funcie de natura vocii care solicit
ajutorul (copil, femeie, brbat) i de genul (masculin, feminin) al persoanei care
trebuie s rspund la solicitarea de ajutor.
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic) i de genul (masculin, feminin) al
studenilor.

ANOVA unifactorial
- cadrul conceptual -

Tem de cercetare:
relaia dintre performana sportivilor n tragerea la int
i patru metode de antrenament (de ex.: metoda 1,
metoda 2, metoda 3)
trei grupuri de sportivi antrenai prin metode diferite
ntrebarea cercetrii:
mediile performanei lor la o edin de tragere sunt diferite? (sunt diferene

de eficien ntre cele trei metode de antrenament?)

ANOVA este o procedur de comparare a mediilor

eantioanelor
n locul diferenei directe dintre medii, se utilizeaz
dispersia lor

Ipoteza cercetrii (H1):

(m1m2 m3 m4)

Ipoteza de nul (H0):

(m1=m2=m3=m4)

populaia de nul
Populaia 1

Populaia 2

Populaia 3

(metoda 1)

(metoda 2)

(metoda 3)

eantion1
(m1, s12)

Ipoteza cercetrii:
Ipoteza de nul:

eantion2
(m2, s22)

eantion3
(m2, s32)

m1m2m3
m1=m2=m3

Ct de diferite (mprtiate) trebuie s fie m1, m2, m3


(luate ca distribuie de sine stttoare) pentru a accepta c
nu provin din populaia de nul, ci din trei populaii diferite
(P1, P2, P3)?

a)

dispersia mediilor performanei


grupurilor cercetrii (considerate ca
eantioane separate)

b)

m3

dispersia intergrup

dispersia intragrup

Facem raportul dintre aceste dou


dispersii:

d)

m2

dispersia valorilor individuale la


nivelul populaiei de nul (indiferent
de metoda de antrenament)

c)

m1

un raport ridicat exprim apartenena


fiecreia din cele trei medii la o populaie
distinct
un raport sczut ar sugera proveniena
mediilor dintr-o populaie unic (de nul)

Decizia statistic

se ia prin raportarea la o distribuie teoretic


numit distribuia Fischer, sau
distribuia F (difer de distribuia
normal)

dispersia intergrup
F
dispersia intragrup

Procedura de calcul

(a) variana intragrup (media dispersiilor)

grupuri de volume

intragrup

egale
grupuri de volume
inegale

s 2 intragrup

df1
df intragrup

s1 s2 s3

N grupuri

* s 21

df 2

* s22

df intragrup

df 3
df intragrup

unde: df1=N1-1; df2=N2-1; df3=N3-1


dfintragrup=Nsubieci-Ngrupuri

* s 23

(b) variana intergrup (dispersia mediilor)


Exist o relaie ntre variaia mediilor i variaia valorilor din grupurile comparate:

N *
2

2M

s 2 intergrup

2
n
*
(
m

M
)
i i

df intergrup

M=(m1+m2+m3+mk)/k

pentru grupuri inegale


2
2
2
n
*
(
m

M
)

n
*
(
m

M
)

n
*
(
m

M
)
1
2
2
3
3
s 2 intergrup 1
df intergrup

pentru grupuri egale


2
2
2
(
m

M
)

(
m

M
)

(
m

M
)
2
3
s 2 intergrup n * 1
dfintergrup

variana intragrup
Dispersia valorilor individuale
estimare direct (media dispersiilor)
variana intergrup
Dispersia mediilor grupurilor
estimare indirect (dispersia mediilor)

Raportul s2intergrup/s2intragrup tinde s devin cu att mai mare, cu ct

dispersia dintre mediile grupurilor este mai mare dect dispersia din
interiorul grupurilor

Dac H0 este fals


valorile variabilei independente (factorul) influeneaz mediile
variabilei dependente

Distribuia Fisher
1.
2.
3.

4.

asimetrie pozitiv;
Sir Ronald Aylmer Fisher
poate lua o valori orict de mari;
1890-1962
valoarea minim este 0, deoarece
s 2 intergrup
F 2
decurge din raportul a dou
s intragrup
dispersii(!)
forma distribuiei variaz n
funcie de o pereche de grade de
libertate

dfintergrup=nr. grupuri-1
dfintragrup=NT-nr. grupuri

EXEMPLU DE CALCUL

Problema cercetrii:

Avem rezultatele la o edin de tragere la int pentru trei grupuri

de cte 6 sportivi, fiecare grup fiind antrenat cu o alt metod


vrem s vedem dac exist o legtur ntre nivelul performanei i
metoda de antrenament.
Ipoteza cercetrii:
Performana sportiv este n legtur cu metoda de antrenament

utilizat.

Ipoteza de nul:
Nu exist o legtur ntre performana sportiv i metoda de

antrenament.

criteriile deciziei statistice


Nivelul =0.05
dfintergrup=3-1=2
dfintragrup=18-3=15
Citim F critic (F(0.05, 2, 15)) din tabelul F pentru =0.05:

Fcritic=3.6823

df
intragrup
(within)

df intergrup (between)
1

161.4476

199.5000

215.7073

224.5832

18.5128

19.0000

19.1643

19.2468

10.1280

9.5521

9.2766

9.1172

7.7086

6.9443

6.5914

6.3882

6.6079

5.7861

5.4095

5.1922

5.9874

5.1433

4.7571

4.5337

5.5914

4.7374

4.3468

4.1203

5.3177

4.4590

4.0662

3.8379

5.1174

4.2565

3.8625

3.6331

10

4.9646

4.1028

3.7083

3.4780

11

4.8443

3.9823

3.5874

3.3567

12

4.7472

3.8853

3.4903

3.2592

13

4.6672

3.8056

3.4105

3.1791

14

4.6001

3.7389

3.3439

3.1122

15

4.5431

3.6823

3.2874

3.0556

16

4.4940

3.6337

3.2389

3.0069

metoda 1

metoda 2

metoda 3

X1
(puncte)
10

(X1-m1)2

X2
(puncte)

(X2-m2)2

X3
(puncte)

(X3-m3)2

3.13

8.00

1.36

0.59

0.02

4.70

10

3.13

0.02

0.68

0.59

0.68

0.02

0.10

4.70

0.02

5.42

1.36

3.34

50

12.96

35

14.78

17

10.14

m1=8.33

m2=5.83
2.59

s2

6
2.96

m3=2.83 M=(m1+m2+m3)/3=5.66
2.83

(m-M)

2.67

0.17

-2.83

(m-M)2

=7.12

=0.02

=8.00

(m-M)2=15.14

m1=8.33
s21=2.59
m2=5.83
s22=2.96

m3=2.83
s23=2.02

2
2
2
(
m

M
)

(
m

M
)

(
m

M
)
2
3
s 2 intergrup n * 1
dfintergrup

intergrup

7.12 0.02 8.00


6*
6 * 7.57 45.42
2

s1 s2 s3
2.59 2.96 2.02

7.57
N grupuri
3
2

s 2 intragrup

s 2 intergrup 45.42
F 2

6
s intragrup
7.57

F calculat (6) > F critic (3.6823)

Decizia statistic ?

Mrimea efectului pentru testul F


Mrimea lui F indic de cte ori este cuprins dispersia

intragrup n dispersia intergrup


Uzual, doi indici de mrime a efectului (ai asocierii):
eta ptrat (2)
omega ptrat (2)
. Mai sunt si alii SPSS eta ptrat parial

Indicele eta ptrat


descrie procentul din variana (mprtierea) variabilei

dependente care este explicat de variana variabilei independente

dfintergrup F
dfintergrup F df intragrup

Praguri similare cu r2 (Cohen)


0.019
0.13
0.26

efect mic
efect mediu
efect mare

Pentru exemplul nostru



2

df intergrup F
df intergrup F df intragrup

26

0.44
2 6 15

Mrime a efectului mare


44% din variaia performanei de instruire este explicat de

utilizarea metodelor de antrenament


restul de variabilitate de 54% provine din alte surse

Indicele f (Cohen) pentru mrimea efectului

f
0.88
2
1
2

efect mic=0.10

efect mediu=0.25
efect mare=0.40

Analiza post-hoc
Testul F spune ceva despre

relaia global dintre v.dep.


i categoriile v.indep.
exist teste post-hoc, care
testeaz semnificaia
diferenei dintre categorii,
luate dou cte dou
Bonferoni, Scheffe,
Tuckey...

Publicarea rezultatului testului (ANOVA)


Grupurile (categoriile) comparate, mediile lor, valoarea

testului F, cu numrul gradelor de libertate i pragul de


semnificaie al testului, mrimea efectului
ntr-o manier narativ, rezultatul obinuit pe exemplul de
mai sus, poate fi prezentat astfel:
A fost analizat performana n tragerea la int a trei grupuri de sportivi, antrenai cu

metode diferite. Mediile performanei pentru cele trei grupuri au fost 8.33, 5.83, respectiv
2.83. Analiza de varian unifactorial a relevat o diferen semnificativ ntre aceste
medii, F (2, 15)=6; p0.05. Mrimea efectului apreciat cu indicele eta ptrat indic un
efect moderat (2=0.44), n timp ce indicele f al lui Cohen indic un efect mare
(f=0.88).

Avantajele ANOVA
elimin riscul cumulrii unei cantiti prea mari de eroare

de tip I
pune n eviden diferene semnificative ntre mediile mai
multor grupuri, chiar i atunci cnd nici una dintre ele nu
difer semnificativ una de cealalt (testul t)
poate fi utilizat i n cazurile n care exist numai dou
grupuri (dei nu este uzual)

Echivalena testelor t i F
pentru compararea a dou medii independente
v. indep.
1
1
1
2
2
2

v. dep.
9
5
7
14
15
10

t=3.13,

p=0.035

F=9.82 (t2), p=0.035

Condiii de utilizare a testului ANOVA


independena eantioanelor (grupurilor supuse

comparaiei)
normalitatea distribuiei de eantionare, n conformitate cu
teorema limitei centrale
absena valorilor extreme (outliers)
egalitatea varianei grupurilor comparate (denumit
homoscedasticitate)
n caz de nerespectare:
renunarea la ANOVA n favoarea unei prezentri descriptive
transformarea variabilei dependente astfel nct s dobndeasc proprietile

necesare
transformarea variabilei pe o alt scal de msurare i aplicarea altui test
statistic (neparametric)

S-ar putea să vă placă și