Sunteți pe pagina 1din 36

M.

Popa
Testarea diferenei dintre mai mult de dou medii:
ANaliza de VArian unifactorial (ANOVA)
Modelul de cercetare
Testul t pentru eantioane independente:
diferena dintre mediile a dou loturi de de subieci diferii
n dou condiii diferite (de ex.: practicare-nepracticare TA; masculin-feminin,
etc.)
Exist i situaii n care se pune problema semnificaiei diferenei
dintre mai mult de dou medii
diferenele constatate la un test de cunotine statistice ntre cele 5 grupe ale
unui an de studiu, difer semnificativ?
Variabila dependent
performana la testul de cunotine (scal I-R)
Variabila independent
grupele de studiu (scal nominal)
De ce nu aplicm repetat testul t?
Argumente periferice
volum mare de calcule (pe msur ce crete numrul categoriilor)
problema cercetrii vizeaz relaia dintre variabila dependent i variabila
independent (grupele de studiu)
ar fi bine s putem utiliza un singur test, nu mai multe
Argumentul esenial:
cumulul de eroare de tip I peste alfa=0.05
Exemplu
testm relaia dintre nivelul performanei i trei metode de antrenament
avem trei categorii ale cror medii ar trebui comparate dou cte dou
se cumuleaz o cantitate total de eroare de tip I de 0.15 adic
0.05+0.05+0.05
Soluia:
ANALIZA DE VARIAN
(ANalysis Of VAriance - ANOVA)
ANOVA unifactorial (One-way ANOVA)
ANOVA factorial (Two-way ANOVA)
ANOVA unifactorial
(One-way ANOVA)
variabil dependent
scal de interval/raport
O singur variabil independent
de tip categorial (nominal sau ordinal)
este denumit factor
are trei sau mai multe valori (niveluri)
exemple
Nivelul anxietii n raport cu trei categorii de fumtori (1-10 igri zilnic,
11-20 igri i 21-30 igri).
Timpul de rspuns la un strigt de ajutor, n funcie de natura vocii
persoanelor care solicit ajutorul (copil, femeie, brbat).
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n
funcie de tipul de liceu absolvit (real, umanist, agricol, artistic)
ANOVA factorial
variabil dependent
msurat pe scal I/R
dou sau mai multe variabile independente (factori)
fiecare cu dou sau mai multe valori msurate pe o scal nominal sau ordinal
exemple
Nivelul anxietii n raport cu intensitatea fumatului (1-10 igri zilnic, 11-20
igri i 21-30 igri), i cu genul (masculin, feminin). n acest caz, problema
cercetrii este dac intensitatea fumatului i caracteristica de sex au, mpreun, o
relaie cu nivelul anxietii.
Timpul de rspuns la un strigt de ajutor n funcie de natura vocii care solicit
ajutorul (copil, femeie, brbat) i de genul (masculin, feminin) al persoanei care
trebuie s rspund la solicitarea de ajutor.
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic) i de genul (masculin, feminin) al
studenilor.
ANOVA unifactorial
- cadrul conceptual -
Tem de cercetare:
relaia dintre performana sportivilor n tragerea la int
i patru metode de antrenament (de ex.: metoda 1,
metoda 2, metoda 3)
trei grupuri de sportivi antrenai prin metode diferite
ntrebarea cercetrii:
mediile performanei lor la o edin de tragere sunt diferite? (sunt diferene
de eficien ntre cele trei metode de antrenament?)
ANOVA este o procedur de comparare a mediilor
eantioanelor
n locul diferenei directe dintre medii, se utilizeaz
dispersia lor
Ipoteza cercetrii (H1):
(m1m2 m3 m4)
Ipoteza de nul (H0):
(m1=m2=m3=m4)
Populaia 1
(metoda 1)
Populaia 2
(metoda 2)
Populaia 3
(metoda 3)
eantion1
(m
1
, s
1
2
)
eantion2
(m
2
, s
2
2
)
eantion3
(m
2
, s
3
2
)
populaia de nul
m1=m2=m3
Ct de diferite (mprtiate) trebuie s fie m
1
, m
2
, m
3

(luate ca distribuie de sine stttoare) pentru a accepta c
nu provin din populaia de nul, ci din trei populaii diferite
(P1, P2, P3)?
Ipoteza de nul: m1=m2=m3
Ipoteza cercetrii:
a) dispersia mediilor performanei
grupurilor cercetrii (considerate ca
eantioane separate)
dispersia intergrup
b) dispersia valorilor individuale la
nivelul populaiei de nul (indiferent
de metoda de antrenament)
dispersia intragrup
c) Facem raportul dintre aceste dou
dispersii:
un raport ridicat exprim apartenena
fiecreia din cele trei medii la o populaie
distinct
un raport sczut ar sugera proveniena
mediilor dintr-o populaie unic (de nul)
d) Decizia statistic
se ia prin raportarea la o distribuie teoretic
numit distribuia Fischer, sau
distribuia F (difer de distribuia
normal)
intragrup dispersia
intergrup dispersia
= F
m1 m2
m3
Procedura de calcul
(a) variana intragrup (media dispersiilor)
grupuri de volume
egale
grupuri
N
s s s
s
2
3
2
2
2
1
intragrup
2
+ +
=
grupuri de volume
inegale
3
2
intragrup
3
2
2
intragrup
2
1
2
intragrup
1
intragrup
2
* * * s
df
df
s
df
df
s
df
df
s + + =
unde: df
1
=N1-1; df
2
=N2-1; df
3
=N3-1
df
intragrup
=Nsubieci-Ngrupuri
(b) variana intergrup (dispersia mediilor)
intergrup
2
intergrup
2
) ( *
df
M m n
s
i i

=
intergrup
2
3 3
2
2 2
2
1 1
intergrup
2
) ( * ) ( * ) ( *
df
M m n M m n M m n
s
+ +
=
intergrup
2
3
2
2
2
1
intergrup
2
) ( ) ( ) (
*
df
M m M m M m
n s
+ +
=
N
M
2
2
o
o =
M
N
2 2
*o o =
pentru grupuri inegale
pentru grupuri egale
Exist o relaie ntre variaia mediilor i variaia valorilor din grupurile comparate:
M=(m1+m2+m3+mk)/k
variana intragrup
Dispersia valorilor individuale
estimare direct (media dispersiilor)
variana intergrup
Dispersia mediilor grupurilor
estimare indirect (dispersia mediilor)
Raportul s
2
intergrup
/s
2
intragrup
tinde s devin cu att mai mare, cu ct
dispersia dintre mediile grupurilor este mai mare dect dispersia din
interiorul grupurilor
Dac H0 este fals
valorile variabilei independente (factorul) influeneaz mediile
variabilei dependente
Distribuia Fisher
1. asimetrie pozitiv;
2. poate lua o valori orict de mari;
3. valoarea minim este 0, deoarece
decurge din raportul a dou
dispersii(!)
4. forma distribuiei variaz n
funcie de o pereche de grade de
libertate
intragrup
2
intergrup
2
s
s
F =
df
intergrup
=nr. grupuri-1
df
intragrup
=N
T
-nr. grupuri
Sir Ronald Aylmer Fisher
1890-1962
EXEMPLU DE CALCUL
Problema cercetrii:
Avem rezultatele la o edin de tragere la int pentru trei grupuri
de cte 6 sportivi, fiecare grup fiind antrenat cu o alt metod
vrem s vedem dac exist o legtur ntre nivelul performanei i
metoda de antrenament.
Ipoteza cercetrii:
Performana sportiv este n legtur cu metoda de antrenament
utilizat.
Ipoteza de nul:
Nu exist o legtur ntre performana sportiv i metoda de
antrenament.
criteriile deciziei statistice
Nivelul o=0.05
df
intergrup
=3-1=2
df
intragrup
=18-3=15
Citim F critic (F(0.05, 2, 15)) din tabelul F pentru o=0.05:
Fcritic=3.6823
df
intragrup
(within)
df intergrup (between)
1 2 3 4
1 161.4476 199.5000 215.7073 224.5832
2 18.5128 19.0000 19.1643 19.2468
3 10.1280 9.5521 9.2766 9.1172
4 7.7086 6.9443 6.5914 6.3882
5 6.6079 5.7861 5.4095 5.1922
6 5.9874 5.1433 4.7571 4.5337
7 5.5914 4.7374 4.3468 4.1203
8 5.3177 4.4590 4.0662 3.8379
9 5.1174 4.2565 3.8625 3.6331
10 4.9646 4.1028 3.7083 3.4780
11 4.8443 3.9823 3.5874 3.3567
12 4.7472 3.8853 3.4903 3.2592
13 4.6672 3.8056 3.4105 3.1791
14 4.6001 3.7389 3.3439 3.1122
15 4.5431 3.6823 3.2874 3.0556
16 4.4940 3.6337 3.2389 3.0069
X1
(puncte)
10
9
10
7
8
6
X2
(puncte)
3
6
6
5
8
7
X3
(puncte)
4
5
2
3
2
1
(X1-m
1
)
2
3.13
0.59
3.13
0.59
0.10
5.42
(X2-m
2
)
2
8.00
0.02
0.02
0.68
4.70
1.36
(X3-m
3
)
2
1.36
4.70
0.68
0.02
0.02
3.34
EX
N
M
s
2
(m-M)
(m-M)
2
50
6
m
1
=8.33
2.67
E=7.12
12.96 35
6
m
2
=5.83
0.17
E=0.02
14.78 17
6
m
3
=2.83
-2.83
E=8.00
10.14
M=(m
1
+m
2
+m
3
)/3=5.66
E(m-M)
2
=15.14
metoda 2 metoda 1
metoda 3
2.59 2.96 2.83
m1=8.33
s
2
1=2.59
m2=5.83
s
2
2=2.96
m3=2.83
s
2
3=2.02
F calculat (6) > F critic (3.6823)
Decizia statistic ?
42 . 45 57 . 7 * 6
2
00 . 8 02 . 0 12 . 7
* 6 intergrup
2
= =
+ +
= s
57 . 7
3
02 . 2 96 . 2 59 . 2
2
3
2
2
2
1
intragrup
2
=
+ +
=
+ +
=
grupuri
N
s s s
s
6
57 . 7
42 . 45
intragrup
2
intergrup
2
= = =
s
s
F
intergrup
2
3
2
2
2
1
intergrup
2
) ( ) ( ) (
*
df
M m M m M m
n s
+ +
=
Mrimea efectului pentru testul F
Mrimea lui F indic de cte ori este cuprins dispersia
intragrup n dispersia intergrup
Uzual, doi indici de mrime a efectului (ai asocierii):
eta ptrat (
2
)
omega ptrat (
2
)
. Mai sunt si alii SPSS eta ptrat parial
Indicele eta ptrat
descrie procentul din variana (mprtierea) variabilei
dependente care este explicat de variana variabilei independente
intragrup intergrup
intergrup 2
df F+ -
-
=
df
F df
q
Praguri similare cu r
2
(Cohen)
0.019 efect mic
0.13 efect mediu
0.26 efect mare
Pentru exemplul nostru
Mrime a efectului mare
44% din variaia performanei de instruire este explicat de
utilizarea metodelor de antrenament
restul de variabilitate de 54% provine din alte surse
44 . 0
15 6 2
6 2
df F
intragrup intergrup
intergrup
2
=
+ -
-
=
+ -
-
=
df
F df
q
Indicele f (Cohen) pentru mrimea efectului
efect mic=0.10
efect mediu=0.25
efect mare=0.40
88 . 0
1
2
2
=

=
q
q
f
Analiza post-hoc
Testul F spune ceva despre
relaia global dintre v.dep.
i categoriile v.indep.
exist teste post-hoc, care
testeaz semnificaia
diferenei dintre categorii,
luate dou cte dou
Bonferoni, Scheffe,
Tuckey...
Publicarea rezultatului testului (ANOVA)
Grupurile (categoriile) comparate, mediile lor, valoarea
testului F, cu numrul gradelor de libertate i pragul de
semnificaie al testului, mrimea efectului
ntr-o manier narativ, rezultatul obinuit pe exemplul de
mai sus, poate fi prezentat astfel:
A fost analizat performana n tragerea la int a trei grupuri de sportivi, antrenai cu
metode diferite. Mediile performanei pentru cele trei grupuri au fost 8.33, 5.83, respectiv
2.83. Analiza de varian unifactorial a relevat o diferen semnificativ ntre aceste
medii, F (2, 15)=6; ps0.05. Mrimea efectului apreciat cu indicele eta ptrat indic un
efect moderat (
2
=0.44), n timp ce indicele f al lui Cohen indic un efect mare
(f=0.88).
Avantajele ANOVA
elimin riscul cumulrii unei cantiti prea mari de eroare
de tip I
pune n eviden diferene semnificative ntre mediile mai
multor grupuri, chiar i atunci cnd nici una dintre ele nu
difer semnificativ una de cealalt (testul t)
poate fi utilizat i n cazurile n care exist numai dou
grupuri (dei nu este uzual)
v. indep. v. dep.
1 9
1 5
1 7
2 14
2 15
2 10
t=3.13, p=0.035
F=9.82 (t
2
), p=0.035
Echivalena testelor t i F
pentru compararea a dou medii independente
Condiii de utilizare a testului ANOVA
independena eantioanelor (grupurilor supuse
comparaiei)
normalitatea distribuiei de eantionare, n conformitate cu
teorema limitei centrale
absena valorilor extreme (outliers)
egalitatea varianei grupurilor comparate (denumit
homoscedasticitate)
n caz de nerespectare:
renunarea la ANOVA n favoarea unei prezentri descriptive
transformarea variabilei dependente astfel nct s dobndeasc proprietile
necesare
transformarea variabilei pe o alt scal de msurare i aplicarea altui test
statistic (neparametric)