Sunteți pe pagina 1din 35

1

Curs_09: Analiza de varian (ANOVA)

Testul t pentru mai mult de 2 eantioane independente


Analiza de varian simpl
Variabilitatea inter-grup
Variabilitatea intra-grup

m3
m2

m1

E3

E2

E1

x31
x21
x32

x11
x22
x12

x33
x23

x13

x34
x24

x14
P

x3k
x2k
x1k

3
f

m
m1 m2

4
f

(1-2) 0

m
m1 m2

1 2

5
f

m
m1 m2

6
f
Cazul ideal este atunci cnd avem
aceeai variabilitate n esantioane

m
m1 m2

m3

S1
S2
S3

7
f
Cazul ideal este atunci cnd avem
aceeai variabilitate n esantioane

m
m1 m2

m3

S1
S2
S3

S1= S2 = S3 = S

8
f
n general ns avem variabilitate
diferit n eantioane
S1 S2 S3

m1 m2
S1
S2

m3

S3

Sir Ronald Aylmer Fisher (17 February 1890 29 July 1962) statistician englez,
recunoscut pentru contribuii importante n statistic, inclusiv analiza de varian
(ANOVA)
Prima meniune a ANOVA a fost fcut n 1921, On the "Probable Error" of a
Coefficient of Correlation Deduced from a Small Sample. Ronald A. Fisher. Metron,
1: 3-32 (1921)
De remarcat faptul c din cauza unor deficiene de vedere Ronald Fisher a fost
instruit fr creion i hrtie, fapt ce a contribuit la capacitatea sa de vizualizare
aproape geometric a termenilor i conceptelor.

Analiza varian (ANOVA) este o colecie de modele statistice utilizate pentru analiza
diferenelor dintre mediile eantioanelor (variabilitatea inter-grupuri) raportat la
variabilitatea intra-grupuri asociat. Procedeul a fost creat i dezvoltat de R.A. Fisher.
Motivele elaborrii ANOVA au fost tocmai limitele testului t pentru eantioane
independente. Aplicarea n mod repetat a acestuia conduce la o cretere a anselor de
comitere a erorii de tip I, la fiecare noua aplicare. Pentru 3 eantioane, testul t trebuie
aplicat de 3 ori. Astfel n loc de 0,05 probabilitate de eroare de tip I, am putea ajunge la
max. 3x0,05=0,15 probabilitate de eroare de tip I

10

Tipuri de modele ANOVA


ANOVA unifactorial (One-way ANOVA) utilizat pentru a testa
diferenele dintre 2 sau mai multe eantioane independente. Atunci
cnd ANOVA este utilizat pentru a compara doar 2 eantioane
independente testul-t i testul-F (ANOVA) sunt echivalente, relaia dintre
acestea fiind F = t2.

ANOVA factorial (Factorial ANOVA) utilizat atunci cnd se caut


efectul interaciunii ntre variabile.

ANOVA pentru msurtori repetate (Repeated measures ANOVA)


utilizat atunci se fac studii longitudinale pe un eantion de subieci.

ANOVA multivariat (Multivariate analysis of variance) (MANOVA)


utilizat atunci cnd avem mai mult de o variabil dependent.

Graficul distribuiei F (Fisher)

11

Distribuia este pozitiv, F 0


Distribuia depinde de perechile gradelor de libertate (intragrup i intergrup)
Pentru df intragrup > 100 i df intergrup > 100, se apropie de distribuia normalit

12

Familia de distribuii F (Fisher)

13

ANOVA univariat (One-way ANOVA) este utilizat pentru testarea


diferenelor dintre 2 sau mai multe eantioane independente.
,F =

F=

F=

Pentru volume inegale:

Pentru volume egale:

14

F=

=
=

(dispersia mediilor)

(media dispersiilor)

Pentru volume inegale:


15

F=

Pentru volume egale:

F=

16

Condiii de aplicare ANOVA:


1. Independena grupurilor/observaiilor.
2. Observaiile s nu se deprteze major de la normalitate
3. Omogenitatea de varian a grupurilor (numit homoscedasticitate)

17

Exemplu:
-----------------------------N=3 grupuri
N1=9
N2=8
N3=11
= 0,05
-----------------------------dfintergrup = N-1= 3-1=2
dfintragrup = (N1-1)+ (N2-1)+ (N3-1)=
= (9-1)+ (8-1)+ (11-1) = 25
Fcritic = F(; df-intergroup; df-intragrup)= F(0,05; 2; 25) = 3,39

18

ANOVA se poate aplica i pentru compararea a 2 eantioane independente,


situaie n care n mod uzual folosim testul t (Student).
n acest caz al comparrii celor dou eantioane independente, testul t i
ANOVA (coeficientul F) trebuie s conduc spre aceeai rezultat. De fapt F = t2.
Distribuia teoretic a lui F este aceeai cu distribuia teoretic a lui t2.
Astfel dac lum N1=9 i N3=11 (de ex.) i =0,05
Aplicnd testul t pentru eantioane independente avem
df = N1-1+ N3 -1 = 8+10 =18
tcritic = t (, df) = t (0,05, 18) = 2,10

Aplicnd ANOVA pentru 2 eantioane independente avem


df intergrup = N-1= 2-1 =1
df intragrup = N1-1+ N3 -1 = 8+10 =18
Fcritic = F (, df_inter, df_intra) = F (0,05, 1, 18) = 4,41= (2,10)2 = t2

19

20
N1=9
N3=11
= 0,05
-----------------------------dfintergrup = N-1= 2-1=1
dfintragrup = (N1-1)+ (N3-1) = (9-1)+ (11-1) = 18
Fcritic = F(; df-intergroup; df-intragrup)= F(0,05; 1; 18) = 4,41

Exemplu de aplicare ANOVA

21
La una dintre serii, rezultatele la evaluarea de
la statistic pentru studenii din 3 grupe sunt
redate n tabelul de mai jos. Au fost luai
aleatoriu 10 studeni din fiecare grup, din
cele 3 menionate (GrA, GrB, GrC).
S se exploreze statistic posibilele diferene
de performan ntre cele 3 grupe. (=0,05)

22

23

24

25

26

27

28

29

30

Concluzii
F = 17,44 la un nivel de semnificaie sig.< 0,001. Prin urmare i la
un =0,05 avem semnificaie statistic.
Testul Levene, indic o nclcare a omogenitii la un =0,041.
Din fericire ANOVA poate fi utilizat n continuare, fiind o
procedur robust la nclcarea acestei condiii, urmnd ca la
testele post-hoc s alegem un test pentru inegalitatea de varian,
la fel ca i la testul t.
Aadar exist cel puin un eantion care face parte din alt
populaie de punctaje. Pentru a identifica acest/aceste eantioane
verificm testele post-hoc.
La testele Tamhane, observm c eantionul diferit este gupa C.

31

Mrimea efectului n cazul ANOVA:

2 =

2 =

f=

2
2

32

Mrimea efectului n cazul ANOVA:

2 =

f=

2
=
2

=
0,56

,
,

,
,

==

= 1,12

Mrimea efectului este mare, rezultatul este semnificativ i de luat n


considerare.

,
,

= 0,56

33

Raportarea

A fost analizat performana la o prob de statistic a trei grupuri de


studeni an I. Mediile performanei pentru cele trei grupuri au fost
mA=14,15, mB=14,90, respectiv mC=8,60. Analiza de varian
unifactorial a relevat o diferen semnificativ ntre aceste medii, F
(2, 27)=17,44; p < 0.05. Mrimea efectului apreciat cu indicele eta
ptrat indic un efect mare (2 = 0.56), indicele f al lui Cohen
indic tot un efect mare f=1.12.

34
MRIMEA EFECTULUI

f (Cohen)

0,40

0,26

0,25

0,13

0,10

0,019

Mare
Mediu
Slab

35

Finalul suportului de curs_09


Curs Statistica aplicat n psihologie

36%

64%

cursuri parcurse

cursuri rmase