Sunteți pe pagina 1din 19

ELEMENTE DE ANALIZ

DISPERSIONAL (ANOVA)


ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)
Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de
statisticianul Irving Fisher.

Modelul de analiz dispersional i propune ca pentru fiecare nivel al
factorului/factorilor cauzali s analizeze populaia distinct asociat i
eventualele diferene ce apar ntre populaii: s studieze efectul
variabilei/variabilelor independente asupra celei dependente.

Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.
Analiz dispersional unifactorial
n modelul de analiz dispersional unifactorial se testeaz ipoteza nul:
H
0
:
y1
=
y2
= ... =
yr
,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt egale:
H
1
:
yi
=
yj
, (i = j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite,
se concluzioneaz c factorul X are un impact asupra variabilei Y.
Setul de date pentru analiza dispersional unifactorial const n valorile
variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n
1
= n
2
= ... = n
r
Analiz dispersional unifactorial
Sistematizarea datelor pentru ANOVA


y
11
y
21
y
r1

y
12
y
22
y
r2

. .
. .
1
n 1
y

2
n 2
y
. . . . .
r
rn
y
1
y
2
y
. . . . .
r
y
Grupe dup factorul cauz
Gr. 1 Gr. 2 . . . . Gr.r
Media
Vol. grup

n
1
n
2
. . . .. n
r

Analiz dispersional unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale s
1
= s
2
= ..... = s
r
.
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s fie,
toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie
aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre unele
medii ale eantioanelor.
Analiz dispersional
unifactorial








a) b)
a) medii de grup egale; b) mediile de grup inegale
Analiz dispersional unifactorial
pe baza datelor din eantion calculm:
r 1, i ,
1
= =

=
i
n
j
ij
i
n
y
y
i
n
n y
n
y
y
r
i
i i
r
i
n
j
ij
i

=
= =
= =
1
1 1

=
=
r
i
i
n n
1
Analiz dispersional unifactorial
Variana dintre grupe, dat de influena factorului cauzal, numit i
variana factorial, este suma ptratelor abaterilor mediilor de grup de
la media general:


Dac
atunci: S
1
= 0.
variana din interiorul grupelor (variana rezidual), este suma
ptratelor abaterilor valorilor individuale de la mediile de grup:


mprtierea total a valorilor individuale fa de media general
(variana total):

( )

=
=
r
1 i
i
2
i 1
n y y S
r 2 1
y ... y y = = =
( )

= =
=
r
1 i
n
1 j
2
i ij 2
i
y y S
( )

= =
=
r
1 i
n
1 j
2
ij
i
y y S
Analiz dispersional unifactorial
Raionamentul analizei dispersionale se bazeaz pe partiionarea sumei
ptratelor abaterilor:


Pentru a face comparabile aceste msuri ale variabilitii, le vom pe
fiecare la gradele de libertate, => media ptratele raporta abaterilor.
Pentru variana factorial S
1
, numrul gradelor de libertate este r-1;
msurm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) S
2
, numrul gradelor de
libertate este nr; msurm variabilitatea tuturor celor n valori, dar
pierdem r grade de libertate.







( ) ( ) ( )

= = = = =
+ =
r
1 i
ni
1 j
2
i ij i
r
1 i
2
i
r
1 i
ni
1 j
2
ij
y y n y y y y
Analiz dispersional unifactorial
Obinem astfel:
dispersia factorial corectat:




dispersia corectat rezidual:


( )
1 r
n y y
1 r
S
s
r
1 i
i
2
i
1 2
1

=

=
( )
r n
y y
r n
S
s
r
1 i
ni
1 j
2
i ij
2 2
2

=

= =
Analiz dispersional unifactorial
Statistica F pentru analiza dispersional unifactorial are forma:



cu gradele de libertate (r 1) la numrtor i (n r) la numitor.
Regiunea critic este dat de :

F> F(r- 1),(n- r),o,

acest lucru indic diferene mai mari ntre mediile grupelor dect cele
datorate ntmplrii.








grupelor interiorul din atea variabilit
grupe dintre a iabilitate var
s
s
F
2
2
2
1
= =
Analiz dispersional unifactorial
dac valoarea F este mai mic dect valoarea critic F, atunci :
acceptm ipoteza nul, H
0
;
nu acceptm ipoteza alternativ H
1
;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.
Dac valoarea F este mai mare dect valoarea critic F, atunci:
acceptm ipoteza alternativ, H
1
;
respingem ipoteza nul, H
0
;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.
Analiz dispersional unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
2
1
s
2
2
s
2
2
2
1
s
s
F =
s
2
=
2
2
2
1
s s +
Sursa
variaiei
Gradele de
libertate
Variana
(suma ptratelor)
Dispersia corectat
(media ptratelor)
Statistica
F
0 1 2 3 4
Factorul X

Rezidual
r 1

n r
S
1


S
2

Total n 1 S = S
1
+ S
2

Modelul de analiz dispersional
bifactorial
se identific doi factori de influen, iar variabilitatea caracteristicii
rezultative poate s fie pus:
pe seama influenei primului factor (cu I niveluri);
pe seama influenei celui de-al doilea factor (cu J niveluri);
pe seama interaciunii celor doi factori;
pe seama ntmplrii (factorului rezidual).

O valoare nregistrat pentru variabila efect Y, la grupa i ( ) a
primului factor i grupa j ( ) a celui de-al doilea factor este y
ijk
, (cu
k = numrul de observaii din fiecare celul considerat pentru
nivelul i al primului factor i nivelul j al celui de-al doilea factor).
I , 1 i =
J , 1 j =
K , 1
Modelul de analiz dispersional
bifactorial
Analiza dispersional bifactorial

Sursa variaiei
Grade de
libertate
Variana
(suma ptratelor)
Dispersia
corectat (media
ptratelor)
Statisica
F
0 1 2 3 4
Primul factor I 1
Al doilea factor J 1
Interaciunea
celor doi factori
(I-1)(J-1)
Rezidual
IJ(K-1)
Total IJK1
( )

=
=
I
1 i
2
. . i
1
x x JK S
( )

=
=
J
1 j
2
. j .
2
x x IK S
( )

= =
+ =
I
1 i
J
1 j
2
. j . . . i
. ij 3
x x x x K S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
. ij
ijk 4
x x S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
ijk
x x S
1 I
S
s
1 2
1

=
1 J
S
s
2 2
2

=
( )( ) 1 J 1 I
S
s
3 2
3

=
( ) 1 K IJ
S
s
4 2
4

=
2
4
2
1
s
s
F =
2
4
2
2
s
s
F =
2
4
2
3
s
s
F =
Modelul de analiz dispersional
bifactorial
media celulei este:


media grupei i ( ) pentru primul factor este:


media grupei j ( ) pentru al doilea factor este:


media total este:


K
x
x
K
1 k
ijk
. ij

=
=
I , 1 i =
JK
x
x
J
1 j
K
1 k
ijk
. . i

= =
=
J , 1 j =
IK
x
x
I
1 i
K
1 k
ijk
. j .

= =
=
J
x
I
x
IJK
x
x
J
1 j
. j .
I
1 i
. . i
I
1 i
J
1 j
K
1 k
ijk

=
=
= = =
= = =
Concluzii
modelele de analiz dispersional nu explic relaia dintre variabile
verific doar msura n care valorile reale ale unei caracteristici se abat
de la valorile teoretice, precum i msura n care aceste variaii sunt sau
nu dependente de factorul/factorii de grupare.
metoda analizei dispersionale poate fi utilizat att naintea, ct i dup
aplicarea metodelor corelaiei i regresiei statistice.
Testul F se poate utiliza i pentru testarea validitii modelului de
regresie.
n general, n analiza dispersional, nivelurile x
1
, x
2
, ..., x
r
sunt niveluri ale
unei variabile categoriale (numite i tratamente), dar, cum ceea ce este
valabil pentru o scal inferioar (nominal) este valabil i pentru orice
alt scal superioar (ordinal, de intervale, de rapoarte), analiza se
poate extinde.
Exemplu
Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni.

i x
2
i
s
) 1 (
2
2
=
i i
n s S
Regiunea Nr.
judee
(n
i
)
Rata medie a ocuprii


(%)
Abaterea
medie
ptratic (s
i
)
Dispersia
NE 6 47.77 4.89 23.91 119.55
SE 6 41.24 5.68 32.26 161.3
S 7 40.68 6.57 43.16 258.96
SV 5 41.9 3.31 10.96 43.84
V 4 42.71 6.18 38.19 114.57
NV 6 46.32 5.84 34.11 170.55
C 6 42.08 2.32 5.38 26.9
Buc 2 41.59 5.62 31.58 31.58
Total 42 43.16 5.41 = s 29.27 = s
2
927.25

=
Exemplu
07 . 1200 41 * 27 . 29
82 . 272
25 . 927
1
2
= =
=
=
S
S
S
27 . 29
1 42
07 . 1200
97 . 38
1 8
82 . 272
27 . 27
8 42
25 . 927
2
2
1
2
2
=

=
=

=
=

=
s
s
s
0 34 ; 7 ; 05 . 0
34 ; 7 ; 05 . 0
40 . 2
42 . 1
27 . 27
97 . 38
H F F
F
F
<
=
= =