Sunteți pe pagina 1din 16

1

Lect.univ.dr. Daniela MANEA


Econometrie
Curs 3
ELEMENTE DE ANALIZ DISPERSIONAL
(ANOVA)
2
ELEMENTE DE ANALIZ DISPERSIONAL (ANOVA)
Analiza dispersional (analiz de varian) (ANOVA), a fost
introdus de statisticianul Irving Fisher.

Modelul de analiz dispersional i propune ca pentru fiecare
nivel al factorului/factorilor cauzali s analizeze populaia
distinct asociat i eventualele diferene ce apar ntre
populaii: s studieze efectul variabilei/variabilelor
independente asupra celei dependente.

Analiza dispersional se poate face dup un model
unifactorial, dup modele bi sau multifactoriale.
3
Analiz dispersional unifactorial
n modelul de analiz dispersional unifactorial se testeaz
ipoteza nul:
H
0
:
y1
=
y2
= ... =
yr
,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt
egale:
H
1
:
yi
=
yj
, (i = j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ
diferite, se concluzioneaz c factorul X are un impact asupra
variabilei Y.
Setul de date pentru analiza dispersional unifactorial const
n valorile variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n
1
= n
2
= ... = n
r
4
Sistematizarea datelor pentru ANOVA


y
11
y
21
y
r1

y
12
y
22
y
r2

. .
. .
1
n 1
y

2
n 2
y
. . . . .
r
rn
y
1
y
2
y
. . . . .
r
y
Grupe dup factorul cauz
Gr. 1 Gr. 2 . . . . Gr.r
Media
Vol. grup

n
1
n
2
. . . .. n
r

Analiz dispersional unifactorial
5
Analiz dispersional unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din
cele r grupe ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal,
iar abaterile medii ptratice sunt egale
1
=
2
= ..... =
r
.
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s
fie, toate, egale. Ne ateptm atunci ca mediile celor r eantioane s
fie aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre
unele medii ale eantioanelor.
6
Analiz dispersional unifactorial







a) b)
a) medii de grup egale; b) mediile de grup inegale
7
Analiz dispersional unifactorial
pe baza datelor din eantion calculm:
r 1, i ,
1
= =

=
i
n
j
ij
i
n
y
y
i
n
n y
n
y
y
r
i
i i
r
i
n
j
ij
i

=
= =
= =
1
1 1

=
=
r
i
i
n n
1
8
Analiz dispersional unifactorial
Variana dintre grupe, dat de influena factorului cauzal,
numit i variana factorial, este suma ptratelor abaterilor
mediilor de grup de la media general:


Dac atunci: SSB = 0.
Variana din interiorul grupelor (variana rezidual), este
suma ptratelor abaterilor valorilor individuale de la mediile de
grup:

mprtierea total a valorilor individuale fa de media
general (variana total):

r 2 1
y ... y y = = =
( )

=
=
r
i
i i
n y y SSB
1
2
( )

= =
=
r
i
n
j
i ij
i
y y SSW
1 1
2
( )

= =
=
r
i
n
j
ij
i
y y SST
1 1
2
9
Analiz dispersional unifactorial
Raionamentul analizei dispersionale se bazeaz pe
partiionarea sumei ptratelor abaterilor:



sau SST = SSB + SSW.
Pentru a face comparabile aceste msuri ale variabilitii, le
vom raporta pe fiecare la gradele de libertate => media
ptratelor abaterilor.
Pentru variana factorial SSB, numrul gradelor de libertate
este r-1; msurm variabilitatea a r medii, se pierde un grad
de libertate, deoarece media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) SSW,
numrul gradelor de libertate este nr; msurm
variabilitatea tuturor celor n valori, dar pierdem r grade de
libertate.
( ) ( ) ( )

= = = = =
+ =
r
i
n
j
i ij
r
i
i i
r
i
n
j
ij
i i
y y n y y y y
1 1
2
1
2
1 1
2
10
Analiz dispersional unifactorial
Obinem astfel:
dispersia factorial corectat:



dispersia rezidual corectat:


( )
1 1
1
2
2
1

=

=
r
n y y
r
SSB
s
r
i
i i
( )
r n
y y
r n
SSW
s
r
i
n
j
i ij
i

=

= = 1 1
2
2
2
11
Analiz dispersional unifactorial
Statistica testului pentru analiza dispersional
unifactorial este:



care urmeaza o repartitie Fisher cu perechea de
grade de libertate (r1,nr) provenind de la
numrtor, repectiv de la numitor.
Regiunea critic este dat de :
F> F
o;r-1,n-r
(F
critic
)


acest lucru indic diferene mai mari ntre mediile
grupelor dect cele datorate ntmplrii.
( ) r n r
Fisher
grupelor interiorul din atea variabilit
grupe dintre atea variabilit
s
s
r n
SSW
r
SSB
F

e = =

=
, 1
2
2
2
1 1
12
Analiz dispersional unifactorial
Dac valoarea F
calc
este mai mic dect valoarea critic
F
;r-1,n-r
atunci :
acceptm ipoteza nul, H
0
;
nu acceptm ipoteza alternativ H
1
;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar
ntmplrii;
rezultatul nu este semnificativ statistic.
Dac valoarea F
calc
este mai mare dect valoarea critic
F
;r-1,n-r
atunci:
acceptm ipoteza alternativ, H
1
;
respingem ipoteza nul, H
0
;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar
ntmplrii;
rezultatul este semnificativ statistic.
13
Analiz dispersional unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
2
1
s
2
2
s
2
2
2
1
s
s
F =
s
2
=
2
2
2
1
s s +
Sursa variaiei Gradele de
libertate
Variana
(suma ptratelor)
Dispersia
corectat
(media
ptratelor)
Statistica F
Factorul X (Between Groups)


Rezidual (Within Groups)
r 1


n r
SSB


SSW
Total n 1 SST = SSB + SSW
14
Concluzii
modelele de analiz dispersional nu explic relaia dintre
variabile
verific doar msura n care valorile reale ale unei
caracteristici se abat de la valorile teoretice, precum i
msura n care aceste variaii sunt sau nu dependente de
factorul/factorii de grupare.
metoda analizei dispersionale poate fi utilizat att
naintea, ct i dup aplicarea metodelor corelaiei i
regresiei statistice.
Testul F se poate utiliza i pentru testarea validitii
modelului de regresie.
n general, n analiza dispersional, nivelurile x
1
, x
2
, ..., x
r

sunt niveluri ale unei variabile categoriale (numite i
tratamente), dar, cum ceea ce este valabil pentru o scal
inferioar (nominal) este valabil i pentru orice alt scal
superioar (ordinal, de intervale, de rapoarte), analiza se
poate extinde.
15
Exemplu
Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii
(%). Folosind analiza dispersional s se stabileasc dac exist diferene
semnificative ntre regiuni.

i x
2
i
s
) 1 (
2
2
=
i i
n s S
Regiunea Nr.
judee
(n
i
)
Rata medie a ocuprii


(%)
Abaterea
medie
ptratic (s
i
)
Dispersia
NE 6 47.77 4.89 23.91 119.55
SE 6 41.24 5.68 32.26 161.3
S 7 40.68 6.57 43.16 258.96
SV 5 41.9 3.31 10.96 43.84
V 4 42.71 6.18 38.19 114.57
NV 6 46.32 5.84 34.11 170.55
C 6 42.08 2.32 5.38 26.9
Buc 2 41.59 5.62 31.58 31.58
Total 42 43.16 5.41 = s 29.27 = s
2
927.25

=
16
Exemplu
07 . 1200 41 * 27 . 29
82 . 272
25 . 927
1
2
= =
=
=
S
S
S
27 . 29
1 42
07 . 1200
97 . 38
1 8
82 . 272
27 . 27
8 42
25 . 927
2
2
1
2
2
=

=
=

=
=

=
s
s
s
0 34 ; 7 ; 05 . 0
34 ; 7 ; 05 . 0
40 . 2
42 . 1
27 . 27
97 . 38
H F F
F
F
<
=
= =