Sunteți pe pagina 1din 16

Econometrie

Curs 3
ELEMENTE DE ANALIZ DISPERSIONAL
(ANOVA)

Prof.univ.dr. Emilia IAN

ELEMENTE DE ANALIZ DISPERSIONAL (ANOVA)

Analiza dispersional (analiz de varian) (ANOVA), a fost


introdus de statisticianul Irving Fisher.
Modelul de analiz dispersional i propune ca pentru fiecare
nivel al factorului/factorilor cauzali s analizeze populaia
distinct asociat i eventualele diferene ce apar ntre
populaii:
s
studieze
efectul
variabilei/variabilelor
independente asupra celei dependente.
Analiza dispersional se poate face dup
unifactorial, dup modele bi sau multifactoriale.

un

model

Analiz dispersional unifactorial


n modelul de analiz dispersional unifactorial se testeaz
ipoteza nul:
H0: y1 = y2 = ... = yr,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt
egale:
H1 : yi yj,
(i j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ
diferite, se concluzioneaz c factorul X are un impact asupra
variabilei Y.
Setul de date pentru analiza dispersional unifactorial const
n valorile variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n1 n2 ... nr
3

Analiz dispersional unifactorial

Sistematizarea datelor pentru ANOVA


Grupe dup factorul cauz
Gr. 1

Gr. 2

... .

Gr.r

y11
y12
.
.
y1 n

y21
y22
.
.

yr1
yr2

y 2n 2

.....

y rnr

y1
n1

y2
n2

.....

yr
nr

Media
Vol. grup

. . . ..

Analiz dispersional unifactorial

Presupunerile sub care se aplic testul F n analiza dispersional


unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din
cele r grupe ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal,
iar abaterile medii ptratice sunt egale 1 = 2 = ..... = r.
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s
fie, toate, egale. Ne ateptm atunci ca mediile celor r eantioane s
fie aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre
unele medii ale eantioanelor.
5

Analiz dispersional unifactorial

a)
a) medii de grup egale;

b)
b) mediile de grup inegale

Analiz dispersional unifactorial

pe baza datelor din eantion calculm:


ni

yi

y
r

ij

j 1

ni

i 1, r

ni

y
i 1 j 1

ij

yn
i

i 1

n ni
i 1

Analiz dispersional unifactorial


Variana dintre grupe, dat de influena factorului cauzal,
numit i variana factorial, este suma ptratelor abaterilor
mediilor de grup de la media general:
r

SSB yi y ni
2

i 1

Dac

y 1 y 2 ... y r

atunci: SSB = 0.

Variana din interiorul grupelor (variana rezidual), este


suma ptratelor abaterilor valorilor individuale de la mediile de
r ni
2
grup:
SSW yij yi
i 1 j 1

mprtierea total a valorilor individuale fa de media


r ni
general (variana total):
2
SST yij y
i 1 j 1

Analiz dispersional unifactorial

Raionamentul analizei dispersionale


partiionarea sumei ptratelor abaterilor:

y
r

ni

i 1 j 1

ij

se

bazeaz

pe

y yi y ni yij yi
2

i 1

ni

i 1 j 1

sau
SST = SSB + SSW.
Pentru a face comparabile aceste msuri ale variabilitii, le
vom raporta pe fiecare la gradele de libertate => media
ptratelor abaterilor.
Pentru variana factorial SSB, numrul gradelor de libertate
este r-1; msurm variabilitatea a r medii, se pierde un grad
de libertate, deoarece media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) SSW,
numrul gradelor de libertate este nr; msurm
variabilitatea tuturor celor n valori, dar pierdem r grade de
libertate.
9

Analiz dispersional unifactorial

Obinem astfel:
dispersia factorial corectat:
r

SSB
s

r 1
2
1

y
ni
i
i 1

r 1

dispersia rezidual corectat:

y
r

SSW
s

nr
2
2

ni

i 1 j 1

yi

ij

nr
10

Analiz dispersional unifactorial


Statistica testului
unifactorial este:

pentru

analiza

dispersional

SSB
s12
variabilitatea dintre grupe
r

1
F
2
Fisherr 1,n r
SSW s 2 variabilitatea din interiorul grupelor
nr

care urmeaza o repartitie Fisher cu perechea de


grade de libertate (r1,nr) provenind de la
numrtor, repectiv de la numitor.
Regiunea critic este dat de :

F> F

;r-1,n-r

(Fcritic)

acest lucru indic diferene mai mari ntre mediile


grupelor dect cele datorate ntmplrii.
11

Analiz dispersional unifactorial

Dac valoarea Fcalc este mai mic dect valoarea critic


F;r-1,n-r atunci :

acceptm ipoteza nul, H0;


nu acceptm ipoteza alternativ H1;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar
ntmplrii;
rezultatul nu este semnificativ statistic.

Dac valoarea Fcalc este mai mare dect valoarea critic


F;r-1,n-r atunci:

acceptm ipoteza alternativ, H1;


respingem ipoteza nul, H0;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar
ntmplrii;
rezultatul este semnificativ statistic.
12

Analiz dispersional unifactorial

Calculul statisticii F
pentru analiza dispersional unifactorial
Sursa variaiei

Gradele de
libertate

Variana
(suma ptratelor)

Factorul X (Between Groups)

r1

SSB

Rezidual (Within Groups)

nr

SSW

Total

n1

SST = SSB + SSW

Dispersia
corectat
(media
ptratelor)
s12
s 22
2
2
s2 s1 s2

Statistica F

s12
s22

13

Concluzii

modelele de analiz dispersional nu explic relaia dintre


variabile
verific doar msura n care valorile reale ale unei
caracteristici se abat de la valorile teoretice, precum i
msura n care aceste variaii sunt sau nu dependente de
factorul/factorii de grupare.
metoda analizei dispersionale poate fi utilizat att
naintea, ct i dup aplicarea metodelor corelaiei i
regresiei statistice.
Testul F se poate utiliza i pentru testarea validitii
modelului de regresie.
n general, n analiza dispersional, nivelurile x1, x2, ..., xr
sunt niveluri ale unei variabile categoriale (numite i
tratamente), dar, cum ceea ce este valabil pentru o scal
inferioar (nominal) este valabil i pentru orice alt scal
superioar (ordinal, de intervale, de rapoarte), analiza se
poate extinde.
14

Exemplu

Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii
(%). Folosind analiza dispersional s se stabileasc dac exist diferene
semnificative ntre regiuni.
Regiunea

Nr.
judee
(ni)

Rata medie a ocuprii

xi

Abaterea
medie
ptratic (si)

Dispersia

2
i

S 2 si2 (ni 1)

(%)
NE

47.77

4.89

23.91

119.55

SE

41.24

5.68

32.26

161.3

40.68

6.57

43.16

258.96

SV

41.9

3.31

10.96

43.84

42.71

6.18

38.19

114.57

NV

46.32

5.84

34.11

170.55

42.08

2.32

5.38

26.9

Buc

41.59

5.62

31.58

31.58

Total

42

43.16

5.41 = s

29.27 = s2

927.25
15

Exemplu
927.25
s
27.27
42 8
272.82
s12
38.97
8 1
1200.07
s2
29.27
42 1
2
2

S 2 927.25
S1 272.82
S 29.27 * 41 1200.07

38.97
1.42
27.27
F0.05;7;34 2.40
F

F F0.05;7;34 H 0
16

S-ar putea să vă placă și