Sunteți pe pagina 1din 15

ELEMENTE DE ANALIZ

DISPERSIONAL (ANOVA)

ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)

Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de


statisticianul Irving Fisher.

Analiza dispersianal se utilizeaz pentru a determina n ce msur


difer media variabilei analizate de la o grup la alta .
Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.

Analiz dispersional unifactorial

n modelul de analiz dispersional unifactorial se testeaz ipoteza nul:


H0: y1 = y2 = ... = yr,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt egale:
H1 : yi yj, (i j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite,
se concluzioneaz c factorul X are un impact asupra variabilei Y.
Setul de date pentru analiza dispersional unifactorial const n valorile
variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n1 n2 ... nr

Analiz dispersional unifactorial

Sistematizarea datelor pentru ANOVA


Grupe dup factorul cauz
Gr. 1
y11
y12
.
.
y 1n

Media
Vol. grup

y1

n1

Gr. 2

y21
y22
.
.
1

y 2n

... .

y2

n2

Gr.r
yr1
yr2

.....

y rn r

.....

yr

. . . ..

nr

Analiz dispersional unifactorial

Presupunerile sub care se aplic testul F n analiza dispersional


unifactorial:

Testul statistic F pentru analiza dispersional unifactorial este raportul


indicatorilor de variabilitate pentru cele dou surse de variaie:

cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale s1 = s2 = ..... = sr.

variabilitatea dintre grupe


variabilitatea din interiorul grupelor.

Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s fie,
toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie
aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre unele
medii ale eantioanelor.

Analiz dispersional unifactorial

Pe baza datelor din eantion calculm:


ni

yi

y
j 1

ij

ni

ni

y
i 1 j 1

n
r

n ni
i 1

i 1, r

ij

y n
i

i 1

Analiz dispersional unifactorial

Variana dintre grupe, dat de influena factorului cauzal, numit i


variana factorial, este suma ptratelor abaterilor mediilor de grup de
la media general (SSR):
r

S1 y i y n i
i 1

Dac y1 y 2 ... y r
atunci: S1 = 0.
variana din interiorul grupelor (variana rezidual), este suma
ptratelor abaterilor valorilor individuale de la mediile de grup (SSE):
r

ni

S 2 yij y i
i 1 j 1

S
2

2
i

* ni

mprtierea total a valorilor individuale fa de media general


n
r
2
(variana total)-SST:
S y ij y
i

i 1

j 1

Analiz dispersional unifactorial

Pentru variana factorial S1, numrul gradelor de libertate este r-1;


msurm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) S2, numrul gradelor de
libertate este nr; msurm variabilitatea tuturor celor n valori, dar
pierdem r grade de libertate.

Analiz dispersional unifactorial

Obinem astfel:

dispersia factorial corectat:

y
r

S
s12 1
r 1

y ni

i 1

r 1

dispersia corectat rezidual:

y
r

S2
2
s2

nr

i 1

ni

ij

yi

j 1

nr

Analiz dispersional unifactorial

Statistica F pentru analiza dispersional unifactorial are forma:

s12
var iabilitate a dintre grupe
F 2
s 2 variabilit atea din interiorul grupelor

cu gradele de libertate (r 1) la numrtor i (n r) la numitor.


Regiunea critic este dat de :
F> F(r- 1),(n- r),,

acest lucru indic diferene mai mari ntre mediile grupelor dect cele
datorate ntmplrii.

Analiz dispersional unifactorial

dac valoarea F este mai mic dect valoarea critic F, atunci :

acceptm ipoteza nul, H0;


nu acceptm ipoteza alternativ H1;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.

Dac valoarea F este mai mare dect valoarea critic F, atunci:

acceptm ipoteza alternativ, H1;


respingem ipoteza nul, H0;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.

Analiz dispersional unifactorial


Calculul statisticii F
pentru analiza dispersional unifactorial
Sursa
variaiei

Gradele de
libertate

Variana
(suma ptratelor)

Dispersia corectat
(media ptratelor)

Statistica
F

Factorul X

r1

S1

s12

Rezidual

nr

S2

s 22

Total

n1

S = S1 + S2

2
2
s2 s1 s2

s12
s22

Concluzii

Modelele de analiz dispersional nu explic relaia dintre variabile;

Verific doar msura n care valorile reale ale unei caracteristici se abat
de la valorile teoretice, precum i msura n care aceste variaii sunt sau
nu dependente de factorul/factorii de grupare;
Metoda analizei dispersionale poate fi utilizat att naintea, ct i dup
aplicarea metodelor corelaiei i regresiei statistice;
Testul F se poate utiliza i pentru testarea validitii modelului de
regresie;
Permite compararea mediilor a dou sau mai multor colectiviti de date
cantitative

Exemplu

Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni.
Regiunea

Nr.
judee
(ni)

Rata medie a ocuprii

xi

Abaterea
medie
ptratic (si)

Dispersia

2
i

S 2 si2 (ni 1)

(%)
NE

47.77

4.89

23.91

119.55

SE

41.24

5.68

32.26

161.3

40.68

6.57

43.16

258.96

SV

41.9

3.31

10.96

43.84

42.71

6.18

38.19

114.57

NV

46.32

5.84

34.11

170.55

42.08

2.32

5.38

26.9

Buc

41.59

5.62

31.58

31.58

Total

42

43.16

5.41 = s

29.27 = s2

927.25

Exemplu
927.25
s
27.27
42 8
272.82
s12
38.97
8 1
1200.07
s2
29.27
42 1
2
2

S 2 927.25
S1 272.82
S 29.27 * 41 1200.07

38.97
1.42
27.27
F0.05;7;34 2.40

F F0.05;7;34 H 0

S-ar putea să vă placă și