Sunteți pe pagina 1din 17

ELEMENTE DE ANALIZ

DISPERSIONAL (ANOVA)


Cnd se folosete ANOVA?
ANOVA se folosete pentru testarea diferenei semnificative ntre mai
multe medii
Dac se compar doar dou medii se obin aceleai rezultate cu ale
testului t pentru testarea diferenelor ntre medii
ANOVA = Analiza de varian
ANOVA a fost introdus de statisticianul Irving Fisher.

Principiul de baz: variaia total este descompus n suma variaiei
dintre grupe i a variaiei din interiorul grupelor

ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)
Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de
statisticianul Irving Fisher.

Modelul de analiz dispersional i propune ca pentru fiecare nivel al
factorului/factorilor cauzali s analizeze populaia distinct asociat i
eventualele diferene ce apar ntre populaii: s studieze efectul
variabilei/variabilelor independente asupra celei dependente.

Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.
Analiz dispersional unifactorial
n modelul de analiz dispersional unifactorial se testeaz:
ipoteza nul
H
0
:
y1
=
y2
= ... =
yr
,
ipoteza alternativ: cel puin dou medii din populaie nu sunt egale:
H
1
: exist i = j astfel nct
yi
=
yj


Setul de date pentru analiza dispersional unifactorial const n
valorile variabilei Y pentru cele r grupe independente.

Volumele grupelor/eantioanelor pot fi diferite n
1
= n
2
= ... = n
r
Analiz dispersional unifactorial
Sistematizarea datelor pentru ANOVA


y
11
y
21
y
r1

y
12
y
22
y
r2

. .
. .
1
n 1
y

2
n 2
y
. . . . .
r
rn
y
1
y
2
y
. . . . .
r
y
Grupe dup factorul cauz
Gr. 1 Gr. 2 . . . . Gr.r
Media
Vol. grup

n
1
n
2
. . . .. n
r

Analiz dispersional unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale

Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.

Ipoteza nul este adevrat: mediile celor r populaii sunt toate egale
Ipoteza alternativ este adevrat: exist diferene semnificative ntre
mediile a cel puin dou grupe, deci factorul X are un impact asupra
variabilei Y.

Analiz dispersional
unifactorial








a) b)
a) medii de grup egale; b) mediile de grup inegale
Analiz dispersional unifactorial
pe baza datelor din eantion calculm:
r 1, i ,
1
= =

=
i
n
j
ij
i
n
y
y
i
n
n y
n
y
y
r
i
i i
r
i
n
j
ij
i

=
= =
= =
1
1 1

=
=
r
i
i
n n
1
Analiz dispersional unifactorial
Variana dintre grupe sau variana factorial, dat de influena
factorului cauzal, este suma ptratelor abaterilor mediilor de grup de la
media general:


Variana din interiorul grupelor sau variana rezidual, este suma
ptratelor abaterilor valorilor individuale de la mediile de grup:


Variana total, mprtierea valorilor individuale fa de media general

( )

=
=
r
1 i
i
2
i 1
n y y S
( )

= =
=
r
1 i
n
1 j
2
i ij 2
i
y y S
( )
i
n
r
2
ij 1 2
i 1 j 1
S y y S S
= =
= = +

Analiz dispersional unifactorial
Pentru ca aceste msuri ale variabilitii s fie comparabile trebuie s le
raportm la gradele lor de libertate:
Variana factorial S
1
: msoar variabilitatea a r medii fa de media
total, deci numrul gradelor de libertate este r-1

dispersia factorial corectat:

Variana rezidual S
2
: msoar variabilitatea tuturor celor n valori
fa de mediile de grup, deci numrul gradelor de libertate este nr

dispersia rezidual corectat:

( )
1 r
n y y
1 r
S
s
r
1 i
i
2
i
1 2
1

=

=
( )
r n
y y
r n
S
s
r
1 i
ni
1 j
2
i ij
2 2
2

=

= =
Analiz dispersional unifactorial
Statistica F pentru analiza dispersional unifactorial are forma:




cu gradele de libertate (r 1) la numrtor i (n r) la numitor.

Regiunea critic este dat de :
F> F(r- 1),(n- r),o,










grupelor interiorul din atea variabilit
grupe dintre a iabilitate var
s
s
F
2
2
2
1
= =
Analiz dispersional unifactorial
Dac , atunci :
acceptm ipoteza nul, H
0
;
respingem ipoteza alternativ H
1
;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.

Dac , atunci:
acceptm ipoteza alternativ, H
1
;
respingem ipoteza nul, H
0
;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.
,r 1,n r
F F
o
<
,r 1,n r
F F
o
>
Analiz dispersional unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
2
1
s
2
2
s
2
2
2
1
s
s
F =
Sursa
variaiei
Gradele de
libertate
Variana
(suma ptratelor)
Dispersia corectat
(media ptratelor)
Statistica
F
Factorul X

Rezidual
r 1

n r
S
1


S
2

Total
n 1 S = S
1
+ S
2

Exemplu
i x
2
i i
s ( n 1)
Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni
pentru o probabilitate de garantare a rezultatelor de 95%.

2
i
s
Regiunea Nr.
judee
(n
i
)
Rata medie a ocuprii


(%)
Abaterea
medie
ptratic (s
i
)
Dispersia
N
12

47.77 4.89 23.91 119.55
S
18
41.24 5.68 32.26 161.3
C
10
42.08 2.32 5.38 26.9
Buc
2
41.59 5.62 31.58 31.58
Modelul de analiz dispersional
bifactorial
se identific doi factori de influen, iar variabilitatea caracteristicii
rezultative poate s fie pus:
pe seama influenei primului factor (cu I niveluri);
pe seama influenei celui de-al doilea factor (cu J niveluri);
pe seama interaciunii celor doi factori;
pe seama ntmplrii (factorului rezidual).

O valoare nregistrat pentru variabila efect Y, la grupa i ( ) a
primului factor i grupa j ( ) a celui de-al doilea factor este y
ijk
, (cu
k = numrul de observaii din fiecare celul considerat pentru
nivelul i al primului factor i nivelul j al celui de-al doilea factor).
I , 1 i =
J , 1 j =
K , 1
Modelul de analiz dispersional
bifactorial
media celulei este:


media grupei i ( ) pentru primul factor este:


media grupei j ( ) pentru al doilea factor este:


media total este:


K
x
x
K
1 k
ijk
. ij

=
=
I , 1 i =
JK
x
x
J
1 j
K
1 k
ijk
. . i

= =
=
J , 1 j =
IK
x
x
I
1 i
K
1 k
ijk
. j .

= =
=
J
x
I
x
IJK
x
x
J
1 j
. j .
I
1 i
. . i
I
1 i
J
1 j
K
1 k
ijk

=
=
= = =
= = =
Modelul de analiz dispersional
bifactorial
Analiza dispersional bifactorial

Sursa variaiei
Grade de
libertate
Variana
(suma ptratelor)
Dispersia
corectat (media
ptratelor)
Statisica
F
0 1 2 3 4
Primul factor I 1
Al doilea factor J 1
Interaciunea
celor doi factori
(I-1)(J-1)
Rezidual IJ(K-1)
Total IJK1
( )

=
=
I
1 i
2
. . i
1
x x JK S
( )

=
=
J
1 j
2
. j .
2
x x IK S
( )

= =
+ =
I
1 i
J
1 j
2
. j . . . i
. ij 3
x x x x K S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
. ij
ijk 4
x x S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
ijk
x x S
1 I
S
s
1 2
1

=
1 J
S
s
2 2
2

=
( )( ) 1 J 1 I
S
s
3 2
3

=
( ) 1 K IJ
S
s
4 2
4

=
2
4
2
1
s
s
F =
2
4
2
2
s
s
F =
2
4
2
3
s
s
F =

S-ar putea să vă placă și