Sunteți pe pagina 1din 14

1

1. Analiza dispersional (ANOVA)


Cnd se folosete ANOVA?
ANOVA (ANalysis Of VAriance) analiza varianei (dispersiei) se
folosete pentru testarea diferenei semnificative ntre mai multe
medii
Dac se compar doar dou medii se obin aceleai rezultate cu ale
testului t pentru testarea diferenelor ntre medii
Este des practicat pentru analiza datelor experimentelor, dar poate fi
foarte util i n cazul anchetelor
ANOVA a fost introdus de statisticianul Irving Fisher.
Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.
Principiul de baz: variaia total este descompus n suma variaiei
dintre grupe i a variaiei din interiorul grupelor
2
ANOVA comparat cu alte metode
Regresia ANOVA Discriminant
Variabila dependent Metric Metric Categorial
Variabila independent Metric Categorial Metric
Principalele deosebiri intre cele 3 metode de analiz:
Spre exemplu, cercettorul dorete s afle dependena consumului
de cereale la micul dejun (variabil metric) pe categorii de vrst:
copii, tineret, aduli (variabil nominal, adic categorial)
ANOVA unifactorial
n modelul de analiz dispersional unifactorial se testeaz:
ipoteza nul
H
0
:
y1
=
y2
= ... =
yr
,
ipoteza alternativ: cel puin dou medii din populaie nu sunt egale:
H
1
: exist i = j astfel nct
yi
=
yj
Setul de date pentru analiza dispersional unifactorial const din
valorile variabilei Y pentru cele r grupe independente.
Mrimile grupelor/eantioanelor pot fi diferite n
1
= n
2
= ... = n
r
3
ANOVA unifactorial
Sistematizarea datelor pentru ANOVA
2
y
Respondentul /
unitatea
Date pe grupe dup factorul cauz
Grupa 1 Grupa 2 Grupa r
1 y
11
y
21
y
r1
2 y
12
y
22
y
r2
3 y
13
y
23
y
r3



7 y
1n
y
2n
y
rn
Total
y
1n
y
2n
y
rn
Mediile
grupurilor
2
y
r
y
ANOVA unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Ipoteza nul este adevrat: mediile celor r populaii sunt toate egale
Ipoteza alternativ este adevrat: exist diferene semnificative ntre
mediile a cel puin dou grupe, deci factorul X are un impact asupra
variabilei Y.
4
ANOVA unifactorial
a) b)
a) medii de grup egale; b) mediile de grup inegale
o
y
x
o
y
x
x
1
x
1
x
2
x
2
...... x
r
..... x
r
y =y = =y
1 2 r
y
1
y
2
y
r
ANOVA unifactorial
pe baza datelor din eantion calculm:
- media grupelor
- media general
r ,... 1 i ,
n
y
y
i
n
1 i
i
i
i
= =

=
n
n y
n
y
y
r
1 i
i i
n
1 i
r
1 j
ij


=
= =
= =
5
ANOVA unifactorial
Variana dintre grupe sau variana factorial, dat de influena
factorului cauzal, este suma ptratelor abaterilor mediilor de grup de la
media general:
Variana din interiorul grupelor sau variana rezidual, este suma
ptratelor abaterilor valorilor individuale de la mediile de grup:
Variana total, mprtierea valorilor individuale fa de media general
( )

=
=
r
1 i
i
2
i 1
n y y S
( )

= =
=
r
1 i
n
1 j
2
i ij 2
i
y y S
( )
i
n r 2
ij 1 2
i 1 j 1
S y y S S
= =
= = +
ANOVA unifactorial
Pentru ca aceste msuri ale variabilitii s fie comparabile trebuie s le
raportm la gradele lor de libertate:
Variana factorial S
1
: msoar variabilitatea a r medii fa de media
total, deci numrul gradelor de libertate este r-1
dispersia factorial corectat:
Variana rezidual S
2
: msoar variabilitatea tuturor celor n valori
fa de mediile de grup, deci numrul gradelor de libertate este nr
dispersia rezidual corectat:
( )
1 r
n y y
1 r
S
s
r
1 i
i
2
i
1 2
1

=

=
( )
r n
y y
r n
S
s
r
1 i
ni
1 j
2
i ij
2 2
2

=

= =
6
ANOVA unifactorial
Statistica F pentru analiza dispersional unifactorial are forma:
cu gradele de libertate (r 1) la numrtor i (n r) la numitor.
Regiunea critic este dat de :
F> F(r- 1),(n- r),o,
grupelor interiorul din atea variabilit
grupe dintre a iabilitate var
s
s
F
2
2
2
1
= =
ANOVA unifactorial
Dac , atunci :
acceptm ipoteza nul, H
0
;
respingem ipoteza alternativ H
1
;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.
Dac , atunci:
acceptm ipoteza alternativ, H
1
;
respingem ipoteza nul, H
0
;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.
,r 1,n r
F F
o
<
,r 1,n r
F F
o
>
7
ANOVA unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
2
1
s
2
2
s
2
2
2
1
s
s
F=
Sursa
variaiei
Gradele de
libertate
Variana
(suma
ptratelor)
Dispersia
corectat
(media
ptratelor)
Statistic
a F
Factorul X
Rezidual
r 1
n r
S
1
S
2
Total
n 1 S = S
1
+ S
2

Exemplu: ANOVA unifactorial
n cadrul unei cercetri de marketing realizate pentru o reea de
magazine s-a urmrit analiza influenei publicitii interioare a
magazinului asupra vnzrilor. n acest scop au fost selectate 30 de
magazine, care au fost divizate n 3 grupuri dup nivelul intensitii
publicitii (nalt, mediu i jos).
Cunoscnd valoarea teoretic a raportului dispersiilor F
corespunztoare unui nivel de semnificaie de 5%, s se determine
dac variabila experimental (intensitatea publicitii) a exercitat un
impact semnificativ asupra volumului vnzrilor nregistrate de
unitile comerciale respective.
8
Continuare (datele de teren)
Nr.
magazinului
Intensitatea publicitii interioare din magazin
nalt Medie Joas
1 10 8 5
2 9 8 7
3 10 7 6
4 8 9 4
5 9 6 5
6 8 4 2
7 9 5 3
8 7 5 2
9 7 6 1
10 6 4 2
Total 83 62 37
Mediile
grupurilor
8,3 6,2 3,7
Media general y = (83+62+37)/30=6,067
Continuare
Variana dintre grupe sau variana factorial, dat de influena
factorului cauzal, este suma ptratelor abaterilor mediilor de grup de la
media general:
Variana din interiorul grupelor sau variana rezidual, este suma
ptratelor abaterilor valorilor individuale de la mediile de grup:
Variana total, mprtierea valorilor individuale fa de media
general, sau S
1
+S
2
( ) 067 , 106 ) 067 , 6 7 , 3 ( 10 ) 067 , 6 2 , 6 ( 10 ) 067 , 6 3 , 8 ( 10
2 2 2
1
2
1
= + + = =

=
r
i
i i
n y y S
( ) 8 , 79 ) 7 , 3 2 ...( ) 2 , 6 8 ...( ) 3 , 8 9 ( ) 3 , 8 10 (
2 2 2 2
1 1
2
2
= + + + = =

= =
r
i
n
j
i ij
i
y y S
( ) 867 , 185 ) 067 , 6 2 ( ) 067 , 6 1 ...( ) 067 , 6 9 ( ) 067 , 6 10 (
2 2 2 2
1 1
2
= + + + = =

= =
r
i
n
j
ij
i
y y S
9
Continuare
Pentru ca aceste msuri ale variabilitii s fie comparabile trebuie s le
raportm la gradele lor de libertate:
Variana factorial S
1
: msoar variabilitatea a r medii fa de media
total, deci numrul gradelor de libertate este r-1
dispersia factorial corectat:
Variana rezidual S
2
: msoar variabilitatea tuturor celor n valori
fa de mediile de grup, deci numrul gradelor de libertate este nr
dispersia rezidual corectat:
( )
34 , 53 ) 1 3 /( 067 , 106
1 1
1
2
1 2
1
= =

=

=
r
n y y
r
S
s
r
i
i i
( )
96 , 2 ) 3 30 /( 8 , 79
1 1
2
2 2
2
= =

=

= =
r n
y y
r n
S
s
r
i
ni
j
i ij
Continuare
Statistica F pentru analiza dispersional unifactorial are forma:
cu gradele de libertate (r 1) la numrtor i (n r) la numitor.
F
(r- 1),(n- r),o,
=F
(3- 1),(30-3),o
= 3,35
Regiunea critic este dat de :
F
c
> F(r- 1),(n- r),o,
Ipoteza nul e respins. Diferenele sunt semnificative. Influena factorului
publicitatea intern este semnificativ
94 , 17
grupelor interiorul din atea variabilit
grupe dintre var
2
2
2
1
= = =
a iabilitate
s
s
Fc
10
ANOVA bifactorial
se identific doi factori de influen, iar variabilitatea caracteristicii
rezultative poate s fie pus:
pe seama influenei primului factor (cu I niveluri);
pe seama influenei celui de-al doilea factor (cu J niveluri);
pe seama interaciunii celor doi factori;
pe seama ntmplrii (factorului rezidual).
O valoare nregistrat pentru variabila efect Y, la grupa i ( ) a
primului factor i grupa j ( ) a celui de-al doilea factor este y
ijk
, (cu
k = - numrul de observaii din fiecare celul considerat pentru
nivelul i al primului factor i nivelul j al celui de-al doilea factor).
I , 1 i =
J , 1 j =
K , 1
ANOVA bifactorial
media celulei este:
media grupei i ( ) pentru primul factor este:
media grupei j ( ) pentru al doilea factor este:
media total este:
K
x
x
K
1 k
ijk
. ij

=
=
I , 1 i =
JK
x
x
J
1 j
K
1 k
ijk
.. i

= =
=
J , 1 j =
IK
x
x
I
1 i
K
1 k
ijk
. j .

= =
=
J
x
I
x
IJK
x
x
J
1 j
. j .
I
1 i
.. i
I
1 i
J
1 j
K
1 k
ijk

=
=
= = =
= = =
11
ANOVA bifactorial
Analiza dispersional bifactorial
Sursa variaiei
Grade de
libertate
Variana
(suma ptratelor)
Dispersia corectat
(media ptratelor)
Statisica
F
0 1 2 3 4
Primul factor I 1
Al doilea factor J 1
Interaciunea celor
doi factori
(I-1)(J-1)
Rezidual IJ(K-1)
Total IJK1
( )

=
=
I
i
i x x IK S
1
2
..
1
( )

=
=
J
j
j x x JK S
1
2
. .
2
( )

= =
+ =
I
1 i
J
1 j
2
. j . .. i
. ij 3
x x x x K S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
. ij
ijk 4
x x S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
ijk
x x S
1 I
S
s
1 2
1

=
1 J
S
s
2 2
2

=
( )( ) 1 J 1 I
S
s
3 2
3

=
( ) 1 K IJ
S
s
4 2
4

=
2
4
2
1
s
s
F =
2
4
2
2
s
s
F =
2
4
2
3
s
s
F =
Exemplu: ANOVA bifactorial
FactorulA
Publicitate
FactorulB mediul
Urban Rural
Cu
publicitate
8 6 9 8 7 7
7 7 8 9 7 8
Fr
publicitate
8 7 9 9 8 8
6 8 9 10 8 9
O ntreprindere de lactate a lansat pe pia un nou tip de iaurt. n scopul testrii
pieei a fost proiectat un experiment cu doi factori independeni: mediul (urban i
rural) i publicitatea (cu i fr).
Datele despre vnzrile lunare ale produsului n cauz n 24 magazine (cte 6
pentru fiecare combinare de factori) selectate aleator pe ntreg teritoriul rii sunt
prezentate n tabel (mii lei):
De analizat influena factorilor utiliznd metoda ANOVA (pentru 2 factori
independeni).
12
Rezolvare: tabelul mediilor
Factorul2
Publicitate
Factorul1 mediul
Urban Rural
Media j
Cupublicitate MediaK11=7,50 MediaK12=7,67 7,58
Fr
publicitate
MediaK21=7,83 MediaK22=8,67 8,25
MEDIAi 7,67 8,17 7,92
Rezolvare: sursa varianei (dispersiei)
Primul factor (mediul):
Factorul al doilea (publicitatea):
Interaciunea factorilor 1 i 2:
( ) 50 , 1 ) 92 , 7 17 , 8 ( 6 2 ) 92 , 7 67 , 7 ( 6 2
2 2
1
2
..
1
= + = =

=
I
i
i x x IK S
( ) 67 , 2 ) 92 , 7 25 , 8 ( 6 2 ) 92 , 7 58 , 7 ( 6 2 x x JK S
2 2
I
1 i
2
.. i
2
= + = =

=
( )
67 , 0 ) 92 , 7 25 , 8 17 , 8 67 , 8 ( 6
... ) 92 , 7 58 , 7 67 , 7 50 , 7 ( 6 x x x x 6 S
2
2
I
1 i
J
1 j
2
. j . .. i
. ij 3
= + +
+ + = + =

= =
13
Rezolvare: sursa varianei (dispersiei)
Rezidual (ali factori sau eroarea):
Total:
( )
0 , 19 ) 67 , 8 9 (
... ) 67 , 7 8 ( ) 5 , 7 9 ( ) 5 , 7 6 ( ) 5 , 7 8 (
2
2 2 2 2
1 1 1
2
.
4
= +
+ + + + = =

= = =
I
i
J
j
K
k
ij
ijk
x x S
( ) ( ) ( )
( ) ( ) 83 , 23 92 , 7 9 92 , 7 8
... 92 , 7 6 92 , 7 8
2 2
2 2
1 1 1
2
= + +
+ + = =

= = =
I
i
J
j
K
k
ijk
x x S
Rezolvare: dispersiile corectate
Dispersia rezidual corectat:
Dispersia factorului i (mediul):
Dispersia factorului j (publicitatea):
Dispersia interaciunii factorilor:
5 , 1
1 2
5 , 1
1
1 2
1
=

=
I
S
s
67 , 2
1 2
67 , 2
1
2 2
2
=

=
J
S
s
( )( ) ( )( )
67 , 0
1 2 1 2
67 , 0
1 1
3 2
3
=

=

=
J I
S
s
( )
95 , 0
) 1 6 ( 2 2
19
1
4 2
4
=

=

=
K IJ
S
s
58 , 1
95 , 0
5 , 1
2
4
2
1
1 = = =
s
s
calc F
81 , 2
95 , 0
67 , 2
2
4
2
2
2 = = =
s
s
calc F
71 , 0
95 , 0
67 , 0
2
4
2
3
3 = = =
s
s
calc F
14
Rezolvare: testarea semnificaiei (F)
Factorul 1: 1 grad libertate (i-1) la numrtor i 20 - la numitor
Ipoteza nul nu este respins (influena mediului - nesemnificativ)
Factorul 2: 1 grad libertate (i-1) la numrtor i 20 - la numitor
Ipoteza nul nu este respins (influena publicitii - nesemnificativ)
Interaciune factori: 1 grad libertate (i-1)(J-1) la numrtor i 20 - la
numitor
Ipoteza nul nu este respins (influena comun a mediului i publicitii -
nesemnificativ)
58 , 1 35 , 4 1 > = tabel F
71 , 0 35 , 4 2 1 > = tabel x F
81 , 2 35 , 4 2 > = tabel F

S-ar putea să vă placă și