Sunteți pe pagina 1din 15

ELEMENTE DE ANALIZ

DISPERSIONAL (ANOVA)
ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)
Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de
statisticianul Irving Fisher.

Analiza dispersianal se utilizeaz pentru a determina n ce msur


difer media variabilei analizate de la o grup la alta .

Analiza dispersional se poate face dup un model unifactorial, dup


modele bi sau multifactoriale.
Analiz dispersional unifactorial

n modelul de analiz dispersional unifactorial se testeaz ipoteza nul:


H0: y1 = y2 = ... = yr,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt egale:
H1 : yi yj, (i j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite,
se concluzioneaz c factorul X are un impact asupra variabilei Y.
Setul de date pentru analiza dispersional unifactorial const n valorile
variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n1 n2 ... nr
Analiz dispersional unifactorial

Sistematizarea datelor pentru ANOVA

Grupe dup factorul cauz


Gr. 1 Gr. 2 ... . Gr.r
y11 y21 yr1
y12 y22 yr2
. .
y.
1n1
y.2n2 ..... y rn r

Media y1 y2 ..... yr
Vol. grup n1 n2 . . . .. nr
Analiz dispersional unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale s1 = s2 = ..... = sr.
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s fie,
toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie
aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre unele
medii ale eantioanelor.
Analiz dispersional unifactorial
Pe baza datelor din eantion calculm:
ni

y
j 1
ij

yi , i 1, r
ni
r ni r
y
i 1 j 1
ij yn i i
y i 1
n n
r
n ni
i 1
Analiz dispersional unifactorial
Variana dintre grupe, dat de influena factorului cauzal, numit i
variana factorial, este suma ptratelor abaterilor mediilor de grup de
la media general (SSR):

r
S1 y i y n i
2

i 1
Dac y 1 y 2 ... y r
atunci: S1 = 0.
variana din interiorul grupelor (variana rezidual), este suma
ptratelor abaterilor valorilor individuale de la mediile de grup (SSE):

r in
S 2 yij y i S i2 * ni
2

i 1 j 1
mprtierea total a valorilor individuale fa de media general
S y ij y
r n
(variana total)-SST: 2 i

i 1 j 1
Analiz dispersional unifactorial
Pentru variana factorial S1, numrul gradelor de libertate este r-1;
msurm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media total a fost estimat.

Pentru variana rezidual (din interiorul grupelor) S 2, numrul gradelor de


libertate este nr; msurm variabilitatea tuturor celor n valori, dar
pierdem r grade de libertate.
Analiz dispersional unifactorial

Obinem astfel:
dispersia factorial corectat:

y
r 2
y ni
S i

s12 1 i 1

r 1 r 1
dispersia corectat rezidual:

y
r ni 2

ij yi
S2 i 1 j1
s2
2

nr nr
Analiz dispersional unifactorial
Statistica F pentru analiza dispersional unifactorial are forma:
s12 var iabilitatea dintre grupe
F 2
s 2 variabilitatea din interiorul grupelor

cu gradele de libertate (r 1) la numrtor i (n r) la numitor.


Regiunea critic este dat de :

F> F(r- 1),(n- r),,

acest lucru indic diferene mai mari ntre mediile grupelor dect cele
datorate ntmplrii.
Analiz dispersional unifactorial
dac valoarea F este mai mic dect valoarea critic F, atunci :
acceptm ipoteza nul, H0;
nu acceptm ipoteza alternativ H1;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.
Dac valoarea F este mai mare dect valoarea critic F, atunci:
acceptm ipoteza alternativ, H1;
respingem ipoteza nul, H0;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.
Analiz dispersional unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
Sursa Gradele de Variana Dispersia corectat Statistica
variaiei libertate (suma ptratelor) (media ptratelor) F

0 1 2 3 4

Factorul X r1 S1 s12
s12
F
Rezidual nr S2 s22 s22
Total n1 S = S 1 + S2
s2 s1 s2
2 2
Concluzii
Modelele de analiz dispersional nu explic relaia dintre variabile;

Verific doar msura n care valorile reale ale unei caracteristici se abat de
la valorile teoretice, precum i msura n care aceste variaii sunt sau nu
dependente de factorul/factorii de grupare;

Metoda analizei dispersionale poate fi utilizat att naintea, ct i dup


aplicarea metodelor corelaiei i regresiei statistice;

Testul F se poate utiliza i pentru testarea validitii modelului de regresie;

Permite compararea mediilor a dou sau mai multor colectiviti de date


cantitative
Exemplu
Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni.
Regiunea Nr. Rata medie a ocuprii Abaterea Dispersia
judee medie
(ni) xi ptratic (si) s 2 S 2 si2 (ni 1)
i
(%)

NE 6 47.77 4.89 23.91 119.55

SE 6 41.24 5.68 32.26 161.3

S 7 40.68 6.57 43.16 258.96

SV 5 41.9 3.31 10.96 43.84

V 4 42.71 6.18 38.19 114.57

NV 6 46.32 5.84 34.11 170.55

C 6 42.08 2.32 5.38 26.9

Buc 2 41.59 5.62 31.58 31.58

Total 42 43.16 5.41 = s 29.27 = s2 927.25


Exemplu
927.25
s 2
2 27.27
S 2 927.25 42 8
S1 272.82 272.82
s12 38.97
8 1
S 29.27 * 41 1200.07
1200.07
s2 29.27
42 1

38.97
F 1.42
27.27
F0.05;7;34 2.40
F F0.05;7;34 H 0

S-ar putea să vă placă și