Sunteți pe pagina 1din 14

Econometrie

Curs 5
ELEMENTE DE ANALIZĂ DISPERSIONALĂ
(ANOVA)

1
ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)

 Analiza dispersională (analiză de varianţă) (ANOVA), a fost


introdusă de statisticianul Irving Fisher.

 Modelul de analiză dispersională îşi propune ca pentru fiecare


nivel al factorului/factorilor cauzali să analizeze populaţia
distinctă asociată şi eventualele diferenţe ce apar între
populaţii: să studieze efectul variabilei/variabilelor independente
asupra celei dependente.

 Analiza dispersională se poate face după un model


unifactorial, după modele bi sau multifactoriale.

2
Analiză dispersională unifactorială

 În modelul de analiză dispersională unifactorială se testează


ipoteza nulă:
H0: y1 = y2 = ... = yr,
 cu ipoteza alternativă cel puţin două medii din populaţie nu sunt
egale:
H1 : yi  yj, (i  j)
 Dacă rezultatul testului indică faptul că mediile sunt semnificativ
diferite, se concluzionează că factorul X are un impact asupra
variabilei Y.
 Setul de date pentru analiza dispersională unifactorială constă
în valorile variabilei Y pentru cele r grupe independente.
 Volumele grupelor pot fi diferite n1  n2  ...  nr

3
Analiză dispersională unifactorială

 Sistematizarea datelor pentru ANOVA

Grupe după factorul cauză

Gr. 1 Gr. 2 ... . Gr.r

y11 y21 … yr1


y12 y22 … yr2
. .
. .
y 1n 1
y 2n 2 ..... y rn r

Media y1 y2 ..... yr
Vol. grupă n1 n2 . . . .. nr

4
Analiză dispersională unifactorială
 Presupunerile sub care se aplică testul F în analiza dispersională
unifactorială:
◼ cele r grupe din eşantion sunt extrase aleator şi independent din
cele r grupe ale populatiei statistice;
◼ fiecare grupă din populatia statistica are o distribuţie normală, iar
abaterile standard sunt egale σ1 = σ2 = ..... = σr.
 Testul statistic F pentru analiza dispersională unifactorială este raportul
indicatorilor de variabilitate pentru cele două surse de variaţie:
◼ variabilitatea dintre grupe
◼ variabilitatea din interiorul grupelor.
 Dacă ipoteza nulă este adevărată, mediile celor r populaţii ar trebui să
fie, toate, egale. Ne aşteptăm atunci ca mediile celor r eşantioane să
fie aproximativ egale.
 Dacă ipoteza alternativă este adevărată, există diferenţe mari între
unele medii ale eşantioanelor.

5
Analiză dispersională unifactorială

a) b)
a) medii de grupă egale; b) mediile de grupă inegale

6
Analiză dispersională unifactorială

 pe baza datelor din eşantion calculăm:


Media fiecarei grupe:
ni

y
j =1
ij

yi = , i = 1, r
ni
Media generala:
r ni r
 yij y n
r

i =1 j =1
i i n =  ni
y= = i =1
i =1
n n

7
Analiză dispersională unifactorială
 Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi
varianţa factorială, este suma pătratelor abaterilor mediilor de grupă
de la media generala (SSB=Sum of Squares Between groups):
r
SSB =  (y − y )  ni
2
i
i =1

Dacă y 1 = y 2 = ... = y r , atunci SSB = 0.


 Varianţa din interiorul grupelor (varianţa reziduală), este suma
pătratelor abaterilor valorilor individuale de la mediile de grupă
(SSW=Sum of Squares Within groups):

  (y − yi )
r ni
SSW =
2
ij
i =1 j =1

 Varianţa totală, imprăştierea totală a valorilor individuale faţă de


media generală (SST= Sum of Total Squares):
SST =   ( yij − y )
r ni
2

i =1 j =1

8
Analiză dispersională unifactorială
 Raţionamentul analizei dispersionale se bazează pe
partiţionarea sumei pătratelor abaterilor:

 (y − y ) =  ( yi − y )  ni +  (yij − yi )
r ni r r ni
2 2 2
ij
i =1 j =1 i =1 i =1 j =1

sau SST = SSB + SSW.


 Pentru a face comparabile aceste măsuri ale variabilităţii, le vom
raporta pe fiecare la gradele de libertate => media pătratelor
abaterilor.
 Pentru varianţa factorială SSB, numărul gradelor de libertate este r-1;
măsurăm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media totală a fost estimată.
 Pentru varianţa reziduală (din interiorul grupelor) SSW, numărul gradelor de
libertate este n–r; măsurăm variabilitatea tuturor celor n valori, dar pierdem
r grade de libertate.

9
Analiză dispersională unifactorială

 Obţinem astfel:
◼ dispersia factorială corectată:
r
(
 iy − y )2
 ni
SSB
MSB = = i =1

r −1 r −1

◼ dispersia reziduală corectată:

 (y ij − yi )
r ni
2

SSW i =1 j =1
MSW = =
n−r n−r

10
Analiză dispersională unifactorială
 Statistica testului pentru analiza dispersională
unifactorială este:
SSB
F = r −1 =
MSB variabilitatea dintre grupe
=  Fisher(r −1,n − r )
SSW MSW variabilitatea din interiorul grupelor
n−r
care urmeaza o repartitie Fisher cu perechea de grade de libertate (r–1,n–
r) provenind de la numărător, respectiv de la numitor.

 Regiunea critică este dată de :


F> F ;r-1,n-r (Fcritic),
situatie ce indică diferenţe mai mari între mediile grupelor
(determinate de influenta factorilor cauzali), in raport cu
diferentele datorate întâmplării.

11
Analiză dispersională unifactorială
 Dacă valoarea Fcalc este mai mică decât valoarea critică
Fα;r-1,n-r atunci :
◼ acceptăm ipoteza nulă, H0;
◼ nu acceptăm ipoteza alternativă H1;
◼ mediile grupelor nu sunt semnificativ diferite una faţă de alta;
◼ diferenţele observate între mediile grupelor pot fi datorate doar
întâmplării;
◼ rezultatul nu este semnificativ statistic.
 Dacă valoarea Fcalc este mai mare decât valoarea critică
Fα;r-1,n-r atunci:
◼ acceptăm ipoteza alternativă, H1;
◼ respingem ipoteza nulă, H0;
◼ mediile grupelor sunt semnificativ diferite una faţă de alta;
◼ diferenţele observate între mediile grupelor nu sunt datorate doar
întâmplării;
◼ rezultatul este semnificativ statistic.

12
Analiză dispersională unifactorială

Calculul statisticii F
pentru analiza dispersională unifactorială
Sursa variaţiei Gradele de Varianţa Dispersia corectată Statistica F
libertate (suma pătratelor) (media pătratelor)
df SS MS

Factorul X r–1 SSB MSB=SSB/(r-1)


(Between Groups)
Fcalc=MSB/MSW
Reziduală n–r SSW MSW=SSW/(n-r)
(Within Groups)
Totală n–1 SST = SSB + SSW -

13
Concluzii
 Modelele de analiză dispersională:
- nu explică relaţia dintre variabile
-verifică măsura în care variaţiile unei variabile sunt dependente
de factorul de grupare.

 metoda analizei dispersionale poate fi utilizată atât înaintea, cât şi


după aplicarea metodelor corelaţiei şi regresiei statistice.

 Testul F se utilizeaza şi pentru testarea validităţii modelului de


regresie.

14

S-ar putea să vă placă și