Sunteți pe pagina 1din 16

ELEMENTE DE ANALIZĂ

DISPERSIONALĂ (ANOVA)
ELEMENTE DE ANALIZĂ
DISPERSIONALĂ (ANOVA)
 Analiza dispersională (analiză de varianţă) (ANOVA), a fost introdusă de
statisticianul Irving Fisher.

 Modelul de analiză dispersională îşi propune ca pentru fiecare nivel al


factorului/factorilor cauzali să analizeze populaţia distinctă asociată şi
eventualele diferenţe ce apar între populaţii: să studieze efectul
variabilei/variabilelor independente asupra celei dependente.

 Analiza dispersională se poate face după un model unifactorial, după


modele bi sau multifactoriale.
Analiză dispersională unifactorială

 Sistematizarea datelor pentru ANOVA

Grupe după factorul cauză

Gr. 1 Gr. 2 ... . Gr.r

y11 y21 … yr1


y12 y22 … yr2
. .
. .
y1 n 1
y 2n 2 ..... y rnr

Media y1 y2 ..... yr
Vol. grupă n1 n2 . . . .. nr
Analiză dispersională unifactorială
 Presupunerile sub care se aplică testul F în analiza dispersională
unifactorială:

 cele r grupe din eşantion sunt extrase aleator şi independent din cele r grupe
ale colectivităţii generale;

 fiecare grupă din colectivitatea generală are o distribuţie normală, iar abaterile
medii pătratice sunt egale σ1 = σ 2 = ..... = σ r.
Analiză dispersională unifactorială
 În modelul de analiză dispersională unifactorială se testează ipoteza
nulă:
H0: 1 = 2 = ... = r,

 cu ipoteza alternativă cel puţin două medii din populaţie nu sunt


egale:
H1 : i  j, (i  j)

 Dacă rezultatul testului indică faptul că mediile sunt semnificativ diferite, se


concluzionează că factorul X are un impact asupra variabilei Y.
 Setul de date pentru analiza dispersională unifactorială constă în valorile variabilei
Y pentru cele r grupe independente.
 Volumele grupelor pot fi diferite n1  n2  ...  nr
Analiză dispersională unifactorială

 Testul statistic F pentru analiza dispersională unifactorială este raportul


indicatorilor de variabilitate pentru cele două surse de variaţie:

 variabilitatea dintre grupe


 variabilitatea din interiorul grupelor.

 Dacă ipoteza nulă este adevărată, mediile celor r populaţii ar trebui să fie,
toate, egale. Ne aşteptăm atunci ca mediile celor r eşantioane să fie
aproximativ egale.

 Dacă ipoteza alternativă este adevărată, există diferenţe mari între unele
medii ale eşantioanelor.
Analiză dispersională
unifactorială

a) b)
a) medii de grupă egale; b) mediile de grupă inegale
Analiză dispersională unifactorială
 1. Medii de grupă:
ni

y
j 1
ij

yi  , i  1, r
ni
 2. Media generală sau media mediilor
r ni r
 y ij yn i i r
n   ni
i 1 j 1
y  i 1
n n i 1
Analiză dispersională unifactorială

 Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi


varianţa factorială, este suma pătratelor abaterilor mediilor de grupă de
la media generală:

 
r
SS1   y i  y ni
2

i 1

 Dacă y 1  y 2  ...  y r

 atunci: S1 = 0.
Analiză dispersională unifactorială

 varianţa din interiorul grupelor (varianţa reziduală), este suma


pătratelor abaterilor valorilor individuale de la mediile de grupă:

 
r ni
SS2   yij  y i
2

i 1 j 1
Analiză dispersională unifactorială

 Împrăştierea totală a valorilor individuale faţă de media generală


(varianţa totală):

SST   yij  y 
r ni
2

i 1 j 1
Analiză dispersională unifactorială
 Raţionamentul analizei dispersionale se bazează pe partiţionarea sumei
pătratelor abaterilor:

 y
r ni

i  1 j 1
ij 
2 r

i 1
 2
 y   y i  y n i   y ij  y i
r ni

i 1 j 1
 2

 Pentru a face comparabile aceste măsuri ale variabilităţii, le vom raporta pe fiecare la gradele de libertate,
=> media pătratelelor abaterilor.

 Pentru varianţa factorială SS1, numărul gradelor de libertate este r-1; măsurăm variabilitatea a r medii,
se pierde un grad de libertate, deoarece media totală a fost estimată.

 Pentru varianţa reziduală (din interiorul grupelor) SS2, numărul gradelor de libertate este n–r; măsurăm
variabilitatea tuturor celor n valori, dar pierdem r grade de libertate.
Analiză dispersională unifactorială

Obţinem astfel:

 y 

 dispersia factorială corectată: r 2


i  y ni
SS1
MS1   i 1
r 1 r 1
 dispersia corectată reziduală:

 y 
r ni
2
ij  yi
SS 2 i 1 j 1
MS 2  
nr nr
Analiză dispersională unifactorială
 Statistica F pentru analiza dispersională unifactorială are forma:
MS1 var iabilitatea dintre grupe
F 
MS 2 variabilit atea din interiorul grupelor
cu gradele de libertate (r – 1) la numărător şi (n – r) la numitor.

 Regiunea critică este dată de :

F> F ,(r- 1),(n- r),

 acest lucru indică diferenţe mai mari între mediile grupelor decât cele datorate
întâmplării.
Analiză dispersională unifactorială
 Dacă valoarea F este mai mică decât valoarea critică, atunci :
 acceptăm ipoteza nulă, H0;
 nu acceptăm ipoteza alternativă H1;
 mediile grupelor nu sunt semnificativ diferite una faţă de alta;
 diferenţele observate între mediile grupelor pot fi datorate doar întâmplării;
 rezultatul nu este semnificativ statistic.

 Dacă valoarea F este mai mare decât valoarea critică Fα, atunci:
 acceptăm ipoteza alternativă, H1;
 respingem ipoteza nulă, H0;
 mediile grupelor sunt semnificativ diferite una faţă de alta;
 diferenţele observate între mediile grupelor nu sunt datorate doar întâmplării;
 rezultatul este semnificativ statistic.
Analiză dispersională unifactorială
Calculul statisticii F
pentru analiza dispersională unifactorială

Sursa Gradele Varianţa Dispersia Statistica F


variaţiei de corectată
(suma
libertate
pătratelor) (media
pătratelor)

0 1 2 3 4

Factorul X r–1 SS1 MS1 Fcalculat 


MS1
MS 2
Reziduală n–r SS2 MS2

Totală n–1 SST = SS1 + SS2 - -