Sunteți pe pagina 1din 28

CURS 3

 Analiza dispersională (analiză de varianţă)


(ANOVA), a fost introdusă de statisticianul
Irving Fisher.

 Se bazează pe separarea eșantionului de


volum n în r grupe în funcție de un factor de
grupare X.

 Indicatorii (medii și dispersii) sunt calculați pe


baza valorilor variabilei dependente Y.
Grupe după factorul cauză X

Gr. 1 Gr. 2 ... Gr.r

Variabila dependentă y11 y21 yr1


Y
y12 y22 yr2
… … ...
y1n1 y2n2 yrnr
Media y̅1 y̅2 … y̅r
Vol. grupă

n1 n1 … nr
GRUP 1 GRUP 2 GRUP 3
(grad mare (grad mediu (grad mic de
de corupție de corupție corupție
Nr. țări percepută) percepută) percepută)
VACCINARE (%)
1 59 61 55
2 29 51 61
3 43 86 73
4 63 79 66
5 42 67 65
6 61 75 63
7 70 68
8 83 67
9 56 67
10 52 76
11 50
 Modelul de analiză dispersională îşi propune
ca pentru fiecare nivel al factorului/factorilor
cauzali să analizeze populaţia distinctă
asociată şi eventualele diferenţe ce apar între
populaţii: să studieze efectul
variabilei/variabilelor independente asupra
celei dependente.
 Analiza dispersională se poate face după un
model unifactorial, după modele bi sau
multifactoriale.
 cele r grupe din eşantion sunt extrase aleator
şi independent din cele r grupe ale
colectivităţii generale;

 fiecare grupă din colectivitatea generală are o


distribuţie normală, iar abaterile medii
pătratice sunt egale σ1 = σ 2 = ..... = σ r.
 IPOTEZE

Ipoteza nulă (mediile grupelor sunt egale):


H0: μ1= μ2...=μr

Ipoteza alternativă (cel puțin două medii nu sunt


egale):
H1: μi≠ μj
 Testul statistic F pentru analiza dispersională
unifactorială este raportul indicatorilor de
variabilitate pentru cele două surse de
variaţie:
 variabilitatea dintre grupe
 variabilitatea din interiorul grupelor.

MS1 variabilitatea dintre grupe


Fcalculat  
MS 2 variabilitatea din interiorul grupelor
 Dacă ipoteza nulă este adevărată, mediile
celor r populaţii ar trebui să fie, toate, egale.
Ne aşteptăm atunci ca mediile celor r
eşantioane să fie aproximativ egale.

 Dacă ipoteza alternativă este adevărată,


există diferenţe mari între unele medii ale
eşantioanelor.
 Dacă
Fcalculat  F ,r 1,n  r
 respingem ipoteza nulă H0 :
 acceptăm ipoteza alternativă, H1;
 mediile grupelor sunt semnificativ diferite
una faţă de alta;
 diferenţele observate între mediile grupelor
nu sunt datorate doar întâmplării;
 rezultatul este semnificativ statistic.
 În caz contrar:
 acceptăm ipoteza nulă, H0;
 nu acceptăm ipoteza alternativă H1;
 mediile grupelor nu sunt semnificativ diferite
una faţă de alta;
 diferenţele observate între mediile grupelor
pot fi datorate doar întâmplării;
 rezultatul nu este semnificativ statistic.
 a. Medii de grupă și media generală (media
mediilor):
ni

 yij
j 1
r

 y
ni

ij
r

y n i i
yi  y
i 1 j 1
 i 1

ni n n
GRUP 2
GRUP 1 (grad GRUP 3
(grad mare mediu de (grad mic
de corupție corupție de corupție
Nr. țări percepută) percepută) percepută)
1 59 61 55
608
y1   55,3
2 29 51 61 11
3 43 86 73
4 63 79 66 419
5 42 67 65 y2   69,8
6
6 61 75 63
7 70 68
8 83 67 661
9 56 67 y3   66,1
10 52 76 10
11 50
SUM 608 419 661 55,3  11  69,8  6  66,1  10
y  62,5
ni 11 6 10 27
y̅ 55.3 69.8 66.1
 b. Dispersii de grupă:

ni

 ij i
( y
j 1
 y ) 2

si2 
ni  1
GRUP 3
GRUP 1 GRUP 2 (grad
(grad mare (grad mic de
de mediu de corupție
corupție corupție perceput
(59  55,3) 2  29  55,3  ...  50  55,3
2 2
2148,18
Nr. țări percepută) percepută) ă) s 
2
  214,8
11  1
1
1 59 61 55 10
2 29 51 61
3 43 86 73
4 63 79 66 (61  69,8) 2  51  69,8  ...  75  69,8
2 2
812,83
5 42 67 65 s 
2
  162,6
6 1
2
5
6 61 75 63
7 70 68
8 83 67
9 56 67
10 52 76 (55  66,1) 2  61  66,1  ...  76  66,1
2 2
310,9
11 50 s 
2
  34,5
10  1
3
9
SUM 608 419 661
ni 11 6 10
y̅ 55.3 69.8 66.1
s2 214.8 162.6 34.5
A. Variabilitatea dintre grupe MS1
 A.1. Varianța dintre grupe, dată de influenţa factorului
cauzal, numită şi varianţa factorială, este suma
pătratelor abaterilor mediilor de grupă de la media
generală:
 
r
SS1   y i  y  ni
2

i 1
 A.2. Gradele de libertate:
 r-1; măsurăm variabilitatea a r medii, se pierde un grad
de libertate, deoarece media totală a fost estimată.

 A3. Dispersia dintre grupe:


SS1
MS1 
r 1
 A1.Varianța dintre grupe (Sum of Squares)
SS1  55,3  62,5 11  69,8  62,5  6  66,1  62,5 10  1026 ,8
2 2 2

 A2. Gradele de libertate (Degrees of Freedom)

r 1  3 1  2
 A3.Dispersia dintre grupe (Mean of Squares)
1026,8
MS1   513,4
3 1
 B1. Varianţa din interiorul grupelor (varianţa reziduală),
este suma pătratelor abaterilor valorilor individuale de
la mediile de grupă:
   s
r ni r
SS 2   yij  y i
2 2
i  (ni  1)
i 1 j 1 i 1

 B2.Gradele de libertate:
numărul gradelor de libertate este n–r; măsurăm
variabilitatea tuturor celor n valori, dar pierdem r grade
de libertate.

B3. Dispersia din interiorul grupelor: SS 2


MS 2 
nr
 A1.Varianța din interiorul grupelor (Sum of
Squares)
SS 2  214 ,8  (11  1)  162 ,6  (6  1)  34,5  (10  1)  3271,9

 A2. Gradele de libertate (Degrees of Freedom)


n  r  27  3  24

 A3. Dispersia din interiorul grupelor (Mean of


Squares)
3271,9
MS 2   136,3
27  3
MS1 513,4
Fcalculat    3,766
MS 2 136,3

Fcritic  F , r 1, n  r  F0, 05, 2, 24  3,403

 Regiunea critică

Fcalculat  Fcritic sau Pvalue  0,05


Respingem ipoteza nulă, ceea ce înseamnă că mediile celor 3 colectivității
generale sunt diferire, iar factorul de grupare (corupția percepută)
influențează semnificativ gradul de vaccinare.
Sursa Gradele Varianţa Dispersia Statistica F
variaţiei de corectată
(suma
libertate
pătratelor) (media
pătratelor)
0 1 2 3 4

Factorul X r–1 SS1 MS1=SS1/r-1 Fcalculat=MS1/MS2


Reziduală n–r SS2 MS2=SS2/n-r

Totală n–1 SST = SS1 + SS2 - -


Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance

GRUP 1 11 608 55.27273 214.8182

GRUP 2 6 419 69.83333 162.5667

GRUP 3 10 661 66.1 34.54444

ANOVA

Source of Variation SS df MS F P-value F crit

Between Groups 1026.826 2 513.4128 3.765962 0.037803 3.402826

Within Groups 3271.915 24 136.3298

Total 4298.741 26
SST  SS1  SS 2

SST    y ij  y 
r ni
2

i 1 j 1
SST  (59  62,5) 2  (29  62,5) 2  ...  (61  62,5) 2 
 (51  62,5) 2  ...  (55  62,5) 2  (61  62,5) 2  ...  4298,7

SST  SS1  SS 2  1026 ,8  3271,9  4298 ,7


SS1
R 
2
 100
SST
SS1 1026,8
R 
2
  100  23,9%
SST 4298,7

 Variația indicelui de percepție a corupției


influențează într-un procent de aproximativ
24% variația ponderii vaccinării.

S-ar putea să vă placă și