Sunteți pe pagina 1din 20

Disciplina : STATISTICA

Tema : Analiza Varianei -ANOVA


lectia : 6 stud.CSIE
Data : 25 martie 2010

ISAIC- MANIU ALEXANDRU


web www.amaniu.ase.ro
e-mail AL.ISAIC-MANIU@CSIE.ASE.RO

Analiza varianei (1)


Etimologie: ANOVA (ANalyses Of VAriance)
Istoric:
-A fost introdus n practica statistic n 1920 de ctre
R. Fischer, care a vrut s vad diferenele semnificative
dintre diferitele tipuri de plante.
-Din 1970 este cea mai folosit metod statistic n
studii de psihologie.

-Aplicaiile sunt dintre cele mai variate: psihologie,


biologie, sociologie, economie.

ANOVA (2)
Terminologie (1):
Variabila dependent (variabil rspuns )
variabila studiat

Variabila independent/explicativ (factor)

o variabil care influeneaz variabila dependent


- Nivelul

factorului (tratament)
o valoare particular (sau o grup de valori) a
factorului
- Variaia

rezidual
influene aleatoare asupra variabilei dependente (ali
factori de influen)

ANOVA (3)
Exemplu (1)

Determinm cum recolta este influenat de tipul de


ngrmnt folosit. Un fermier folosete 3 tipuri de
ngrmnt notate A,B i C.
- variabila rspuns - producia

- factorul
- tipul de ngrmnt
- tratamentul - cantitatile din ngr. A, B i C

ANOVA (4)
Exemplu (2)
Analizm cum rezultatele la examenul de Admitere
ASE sunt influenate de media obinuta de candidai
la examenul de Bacalaureat. Studiem candidaii care
au obinut la Bacalaureat urmtoarele categorii de
note: (7-8], (8-9], (9-10]

- variabila rspuns - rezultatul la admiterea ASE


- factorul
- media la Bacalaureat
- tratamentul - grupe de note (7-8], (8-9], (9-10]

ANOVA (5)
Ipoteze:
Normalitatea n fiecare grup valorile sunt distribuite
aproximativ normal
-Omogenitatea varianei n interiorul fiecrei grupe
dispersiile sunt distribuite aproximativ normal

-Setul de ipoteze:

- Ideea

H0: factorul de grupare este nerelevant

de baz n testarea ipotezelor ANOVA este

regula de adunare a dispersiilor


descompunerea dispersiei totale n dispersia dintre grupe
(factorul sistematic) i dispersia din interiorul grupelor (factorul
aleator).- ( vezi !!! Regula adunarii dispersiilor ! ;) )

ANOVA (6)
Aplicabilitate:
- O singur variabil independent X, ale
crei valori pot fi mprite n mai multe
grupuri: X1,...,Xr.
- Vrem s vedem dac exist o diferen semnificativ
ntre valorile variabilei dependente Y n interiorul
grupurilor create dup variabila de grupare X.

- Practic, observaiile sunt valorile lui Y n interiorul celor r


grupuri create dup valorile lui X.

ANOVA (7)

y n
yn

y
n
n

Mediile variabilei Y pentru fiecare grup dup variabila X vor fi:


Media general pentru
variabila Y

yj

yn

i ij
ij

yn

i ij

n. j

i.

i.

Deci media general se poate scrie i sub


forma mediei din medii

ANOVA (8)
n aceast situaie, pentru variabila Y, putem identifica
urmtoarele dispersii:

- Dispersia total:

y
ni.
i

y y n

i.

- Dispersia explicat/ sistematic/ dintre grupe: 2


- Dispersia din interiorul grupei j:

2
j

y y n

n
i

ij

ij

- Dispersia rezidual/ medie din interiorul grupelor:

n
2
j

Relaia dintre cele trei tipuri de dispersie este:

ANOVA (9)
Tabelul de analiz a
varianei

Practic, Fcalculat se
poate
calcula:

nr
2
r 1
2

Fcalculat

R 2 1 2

Tabelul de analiz a varianei


ANOVA Table

Source of
Variance

SS

df

MS

Between Groups

(Factorul
sistematic)

SST ni ( yi y )

k-1

i 1

SST
MST
k 1

Within Groups
ni

(Factorul
aleator)

SSE ( yij yi )

n-k

i 1 j 1

Total

ni

SStotal ( yij y )2
i 1 j 1

n-1

SSE
MSE
nk

MST
MSE

ANOVA (10)
Decizia:
se ia pe baza testului F: se compar valoarea
statisticii Fcalculat calculat n tabelul ANOVA cu valoarea
critic, corespunztoare cuantilei repartiiei F cu (r-1,n-r)
grade de libertate.
- Decizia

- DacFcalculat F ;r 1;n r atunci respingem ipoteza nul, deci putem afirma,


cu probabilitatea 1 , c factorul de grupare are o influen semnificativ
asupra variabilei de interes.
- Valoarea critic n EXCEL:

F ;r 1;n r FINV ; r 1; n r

Exemplificare (1) Toi candidaii

yi ni
n

y y n

59000
295
200

9000

45 puncte
200

CV

100

17,18
100 38,17%
45

2 295 17 ,18 puncte

Exemplificare (2)

Exemplificare (3) Candidai cu media


la Bacalaureat ntre 7 i 8 Grupa 1

y1

yn
n

i i1
i1

y y n

n
2

i1

CV1

1
x1

100

i1

1085
24,11 puncte
45

2964,44
65,88
45

8,12
100 33,66 %
24 ,11

1 12 65,88 8,12 puncte

Exemplificare (4) Candidai cu media


la Bacalaureat ntre 8 i 9 Grupa 2

y2

yn

i i2
i2

y y n

n
2

3685

43,35 puncte
85

CV2

2
x2

100

i2

10 ,94

100 25,23 %
43,35

i2

10169,41
119,64
85

2 22

119,64 10,94 puncte

Exemplificare (5) Candidai cu media


la Bacalaureat ntre 9 i 10 Grupa 3

y3

yn

4230

60,43 puncte
70

i i3
i3

2
9337,14

y
2 i
3 ni 3

133,39
3

i3

CV3

3
x3

100

11,55

100 19 ,11 %
60 ,43

70

3 3

133,39 11,55 puncte

Exemplificare (6)
2 295
Dispersia total era:

y y n

n
2

Dispersia explicat (dintre grupe) se calculeaz:

36529
182,645
200

45 85 70

65,88 45 119,64 85 133,39 70 22471

112,355
45 85 70
200

2 2 2 182 ,645 112 ,355 295

2
2
2

24 ,11 45 45 43,35 45 85 60 ,43 45 70

Dispersia rezidual (din interiorul grupelor) se calculeaz:

n
2
j

Exemplificare (7)
2

182 ,645
2
R 2
0,62

295

Gradul de determiniaie:

2 n r 182 ,645 200 3


Testul F Fcalculat 2

160 ,12
r 1 112 ,355 3 1

F ;n r ;r 1 F0,05;197; 2 19 ,49
Deoarece Fcalculat >Ftabelar alegem ipoteza H1 conform creia gruparea
candidailor ASE dup media de la Bacalaureat este relevant.

S-ar putea să vă placă și