Sunteți pe pagina 1din 6

Facultatea de Marketing, ASE

Econometrie, anul II, 2012-2013


Analiza dispersionala ANOVA
Problema rezolvata
Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea
le ofer tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta
el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf
i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la
prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele
nregistrate sunt:
Mrimea firmelor

Numr de
promovare
30; 26; 30;
34; 32; 25;
47; 41; 43;

Mici
Medii
Mari

sptmni de la angajare pn la prima


32; 38; 24; 32; 28;
36; 33
48; 40; 49; 40.

Se cere s se determine, folosind testul F de analiz dispersional, dac variaia


timpului scurs pn la prima promovare este influenat semnificativ de mrimea
firmei? (nivel de semnificatie 5%)
Rezolvare:
o
Populatia statistica este multimea companiilor producatoare de tehnologie de
varf.
o
Unitatea statistica este o companie (firma).
o
Caracteristicile urmarite sunt:
X

- variabila ce arata marimea unei firme;


- variabila nenumerica avand r=3 categorii sau variante: firme mici, firme
mijlocii si firme mari:
aceste categorii ale variabilei X vor determina impartirea populatiei
statistice in r =3 grupe si anume:
Grupa 1 (grupa firmelor mici),
Grupa 2 (grupa firmelor mijlocii),
Grupa 3 (grupa firmelor mari);
- astfel, variabila X, marimea firmei, se mai numeste si factor de grupare.

si
Y

- variabila ce arata durata de timp, in saptamani, de la angajare la prima


promovare a unui salariat al unei firme producatoare de tehnologie de varf;
- variabila numerica de interes.

o Fie Y1 ~ N 1 , 12 variabila ce arata durata de timp, in saptamani, de la angajare la


prima promovare a unui salariat al unei firme mici Grupa 1, unde 1 este media
variabilei la nivelul intregii grupe.
Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum n1 8
firme pentru care se inregistreaza valorile variabilei Y1:

{ y1,1 30, y1,2 26, y1,3 30, y1,4 32,


y1,5 38, y1,6 24, y1,7 32, y1,8 y1,n1 28 }
Media de selectie de grupa este y1

y1,1 y1, 2 ... y1,n1

iar dispersia de selectie de grupa este


y1,1 y1 2 y1,2 y1 2 ... y1,n1 y1
2
s1
n1 1

n1

240
30 saptamani,
8

18,2857 .

o Fie Y2 ~ N 2 , 22 variabila ce arata durata de timp, in saptamani, de la angajare la


prima promovare pentru un salariat al unei firme mijlocii Grupa 2, unde 2 este
media variabilei la nivelul intregii grupe.
Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum
n2 5 firme pentru care se inregistreaza valorile variabilei Y2:
{ y 2,1 34, y 2, 2 32, y 2,3 25, y 2, 4 36, y 2,5 y 2,n2 33} .
y 2,1 y 2, 2 ... y 2,n2 160

32 saptamani,
Media de selectie de grupa este y 2
n2
5
iar dispersia de selectie de grupa este
y 2,1 y2 2 y 2,2 y2 2 ... y 2,n2 y 2 2
2
s2
17,5 .
n2 1

o Fie Y3 ~ N 3 , 32 variabila ce arata durata de timp, in saptamani, de la angajare la


prima promovarepentru un salariat al unei firme mari Grupa 3, unde 3 este
media variabilei la nivelul intregii grupe.
Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum n3 7
firme pentru care se inregistreaza valorile variabilei Y3:
{ y3,1 47, y3, 2 41, y3,3 43, y 3, 4 48, y3,5 40, y3,6 49, y 3,7 y3,n2 40 } .
y 3,1 y 3, 2 ... y 3,n3 308

44 saptamani,
Media de selectie de grupa este y3
n3
7
iar dispersia de selectie de grupa este
y3,1 y3 2 y3,2 y3 2 ... y3,n3 y3 2
2
s3
15,3333 .
n3 1

o Media totala la nivelul intregului esantion de volum n n1 n2 n3 20 firme este


y n y n y3 n3 30 8 32 5 44 7
y 1 1 2 2

n1 n2 n3
20
y 35,4 saptamani.

o Ipotezele statistice sunt:


H 0 : 1 2 3 (factorul de grupare marimea companiei nu influenteaza

semnificativ variatia duratei de timp pana la prima promovare


a unui salariat)
H 1 : k , l 1,2,3 , k l astfel incat k l (cel putin doua medii sunt semnificativ
diferite, adica factorul de grupare marimea companiei
influenteaza semnificativ variatia duratei de timp pana la prima
promovare a unui salariat)
o Statistica testului este
SSB
MSB
F
r 1 Fisher r 1 2, n r 17 .
SSW
MSW
nr

o Pe baza datelor de selectie calculam:


Variatia dintre grupe

SSB y1 y 2 n1 y 2 y 2 n2 y 3 y 2 n3

30 35,4 2 8 32 35,4 2 5 44 35,4 2 7


SSB 808,8

Variatia din interiorul grupelor

SSW n1 1 s12 n2 1 s 22 n3 1 s32

8 1 18,2857 5 1 17,5 7 1 15,3333

SSW 290

Variatia totala

Dispersia factoriala corectata (cu gradele de libertate r 1 2 )

SST SSB SSW


808,8 290
SST 1098,8

MSB

SSB 808,8

r 1
2

MSB 404,4

Dispersia reziduala corectata (cu gradele de libertate n r 17 )

MSW

SSW 290

nr
17

MSW 17,0588

Valoarea calculata a statisticii testului este

MSB
404,4

MSW
17,0588
Fcalc 23,7062
Fcalc

o Nivelul de semnificatie al testului este 0,05 ,


iar valoarea critica a testului este Fcritic F ; r 1, n r F0,05; 2,17 3,59 ,
deci regiunea critica este Rc Fcritic ; 3,59; .
3

o Cum Fcalc Fcritic Fcalc Rc , respingem ipoteza nula H0 si acceptam ipoteza


alternativa H1, concluzionand ca la un nivel de semnificatie de 5% si pe baza
acestor date de selectie, marimea companiei influenteaza semnificativ variatia
duratei de timp pana la prima promovare pentru un salariat.
o Calculele pot fi organizate in urmatorul tabel ANOVA
Source
of variation
(Sursa variatiei)
Between groups
(Factorul
de grupare X)
Within Groups
(Reziduala)
Total

SS
(sum
of squares
(suma
patratelor)
SSB = 404,4

df degrees
of freedom
(gradele de
libertate)
r-1 = 3

MS mean of
sum
of squares
(dispersiile
corectate)
MSB

SSB
r 1

= 404,4
SSW = 290

n-r = 17

Fcalc

Fcritic
MSB
MSW

=23,0762

Fcritic=F0,05; 2, 17
=3,59

SSW
MSW
nr

=17,0588

SST=SSB+SS
W
= 1098,8

n-1 = 19

Problema poate fi rezolvata in Excel dupa cum urmeaza:


Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane,
asa cum apare in Figura 1;
In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege
Anova: Single Factor;
In Excel 2007, din meniul principal Data, submeniul Data Analysis, se alege
Anova: Single Factor;

Figura 1. Introducerea datelor si alegerea Anova: Single Factor


din submeniul Data Analysis.
4

Fereastra de dialog este prezentata in Figura 2.

Figura 2. Fereastra de dialog pentru Anova: Single Factor.


Output-ul consta din doua tabele: primul contine rezultatele obtinute in urma
prelucrarii datelor din fiecare grupa, iar cel de-al doilea este tabelul ANOVA.
Anova: Single Factor
SUMMARY
Groups

Count ( ni )

Sum

Average ( y i )

Variance ( si2 )

30 y1

18.2857 s12

32 y 2

17.5 s 22

44 y 3

15.3333 s 32

240
Grupa 1
(firme mici)
Grupa 2
(firme mijlocii)

n1

y1 j
j 1

5 n2

160 y

7 n3

j 1

2j

308
Grupa 3
(firme mari)

y3 j
j 1

ANOVA
Source of
Variation
Between Groups

SS

df

808.8=SSB

2=r-1

290=SSW

17=n-r

MS

404.4=MSB

23.7062=Fcalc

P-value
1.21E-05

17.0588=MS
Within Groups

F crit
3.59

Total

1098.8=SST

19=n-1

Observatii:
In Excel 2007, submeniul Data Analysis se instaleaza astfel:
- intr-o foie obisnuita de lucru, dati click pe Office Button (cerculetul stanga sus)
- click pe Excel Options
- apoi click pe Add Ins
- selectati cu un singur click Analisys Toolpack din partea deapta a ferestrei de la
Add Ins si apoi click GO
- apare o noua fereastra in care bifati Analysis ToolPack si de asemenea Analysis
ToolPack VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul
principal Data.
In Excel 2003, submeniul Data Analysis se instaleaza astfel:
- intr-o foie obisnuita de lucru, din meniul principal Tools, alegeti Add Ins
- apare o fereastra in care bifati Analysis ToolPack si de asemenea Analysis
ToolPack VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul
principal Tools.

S-ar putea să vă placă și