Sunteți pe pagina 1din 7

Anul I, Facultatea de Marketing 2011-2012

Statistica

Exercitii Statistica partea a II-a

Ex. 1. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer
tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu
un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la
angajarea iniial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost
grupate dup mrime, iar datele nregistrate sunt:
Mrimea
firmelor
Numr de sptmni de la angajare pn la prima
promovare
Mici 30; 26; 30; 32; 38; 24; 32; 28;
Medii 34; 32; 25; 36; 33
Mari 47; 41; 43; 48; 40; 49; 40.
Se cere:
a) s seprecizeze care este grupa de firme cu un grad mai ridicat de omogenitate;
b) sa se determine in ce proportie marimea companiei influenteaza variatia timpului pana la
prima promovare a unui salariat.


Rezolvare: a)
o Populatia statistica este multimea companiilor producatoare de tehnologie de varf.
o Unitatea statistica este o companie (firma).
o Caracteristicile urmarite sunt:
X - variabila ce arata marimea unei firme;
- variabila nenumerica avand r=3 categorii sau variante de raspuns: firme mici, firme
mijlocii si firme mari:
aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3
grupe si anume:
Grupa 1 (grupa firmelor mici),
Grupa 2 (grupa firmelor mijlocii),
Grupa 3 (grupa firmelor mari);
- astfel, variabila X, marimea firmei, se mai numeste si factor de grupare.
si

Y - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui
salariat al unei firme producatoare de tehnologie de varf;
- variabila numerica de interes.

Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum 8
1
= n firme pentru
care se inregistreaza valorile variabilei Y:
} 28 ; 32 ; 24 ; 38 ; 32 ; 30 ; 26 ; 30 {
1
, 1 8 , 1 7 , 1 6 , 1 5 , 1 4 , 1 3 , 1 2 , 1 1 , 1
= = = = = = = = =
n
y y y y y y y y y
saptamani.
Media de selectie de grupa este 30
8
240
...
1
1
, 1
1
, 1 2 , 1 1 , 1
1
1
1
= = =
+ + +
=

=
n
y
n
y y y
y
n
j
j
n
saptamani,
dispersia de selectie de grupa este
( ) ( ) ( )
( )
2857 , 18
1 1
...
1
1
2
1 , 1
1
2
1 , 1
2
1 2 , 1
2
1 1 , 1 2
1
1
1
=

+ + +
=

=
n
y y
n
y y y y y y
s
n
j
j
n
,
abaterea standard de selectie de grupa este 2762 , 4 2857 , 18
2
1 1
= = = s s saptamani,
iar coeficientul de variatie al acestei grupe este % 25 , 14 100
30
2762 , 4
100
1
1
1
= = =
y
s
v .

Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum 5
2
= n firme
pentru care se inregistreaza valorile variabilei Y:
} 33 , 36 , 25 , 32 , 34 {
2
, 2 5 , 2 4 , 2 3 , 2 2 , 2 1 , 2
= = = = = =
n
y y y y y y saptamani.
Media de selectie de grupa este 32
5
160
...
2
1
, 2
2
, 2 2 , 2 1 , 2
2
2
2
= = =
+ + +
=

=
n
y
n
y y y
y
n
j
j
n
saptamani,
dispersia de selectie de grupa este
( ) ( ) ( )
( )
5 , 17
1 1
...
2
1
2
2 , 2
2
2
2 , 2
2
2 2 , 2
2
2 1 , 2 2
2
2
2
=

+ + +
=

=
n
y y
n
y y y y y y
s
n
j
j
n
,
abaterea standard de selectie de grupa este 1833 , 4 5 , 17
2
2 2
= = = s s saptamani,
iar coeficientul de variatie al acestei grupe este % 07 , 13 100
32
1833 , 4
100
2
2
2
= = =
y
s
v .

Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum 7
3
= n firme pentru
care se inregistreaza valorile variabilei Y:
} 40 ; 49 ; 40 ; 48 ; 43 ; 41 ; 47 {
2
, 3 7 , 3 6 , 3 5 , 3 4 , 3 3 , 3 2 , 3 1 , 3
= = = = = = = =
n
y y y y y y y y saptamani.
Media de selectie de grupa este 44
7
308
...
3
1
, 3
3
, 3 2 , 3 1 , 3
3
3
3
= = =
+ + +
=

=
n
y
n
y y y
y
n
j
j
n
saptamani,
dispersia de selectie de grupa este
( ) ( ) ( )
( )
3333 , 15
1 1
...
3
1
2
3 , 3
3
2
3 , 3
2
3 2 , 3
2
3 1 , 3
2
3
3
3
=

+ + +
=

=
n
y y
n
y y y y y y
s
n
j
j
n
,
abaterea standard de selectie de grupa este 9158 , 3 3333 , 15
2
3 3
= = = s s saptamani,
iar coeficientul de variatie al acestei grupe este % 89 , 8 100
44
9158 , 3
100
3
3
3
= = =
y
s
v .

Cum coeficientii de variatie pentru cele trei grupe sunt mai mici ca 30%-35%, atunci toate
grupele sunt omogene. Grupa 3 (grupa firmelor mari) este mai omogena in privinta duratei de timp
de la angajare la prima promovare a unui salariat deoarece are cel mai mic coeficient de variatie
1 2 3
v v v < < .



Problema poate fi rezolvata in Excel dupa cum urmeaza:
Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane, asa cum apare
in Figura 1;
In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege Descriptive
Statistics;
In Excel 2007, din meniul principal Data, submeniul Data Analysis, se alege Descriptive
Statistics;


Figura 1. Introducerea datelor si alegerea Descriptive Statistics
din submeniul Data Analysis.

Fereastra de dialog este prezentata in Figura 2.

Figura 2. Fereastra de dialog pentru Descriptive Statistics.

Output-ul consta din urmatorul tabel, corepunzator prelucrarii datelor din cele trei grupe:

Grupa 1
(firme mici)
Grupa 2
(firme mijlocii)
Grupa 3
(firme mari)

Mean 30=
1
y 32=
2
y
44=
3
y
Standard Error 1,5119 1,8708 1,4800
Median 30 33 43
Mode 30 #N/A 40
Standard Deviation
4,2762=
2
1 1
s s = 4,1833=
2
2 2
s s =
3,9158=
2
3 3
s s =
Sample Variance
18,2857=
2
1
s 17,5=
2
2
s
15,3333=
2
3
s
Kurtosis 0,9406 2,9143 -2,3115
Skewness 0,5846 -1,5367 0,2332
Range 14 11 9
Minimum 24 25 40
Maximum 38 36 49
Sum 240=

=
1
1
, 1
n
j
j
y 160=

=
2
1
, 2
n
j
j
y 308=

=
3
1
, 3
n
j
j
y
Count 8=
1
n 5=
2
n
7=
3
n

b)
o Media totala la nivelul intregului esantion de volum 20
3 2 1
= + + = n n n n firme este
20
7 44 5 32 8 30
3 2 1
3 3 2 2 1 1
+ +
=
+ +
+ +
=
n n n
n y n y n y
y
4 , 35 = y saptamani.
o Pe baza datelor de selectie calculam:
Variatia dintre grupe (Sum of Squares Between Groups)
( ) ( ) ( )
( ) ( ) ( ) 7 4 , 35 44 5 4 , 35 32 8 4 , 35 30
2 2 2
3
2
3 2
2
2 1
2
1
+ + =
= + + = n y y n y y n y y SSB

8 , 808 = SSB
Variatia din interiorul grupelor (Sum of Squares Within Groups)
( ) ( ) ( )
( ) ( ) ( ) 3333 , 15 1 7 5 , 17 1 5 2857 , 18 1 8
1 1 1
2
3 3
2
2 2
2
1 1
+ + =
= + + = s n s n s n SSW

290 = SSW
Variatia totala
290 8 , 808 + =
+ = SSW SSB SST

8 , 1098 = SST
Coeficientul de determinatie este
7361 , 0
8 , 1098
8 , 808
2
= = =
SST
SSB
R
sau, exprimat procentual, % 61 , 73 100
8 , 1098
8 , 808
100
2
%
= = =
SST
SSB
R arata ca factorul de
grupare, tipul companiei, explica variatia totala a duratei de timp pana la prima promovare
in proportie de 73,61%, restul de 26,39% din variatia totala a timpului se datoreaza altor
factori care nu au fost considerati de cercetator.
o Dispersia de selectie la nivelul intregului esantion de volum 20 = n de firme este
8315 , 57
1 20
8 , 1098
1 1
esantion intregului nivelul la totala Variatia
2
=

=
n
SST
n
s
y

cu o abatere standard 6047 , 7 8315 , 57
2
= = =
y y
s s saptamani,
iar coeficientul de variatie este % 48 , 21 100
4 , 35
6047 , 7
100 = = =
y
s
v
y
y
.

Ex. 2 Pentru a cerceta dac o companie are un comportament discriminatoriu fa de femei un
cercettor selecteaz aleator un eantion de 105 salariai i nregistreaz veniturile salariale lunare
(sute lei). Datele, grupate n funcie de genul persoanei au fost prelucrate folosind EXCEL i s-au
obinut urmtoarele rezultate:

fe m e i b a r b a t i
M e a n 2 2 , 5 M e a n 2 6 , 0
M e d i a n 2 1 , 4 M e d i a n 2 5 , 7
M o d e 2 0 , 5 M o d e 3 2 , 0
S t a n d a r d D e v i a t i o n 5 , 7 4 S t a n d a r d D e v i a t i o n 9 , 5 0
S a m p l e V a r i a n c e 3 2 , 8 9 S a m p l e V a r i a n c e 9 0 , 2 3
K u r t o s i s - 0 , 5 K u r t o s i s 0 , 0
S k e w n e s s 0 , 3 S k e w n e s s - 0 , 3
R a n g e 2 2 , 8 R a n g e 4 6 , 9
M i n i m u m 1 2 , 1 M i n i m u m 1 0 , 9
M a x i m u m 3 4 , 9 M a x i m u m 5 7 , 8
S u m 1 0 1 1 S u m 1 5 6 1
C o u n t 4 5 C o u n t 6 0


Se cere:
a) Caracterizai omogenitatea i asimetria fiecrei grupe pe baza output-lui prezentat;
b) Determinai n ce proporie genul persoanei influeneaz variaia veniturilor salariale.
Comentai rezultatul obinut.

Ex. 3 Pentru o mai bun organizare a programului de vizitare managerul unui muzeu dorete s
cunoasc durata de vizitare a muzeului, n funcie de momentul zilei. Astfel, un eantion de 225 de
vizitatori pentru care s-a nregistrat durata vizitei (n minute) a fost mprit n dou grupe n funcie
de momentul ales (nainte de amiaz i dup amiaz). Datele nregistrate au fost prelucrate i s-au
obinut urmtoarele rezultate:

Grupe Numar de vizitatori Durata medie a vizitei (minute) Dispersia
Inainte de amiza 75 34 274,1
Dupa amiaza 150 50 215,5

Determinai n ce proporie momentul zilei nflueneaz durata de vizitare a muzeului. Comentai
rezultatul obinut.


Ex. 4. Managerul unei agentii imobiliare doreste sa efectueze o analiza referitoare la pretul de
vanzare (zeci mii euro) al caselor din doua zone ale Bucurestiului: zona Cotroceni si zona Piata
Victoriei. Datele inregistrate au fost prelucrate cu Excel si s-au obtinut urmatoarele rezultate:



















a) Caracterizati comparativ cele doua subcolectivitati pe baza output-ului prezentat (in particular,
caracterizai omogenitatea i asimetria fiecrei grupe);
b) Determinati in ce proportie zona influenteaza pretul de vanzare al caselor.


Ex. 5 Pentru 6 salariai care au urmat un curs de perfecionare au fost nregistrate date privind
calificativul obinut i productivitatea muncii (numar de dosare analizate intr-o ora):
Nr.
crt.
Calificativul Productivitatea
1 Foarte bine 15
2 Bine 16
3 Foarte bine 14
4 Suficient 13
5 Insuficient 12
6 Bine 13
Se cere sa se analizeze sensul si intensitatea legaturii dintre calificativul obinut si
productivitatea muncii, utilizand un coeficient de corelatie adecvat.

Rezolvare:
o Populatia statistica este multimea salariatilor unei companii care au urmat un curs de
perfectionare.
o Unitatea statistica este un salariat.
o Variabilele de interes sunt:

X - variabila ce arata calificativul obtinut de un salariat la sfarsitul cursului de perfectionare;
- variabila nenumerica masurata pe scala ordinala, aveand variantele de raspuns, de la cea
mai performanta pana la cea mai putin performanta, Foarte, bine, Bine, Suficient,
Insuficient.

Y - variabila ce arata productivitatea muncii unui salariat, exprimata in numar de dosare
analizate intr-o ora;
- variabila numerica.

o Pentru a analiza sensul si intensitatea legaturii dintreo variabila nenumerica masurata pe
scala ordinala si o variabila numerica se utilizeaza un coeficientu de corelatie al rangurilor
si anume cel al lui Spearman.
Cotroceni Piata Victoriei

Mean 38,98 Mean 59,45
Median 36,18 Median 59,8
Mode 36 Mode 59
Standard Deviation 12,04 Standard Deviation 17,23
Sample Variance 144,93 Sample Variance 296,88
Kurtosis 1,91 Kurtosis -1,01
Skewness 1,30 Skewness 0,09
Range 53,20 Range 61,37
Minimum 21,77 Minimum 29,9
Maximum 74,97 Maximum 91,27
Sum 1169,50 Sum 1783,37
Count 30 Count 30

Ex. 6 Rezultatele examinrii a unui eantion de studeni la probele teoretice i practice ale unei
discipline de specialitate sunt urmtoarele:
Student A B C D E F G H I J
TEORIE 8 3 9 2 7 10 4 6 1 5
PRACTIC 9 5 10 1 8 7 3 4 2 6
Se cere:
a) s se analizeze grafic legatura dintre cele doua variabile;
b) in ipoteza distribuiei normale a celor doua variabile, sa se msoare intensitatea legturii
folosind coeficientul de corelatie liniar Pearson;
c) sa se calculeze si interpreteze coeficientul de corelatie al rangurilor Spearman.

S-ar putea să vă placă și