Sunteți pe pagina 1din 7

Anul I, Facultatea de Marketing 2011-2012 Statistica Exercitii Statistica partea a II-a Ex. 1.

. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angaja i de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea ini ial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele nregistrate sunt: Mrimea firmelor Mici Medii Mari Numr de promovare 30; 26; 30; 34; 32; 25; 47; 41; 43; sptmni de la angajare pn la prima 32; 38; 24; 32; 28; 36; 33 48; 40; 49; 40.

Se cere: a) s seprecizeze care este grupa de firme cu un grad mai ridicat de omogenitate; b) sa se determine in ce proportie marimea companiei influenteaza variatia timpului pana la prima promovare a unui salariat.

Rezolvare: a) o Populatia statistica este multimea companiilor producatoare de tehnologie de varf. o Unitatea statistica este o companie (firma). o Caracteristicile urmarite sunt: X - variabila ce arata marimea unei firme; - variabila nenumerica avand r=3 categorii sau variante de raspuns: firme mici, firme mijlocii si firme mari: aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3 grupe si anume: Grupa 1 (grupa firmelor mici), Grupa 2 (grupa firmelor mijlocii), Grupa 3 (grupa firmelor mari); - astfel, variabila X, marimea firmei, se mai numeste si factor de grupare. - variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat al unei firme producatoare de tehnologie de varf; - variabila numerica de interes. Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum n1 = 8 firme pentru care se inregistreaza valorile variabilei Y: { y 1, 1 = 30 ; y1, 2 = 26 ; y 1, 3 = 30 ; y 1, 4 = 32 ; y1, 5 = 38 ; y1, 6 = 24 ; y1, 7 = 32 ; y 1, 8 = y 1, n1 = 28 } saptamani. Media de selectie de grupa este y1 =

si Y

y1, 1 + y1, 2 + ... + y1, n1 n1

y
=
j =1

n1

1, j

n1

240 = 30 saptamani, 8

dispersia de selectie de grupa este

s12

(y =

1, 1

y ) + (y
2 1

1, 2

y )
1

+ ... + ( y

1, n1

n1 1

(y y ) =
n1 2 1 j =1

1, j

y1 )

n1 1

= 18,2857 ,

abaterea standard de selectie de grupa este s1 = s12 = 18,2857 = 4,2762 saptamani, s 4,2762 iar coeficientul de variatie al acestei grupe este v1 = 1 100 = 100 = 14,25% . y1 30
Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum n2 = 5 firme pentru care se inregistreaza valorile variabilei Y: { y 2 , 1 = 34 , y 2 , 2 = 32 , y 2 , 3 = 25, y 2 , 4 = 36 , y 2 , 5 = y 2 , n2 = 33} saptamani. Media de selectie de grupa este y2 = dispersia de selectie de grupa este
2 s2 =

y 2, 1 + y 2, 2 + ... + y2, n2 n2

y
=
j =1

n2

2, j

n2
2

160 = 32 saptamani, 5

(y

2, 1

y 2 ) + ( y 2, 2 y 2 ) + ... + y2, n2 y2
2 2

n2 1

(y
n2 j =1

2, j

y2 )

n2 1

= 17,5 ,

2 abaterea standard de selectie de grupa este s2 = s2 = 17,5 = 4,1833 saptamani, s 4,1833 iar coeficientul de variatie al acestei grupe este v2 = 2 100 = 100 = 13,07% . y2 32

Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum n3 = 7 firme pentru care se inregistreaza valorile variabilei Y: { y3, 1 = 47; y3, 2 = 41; y3, 3 = 43; y3, 4 = 48; y3, 5 = 40; y3, 6 = 49; y3, 7 = y3, n2 = 40 } saptamani. Media de selectie de grupa este y3 = dispersia de selectie de grupa este
2 s3 =

y3, 1 + y3, 2 + ... + y3, n3 n3

y
=
j =1

n3

3, j

n3
2

308 = 44 saptamani, 7

(y

3, 1 y3 ) + ( y 3, 2 y3 ) + ... + y3, n3 y 3 2 2

n3 1

) = (y
n3
2

j =1

3, j

y3 )

n3 1

= 15,3333 ,

2 abaterea standard de selectie de grupa este s3 = s3 = 15,3333 = 3,9158 saptamani,

iar coeficientul de variatie al acestei grupe este v3 =

s3 3,9158 100 = 100 = 8,89% . y3 44

Cum coeficientii de variatie pentru cele trei grupe sunt mai mici ca 30%-35%, atunci toate grupele sunt omogene. Grupa 3 (grupa firmelor mari) este mai omogena in privinta duratei de timp de la angajare la prima promovare a unui salariat deoarece are cel mai mic coeficient de variatie v3 < v2 < v1 .

Problema poate fi rezolvata in Excel dupa cum urmeaza: Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane, asa cum apare in Figura 1; In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege Descriptive Statistics; In Excel 2007, din meniul principal Data, submeniul Data Analysis, se alege Descriptive Statistics;

Figura 1. Introducerea datelor si alegerea Descriptive Statistics din submeniul Data Analysis. Fereastra de dialog este prezentata in Figura 2.

Figura 2. Fereastra de dialog pentru Descriptive Statistics.

Output-ul consta din urmatorul tabel, corepunzator prelucrarii datelor din cele trei grupe:
Grupa 1 (firme mici) Grupa 2 (firme mijlocii) Grupa 3 (firme mari)

Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count 240= 4,2762= s1

30= y1 1,5119 30 30

32= y 2 1,8708 33 #N/A 4,1833= s 2


2 = s2 2

44= y3 1,4800 43 40 3,9158= s3


2 = s3
2

= s12
2

18,2857= s1

17,5= s2

15,3333= s3

0,9406 0,5846 14 24 38

2,9143 -1,5367 11 25 36 160=

-2,3115 0,2332 9 40 49 308=

y
j =1

n1

1, j

y
j =1

n2

2, j

y
j =1

n3

3, j

8= n1

5= n2

7= n3

b) o Media totala la nivelul intregului esantion de volum n = n1 + n 2 + n3 = 20 firme este y n + y 2 n2 + y3 n3 30 8 + 32 5 + 44 7 y= 1 1 = n1 + n2 + n3 20 y = 35,4 saptamani. o Pe baza datelor de selectie calculam: Variatia dintre grupe (Sum of Squares Between Groups) 2 2 2 SSB = ( y1 y ) n1 + ( y 2 y ) n 2 + ( y 3 y ) n3 =
= (30 35,4 ) 8 + (32 35,4 ) 5 + (44 35,4 ) 7 SSB = 808,8 Variatia din interiorul grupelor (Sum of Squares Within Groups) 2 2 SSW = (n1 1) s12 + (n2 1) s 2 + (n3 1) s3 =
2 2 2

= (8 1) 18,2857 + (5 1) 17,5 + (7 1) 15,3333 SSW = 290 Variatia totala SST = SSB + SSW

= 808,8 + 290 SST = 1098,8 Coeficientul de determinatie este SSB 808,8 R2 = = = 0,7361 SST 1098,8 SSB 808,8 2 sau, exprimat procentual, R% = 100 = 100 = 73,61% arata ca factorul de SST 1098,8 grupare, tipul companiei, explica variatia totala a duratei de timp pana la prima promovare in proportie de 73,61%, restul de 26,39% din variatia totala a timpului se datoreaza altor factori care nu au fost considerati de cercetator.

o Dispersia de selectie la nivelul intregului esantion de volum n = 20 de firme este Variatia totala la nivelul intregului esantion SST 1098,8 s2 = = = = 57,8315 y n 1 n 1 20 1
cu o abatere standard s y = s 2 = 57,8315 = 7,6047 saptamani, y iar coeficientul de variatie este v y =

sy y

100 =

7,6047 100 = 21,48% . 35,4

Ex. 2 Pentru a cerceta dac o companie are un comportament discriminatoriu fa de femei un cercettor selecteaz aleator un eantion de 105 salaria i i nregistreaz veniturile salariale lunare (sute lei). Datele, grupate n func ie de genul persoanei au fost prelucrate folosind EXCEL i s-au ob inut urmtoarele rezultate:
fe m e i M M M S S K S R M M S C ean e d ia n ode t a n d a r d D e v ia t io n a m p le V a r ia n c e u rt o s is ke w n es s an g e in im u m a x im u m um ou n t 2 2 ,5 2 1 ,4 2 0 ,5 5 ,7 4 3 2 ,8 9 - 0 ,5 0 ,3 2 2 ,8 1 2 ,1 3 4 ,9 10 1 1 45 b a rb a t i M e an M e d ia n M o de S t a n d a rd D e v ia t io n S a m p le V a r ia n c e K u r t o s is S k e w ne ss R ange M in im u m M a x im u m Sum C ount 2 2 3 9 90 6 ,0 5 ,7 2 ,0 ,5 0 ,2 3 0 ,0 - 0 ,3 4 6 ,9 1 0 ,9 5 7 ,8 1561 60

Se cere: a) Caracteriza i omogenitatea i asimetria fiecrei grupe pe baza output-lui prezentat; b) Determina i n ce propor ie genul persoanei influen eaz varia ia veniturilor salariale. Comenta i rezultatul ob inut.

Ex. 3 Pentru o mai bun organizare a programului de vizitare managerul unui muzeu dorete s cunoasc durata de vizitare a muzeului, n func ie de momentul zilei. Astfel, un eantion de 225 de vizitatori pentru care s-a nregistrat durata vizitei (n minute) a fost mpr it n dou grupe n func ie de momentul ales (nainte de amiaz i dup amiaz). Datele nregistrate au fost prelucrate i s-au ob inut urmtoarele rezultate:
Grupe Inainte de amiza Dupa amiaza Numar de vizitatori 75 150 Durata medie a vizitei (minute) 34 50 Dispersia 274,1 215,5

Determina i n ce propor ie momentul zilei nfluen eaz durata de vizitare a muzeului. Comenta i rezultatul ob inut.

Ex. 4. Managerul unei agentii imobiliare doreste sa efectueze o analiza referitoare la pretul de vanzare (zeci mii euro) al caselor din doua zone ale Bucurestiului: zona Cotroceni si zona Piata Victoriei. Datele inregistrate au fost prelucrate cu Excel si s-au obtinut urmatoarele rezultate:

Cotroceni Mean Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count 38,98 36,18 36 12,04 144,93 1,91 1,30 53,20 21,77 74,97 1169,50 30

Piata Victoriei Mean Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count 59,45 59,8 59 17,23 296,88 -1,01 0,09 61,37 29,9 91,27 1783,37 30

a) Caracterizati comparativ cele doua subcolectivitati pe baza output-ului prezentat (in particular, caracteriza i omogenitatea i asimetria fiecrei grupe); b) Determinati in ce proportie zona influenteaza pretul de vanzare al caselor.

Ex. 5 Pentru 6 salaria i care au urmat un curs de perfec ionare au fost nregistrate date privind calificativul ob inut i productivitatea muncii (numar de dosare analizate intr-o ora): Nr. Calificativul Productivitatea crt. 1 Foarte bine 15 2 Bine 16 3 Foarte bine 14 4 Suficient 13 5 Insuficient 12 6 Bine 13 Se cere sa se analizeze sensul si intensitatea legaturii dintre calificativul ob inut si productivitatea muncii, utilizand un coeficient de corelatie adecvat.
Rezolvare: o Populatia statistica este multimea salariatilor unei companii care au urmat un curs de perfectionare. o Unitatea statistica este un salariat. o Variabilele de interes sunt: X - variabila ce arata calificativul obtinut de un salariat la sfarsitul cursului de perfectionare; - variabila nenumerica masurata pe scala ordinala, aveand variantele de raspuns, de la cea mai performanta pana la cea mai putin performanta, Foarte, bine, Bine, Suficient, Insuficient. Y - variabila ce arata productivitatea muncii unui salariat, exprimata in numar de dosare analizate intr-o ora; - variabila numerica.

o Pentru a analiza sensul si intensitatea legaturii dintreo variabila nenumerica masurata pe scala ordinala si o variabila numerica se utilizeaza un coeficientu de corelatie al rangurilor si anume cel al lui Spearman.

Ex. 6 Rezultatele examinrii a unui eantion de studen i la probele teoretice i practice ale unei discipline de specialitate sunt urmtoarele: Student A B C D E F G H I J TEORIE 8 3 9 2 7 10 4 6 1 5 PRACTIC 9 5 10 1 8 7 3 4 2 6 Se cere: a) s se analizeze grafic legatura dintre cele doua variabile; b) in ipoteza distribu iei normale a celor doua variabile, sa se msoare intensitatea legturii folosind coeficientul de corelatie liniar Pearson; c) sa se calculeze si interpreteze coeficientul de corelatie al rangurilor Spearman.

S-ar putea să vă placă și