Sunteți pe pagina 1din 13

1.

Pentru

30 de convorbiri
nregistrat duratele (n minute):
11,8 3,6; 16,6 13,5 4,8
;
;
;
;
10,2 8,0; 11,4 6,8; 9,6
;
;
;
6,2; 11,2 10,4 7,2; 5,5
;
;
;

telefonice de lung-distan s-au


8,3;

8,9;

9,1;

7,7 2,3;
;
19,5 15,3 12,3 8,5 15,9
;
;
;
;
;
14,5
.

12,1 6,1;
;
18,7 11,7
;
;

Se cere:
a)S se determine durata medie a unei convorbiri telefonice i s
se studieze dac valoarea obinut este reprezentativ;
b) S se analizeze asimetria distribuiei;
c)S se grupeze datele pe 6 intervale de mrime egal i s se
reprezinte grafic rezultatul gruprii;
Rezolvare:
a) Notm cu X variabila durata unei convorbiri telefonice, iar xi
reprezint valorile variabilei X pentru cele n=30 observaii.
Pentru calculul mediei se va utiliza formula mediei aritmetice
simple:
30

xi

x i 1
n

10 ,26

minute.

Verificarea reprezentativitii mediei se face cu ajutorul


coeficientului de variaie:
s
v x 100
x

Calculm abaterea medie ptratic:


30

s x s x2

xi x
i 1

4 ,29

minute.

Coeficientul de variaie este:


s
4 ,29
v x 100
100 41,8% >35%,
x
10 ,26

ceea ce nseamn c seria

de date are un grad redus de omogenitate i deci media are o


reprezentativitate sczut.
b) Analizm asimetria seriei cu ajutorul coeficientului de
asimetrie Pearson:
Cas

x Mo
sx

, unde Mo este valoarea modal i reprezint

valoarea cel mai des ntlnit ntr-o serie statistic.

Dac analizm seria de date observm c fiecare valoare


apare o singur dat i deci putem afirma nu exist mod. n acest
caz vom analiza asimetria seriei folosind o formul alternativ a
coeficientului de asimetrie, formul bazat pe ipoteza c ntr-o
repartiie moderat asimetric ntre indicatorii tendinei centrale
exist relaia Mo x 3 Me x .
Cas1

3( x Me )
,
sx

unde Me reprezint mediana seriei.

Pentru determinarea valorii medianei procedm astfel:


Ordonm cresctor seria de date:
2,3 3,6 4,8 5,5 6,1 6,2 6,8 7,2 7,7
8
8,9 9,1 9,6 10, 10, 11, 11, 11, 11, 12,
2
4
2
4
7
8
1
14, 15, 15, 16, 18, 19,
5
3
9
6
7
5

8,3
12,
3

8,5
13,
5

Determinm locul medianei n serie:


locMe

n 1 31

15 ,5 .
2
2

Aceast valoare arat c mediana se

gsete ntre termenul al 15-lea, respective al 16-lea ai seriei


ordodate cresctor/descresctor, adic mediana este o valoare
cuprins ntre 9,6 i 10,2.
Determinm mediana ca fiind media aritmetic simpl a
celor dou valori:
Me

9 ,6 10 ,2
9 ,9
2

minute.

Aceasta nseamn c 50% dintre convorbirile telefonice au o durat


mai mic de 9,9 minute, respective 50% au o durat mai mare.
Cas1

3( x Me ) 3 10 ,26 9 ,9

0 ,25
sx
4 ,29

Observaie: Cas1 3,3 .


Valoarea coeficientului arat o uoar asimetrie pozitiv, n serie
predominnd valorile mici.
c) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute
r=6
h Ax r 16,8 6 2,8 3 minute
Rezultatele gruprii sunt prezentate n tabelul:
Intervale de variaie a duratei
convorbirilor telefonice (minute)
2-5
5-8
8-11

Numr de convorbiri
telefonice
3
6
8

11-14
14-17
17-20
Total
Not: limita inferioar inclus n interval.

7
4
2
30

Convorbiri

Reprezentarea grafic :
9
8
7
6
5
4
3
2
1
0
0-2

2-5

5-8

8-11 11-14 14-17 17-20


Durata

Distribuia convorbirilor telefonice dup durat


Se observ c distribuia este normal, uor asimetric la dreapta
(vezi coeficientul de asimetrie-punctul b).

2. Distribuia celor 54 de ageni comerciali ai unei firme ce


comercializeaz produse cosmetice de
dup numrul de zile
lucrate n luna iulie este urmtoarea:
Zile lucrate
Numr
vnztori

21
22
23
24
25
26
27
Total

6
7
14
11
9
4
3
54

Se cere:
a) S se reprezinte grafic distribuia vnztorilor dup numrul de
zile lucrate;
b) S se determine numrul mediu de zile lucrate i s se
studieze dac valoarea obinut este reprezentativ;
c) Care este numrul de zile lucrate peste care se situeaz 50%
din vnztori?
d) S se analizeze asimetria distribuiei.
e) Daca cei 54 de vanzatori reprezinta un esantion reprezentativ,
selectat aleator repetat, determinati intervalul de incredere pentru
nr. mediu de zile lucrate de un vanzator din colectivitatea generala
(probabilitate de garantare a rezultatelor este de 95% (z 0,025=1.96)).
Rezolvare:
a) n tabel avem o serie de distribuie de frecvene pe variante,
variabila analizat X fiind numr zile lucrate. Pentru reprezentarea
grafic se folosete diagrama cu coloane nelipite centrate pe
variant.
16
14

nr.lucratori

12
10
8
6
4
2
0
21

22

23

24

25

26

27

zile lucrate

Distribuia vnztorilor dup numrul de zile lucrate


b) Se calculeaz numrul mediu de zile lucrate cu ajutorul mediei
aritmetice ponderate:
x

xi ni
ni

1276
23,6
54

Tabelul 3.4

zile.

Zile
lucrate
(xi)
0
21
22
23
24
25
26
27
Total

Numr
vnztori
(ni)
1
6
7
14
11
9
4
3
54

xi ni

xi x 2 ni

Fci

2
126
154
322
264
225
104
81
1276

3
40,56
17,92
5,04
1,76
17,64
23,04
34,68
140,64

4
6
13
27
38
47
51
54
-

Aadar, un vnztor din cei 54 luai n studiu a lucrat, n medie,


aproximativ 23 de zile i jumtate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie
calculat coeficientul de variaie, pe baza abaterii medii ptratice:
s
v x 100
x
s x2

sx

Dispersia variabilei este:


s x2

xi x

ni

ni

140 ,64
2 ,6044 .
54

Calculele intermediare necesare n determinarea dispersiei sunt


prezentate n coloana 3 a tabelului 3.4.
Abaterea medie ptratic va fi:
s x 2 ,6044 1,61 zile.
iar coeficientul de variaie:
s
1,61
v x 100
100 6 ,8% <
23 ,6
x

35%, ceea ce nseamn c media calculat

este reprezentativ, colectivitatea fiind omogen.


c)Se cere determinarea medianei
Mediana (Me)
locMe

ni 1 55 27 ,5
2

Me = 24 zile.
Deci, 50% din vnztori au lucrat mai mult de 24 de zile, iar 50%
mai puin.
d)

Analizm asimetria distribuiei cu ajutorul coeficientului de


asimetrie al lui Pearson.
Cas

x Mo 23 ,6 23

0 ,37
sx
1,61

Mo = 23 zile (nivelul variabilei cu frecvena cea mai mare).


Valoarea coeficientului de asimetrie indic fapul c seria este
moderat asimetric la dreapta (predomin valorile mici ale
variabilei).
e)Intervalul de incredere pentru media din colectivitatea generala
este:
x x x x

Eroarea limita este:


x z / 2 s x z / 2

sx
n

x B 1.96 *1.61 / 54 B 3.1556 / 7.3484 B 0.4294

3. Procentul din profit cheltuit de 70 de firme pentru reclam i publicitate n anul 2005 a avut
urmtoarea distribuie:
Tabelul 3.5
% pentru reclam i publicitate

Nr. firme cu % pentru reclama mai mic


dect limita superioar a intervalului
0,6-1,0
14
1,0-1,4
32
1,4-1,8
56
1,8-2,2
64
2,2-2,6
68
2,6-3,0
70
Total
Not: limita inferioar inclus n interval.

Se cere:
a) S se reprezinte grafic distribuia de frecvene absolute;
b) S se determine procentul mediu cheltuit pentru reclam i publicitate i s se studieze dac valoarea
obinut este reprezentativ;
c) Care este procentul din profit cheltuit pentru reclam i publicitate peste care se situeaz:
c1) trei sferturi dintre firme?
c2) 50% din firme?
c3) o ptrime din firme?
d) S se analizeze asimetria i excesul distribuiei.
e) S se calculeze media i dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru
reclam i publicitate.

Rezolvare:

a) Se observ c n tabelul 3.5 sunt date frecvenele absolute cumulate cresctor. Pentru a determina
frecvenele absolute, trebuie s decumulm frecvenele date n tabelul iniial (coloana 2). Rezultatele
prelucrrilor intermediare necesare pentru calcularea indicatorilor solicitai vor fi redate n tabelul 3.6.
Tabelul 3.6
% cheltuit
pentru
reclam i
publicitate
0
0,6-1,0
1,0-1,4
1,4-1,8
1,8-2,2
2,2-2,6
2,6-3,0
Total

Frecvenele
absolute
cumulate
cresctor
1
14
32
56
64
68
70
-

Frecvene
absolute
(nr. firme)
(ni)
2
14
18
24
8
4
2
70

Centre de
interval
(xi)

xi ni

xi x x i x

3
0,8
1,2
1,6
2,0
2,4
2,8
-

4
11,2
21,6
38,4
16
9,6
5,6
102,4

5
-0,66
-0,26
0,14
0,54
0,94
1,34

2 nixi x 4 ni

6
6,098
1,217
0,470
2,333
3,534
3,591
17,244

7
2,656
0,082
0,009
0,680
3,123
6,448
13,000

Distribuia de frecvene absolute este reprezentat grafic n figura 3.3, prin histogram.
30
Numr de firme

25
20
15
10
5
0
0,6-1,0 1,0-1,4 1,4-1,8 1,8-2,2 2,2-2,6 2,6-3,0
procentul pt. reclama si publicitate

Figura 3.3 Distribuia firmelor dup procentul cheltuit pentru reclam i publicitate
b) Se calculeaz media aritmetic ponderat a procentului cheltuit pentru reclam i publicitate, pe baza
frecvenelor absolute (coloana 4):
x

xi ni
ni

102 ,4
1,4628 1,46 %
70

Aadar, o firm din cele 70 luate n studiu a cheltuit, n medie, 1,46% din profit pentru reclam i
publicitate.

Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza
abaterii medii ptratice:
s
v x 100
x
sx

s x2

Dispersia variabilei n eantion este:


s x2

xi x

ni

ni

17 ,244
0 ,2463
70

Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloanele 5 i 6.


Abaterea medie ptratic va fi:
s x 0 ,2463 0 ,4963 0 ,5 %.
iar coeficientul de variaie:
s
0 ,5
v x 100
100 34 ,24% < 35%, ceea ce nseamn c media calculat este reprezentativ,
1,46
x
colectivitatea fiind omogen.
c) Se cer calculai urmtorii indicatori medii de poziie:
c1) prima cuartil (Q1):
Pentru calculul ei se procedeaz astfel:
se determin locul primei cuartile:
ni 1 71
locQ1

17 ,75
4
4

se gsete intervalul n care se afl prima cuartil (primul interval a crui frecven cumulat cresctor
depete locul primei cuartile), acesta este 1,0-1,4;
se calculeaz prima cuartil, cu formula:

Q1 x0 k

loc Q1 FcQ1 1
nQ1

1 0 ,4

17 ,75 14
1,08
18

%.

unde:
x0 = limita inferioar a intervalului primei cuartile;
k = mrimea intervalului cuartilic;
FcQ1-1 = frecvena cumulat a intervalului anterior celui cuartilic;
nQ1 = frecvena absolut a intervalului primei cuartile.
Aadar, 75% dintre firme au cheltuit pentru reclam i publicitate mai mult de 1,08 % din profit.
c2) Mediana (Me)
ni 1 71
locMe

35 ,5
2
2
Mediana se gsete n intervalul 1,4-1,8.

Me x0 k

loc Me FcMe 1
35 ,5 32
1,4 0 ,4
1,458 %.
nMe
24

Deci, 50% din firme au cheltuit pentru reclam i publicitate mai mult de 1,458 % din profit, iar 50%
mai puin.
c3) Cuartila a treia (Q3)
3(
ni 1 )
locQ3
53 ,25
4
A treia cuartil se gsete tot n intervalul 1,4-1,8.

Q3 x0 k

loc Q3 FcQ3 1
nQ3

1,4 0 ,4

53,25 32
1,754 %.
24

Aadar, 25% din firme au cheltuit pentru reclam i publicitate mai mult de 1,754 % din profit, iar 75%
mai puin.
d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.
Cas

x Mo
sx

Mo x0 k

1
1 2

unde:
x0 = limita inferioar a intervalului modal;
k = mrimea intervalului modal;
Intervalul modal este intervalul cu frecvena maxim: [ 1,4-1,8)
1 = nMo nMo-1 = frecvena intervalului modal minus frecvena intervalului anterior celui modal;
2 = nMo - nMo+1 = frecvena intervalului modal minus frecvena intervalului urmtor celui modal;
Se obine Mo 1,4 0 ,44

24 18
1,52%.
( 24 18 ) ( 24 8 )

Cele mai multe firme au cheltuit pentru reclam i publicitate 1,52% din profit.
Cas

1,46 1,52
0 ,12 <0 ceea ce arat o asimetrie uoar, negativ, n serie predomin valorile
0 ,4963

mici.
Oblicitatea poate fi studiat i cu ajutorul coeficientului lui Bowley:

As

Q3 Me Me Q1 0 ,122
Q3 Q1

, cu aceeai interpretare ca cea artat nainte.

Excesul unei distribuii unimodale poate fi studiat cu ajutorul coeficientului lui Pearson:

22

Cum 2 = sx2 rezult c 22 0 ,06

xi x
4
ni
2

ni

13
0 ,186 (coloana 7)
70

0 ,186
3 ,1
0 ,06

sau 2 = 2 3 = 3,1 3 = 0,1


Curba este aadar leptocurtic (alungit), deoarece 2 > 3, iar 2 > 0.

d) Se creeaz o caracteristic alternativ cu o stare favorabil (firmele care au cheltuit peste 2,2%) i o
stare nefavorabil (firmele care au cheltuit mai puin de 2,2%).
Media caracteristicii alternative este:
m
6
w

0 ,086 0 ,09 (n medie, 9% din firme au cheltuit peste 2,2%)


n 70
iar dispersia:
s 2 w 1 w 0 ,09 0 ,91 0 ,08 .
4. Se cunosc urmtoarele date referitoare la distribuia celor 3569 structuri de primire turistic cu
funciuni de cazare turistic, pe categorii de confort n anul 2003:

Tabelul 3.7
Categorii de confort
0
Neclasificate
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL

Numr de uniti (ni)


1
448
1080
1479
427
125
10
3569

Sursa: www.insse.ro
S se determine indicatorii tendinei centrale pentru aceast serie.

Rezolvare:
Datele prezentate n tabelul 3.7 reprezint o serie de distribuie de frecvene pe variante, iar variabila
analizat (categoria de confort) este calitativ, msurat pe o scal ordinal. Din categoria indicatorilor ce
caracterizeaz tendina central, pentru aceast serie pot fi determinate valoarea modal (modul) i mediana.
Modul (Mo) este valoarea variabilei cu frecvena cea mai mare, deci nivelul Mo este 2 stele (nimax
=1467).
Pentru determinarea medianei (Me) procedm astfel:

Calculm frecvenele absolute cumulate cresctor (Fci)- coloana 2, tabelul 3.8.


Tabelul 3.8
Categorii de confort

Numr de uniti (ni)

0
Neclasificate
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL

1
448
1080
1479
427
125
10
3569

Frecvene absolute
cumulate cresctor (Fci)
2
448
1528
3007
3434
3559
3569
-

Determinm locul medianei:


6

ni 1

locMe i 1

n 1 3570

1785
2
2

2
Determinm mediana:
Mediana reprezint acel nivel al variabilei analizate corespunztor primei frecvene cumulate cresctor mai
mare dect locMe. Deci i nivelul Me este 2 stele (Fc3=3007>locMe=1785).

5. Dou grupe de studeni, cu efective de 25 i, respectiv, 32 de persoane, au susinut un test de


cultur general. Prima grup a obinut media 7,8, iar a doua 8,4. Cercettorul este interesat n a determina
nota medie pe ansamblul celor dou grupe.
Rspuns:
Nota medie pe ansamblul celor dou grupe se poate determina ca o medie de medii pariale. S notm:
n1 = 25
i
x 1 7 ,8
n2 = 32
i
x 2 8 ,4
x i ni , x x 1 n1 x 2 n2 7 ,8 25 8 ,4 32 195 268 ,8 8 ,14 puncte.
Atunci: x
n1 n 2
25 32
57
ni

6. Considerai urmtoarele valori: 5, 7, 4, 5, 20, 6, 4.


a) Calculai media aritmetic i mediana acestui set de date; ce valoare vi se pare mai potrivit pentru a
caracteriza tendina central: media sau mediana?
b) nlocuii valoarea 20 cu valoarea 8 i recalculai cei doi indicatori ai tendinei centrale. Explicai
modificrile survenite.
c) Adugai 50 fiecrei valori iniiale. Cum se va modifica media?
Rspuns:
x 7 ,28

Pentru determinarea medianei, datele se ordoneaz: 4, 4, 5, 5, 6, 7, 20. Se determin locul medianei n serie:
ni 1 7 1
Loc Me

4.
2
2
Seria avnd un numr impar de termeni, mediana este egal cu valoarea termenului central (al patrulea), deci
Me = 5.
Mediana este un indicator potrivit pentru a studia tendina central n acest set de date, deoarece valoarea 20
este o valoare extrem, ce afecteaz, prin magnitudine, nivelul total al variabilei i deci valoarea mediei. ase
dintre cele apte valori se situeaz sub valoarea mediei aritmetice, ceea ce face ca indicatorul median s
exprime mai corect tendina central.
b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.
x 5 ,57 , Me = 5.
Valoarea medianei rmne neschimbat, ea innd cont numai de numrul valorilor mari, nu i de valoarea
lor efectiv.
c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.
x'i 401 57 ,28 x 50 .
x'
n
7
Se verific proprietatea mediei aritmetice de a se modifica () cu a uniti, dac fiecare valoare se
modific () cu cte a uniti.

9. Directorul unei bnci dorete s cunoasc situaia numrul de zile de ntrziere a rambursrii
creditelor. Analiznd distribuia debitorilor dup numrul zilelor de ntrziere, constat urmtoarele: 30% din
debitori ntrzie ntre 10 i 20 de zile, 40% ntre 20 i 30 de zile, 18% ntre 30 i 40 de zile, iar restul mai
mult de 40 de zile. Care este numrul mediu de zile de ntrziere a plii pe un debitor?
Rspuns:
Datele pot fi sistematizate ca n tabelul 3.11:
Tabelul 3.11

Intervale de variaie a numrului de zile de


ntrziere a plii
10-20
20-30
30-40
40 i peste
Total

Numr de debitori (%)

xi

xi ni*%

40
30
18
12
100

15
25
35
45
-

600
750
630
540
2520

Se va utiliza media aritmetic ponderat, calculat pe baza frecvenelor relative:


xi n*i% 2520

25 ,2 25 zile.
100
100
Aadar, n medie, un debitor al bncii ntrzie 25 zile la rambursarea unui credit.
15. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor
angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20
de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui

salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele
nregistrate sunt:
Tabelul 3.20
Mrimea firmelor
Mici
Medii
Mari

Numr de sptmni de la angajare pn la prima promovare


30; 26; 30; 38; 32; 24; 32; 30;
30; 34; 32; 25; 36;
49; 42; 43; 48; 40; 49; 40.

Se cere:
a) s se determine numrul mediu de sptmni pn la prima promovare, pe fiecare grup de firme,
precum i pe total;
b) s se arate dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul
anterior, este o valoare reprezentativ;
c) n ce msur variaia timpului scurs pn la prima promovare este influenat de mrimea firmei?
Rezolvare
a) Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de
sptmni de la angajare pn la prima promovare.
Tabelul 3.21
Mrimea firmelor
Mici
Medii
Mari
Total

ni

yi

8
5
7
20

30,25
31,4
44,43
-

si2

15,44
14,24
14,53
-

i 1,3 ,

i reprezint grupa (mrimea firmei)


Calculm mediile pentru fiecare grup i ( yi ):
8

y1 j
y1

j 1

n1

sptmni;
30 26 30 38 32 24 32 30
30 ,25
8

sptmni;
30 34 32 25 36
31,4
5

sptmni.
49 42 43 48 40 49 40
44 ,43
7

y2 j
y2

j 1

n2
7

y3 j
y3

j 1

n3

Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a
mediilor pariale:
y

y i ni
ni

30 ,25 5 31,4 8 44 ,43 7


35 ,67 sptmni.
20

b) Pentru a verifica dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul
anterior, este o valoare reprezentativ trebuie s calculm, mai nti, dispersia pe total cu ajutorul regulii
de adunare a dispersiilor. Determinm, mai nti, dispersia fiecrei grupe i ( si2 ):
8

s12

y1 j y1
j 1

n1
5

s22

y2 j y 2
j 1

n2

3 30 30 ,25 2 2 32 30 ,25 2 26 30 ,25 2 38 30 ,25 2 24 30 ,25 2


15 ,44
8

30 31,4 2 34 31,4 2 32 31,4 2 25 31,4 2 36 31,4 2


5

14 ,24

s32

y3 j y 3

j 1

n3

2 49 44 ,43 2 2 40 44 ,43 2 42 44 ,43 2 43 44 ,43 2 48 44 ,43 2


14 ,53
7

Media dispersiilor grupelor va fi:


s2

si2 ni
ni

15 ,44 5 14 ,24 8 14 ,53 7


14 ,64
20

Dispersia dintre grupe care sintetizeaz influena factorului de grupare X asupra variaiei variabilei Y este:

yi y

ni

ni

30 ,25 35 ,67 2 5 31,4 35 ,67 2 8 44 ,43 35 ,67 2 7


20

41,5

Din regula de adunare a dispersiilor rezult:


s2 s

2 14 ,64 41,5 56 ,14

Reprezentativitatea mediei este influenat de omogenitatea seriei de date i se msoar cu


ajutorul coeficientului de variaie:
v

s
56 ,14
100
100 21%.
y
35 ,67

Cum v < 35%, rezult c numrul mediu de sptmni pn la prima promovare este o valoare
reprezentativ pentru colectivitate.

c) Pentru a calcula n ce msur variaia timpului scurs pn la prima promovare este influenat de
mrimea firmei utilizm coeficientul de determinaie:
R2

2
s

100

41,5
100 74%.
56 ,14

Aadar, 74% din variaia caracteristicii Y este influenat de mrimea firmei, iar influena altor factori
(considerai aleatori) este:
K 2 1 R2

s2

100 26%.