Sunteți pe pagina 1din 14

WS QAPLICAŢII REZOLVATE

1. Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre


aceste conturi. Sumele sunt date în Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) să se calculeze suma medie de bani existentă într-un cont şi să se testeze proprietăţile
mediei;
b) să se calculeze indicatorii medii de poziţie;
c) să se caracterizeze gradul de omogenitate al seriei.
G3W

\AZ|mkkkkkkkkkkkkkkkee3
Rezolvare:
Notăm cu xi = suma existentă în contul i
i  1, 10
a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:
10
 xi
150  175  195  200  235  240  250  256  275  294
x  i 1  
10 10
2270
  227 Euro
10
Proprietăţile mediei aritmetice:
1) x min  x  x max
150  227  294 (A)
 x i 
10
2) x 0
i 1
(150 - 227) + (175 - 227) + … + (294 - 227) = 0 (A)
n
3)  xi nx
i 1
10
 xi  10  x  2270  10  227 (A)
i 1
n

4)
  xi  a
x '  i 1 xa a0
n
Fie a = 5 (ales arbitrar)
10
 xi  5
i 1 (150  5)  (175  5)  ...  (294  5)
x'  
10 10 (A)
2220
  222  x  5  227  5
10
n  xi 
5)
 
i 1 h  x
x'   h   0, 1
n n
Pentru h = 2 (ales arbitrar) avem:
150 175 294
  ... 
x'  2 2 2  1135  113,5  227  x (A)
10 10 2 2

b) Indicatorii medii de poziţie sunt: mediana, decile, quartile, centile şi modul.


Mediana
Pentru calculul medianei valorile xi trebuie ordonate crescător. (sunt, din ipoteză)
Seria are număr par de termeni (10 termeni), deci mediana este media aritmetică a celor doi
termeni centrali:
235  240
Me   237,5 Euro
2
Deci, în 50% din conturi sunt mai puţin de 237,5 Euro, iar în 50% din conturi sunt peste
237,5 Euro.
Quartila 1:
- se determină locul quartilei 1:
n  1 11
L Q1 :   2,75 deci Q1 va fi media aritmetică simplă a termenilor 2 şi 3
4 4
x  x 3 175  195
Q1  2   185 Euro
2 2
În 25% din conturi sunt sub 185 Euro, iar în 75% din conturi sunt peste 185 Euro.
Quartila 2 = Me
Quartila 3:
- se determină locul quartilei 3:
3 33
L Q3 : ( n  1)   8,25 deci Q3 se găseşte între termenii 8 şi 9.
4 4
x  x 9 256  275
Q3  8   265,5 Euro
2 2
În 75% din conturi sunt sub 265,5 Euro, iar în 25% din conturi sunt peste 265,5 Euro.
Decila 1:
- se determină locul decilei 1:
1 11
L D1 : (n  1)   1,1 deci D1 se află între primul şi al doilea termen
10 10
x  x 2 150  175 325
D1  1    162,5 Euro
2 2 2
În 10% din conturi sunt sub 162,5 Euro, iar în 90% din conturi sunt peste 162,5 Euro.
Celelalte decile se calculează în mod analog.
Modul este valoarea cea
Analiza mai des
statistică întâlnită.
a seriilor Fiind serie simplă şi neavând date care să se
de distribuţie
repete, seria nu are mod.
c) Gradul de omogenitate al seriei se apreciază ci coeficienţii de variaţie (v, v’).
 45,68
v  100   100  20,12%
x 227
d 37,6
v'   100   100  16,56%
x 227
2
   2086,889  45,68

 x i x 
10 2

 2  i 1  2086,889
10
Deoarece v, v’  35%, apreciem că seria este omogenă, variaţia este mică, media este
reprezentativă.
d) În acest caz, variaţia nefiind continuă se poate utiliza un grafic prin coloane:

Scara de reprezentare:
1 cm OY = 20 Euro

Rezultatele obţinute cu ajutorul programului EXCEL sunt:

Număr operaţiuni
MEAN 227
STANDARD ERROR 14,446
MEDIAN 237,5
MODE
STANDARD DEVIATION 45,68248
SAMPLE VARIANCE 2086,889
KURTOSIS -0,80501
SKEWNESS -0,28987
RANGE 144
MINIMUM 150
MAXIMUM 294
SUM 2270
COUNT 10
2. Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă
dintr-un an se prezintă astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariaţi 2 6 10 15 8 5 4

Se cere:
a) să se reprezinte grafic seria;
b) să se calculeze indicatorii tendinţei centrale;
c) să se calculeze indicatorii sintetici ai variaţiei;
d) să se caracterizeze gradul de asimetrie;
e) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile
de concediu mai mare sau egal cu 17”.

Rezolvare:
Notăm cu: xi = numărul zilelor de concediu
ni = numărul de salariaţi (frecvenţele absolute)
a) Seria se reprezintă grafic prin diagrama prin bastoane sau diagrama prin coloane nelipite
centrate pe variante:

Analiza statistică a seriilor de distribuţie


Scara de reprezentare: 1 cm OX = 1 zi; 1 cm OY = 2 salariaţi

b) Indicatorii tendinţei centrale sunt:


b1) Media – se calculează ca o medie aritmetică ponderată:
7
 xini
14  2  15  6  16  10  17  15  18  8  19  5  20  4
x  i1  
7 50
 ni
i 1
852
  17,04 zile concediu
50
b2) Mediana (valoarea centrală a seriei)
1 7 1
L Me : (  n i  1)   51  25,5  33  Me  17 zile
2 i 1 2
Se cumulează crescător frecvenţele absolute (ni):
ni cumulate
xi ni
crescător
14 2 2
15 6 8
16 10 18
17 15 33
18 8 41
19 5 46
20 4 50

Deci 50% dintre salariaţi au avut sub 17 zile concediu, iar 50%, peste 17 zile.
b3) Qurtilele:
1
L Q1 :   n i  1  1  51  12,75  Q1  16 zile
4 4
Deci 25% dintre salariaţi au avut sub 16 zile concediu, iar 75% peste 16 zile.
Q2 = Me
3 3
L Q3 : ( n i  1)   51  38,25  41  Q 3  18 zile
4 4
Deci, 75% dintre salariaţi au avut sub 18 zile concediu, iar 25% peste 18 zile.
b4) Decilele:
1 51
L D1 : ( n i  1)   5,1  8  D i  15 zile
10 10
Deci, 10% dintre salariaţi au avut sub 15 zile concediu, iar 90% peste 15 zile.
Restul decilelor, D2, …, D9 se calculează în mod similar.
b5) Modul (dominanta unei serii)
Modul este, în cazul grupării pe variante, acea valoare a caracteristicii căreia îi corespunde
frecvenţa absolută maximă. Frecvenţa absolută (ni) maximă este 15  Mo = 17 zile. Cei mai
mulţi salariaţi au avut 17 zile de concediu.
c) Indicatorii sintetici ai variaţiei sunt:
- abaterea medie liniară:
7
 xi  x  ni
14  17,04  2  15  17,04  6  16  17,04  10
i 1
d  
7 50
 ni
i 1
17  17,04  15  18  17,04  8  19  17,04  5  20  17,04  4
 
50
58,64
  1,1728 zile
50
Numărul de zile de concediu a unui salariat se abate în medie de la numărul mediu de zile
de concediu cu  1,1728 zile.
- dispersia:
 x i  x
7 2
 ni
2
  i 1

14  17,04 2  2  15  17,04 2  6 
7 50
 ni
i 1


16  17,04 2  10  17  17,04 2  15  18  17,04 2  8 
50


19  17,04 2
 5   20  17,04 2  4 115,92
  2,3184
50 50
- abaterea medie pătratică:
 2  2,3184  1,5226 zile
Numărul de zile de concediu a unui salariat se abate în medie de la numărul mediu de zile
de concediu cu  1,5226 zile.
- coeficientul de variaţie:
 1,5226
v  100   100  8,93%
x 17,04
d 1,1728
v'   100   100  6,88%
x 17,04
Deoarece v, v’ Analiza
35% statistică
seria este omogenă,
a seriilor variaţia este mică, media este reprezentativă.
de distribuţie

d) Aprecierea asimetriei:
x  Mo 17,04  17
Cas    0,026
 1,5226
Deoarece Cas  0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se găsesc
în stânga mediei pe grafic, deci în această serie predomină valorile mici ale caracteristicii.
Cas  [-0,3; 0,3]  seria este uşor asimetrică (Cas este foarte apropiat de zero).
e) Avem o caracteristică alternativă:
- salariaţi care au avut un concediu  17 zile;
- salariaţi care au avut un concediu  17 zile.

Frecvenţele absolute
Varianta xi
ni
DA (peste 17 zile) 1 m = 32
NU (sub 17 zile) 0 n – m = 18
Total - n = 50

Media caracteristicii alternative:


m 32
w   0,64 
n 50
64% dintre salariaţi au avut un concediu  17 zile
Dispersia caracteristicii alternative:
 2w  w (1  w )  0,64  (1  0,64)  0,2304

3. Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un
magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:
Calorii 75-85 85-95 95-105 105-115 115-125
Nr. cutii cu
5 10 15 14 6
brânză topită

Se cere:
a) să se reprezinte grafic seria;
b) să se calculeze indicatorii tendinţei centrale;
c) să se aprecieze omogenitatea seriei;
d) să se caracterizeze gradul de asimetrie;
e) să se calculeze media şi dispersia caracteristicii “cutii de brânză care au sub 95 de
calorii”.

Rezolvare:
Se observă că avem o serie de repartiţie de frecvenţă pe intervale egale.
Notăm cu: xi = numărul de calorii
ni = numărul de cutii de brânză topită
a) Seria se reprezintă grafic prin:
- histogramă;
- poligonul frecvenţelor;
- ogivă.
Histograma:
Poligonul frecvenţelor:
- pe axa OX se reprezintă caloriile
- pe axa OY se reprezintă numărul de cutii

Scara de reprezentare: 1 cm OX = 10 calorii


1 cm OY = 5 cutii
Ogiva (diagrama frecvenţelor cumulate):
Pentru a construi ogiva trebuie să calculăm frecvenţele cumulate crescător şi descrescător:
Calorii Nr. cutii Număr cutii cumulate
xi ni crescător descrescător
75-85 5 5 50
85-95 10 15 45
95-105 15 30 35
105-115 14 44 20
115-125 6 50 6
Total 50 - -

- pe axa OX se reprezintă caloriile (xi)


- pe axa OY se reprezintă
Analiza statistică afrecvenţele absolute cumulate
seriilor de distribuţie

ogiva
crescătoare

ogiva
descrescătoare

Scara de reprezentare: 1 cm pe OX = 10 calorii


1 cm pe OY = 10 cutii

b) Indicatorii tendinţei centrale sunt:


b1) Media – se calculează ca o medie aritmetică ponderată
xi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita inferioară şi
limita superioară a fiecărui interval:
5
 xini
80  5  90  10  100  15  110  14  120  6 5060
x  i 1    101,2 calorii
5 50 50
 ni
i 1
b2) Mediana (valoarea centrală a seriei):
1 5 1
L Me : (  n i  1)   51  25,5  30  Me   95, 105
2 i 1 2
Se cumulează frecvenţele absolute şi se determină care frecvenţă absolută este imediat mai
mare sau egală cu LMe. Intervalul care corespunde frecvenţei absolute cumulate ce îndeplineşte
condiţia de mai sus este intervalul median.
Me se calculează cu relaţia:
L Me  n pMe 25,5  15
Me  x 0  h   95  10   102 calorii
n Me 15
x0 = limita inferioară a intervalului median;
h = mărimea intervalului;
npMe = suma frecvenţelor absolute până la intervalul median;
nMe = frecvenţa absolută a intervalului median.
Deoarece Me = 102 calorii  50% din cutii au sub 102 calorii, iar 50% au peste 102
calorii.

b3) Quartilele:
1
L Q1 :   n i  1  1  51  12,75  15  Q1  85, 95
4 4
L Q1  n pQ1 12,75  5
Q1  x 0  h   85  10   92,75 calorii
n Q1 10
n pQ1 = suma frecvenţelor absolute până la intervalul lui Q1;
n Q1 = frecvenţa absolută a intervalului în care se găseşte Q1.
Deoarece Q1 = 92,75 calorii  25% dintre cutii au sub 92,75 calorii, iar 75% dintre cutii
au peste 92,75 calorii.
3
L Q3 :   n i  1  3  51  38,25  44  Q 3  105, 115 
4 4
L Q3  n pQ3 38,25  30
Q3  x 0  h   105  10   110,89 calorii
n Q3 14
Deci 75% dintre cutii au sub 110,89 calorii, iar 25% au peste 110,89 calorii.
b4) Decilele:
1
L D1 :   n i  1  1  51  5,1  15  D1  85, 95
10 10
L D1  n pD1 5,1  5
D1  x 0  h   85  10   85,1 calorii
n D1 10
Deci 10% dintre cutii au sub 85,1 calorii, iar 90% peste 85,1 calorii.
Celelalte decile: D2, …, D9 se calculează pe baza aceluiaşi procedeu.
b5) Modul (dominanta seriei):
1 15  10
Mo  x 0  h   95  10   103,33 calorii
1   2 (15  10)  (15  14)
x0 = limita inferioară a intervalului modal;
h = mărimea intervalului modal;
1 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a
intervalului anterior celui modal;
2 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a
intervalului următor celui modal.
Intervalul modal este intervalul căruia îi corespunde frecvenţa absolută maximă. Deci Mo
 [95, 105].
Deoarece Mo = 103,33 calorii, rezultă că cele mai multe dintre cutii au 103,33 calorii.
c) Omogenitatea seriei se apreciază cu ajutorul coeficientului de variaţie:
 11,6
v  100   100  11,46%
x 101,2
Analiza statistică a seriilor de distribuţie

 2  134,56  11,6 calorii

 x i  x
5 2
 ni
2 i 1 6728
    134,56
5 50
 ni
i 1
Deoarece v  35%  seria este omogenă, variaţia este mică, media este reprezentativă.
d) Gradul de asimetrie:
x  Mo 101,2  103,33
Cas    0,18
 11,6
Deoarece Cas  0  seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic
mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de brânză
cu multe calorii.
Cas  [-0,3; 0,3]  seria este uşor asimetrică.
e) Avem o caracteristică alternativă:
- cutii care au sub 95 calorii;
- cutii care au peste 95 calorii.
Frecvenţele absolute
Varianta xi
ni
DA (sub 95 calorii) 1 m = 15
NU (peste 95 calorii) 0 n – m = 35
Total - n = 50

Media caracteristicii alternative:


m 15
w   0,3 
n 50
30% dintre cutii au sub 95 calorii.
Dispersia caracteristicii alternative:
 2w  w (1  w )  0,3  (1  0,3)  0,21

4. Despre 100 de salariaţi ai unui hipermarket se cunosc următoarele date:

Grupe de salariaţi Grupe de salariaţi după salariul obţinut în luna


după vechime august 2007 (RON) Total
(ani) 400-600 600-800 800-1000 1000-1200 1200-1400
sub 10 10 25 20 - - 55
peste 10 - 5 20 15 5 45
Total 10 30 40 15 5 100

Se cere:
a) să se calculeze mediile pe fiecare grupă de vechime şi pe total;
b) să se verifice regula de adunare a dispersiilor;
c) să se verifice dacă factorul de grupare “vechimea în muncă” este semnificativ;
d) să se caracterizeze gradul de omogenitate pe fiecare grupă de vechime şi pe total;
e) să se verifice regula de adunare a dispersiilor pentru caracteristica “salariaţi cu salariul
peste 800 RON”.

Rezolvare:
Notăm cu:
xi = vechimea i  1,2 ;
yj = salariul j  1,5 ;
ni = numărul de salariaţi din grupa de vechime i;
nj = număr de salariaţi din grupa de salarii j;
nij = număr de salariaţi din grupa de vechime i şi având salariul în grupa j.
a) Calculul mediilor pe fiecare grupă de vechime:
5
 y j  n ij
j1
yi 
5
 n ij
j1
Pentru prima grupă de vechime: i = 1:
5
 y j  n1j
j1 500  10  700  25  900  20
y1    736,36 RON / salariat
5 55
 n1j
j1
Pentru a doua grupă de vechime: i = 2:
5
 y j  n2j
j1 700  5  900  20  1100  15  1300  5
y2   
5 45
 n2j
j1
 988,88 RON / salariat
Calculul mediei (salariului mediu) pe total:
Analiza statistică a seriilor de distribuţie

5
yj nj
j1 500  10  700  30  900  40  1100  15  1300  5
y  
5 45
n j
j1
 850 RON / salariat

2
yj nj
j1 736,36  55  988,88  45
y   850 RON / salariat
2 100
nj
j1
b) Calculul dispersiilor pe fiecare grupă de vechime:
 y j  yi 
5 2
 n ij
j1
 i2 
5
 n ij
j1
Pentru prima grupă de vechime: i = 1:
  y j  y1 
5 2
 n1 j
12 
j1

 500  736,36 2  10   700  736,36 2  25 
5 55
 n1j
j1


 900  736,36 2  20  20495,87
55
Pentru a doua grupă de vechime: i = 2:
 y j  y2 
5 2
 n2j
 22 
j1

 700  988,88 2  5   900  988,88 2  20 
5 45
 n2j
j1


1100  988,88 2  15  1300  988,88 2  5  27654,32
45
Media dispersiilor de grupă:
2
  i2  n i
2 20495,87  55  27654,32  45
  i 1   23717,17
2 100
 ni
i 1

Dispersia dintre grupe:

  y i  y
2 2
 ni
2
  i 1

 736,36  850 2  55   988,88  850 2  45
 15782,17
2 100
 ni
i 1
Dispersia totală:
  y j  y
5 2
nj
2
 
j1

 500  850 2  10   700  850 2  30 
5 100
nj
j1

 900  850 2  40  1100  850 2  15  1300  850 2  5  39499,34


100
Regula de adunare a dispersiilor:
2
2    2
c) Aprecierea dacă factorul de grupare este semnificativ se face cu ajutorul gradului de
determinaţie:
2 15782,17
R 2y / x   100   100  39,95%
2 39499,34

Deoarece R2
y / x  39,95%  50% putem aprecia că factorul de grupare “vechimea în
muncă” nu este semnificativ, el influenţând doar în proporţie de 39,95% variaţia salariului, restul
de 60,05% reprezentând influenţa altor factori asupra variaţiei salariului.
d) Aprecierea gradului de omogenitate se face cu ajutorul coeficientului de variaţie:
- coeficientul de variaţie pe fiecare grupă de vechime:

v i  i  100
yi
1 20495,87 143,16
v1   100   100   100  17,44%
y1 736,36 736,36
2 27654,32 166,29
v2   100   100   100  16,81%
y2 988,88 988,88
- coeficientul de variaţie pe total:
 39499 ,34 a seriilor198,74
v  100Analiza
 statistică  100  de distribuţie
 100  23,38%
y 850 850
Deoarece atât coeficienţii de variaţie pe grupe de vechime (v1, v2) cât şi coeficientul de
variaţie pe total, v, sunt mai mici decât 35%, apreciem că atât fiecare grupă de vechime, cât şi
colectivitatea în ansamblul său sunt omogene.
Deoarece v1, v2  v  fiecare grupă de vechime este mai omogenă decât colectivitatea în
ansamblu.
Grupa a doua de vechime este mai omogenă deoarece are coeficientul de variaţie mai mic.
e) Avem o caracteristică alternativă:
- salariaţi cu salariul peste 800 RON;
- salariaţi cu salariul sub 800 RON.
Media caracteristicii alternative:
- pe fiecare grupă de vechime:
m
wi  i
ni
m1 20
i = 1 : w1    0,3636  36,36% dintre salariaţii din prima grupă de
n 1 55
vechime au salariul peste 800 RON
m 2 20  15  5
i = 2 : w2    0,8888  88,88% dintre salariaţii din a doua grupă de
n2 45
vechime au salariul peste 800 RON
- pe total:
m 40  15  5
w   0,6  60% dintre salariaţi au salariul peste 800 RON
n 100
Dispersiile:
- pe fiecare grupă de vechime:
 2w  w i  1  w i 
i
i=1: 2
w1
 w 1  1  w 1   0,3636  1  0,3636   0,2313

i = 2 :  w 2  w 2  1  w 2   0,8888  1  0,8888  0,0988


2

- media dispersiilor de grupă:


2
  2w i  ni
2 i 1 0,2313  55  0,0988  45
w    0,1716
2 100
 ni
i 1
- dispersia dintre grupe:
2
  w i  w  2 n i
 2w  i1 
 0,3636  0,6 2  55   0,8888  0,6 2  45  0,0684
2 100
 ni
i 1
- dispersia totală:
 2w  w  1  w   0,6  1  0,6   0,24
Regula de adunare a dispersiilor:
2
 2w   w   2w
0,24 = 0,1716 + 0,0684