Documente Academic
Documente Profesional
Documente Cultură
Un agent economic dispune de o retea de unitati economice cu profilul alimentatie publica in care sunt
angajati 500 de vanzatori
Pentru cei 500 de vanzatori , considerati ca o colectivitate generala , s-a intocmit o baza de sondaj (vezi
baza de sondaj din Anexa nr.1) . Inscrierea in baza de sondaj a vanzatorilor s-a facut in ordine alfabetica
, ceea ce constituie un criteriu aleator si li s-a dat un cod (nr.crt.)
REZOLVARE:
500
K= 60
= ~8
Ca prima unitate de esantionare vom utiliza ultimile 2 cifre ale numarului matricol personal
1
Interpretare : Cei 60 de vanzatori extrasi din baza de sondaj ne ofera pentru inceput urmatoarele
informatii : au lucrat in total intr-o luna 1337 de zile. 10280 de ore; realizand o valoare a incasarilor de
896330 Lei. Iar fondul de salariu in aceasta luna pentru cei 60 de vanzatori a fost 173194 lei.
a) calculul amplitudinii absolute devariatiei (A) care exprima imprastierea maxima a valorilor serei.
OBservatie : Daca variatia este foarte mica ( in cazul nostru 𝐴𝑎𝑥 ≤ 10) se va forma o distribuite pe
variante (valabil in cazul caracteristicilor : varsta,zile lucrate).
b)stabilirea in poarametrii intr-un anumit numar de grupe (r) se poate stabili astfel :
-daca variatia caracteristicii este relative uniforma si volumul de unitati nu este sufficient de mare
numarul de grupe se poate fixa anterior (din cerintele proiectului se vor folosi minimul de 8 grupe
pentru interval egale)
- iar daca numarul grupelor nu este anterior cunoscut si volumul unitatilor este sufficient de mare se
recomanda stabilirea grupelor conform relatiei lui Sturgers.
r=1+3,322log n
d)determinarea marimii intervalului de grupare (h) se calculeaza ca raport intre amplitudinea absoluta a
variatiei si numarul de grupe:
𝐴𝑋 𝑋
𝑚𝑎𝑥 −𝑋
𝑚𝑖𝑛
h= 𝑟𝐴 h=1−3,22𝑙𝑜𝑔𝑔 𝑛
Prima grupa se porneste de la 𝑋𝑚𝑖𝑛 adaugandu-se succesiv marimea intervalui de grupare (h) rezultat
din calculul anterior. Valoarea din stanga intervalului va fi considerate ca limita inferioara,iar valoarea
din dreapta ca limita superioara.Valorile care formeaza limitele inrvalelor se inregistreaza fie numai ca
limita superioara fie ca limita inferioara pentru a evita inregistrari duble a caracteristicilor.
2
Astfel obtinem o distributie pe 9 variante (19,20,…,27)
Centralizarea valorilor dupa va rsta se obtine astfel :
Repartitia vanzatorilor dupa varsta:
Varsta(ani) Nr. Vanzatori Valori centralizate pentru:
Nr.vanzatori Zile lucrate Ore lucrate
19 1 18 150
20 3 67 524
21 14 297 2414
22 10 197 1633
23 12 252 2111
24 2 41 334
25 10 228 1793
26 6 126 990
27 2 41 331
Total 60 1267 10280
vanzatori
14
12
10
vanzatori
6
0
19 20 21 22 23 24 25 26 27
3
Varsta Frecventa Frecvente cumulate
crescator Descrescator
19 1 1 60
20 3 4 59
21 14 18 56
22 10 28 42
23 12 40 32
24 2 42 20
25 10 52 18
26 6 58 8
27 2 60 2
TOTAL 60 - -
60
50
40
30 CRESCATOR
DESCRESCATOR
20
10
0
19 20 21 22 23 24 25 26 27
4
Zile lucrate Nr. Vanzatori Ore lucrate
17 7 991
18 5 765
19 3 453
20 2 316
21 11 1921
22 10 1790
23 19 3449
24 3 595
Total 60 10280
20 SERIES 1
19
18 Series 1
16
14
12
11
10 10
8
7
6
5
4 4
3
2 2
0
17 18 19 20 21 22 23 24
5
Zile lucrate Nr. Vanzatori Frecvente cumulate
Crescator descrescator
17 7 7 60
18 5 12 53
19 3 15 48
20 2 17 45
21 11 28 43
22 10 38 32
23 19 57 22
24 3 60 3
Total 60 - -
Chart Title
70
60
50
40
30
20
10
0
17 18 19 20 21 22 23 24
crecator descrescator
6
2C.Gruparea pe interval egale a vanzatorilor dupa ore lucrate.
𝐴𝑥 76
c)Marimea intervalului h= 𝑑𝐴 = 8 =9,5 ~ `0
[135-145) 6
[145-155) 10
[155-165) 1
[165-175) 11
[175-185) 23
[185-195) 6
[195-205) 2
[205-215] 1
Total 60
Reprezentarea grafica a repartitiei vanzatorilor dupa numarul de ore lucrate , se poate ilustra prin
histograma , poligonul frecventelor si prin curba cumulative a frecventelor pentru construirea careia
este necesar calculul in prealabil al frecventelor cumulate crescator si descrescator determinate in
Tabelul 7.9
Grupe ore
25
20
15
Grupe ore
10
0
135 145 155 165 175 185 195 205
7
Grupe dupa nr. ore Frecventa Frecvente cumulate
lucrate crescator descrescator
135-145 6 6 60
145-155 10 16 54
155-165 1 17 44
165-175 11 28 43
175-185 23 51 32
185-195 6 57 9
195-205 2 59 3
205-215 1 60 1
60 - -
70
60
50
40
crescator
30 descrescator
20
10
0
140 150 160 170 180 190 200 210
Gruparea pe interval egale ne-a permis structurarea colectivitaii pe grupe cat mai omogene. De
asemenea , dupa cum s-a observant gruparea statistica este cea mai semnificativa modalitate a
sistematizarii datelor dupa o caracteristica numerica sau nominative.
Sistematizarea datelor printr-o grupare pe interval egale raspunde in primul rand necesitatii de
sistematizare si omogenizare a datelor unei observatii statistice de masa si a caracterizarii independente
a fiecarei variabile din propria observare.
Pentru analiza structurii colectivitatii pe grupe tipice se foloseste gruparea pe interval neegale.
8
Un prim principiu al gruparii pe interval neeglae este trecerea de la variatia liniara (interval de marime
constanta) la variatia neuniforma a unor interval de grupare din ce in ce mai mari.De exemplu , de la 8
grupe se poate trece la 5 grupe. Analizand situatia concreta se pot pastra primele 3 grupe , grupa a patra
se obtine cumuland-o cu grupa a cincia , iar ultimile trei grupe se pot cupla. In cazul acesta se poate
trece de la grupe pe fariante la grupe pe interval.
Un alt principiu de grupare are in vedere separarea unitatilor pe trei grupe : mici, mijlocii si mari , se
porneste de la nivelul mediu al caracteristicii , care se calculeaza ca o medie aritmetica simpla sau
ponderata pentru fiecare variabila in parte :
∑𝑛
𝑖=1 𝑋𝑖
∑𝑛
𝑖=1 𝑋𝑖 𝑛1
X= 𝑛
sau x= ∑𝑛
𝑖=1 𝑛1
Unde: 𝑥𝑖 -variabila
n- numarul unitatilor inregistrate (in cazul nostrum n=60 sau daca nu avem datele initiale folosim
media seriei in care 𝑥𝑖 , sunt valorile sau centrele de interval si cu frecventele seriei)
- In grupa a II-a sunt cuprinse grupa care contine nivelul mediu al variabilei si intervalele invecinate cu
avesta;
-grupa I-a este formata limita inferioara a primului interval si limita inferioara a intervalului II, iar
-a III-a grupa intre limita superioara a intervalului II si limita superioara a ultimului interval de grupare.
Nivelul mediu
∑𝑛
𝑖=1 𝑥𝑖 1267
X= 𝑛
= 60 =21 ani/vanz.
9
2.2B Gruparea pe interval neegale a vanzatorilor dupa zilele lucrate
∑𝑛
𝑖=1 𝑥𝑖 1267
Nivelul mediu x= 𝑛
= 60 =21,11 zile/vanz
[20-22) 13 2237
[22-24] 32 5843
Total 60 10280
∑𝑛
𝑖=1 𝑥𝑖 10280
Nivelul mediu x= 𝑛
= 60 =171,33 ore/vanz
185-215 9 204
Total 60 1267
10
2.3 Grupe vanzatorilor dupa sex (dupa o variabila numerica)
Grupe dupa sex Nr. vanzatori Varsta (ani) Zile lucrate Ore Lucrate
𝑛𝑖
𝑛𝑖∗ (%)= *100
∑𝑘
𝑖=1 𝑛𝑖
Sales
43.7
66.3 Masculin
Feminin
11
Caracterizarea statistica a repartitiilor obtinute,
Mediana (Me)
∑𝑘
𝑖=1 𝑛1+1 − ∑𝑛=1 𝑛
2 𝑖=1 1
Me=𝑥0 + h *
𝑛1
∑𝑘
𝑖=1 |𝑥1 −ẍ|𝑛
d=
∑𝑘
𝑖=1 𝑛1
Dispersia 𝑐 2
∑𝑘 2
𝑖=1(𝑥1 −ẍ) 𝑛
𝜎2 =
∑𝑘
𝑖=1 𝑛1
𝜎 = √𝜎 2
12
Coeficientul de asimetrie
ẍ−𝑀𝑜 3(ẍ−𝑀𝑒)
𝐶𝑎𝑠 = sau 𝐶𝑎𝑠 =
𝑐 𝑐
- Media aritmetica
∑𝑘
𝑖=1 𝑥𝑖 𝑛𝑖 1377
X= = =22,95 ani/vanz
∑𝑘
𝑖=1 𝑛𝑖 60
Mo = 23 ani /vanz
∑𝑘
𝑖=1 𝑛𝑖 +1 60+1
Locul medianei : U(Me) = 2
= 2
= 30,5
Variabila 23 ani este prima frecventa cumulata crescator si este mai mare de 30,5
Me = 23 ani /vanz
13
Abaterea medie liniara (d) :
∑𝑘
𝑖=1 |𝑥𝑖 −ẍ|𝑛𝑖 116,8
D= = = 1,94 ani / vanz
∑𝑘
𝑖=1 𝑛𝑖 60
Dispersia 𝐶 2
∑𝑘 2
𝑖=1(𝑥𝑖 −ẍ) 𝑛𝑖 236,84
𝜎 2= = =3,94
∑𝑘
𝑖=1 𝑛𝑖 60
𝑐 1,98
Sau V=ẍ*100 =22,95*100 = 8,6%
Coeficientul de asimetrie
ẍ−𝑀𝑝 22,95−23
𝐶𝑎𝑠 = 𝜎
= 1,98
= -0,025
3(ẍ−𝑀𝑒) 3(22,95−23)
Sau 𝐶′𝑎𝑠 = 𝜎
= 1,98
= -0,07
14
(zilelucrate– 21,1) * nr vanza
- Media aritmetica
∑𝑘
𝑖=1 𝑥𝑖 𝑛𝑖 1266
ẍ= = =22,95 zile /vanz
∑𝑘
𝑖=1 𝑛𝑖 60
Mo = 23 ani /vanz
∑𝑘
𝑖=1 𝑛𝑖 +1 60+1
Locul medianei : U(Me) = 2
= 2
= 30,5
Variabila 23 ani este prima frecventa cumulata crescator si este mai mare de 30,5
Me = 23 ani /vanz
∑𝑘
𝑖=1 |𝑥𝑖 −ẍ|𝑛𝑖 107,6
D= = = 1,79 zile / vanz
∑𝑘
𝑖=1 𝑛𝑖 60
15
Dispersia 𝐶 2
∑𝑘 2
𝑖=1(𝑥𝑖 −ẍ) 𝑛𝑖 283,4
𝜎 2= = =4,72
∑𝑘
𝑖=1 𝑛𝑖 60
𝑐 2,17
Sau V=ẍ*100 =22,95*100 = 9,4%
Coeficientul de asimetrie
ẍ−𝑀𝑝 22,95−23
𝐶𝑎𝑠 = 𝜎
= 2,17
= -0,023
3(ẍ−𝑀𝑒) 3(22,95−23)
Sau 𝐶′𝑎𝑠 = 𝜎
= 2,17
= -0,06
Se aplica pentru primele 10 unitati din esantion , privind numarul de ore lucrate (𝑥𝑖 ) si salariu brut
lunar (𝑦𝑖 ) – lei. Seria se va ordona crescator dupa numarul de ore lucrate (𝑥𝑖 ) mentinandu-sa salariul
brut lunar (𝑦𝑖 ) corespunzator.
16
A) Metoda seriilor paralele interdependente
Concluzie : valorile(𝑥𝑖 ) fiind ordonate crescator se poate observa ca si valorile 𝑦𝑖 cresc in cea mai
mare parte , ceea ce sugereaza o legatura directa.
Series 1
4000
3500
3000
2500
2000
Series 1
1500
1000
500
0
147 151 153 176 178 183 184 184 187 211
17
Graficul de asemenea confirma o legatura directa de forma liniara .
Metoda grafica este utilizata cu bune reultate pentru alegerea functiei analitice care se studiaza ( y =
19876x-425,62 in cazul regresiei si ccorelatiei)
Metoda regresiei constituie o metoda statistica analitica de cercetare a legaturii dintre variabile cu
ajutorul unor functii denumite functii de regresie.
In cazul de fata am apelat la modellul de regresie unifactoriala linear considerand legatura dintre y si
x de tipul 𝑦𝑥𝑖 = a + b𝑥𝑖 . Parametri ecuatiei in acest caz se determina prin rezolvarea urmatorului
𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
system de ecuatii : {
𝑎 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖
∑
𝑛 ∑ 𝑦𝑖
| |
∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖 640222
b= 𝑛 ∑ 𝑥 = 𝑛 ∑ 𝑥 2 −(∑ 𝑥 )2 = 35184
=18,19
𝑖 𝑖 𝑖
| |
∑ 𝑥𝑖 ∑ 𝑥𝑖2
18
Valorile functiei de regresie se obtin inlocuind 𝑥𝑖 cu valorile empirice.
(∑ 𝑦𝑖 −𝑌𝑥𝑖 )^(2) ∑ 𝑦𝑖
R y/x = √1 − (∑ 𝑦𝑖 −ŷ)^(2)
ŷ= 𝑛
Se poate spune ca legatura ester stransa (R y/x = 0.9968) si gradul de determinati R2 y/x = 0.99682
este de 0,993 sau de 99,3 %
b)Metoda coeficientului de corelatie
Intensitatea legaturii se masoara prin coeficientul de corelatie (r y/x)
𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖
ry/x= 2
√[𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖2 ) ]∗[𝑛 ∑ 𝑦𝑖2 −(∑ 𝑦𝑖 )^(2)
19