Sunteți pe pagina 1din 22

PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Cuprins
0 TEMA PROIECTULUI........................................................................................................................3

1 EXTRAGEREA EŞANTIONULUI...................................................................................................4

1.1 Gruparea datelor înregistrate........................................................................................................5


1.1.1 Gruparea pe intervale de variaţie egale......................................................................................5
1.1.2 Gruparea pe intervale de variaţie neegale................................................................................10

2 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ.......................................................14

3 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR OBŢINUTE....................................17

3.1 Repartiţia vânzătorilor după vârstă............................................................................................18

3.2 Repartiţia vânzătorilor după zilele lucrate.................................................................................19

3.3 Repartiţia vânzătorilor după orele lucrate..................................................................................20

3.4 Repartiţia vânzătorilor după valoarea desfacerii (lei)................................................................21

3.5 Repartiţia vânzătorilor după salariu net (lei).............................................................................22

4 APLICAREA REGULII DE ADUNARE A DISPERSIILOR ŞI VERIFICAREA GRADULUI


DE SEMNIFICAŢIE A FACTORULUI DE GRUPARE......................................................................25

5 ESTIMAREA LIMITELOR PENTRU MEDIA COLECTIVITĂŢII TOTALE ŞI PENTRU


NIVELUL TOTALIZAT AL CARACTERISTICII..............................................................................27

5.1 Estimări pentru repartiţia vânzătorilor după valoarea desfacerilor.........................................27

5.2 Estimări pentru repartiţia vânzătorilor după salariul net lunar...............................................28

6 ANALIZA CORELAŢIEI DINTRE VALOAREA DESFACERII ŞI SALARIU........................29

6.1 Corelaţia liniară simplă (date negrupate)...................................................................................29

6.2 Metoda coeficientului de corelaţie...............................................................................................31

7 BIBLIOGRAFIE................................................................................................................................32

1
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

0 TEMA PROIECTULUI

Un agent economic dispune de o reţea de unităţi economice cu profilul alimentaţie


publică în care sunt angajaţi 500 de vânzători.
Pentru cei 500 de vânzători, consideraţi ca o colectivitate generală, s-a întocmit o bază de
sondaj. Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce
constituie un criteriu aleator şi li s-a dat un cod (nr. crt.).
Considerând cei 500 de vânzători ca formând o colectivitate statistică se cere:
1. să se extragă printr-un procedeu de sondaj un eşantion de 60 de unităţi şi să se centralizeze
nivelurile individuale ale fiecăruia din variabilele prezentate potrivit conţinutului lor;
2. să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate
caracteristicile înregistrate pe intervale egale şi neegale (se vor folosi minim 8 grupe pentru
intervale egale şi minim 3 grupe pentru intervale neegale) şi să se centralizeze datele
condiţionate de grupările folosite. Să se reprezinte grafic seriile obţinute,
3. să se calculeze toate mărimile relative posibile şi să se reprezinte grafic mărimile obţinute
folosind diagramele adecvate;
4. să se calculeze indicatorii tendinţei centrale, indicatorii variaţiei şi ai asimetriei pentru
variabilele înregistrate;
5. să se aplice regula adunării dispersiilor pentru tabelul cu dublă intrare obţinut prin gruparea
combinată;
6. să se extindă rezultatele obţinute asupra întregii colectivităţi pentru două variabile dacă P =
0,9973 (z = 3);
7. să se aplice metoda corelaţiei şi regresiei pentru datele din eşantion. Să se măsoare gradul de
intensitate al corelaţiei. Pentru date grupate se vor lua în calcul primele 10 unităţi din
eşantion, la care se vor calcula şi coeficienţii de corelaţie a rangurilor.

2
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

1 EXTRAGEREA EŞANTIONULUI
1. Din baza de sondaj se extrage un eşantion format din 60 de vânzători. La extragere s-a folosit
N 500
procedeul selecţiei mecanice cu pas de numărare egal cu 8   8  şi prima unitate
n 60
extrasă.
S-au înregistrat datele privind sexul, vârsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor
lunare (lei) şi salariul net lunar (lei) din luna februarie 2009.

Nr. crt. Sex Vârsta Zile Ore Valoarea Salariul net lunar
(ani) lucrate lucrate desfacerilor (lei) (lei)
1. F 24 23 193 155250 1689
2. F 26 23 180 172500 1575
3. M 21 21 184 141750 1610
4. M 23 22 176 156200 1540
5. M 23 18 142 118800 1243
6. M 21 22 181 173800 1584
7. M 21 23 185 181700 1619
8. F 19 18 150 134100 1313
9. F 22 21 190 156450 1663
10. F 27 21 168 147000 1470
11. M 22 24 211 189600 1846
12. F 24 23 188 184800 1504
13. F 24 21 175 147600 1531
14. F 22 22 169 162800 1479
15. F 24 23 193 155250 1689
16. M 24 22 179 163900 1566
17. F 23 22 176 160600 1540
18. F 24 23 188 184800 1504
19. M 24 18 141 131400 1234
20. F 23 22 176 160600 1540
21. F 23 24 183 168000 1601
22. M 23 18 166 125100 1453
23. F 21 21 170 168000 1488
24. M 25 21 173 155400 1514
25. F 23 21 174 117600 1392
26. F 21 24 184 165900 1472
27. F 24 23 188 184800 1504
28. M 21 23 185 181700 1619
29. F 19 19 158 148200 1383
30. F 22 22 169 162800 1479
31. F 20 23 170 184000 1488
32. M 23 18 142 118800 1243
3
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

33. F 19 18 146 144000 1278


34. F 20 19 166 125400 1453
35. F 25 23 178 181700 1558
36. F 22 21 190 156450 1663
37. M 24 22 179 163900 1566
38. F 22 21 190 156450 1663
39. F 20 19 166 125400 1453
40. F 22 22 169 162800 1479
41. M 24 18 141 131400 1234
42. M 24 22 179 163900 1566
43. M 21 22 181 173800 1584
44. F 20 19 165 152000 1444
45. M 25 21 173 155400 1514
46. F 20 23 170 184000 1488
47. M 23 18 166 125100 1453
48. F 22 21 190 156450 1663
49. F 22 22 169 162800 1479
50. F 22 22 169 162800 1479
51. F 22 21 190 156450 1663
52. M 20 24 201 192000 1759
53. M 25 23 184 138000 1610
54. F 26 23 180 172500 1575
55. M 21 22 179 160600 1566
56. F 25 23 178 181700 1558
57. F 23 22 182 171600 1593
58. M 25 23 184 138000 1610
59. F 20 20 165 151500 1444
60. F 25 23 178 181700 1558
Total 1355 1286 10515 9487000 91328

Interpretare.....

1.1 Gruparea datelor înregistrate

1.1.1 Gruparea pe intervale de variaţie egale


1. Gruparea datelor înregistrate
1.1. Gruparea pe intervale de variaţie egale
Gruparea pe intervale egale implică următoarele etape:
a) calculul amplitudinii absolute de variaţiei (A) care exprimă împrăştierea maximă a
valorilor serei.
Axa = Xmax – Xmin;
Dacă variaţia este foarte mică (în cazul nostru Axa  10) se va forma o distribuţie pe variante
(valabil în cazul caracteristicilor: vârsta; zile lucrate).
b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:

4
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

 dacă variaţia caracteristicii este relativ uniformă şi volumul de unităţi nu este suficient de
mare numărul de grupe se poate fixa anterior (din cerinţele proiectului se vor folosi
minimul 8 grupe pentru intervale egale);
 iar dacă numărul grupelor nu este anterior cunoscut şi volumul unităţilor este suficient de
mare se recomandă stabilirea grupelor conform relaţiei lui Sturgers,
r = 1+3,322log n
unde: n - nr. caracteristicilor.
c)determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea
absolută a variaţiei şi numărul de grupe:
Ax xmax  xmin
h  a sau h 
r 1  3,322 log n
Notă: Mărimea intervalului (h) se rotunjeşte la întreg în plus (ex.3,254)
Prima grupă se porneşte de la xmin adăugându-se succesiv mărimea intervalului de grupare
(h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită
inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele
intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita
înregistrări duble a caracteristicilor.
Analog se rezolvă pentru orice variabilă.

2A. Gruparea pe intervale egale a vânzătorilor după vârstă


a) Amplitudinea variaţiei Axa = Xmax – Xmin =

Repartiţia vânzătorilor după vârstă


Vârsta Nr. Valori centralizate pentru
(ani) vânzatori Zile Ore Valoarea Fondul de
lucrate lucrate Desfacerilor (lei) salariu lunar (lei)
19 3 55 454 426300 3974
20 7 147 1203 1114300 10529
21 8 178 1449 1347250 12542
22 11 239 2006 1785850 17556
23 10 205 1683 1422400 14598
24 11 238 1944 1767000 16587
25 7 157 1248 1131900 10922
26 2 46 360 345000 3150
27 1 21 168 147000 1470
Total 60 1286 10515 9487000 91328

Reprezentarea grafică a repartiţiei vânzătorilor după vârstă se ilustrează prin poligonul


frecvenţelor şi prin curba cumulativă a frecvenţelor.

5
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Vârsta Frecventa Frecvente cumulate


(ani) crescator descrescator
19 3 3 60
20 7 10 57
21 8 18 50
22 11 29 42
23 10 39 31
24 11 50 21
25 7 57 10
26 2 59 3
27 1 60 1
Total 60

2C. Gruparea pe intervale egale a vânzătorilor după ore lucrate


a) Amplitudinea variaţiei Axa = Xmax -Xmin = 211-141=70
b) Nr. de grupe r = 8
70
c) Mărimea intervalului h = 9
8

Repartiţia vânzătorilor după numărul de ore lucrate


Grupe de Nr. Valori centralizate pentru:
vanzatori dupa vanzatori Zile Valoarea desfacerilor Fondul de
nr. ore lucrate lucrate lunare (lei) salariu
lunar (lei)
141 – 150 6 108 778500 7545
150 – 159 1 19 148200 1383
159 – 168 7 134 951500 10170
168 – 177 15 327 2403400 22430
177 – 186 19 430 3176650 29990
186 – 195 10 220 1647150 16205
195 – 204 1 24 192000 1759
204 – 213 1 24 189600 1846
Total 60 1286 9487000 91328
Nota: Limita superioară este inclusă în interval.

6
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Repartizarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate se ilustrează prin
poligonl frecvenţelor şi prin curba cumulativă a frecvenţelor.

Grupe de vânzători Frecvenţa Frecvenţe cumulate


după nr.ore lucrate crescător descrescător
141 – 150 6 6 60
150 – 159 1 7 54
159 – 168 7 14 53
168 – 177 15 29 46
177 – 186 19 48 31
186 – 195 10 58 12
195 – 204 1 59 2
204 – 213 1 60 1
Total 60

2E. Gruparea pe intervale egale a vânzătorilor după salariul net lunar


a) Amplitudinea variaţiei Axa = Xmax -Xmin = 1846-1234=612
b) Nr. de grupe r = 8
612
c) mărimea intervalului h  77
8
Repartiţia vânzătorilor în funcţie de salariul net lunar (lei)
Grupe de Valori centralizate pentru:
vanzatori dupa Nr. Zile Ore Valoarea desfacerii
salariul net lunar (lei) vanzatori lucrate lucrate lunare (lei)
1234 – 1311 5 90 712 644400
1311 – 1388 2 37 308 282300
1388 – 1465 7 134 1168 922100

7
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

1465 – 1542 19 420 3320 3153100


1542 – 1619 18 406 3259 3010750
1619 – 1696 7 151 1336 1092750
1696 – 1773 1 24 201 192000
1773 – 1850 1 24 211 189600
Total 60 1286 10515 9487000

Notă: Limita superioară inclusă în interval

Centralizarea valorilor după salariul net lunar s-a obţinut la fel ca şi la orele lucrate.
Repartizarea grafică a repartiţiei vânzătorilor după salariul net lunar, se ilustreză prin
poligonul frecvenţelor şi curba cumulativă a frecvenţelor.

Grupe de vânzători după Frecvenţa Frecvenţe cumulate


salariul net lunar crescător descrescător
1234 – 1311 5 5 60
1311 – 1388 2 7 55
1388 – 1465 7 14 53
1465 – 1542 19 33 46
1542 – 1619 18 51 27
1619 – 1696 7 58 9
1696 – 1773 1 59 2
1773 – 1850 1 60 1
Total 60

Gruparea pe intervale egale permite structurarea colectivităţii pe grupe cât mai omogene,
iar gruparea statistică este cea mai semnificativă modalitate a sistemetizării datelor după o
caracteristică numerică sau nominativă.

8
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Sistematizarea datelor printr-o grupare pe intervale egale răspunde necesităţii de


sistematizare şi omogenizare a datelor unei observaţii statistice de masă şi a caracterizării
independente a fiecărei variabile din propria observare.

1.1.2 Gruparea pe intervale de variaţie neegale

Pentru analiza structurii colectivităţii pe grupe tipice se foloseşte gruparea pe intervale


neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
Un prim principiu al grupării pe intervale neegale este trecerea de la variaţia lineară
(interval de mărime constantă) la variaţia neuniformă a unor intervale de grupare din ce în ce mai
mari.
Un alt principiu de grupare are în vedere separarea unităţilor pe trei grupe: mici, mijlocii
şi mari.
2.2.A Gruparea pe intervale neegale a vânzătorilor după vârstă
Nivelul mediu
n

 xi 1355
 23
x i 1
 . 60
n
Grupe de Valori centralizate pentru:
vânz. Zile Ore Valoarea Fondul de
Nr.
după lucrate lucrate desfacerii salariu
vânz. Calificativul
vârstă (lei) (lei)
(ani)
19 – 22 29 619 5112 4673700 44601 Cei mai tineri
22 – 24 21 443 3627 3189400 31185 Tineri
24 – 27 10 224 1776 1623900 15542 Mai puţin tineri
Total 60 1286 10515 9487000 914328

2.2.C. Gruparea pe intervale neegale a vânzătorilor după orele lucrate


n

Nivelul mediu x i 10515


 175
x i 1
 60
n
Grupe de Valori centralizate pentru:
vânzători Nr. Zile Valoarea Fondul de Calificativ
după nr. ore vânz lucrate desfacerii salariu lunar
lucrate (lei) (lei)
141 – 159 7 127 926700 8928 Minimum
159 – 186 41 891 6531550 62590 Mediu
186 – 213 12 268 2028750 19810 Maxim

9
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Total 60 1286 9487000 91328


Notă: Limita superioară inclusă în interval

2.2.E. Gruparea pe intervale neegale a vânzătorilor după salariu net


n

Nivelul mediu x i 91238


 1522
x i 1
 60
n
Grupe de Valori centralizate pentru:
vânzători după Nr. Zile Ore Valoarea Calificativ
salariul net lunar vânz lucrate lucrate desfacerii
(lei) (lei)
1234 – 1465 14 261 2188 1848800 Mic
1465 – 1696 44 977 7915 7256600 Mediu
1696 – 1850 2 48 412 381600 Mare
Total 60 1286 10515 9487000
Notă: Limita superioară inclusă în interval

2.2.F. Gruparea vânzătorilor după sex (gruparea după o variabilă calitativă)


Valoarea Fond salariu net
Grupe Vârsta Zile
Nr. vânz Ore lucrate desfacerii lunar
după sex (ani) lucrate
(lei) (lei)
F 38 852 821 6683 6106750 57795
M 22 503 465 3832 3380250 33533
Total 60 1355 1286 10515 9487000 91328

Pentru reprezentarea grafică s-a folosit diagrama de structură


Structura pe sexe se determină conform relaţiei:

10
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

ni  100
ni (%) 
*
k

n
i 1
i

38
ni (%)   100  63,33 % nr. femei
*

60
22
ni (%)   100  36,66 % nr. barbati
*

60

2 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ

Din cele 5 mărimi relative întâlnite în statistică, în proiectul de faţă se pot determina trei:

3.1. Mărimile relative de structură se obţin ca raport între parte şi întreg. Forma cea mai
obişnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte
unităţii din indicatorul raportat revin la 100 unităţi ale indicatorului bază de raportare. Se pot
calcula atât pe baza frecvenţelor absolute şi în acest caz au sens de frecvenţe relative ( ni* )
ni  100
ni (%) 
*
k

 ni
i 1
cât şi pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul
desfacerilor şi salariul net, obţinându-se în acest caz ponderea sau greutatea specifică ( g i ) a
n
unei valori ( xi ) în totalul valorilor colectivităţii (  xi ):
i 1
x
i
g i (%)   100
n
 xi
i 1

3.2. Mărimile relative de coordonare se obţin ca raport între două grupe sau între două
colectivităţi ce coexistă în spaţiu.
Pentru o colectivitate împărţită în două grupe pentru care nivelul pe grupe al variabilei
studiate este xA şi xB :
xA xB
K A/ B  sau KB/ A 
xB xA
Dacă sunt mai multe grupe, se alege una ca bază de comparaţie şi se raportează, pe rând,
fiecare grupă la baza aleasă.
11
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

3.3. Mărimile relative de intensitate se obţin prin raportarea a doi indicatori cu conţinut
diferit dar între care există o relaţie de interdependenţă.
y
la nivel parţial: xi  i ; la nivelul ansamblului: x 
 yi
zi  zi
3.A Calculul mărimilor relative pe baza repartiţiei vânzătorilor după vârstă

Repartiţia timpului lucrat (în zile şi ore), a valorii desfacerii şi a fondului de salarii şi a
structurii acestora în funcţie de vârstă

Mărimi relative de structură %


Intervalul Frecven gi
Calificativul ţe Zile lucr Ore
de variaţie Val. desf Fond salariu
al vârstei relative lucr
n i*
19 – 22 Cei mai tineri 48.33% 48.13% 48.61% 49.26% 48.83%
22 – 24 Tineri 35% 34.44% 34.49% 33.61% 34.14%
24 – 27 Mai puţin tineri 16.66% 17.41% 16.89% 17.11% 17.01%
Total 100,0 100,0 100,0 100,0 100

Interpretare:

Repartiţia timpului lucrat (în zile şi ore), a valorii desfacerii şi a fondului de salarii şi a raportului
acestora faţă de grupa celor mai tineri, în funcţie de vârstă

Intervalul Valori centralizate pentru: Mărimile relative de coordonare


Nr.
de Zile Ore Val. desf. Fond Nr. vz Zile Ore Val Fond
vânz.
variaţie al lucr. lucr. z i salariu n /n
i 1 lucr lucr desf sal
ni
vârstei xi yi si xi/x1 yi/y1 zi/z1 si/s1
19 – 22 29 619 5112 4673700 44601 1 1 1 1 1
22 – 24 21 443 3627 3189400 31185 0.72 0.71 0.70 0.68 0.69
24 – 27 10 224 1776 1623900 15542 0.34 0.36 0.34 0.34 0.34
Total 60 1286 10515 9487000 91328

Repartiţia timpului lucrat (în zile şi ore), a valorii desfacerii şi a fondului de salarii pe total şi în
medie pe un vânzător în funcţie de vârstă salariatului

Intervalul Nr. Valori centralizate pentru: Mărimile relative de intensitate


12
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

19 – 22 29 619 5112 4673700 44601 21 176 161162 1538


22 – 24 21 443 3627 3189400 31185 21 173 151876 1485
24 – 27 10 224 1776 1623900 15542 22 178 162390 1554
Total 60 1286 10515 9487000 91328 21 176 158476 1526
Notă: În cazul dat mărimile relative de intensitate au caracter de medie, prin urmare toate
valorile obţinute sunt valori medii atât la nivel de grupă cât şi pe total.

3 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR


OBŢINUTE
Caracterizarea statistică în cazul dat se referă la determinarea:
a) Indicatorilor tendinţei centrale:

13
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

 Media aritmetică
k

x n i i
x i 1
k

n
i 1
i

 Modul (modulul, dominanta)


1
Mo  x0  h
1   2
 Mediana (Me)
k

n i 1 m 1
i 1
  ni
2
Me  x0  h  i 1

nm
b) Indicatorii sintetici ai variaţiei şi ai asimetriei:
 Abaterea medie liniară (d ) :
k

x i  x ni
d  i 1
k

n
i 1
i

 Dispersia  2
k

 (x i  x ) 2 ni
2  i 1
k

n i 1
i

 Abaterea medie pătratică 


  2

 Coeficientul de variaţie (v):


d 
v   100 respectiv v  100
x x
 Coeficientul de asimetrie
x  Mo 3( x  Me)
C as  sau C as 
 

3.1 Repartiţia vânzătorilor după vârstă

Frecvenţe
Vârsta Nr.
xini cumulate x i  x ni  xi  x  ni
2

(ani) vânzători
crescător
19 3 57 3 10.74 38.44
20 7 140 10 18.06 46.59
21 8 168 18 12.64 19.97
22 11 242 29 6.38 3.70
23 10 230 39 4.2 1.76
24 11 264 50 15.62 22.18
25 7 175 57 16.94 40.99
26 2 52 59 6.84 23.39

14
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

27 1 27 60 4.42 19.53
TOTAL 60 1355 95.84 216.55

a) Calculul indicatorilor tendinţei centrale:


 Media aritmetică
k

x n i i
1355
x i 1
k
  22.58
60
n
i 1
i

 Modul (modulul, dominanta)


Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
Mo  22ani / vânz
 Mediana (Me)
k

locul medianei: n
i 1
i 1
60  1
U ( Me)    30,5
2 2
Me  23 ani / vânz
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
 Dispersia 
2

 (x i  x ) 2 ni
216.55
2  i 1
k
  3.60
60
n
i 1
i

 Abaterea medie pătratică 


   2
 3.60  1.89ani / vânz.
 Coeficientul de variaţie (v):
 1.89
v  100  * 100  8.21
x 23
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie
 Coeficientul de asimetrie
x  Mo 23  22
C as    0.52
 1.89
3( x  Me) 3( 23  23)
 
C as  0
 1.89
Rezultă asimetrie

3.2 Repartiţia vânzătorilor după orele lucrate

15
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Grupe de Nr, Centrul


Frecvenţe
vânzători Vânz, intervalului
xini cumulate x i  x ni  xi  x  ni
2

după ore xi
crescător
lucrate
141 – 150 6 145.5 873 6 179.1 5346.13
150 – 159 1 154.5 154.5 7 20.85 434.72
159 – 168 7 163.5 1144.5 14 82.95 982.95
168 – 177 15 172.5 2587.5 29 42.75 121.83
177 – 186 19 181.5 3448.5 48 116.85 718.62
186 – 195 10 190.5 1905 58 151.5 2295.22
195 – 204 1 199.5 199.5 59 24.5 600.25
204 – 213 1 208.5 208.5 60 33.15 1098.92
Total 60 10521 651.65 11598.64

a) Calculul indicatorilor tendinţei centrale:


 Media aritmetică
k

x n i i
10521
x i 1
k
  175.35
60
n
i 1
i

 Modul (modulul, dominanta)


Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
1 19  15
Mo  x0  h  177  9 *  184.2
 1   2 19  15  19  10

 Mediana (Me)
k

locul medianei: 60  1
n i 1
i 1
U ( Me) 
 30,5 
2 2
Variabila 23 ani este prima a cărei frecvenţă cumulată crescător este mai mare de 30,5
Me  171.47 ani / vânz
k

n i 1 m 1
i 1
  ni
2 i 1 30.5  60
Me  x 0  h  177  9 *  177  5.53  171.47
nm 48

b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei


 Dispersia 
2

 (x i  x ) 2 ni
11598.64
2  i 1
k
  193.31
60
n
i 1
i

 Abaterea medie pătratică 


   2
 193.31  13.90 .
 Coeficientul de variaţie (v):

16
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

 13.90
v  100  * 100  7.92
x 175.35
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie
 Coeficientul de asimetrie
x  Mo 175.35  184.2
C as    0.63
 13.90
3( x  Me) 3(175.35  171.47)
 
C as   0.83
 13.90
Rezultă asimetrie .....

3.3 Repartiţia vânzătorilor după salariu net (lei)

Grupe de Nr, Centrul


Frecvenţe
vânzători vânz. intervalului
xini cumulate x i  x ni  xi  x  ni
2

după salariul xi
crescător
net lunar (lei)
1234 – 1311 5 1272.5 6362.5 5 1232 303564.80
1311 – 1388 2 1349.5 2699 7 338.80 57392.72
1388 – 1465 7 1426.5 9985.5 14 646.80 59764.32
1465 – 1542 19 1503.5 28566.5 33 292.60 4506.04
1542 – 1619 18 1580.5 28449 51 1085.76 65493.04
1619 – 1696 7 1657.5 11602.5 58 961.24 131997.47
1696 – 1773 1 1734.5 1734.5 59 214.32 45933.06
1773 – 1850 1 1811.5 1811.5 60 291.32 84867.34
Total 60 91211 5062.84 753518.79

a) Calculul indicatorilor tendinţei centrale:


 Media aritmetică
k

x n i i
91211
x i 1
k
.  1520.18
60
n
i 1
i

 Modul
Locul Mo - intervalul cu frecvenţa maximă
1 19  7
Mo  x0  h  1465  77 *  1465  51.33  1615.33
1   2 19  7  19  18

 Mediana (Me)
k

locul medianei: n
i 1
i 1
60  1
U ( Me)    30,5
2 2
prin urmare intervalul ) este primul interval a cărei frecvenţă cumulată crescător este mai
mare de 30,5
k

n i 1 m 1
i 1
  ni
2 30.5  60
i 1
Me  x 0  h   1465  77 *
 1465  68.53  1396.47
nm 33
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
17
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

 Abaterea medie liniară (d ) :


k

x i  x ni
5062.84
d  i 1
k
  84.38
60
n
i 1
i

Dispersia  2
k

 (x i  x ) 2 ni
753518.79
2  i 1
k
  12558.64
60
n
i 1
i

 Abaterea medie pătratică 


   2
 12558.64  112 .06
 Coeficientul de variaţie (v):
d 84.38
v   100  * 100  5.55%
x 1520.18
 112 .06
v  100  * 100  7.37
x 1520.18
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie
 Coeficientul de asimetrie
x  Mo 1520.18  1615.33
C as    0.84
 112.06
3( x  Me) 3(1520.18  1396.47)
 
C as   3.31
 112 .06
Rezultă asimetrie negativă moderată

Pentru interpretarea rezultatelor se vor trece indicatorii obţinuţi într-un tabel sintetic.
Indicatorii tendinţei centrale, de variaţie totală şi de asimetrie pentru variabilele
înregistrate în eşantion

Variabilele înregistrate
Denumirea
Vârsta Ore Salariul net lunar
indicatorului
lucrate
Media aritmetică 22 175.35 1520.18
Modul 22 184.2 1615.33
Mediana 23 171.47 1396.47
Abaterea medie liniară - - 84.38
Abaterea medie 1.89 13.90 112.06
pătratică
Dispersia 3.60 193.31 12558.64
Coeficientul de d - - 5.55
variaţie % după:  8.21 7.92 7.37
Coeficientul de Mo 0.52 -0.63 -0.84
asimetrie după Me 0 0.83 3.31

4 ANALIZA CORELAŢIEI DINTRE VALOAREA DESFACERII ŞI


SALARIU

18
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

4.1 Corelaţia liniară simplă (date negrupate)

Se aplică pentru primele 10 unităţi din eşantion, privind numărul de ore lucrate (x i) şi salariul
net lunar (yi ) - mii lei. Seria se va ordona crescător după numărul de ore lucrate (x i)
menţinându-se salariul net lunar (yi ) corespunzător.
Dintre metodele simple de cercetare a legaturilor statistice recurgem la :

A) Metoda seriilor paralele interdependente

Ore lucrate Salariul net lunar


Nr. crt
(xi) (lei) (yi)
1. 141 1234
2. 141 1234
3. 142 1243
4. 142 1243
5. 146 1278
6. 150 1313
7. 158 1383
8. 165 1444
9. 165 1444
10. 166 1453

Concluzie: Valorile xi fiind ordonate crescător se poate observa că şi valorile yi cresc în cea mai
mare parte, ceea ce sugerează o legătură directă.

B) Metoda grafică este o altă cale de a stabili legătura dintre fenomene.


Pentru a obţine graficul de corelaţie, denumit şi corelograma, valorile caracteristicii
factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii
rezultative (yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se
reprezintă grafic printr-un punct.
Graficul de asemenea confirmă o legătură directă de formă liniară.
Metoda grafica este utilizată cu bune rezultate pentru alegerea funcţiei analitice care se
studiază (în cazul regresiei şi corelaţiei)
Metodele de studiere a legaturilor prezentate anterior au ca deficienţă principală faptul că
deşi permit constatarea legăturii şi caracterulul ei, nu o pot măsura printr-un indicator sintetic.
Acest inconvenient este înlăturat prin utilizarea metodei regresie.
Metoda regresiei constituie o metoda statistică analitică de cercetare a legăturii dintre
variabile cu ajutorul unor funcţii denumite funcţii de regresie.
Notând cu Y variabile dependenta şi cu x 1 , x2 ... xn variabilele independente obţinem
ecuaţia de regresie y = f (x1 , x2 ... xn).
În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura
dintre y şi x de tipul yxi = a +bxi. Parametri ecuaţiei în acest caz se determină prin rezolvarea
următorului sistem de ecuaţii:

19
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

na  b xi   yi

a xi  b xi   xi yi
2

Dacă se foloseşte metoda determinanţilor se obţine:

y x i i

a
x y x i i
2
i

y x x y x
i i
2
i i i

n x i n x  ( x )
2
i i
2

x x i
2
i

n y i

b
x i x y i i

n xi y i   xi  y i
n x i
n x i2  ( xi ) 2
x i x 2
i

Datele necesare calculării celor doi parametri sunt prezentate în tabelul de mai jos.

Nr x i2
xi yi xiyi Yxi=13.11+8.67x
ctr.
1. 141 1234 19881 173994 1235,58
2. 141 1234 19881 173994 1235,58
3. 142 1243 20164 176506 1244,25
4. 142 1243 20164 176506 1244,25
5. 146 1278 21326 186588 1278,93
6. 150 1313 22500 196950 1313,61
7. 158 1383 24964 218514 1382,97
8. 165 1444 27225 238260 1443,66
9. 165 1444 27225 238260 1443,66
10. 166 1453 27556 241198 1452,33
Total 1516 13269 230886 2020770 13274,82

a  13.11
b  8.67

20
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

Funcţia de regresie este: y=13,11+8.67x

a) Raportul de corelaţie liniară simplă se calculează cu formula:

Ry / x  1 
(y Y )
i xi
2

 1
13269  13274,82
1
 ( y  y)
i
2 13269  1326,90

Nr. crt xi yi Yxi (yi - Yxi)2 (yi - y )2 y i2


1. 141 1234 1235,58 2,50 8630,41 1522756
2. 141 1234 1235,58 2,50 8630,41 1522756
3. 142 1243 1244,25 1,56 7039,21 1545049
4. 142 1243 1244,25 1,56 7039,21 1545049
5. 146 1278 1278,93 0,86 2391,21 1633284
9. 150 1313 1313,61 0,37 193,21 1723969
7. 158 1383 1382,97 0 3147,21 1912689
8. 165 1444 1443,66 0,12 13712,41 2085136
9. 165 1444 1443,66 0,12 13712,41 2085136
10. 166 1453 1452,33 0,45 15901,21 2111209
1516 13269 13274,82 10,04 80396,90 17687033

Unde: y 
 y  13269  1326,90
i

n i 10

Ry / x  1
 ( y i  Yx ) 2 =
i
1
13269  13274,82
1
 ( yi  y ) 2 13269  1326,90

4.2 Metoda coeficientului de corelaţie

Intensitatea legăturii se măsoară prin coeficientul de corelaţie (ry/x).

n xi yi   xi  yi
ry / x  
 n x
2
i 
 ( xi ) 2  n yi2  ( yi ) 2 

10 * 2020770  1516 * 13269
0
10 * 230886  2298256 * 10 *17687033  176066361
Rezultă că legătura dintre aceste două variabile este directă (r z/x>0) şi puternică. Există
legătură liniară intensă deoarece ry/x=Ry/x.
b) Calculul coeficientului de corelaţie a rangurilor

Coeficienul de corelaţie a rangurilor propus de Spearman:


6 d i2 6*0
rs  1  3 =1- 1
n n 990
în care: di - reprezintă diferenţa între rangurile perechii de valori (xi,yi);
n - numărul de perechi de valori.
Coeficientul de corelaţie a rangurilor propus de Kendall :

21
PROIECT STATISTICA Student Filculescu Bogdan Grupa 13

2S 2 * 33
rk  =  0,73
n  ( n  1) 90
în care S   ( Pi  Qi )
în care: Pi - numărul rangurilor mai mari care urmează rangului curent pentru variabila
dependentă;
Qi - numărul rangurilor mai mici care urmează rangului curent pentru variabila
dependentă.

Calculul coeficienţilor de corelaţie a rangurilor

Nr Ranguri
xi yi di=rxi-ryi di 2 Pi Qi Pi-Qi
crt rxi ryi
1. 141 1234 1 1 0 0 6 0 6
2. 141 1234 1 1 0 0 6 0 6
3. 142 1243 2 2 0 0 5 0 5
4. 142 1243 2 2 0 0 5 0 5
5. 146 1278 3 3 0 0 4 0 4
9. 150 1313 4 4 0 0 3 0 3
7. 158 1383 5 5 0 0 2 0 2
8. 165 1444 6 6 0 0 1 0 1
9. 165 1444 6 6 0 0 1 0 1
10. 166 1453 7 7 0 0 0 0 0
total 1516 13269 0 33

Interpretare ....

5 BIBLIOGRAFIE
1. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, STATISTICĂ
APLICATĂ ÎN ECONOMIE, Editura Oscar Print, 2007
2. . Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, APLICAŢII
STATISTICE ÎN STUDIUL FENOMENELOR ECONOMICE, Editura Oscar Print, Bucureşti
2007

22

S-ar putea să vă placă și