Sunteți pe pagina 1din 16

PROIECT STATISTICA Student ............................Grupa......

CUPRINS

0 TEMA PROIECTULUI....................................................................2

1 EXTRAGEREA EŞANTIONULUI....................................................... 3

2 GRUPAREA DATELOR ÎNREGISTRATE............................................4

2.1 Gruparea pe intervale de variaţie egale.................................................4

2.2 Gruparea pe intervale de variaţie neegale.............................................7

3 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ.........................8

4 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR OBŢINUTE.........10

4.A. Repartiţia vânzătorilor după vârstă...................................................11

4.C. Repartiţia vânzătorilor după orele lucrate.........................................12

5 ANALIZA CORELAŢIEI DINTRE SALARIUL NET ȘI ORELE LUCRATE. .14

6 BIBLIOGRAFIE..........................................................................16

1
PROIECT STATISTICA Student ............................Grupa......

0 TEMA PROIECTULUI

Un agent economic dispune de o reţea de unităţi economice cu profilul alimentaţie


publică în care sunt angajaţi 500 de vânzători.
Pentru cei 500 de vânzători, consideraţi ca o colectivitate generală, s-a întocmit o bază de
sondaj. Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce
constituie un criteriu aleator şi li s-a dat un cod (nr. crt.).

Considerând cei 500 de vânzători ca formând o colectivitate statistică se cere:


1. să se extragă printr-un procedeu de sondaj un eşantion de 60 de unităţi şi să se centralizeze
nivelurile individuale ale fiecăruia din variabilele prezentate potrivit conţinutului lor;
2. să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate
caracteristicile înregistrate pe intervale egale şi neegale (se vor folosi minim 8 grupe pentru
intervale egale şi minim 3 grupe pentru intervale neegale) şi să se centralizeze datele
condiţionate de grupările folosite. Să se reprezinte grafic seriile obţinute,
3. să se calculeze toate mărimile relative posibile şi să se reprezinte grafic mărimile obţinute
folosind diagramele adecvate;
4. să se calculeze indicatorii tendinţei centrale, indicatorii variaţiei şi ai asimetriei pentru
variabilele înregistrate;
5. să se aplice metoda corelaţiei şi regresiei pentru datele din eşantion. Să se măsoare gradul de
intensitate al corelaţiei. Pentru date grupate se vor lua în calcul primele 10 unităţi din
eşantion, la care se vor calcula şi coeficienţii de corelaţie a rangurilor.

2
PROIECT STATISTICA Student ............................Grupa......

1 EXTRAGEREA EŞANTIONULUI
1. Din baza de sondaj se extrage un eşantion format din 60 de vânzători. La extragere s-a folosit
N 500
procedeul selecţiei mecanice cu pas de numărare egal cu 8 ( = ≈8 ) şi prima unitate
n 60
extrasă ….
S-au înregistrat datele privind sexul, vârsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor
lunare (lei) şi salariul net lunar (lei) din luna februarie 2009.

Nr. crt. Sex Vârsta Zile Ore Valoarea Salariul net lunar
(ani) lucrate lucrate desfacerilor (lei) (lei)

3
PROIECT STATISTICA Student ............................Grupa......

Total

Interpretare.....

2 GRUPAREA DATELOR ÎNREGISTRATE

2.1 Gruparea pe intervale de variaţie egale


1. Gruparea datelor înregistrate
1.1. Gruparea pe intervale de variaţie egale
Gruparea pe intervale egale implică următoarele etape:
a) calculul amplitudinii absolute de variaţiei (A) care exprimă împrăştierea maximă a
valorilor serei.
Axa = Xmax – Xmin;
Dacă variaţia este foarte mică (în cazul nostru Axa ≤ 10) se va forma o distribuţie pe variante
(valabil în cazul caracteristicilor: vârsta; zile lucrate).
b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:
 dacă variaţia caracteristicii este relativ uniformă şi volumul de unităţi nu este
suficient de mare numărul de grupe se poate fixa anterior (din cerinţele proiectului se vor
folosi minimul 8 grupe pentru intervale egale);
 iar dacă numărul grupelor nu este anterior cunoscut şi volumul unităţilor este
suficient de mare se recomandă stabilirea grupelor conform relaţiei lui Sturgers,
r = 1+3,322log n
unde: n - nr. caracteristicilor.
c)determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea
absolută a variaţiei şi numărul de grupe:

4
PROIECT STATISTICA Student ............................Grupa......

Aax xmax − xmin


h= sau h =
r 1 + 3,322 log n
Notă: Mărimea intervalului (h) se rotunjeşte la întreg în plus (ex.3,25≈ 4)
Prima grupă se porneşte de la xmin adăugându-se succesiv mărimea intervalului de grupare
(h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită
inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele
intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita
înregistrări duble a caracteristicilor.
Analog se rezolvă pentru orice variabilă.

2A. Gruparea pe intervale egale a vânzătorilor după vârstă


a) Amplitudinea variaţiei Axa = Xmax – Xmin =

Repartiţia vânzătorilor după vârstă


Vârsta Nr. Valori centralizate pentru
(ani) vânzatori Zile Ore Valoarea Fondul de
lucrate lucrate Desfacerilor (lei) salariu lunar (lei)

Total 60

Reprezentarea grafică a repartiţiei vânzătorilor după vârstă se ilustrează prin poligonul


frecvenţelor şi prin curba cumulativă a frecvenţelor.

Vârsta Frecventa Frecvente cumulate


(ani) crescator descrescator

Total 60

2C. Gruparea pe intervale egale a vânzătorilor după ore lucrate


a) Amplitudinea variaţiei Axa = Xmax -Xmin =
b) Nr. de grupe r = 8
c) Mărimea intervalului h =

5
PROIECT STATISTICA Student ............................Grupa......

Repartiţia vânzătorilor după numărul de ore lucrate


Grupe de Nr. Valori centralizate pentru:
vanzatori dupa vanzatori Zile Valoarea desfacerilor Fondul de
nr. ore lucrate lucrate lunare (lei) salariu
lunar (lei)

Total 60
Nota: Limita superioară este inclusă în interval.

Repartizarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate se ilustrează prin
poligonl frecvenţelor şi prin curba cumulativă a frecvenţelor.

Grupe de vânzători Frecvenţa Frecvenţe cumulate


după nr.ore lucrate crescător descrescător

Total 60

2E. Gruparea pe intervale egale a vânzătorilor după salariul net


a) Amplitudinea variaţiei Axa = Xmax -Xmin =
b) Nr. de grupe r = 8
c) Mărimea intervalului h =

Repartiţia vânzătorilor după numărul de salariul net


Grupe de Nr. Valori centralizate pentru:
vanzatori dupa vanzatori Zile Ore lucrate Valoarea
salariul net lucrate desfacerilor
lunare (lei)

6
PROIECT STATISTICA Student ............................Grupa......

Total 60
Nota: Limita superioară este inclusă în interval.

Repartizarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate se ilustrează prin
poligonl frecvenţelor şi prin curba cumulativă a frecvenţelor.

Grupe de vânzători Frecvenţa Frecvenţe cumulate


după salariul net crescător descrescător

Total 60

Gruparea pe intervale egale permite structurarea colectivităţii pe grupe cât mai omogene,
iar gruparea statistică este cea mai semnificativă modalitate a sistemetizării datelor după o
caracteristică numerică sau nominativă.
Sistematizarea datelor printr-o grupare pe intervale egale răspunde necesităţii de
sistematizare şi omogenizare a datelor unei observaţii statistice de masă şi a caracterizării
independente a fiecărei variabile din propria observare.

2.2 Gruparea pe intervale de variaţie neegale

Pentru analiza structurii colectivităţii pe grupe tipice se foloseşte gruparea pe intervale


neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
Un prim principiu al grupării pe intervale neegale este trecerea de la variaţia lineară
(interval de mărime constantă) la variaţia neuniformă a unor intervale de grupare din ce în ce mai
mari.
Un alt principiu de grupare are în vedere separarea unităţilor pe trei grupe: mici, mijlocii
şi mari.

2.2.C. Gruparea pe intervale neegale a vânzătorilor după orele lucrate


n

Nivelul mediu ∑x i
x= i =1
=
n
Grupe de Valori centralizate pentru:
vânzători Nr. Zile Valoarea Fondul de Calificativ
după nr. ore vânz lucrate desfacerii salariu lunar
lucrate (lei) (lei)
Minimum
Mediu
Maxim
Total 60

7
PROIECT STATISTICA Student ............................Grupa......

Notă: Limita superioară inclusă în interval

3 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ

Din cele 5 mărimi relative întâlnite în statistică, în proiectul de faţă se pot determina trei:

1. Mărimile relative de structură se obţin ca raport între parte şi întreg. Forma cea mai
obişnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte
unităţii din indicatorul raportat revin la 100 unităţi ale indicatorului bază de raportare. Se pot
calcula atât pe baza frecvenţelor absolute şi în acest caz au sens de frecvenţe relative ( ni* )
ni ⋅ 100
ni (%) =
*
k

∑ ni
i =1
cât şi pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul
desfacerilor şi salariul net, obţinându-se în acest caz ponderea sau greutatea specifică ( g i ) a
n
unei valori ( xi ) în totalul valorilor colectivităţii ( ∑ xi ):
i =1
x
g i (%) = i
⋅100
n
∑ xi
i =1

2. Mărimile relative de coordonare se obţin ca raport între două grupe sau între două
colectivităţi ce coexistă în spaţiu.
Pentru o colectivitate împărţită în două grupe pentru care nivelul pe grupe al variabilei
studiate este xA şi xB :
xA xB
K A/ B = sau KB/A =
xB xA
Dacă sunt mai multe grupe, se alege una ca bază de comparaţie şi se raportează, pe rând,
fiecare grupă la baza aleasă.
3. Mărimile relative de intensitate se obţin prin raportarea a doi indicatori cu conţinut
diferit dar între care există o relaţie de interdependenţă.
y
la nivel parţial: xi = i ; la nivelul ansamblului: x =
∑ yi
zi ∑ zi

3.C Calculul mărimilor relative pe baza repartiţiei vânzătorilor după numărul de ore
lucrate
Repartiţia timpului lucrat în zile a fondului de salarii şi a structurii acestora în funcţie de numărul
de ore lucrate

Mărimi relative de structură %


Interval de Frecvenţe gi
variaţie a orelor Calificativ relative
Zile lucr Fond Valoarea
lucrate *
ni salariu desfacerii

8
PROIECT STATISTICA Student ............................Grupa......

Total 100 100 100 100

Repartiţia timpului lucrat (în zile şi ore), a fondului de salarii şi a raportului acestora faţă de
prima grupa, în funcţie de valoarea desfacerii

Valori centralizate Mărimile relative de coordonare


Interval de Nr.
Zile Fond Valoarea Nr. vz Zile lucr Fond Val.desf..
variaţie a orelor vânz
lucr. salariu desfacerii ni/n1 xi/x1 sal. zi/z1
lucrate ni
xi yi zi yi/y1

Total 60

Repartiţia timpului lucrat (în zile şi ore), a fondului de salarii pe total şi în medie pe un vânzător
în funcţie de valoarea desfacerii

Valori centralizate pentru: Mărimi relative de intensitate


Interval de Nr. Zile Ore Fond Zile Fond Val desf..
variaţie a orelor vânz lucr. lucr. salariu lucr sal zi/n1
lucrate ni xi yi zi xi/ni yi/n1

Total 60

9
PROIECT STATISTICA Student ............................Grupa......

4 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR


OBŢINUTE
Caracterizarea statistică în cazul dat se referă la determinarea:
a) Indicatorilor tendinţei centrale:
 Media aritmetică
k

∑x n i i
x= i =1
k

∑n
i =1
i

 Modul (modulul, dominanta)


∆1
Mo = x0 + h
∆1 + ∆ 2
 Mediana (Me)
k

∑n i +1 m −1
i =1
− ∑ ni
2
Me = x0 + h ⋅ i =1

nm
b) Indicatorii sintetici ai variaţiei şi ai asimetriei:
 Abaterea medie liniară (d ) :
k

∑x i − x ni
d = i =1
k

∑n
i =1
i

 Dispersia σ 2
k

∑ (x i − x ) 2 ni
σ2 = i =1
k

∑n
i =1
i

 Abaterea medie pătratică σ


σ= σ 2

 Coeficientul de variaţie (v):


d σ
v ′ = ⋅100 respectiv v = ⋅100
x x
 Coeficientul de asimetrie
x − Mo 3( x − Me )
C as = sau C as′ =
σ σ

10
PROIECT STATISTICA Student ............................Grupa......

4.A. Repartiţia vânzătorilor după vârstă

Frecvenţe
Vârsta Nr.
(ani) vânzători
xini cumulate x i − x ni ( xi − x ) 2 ni
crescător

TOTAL 60

a) Calculul indicatorilor tendinţei centrale:


 Media aritmetică
k

∑x n i i
x= i =1
k
=
∑n
i =1
i

Modul (modulul, dominanta)



Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
Mo = ani / vânz
 Mediana (Me)
k

locul medianei: ∑n
i =1
i +1
60 + 1
U ( Me ) = = = 30,5
2 2
Me = ani / vânz
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
 Dispersia σ
2

∑ (x − x) n i
2
i
σ2 = i =1
k
=
∑n
i =1
i

 Abaterea medie pătratică σ


σ = σ = ani / vânz .
2

 Coeficientul de variaţie (v):


σ
v= ⋅ 100 =
x
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie
 Coeficientul de asimetrie
x − Mo
Cas = =
σ
3( x − Me )
′ =
Cas =
σ
Rezultă asimetrie

11
PROIECT STATISTICA Student ............................Grupa......

4.C. Repartiţia vânzătorilor după orele lucrate

Grupe de Nr, Centrul


Frecvenţe
vânzători Vânz, intervalului
după ore xi
xini cumulate x i − x ni ( xi − x ) 2 ni
crescător
lucrate

Total 60 -

c) Calculul indicatorilor tendinţei centrale:


 Media aritmetică
k

∑x n i i
x= i =1
k
=
∑n
i =1
i

 Modul (modulul, dominanta)


Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
∆1
Mo = x0 + h
 ∆1 + ∆2

 Mediana (Me)
k

locul medianei: 60 + 1
∑ni =1
i +1
U ( Me ) =
= 30,5 =
2 2
Variabila 23 ani este prima a cărei frecvenţă cumulată crescător este mai mare de 30,5
Me = ani / vânz
d) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
 Dispersia σ
2

∑ (x − x) n i
2
i
σ2 = i =1
k
=
∑n
i =1
i

 Abaterea medie pătratică σ


σ = σ =. 2

 Coeficientul de variaţie (v):


σ
v= ⋅ 100 =
x
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie

12
PROIECT STATISTICA Student ............................Grupa......

 Coeficientul de asimetrie
x − Mo
Cas = =
σ
3( x − Me )
′ =
Cas =
σ
Rezultă asimetrie .....

Pentru interpretarea rezultatelor se vor trece indicatorii obţinuţi într-un tabel sintetic.
Indicatorii tendinţei centrale, de variaţie totală şi de asimetrie pentru variabilele
înregistrate în eşantion

Variabilele înregistrate
Denumirea indicatorului Vârsta Zile lucrate Ore lucrate

Media aritmetică
Modul
Mediana
Abaterea medie liniară
Abaterea medie pătratică
Dispersia
Coeficientul de variaţie % d

după: σ
Coeficientul de asimetrie Mo
după Me

13
PROIECT STATISTICA Student ............................Grupa......

5 ANALIZA CORELAŢIEI DINTRE SALARIUL NET ȘI ORELE


LUCRATE

Se aplică pentru primele 10 unităţi din eşantion, privind numărul de ore lucrate (xi) şi salariul
net lunar (yi ) - mii lei. Seria se va ordona crescător după numărul de ore lucrate (xi)
menţinându-se salariul net lunar (yi ) corespunzător.
Dintre metodele simple de cercetare a legaturilor statistice recurgem la :

A) Metoda seriilor paralele interdependente

Ore lucrate Salariul net lunar


Nr. crt
(xi) (lei) (yi)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

Concluzie: Valorile xi fiind ordonate crescător se poate observa că şi valorile yi cresc în cea mai
mare parte, ceea ce sugerează o legătură directă.

B) Metoda grafică este o altă cale de a stabili legătura dintre fenomene.


Pentru a obţine graficul de corelaţie, denumit şi corelograma, valorile caracteristicii
factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii
rezultative (yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se
reprezintă grafic printr-un punct.
Graficul de asemenea confirmă o legătură directă de formă liniară.
În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura
dintre y şi x de tipul yxi = a +bxi. Parametri ecuaţiei în acest caz se determină prin rezolvarea
următorului sistem de ecuaţii:

 n a+ b∑ xi = ∑ yi

 a∑ xi + b∑ xi = ∑ xi yi
2

Dacă se foloseşte metoda determinanţilor se obţine:

∑ y ∑xi i

a=
∑x y ∑x
i i
2
i
=
∑ y ∑x
i i
2
− ∑ xi yi ∑ xi
n ∑x i n∑ x 2
i − (∑ xi ) 2
∑x ∑x i
2
i

14
PROIECT STATISTICA Student ............................Grupa......

n ∑y i

b=
∑ xi ∑x y i i
=
n∑ x i y i − ∑ xi ∑ y i
n ∑x i
n∑ xi2 − (∑ xi ) 2
∑ xi ∑x 2
i

Datele necesare calculării celor doi parametri sunt prezentate în tabelul de mai jos.

Nr x i2
xi yi xiyi Yxi=
ctr.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Total

a=
b=
Funcţia de regresie este: yxi = a +bxi

Intensitatea legăturii se măsoară prin coeficientul de corelaţie (ry/x).

n∑ xi yi − ∑ xi ∑ yi
ry / x = =
[n∑ x 2
i ][
− (∑ xi ) 2 ⋅ n∑ yi2 − (∑ yi ) 2 ]
=
Interpretare ....

15
PROIECT STATISTICA Student ............................Grupa......

6 BIBLIOGRAFIE
1. Emilia Gogu, „Statistica în turism şi comerţ - teorie şi studii de caz”, Editura Oscar Print
Bucureşti, 2009,
2. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, “Statistică aplicată în
economie”, Editura Oscar Print, 2007
3. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, “Aplicaţii statistice în studiul
fenomenelor economice”, Editura Oscar Print, Bucureşti 2007

16