Documente Academic
Documente Profesional
Documente Cultură
CAPITOLUL 3
Consideraţii preliminare
Cel mai adesea, urmărim să caracterizăm prin indicatori statistici —
măsuri cantitative — datele statistice pe care le avem la dispoziţie. Scopul
capitolului următor este să prezinte indicatorii statistici, primari şi derivaţi,
simpli şi sintetici, ce se folosesc în mod frecvent pentru caracterizarea
statistică a seriilor statistice.
Vom putea, astfel, să analizăm tendinţa centrală, dar şi variabilitatea
datelor, forma distribuţiilor şi concentrarea datelor.
Să notăm şi faptul că, datorită particularităţilor lor, indicatorii
statistici ai seriilor cronologice vor fi trataţi într-un capitol distinct.
Termeni cheie
abatere individuală indicator
abatere intercuartilică indicatori de poziţie
abatere medie liniară indicatori derivaţi
abatere medie pătratică indicatori primari
abatere semiintercuartilică mărime medie
amplitudine mărimi relative
aplatizare. mediană
asimetrie medie aritmetică
boltire medie armonică
coeficient de determinaţie medie geometrică
coeficient de variaţie medie pătratică
cuantile mod
cuartile percentile
decile regula de adunare a dispersiilor
diagramă Box- Plot variabilitate
dispersie
STATISTICĂ ECONOMICĂ
Noţiuni teoretice
3.1. INTRODUCERE
5 6 7 8
X =6,6 ani
Fig. 3.1. Balansarea valorilor individuale prin calculul mediei
STATISTICĂ ECONOMICĂ
0 5 10 15 20
X =6,6 ani
Fig. 3.2. Balansarea valorilor individuale prin calculul mediei
r
¦ xini
i =1 11490
x= r
= = 57,45 minute
200
¦ ni
i =1
EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 şi atunci:
STATISTICĂ ECONOMICĂ
Tabelul 3.2
Timp (min.) Frecvenţe ni xi xi – a x i’ ⋅ n i
x i’ =
h
< 30 47 15 -2 - 94
30-60 51 45 -1 - 51
60-90 76 60 0 0
90-120 24 105 1 24
120 şi peste 2 135 2 4
Total 200 – – -117
r
’
¦ xini
i =1 − 117
x= r
⋅h +a = ⋅ 30 + 75 = 57,45 minute
200
¦ ni
i =1
© i =1 ¹
ni ni
frecvenţele sunt chiar frecvenţele relative n *i = , i = 1, r şi rezultă,
c n
deci:
r
*
¦ xi ⋅ ni
i =1
x= (3.5)
1
sau, dacă frecvenţele relative au fost exprimate în procente:
r
*%
¦ xi ⋅ ni
i =1
x= (3.6)
100
xy = x ⋅ y (3.9)
2
¦ xini
i =1 1 ⋅ m + 0(n − m ) m
x= = = =f (3.10)
n n n
Modul (M0) reprezintă valoarea cel mai des întâlnită într-o serie
statistică sau cea care are cea mai mare frecvenţă de apariţie.
În cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie,
determinarea modului presupune mai întâi, identificarea intervalului cu frec-
venţă maximă (int M0). Apoi, modul se poate determina conform relaţiei:
§ d1 ·
M 0 = x inf M 0 + ¨¨ ¸¸ h M 0 (3.11)
© d1 + d 2 ¹
unde: xinfMo reprezintă limita inferioară a intervalului modal;
h M0 reprezintă mărimea intervalului modal;
d1 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
precedent;
d2 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
următor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modală este:
M 0 = 60 +
(76 − 51) ⋅ 30 = 69,74 minute
(76 − 51) + (76 − 24)
O distribuţie cu un singur mod se numeşte unimodală (fig. 3.3a),
o distribuţie este bimodală dacă are două valori dominante (moduri) (fig.
3.3b) şi multimodală dacă are mai mult de două moduri (fig. 3.3c).
CAPITOLUL 3
y y y
Frecvenþe
Frecvenþe
Frecvenþe
M0 x o M01 M02 x o M01 M02 M03 x
o
a) b) c)
3.3.3.2 Mediana
Mediana (Me) este un indicator mediu de poziţie care face parte din
categoria cuantilelor. Ea reprezintă valoarea/varianta din mijlocul unei serii
de date, serie în care observaţiile au fost ordonate crescător (sau descrescă-
tor).
Dacă datele au fost sistematizate într-o serie de distribuţie de frec-
venţe pe variante, pentru determinarea medianei vom calcula, mai întâi,
frecvenţele cumulate (Fci). Prima frecvenţă cumulată mai mare decât
(n+1)/2, adică mai mare decât locul medianei, ne indică varianta mediană.
interval cu frecvenţa cumulată mai mare decât locul (rangul, poziţia) media-
nei.
1§ r ·
¨ ¦ n i + 1¸ − FC( Me−1)
2 © i=1 ¹
Me = x inf Me + h Me (3.12)
n Me
unde:
x inf Me reprezintă limita inferioară a intervalului median;
h Me reprezintă mărimea intervalului median;
1§ r · n +1
¨ ¦ n i + 1¸ = reprezintă locul medianei în serie;
2 © i =1 ¹ 2
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului anterior celui
median;
nMe reprezintă frecvenţa absolută a intervalului median.
(
M 0 − x ≈ 3 Me − x ) (3.13)
CAPITOLUL 3
y y y
o x=Me=Mo x o Mo Me x x o x Me Mo x
3.3.3.4. Cuantilele
y Astfel,
cuartilele (cuantile
Frecvenþe relative
( )
Media armonică x h este o medie de calcul cu aplicaţii speciale,
care se determină, pentru o serie de date cantitative, ca valoarea inversă a
STATISTICĂ ECONOMICĂ
¦ vi ¦ vi 450000 + 480000
p= = = = 103333,3 lei/litru
¦ qi ¦ v1 1 1
i ⋅ 450000 + ⋅ 480000
pi 90000 120000
r
2
¦ xi ni
i =1
xp = r
(3.19)
¦ ni
i =1
r
2 *
¦ xi ni
i =1
xp = (3.20)
1
r
2 *%
¦ xi ni
i =1
xp = (3.21)
100
( )
Media geometrică x g se calculează ca rădăcina de ordinul n din
produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
înlocuind termenii seriei nu modifică produsul lor:
n
xg = n ∏ xi (3.22)
i =1
Pentru o serie de distribuţie de frecvenţe, media geometrică se
calculează ca:
r
¦ ni r
x g = i =1 ∏ x in i (3.23)
i =1
y y y
o a) x o x o x
b) c)
Fig. 3.6 - a) Distribuţii cu tendinţă centrală diferită; b) Distribuţii cu variabilitate
diferită; c) Distribuţii cu tendinţă centrală şi variabilitate diferite
x max − x min
A%
x = 100 (3.26)
x
A Q = Q 3 − Q1 (3.27)
CAPITOLUL 3
Q 3 − Q1
A ’Q = (3.28)
2
di = xi − x (3.29)
xi − x
d i% = (3.30)
x
3.4.2.2. Dispersia
( )
Dispersia s 2x se calculează ca media aritmetică a pătratelor
abaterilor individuale ale valorilor de la tendinţa centrală (uzual de la
medie). Pentru o serie simplă, formula dispersiei este:
CAPITOLUL 3
∑ (x i − x )
n 2
i =1
s 2x = (3.36)
n
iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2
i =1
s 2x = (3.37)
r
¦ ni
i =1
sau, pe baza frecvenţelor relative:
∑ (x i − x ) n *i%
r 2
i=1
s 2x = (3.38)
100
¦ (x i − x ) n i
r 2
i =1 182299,5
s 2x = = = 911,4975
r 200
¦ ni
i =1
Se cuvine să facem şi asupra dispersiei câteva observaţii şi să
remarcăm câteva din proprietăţile sale:
a) Pentru un şir de valori constante, dispersia este nulă;
( )
b) Dispersia calculată faţă de medie s 2x este mai mică decât orice
altă dispersie calculată faţă de o valoare “a”, cu pătratul distanţei dintre
medie şi constanta a:
s 2x = s a2 − (x − a )
2
(3.39)
c) Dacă valorile variabilei statistice studiate sunt modificate
(micşorate sau mărite) cu constanta „a“, dispersia seriei rămâne
neschimbată;
STATISTICĂ ECONOMICĂ
2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 = 200
271
⋅ 30 2 − (57,45 − 75)2 = 911,4975
¦ ni
i =1
e) Dispersia se poate calcula şi pe baza relaţiei:
CAPITOLUL 3
2
n n n
∑ x i2 ∑ x i2 ∑ xi
i =1 2 i =1
s 2x = −x = − i=1 (3.43)
n n n
iar pentru o serie de distribuţie de frecvenţe:
2
r r § r ·
¦ x i2 n i ¦ x i2 n i ¨ ¦ xini ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.44)
r r r
¦ ni ¦ ni ¨ ¦ ni ¸
¨ ¸
i =1 i =1 © i=1 ¹
2
r r § r ·
¦ x i2 n *i% ¦ x i2 n *i% ¨ ¦ x i n *i% ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.45)
100 100 100
¨ ¸
¨ ¸
© ¹
f) Dacă o serie este compusă din m serii componente (grupuri),
fiecare serie componentă fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m şi dispersiile seriilor componente:
¦ (x i − x j )
nj
2
i =1
s 2x = , j = 1, m (3.46)
j nj
Dispersia generală a colectivităţii poate să fie scrisă în funcţie de dis-
persiile seriilor componente (grupurilor):
¦ (x j − x ) n j
m m 2
¦ s 2x j n j
j=1 j=1
s 2x = + (3.47)
m m
¦n j ¦nj
j=1 j=1
m
¦ s 2x j n j
j=1
Expresia: m
se numeşte media dispersiilor parţiale
¦nj
j=1
m
¦ s 2x j n j
2 j=1
sx =
m
(3.48)
¦nj
j=1
¦ (x j − x ) n j
m 2
j=1
Expresia: m
sintetizează împrăştierea valorilor de la
¦nj
j=1
media generală, doar ca urmare a acţiunii factorului după care s-au alcătuit
grupurile, seriile componente. Această expresie se numeşte dispersia dintre
( )
grupe d 2x :
¦ (x j − x ) n j
m 2
j=1
d 2x = (3.49)
m
¦n j
j=1
( )
Putem spune că d 2x explică măsura în care factorul de grupare
determină variaţia variabilei studiate şi să calculăm coeficientul de
determinaţie:
d 2x
R2 = (3.51)
s 2x
d 2x =
(x L − x )2 n L + (x M − x )2 n M = (400 − 320)2 30 + (200 − 320)2 20 =
nL + nM 50
480000
= = 9600
50
2
s 2x = s x + d 2x = 2140 + 9600 = 11740
Aşadar
2 d 2x 9600
R% = 100 = 100 = 81,77%
s 2x 11740
s f2 = f (1 − f ) (3.55)
¦ (x i − x )
n 2
s x = s 2x = i =1 (3.56)
n
pentru o serie simplă, iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2
i =1
sx =
r
(3.57)
¦ ni
i =1
¦ (x i − x ) n *i%
r 2
sx = i =1 (3.58)
100
4
dx ≈ sx (3.59)
5
s
v = x 100 (3.61)
x
Cu cât valoarea coeficientului de variaţie este mai mică, cu atât acest
lucru semnifică o omogenitate crescută a datelor.
≈34%
≈13,5%
≈13,5%
o ≈2,5% ≈2,5%
x-3σ x-2σ x-σ x x+σ x+2σ x+3σ x
Amplitudine
AS = x − M 0 (3.62)
sau
(
A S1 = 3 x − Me ) (3.63)
x − M0
C as = (3.64)
sx
C as1 =
(
3 x − Me ) (3.65)
sx
C as1 =
( =
)
3 x − Me 57,45 − 61
= −0,118
sx 30,19
ceea ce semnifică o asimetrie negativă moderată (coada mai lungă a distri-
buţiei înspre valorile mici).
¦ (x i − x )
n 3
m 3 = i =1 (3.66)
n
sau, utilizând frecvenţe:
¦ (x i − x ) n i ¦ (x i − x ) n *i%
r 3 r 3
m 3 = i =1 = i =1 (3.67)
r 100
¦ ni
i =1
Coeficientul de asimetrie (Fisher) este:
m3 m 32
γ1 = = (3.68)
s 3x m 32
Coeficientul γ 1 va avea valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative
şi va fi egal cu zero în cazul seriei perfect simetrice.
ASQ=Q3+Q1-2Me (3.69)
X m in Q1 Me Q3 X m ax
25% 25% 25% 25%
x k
z= 10 (3.71)
y
unde: z reprezintă indicatorul relativ;
x reprezintă indicatorul comparat;
y reprezintă indicatorul bază de comparaţie;
CAPITOLUL 3
xi
g ix % = n
100 (3.73)
¦ xi
i =1
ni
¦ x ij
j=1
g ix = (3.74)
r ni
¦ ¦ x ij
i =1 j=1
ni
¦ x ij
j=1
g ix % = 100 (3.75)
r ni
¦ ¦ x ij
i =1 j=1
STATISTICĂ ECONOMICĂ
EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules şi
sistematizat date privind producţia zilnică realizată de muncitori (Tabelul
3.8)
Tabelul 3.8
Judeţul/Filiala Număr de muncitori Producţia individuală (buc.)
0 1 2
Alba/A 4 120;130;120;90
Bacău/B 3 80;120;100;
Constanţa/C 6 140;70;90;100;110;120
Tabelul 3.9
Filiala Producţia pe Structura producţiei pe Structura
filială (buc.) filiale (%) colectivităţii de
muncitori (%)
0 1 2 3
Rezultatul ne arată de câte ori este mai mare (dacă rezultatul este
supraunitar), sau mai mic (dacă rezultatul este subunitar) nivelul variabilei
în unitatea (grupa, colectivitatea) i faţă de nivelul variabilei în unitatea
(grupa, colectivitatea) j.
A 1,33 1,53
B 1,00 1,00
C 2,00 2,10
Pe baza datelor din Tabelul 3.8, col.1 şi Tabelul 3.9, col.1, putem
calcula producţia obţinută de un muncitor (bucăţi pe muncitor) (Tabelul
3.11):
Tabelul 3.11
Filiala Productivitatea muncii (buc./muncitor)
0 1
A 115
B 100
C 105
Total 106,92
STATISTICĂ ECONOMICĂ
x pi
i px 0i = (3.83)
x 0i
CAPITOLUL 3
x pi
i px %0i = 100 (3.84)
x 0i
x 1i
i 1x pi = (3.85)
x pi
x 1i
i 1x %pi = 100 (3.86)
x pi
Se observa ca:
x pi x 1i x 1i
i px %0i ⋅ i 1x %
pi = ⋅ = = i 1x 0i (3.87)
x 0i x pi x 0i
Întrebări recapitulative