Sunteți pe pagina 1din 33

CAPITOLUL 3

CAPITOLUL 3
ANALIZA I DESCRIEREA NUMERIC A
SERIILOR STATISTICE UNIVARIATE
Consideraii preliminare
Cel mai adesea, urmrim s caracterizm prin indicatori statistici
msuri cantitative datele statistice pe care le avem la dispoziie. Scopul
capitolului urmtor este s prezinte indicatorii statistici, primari i derivai,
simpli i sintetici, ce se folosesc n mod frecvent pentru caracterizarea
statistic a seriilor statistice.
Vom putea, astfel, s analizm tendina central, dar i variabilitatea
datelor, forma distribuiilor i concentrarea datelor.
S notm i faptul c, datorit particularitilor lor, indicatorii
statistici ai seriilor cronologice vor fi tratai ntr-un capitol distinct.

Termeni cheie
abatere individual
abatere intercuartilic
abatere medie liniar
abatere medie ptratic
abatere semiintercuartilic
amplitudine
aplatizare.
asimetrie
boltire
coeficient de determinaie
coeficient de variaie
cuantile
cuartile
decile
diagram Box- Plot
dispersie

indicator
indicatori de poziie
indicatori derivai
indicatori primari
mrime medie
mrimi relative
median
medie aritmetic
medie armonic
medie geometric
medie ptratic
mod
percentile
regula de adunare a dispersiilor
variabilitate

STATISTIC ECONOMIC

Noiuni teoretice
3.1. INTRODUCERE
n acest capitol, vom continua s examinm modalitile prin care
putem s rezumm seturile de date statistice, n aa fel nct trsturile lor
eseniale s poat fi puse n eviden. n capitolele precedente, am nvat
cum s grupm datele brute ntr-o form mai uor de interpretat i cum s
construim diferite reprezentri grafice ale datelor sistematizate. Avnd la
dispoziie un set de date numerice, am nceput analiza statistic prin
determinarea valorii maxime i valorii minime, apoi am determinat o
distribuie de frecvene, histograma i poligonul frecvenelor. Aceste
instrumente au permis identificarea formei aproximative a distribuiei i au
indicat n jurul crei valori sunt mai concentrate nivelurile individuale ale
variabilei.
Dei o distribuie de frecvene este, cu siguran, util n conturarea
unei idei de ansamblu privind distribuia datelor ntre cele dou valori
extreme, vom dori, n continuare, s rezumm mai mult datele, calculnd
civa indicatori statistici descriptivi. Indicatorii numerici descriptivi ofer
valori precise i determinate n mod obiectiv, valori care pot fi uor folosite,
interpretate i comparate una cu alta. Pe scurt, acetia permit o analiz mai
atent a datelor, fa de impresia general pe care o ofer prezentarea datelor
sub form de serii, tabele i grafice.
3.2. INDICATORI STATISTICI PRIMARI I DERIVAI

DEFINIIE: Indicatorul statistic n sens larg reprezent expresia


numeric a unor fenomene i procese social-economice, definite n timp,
spaiu i structur organizatoric.
Indicatorii statistici pot fi primari i derivai.
Indicatorii primari se obin, de regul, n etapa de sistematizare a
datelor statistice, prin centralizarea i agregarea acestora.

CAPITOLUL 3

Indicatorii derivai se obin prin prelucrarea mrimilor absolute ale


indicatorilor primari.
Cele trei proprieti majore ale seriilor de date numerice, pe care le
putem analiza folosind indicatorii statistici sunt cele privitoare la tendina
central, la variabilitatea i la forma distribuiilor.
3.3. INDICATORI AI TENDINEI CENTRALE
O clasificare a indicatorilor tendinei centrale se poate face, n
funcie de modul de determinare a lor, n:
indicatori (mrimi) medii de calcul: media aritmetic, armonic,
ptratic, geometric etc.;
indicatori medii de poziie: modul, mediana.
Indicatorii fundamentali ai tendinei centrale sunt: media
aritmetic, modul i mediana, dar n anumite cazuri speciale putem apela
i la alte tipuri de medii.
3.3.1. Media aritmetic
Media aritmetic (x ) reprezint valoarea care nlocuind toi
termenii unei serii nu modific nivelul lor totalizator i se calculeaz ca
suma valorilor raportat la numrul lor.
n

x=

xi

i =1

(3.1)
n
EXEMPLUL 3.1: Vechimea n munc a fost nregistrat pentru cinci
salariai ai unei firme i anume: 7, 5, 6,7 i 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x=
=
= 6,6 ani
5
5
Observm din fig. 3.1. cum media aritmetic pune n balan toate
valorile individuale:
5

7
X =6,6 ani

Fig. 3.1. Balansarea valorilor individuale prin calculul mediei

STATISTIC ECONOMIC

De asemenea, dac vom considera


vechimea n munc, vom observa cum media
valorile extreme. Astfel, dac presupunem c
munc a 10 salariai sunt: 5, 4, 5, 5, 6, 6, 4 i
este:
x=

urmtoarele date privind


aritmetic este afectat de
datele pentru vechimea n
20, atunci vechimea medie

5 + 4 + ... + 4 + 20
= 6,6 ani
10

10

15

20

X =6,6 ani

Fig. 3.2. Balansarea valorilor individuale prin calculul mediei

n cazul n care datele au fost sistematizate ntr-o serie de distribuie


de frecvene, n care valorile / centrele intervalelor de variaie x i , i = 1, r
apar cu frecvenele ni media aritmetic (numit i medie aritmetic
ponderat) este:

x=

xini

i =1
r

(3.2)

ni

i =1

EXEMPLUL 3.2: Presupunem c pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului,
rezultnd (Tabelul 3.1):
Timp (min.)
Pn la 30
30-60
60-90
90-120
120 i peste
Total

Numr de persoane
(frecvene) ni
47
51
76
24
2
200

xi
15
45
75
105
135

Tabelul 3.1
xi ni
705
2295
5700
2520
270
11490

CAPITOLUL 3

x=

xini

i =1
r

ni

11490
= 57,45 minute
200

i =1

Asupra mediei aritmetice sunt de fcut cteva observaii i de


subliniat cteva proprieti:
a) Pentru un ir de valori constante, media este egal cu constanta;
b) Media are ntotdeauna valoarea cuprins ntre valoarea minim
din serie (xmin) i valoarea maxim (xmax);
c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este
ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se
compenseaz perfect);
d) Dac valorile individuale ale unei variabile sunt mrite sau
micorate cu constanta a, atunci media se modific i ea, n acelai sens,
cu aceeai constant a;
e) Dac valorile individuale ale unei variabile sunt modificate de h
ori, media se modific i ea de h ori;
Din aceste dou proprieti, d) i e), rezult formula de calcul
simplificat al mediei aritmetice, pentru valori reduse cu constanta a i de h
x a

, i = 1, n :
ori x i = i
h

n
n x a

xi
i
x = i =1 h + a = i =1 h h + a
(3.3)
n
n
iar pentru o serie de distribuie de frecvene:
r x a
r

ni
xini
i
x = i =1
h + a = i =1 h
h +a
(3.4)
r

ni

i =1

ni

i =1

EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 i atunci:

STATISTIC ECONOMIC
Tabelul 3.2
Timp (min.)

Frecvene ni

< 30
30-60
60-90
90-120
120 i peste
Total

47
51
76
24
2
200
r

x=

15
45
60
105
135

xini

i =1
r

xi

h +a =

ni

x i =

xi a
h

-2
-1
0
1
2

x i n i

- 94
- 51
0
24
4
-117

117
30 + 75 = 57,45 minute
200

i =1

f) ntr-o serie de distribuie de frecvene, dac frecvenele sunt


modificate de c ori, media rmne neschimbat.

Dac c reprezint volumul total al colectivitii n = n i ,


r

frecvenele

ni
c

sunt chiar frecvenele relative n *i =

i =1

ni
, i = 1, r i rezult,
n

deci:
r

x=

xi ni

i =1

1
sau, dac frecvenele relative au fost exprimate n procente:
r

x=

(3.5)

*%

xi ni

i =1

(3.6)

100

g) Dac o serie statistic este alctuit din mai multe serii


componente, pentru care s-au calculat medii pariale x j , j = 1, m , atunci
media ntregii serii poate fi calculat ca o medie aritmetic ponderat din
mediile pariale:

( )

x=

x jn j
j=1
m

nj
j=1

(3.7)

CAPITOLUL 3

unde nj reprezint volumul seriei componente j (j = 1, m )


EXEMPLUL 3.4: ntr-o colectivitate de 60 de persoane, din care 24 de
sex feminin i 36 de sex masculin, s-a determinat vrsta medie a persoanelor
de sex feminin x F = 38,1 ani i vrsta medie a persoanelor de sex masculin
x M = 42,2 ani. Vrsta medie n ntreaga colectivitate este:
x=

x F n F + x M n M 24 38,1 + 36 42,2
=
= 40,56 ani
nF + nM
60

h) Pentru dou caracteristici statistice X i Y, pentru care s-au


calculat mediile x i, respectiv, y , media sumei valorilor individuale (xi +
yi) este ntotdeauna egal cu suma mediilor:
x+y=x+y
(3.8)
i) Pentru dou caracteristici statistice X i Y, pentru care s-au
calculat x i y , media produsului (xi yi) este egal cu produsul mediilor,
doar dac cele dou variabile sunt independente:
xy = x y

(3.9)

3.3.2. Media unei variabile de tip alternativ

n cazul n care variabila studiat este de tip alternativ (dihotomic),


atunci celor dou variante de rspuns (afirmativ i negativ) li se vor acorda,
convenional, valorile numerice 1 i, respectiv, 0. Pentru calculul mediei
aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3
Varianta de rspuns

xi

Frecvene ni

Frecvene relative n *i

Afirmativ

Negativ

n-m

m
=f
n
nm
= 1 f
n

Total

STATISTIC ECONOMIC
2

x=

xini

i =1

1 m + 0(n m ) m
= =f
n
n

(3.10)

3.3.3. Indicatori de poziie

Indicatorii medii de poziie sunt: modul i mediana. Mediana face


parte din indicatorii (mai generali) de poziie, numii cuantile, alturi de
cuartile, decile etc.
3.3.3.1 Valoarea modal
Modul (M0) reprezint valoarea cel mai des ntlnit ntr-o serie
statistic sau cea care are cea mai mare frecven de apariie.
n cazul seriilor de distribuie de frecvene pe intervale de variaie,
determinarea modului presupune mai nti, identificarea intervalului cu frecven maxim (int M0). Apoi, modul se poate determina conform relaiei:

d1
h M 0
M 0 = x inf M 0 +
d1 + d 2
unde: xinfMo reprezint limita inferioar a intervalului modal;
h M0 reprezint mrimea intervalului modal;
d1

(3.11)

reprezint diferena dintre frecvena intervalului modal i a celui

precedent;
d2

reprezint diferena dintre frecvena intervalului modal i a celui

urmtor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modal este:
(76 51)
M 0 = 60 +
30 = 69,74 minute
(76 51) + (76 24)

O distribuie cu un singur mod se numete unimodal (fig. 3.3a),


o distribuie este bimodal dac are dou valori dominante (moduri) (fig.
3.3b) i multimodal dac are mai mult de dou moduri (fig. 3.3c).

CAPITOLUL 3
y

Frecvene

Frecvene

Frecvene
o

M0
a)

x o

M01

M02

x o

M01

M02

M03

c)

b)

Fig. 3.3 - Distribuie de frecvene: a) unimodal; b) bimodal; c) multimodal

3.3.3.2 Mediana
Mediana (Me) este un indicator mediu de poziie care face parte din
categoria cuantilelor. Ea reprezint valoarea/varianta din mijlocul unei serii
de date, serie n care observaiile au fost ordonate cresctor (sau descresctor).
Dac datele au fost sistematizate ntr-o serie de distribuie de frecvene pe variante, pentru determinarea medianei vom calcula, mai nti,
frecvenele cumulate (Fci). Prima frecven cumulat mai mare dect
(n+1)/2, adic mai mare dect locul medianei, ne indic varianta median.
EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au sistematizat datele privind numrul membrilor de familie, rezultnd distribuia
de frecvene (Tabelul 3.4):
Numrul membrilor de
familie
1
2
3
4
5
Total

Numr de familii ni
12
23
30
8
7
80

Tabelul 3.4
Frecvene cumulate Fci
12
35
65
73
80

Varianta 3 membrii de familie reprezint varianta median, situat


n mijlocul distribuiei;
Pentru o serie de repartiie de frecvene pe intervale de variaie
(date de tip continuu), mediana se va ncadra n intervalul median, primul

STATISTIC ECONOMIC

interval cu frecvena cumulat mai mare dect locul (rangul, poziia) medianei.
1 r

n i + 1 FC( Me1)
2 i=1

n Me

Me = x inf Me + h Me

(3.12)

unde:
x inf Me reprezint limita inferioar a intervalului median;

reprezint mrimea intervalului median;


1 r
n +1
reprezint locul medianei n serie;
n i + 1 =
2 i =1
2

FC(Me - 1) reprezint frecvena cumulat a intervalului anterior celui


median;
nMe reprezint frecvena absolut a intervalului median.
h Me

EXEMPLUL

3.7:

100,5 98
Me = 60 + 30
61
76

Pe

baza

datelor

din

Tabelul

3.1,

minute

3.3.3.3. Relaia dintre mod, median i medie


Me

Pentru o distribuie simetric, media, mediana i modul coincid (Fig.


3.3a). Dac distribuia este cu tendin de normalitate dar pozitiv nclinat,
spre valori mari (cu coada mai lung a distribuiei spre valorile mari) atunci
x > Me > M 0 (Fig. 3.4b); dac distribuia este moderat oblic i negativ
ncheiat, spre valorile mici (cu coada mai lung a distribuiei spre valorile
mici, atunci x < Me < M 0 (Fig. 3.4c). n general, pentru repartiii moderat
asimetrice, exist o relaie empiric ntre cele trei valori i anume:

M 0 x 3 Me x

(3.13)

CAPITOLUL 3

x=Me=Mo

Mo Me x

x Me Mo

Fig. 3.4 - a) distribuie simetric; b) distribuie cu asimetrie pozitiv;


c) distribuie cu asimetrie negativ

3.3.3.4. Cuantilele
Cuantilele, categorie de indicatori de poziie din care face parte i
mediana, pot fi uor nelese intuitiv prin extinderea noiunii de median i
reprezint valori ce mpart seria n pri egale.

Astfel,
cuartilele (cuantile
patru) mpart seria
pri egale, ele
delimitnd
cte
observaii. Ele sunt
de trei: Q1, Q2, Q3
3.5); Q1 se numete
inferioar, Q2 este
ntotdeauna
cu
Q3 se numete

de ordin
n patru

Frecvene relative

25% din
n numr
25% 25% 25% 25%
(fig.
x
Q1 Q2=Me Q3
o
cuartila
Fig. 3.5 - Cuartilele ntr-o serie de repartiie
egal
mediana,
cuartila superioar.
Similar se pot determina cuantile de ordin superior, ca de pild
decilele (care sunt D1, ...., D9 i delimiteaz cte 10% din observaii, D5 =
Me) ori percentile (delimiteaz cte 1% din observaii).
3.3.4. Alte tipuri de medii
3.3.4.1. Media armonic

( )

Media armonic x h este o medie de calcul cu aplicaii speciale,


care se determin, pentru o serie de date cantitative, ca valoarea invers a

STATISTIC ECONOMIC

mediei aritmetice, calculat din inversele valorilor seriei. Aadar media


armonic simpl este:
n
xh = n
(3.14)
1

i =1 x i
Pentru o serie de distribuie de frecvene, media armonic ponderat
este:
r

xh =

ni

i =1

1
ni
i =1 x i
1
xh = r
1 *
ni
i =1 x i
100
xh = r
1 *%
ni
i =1 x i
r

(3.15)

(3.16)

(3.17)

EXEMPLUL 3.8: Un conductor auto cumpr ulei de motor, la preul


de 90.000 lei/litru, n valoare total de 450.000 lei dintr-un magazin, iar din
alt magazin, la preul de 120.000 lei/litru, n valoare total de 480.000 lei.
Care a fost preul mediu pe litru, pe care l-a pltit?
p=

450000 + 480000
vi
vi
=
=
= 103333,3
1
1
1
qi v

450000
+

480000
i
pi
90000
120000

lei/litru

3.3.4.2. Media ptratic


Media ptratic x p este tot o medie de calcul cu aplicaii speciale
i reprezint valoarea care, nlocuind termenii seriei, nu modific suma
ptratelor lor. Aadar:
n

xp =

xi

i =1

(3.18)

CAPITOLUL 3

Pentru o serie de distribuie de frecvene, media ptratic ponderat


este:
r

xi ni

i =1
r

xp =

(3.19)

ni

i =1

2 *

xi ni

i =1

xp =

1
r

2 *%

xi ni

i =1

xp =

(3.20)

100

(3.21)

3.3.4.3. Media geometric

( )

Media geometric x g se calculeaz ca rdcina de ordinul n din


produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
nlocuind termenii seriei nu modific produsul lor:
n

xg = n xi
i =1

(3.22)

Pentru o serie de distribuie de frecvene, media geometric se


calculeaz ca:
r

ni

x g = i =1 x in i
i =1

ntre mediile de calcul prezentate exist relaia:


xh xg x xp

(3.23)

(3.24)

STATISTIC ECONOMIC

3.4. INDICATORI AI VARIABILITII

n analiza unei serii statistice de date cantitative ne intereseaz, pe


lng indicatorii tendinei centrale i indicatorii variabilitii, ai mprtierii
valorilor. Astfel, dou serii statistice pot diferi prin tendina central (Fig 3.6a),
prin mprtierea datelor (Fig. 3.6b) sau prin amndou (Fig. 3.6c).
y

a)

b)

c)

Fig. 3.6 - a) Distribuii cu tendin central diferit; b) Distribuii cu variabilitate


diferit; c) Distribuii cu tendin central i variabilitate diferite

3.4.1. Indicatori simpli ai variabilitii

Aceti indicatori msoar mprtierea valorilor individuale ale


seriei, una fa de alta, ori fa de o valoare tipic.
3.4.1.1. Amplitudinea variaiei
Amplitudinea variaiei (Ax) se calculeaz ca valoarea maxim
minus valoarea minim a variabilei:
(3.25)
Ax = xmax xmin

n expresie relativ amplitudinea se calculeaz ca:


A%
x =

x max x min
x

100

(3.26)

3.4.1.2. Abaterea intercuartilic i semiintercuartilic

Un alt indicator simplu al variaiei este abaterea intercuartilic:


A Q = Q 3 Q1

(3.27)

CAPITOLUL 3

Indicatorul are unitatea de msur a variabilei studiate i uneori se


folosete i valoarea sa njumtit, indicator cunoscut ca abaterea
semiintercuartilic:
A Q =

Q 3 Q1
2

(3.28)

3.4.1.3. Abaterea individual

Un alt indicator simplu al variaiei este abaterea individual:


di = xi x

(3.29)

care ne arat mprtierea fiecrei valori de la nivelul mediu.


Abaterea individual se poate calcula i n expresie relativ:

d i% =

xi x
x

(3.30)

De asemenea, prezint interes abaterea maxim pozitiv:


d +max = x max x

(3.31)

i abaterea maxim negativ:


d max = x min x

(3.32)

3.4.2. Indicatori sintetici ai variabilitii


3.4.2.1. Abaterea medie liniar
O prim soluie la care putem apela pentru a surprinde, printr-o
singur msur, ntreaga mprtiere din serie este s calculm media
abaterilor individuale. Dar, pentru c aceste abateri se compenseaz

STATISTIC ECONOMIC

reciproc, trebuie s le considerm n valoare absolut. Obinem, astfel,


abaterea medie liniar d x calculat pentru o serie simpl:

( )

dx =

xi x

i =1

(3.33)

iar n cazul unei serii de distribuie de frecvene:


r

dx =

xi x ni

i =1

(3.34)

ni

i =1
r

dx =

x i x n *i%

i =1

(3.35)

100

Abaterea medie liniar se exprim n unitatea de msur a


caracteristicii i ne arat cu ct se abat, n medie, valorile individuale de la
media lor.
EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obinem:
Tabelul 3.5
Timp (min.)

Nr. de persoane (ni)

xi

xi x ni

pn la 30
30-60
60-90
90-120
120 i peste
Total

47
51
76
24
2
200

15
45
75
105
135

1995,15
634,95
1333,8
1141,2
155,1
5260,2

x = 57,45 minute
r

xi x ni

dx

i =1

ni

5260,2
= 26,30
200

min

i =1

3.4.2.2. Dispersia

( )

Dispersia s 2x se calculeaz ca media aritmetic a ptratelor


abaterilor individuale ale valorilor de la tendina central (uzual de la
medie). Pentru o serie simpl, formula dispersiei este:

CAPITOLUL 3

(x i x )
n

s 2x =

i =1

(3.36)

iar pentru o serie de distribuie de frecvene:


(x i x ) n i
r

s 2x =

i =1

(3.37)

ni

i =1

sau, pe baza frecvenelor relative:


(x i x ) n *i%
r

s 2x =

i=1

(3.38)

100

EXEMPLUL 3.10. Pe baza datelor din exemplul nr. 3.2, obinem


Tabelul 3.6

Timp (min.)

Nr. de persoane (ni)

xi

pn la 30
30-60
60-90
90-120
120 i peste
Total

47
51
76
24
2
200

15
45
75
105
135

(x i x ) n i
r

s 2x =

(x i x )2 ni
84694,12
7905,13
23408,19
54264,06
12028,00
182299,50

i =1

ni

182299,5
= 911,4975
200

i =1

Se cuvine s facem i asupra dispersiei cteva observaii i s


remarcm cteva din proprietile sale:
a) Pentru un ir de valori constante, dispersia este nul;
b) Dispersia calculat fa de medie s 2x este mai mic dect orice
alt dispersie calculat fa de o valoare a, cu ptratul distanei dintre
medie i constanta a:
2
s 2x = s a2 (x a )
(3.39)
c) Dac valorile variabilei statistice studiate sunt modificate
(micorate sau mrite) cu constanta a, dispersia seriei rmne
neschimbat;

( )

STATISTIC ECONOMIC

d) Dac valorile variabilei statistice studiate se modific de h ori,


dispersia se modific (n acelai sens) de h2 ori
Rezult i n calculul dispersiei c, dac vom combina proprietile 2
i 4, vom obine formula de calcul simplificat al dispersiei, pentru o serie
simpl:
2

x a
i
h 2
h xa
s 2x = i=1
n
n

)2

(3.40)

i pentru o serie de distribuie de frecvene:


2

xi a
ni
i =1 h
r

s 2x =

h2 x a

ni

)2

(3.41)

i =1

x i a *%
ni
h
s 2x = i=1
h2 x a
100
r

)2

(3.42)

EXEMPLUL 3.11: Pe baza datelor prelucrate n exemplul 3.3, obi-

nem:
Tabelul 3.7
Timp (min)

Frecvene
ni

x a
x i = i
h

<30
30-60
60-90
90-120
120 i peste
Total

47
51
76
24
2
200

-2
-1
0
1
2

2
i

x a
= i

4
1
0
1
4

x i n i

188
51
0
24
8
271

xi a
ni
i =1 h
r

s 2x =

(x )

ni

h2 x a

271
)2 = 200
30 2 (57,45 75)2 = 911,4975

i =1

e) Dispersia se poate calcula i pe baza relaiei:

CAPITOLUL 3
n

s 2x =

x i2
i =1

x =

x i2
i =1
n

n
xi

i=1
n

(3.43)

iar pentru o serie de distribuie de frecvene:


r

x i2 n i

s 2x = i=1

x i2 n i

2
x = i=1

ni

ni

i =1
r

x i2 n *i%

s 2x = i=1

i =1

r
xini

i=1
r
ni

i=1

100

(3.44)

i=1
100

x i2 n *i% x i n *i%

2
x = i=1

100

(3.45)

f) Dac o serie este compus din m serii componente (grupuri),


fiecare serie component fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m i dispersiile seriilor componente:
(x i x j )
nj

s 2x =

i =1

nj

, j = 1, m

(3.46)

Dispersia general a colectivitii poate s fie scris n funcie de dispersiile seriilor componente (grupurilor):
(x j x ) n j

s 2x =

s 2x j n j
j=1
m

n j
j=1

j=1

(3.47)

nj
j=1

Expresia:

s 2x j n j
j=1
m

se numete media dispersiilor pariale

nj
j=1

(grupurilor, seriilor componente) i se noteaz cu s 2x .

STATISTIC ECONOMIC
m

s 2x j n j

j=1
m

sx =

(3.48)

nj
j=1

(x j x ) n j
m

Expresia:

j=1

sintetizeaz mprtierea valorilor de la

nj
j=1

media general, doar ca urmare a aciunii factorului dup care s-au alctuit
grupurile, seriile componente. Aceast expresie se numete dispersia dintre
grupe d 2x :

( )

(x j x ) n j
m

d 2x =

j=1

(3.49)

n j
j=1

Regula de adunare a dispersiilor este, deci:


2

s 2x = s x + d 2x

(3.50)

( )

Putem spune c d 2x explic msura n care factorul de grupare


determin variaia variabilei studiate i s calculm coeficientul de
determinaie:
R2 =

d 2x

(3.51)

s 2x

sau, n expresie procentual, gradul de determinaie:


2
R%
=

d 2x
s 2x

100

(3.52)

Evident, msura n care ali factori (din interiorul grupelor)


determin variaia variabilei, este dat de coeficientul de nedeterminaie:
K2 =

sx
s 2x

= 1 R2

(3.53)

CAPITOLUL 3

sau gradul de nedeterminaie:


2
K%
=

sx
s 2x

2
100 = 100 R %

(3.54)

EXEMPLUL 3.12: O firm ce comercializeaz produse cosmetice a realizat


ntr-o lun de var, prin cele 30 de magazine de desfacere situate pe litoral,
o vnzare medie de 400 milioane lei pe magazin, cu o dispersie a vnzrilor
de 2500; iar prin cele 20 de magazine din zona montan, o vnzare medie de
200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul n care zona de
amplasare a magazinelor determin variaia vnzrilor, vom calcula:
x L n L + x M n M 30 400 + 20 200 16000
x=
=
=
= 320 mil lei
nL + nM
50
50
2

sx =
d 2x =

s 2xL n L + s 2xM n M 2500 30 + 1600 20 107000


=
=
= 2140
nL + nM
50
50

(x L x )2 n L + (x M x )2 n M = (400 320)2 30 + (200 320)2 20 =


nL + nM

50

480000
= 9600
50

s 2x = s x + d 2x = 2140 + 9600 = 11740

Aadar
2
R%
=

d 2x
s 2x

100 =

9600
100 = 81,77%
11740

3.4.2.3. Dispersia unei variabile de tip alternativ

Pentru o variabil de tip alternativ, sistematizat ca n tabelul 3.3,


dispersia este:
s f2 = f (1 f )

(3.55)

3.4.2.4. Abaterea medie ptratic

n studiul variabilitii datelor se folosete rdcina ptrat a


dispersiei, indicator numit abaterea medie ptratic:

STATISTIC ECONOMIC

(x i x )
n

i =1

s x = s 2x =

(3.56)

pentru o serie simpl, iar pentru o serie de distribuie de frecvene:


(x i x ) n i
r

sx =

i =1

(3.57)

ni

i =1

(x i x ) n *i%
r

sx =

i =1

(3.58)

100

Abaterea medie ptratic (numit i abatere tip, abatere


standard, deviaie standard sau ecart tip) este calculat ca o medie
ptratic din abaterile termenilor seriei de la media lor. O regul empiric ne
spune c, pentru serii de distribuie de frecvene cu tendin de normalitate
(simetrice sau moderat asimetrice), abaterea medie liniar reprezint
aproximativ patru cincimi din abaterea medie ptratic:
dx

4
sx
5

(3.59)

iar abaterea semiintercuartilic aproximativ dou treimi din abaterea standard:


A Q

2
sx
3

(3.60)

EXEMPLUL 3.13 Pe baza datelor din Exemplul 3.2, obinem:


s x = s 2x = 911,4975 = 30,19

minute

d x 26,30
=
0,87
sx
30,19

3.4.2.5. Coeficientul de variaie

Pentru asigurarea comparabilitii mprtierii datelor se folosete


expresia relativ a variabilitii, coeficientul de variaie:

CAPITOLUL 3
s
v = x 100
x

(3.61)

Cu ct valoarea coeficientului de variaie este mai mic, cu att acest


lucru semnific o omogenitate crescut a datelor.
EXEMPLUL 3.14. Pentru seriile de date:
A: 10; 11; 12; 13; 14; 15; 16
B: 60; 61; 62; 63; 64; 65; 66
vA =
vB =

sxA
xA
sx B
xB

100 =

2
100 = 15,4%
13

100 =

2
100 = 3,2%
63

Evident, variabilitatea relativ este mai sczut n seria B.


3.4.2.6. Interpretarea abaterii medii ptratice

O regul empiric, care se aplic distribuiei normale simetrice sau


moderat asimetrice, ne spune c:
aproximativ 68%din valori se situeaz n intervalul x x ;
aproximativ 95% din valori se situeaz n intervalul x 2 x ;
aproximativ 99,8% din valori se situeaz n intervalul x 3 x .
(fig. 3.7)

13,5%

34%

34%

13,5%

2,5%
o 2,5%
x
x-
x+
x-3 x-2
x+2 x+3
Amplitudine

Figura 3.7 - Relaia dintre amplitudine i


abaterea medie ptratic

STATISTIC ECONOMIC

3.5. INDICATORI AI FORMEI DISTRIBUIEI

Forma unei distribuii de frecvene se analizeaz, comparativ cu


distribuia ideal, normal, prin: indicatori asimetrici (oblicitii) i
indicatori ai boltirii (excesului).
3.5.1. Indicatori ai asimetriei (oblicitii)
Asimetria, n valoare absolut, se poate msura cu indicatorii:

(3.62)

AS = x M 0

sau

A S1 = 3 x Me

(3.63)

indicatori care au unitatea de msur a variabilei studiate i care sunt pozitivi sau negativi, n funcie de tipul de asimetrie (coada mai lung a distribuiei spre valorile mari sau spre valorile mici).
Coeficientul de asimetrie (Pearson) este:
C as =

x M0
sx

(3.64)

coeficient care ia valori pozitive n cazul curbelor alungite spre dreapta


(asimetrie pozitiv) i valori negative n cazul curbelor alungite spre stnga
(asimetrie negativ). Coeficientul de asimetrie poate s fie scris i pe baza
relaiei dintre medie i median:
C as1 =

3 x Me
sx

(3.65)

EXEMPLUL 3.15. Pentru datele din Tabelul 3.2, prelucrate, obinem:


C as =

x M 0 57,45 69,74
=
= 0,407
sx
30,19

CAPITOLUL 3
C as1 =

3 x Me 57,45 61
=
= 0,118
sx
30,19

ceea ce semnific o asimetrie negativ moderat (coada mai lung a distribuiei nspre valorile mici).
Analiza oblicitii (asimetriei) se poate face i pe baza momentelor
centrate de ordin 3:

(x i x )
n

m 3 = i =1

(3.66)

sau, utiliznd frecvene:

(x i x ) n i
r

m 3 = i =1

ni

(x i x ) n *i%
r

= i =1

100

(3.67)

i =1

Coeficientul de asimetrie (Fisher) este:


1 =

m3
s 3x

m 32
m 32

(3.68)

Coeficientul 1 va avea valoare mai mare dect zero n cazul


asimetriei pozitive, valoare mai mic dect zero n cazul asimetriei negative
i va fi egal cu zero n cazul seriei perfect simetrice.
3.5.2. Indicatorii de poziie i forma distribuiei

O msur alternativ asimetriei poate s fie dat i de:


ASQ=Q3+Q1-2Me

(3.69)

dar, pentru a o exprima n coeficieni adimensionali, o vom raporta la indicatorul de mprtiere abaterea intercuartilic AQ (3.60) i obinem
coeficientul de asimetrie (Yule i Kendall):
C asq =

(Q 3 Me) (Me Q1 ) Q 3 + Q1 2Me


=
(Q 3 Me) + (Me Q1 )
Q 3 Q1

(3.70)

STATISTIC ECONOMIC

Pe baza indicatorilor de poziie se poate alctui un rezumat al celor


cinci indicatori, care ofer informaii privind tendina central, dar i forma
distribuiei studiate. Aceste cinci valori sunt:
valoarea, minim xmin (denumit, uneori, percentila 0);
cuartila inferioar Q1 (delimiteaz cele mai mici 25% din valori);
mediana Me (delimiteaz50% din valori);
cuartila superioar Q3 (delimiteaz cele mai mari 25% din valori);
valoarea maxim xmax (denumit, uneori, a 100-a percentil).
Cele cinci valori se reprezint grafic prin intermediul diagramei
Box-Plot (fig. 3.8). Pe grafic pot fi marcate i media i modul.

Q1

X m in
25%

Q3

Me
25%

25%

X m ax
25%

Fig. 3.8 - Diagrama Box-Plot

3.6. MRIMI RELATIVE


DEFINIIE: Mrimile relative reprezint rezultatul comparrii sub
form de raport a doi indicatori statistici: un indicator comparat (raportat) i
un indicator de baz de comparaie (baz de raportare).

Forma general a unei mrimi relative este:


x k
10
y
unde: z reprezint indicatorul relativ;
x reprezint indicatorul comparat;
y reprezint indicatorul baz de comparaie;
z=

(3.71)

CAPITOLUL 3

k reprezint un numr ntreg ce poate fi egal cu:


k=0 i atunci exprimarea se face n coeficieni;
k=2 i atunci exprimarea se face n procente (%);
k=3, k=4, k=5 ,exprimarea se face n promile (0/00), respectiv
prodecimile (0/000) i procentimile (0/0000).
3.6.1. Mrimi relative de structur
Mrimile relative de structur se calculeaz sub forma unui raport
ntre parte i ntreg, prezentnd astfel structura colectivitilor statistice
sistematizate att dup variabile cantitative ct i dup variabile calitative.
Mrimile relative de structur pot fi: greuti specifice (ponderi) i frecvene
relative.
Greutatea specific (ponderea) este:
g ix =

xi

(3.72)

xi

i =1

xi

g ix % =

(3.73)

100

xi

i =1

i ne arat ponderea nivelului caracteristicii dintr-o unitate n nivelul total al


caracteristicii din colectivitatea statistic.
Dac datele au fost sistematizate pe grupe/clase, atunci greutatea
specific este:
ni

g ix =

x ij

j=1
r ni

(3.74)

x ij

i =1 j=1
ni

g ix % =

x ij

j=1
r ni

x ij

i =1 j=1

100

(3.75)

STATISTIC ECONOMIC

EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules i
sistematizat date privind producia zilnic realizat de muncitori (Tabelul
3.8)
Judeul/Filiala

Tabelul 3.8
Producia individual (buc.)

Numr de muncitori

Alba/A
Bacu/B
Constana/C

4
3
6

120;130;120;90
80;120;100;
140;70;90;100;110;120

Filiala

Producia pe
filial (buc.)

A
B
C
Total

Structura produciei pe
filiale (%)

460
300
630
1390

33,09
21,58
45,33
100,00

Tabelul 3.9
Structura
colectivitii de
muncitori (%)
3

30,77
23,08
46,15
100,00

Tot mrimi relative sunt i frecvenele relative.


3.6.2. Mrimi relative de coordonare
Mrimile relative de coordonare se calculeaz ca un raport ntre
dou niveluri ale aceluiai indicator statistic, niveluri situate pe aceeai
treapt de agregare: unitate, grup, colectivitate statistic.
x
(3.76)
k ix j = i
xj

Rezultatul ne arat de cte ori este mai mare (dac rezultatul este
supraunitar), sau mai mic (dac rezultatul este subunitar) nivelul variabilei
n unitatea (grupa, colectivitatea) i fa de nivelul variabilei n unitatea
(grupa, colectivitatea) j.
Exprimarea rezultatului mrimii relative de coordonare (numit i
raport de coordonare) se poate face i n procente .
Reprezentarea grafic a mrimilor relative de coordonare se face
prin intermediul diagramei prin benzi, coloane ori suprafee.

CAPITOLUL 3

Pe baza datelor din Tabelul 3.8, col. 1 i din Tabelul 3.9,


col.1,obtinem (vezi Tabelul 3.10):
Tabelul 3.10
Raport de coordonare
Pentru numrul de muncitori
Pentru producie

Filiala
0

A
B
C

1,33
1,00
2,00

1,53
1,00
2,10

3.6.3. Mrimi relative de intensitate


Mrimile relative de intensitate au forma general:
x
z=
y

(3.77)

La nivelul ntregului (alctuit din uniti, grupe etc.):


n

Z=

i =1
n

i =1

zy

i =1
n

(3.78)

z gi

i =1

i =1

Reprezentarea grafic a mrimilor relative de intensitate se face cu


ajutorul diagramelor prin coloane, prin benzi ori prin suprafee.
Pe baza datelor din Tabelul 3.8, col.1 i Tabelul 3.9, col.1, putem
calcula producia obinut de un muncitor (buci pe muncitor) (Tabelul
3.11):
Filiala

Tabelul 3.11
Productivitatea muncii (buc./muncitor)

A
B
C
Total

115
100
105
106,92

STATISTIC ECONOMIC

3.6.4. Mrimi relative de dinamic


Mrimile relative de dinamic sunt folosite pentru analiza
evoluiei n timp a fenomenelor social-economice.
x
i 1x 0i = 1i
(3.79)
x 0i
x
i 1x 0 = 1i 100
(3.80)
x 0i
De remarcat c, la nivel totalizator (de ntreg), calculm indicii ntruna din variantele:
- ca medie aritmetic a indicilor individuali:
n

I1x0 =

x1i

i =1
n

x 0i

i1x 0i x 0i

i =1

= i1x 0i g 0xi =
i=1

(3.81)

x 0i

i =1

i =1

- ca medie armonic a indicilor individuali:


n

I1x0 =

1
1

x
i =1 i1 0i

g1xi

x1i

i =1

x
i =1 i1 0i

(3.82)

x1xi

Evident, pentru o exprimare procentual, rezultatele se nmulesc cu 100.


Reprezentarea grafic a mrimilor relative de dinamic se poate face
prin diagrama prin coloane, benzi, ori suprafee.
3.6.5. Mrimi relative ale planului (prevederilor)
Mrimile relative ale planului sunt:
mrimea relativ (indicele) sarcinii programate:
i px 0i =

x pi
x 0i

(3.83)

CAPITOLUL 3

i px %0i =

x pi
x 0i

100

(3.84)

mrimea relativ (indicele) realizrii prevederilor (programului):


i 1x pi =

x 1i
x pi

(3.85)

i 1x %pi =

x 1i
100
x pi

(3.86)

Se observa ca:

i px %0i i 1x %
pi =

x pi x 1i x 1i

=
= i 1x 0i
x 0i x pi x 0i

(3.87)

Reprezentarea grafic a mrimilor relative ale prevederilor se face cu


ajutorul diagramei prin coloane, benzi ori suprafee.

STATISTIC ECONOMIC

ntrebri recapitulative
1. Ce este indicatorul statistic?
2. Care sunt funciile indicatorilor statistici?
3. Ce sunt indicatorii statistici? Cum se obin ei?
4. Ce sunt indicatorii tendinei centrale?
5. Care sunt principalele tipuri de indicatori ai tendinei centrale?
6. Media aritmetic: definiie, proprieti, observaii, utilizri.
7. Care sunt indicatorii de poziie?
8. Modul: definiie, calcul, utilizri, proprieti.
9. Mediana: definiie, calcul, utilizri, proprieti
10. Cum se determin mediana pentru o serie de distribuie pe variante?
Dar pe intervale de variaie?
11. Analiza comparativ a celor trei indicatori ai tendinei centrale.
12. Ce sunt cuantilele?
13. Care este semnificaia cuantilelor de ordin 4?
14. Media armonic: definiie, calcul, utilizri, proprieti.
15. Media ptratic: definiie, calcul, utilizri, proprieti.
16. Media geometric: definiie, calcul, utilizri, proprieti.
17. Ce se nelege prin variabilitatea datelor statistice?
18. Necesitatea msurrii variabilitii.
19. Ce este amplitudinea datelor? Calcul i interpretare.
20. Care sunt indicatorii simpli ai variabilitii?
21. Ce reprezint abaterea medie liniar?
22. Dispersia: determinare, observaii, proprieti.
23. Cum se determin media i dispersia unei variabile alternative?
24. Cum se determin abaterea medie ptratic? Semnificaie, utilizri.
25. Coeficientul de variaie: calcul, utilizri.
26. Cum se compune dispersia pentru o serie structurat n serii componente?
27. Cum se interpreteaz abaterea medie ptreatic folosind regula
empiric?
28. Ce reprezint oblicitatea unei repartiii?
29. Cum se analizeaz asimetria (oblicitatea) unei repartiii?
30. Cum se analizeaz boltirea/aplatizarea unei repartiii?
31. Cum se poate studia forma distribuiei folosind indicatorii de poziie?
32. Cum se construiete i interpreteaz diagrama Box-Plot?
33. Cum se obin indicatorii statistici derivai?
34. Ce sunt mrimile relative?

CAPITOLUL 3

35. Mrimile relative de structur: definiie, utilizare, reprezentare grafic, exemple.


36. Mrimile relative de coordonare: definiie, utilizare, reprezentare grafic, exemple.
37. Mrimile relative de intensitate: definiie, utilizare, reprezentare grafic, exemple.
38. Mrimile relative de dinamic: definiie, utilizare, reprezentare grafic, exemple.
39. Mrimile relative ale planului: definiie, utilizare, reprezentare grafic, exemple.
40. Care sunt cele trei proprieti pe care urmrim s le analizm i s le
descriem n analiza unui set de date numerice?

S-ar putea să vă placă și