Sunteți pe pagina 1din 33

CAPITOLUL 3

CAPITOLUL 3

ANALIZA ŞI DESCRIEREA NUMERICĂ A


SERIILOR STATISTICE UNIVARIATE

Consideraţii preliminare
Cel mai adesea, urmărim să caracterizăm prin indicatori statistici —
măsuri cantitative — datele statistice pe care le avem la dispoziţie. Scopul
capitolului următor este să prezinte indicatorii statistici, primari şi derivaţi,
simpli şi sintetici, ce se folosesc în mod frecvent pentru caracterizarea
statistică a seriilor statistice.
Vom putea, astfel, să analizăm tendinţa centrală, dar şi variabilitatea
datelor, forma distribuţiilor şi concentrarea datelor.
Să notăm şi faptul că, datorită particularităţilor lor, indicatorii
statistici ai seriilor cronologice vor fi trataţi într-un capitol distinct.

Termeni cheie
abatere individuală indicator
abatere intercuartilică indicatori de poziţie
abatere medie liniară indicatori derivaţi
abatere medie pătratică indicatori primari
abatere semiintercuartilică mărime medie
amplitudine mărimi relative
aplatizare. mediană
asimetrie medie aritmetică
boltire medie armonică
coeficient de determinaţie medie geometrică
coeficient de variaţie medie pătratică
cuantile mod
cuartile percentile
decile regula de adunare a dispersiilor
diagramă Box- Plot variabilitate
dispersie
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

3.1. INTRODUCERE

În acest capitol, vom continua să examinăm modalităţile prin care


putem să rezumăm seturile de date statistice, în aşa fel încât trăsăturile lor
esenţiale să poată fi puse în evidenţă. În capitolele precedente, am învăţat
cum să grupăm datele brute într-o formă mai uşor de interpretat şi cum să
construim diferite reprezentări grafice ale datelor sistematizate. Având la
dispoziţie un set de date numerice, am început analiza statistică prin
determinarea valorii maxime şi valorii minime, apoi am determinat o
distribuţie de frecvenţe, histograma şi poligonul frecvenţelor. Aceste
instrumente au permis identificarea formei aproximative a distribuţiei şi au
indicat în jurul cărei valori sunt mai concentrate nivelurile individuale ale
variabilei.
Deşi o distribuţie de frecvenţe este, cu siguranţă, utilă în conturarea
unei idei de ansamblu privind distribuţia datelor între cele două valori
extreme, vom dori, în continuare, să rezumăm mai mult datele, calculând
câţiva indicatori statistici descriptivi. Indicatorii numerici descriptivi oferă
valori precise şi determinate în mod obiectiv, valori care pot fi uşor folosite,
interpretate şi comparate una cu alta. Pe scurt, aceştia permit o analiză mai
atentă a datelor, faţă de impresia generală pe care o oferă prezentarea datelor
sub formă de serii, tabele şi grafice.

3.2. INDICATORI STATISTICI PRIMARI ŞI DERIVAŢI

DEFINIŢIE: Indicatorul statistic — în sens larg — reprezentă expresia


numerică a unor fenomene şi procese social-economice, definite în timp,
spaţiu şi structură organizatorică.

Indicatorii statistici pot fi primari şi derivaţi.

Indicatorii primari se obţin, de regulă, în etapa de sistematizare a


datelor statistice, prin centralizarea şi agregarea acestora.
CAPITOLUL 3

Indicatorii derivaţi se obţin prin prelucrarea mărimilor absolute ale


indicatorilor primari.

Cele trei proprietăţi majore ale seriilor de date numerice, pe care le


putem analiza folosind indicatorii statistici sunt cele privitoare la tendinţa
centrală, la variabilitatea şi la forma distribuţiilor.

3.3. INDICATORI AI TENDINŢEI CENTRALE

O clasificare a indicatorilor tendinţei centrale se poate face, în


funcţie de modul de determinare a lor, în:
— indicatori (mărimi) medii de calcul: media aritmetică, armonică,
pătratică, geometrică etc.;
— indicatori medii de poziţie: modul, mediana.
Indicatorii fundamentali ai tendinţei centrale sunt: media
aritmetică, modul şi mediana, dar în anumite cazuri speciale putem apela
şi la alte tipuri de medii.

3.3.1. Media aritmetică

Media aritmetică (x ) reprezintă valoarea care înlocuind toţi


termenii unei serii nu modifică nivelul lor totalizator şi se calculează ca
suma valorilor raportată la numărul lor.
n
¦ xi
i =1
x= (3.1)
n
EXEMPLUL 3.1: Vechimea în muncă a fost înregistrată pentru cinci
salariaţi ai unei firme şi anume: 7, 5, 6,7 şi 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x= = = 6,6 ani
5 5
Observăm din fig. 3.1. cum media aritmetică pune în balanţă toate
valorile individuale:

5 6 7 8
X =6,6 ani
Fig. 3.1. Balansarea valorilor individuale prin calculul mediei
STATISTICĂ ECONOMICĂ

De asemenea, dacă vom considera următoarele date privind


vechimea în muncă, vom observa cum media aritmetică este afectată de
valorile extreme. Astfel, dacă presupunem că datele pentru vechimea în
muncă a 10 salariaţi sunt: 5, 4, 5, 5, 6, 6, 4 şi 20, atunci vechimea medie
este:
5 + 4 + ... + 4 + 20
x= = 6,6 ani
10

0 5 10 15 20
X =6,6 ani
Fig. 3.2. Balansarea valorilor individuale prin calculul mediei

În cazul în care datele au fost sistematizate într-o serie de distribuţie


(
de frecvenţe, în care valorile / centrele intervalelor de variaţie x i , i = 1, r )
apar cu frecvenţele ni media aritmetică (numită şi medie aritmetică
ponderată) este:
r
¦ xini
i =1
x= r
(3.2)
¦ ni
i =1

EXEMPLUL 3.2: Presupunem că pentru 200 de persoane s-au siste-


matizat datele culese cu privire la timpul zilnic petrecut în faţa televizorului,
rezultând (Tabelul 3.1):
Tabelul 3.1
Timp (min.) Număr de persoane xi xi • ni
(frecvenţe) ni
Până la 30 47 15 705
30-60 51 45 2295
60-90 76 75 5700
90-120 24 105 2520
120 şi peste 2 135 270
Total 200 – 11490
CAPITOLUL 3

r
¦ xini
i =1 11490
x= r
= = 57,45 minute
200
¦ ni
i =1

Asupra mediei aritmetice sunt de făcut câteva observaţii şi de


subliniat câteva proprietăţi:

a) Pentru un şir de valori constante, media este egală cu constanta;


b) Media are întotdeauna valoarea cuprinsă între valoarea minimă
din serie (xmin) şi valoarea maximă (xmax);
c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este
întotdeauna egală cu zero (adică distanţele faţă de centru se balansează, se
compensează perfect);
d) Dacă valorile individuale ale unei variabile sunt mărite sau
micşorate cu constanta „a“, atunci media se modifică şi ea, în acelaşi sens,
cu aceeaşi constantă „a“;
e) Dacă valorile individuale ale unei variabile sunt modificate de h
ori, media se modifică şi ea de h ori;

Din aceste două proprietăţi, d) şi e), rezultă formula de calcul


simplificat al mediei aritmetice, pentru valori reduse cu constanta „a“ şi de h
§ x −a ·
ori ¨ x ’i = i , i = 1, n ¸ :
© h ¹
n n x −a

¦ xi ¦ i
x = i =1 ⋅ h + a = i =1 h ⋅ h + a (3.3)
n n
iar pentru o serie de distribuţie de frecvenţe:
r r x −a

¦ xini ¦ i ni
x = i =1 r
⋅ h + a = i =1 h
r
⋅h +a (3.4)
¦ ni ¦ ni
i =1 i =1

EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 şi atunci:
STATISTICĂ ECONOMICĂ

Tabelul 3.2
Timp (min.) Frecvenţe ni xi xi – a x i’ ⋅ n i
x i’ =
h
< 30 47 15 -2 - 94
30-60 51 45 -1 - 51
60-90 76 60 0 0
90-120 24 105 1 24
120 şi peste 2 135 2 4
Total 200 – – -117
r

¦ xini
i =1 − 117
x= r
⋅h +a = ⋅ 30 + 75 = 57,45 minute
200
¦ ni
i =1

f) Într-o serie de distribuţie de frecvenţe, dacă frecvenţele sunt


modificate de „c“ ori, media rămâne neschimbată.
Dacă „c“ reprezintă volumul total al colectivităţii §¨ n = ¦ n i ·¸ ,
r

© i =1 ¹
ni ni
frecvenţele sunt chiar frecvenţele relative n *i = , i = 1, r şi rezultă,
c n
deci:
r
*
¦ xi ⋅ ni
i =1
x= (3.5)
1
sau, dacă frecvenţele relative au fost exprimate în procente:
r
*%
¦ xi ⋅ ni
i =1
x= (3.6)
100

g) Dacă o serie statistică este alcătuită din mai multe serii


componente, pentru care s-au calculat medii parţiale x j , j = 1, m , atunci( )
media întregii serii poate fi calculată ca o medie aritmetică ponderată din
mediile parţiale:
m
¦ x jn j
j=1
x= m
(3.7)
¦nj
j=1
CAPITOLUL 3

unde nj reprezintă volumul seriei componente j (j = 1, m )

EXEMPLUL 3.4: Într-o colectivitate de 60 de persoane, din care 24 de


sex feminin şi 36 de sex masculin, s-a determinat vârsta medie a persoanelor
de sex feminin x F = 38,1 ani şi vârsta medie a persoanelor de sex masculin
x M = 42,2 ani. Vârsta medie în întreaga colectivitate este:
x F n F + x M n M 24 ⋅ 38,1 + 36 ⋅ 42,2
x= = = 40,56 ani
nF + nM 60

h) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat mediile x şi, respectiv, y , media sumei valorilor individuale (xi +
yi) este întotdeauna egală cu suma mediilor:
x+y=x+y (3.8)

i) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat x şi y , media produsului (xi • yi) este egală cu produsul mediilor,
doar dacă cele două variabile sunt independente:

xy = x ⋅ y (3.9)

3.3.2. Media unei variabile de tip alternativ

În cazul în care variabila studiată este de tip alternativ (dihotomic),


atunci celor două variante de răspuns (afirmativ şi negativ) li se vor acorda,
convenţional, valorile numerice 1 şi, respectiv, 0. Pentru calculul mediei
aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3
Varianta de răspuns xi Frecvenţe ni Frecvenţe relative n *i
Afirmativ 1 m m
=f
n
Negativ 0 n-m n−m
= 1− f
n
Total – n 1
STATISTICĂ ECONOMICĂ

2
¦ xini
i =1 1 ⋅ m + 0(n − m ) m
x= = = =f (3.10)
n n n

3.3.3. Indicatori de poziţie

Indicatorii medii de poziţie sunt: modul şi mediana. Mediana face


parte din indicatorii (mai generali) de poziţie, numiţi cuantile, alături de
cuartile, decile etc.

3.3.3.1 Valoarea modală

Modul (M0) reprezintă valoarea cel mai des întâlnită într-o serie
statistică sau cea care are cea mai mare frecvenţă de apariţie.
În cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie,
determinarea modului presupune mai întâi, identificarea intervalului cu frec-
venţă maximă (int M0). Apoi, modul se poate determina conform relaţiei:

§ d1 ·
M 0 = x inf M 0 + ¨¨ ¸¸ h M 0 (3.11)
© d1 + d 2 ¹
unde: xinfMo reprezintă limita inferioară a intervalului modal;
h M0 reprezintă mărimea intervalului modal;
d1 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
precedent;
d2 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
următor.

EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modală este:
M 0 = 60 +
(76 − 51) ⋅ 30 = 69,74 minute
(76 − 51) + (76 − 24)
O distribuţie cu un singur mod se numeşte unimodală (fig. 3.3a),
o distribuţie este bimodală dacă are două valori dominante (moduri) (fig.
3.3b) şi multimodală dacă are mai mult de două moduri (fig. 3.3c).
CAPITOLUL 3

y y y
Frecvenþe

Frecvenþe
Frecvenþe
M0 x o M01 M02 x o M01 M02 M03 x
o
a) b) c)

Fig. 3.3 - Distribuţie de frecvenţe: a) unimodală; b) bimodală; c) multimodală

3.3.3.2 Mediana

Mediana (Me) este un indicator mediu de poziţie care face parte din
categoria cuantilelor. Ea reprezintă valoarea/varianta din mijlocul unei serii
de date, serie în care observaţiile au fost ordonate crescător (sau descrescă-
tor).
Dacă datele au fost sistematizate într-o serie de distribuţie de frec-
venţe pe variante, pentru determinarea medianei vom calcula, mai întâi,
frecvenţele cumulate (Fci). Prima frecvenţă cumulată mai mare decât
(n+1)/2, adică mai mare decât locul medianei, ne indică varianta mediană.

EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au siste-


matizat datele privind numărul membrilor de familie, rezultând distribuţia
de frecvenţe (Tabelul 3.4):
Tabelul 3.4
Numărul membrilor de Număr de familii ni Frecvenţe cumulate Fci
familie
1 12 12
2 23 35
3 30 65
4 8 73
5 7 80
Total 80 –

Varianta „3 membrii de familie“ reprezintă varianta mediană, situată


în mijlocul distribuţiei;

Pentru o serie de repartiţie de frecvenţe pe intervale de variaţie


(date de tip continuu), mediana se va încadra în intervalul median, primul
STATISTICĂ ECONOMICĂ

interval cu frecvenţa cumulată mai mare decât locul (rangul, poziţia) media-
nei.

1§ r ·
¨ ¦ n i + 1¸ − FC( Me−1)
2 © i=1 ¹
Me = x inf Me + h Me (3.12)
n Me

unde:
x inf Me reprezintă limita inferioară a intervalului median;
h Me reprezintă mărimea intervalului median;
1§ r · n +1
¨ ¦ n i + 1¸ = reprezintă locul medianei în serie;
2 © i =1 ¹ 2
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului anterior celui
median;
nMe reprezintă frecvenţa absolută a intervalului median.

EXEMPLUL 3.7: Pe baza datelor din Tabelul 3.1,


100,5 − 98
Me = 60 + 30 ≈ 61 minute
76

3.3.3.3. Relaţia dintre mod, mediană şi medie


Me

Pentru o distribuţie simetrică, media, mediana şi modul coincid (Fig.


3.3a). Dacă distribuţia este cu tendinţă de normalitate dar pozitiv înclinată,
spre valori mari (cu coada mai lungă a distribuţiei spre valorile mari) atunci
x > Me > M 0 (Fig. 3.4b); dacă distribuţia este moderat oblică şi negativ
încheiată, spre valorile mici (cu coada mai lungă a distribuţiei spre valorile
mici, atunci x < Me < M 0 (Fig. 3.4c). În general, pentru repartiţii moderat
asimetrice, există o relaţie empirică între cele trei valori şi anume:

(
M 0 − x ≈ 3 Me − x ) (3.13)
CAPITOLUL 3

y y y

o x=Me=Mo x o Mo Me x x o x Me Mo x

Fig. 3.4 - a) distribuţie simetrică; b) distribuţie cu asimetrie pozitivă;


c) distribuţie cu asimetrie negativă

3.3.3.4. Cuantilele

Cuantilele, categorie de indicatori de poziţie din care face parte şi


mediana, pot fi uşor înţelese intuitiv prin extinderea noţiunii de mediană şi
reprezintă valori ce împart seria în părţi egale.

y Astfel,
cuartilele (cuantile
Frecvenþe relative

de ordin patru) împart seria


în patru părţi egale, ele
delimitând câte
25% din observaţii. Ele sunt
în număr 25% 25% 25% 25% de trei: Q1, Q2, Q3
(fig. x 3.5); Q1 se numeşte
o Q1 Q2=Me Q3
cuartila inferioară, Q2 este
egală Fig. 3.5 - Cuartilele într-o serie de repartiţie întotdeauna cu
mediana, Q3 se numeşte
cuartila superioară.
Similar se pot determina cuantile de ordin superior, ca de pildă
decilele (care sunt D1, ...., D9 şi delimitează câte 10% din observaţii, D5 =
Me) ori percentile (delimitează câte 1% din observaţii).

3.3.4. Alte tipuri de medii

3.3.4.1. Media armonică

( )
Media armonică x h este o medie de calcul cu aplicaţii speciale,
care se determină, pentru o serie de date cantitative, ca valoarea inversă a
STATISTICĂ ECONOMICĂ

mediei aritmetice, calculată din inversele valorilor seriei. Aşadar media


armonică simplă este:
n
xh = n (3.14)
1
¦
i =1 x i
Pentru o serie de distribuţie de frecvenţe, media armonică ponderată
este:
r
¦ ni
i =1
xh = (3.15)
r 1
¦ ni
i =1 x i
1
xh = r (3.16)
1 *
¦ ni
i =1 x i
100
xh = r (3.17)
1 *%
¦ ni
i =1 x i

EXEMPLUL 3.8: Un conducător auto cumpără ulei de motor, la preţul


de 90.000 lei/litru, în valoare totală de 450.000 lei dintr-un magazin, iar din
alt magazin, la preţul de 120.000 lei/litru, în valoare totală de 480.000 lei.
Care a fost preţul mediu pe litru, pe care l-a plătit?

¦ vi ¦ vi 450000 + 480000
p= = = = 103333,3 lei/litru
¦ qi ¦ v1 1 1
i ⋅ 450000 + ⋅ 480000
pi 90000 120000

3.3.4.2. Media pătratică

Media pătratică x p este tot o medie de calcul cu aplicaţii speciale


şi reprezintă valoarea care, înlocuind termenii seriei, nu modifică suma
pătratelor lor. Aşadar:
n
2
¦ xi
i =1
xp = (3.18)
n
CAPITOLUL 3

Pentru o serie de distribuţie de frecvenţe, media pătratică ponderată


este:

r
2
¦ xi ni
i =1
xp = r
(3.19)
¦ ni
i =1

r
2 *
¦ xi ni
i =1
xp = (3.20)
1

r
2 *%
¦ xi ni
i =1
xp = (3.21)
100

3.3.4.3. Media geometrică

( )
Media geometrică x g se calculează ca rădăcina de ordinul n din
produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
înlocuind termenii seriei nu modifică produsul lor:
n
xg = n ∏ xi (3.22)
i =1
Pentru o serie de distribuţie de frecvenţe, media geometrică se
calculează ca:
r
¦ ni r
x g = i =1 ∏ x in i (3.23)
i =1

Între mediile de calcul prezentate există relaţia:


xh ≤ xg ≤ x ≤ xp (3.24)
STATISTICĂ ECONOMICĂ

3.4. INDICATORI AI VARIABILITĂŢII

În analiza unei serii statistice de date cantitative ne interesează, pe


lângă indicatorii tendinţei centrale şi indicatorii variabilităţii, ai împrăştierii
valorilor. Astfel, două serii statistice pot diferi prin tendinţa centrală (Fig 3.6a),
prin împrăştierea datelor (Fig. 3.6b) sau prin amândouă (Fig. 3.6c).

y y y

o a) x o x o x
b) c)
Fig. 3.6 - a) Distribuţii cu tendinţă centrală diferită; b) Distribuţii cu variabilitate
diferită; c) Distribuţii cu tendinţă centrală şi variabilitate diferite

3.4.1. Indicatori simpli ai variabilităţii

Aceşti indicatori măsoară împrăştierea valorilor individuale ale


seriei, una faţă de alta, ori faţă de o valoare tipică.

3.4.1.1. Amplitudinea variaţiei

Amplitudinea variaţiei (Ax) se calculează ca valoarea maximă


minus valoarea minimă a variabilei:
Ax = xmax — xmin (3.25)

În expresie relativă amplitudinea se calculează ca:

x max − x min
A%
x = 100 (3.26)
x

3.4.1.2. Abaterea intercuartilică şi semiintercuartilică

Un alt indicator simplu al variaţiei este abaterea intercuartilică:

A Q = Q 3 − Q1 (3.27)
CAPITOLUL 3

Indicatorul are unitatea de măsură a variabilei studiate şi uneori se


foloseşte şi valoarea sa înjumătăţită, indicator cunoscut ca abaterea
semiintercuartilică:

Q 3 − Q1
A ’Q = (3.28)
2

3.4.1.3. Abaterea individuală

Un alt indicator simplu al variaţiei este abaterea individuală:

di = xi − x (3.29)

care ne arată împrăştierea fiecărei valori de la nivelul mediu.

Abaterea individuală se poate calcula şi în expresie relativă:

xi − x
d i% = (3.30)
x

De asemenea, prezintă interes abaterea maximă pozitivă:

d +max = x max − x (3.31)

şi abaterea maximă negativă:

d −max = x min − x (3.32)

3.4.2. Indicatori sintetici ai variabilităţii

3.4.2.1. Abaterea medie liniară


O primă soluţie la care putem apela pentru a surprinde, printr-o
singură măsură, întreaga împrăştiere din serie este să calculăm media
abaterilor individuale. Dar, pentru că aceste abateri se compensează
STATISTICĂ ECONOMICĂ

reciproc, trebuie să le considerăm în valoare absolută. Obţinem, astfel,


( )
abaterea medie liniară d x calculată pentru o serie simplă:
n
¦ xi − x
i =1
dx = (3.33)
n
iar în cazul unei serii de distribuţie de frecvenţe:
r
¦ xi − x ni
i =1
dx =
r
(3.34)
¦ ni
i =1
r
¦ x i − x n *i%
i =1
dx = (3.35)
100
Abaterea medie liniară se exprimă în unitatea de măsură a
caracteristicii şi ne arată cu cât se abat, în medie, valorile individuale de la
media lor.

EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obţinem:


Tabelul 3.5
Timp (min.) Nr. de persoane (ni) xi xi − x ni
până la 30 47 15 1995,15
30-60 51 45 634,95
60-90 76 75 1333,8
90-120 24 105 1141,2
120 şi peste 2 135 155,1
Total 200 – 5260,2
x = 57,45 minute
r
¦ xi − x ni
i =1 5260,2
dx
r
= = 26,30 min
200
¦ ni
i =1

3.4.2.2. Dispersia

( )
Dispersia s 2x se calculează ca media aritmetică a pătratelor
abaterilor individuale ale valorilor de la tendinţa centrală (uzual de la
medie). Pentru o serie simplă, formula dispersiei este:
CAPITOLUL 3

∑ (x i − x )
n 2

i =1
s 2x = (3.36)
n
iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2

i =1
s 2x = (3.37)
r
¦ ni
i =1
sau, pe baza frecvenţelor relative:
∑ (x i − x ) n *i%
r 2

i=1
s 2x = (3.38)
100

EXEMPLUL 3.10. Pe baza datelor din exemplul nr. 3.2, obţinem


Tabelul 3.6
Timp (min.) Nr. de persoane (ni) xi
(x i − x )2 ni
până la 30 47 15 84694,12
30-60 51 45 7905,13
60-90 76 75 23408,19
90-120 24 105 54264,06
120 şi peste 2 135 12028,00
Total 200 – 182299,50

¦ (x i − x ) n i
r 2

i =1 182299,5
s 2x = = = 911,4975
r 200
¦ ni
i =1
Se cuvine să facem şi asupra dispersiei câteva observaţii şi să
remarcăm câteva din proprietăţile sale:
a) Pentru un şir de valori constante, dispersia este nulă;
( )
b) Dispersia calculată faţă de medie s 2x este mai mică decât orice
altă dispersie calculată faţă de o valoare “a”, cu pătratul distanţei dintre
medie şi constanta a:
s 2x = s a2 − (x − a )
2
(3.39)
c) Dacă valorile variabilei statistice studiate sunt modificate
(micşorate sau mărite) cu constanta „a“, dispersia seriei rămâne
neschimbată;
STATISTICĂ ECONOMICĂ

d) Dacă valorile variabilei statistice studiate se modifică de h ori,


dispersia se modifică (în acelaşi sens) de h2 ori
Rezultă şi în calculul dispersiei că, dacă vom combina proprietăţile 2
şi 4, vom obţine formula de calcul simplificat al dispersiei, pentru o serie
simplă:
2
n § x −a ·
¦¨ i ¸
s 2x = i=1
© h ¹ 2
n
h − x−a ( )2 (3.40)
şi pentru o serie de distribuţie de frecvenţe:
2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 (3.41)
¦ ni
i =1
2
r§ x i − a · *%
¦¨ ¸ ni
s 2x = i=1
© h ¹
100
h2 − x − a ( )2 (3.42)

EXEMPLUL 3.11: Pe baza datelor prelucrate în exemplul 3.3, obţi-


nem:
Tabelul 3.7
Timp (min) Frecvenţe x −a
(x )
2 2
x ’i = i ’ 2 §x −a· x ’i ⋅ n i
ni h i =¨ i ¸
© h ¹
<30 47 -2 4 188
30-60 51 -1 1 51
60-90 76 0 0 0
90-120 24 1 1 24
120 şi peste 2 2 4 8
Total 200 – – 271

2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 = 200
271
⋅ 30 2 − (57,45 − 75)2 = 911,4975
¦ ni
i =1
e) Dispersia se poate calcula şi pe baza relaţiei:
CAPITOLUL 3

2
n n  n 
∑ x i2 ∑ x i2  ∑ xi 
i =1 2 i =1  
s 2x = −x = −  i=1  (3.43)
n n n
 
 
 
iar pentru o serie de distribuţie de frecvenţe:
2
r r § r ·
¦ x i2 n i ¦ x i2 n i ¨ ¦ xini ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.44)
r r r
¦ ni ¦ ni ¨ ¦ ni ¸
¨ ¸
i =1 i =1 © i=1 ¹
2
r r § r ·
¦ x i2 n *i% ¦ x i2 n *i% ¨ ¦ x i n *i% ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.45)
100 100 100
¨ ¸
¨ ¸
© ¹
f) Dacă o serie este compusă din m serii componente (grupuri),
fiecare serie componentă fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m şi dispersiile seriilor componente:

¦ (x i − x j )
nj
2

i =1
s 2x = , j = 1, m (3.46)
j nj
Dispersia generală a colectivităţii poate să fie scrisă în funcţie de dis-
persiile seriilor componente (grupurilor):
¦ (x j − x ) n j
m m 2
¦ s 2x j n j
j=1 j=1
s 2x = + (3.47)
m m
¦n j ¦nj
j=1 j=1
m
¦ s 2x j n j
j=1
Expresia: m
se numeşte media dispersiilor parţiale
¦nj
j=1

(grupurilor, seriilor componente) şi se notează cu s 2x .


STATISTICĂ ECONOMICĂ

m
¦ s 2x j n j
2 j=1
sx =
m
(3.48)
¦nj
j=1

¦ (x j − x ) n j
m 2

j=1
Expresia: m
sintetizează împrăştierea valorilor de la
¦nj
j=1
media generală, doar ca urmare a acţiunii factorului după care s-au alcătuit
grupurile, seriile componente. Această expresie se numeşte dispersia dintre
( )
grupe d 2x :

¦ (x j − x ) n j
m 2

j=1
d 2x = (3.49)
m
¦n j
j=1

Regula de adunare a dispersiilor este, deci:


2
s 2x = s x + d 2x (3.50)

( )
Putem spune că d 2x explică măsura în care factorul de grupare
determină variaţia variabilei studiate şi să calculăm coeficientul de
determinaţie:
d 2x
R2 = (3.51)
s 2x

sau, în expresie procentuală, gradul de determinaţie:


2 d 2x
R% = 100 (3.52)
s 2x

Evident, măsura în care alţi factori (din interiorul grupelor)


determină variaţia variabilei, este dată de coeficientul de nedeterminaţie:
2
sx
K2 = = 1− R2 (3.53)
s 2x
CAPITOLUL 3

sau gradul de nedeterminaţie:


2
2 sx 2
K% = 100 = 100 − R % (3.54)
s 2x

EXEMPLUL 3.12: O firmă ce comercializează produse cosmetice a realizat


într-o lună de vară, prin cele 30 de magazine de desfacere situate pe litoral,
o vânzare medie de 400 milioane lei pe magazin, cu o dispersie a vânzărilor
de 2500; iar prin cele 20 de magazine din zona montană, o vânzare medie de
200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul în care zona de
amplasare a magazinelor determină variaţia vânzărilor, vom calcula:
x L ⋅ n L + x M ⋅ n M 30 ⋅ 400 + 20 ⋅ 200 16000
x= = = = 320 mil lei
nL + nM 50 50
2 s 2xL n L + s 2xM n M 2500 ⋅ 30 + 1600 ⋅ 20 107000
sx = = = = 2140
nL + nM 50 50

d 2x =
(x L − x )2 n L + (x M − x )2 n M = (400 − 320)2 30 + (200 − 320)2 20 =
nL + nM 50
480000
= = 9600
50
2
s 2x = s x + d 2x = 2140 + 9600 = 11740
Aşadar
2 d 2x 9600
R% = 100 = 100 = 81,77%
s 2x 11740

3.4.2.3. Dispersia unei variabile de tip alternativ

Pentru o variabilă de tip alternativ, sistematizată ca în tabelul 3.3,


dispersia este:

s f2 = f (1 − f ) (3.55)

3.4.2.4. Abaterea medie pătratică

În studiul variabilităţii datelor se foloseşte rădăcina pătrată a


dispersiei, indicator numit abaterea medie pătratică:
STATISTICĂ ECONOMICĂ

¦ (x i − x )
n 2

s x = s 2x = i =1 (3.56)
n
pentru o serie simplă, iar pentru o serie de distribuţie de frecvenţe:

¦ (x i − x ) n i
r 2

i =1
sx =
r
(3.57)
¦ ni
i =1

¦ (x i − x ) n *i%
r 2

sx = i =1 (3.58)
100

Abaterea medie pătratică (numită şi abatere tip, abatere


standard, deviaţie standard sau ecart tip) este calculată ca o medie
pătratică din abaterile termenilor seriei de la media lor. O regulă empirică ne
spune că, pentru serii de distribuţie de frecvenţe cu tendinţă de normalitate
(simetrice sau moderat asimetrice), abaterea medie liniară reprezintă
aproximativ patru cincimi din abaterea medie pătratică:

4
dx ≈ sx (3.59)
5

iar abaterea semiintercuartilică aproximativ două treimi din abaterea stan-


dard:
2
A ′Q ≈ sx (3.60)
3

EXEMPLUL 3.13 Pe baza datelor din Exemplul 3.2, obţinem:


s x = s 2x = 911,4975 = 30,19 minute
d x 26,30
= ≈ 0,87
sx 30,19

3.4.2.5. Coeficientul de variaţie

Pentru asigurarea comparabilităţii împrăştierii datelor se foloseşte


expresia relativă a variabilităţii, coeficientul de variaţie:
CAPITOLUL 3

s
v = x 100 (3.61)
x
Cu cât valoarea coeficientului de variaţie este mai mică, cu atât acest
lucru semnifică o omogenitate crescută a datelor.

EXEMPLUL 3.14. Pentru seriile de date:


A: 10; 11; 12; 13; 14; 15; 16
B: 60; 61; 62; 63; 64; 65; 66
sxA 2
vA = 100 = 100 = 15,4%
xA 13
sx B 2
vB = 100 = 100 = 3,2%
xB 63
Evident, variabilitatea relativă este mai scăzută în seria B.

3.4.2.6. Interpretarea abaterii medii pătratice

O regulă empirică, care se aplică distribuţiei normale simetrice sau


moderat asimetrice, ne spune că:
— aproximativ 68%din valori se situează în intervalul x ± σ x ;
— aproximativ 95% din valori se situează în intervalul x ± 2σ x ;
— aproximativ 99,8% din valori se situează în intervalul x ± 3σ x .
(fig. 3.7)
y
≈34%

≈34%
≈13,5%

≈13,5%

o ≈2,5% ≈2,5%
x-3σ x-2σ x-σ x x+σ x+2σ x+3σ x
Amplitudine

Figura 3.7 - Relaţia dintre amplitudine şi


abaterea medie pătratică
STATISTICĂ ECONOMICĂ

3.5. INDICATORI AI FORMEI DISTRIBUŢIEI

Forma unei distribuţii de frecvenţe se analizează, comparativ cu


distribuţia ideală, normală, prin: indicatori asimetrici (oblicităţii) şi
indicatori ai boltirii (excesului).

3.5.1. Indicatori ai asimetriei (oblicităţii)

Asimetria, în valoare absolută, se poate măsura cu indicatorii:

AS = x − M 0 (3.62)
sau
(
A S1 = 3 x − Me ) (3.63)

indicatori care au unitatea de măsură a variabilei studiate şi care sunt po-


zitivi sau negativi, în funcţie de tipul de asimetrie (coada mai lungă a dis-
tribuţiei spre valorile mari sau spre valorile mici).

Coeficientul de asimetrie (Pearson) este:

x − M0
C as = (3.64)
sx

coeficient care ia valori pozitive în cazul curbelor alungite spre dreapta


(asimetrie pozitivă) şi valori negative în cazul curbelor alungite spre stânga
(asimetrie negativă). Coeficientul de asimetrie poate să fie scris şi pe baza
relaţiei dintre medie şi mediană:

C as1 =
(
3 x − Me ) (3.65)
sx

EXEMPLUL 3.15. Pentru datele din Tabelul 3.2, prelucrate, obţinem:


x − M 0 57,45 − 69,74
C as = = = −0,407
sx 30,19
şi
CAPITOLUL 3

C as1 =
( =
)
3 x − Me 57,45 − 61
= −0,118
sx 30,19
ceea ce semnifică o asimetrie negativă moderată (coada mai lungă a distri-
buţiei înspre valorile mici).

Analiza oblicităţii (asimetriei) se poate face şi pe baza momentelor


centrate de ordin 3:

¦ (x i − x )
n 3

m 3 = i =1 (3.66)
n
sau, utilizând frecvenţe:

¦ (x i − x ) n i ¦ (x i − x ) n *i%
r 3 r 3

m 3 = i =1 = i =1 (3.67)
r 100
¦ ni
i =1
Coeficientul de asimetrie (Fisher) este:
m3 m 32
γ1 = = (3.68)
s 3x m 32
Coeficientul γ 1 va avea valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative
şi va fi egal cu zero în cazul seriei perfect simetrice.

3.5.2. Indicatorii de poziţie şi forma distribuţiei

O măsură alternativă asimetriei poate să fie dată şi de:

ASQ=Q3+Q1-2Me (3.69)

dar, pentru a o exprima în coeficienţi adimensionali, o vom raporta la indi-


catorul de împrăştiere abaterea intercuartilică AQ (3.60) şi obţinem
coeficientul de asimetrie (Yule şi Kendall):

(Q 3 − Me) − (Me − Q1 ) Q 3 + Q1 − 2Me


C asq = = (3.70)
(Q 3 − Me) + (Me − Q1 ) Q 3 − Q1
STATISTICĂ ECONOMICĂ

Pe baza indicatorilor de poziţie se poate alcătui un rezumat al celor


cinci indicatori, care oferă informaţii privind tendinţa centrală, dar şi forma
distribuţiei studiate. Aceste cinci valori sunt:
— valoarea, minimă xmin (denumită, uneori, percentila 0);
— cuartila inferioară Q1 (delimitează cele mai mici 25% din valori);
— mediana Me (delimitează50% din valori);
— cuartila superioară Q3 (delimitează cele mai mari 25% din valori);
— valoarea maximă xmax (denumită, uneori, a 100-a percentilă).

Cele cinci valori se reprezintă grafic prin intermediul diagramei


Box-Plot (fig. 3.8). Pe grafic pot fi marcate şi media şi modul.

X m in Q1 Me Q3 X m ax
25% 25% 25% 25%

Fig. 3.8 - Diagrama Box-Plot

3.6. MĂRIMI RELATIVE

DEFINIŢIE: Mărimile relative reprezintă rezultatul comparării sub


formă de raport a doi indicatori statistici: un indicator comparat (raportat) şi
un indicator de bază de comparaţie (bază de raportare).

Forma generală a unei mărimi relative este:

x k
z= 10 (3.71)
y
unde: z reprezintă indicatorul relativ;
x reprezintă indicatorul comparat;
y reprezintă indicatorul bază de comparaţie;
CAPITOLUL 3

k reprezintă un număr întreg ce poate fi egal cu:


k=0 şi atunci exprimarea se face în coeficienţi;
k=2 şi atunci exprimarea se face în procente (%);
k=3, k=4, k=5 ,exprimarea se face în promile (0/00), respectiv
prodecimile (0/000) şi procentimile (0/0000).

3.6.1. Mărimi relative de structură

Mărimile relative de structură se calculează sub forma unui raport


între parte şi întreg, prezentând astfel structura colectivităţilor statistice
sistematizate atât după variabile cantitative cât şi după variabile calitative.
Mărimile relative de structură pot fi: greutăţi specifice (ponderi) şi frecvenţe
relative.
Greutatea specifică (ponderea) este:
xi
g ix = (3.72)
n
¦ xi
i =1

xi
g ix % = n
100 (3.73)
¦ xi
i =1

şi ne arată ponderea nivelului caracteristicii dintr-o unitate în nivelul total al


caracteristicii din colectivitatea statistică.
Dacă datele au fost sistematizate pe grupe/clase, atunci greutatea
specifică este:

ni
¦ x ij
j=1
g ix = (3.74)
r ni
¦ ¦ x ij
i =1 j=1

ni
¦ x ij
j=1
g ix % = 100 (3.75)
r ni
¦ ¦ x ij
i =1 j=1
STATISTICĂ ECONOMICĂ

EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules şi
sistematizat date privind producţia zilnică realizată de muncitori (Tabelul
3.8)
Tabelul 3.8
Judeţul/Filiala Număr de muncitori Producţia individuală (buc.)
0 1 2
Alba/A 4 120;130;120;90
Bacău/B 3 80;120;100;
Constanţa/C 6 140;70;90;100;110;120

Tabelul 3.9
Filiala Producţia pe Structura producţiei pe Structura
filială (buc.) filiale (%) colectivităţii de
muncitori (%)
0 1 2 3

A 460 33,09 30,77


B 300 21,58 23,08
C 630 45,33 46,15
Total 1390 100,00 100,00

Tot mărimi relative sunt şi frecvenţele relative.

3.6.2. Mărimi relative de coordonare

Mărimile relative de coordonare se calculează ca un raport între


două niveluri ale aceluiaşi indicator statistic, niveluri situate pe aceeaşi
treaptă de agregare: unitate, grupă, colectivitate statistică.
x
k ix j = i (3.76)
xj

Rezultatul ne arată de câte ori este mai mare (dacă rezultatul este
supraunitar), sau mai mic (dacă rezultatul este subunitar) nivelul variabilei
în unitatea (grupa, colectivitatea) i faţă de nivelul variabilei în unitatea
(grupa, colectivitatea) j.

Exprimarea rezultatului mărimii relative de coordonare (numită şi


raport de coordonare) se poate face şi în procente .
Reprezentarea grafică a mărimilor relative de coordonare se face
prin intermediul diagramei prin benzi, coloane ori suprafeţe.
CAPITOLUL 3

Pe baza datelor din Tabelul 3.8, col. 1 şi din Tabelul 3.9,


col.1,obtinem (vezi Tabelul 3.10):
Tabelul 3.10
Filiala Raport de coordonare
Pentru numărul de muncitori Pentru producţie
0 1 2

A 1,33 1,53
B 1,00 1,00
C 2,00 2,10

3.6.3. Mărimi relative de intensitate

Mărimile relative de intensitate au forma generală:


x
z= (3.77)
y

La nivelul întregului (alcătuit din unităţi, grupe etc.):


n n
¦x ¦ z⋅y n
i =1 i =1 y
Z=
n
=
n
= ¦ z ⋅gi (3.78)
i =1
¦y ¦y
i =1 i =1

Reprezentarea grafică a mărimilor relative de intensitate se face cu


ajutorul diagramelor prin coloane, prin benzi ori prin suprafeţe.

Pe baza datelor din Tabelul 3.8, col.1 şi Tabelul 3.9, col.1, putem
calcula producţia obţinută de un muncitor (bucăţi pe muncitor) (Tabelul
3.11):
Tabelul 3.11
Filiala Productivitatea muncii (buc./muncitor)
0 1
A 115
B 100
C 105
Total 106,92
STATISTICĂ ECONOMICĂ

3.6.4. Mărimi relative de dinamică

Mărimile relative de dinamică sunt folosite pentru analiza


evoluţiei în timp a fenomenelor social-economice.
x
i 1x 0i = 1i (3.79)
x 0i
x
i 1x 0 = 1i 100 (3.80)
x 0i
De remarcat că, la nivel totalizator (de întreg), calculăm indicii într-
una din variantele:
- ca medie aritmetică a indicilor individuali:
n n
¦ x1i n ¦ i1x 0i x 0i
I1Σx0 = i =1
= ¦ i1x 0i g 0xi = i =1
(3.81)
n n
i=1
¦ x 0i ¦ x 0i
i =1 i =1
- ca medie armonică a indicilor individuali:
n
¦ x1i
1
I1Σx0 = = i =1
(3.82)
n 1 n 1
¦ x g1xi ¦ x x1xi
i =1 i1 0i i =1 i1 0i

Evident, pentru o exprimare procentuală, rezultatele se înmulţesc cu 100.


Reprezentarea grafică a mărimilor relative de dinamică se poate face
prin diagrama prin coloane, benzi, ori suprafeţe.

3.6.5. Mărimi relative ale planului (prevederilor)

Mărimile relative ale planului sunt:

— mărimea relativă (indicele) sarcinii programate:

x pi
i px 0i = (3.83)
x 0i
CAPITOLUL 3

x pi
i px %0i = 100 (3.84)
x 0i

— mărimea relativă (indicele) realizării prevederilor (programului):

x 1i
i 1x pi = (3.85)
x pi

x 1i
i 1x %pi = 100 (3.86)
x pi

Se observa ca:
x pi x 1i x 1i
i px %0i ⋅ i 1x %
pi = ⋅ = = i 1x 0i (3.87)
x 0i x pi x 0i

Reprezentarea grafică a mărimilor relative ale prevederilor se face cu


ajutorul diagramei prin coloane, benzi ori suprafeţe.
STATISTICĂ ECONOMICĂ

Întrebări recapitulative

1. Ce este indicatorul statistic?


2. Care sunt funcţiile indicatorilor statistici?
3. Ce sunt indicatorii statistici? Cum se obţin ei?
4. Ce sunt indicatorii tendinţei centrale?
5. Care sunt principalele tipuri de indicatori ai tendinţei centrale?
6. Media aritmetică: definiţie, proprietăţi, observaţii, utilizări.
7. Care sunt indicatorii de poziţie?
8. Modul: definiţie, calcul, utilizări, proprietăţi.
9. Mediana: definiţie, calcul, utilizări, proprietăţi
10. Cum se determină mediana pentru o serie de distribuţie pe variante?
Dar pe intervale de variaţie?
11. Analiza comparativă a celor trei indicatori ai tendinţei centrale.
12. Ce sunt cuantilele?
13. Care este semnificaţia cuantilelor de ordin 4?
14. Media armonică: definiţie, calcul, utilizări, proprietăţi.
15. Media pătratică: definiţie, calcul, utilizări, proprietăţi.
16. Media geometrică: definiţie, calcul, utilizări, proprietăţi.
17. Ce se înţelege prin variabilitatea datelor statistice?
18. Necesitatea măsurării variabilităţii.
19. Ce este amplitudinea datelor? Calcul şi interpretare.
20. Care sunt indicatorii simpli ai variabilităţii?
21. Ce reprezintă abaterea medie liniară?
22. Dispersia: determinare, observaţii, proprietăţi.
23. Cum se determină media şi dispersia unei variabile alternative?
24. Cum se determină abaterea medie pătratică? Semnificaţie, utilizări.
25. Coeficientul de variaţie: calcul, utilizări.
26. Cum se compune dispersia pentru o serie structurată în serii compo-
nente?
27. Cum se interpretează abaterea medie pătreatică folosind regula
empirică?
28. Ce reprezintă oblicitatea unei repartiţii?
29. Cum se analizează asimetria (oblicitatea) unei repartiţii?
30. Cum se analizează boltirea/aplatizarea unei repartiţii?
31. Cum se poate studia forma distribuţiei folosind indicatorii de poziţie?
32. Cum se construieşte şi interpretează diagrama Box-Plot?
33. Cum se obţin indicatorii statistici derivaţi?
34. Ce sunt mărimile relative?
CAPITOLUL 3

35. Mărimile relative de structură: definiţie, utilizare, reprezentare gra-


fică, exemple.
36. Mărimile relative de coordonare: definiţie, utilizare, reprezentare gra-
fică, exemple.
37. Mărimile relative de intensitate: definiţie, utilizare, reprezentare gra-
fică, exemple.
38. Mărimile relative de dinamică: definiţie, utilizare, reprezentare gra-
fică, exemple.
39. Mărimile relative ale planului: definiţie, utilizare, reprezentare gra-
fică, exemple.
40. Care sunt cele trei proprietăţi pe care urmărim să le analizăm şi să le
descriem în analiza unui set de date numerice?

S-ar putea să vă placă și