Sunteți pe pagina 1din 33

CAPITOLUL 3

CAPITOLUL 3 ANALIZA I DESCRIEREA NUMERIC A SERIILOR STATISTICE UNIVARIATE


Consideraii preliminare
Cel mai adesea, urmrim s caracterizm prin indicatori statistici msuri cantitative datele statistice pe care le avem la dispoziie. Scopul capitolului urmtor este s prezinte indicatorii statistici, primari i derivai, simpli i sintetici, ce se folosesc n mod frecvent pentru caracterizarea statistic a seriilor statistice. Vom putea, astfel, s analizm tendina central, dar i variabilitatea datelor, forma distribuiilor i concentrarea datelor. S notm i faptul c, datorit particularitilor lor, indicatorii statistici ai seriilor cronologice vor fi tratai ntr-un capitol distinct.

Termeni cheie
abatere individual abatere intercuartilic abatere medie liniar abatere medie ptratic abatere semiintercuartilic amplitudine aplatizare. asimetrie boltire coeficient de determinaie coeficient de variaie cuantile cuartile decile diagram Box- Plot dispersie indicator indicatori de poziie indicatori derivai indicatori primari mrime medie mrimi relative median medie aritmetic medie armonic medie geometric medie ptratic mod percentile regula de adunare a dispersiilor variabilitate

STATISTIC ECONOMIC

Noiuni teoretice
3.1. INTRODUCERE n acest capitol, vom continua s examinm modalitile prin care putem s rezumm seturile de date statistice, n aa fel nct trsturile lor eseniale s poat fi puse n eviden. n capitolele precedente, am nvat cum s grupm datele brute ntr-o form mai uor de interpretat i cum s construim diferite reprezentri grafice ale datelor sistematizate. Avnd la dispoziie un set de date numerice, am nceput analiza statistic prin determinarea valorii maxime i valorii minime, apoi am determinat o distribuie de frecvene, histograma i poligonul frecvenelor. Aceste instrumente au permis identificarea formei aproximative a distribuiei i au indicat n jurul crei valori sunt mai concentrate nivelurile individuale ale variabilei. Dei o distribuie de frecvene este, cu siguran, util n conturarea unei idei de ansamblu privind distribuia datelor ntre cele dou valori extreme, vom dori, n continuare, s rezumm mai mult datele, calculnd civa indicatori statistici descriptivi. Indicatorii numerici descriptivi ofer valori precise i determinate n mod obiectiv, valori care pot fi uor folosite, interpretate i comparate una cu alta. Pe scurt, acetia permit o analiz mai atent a datelor, fa de impresia general pe care o ofer prezentarea datelor sub form de serii, tabele i grafice. 3.2. INDICATORI STATISTICI PRIMARI I DERIVAI

DEFINIIE: Indicatorul statistic n sens larg reprezent expresia numeric a unor fenomene i procese social-economice, definite n timp, spaiu i structur organizatoric. Indicatorii statistici pot fi primari i derivai. Indicatorii primari se obin, de regul, n etapa de sistematizare a datelor statistice, prin centralizarea i agregarea acestora.

CAPITOLUL 3

Indicatorii derivai se obin prin prelucrarea mrimilor absolute ale indicatorilor primari. Cele trei proprieti majore ale seriilor de date numerice, pe care le putem analiza folosind indicatorii statistici sunt cele privitoare la tendina central, la variabilitatea i la forma distribuiilor. 3.3. INDICATORI AI TENDINEI CENTRALE O clasificare a indicatorilor tendinei centrale se poate face, n funcie de modul de determinare a lor, n: indicatori (mrimi) medii de calcul: media aritmetic, armonic, ptratic, geometric etc.; indicatori medii de poziie: modul, mediana. Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic, modul i mediana, dar n anumite cazuri speciale putem apela i la alte tipuri de medii. 3.3.1. Media aritmetic Media aritmetic (x ) reprezint valoarea care nlocuind toi termenii unei serii nu modific nivelul lor totalizator i se calculeaz ca suma valorilor raportat la numrul lor. (3.1) n EXEMPLUL 3.1: Vechimea n munc a fost nregistrat pentru cinci salariai ai unei firme i anume: 7, 5, 6,7 i 8 ani. Vechimea medie este: 7 + 5 + 6 + 7 + 8 33 x= = = 6,6 ani 5 5 Observm din fig. 3.1. cum media aritmetic pune n balan toate valorile individuale:
5 6 7 X =6,6 ani 8

x=

i =1

xi

Fig. 3.1. Balansarea valorilor individuale prin calculul mediei

STATISTIC ECONOMIC

De asemenea, dac vom considera vechimea n munc, vom observa cum media valorile extreme. Astfel, dac presupunem c munc a 10 salariai sunt: 5, 4, 5, 5, 6, 6, 4 i este:
x= 5 + 4 + ... + 4 + 20 = 6,6 ani 10

urmtoarele date privind aritmetic este afectat de datele pentru vechimea n 20, atunci vechimea medie

5
X =6,6 ani

10

15

20

Fig. 3.2. Balansarea valorilor individuale prin calculul mediei

n cazul n care datele au fost sistematizate ntr-o serie de distribuie de frecvene, n care valorile / centrele intervalelor de variaie x i , i = 1, r apar cu frecvenele ni media aritmetic (numit i medie aritmetic ponderat) este:

x=

i =1 r

xini
i =1

(3.2)

ni

EXEMPLUL 3.2: Presupunem c pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului, rezultnd (Tabelul 3.1):
Timp (min.) Pn la 30 30-60 60-90 90-120 120 i peste Total Numr de persoane (frecvene) ni 47 51 76 24 2 200 xi 15 45 75 105 135 Tabelul 3.1 xi ni 705 2295 5700 2520 270 11490

CAPITOLUL 3

x=

i =1 r

xini
i =1

ni

11490 = 57,45 minute 200

Asupra mediei aritmetice sunt de fcut cteva observaii i de subliniat cteva proprieti: a) Pentru un ir de valori constante, media este egal cu constanta; b) Media are ntotdeauna valoarea cuprins ntre valoarea minim din serie (xmin) i valoarea maxim (xmax); c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se compenseaz perfect); d) Dac valorile individuale ale unei variabile sunt mrite sau micorate cu constanta a, atunci media se modific i ea, n acelai sens, cu aceeai constant a; e) Dac valorile individuale ale unei variabile sunt modificate de h ori, media se modific i ea de h ori; Din aceste dou proprieti, d) i e), rezult formula de calcul simplificat al mediei aritmetice, pentru valori reduse cu constanta a i de h x a , i = 1, n : ori x i = i h n n x a xi i x = i =1 h + a = i =1 h h + a (3.3) n n iar pentru o serie de distribuie de frecvene: r x a r ni xini i x = i =1 h + a = i =1 h h +a (3.4)
i =1

ni

i =1

ni

EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75, h=30 i atunci:

STATISTIC ECONOMIC Tabelul 3.2 Timp (min.) < 30 30-60 60-90 90-120 120 i peste Total Frecvene ni 47 51 76 24 2 200
r

xi 15 45 60 105 135

x i =

xi a h

x i n i

-2 -1 0 1 2

- 94 - 51 0 24 4 -117

x=

i =1 r

xini
i =1

h +a =

ni

117 30 + 75 = 57,45 minute 200

f) ntr-o serie de distribuie de frecvene, dac frecvenele sunt modificate de c ori, media rmne neschimbat.

Dac c reprezint volumul total al colectivitii n = n i ,


r

i =1

frecvenele
deci:

ni c

sunt chiar frecvenele relative n * = i


xi ni
r *

ni , i = 1, r i rezult, n

1 sau, dac frecvenele relative au fost exprimate n procente: x=


i =1

x=

i =1

(3.5)

xi ni 100

*%

(3.6)

g) Dac o serie statistic este alctuit din mai multe serii componente, pentru care s-au calculat medii pariale x j , j = 1, m , atunci media ntregii serii poate fi calculat ca o medie aritmetic ponderat din mediile pariale:

( )

x=

x jn j
j=1 m

(3.7)

nj
j=1

CAPITOLUL 3

unde nj reprezint volumul seriei componente j (j = 1, m )


EXEMPLUL 3.4: ntr-o colectivitate de 60 de persoane, din care 24 de sex feminin i 36 de sex masculin, s-a determinat vrsta medie a persoanelor de sex feminin x F = 38,1 ani i vrsta medie a persoanelor de sex masculin
x M = 42,2 ani. Vrsta medie n ntreaga colectivitate este:
x= x F n F + x M n M 24 38,1 + 36 42,2 = = 40,56 ani nF + nM 60

h) Pentru dou caracteristici statistice X i Y, pentru care s-au calculat mediile x i, respectiv, y , media sumei valorilor individuale (xi + yi) este ntotdeauna egal cu suma mediilor: x+y=x+y (3.8) i) Pentru dou caracteristici statistice X i Y, pentru care s-au calculat x i y , media produsului (xi yi) este egal cu produsul mediilor, doar dac cele dou variabile sunt independente:
xy = x y

(3.9)

3.3.2. Media unei variabile de tip alternativ

n cazul n care variabila studiat este de tip alternativ (dihotomic), atunci celor dou variante de rspuns (afirmativ i negativ) li se vor acorda, convenional, valorile numerice 1 i, respectiv, 0. Pentru calculul mediei aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3 Varianta de rspuns Afirmativ Negativ Total xi 1 0 Frecvene ni m n-m n Frecvene relative n * i

m =f n nm = 1 f n
1

STATISTIC ECONOMIC

x=

i =1

xini n

1 m + 0(n m ) m = =f n n

(3.10)

3.3.3. Indicatori de poziie

Indicatorii medii de poziie sunt: modul i mediana. Mediana face parte din indicatorii (mai generali) de poziie, numii cuantile, alturi de cuartile, decile etc.
3.3.3.1 Valoarea modal Modul (M0) reprezint valoarea cel mai des ntlnit ntr-o serie statistic sau cea care are cea mai mare frecven de apariie. n cazul seriilor de distribuie de frecvene pe intervale de variaie, determinarea modului presupune mai nti, identificarea intervalului cu frecven maxim (int M0). Apoi, modul se poate determina conform relaiei:

d1 M 0 = x inf M 0 + d + d h M 0 2 1 unde: xinfMo reprezint limita inferioar a intervalului modal; h M0 reprezint mrimea intervalului modal;
d1

(3.11)

reprezint diferena dintre frecvena intervalului modal i a celui reprezint diferena dintre frecvena intervalului modal i a celui

precedent;
d2

urmtor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modal este: (76 51) M 0 = 60 + 30 = 69,74 minute (76 51) + (76 24)

O distribuie cu un singur mod se numete unimodal (fig. 3.3a), o distribuie este bimodal dac are dou valori dominante (moduri) (fig. 3.3b) i multimodal dac are mai mult de dou moduri (fig. 3.3c).

CAPITOLUL 3
y
y

Frecvene

Frecvene

Frecvene

M0 a)

x o

M01 b)

M02

x o

M01

M02 c)

M03

Fig. 3.3 - Distribuie de frecvene: a) unimodal; b) bimodal; c) multimodal

3.3.3.2 Mediana Mediana (Me) este un indicator mediu de poziie care face parte din categoria cuantilelor. Ea reprezint valoarea/varianta din mijlocul unei serii de date, serie n care observaiile au fost ordonate cresctor (sau descresctor). Dac datele au fost sistematizate ntr-o serie de distribuie de frecvene pe variante, pentru determinarea medianei vom calcula, mai nti, frecvenele cumulate (Fci). Prima frecven cumulat mai mare dect (n+1)/2, adic mai mare dect locul medianei, ne indic varianta median. EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au sistematizat datele privind numrul membrilor de familie, rezultnd distribuia de frecvene (Tabelul 3.4):
Numrul membrilor de familie 1 2 3 4 5 Total Numr de familii ni 12 23 30 8 7 80 Tabelul 3.4 Frecvene cumulate Fci 12 35 65 73 80

Varianta 3 membrii de familie reprezint varianta median, situat n mijlocul distribuiei; Pentru o serie de repartiie de frecvene pe intervale de variaie (date de tip continuu), mediana se va ncadra n intervalul median, primul

STATISTIC ECONOMIC

interval cu frecvena cumulat mai mare dect locul (rangul, poziia) medianei. 1 r n i + 1 FC( Me1) 2 i=1 n Me

Me = x inf Me + h Me unde:

(3.12)

x inf Me reprezint limita inferioar a intervalului median;

reprezint mrimea intervalului median; 1 r n +1 reprezint locul medianei n serie; n i + 1 = 2 i =1 2 FC(Me - 1) reprezint frecvena cumulat a intervalului anterior celui median; nMe reprezint frecvena absolut a intervalului median.
h Me

EXEMPLUL

3.7:

Pe

baza

datelor

din

Tabelul

3.1,

100,5 98 Me = 60 + 30 61 76

minute

3.3.3.3. Relaia dintre mod, median i medie


Me

Pentru o distribuie simetric, media, mediana i modul coincid (Fig. 3.3a). Dac distribuia este cu tendin de normalitate dar pozitiv nclinat, spre valori mari (cu coada mai lung a distribuiei spre valorile mari) atunci x > Me > M 0 (Fig. 3.4b); dac distribuia este moderat oblic i negativ ncheiat, spre valorile mici (cu coada mai lung a distribuiei spre valorile mici, atunci x < Me < M 0 (Fig. 3.4c). n general, pentru repartiii moderat asimetrice, exist o relaie empiric ntre cele trei valori i anume:

M 0 x 3 Me x

(3.13)

CAPITOLUL 3

x=Me=Mo

Mo Me x

x Me Mo

Fig. 3.4 - a) distribuie simetric; b) distribuie cu asimetrie pozitiv; c) distribuie cu asimetrie negativ

3.3.3.4. Cuantilele Cuantilele, categorie de indicatori de poziie din care face parte i mediana, pot fi uor nelese intuitiv prin extinderea noiunii de median i reprezint valori ce mpart seria n pri egale.
y

de ordin n patru

25% din n numr 25% 25% 25% 25% (fig. x Q1 Q2=Me Q3 o cuartila Fig. 3.5 - Cuartilele ntr-o serie de repartiie egal mediana, cuartila superioar. Similar se pot determina cuantile de ordin superior, ca de pild decilele (care sunt D1, ...., D9 i delimiteaz cte 10% din observaii, D5 = Me) ori percentile (delimiteaz cte 1% din observaii).
3.3.4. Alte tipuri de medii 3.3.4.1. Media armonic Media armonic x h este o medie de calcul cu aplicaii speciale, care se determin, pentru o serie de date cantitative, ca valoarea invers a

Astfel, cuartilele (cuantile patru) mpart seria pri egale, ele delimitnd cte observaii. Ele sunt de trei: Q1, Q2, Q3 3.5); Q1 se numete inferioar, Q2 este ntotdeauna cu Q3 se numete

Frecvene relative

( )

STATISTIC ECONOMIC

mediei aritmetice, calculat din inversele valorilor seriei. Aadar media armonic simpl este: n xh = n (3.14) 1 i =1 x i Pentru o serie de distribuie de frecvene, media armonic ponderat este: xh =
i =1

ni

1 ni i =1 x i 1 xh = r 1 * ni i =1 x i 100 xh = r 1 *% ni i =1 x i
r

(3.15)

(3.16)

(3.17)

EXEMPLUL 3.8: Un conductor auto cumpr ulei de motor, la preul de 90.000 lei/litru, n valoare total de 450.000 lei dintr-un magazin, iar din alt magazin, la preul de 120.000 lei/litru, n valoare total de 480.000 lei. Care a fost preul mediu pe litru, pe care l-a pltit?
p= 450000 + 480000 vi vi = = = 103333,3 1 1 1 qi v 450000 + 480000 i pi 90000 120000

lei/litru

3.3.4.2. Media ptratic Media ptratic x p este tot o medie de calcul cu aplicaii speciale i reprezint valoarea care, nlocuind termenii seriei, nu modific suma ptratelor lor. Aadar:
xp =
i =1

xi n

(3.18)

CAPITOLUL 3

Pentru o serie de distribuie de frecvene, media ptratic ponderat este:


xi ni
i =1 r 2

xp =

i =1 r

(3.19)

ni

xp =

i =1

xi ni 1

2 *

(3.20)

xp =

i =1

xi ni 100

2 *%

(3.21)

3.3.4.3. Media geometric Media geometric x g se calculeaz ca rdcina de ordinul n din produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care nlocuind termenii seriei nu modific produsul lor:

( )

xg = n xi
i =1

(3.22)

Pentru o serie de distribuie de frecvene, media geometric se calculeaz ca:


x g = i =1 x in i
i =1

ni

(3.23)

ntre mediile de calcul prezentate exist relaia: xh xg x xp

(3.24)

STATISTIC ECONOMIC

3.4. INDICATORI AI VARIABILITII

n analiza unei serii statistice de date cantitative ne intereseaz, pe lng indicatorii tendinei centrale i indicatorii variabilitii, ai mprtierii valorilor. Astfel, dou serii statistice pot diferi prin tendina central (Fig 3.6a), prin mprtierea datelor (Fig. 3.6b) sau prin amndou (Fig. 3.6c).
y y y

a)

b)

Fig. 3.6 - a) Distribuii cu tendin central diferit; b) Distribuii cu variabilitate diferit; c) Distribuii cu tendin central i variabilitate diferite

c)

3.4.1. Indicatori simpli ai variabilitii

Aceti indicatori msoar mprtierea valorilor individuale ale seriei, una fa de alta, ori fa de o valoare tipic.
3.4.1.1. Amplitudinea variaiei Amplitudinea variaiei (Ax) se calculeaz ca valoarea maxim minus valoarea minim a variabilei: (3.25) Ax = xmax xmin

n expresie relativ amplitudinea se calculeaz ca: A% = x x max x min x 100 (3.26)

3.4.1.2. Abaterea intercuartilic i semiintercuartilic

Un alt indicator simplu al variaiei este abaterea intercuartilic: A Q = Q 3 Q1 (3.27)

CAPITOLUL 3

Indicatorul are unitatea de msur a variabilei studiate i uneori se folosete i valoarea sa njumtit, indicator cunoscut ca abaterea semiintercuartilic:
A Q = Q 3 Q1 2

(3.28)

3.4.1.3. Abaterea individual

Un alt indicator simplu al variaiei este abaterea individual:


di = xi x

(3.29)

care ne arat mprtierea fiecrei valori de la nivelul mediu.


Abaterea individual se poate calcula i n expresie relativ:

d i% =

xi x x

(3.30)

De asemenea, prezint interes abaterea maxim pozitiv: d + = x max x max i abaterea maxim negativ: d = x min x max
3.4.2. Indicatori sintetici ai variabilitii 3.4.2.1. Abaterea medie liniar O prim soluie la care putem apela pentru a surprinde, printr-o singur msur, ntreaga mprtiere din serie este s calculm media abaterilor individuale. Dar, pentru c aceste abateri se compenseaz

(3.31)

(3.32)

STATISTIC ECONOMIC

reciproc, trebuie s le considerm n valoare absolut. Obinem, astfel, abaterea medie liniar d x calculat pentru o serie simpl:
dx =
i =1

xi x
n

( )

(3.33)

iar n cazul unei serii de distribuie de frecvene:


dx =
i =1

xi x ni
i =1 r

ni

(3.34)

dx =

i =1

x i x n *% i
100

(3.35)

Abaterea medie liniar se exprim n unitatea de msur a caracteristicii i ne arat cu ct se abat, n medie, valorile individuale de la media lor.
EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obinem:
Tabelul 3.5 Timp (min.) pn la 30 30-60 60-90 90-120 120 i peste Total Nr. de persoane (ni) 47 51 76 24 2 200

xi
15 45 75 105 135

xi x ni

1995,15 634,95 1333,8 1141,2 155,1 5260,2

x = 57,45 minute
dx
i =1

xi x ni
i =1

ni

5260,2 = 26,30 200

min

3.4.2.2. Dispersia Dispersia s 2 se calculeaz ca media aritmetic a ptratelor x abaterilor individuale ale valorilor de la tendina central (uzual de la medie). Pentru o serie simpl, formula dispersiei este:

( )

CAPITOLUL 3

s2 = x

i =1

(x i x )
n

(3.36)
2

iar pentru o serie de distribuie de frecvene:


s2 = x
i =1

(x i x ) n i
r i =1 r

ni
2

(3.37)

sau, pe baza frecvenelor relative:


s2 = x
i=1

(x i x ) n *% i
100

(3.38)

EXEMPLUL 3.10. Pe baza datelor din exemplul nr. 3.2, obinem


Timp (min.) pn la 30 30-60 60-90 90-120 120 i peste Total
r

Nr. de persoane (ni) 47 51 76 24 2 200


s2 = x
i =1

xi 15 45 75 105 135

(x i x )2 ni
84694,12 7905,13 23408,19 54264,06 12028,00 182299,50

Tabelul 3.6

(x i x ) n i
2 i =1

ni

182299,5 = 911,4975 200

Se cuvine s facem i asupra dispersiei cteva observaii i s remarcm cteva din proprietile sale: a) Pentru un ir de valori constante, dispersia este nul; b) Dispersia calculat fa de medie s 2 este mai mic dect orice x alt dispersie calculat fa de o valoare a, cu ptratul distanei dintre medie i constanta a: 2 2 s 2 = s a (x a ) (3.39) x c) Dac valorile variabilei statistice studiate sunt modificate (micorate sau mrite) cu constanta a, dispersia seriei rmne neschimbat;

( )

STATISTIC ECONOMIC

d) Dac valorile variabilei statistice studiate se modific de h ori, dispersia se modific (n acelai sens) de h2 ori Rezult i n calculul dispersiei c, dac vom combina proprietile 2 i 4, vom obine formula de calcul simplificat al dispersiei, pentru o serie simpl:
x a i h 2 h xa s 2 = i=1 x n
n 2

)2

(3.40)

i pentru o serie de distribuie de frecvene:


s2 = x
xi a ni i =1 h

i =1

ni
2

h2 x a

)2
)2

(3.41)

x i a *% ni h s 2 = i=1 h2 x a x 100

(3.42)

EXEMPLUL 3.11: Pe baza datelor prelucrate n exemplul 3.3, obi-

nem:
Tabelul 3.7 Timp (min) <30 30-60 60-90 90-120 120 i peste Total Frecvene ni 47 51 76 24 2 200
xi a ni i =1 h

x a x = i i h

(x )

2 i

x a = i h

x n i i

-2 -1 0 1 2

4 1 0 1 4

188 51 0 24 8 271

s2 = x

i =1

ni

h2 x a

271 )2 = 200 30 2 (57,45 75)2 = 911,4975

e) Dispersia se poate calcula i pe baza relaiei:

CAPITOLUL 3

s2 = x

x i2 i =1
n

x =

x i2 i =1
n

n xi i=1 n

(3.43)

iar pentru o serie de distribuie de frecvene:


s 2 = i=1 x

x i2 n i
i =1 r

ni

2 x = i=1

x i2 n i
i =1 r

ni

r xini i=1 r ni i=1


r

(3.44)
2

s 2 = i=1 x

x i2 n *% i
100

2 x = i=1

x i2 n *% x i n *% i i
100

i=1 100

(3.45)

f) Dac o serie este compus din m serii componente (grupuri), fiecare serie component fiind de volum nj, j = 1, m , atunci se pot calcula mediile seriilor componente, x j , j = 1, m i dispersiile seriilor componente:
s2 = x
j

i =1

(x i x j )
nj

nj

, j = 1, m

(3.46)

Dispersia general a colectivitii poate s fie scris n funcie de dispersiile seriilor componente (grupurilor):
s2 = x

s2 j n j x
j=1 m

(x j x ) n j
m 2 j=1

n j
j=1

nj
j=1

(3.47)

Expresia:

s2 j n j x
j=1 m

se numete media dispersiilor pariale

nj
j=1

(grupurilor, seriilor componente) i se noteaz cu s 2 . x

STATISTIC ECONOMIC

sx =

s2j n j x
j=1 m

(3.48)

nj
j=1 2

Expresia:

(x j x ) n j
m j=1

nj
j=1

sintetizeaz mprtierea valorilor de la

media general, doar ca urmare a aciunii factorului dup care s-au alctuit grupurile, seriile componente. Aceast expresie se numete dispersia dintre grupe d 2 : x

( )

d2 = x

(x j x ) n j
m 2 j=1

n j
j=1

(3.49)

Regula de adunare a dispersiilor este, deci:


s2 = sx + d2 x x
2

(3.50)

Putem spune c d 2 explic msura n care factorul de grupare x determin variaia variabilei studiate i s calculm coeficientul de determinaie:
R2 = d2 x s2 x

( )

(3.51)

sau, n expresie procentual, gradul de determinaie:


2 R% =

d2 x s2 x

100

(3.52)

Evident, msura n care ali factori (din interiorul grupelor) determin variaia variabilei, este dat de coeficientul de nedeterminaie:
K2 = sx s2 x
2

= 1 R2

(3.53)

CAPITOLUL 3

sau gradul de nedeterminaie:


2 K% =

sx s2 x

2 100 = 100 R %

(3.54)

EXEMPLUL 3.12: O firm ce comercializeaz produse cosmetice a realizat ntr-o lun de var, prin cele 30 de magazine de desfacere situate pe litoral, o vnzare medie de 400 milioane lei pe magazin, cu o dispersie a vnzrilor de 2500; iar prin cele 20 de magazine din zona montan, o vnzare medie de 200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul n care zona de amplasare a magazinelor determin variaia vnzrilor, vom calcula: x L n L + x M n M 30 400 + 20 200 16000 x= = = = 320 mil lei nL + nM 50 50
sx = d2 = x
2

s 2 n L + s 2 n M 2500 30 + 1600 20 107000 xL xM = = = 2140 nL + nM 50 50 nL + nM 50

(x L x )2 n L + (x M x )2 n M = (400 320)2 30 + (200 320)2 20 =


480000 = 9600 50
2

s 2 = s x + d 2 = 2140 + 9600 = 11740 x x

Aadar
2 R% =

d2 x s2 x

100 =

9600 100 = 81,77% 11740

3.4.2.3. Dispersia unei variabile de tip alternativ

Pentru o variabil de tip alternativ, sistematizat ca n tabelul 3.3, dispersia este:


2 s f = f (1 f )

(3.55)

3.4.2.4. Abaterea medie ptratic

n studiul variabilitii datelor se folosete rdcina ptrat a dispersiei, indicator numit abaterea medie ptratic:

STATISTIC ECONOMIC

sx = s2 = x
r

i =1

(x i x )
n

n
2

(3.56)

pentru o serie simpl, iar pentru o serie de distribuie de frecvene:


sx =
i =1

(x i x ) n i
i =1 r

ni
2

(3.57)

sx =

i =1

(x i x ) n *% i
100

(3.58)

Abaterea medie ptratic (numit i abatere tip, abatere standard, deviaie standard sau ecart tip) este calculat ca o medie ptratic din abaterile termenilor seriei de la media lor. O regul empiric ne spune c, pentru serii de distribuie de frecvene cu tendin de normalitate (simetrice sau moderat asimetrice), abaterea medie liniar reprezint aproximativ patru cincimi din abaterea medie ptratic:
dx 4 sx 5

(3.59)

iar abaterea semiintercuartilic aproximativ dou treimi din abaterea standard:


A Q 2 sx 3

(3.60)

EXEMPLUL 3.13 Pe baza datelor din Exemplul 3.2, obinem:


s x = s 2 = 911,4975 = 30,19 x d x 26,30 = 0,87 sx 30,19

minute

3.4.2.5. Coeficientul de variaie

Pentru asigurarea comparabilitii mprtierii datelor se folosete expresia relativ a variabilitii, coeficientul de variaie:

CAPITOLUL 3
s v = x 100 x

(3.61)

Cu ct valoarea coeficientului de variaie este mai mic, cu att acest lucru semnific o omogenitate crescut a datelor.
EXEMPLUL 3.14. Pentru seriile de date: A: 10; 11; 12; 13; 14; 15; 16 B: 60; 61; 62; 63; 64; 65; 66
vA = vB = sxA xA sx B xB 100 = 100 = 2 100 = 15,4% 13 2 100 = 3,2% 63

Evident, variabilitatea relativ este mai sczut n seria B.


3.4.2.6. Interpretarea abaterii medii ptratice

O regul empiric, care se aplic distribuiei normale simetrice sau moderat asimetrice, ne spune c: aproximativ 68%din valori se situeaz n intervalul x x ;
aproximativ 95% din valori se situeaz n intervalul x 2 x ; aproximativ 99,8% din valori se situeaz n intervalul x 3 x . (fig. 3.7)

13,5%

34%

34%

2,5% o 2,5% x- x x+ x+2 x+3 x-3 x-2 Amplitudine

13,5%

Figura 3.7 - Relaia dintre amplitudine i abaterea medie ptratic

STATISTIC ECONOMIC

3.5. INDICATORI AI FORMEI DISTRIBUIEI

Forma unei distribuii de frecvene se analizeaz, comparativ cu distribuia ideal, normal, prin: indicatori asimetrici (oblicitii) i indicatori ai boltirii (excesului).
3.5.1. Indicatori ai asimetriei (oblicitii) Asimetria, n valoare absolut, se poate msura cu indicatorii:
AS = x M 0

(3.62)

sau

A S1 = 3 x Me

(3.63)

indicatori care au unitatea de msur a variabilei studiate i care sunt pozitivi sau negativi, n funcie de tipul de asimetrie (coada mai lung a distribuiei spre valorile mari sau spre valorile mici).
Coeficientul de asimetrie (Pearson) este:
C as = x M0 sx

(3.64)

coeficient care ia valori pozitive n cazul curbelor alungite spre dreapta (asimetrie pozitiv) i valori negative n cazul curbelor alungite spre stnga (asimetrie negativ). Coeficientul de asimetrie poate s fie scris i pe baza relaiei dintre medie i median:
C as1 = 3 x Me sx

(3.65)

EXEMPLUL 3.15. Pentru datele din Tabelul 3.2, prelucrate, obinem:


C as = x M 0 57,45 69,74 = = 0,407 sx 30,19

CAPITOLUL 3
C as1 = 3 x Me 57,45 61 = = 0,118 sx 30,19

ceea ce semnific o asimetrie negativ moderat (coada mai lung a distribuiei nspre valorile mici). Analiza oblicitii (asimetriei) se poate face i pe baza momentelor centrate de ordin 3: m 3 = i =1 sau, utiliznd frecvene: m 3 = i =1
r

(x i x )
n

n
3

(3.66)

(x i x ) n i
i =1

ni
2 m3

= i =1

(x i x ) n *% i
r 3

100

(3.67)

Coeficientul de asimetrie (Fisher) este:


1 = m3 s3 x = m3 2

(3.68)

Coeficientul 1 va avea valoare mai mare dect zero n cazul asimetriei pozitive, valoare mai mic dect zero n cazul asimetriei negative i va fi egal cu zero n cazul seriei perfect simetrice.
3.5.2. Indicatorii de poziie i forma distribuiei

O msur alternativ asimetriei poate s fie dat i de: ASQ=Q3+Q1-2Me (3.69)

dar, pentru a o exprima n coeficieni adimensionali, o vom raporta la indicatorul de mprtiere abaterea intercuartilic AQ (3.60) i obinem coeficientul de asimetrie (Yule i Kendall): C asq =

(Q 3 Me) (Me Q1 ) Q 3 + Q1 2Me = (Q 3 Me) + (Me Q1 ) Q 3 Q1

(3.70)

STATISTIC ECONOMIC

Pe baza indicatorilor de poziie se poate alctui un rezumat al celor cinci indicatori, care ofer informaii privind tendina central, dar i forma distribuiei studiate. Aceste cinci valori sunt: valoarea, minim xmin (denumit, uneori, percentila 0); cuartila inferioar Q1 (delimiteaz cele mai mici 25% din valori); mediana Me (delimiteaz50% din valori); cuartila superioar Q3 (delimiteaz cele mai mari 25% din valori); valoarea maxim xmax (denumit, uneori, a 100-a percentil). Cele cinci valori se reprezint grafic prin intermediul diagramei Box-Plot (fig. 3.8). Pe grafic pot fi marcate i media i modul.

X m in
25%

Q1
25%

Me
25%

Q3
25%

X m ax

Fig. 3.8 - Diagrama Box-Plot

3.6. MRIMI RELATIVE DEFINIIE: Mrimile relative reprezint rezultatul comparrii sub form de raport a doi indicatori statistici: un indicator comparat (raportat) i un indicator de baz de comparaie (baz de raportare).

Forma general a unei mrimi relative este:


x k 10 y unde: z reprezint indicatorul relativ; x reprezint indicatorul comparat; y reprezint indicatorul baz de comparaie; z=

(3.71)

CAPITOLUL 3

k reprezint un numr ntreg ce poate fi egal cu: k=0 i atunci exprimarea se face n coeficieni; k=2 i atunci exprimarea se face n procente (%); k=3, k=4, k=5 ,exprimarea se face n promile (0/00), respectiv prodecimile (0/000) i procentimile (0/0000).
3.6.1. Mrimi relative de structur Mrimile relative de structur se calculeaz sub forma unui raport ntre parte i ntreg, prezentnd astfel structura colectivitilor statistice sistematizate att dup variabile cantitative ct i dup variabile calitative. Mrimile relative de structur pot fi: greuti specifice (ponderi) i frecvene relative. Greutatea specific (ponderea) este:
g ix = xi
i =1

xi

(3.72)

g ix % =

xi
i =1

xi

100

(3.73)

i ne arat ponderea nivelului caracteristicii dintr-o unitate n nivelul total al caracteristicii din colectivitatea statistic. Dac datele au fost sistematizate pe grupe/clase, atunci greutatea specific este:

g ix =

i =1 j=1 ni

x ij x ij
100 (3.75)

j=1 r ni

x ij
(3.74)

ni

g ix % =

i =1 j=1

x ij

j=1 r ni

STATISTIC ECONOMIC

EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules i sistematizat date privind producia zilnic realizat de muncitori (Tabelul 3.8)
Judeul/Filiala
0

Numr de muncitori
1

Tabelul 3.8 Producia individual (buc.)


2

Alba/A Bacu/B Constana/C

4 3 6

120;130;120;90 80;120;100; 140;70;90;100;110;120 Tabelul 3.9 Structura colectivitii de muncitori (%)


3

Filiala
0

Producia pe filial (buc.)


1

Structura produciei pe filiale (%)


2

A B C Total

460 300 630 1390

33,09 21,58 45,33 100,00

30,77 23,08 46,15 100,00

Tot mrimi relative sunt i frecvenele relative.


3.6.2. Mrimi relative de coordonare Mrimile relative de coordonare se calculeaz ca un raport ntre dou niveluri ale aceluiai indicator statistic, niveluri situate pe aceeai treapt de agregare: unitate, grup, colectivitate statistic. x (3.76) k ix j = i xj

Rezultatul ne arat de cte ori este mai mare (dac rezultatul este supraunitar), sau mai mic (dac rezultatul este subunitar) nivelul variabilei n unitatea (grupa, colectivitatea) i fa de nivelul variabilei n unitatea (grupa, colectivitatea) j. Exprimarea rezultatului mrimii relative de coordonare (numit i raport de coordonare) se poate face i n procente . Reprezentarea grafic a mrimilor relative de coordonare se face prin intermediul diagramei prin benzi, coloane ori suprafee.

CAPITOLUL 3

Pe baza datelor din Tabelul 3.8, col. 1 i din Tabelul 3.9, col.1,obtinem (vezi Tabelul 3.10):
Filiala
0

Tabelul 3.10 Raport de coordonare Pentru numrul de muncitori Pentru producie


1 2

A B C

1,33 1,00 2,00

1,53 1,00 2,10

3.6.3. Mrimi relative de intensitate Mrimile relative de intensitate au forma general: x z= y

(3.77)

La nivelul ntregului (alctuit din uniti, grupe etc.):


Z=
i =1 n i =1

x y

i =1 n

zy
i =1

i =1

z gi

(3.78)

Reprezentarea grafic a mrimilor relative de intensitate se face cu ajutorul diagramelor prin coloane, prin benzi ori prin suprafee. Pe baza datelor din Tabelul 3.8, col.1 i Tabelul 3.9, col.1, putem calcula producia obinut de un muncitor (buci pe muncitor) (Tabelul 3.11):
Filiala
0

Tabelul 3.11 Productivitatea muncii (buc./muncitor)


1

A B C Total

115 100 105 106,92

STATISTIC ECONOMIC

3.6.4. Mrimi relative de dinamic Mrimile relative de dinamic sunt folosite pentru analiza evoluiei n timp a fenomenelor social-economice. x x i 1 0i = 1i (3.79) x 0i x x i 1 0 = 1i 100 (3.80) x 0i De remarcat c, la nivel totalizator (de ntreg), calculm indicii ntruna din variantele: - ca medie aritmetic a indicilor individuali:
I1 x = 0 i =1 n

x1i

i =1

x 0i

x x = i1 0i g 0i = i=1

i =1

x i1 0i x 0i

i =1 n

x 0i

(3.81)

- ca medie armonic a indicilor individuali:


I1 x = 0

x i =1 i1 0i

1 1

=
x g1i

x i =1 i1 0i

i =1

x1i
1
x x1i

(3.82)

Evident, pentru o exprimare procentual, rezultatele se nmulesc cu 100. Reprezentarea grafic a mrimilor relative de dinamic se poate face prin diagrama prin coloane, benzi, ori suprafee.
3.6.5. Mrimi relative ale planului (prevederilor) Mrimile relative ale planului sunt: mrimea relativ (indicele) sarcinii programate:
x i p 0i =

x pi x 0i

(3.83)

CAPITOLUL 3
x i p %i = 0

x pi x 0i

100

(3.84)

mrimea relativ (indicele) realizrii prevederilor (programului):


x i 1 pi =

x 1i x pi x 1i 100 x pi

(3.85)

x i1 % = pi

(3.86)

Se observa ca:
x x i p %i i 1 % = 0 pi

x pi x 1i x 1i x = = i 1 0i x 0i x pi x 0i

(3.87)

Reprezentarea grafic a mrimilor relative ale prevederilor se face cu ajutorul diagramei prin coloane, benzi ori suprafee.

STATISTIC ECONOMIC

ntrebri recapitulative 1. Ce este indicatorul statistic? 2. Care sunt funciile indicatorilor statistici? 3. Ce sunt indicatorii statistici? Cum se obin ei? 4. Ce sunt indicatorii tendinei centrale? 5. Care sunt principalele tipuri de indicatori ai tendinei centrale? 6. Media aritmetic: definiie, proprieti, observaii, utilizri. 7. Care sunt indicatorii de poziie? 8. Modul: definiie, calcul, utilizri, proprieti. 9. Mediana: definiie, calcul, utilizri, proprieti 10. Cum se determin mediana pentru o serie de distribuie pe variante? Dar pe intervale de variaie? 11. Analiza comparativ a celor trei indicatori ai tendinei centrale. 12. Ce sunt cuantilele? 13. Care este semnificaia cuantilelor de ordin 4? 14. Media armonic: definiie, calcul, utilizri, proprieti. 15. Media ptratic: definiie, calcul, utilizri, proprieti. 16. Media geometric: definiie, calcul, utilizri, proprieti. 17. Ce se nelege prin variabilitatea datelor statistice? 18. Necesitatea msurrii variabilitii. 19. Ce este amplitudinea datelor? Calcul i interpretare. 20. Care sunt indicatorii simpli ai variabilitii? 21. Ce reprezint abaterea medie liniar? 22. Dispersia: determinare, observaii, proprieti. 23. Cum se determin media i dispersia unei variabile alternative? 24. Cum se determin abaterea medie ptratic? Semnificaie, utilizri. 25. Coeficientul de variaie: calcul, utilizri. 26. Cum se compune dispersia pentru o serie structurat n serii componente? 27. Cum se interpreteaz abaterea medie ptreatic folosind regula empiric? 28. Ce reprezint oblicitatea unei repartiii? 29. Cum se analizeaz asimetria (oblicitatea) unei repartiii? 30. Cum se analizeaz boltirea/aplatizarea unei repartiii? 31. Cum se poate studia forma distribuiei folosind indicatorii de poziie? 32. Cum se construiete i interpreteaz diagrama Box-Plot? 33. Cum se obin indicatorii statistici derivai? 34. Ce sunt mrimile relative?

CAPITOLUL 3

35. Mrimile relative de structur: definiie, utilizare, reprezentare grafic, exemple. 36. Mrimile relative de coordonare: definiie, utilizare, reprezentare grafic, exemple. 37. Mrimile relative de intensitate: definiie, utilizare, reprezentare grafic, exemple. 38. Mrimile relative de dinamic: definiie, utilizare, reprezentare grafic, exemple. 39. Mrimile relative ale planului: definiie, utilizare, reprezentare grafic, exemple. 40. Care sunt cele trei proprieti pe care urmrim s le analizm i s le descriem n analiza unui set de date numerice?