Documente Academic
Documente Profesional
Documente Cultură
Termeni cheie
abatere individual abatere intercuartilic abatere medie liniar abatere medie ptratic abatere semiintercuartilic amplitudine aplatizare. asimetrie boltire coeficient de determinaie coeficient de variaie cuantile cuartile decile diagram Box- Plot dispersie indicator indicatori de poziie indicatori derivai indicatori primari mrime medie mrimi relative median medie aritmetic medie armonic medie geometric medie ptratic mod percentile regula de adunare a dispersiilor variabilitate
STATISTIC ECONOMIC
Noiuni teoretice
3.1. INTRODUCERE n acest capitol, vom continua s examinm modalitile prin care putem s rezumm seturile de date statistice, n aa fel nct trsturile lor eseniale s poat fi puse n eviden. n capitolele precedente, am nvat cum s grupm datele brute ntr-o form mai uor de interpretat i cum s construim diferite reprezentri grafice ale datelor sistematizate. Avnd la dispoziie un set de date numerice, am nceput analiza statistic prin determinarea valorii maxime i valorii minime, apoi am determinat o distribuie de frecvene, histograma i poligonul frecvenelor. Aceste instrumente au permis identificarea formei aproximative a distribuiei i au indicat n jurul crei valori sunt mai concentrate nivelurile individuale ale variabilei. Dei o distribuie de frecvene este, cu siguran, util n conturarea unei idei de ansamblu privind distribuia datelor ntre cele dou valori extreme, vom dori, n continuare, s rezumm mai mult datele, calculnd civa indicatori statistici descriptivi. Indicatorii numerici descriptivi ofer valori precise i determinate n mod obiectiv, valori care pot fi uor folosite, interpretate i comparate una cu alta. Pe scurt, acetia permit o analiz mai atent a datelor, fa de impresia general pe care o ofer prezentarea datelor sub form de serii, tabele i grafice. 3.2. INDICATORI STATISTICI PRIMARI I DERIVAI
DEFINIIE: Indicatorul statistic n sens larg reprezent expresia numeric a unor fenomene i procese social-economice, definite n timp, spaiu i structur organizatoric. Indicatorii statistici pot fi primari i derivai. Indicatorii primari se obin, de regul, n etapa de sistematizare a datelor statistice, prin centralizarea i agregarea acestora.
CAPITOLUL 3
Indicatorii derivai se obin prin prelucrarea mrimilor absolute ale indicatorilor primari. Cele trei proprieti majore ale seriilor de date numerice, pe care le putem analiza folosind indicatorii statistici sunt cele privitoare la tendina central, la variabilitatea i la forma distribuiilor. 3.3. INDICATORI AI TENDINEI CENTRALE O clasificare a indicatorilor tendinei centrale se poate face, n funcie de modul de determinare a lor, n: indicatori (mrimi) medii de calcul: media aritmetic, armonic, ptratic, geometric etc.; indicatori medii de poziie: modul, mediana. Indicatorii fundamentali ai tendinei centrale sunt: media aritmetic, modul i mediana, dar n anumite cazuri speciale putem apela i la alte tipuri de medii. 3.3.1. Media aritmetic Media aritmetic (x ) reprezint valoarea care nlocuind toi termenii unei serii nu modific nivelul lor totalizator i se calculeaz ca suma valorilor raportat la numrul lor. (3.1) n EXEMPLUL 3.1: Vechimea n munc a fost nregistrat pentru cinci salariai ai unei firme i anume: 7, 5, 6,7 i 8 ani. Vechimea medie este: 7 + 5 + 6 + 7 + 8 33 x= = = 6,6 ani 5 5 Observm din fig. 3.1. cum media aritmetic pune n balan toate valorile individuale:
5 6 7 X =6,6 ani 8
x=
i =1
xi
STATISTIC ECONOMIC
De asemenea, dac vom considera vechimea n munc, vom observa cum media valorile extreme. Astfel, dac presupunem c munc a 10 salariai sunt: 5, 4, 5, 5, 6, 6, 4 i este:
x= 5 + 4 + ... + 4 + 20 = 6,6 ani 10
urmtoarele date privind aritmetic este afectat de datele pentru vechimea n 20, atunci vechimea medie
5
X =6,6 ani
10
15
20
n cazul n care datele au fost sistematizate ntr-o serie de distribuie de frecvene, n care valorile / centrele intervalelor de variaie x i , i = 1, r apar cu frecvenele ni media aritmetic (numit i medie aritmetic ponderat) este:
x=
i =1 r
xini
i =1
(3.2)
ni
EXEMPLUL 3.2: Presupunem c pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului, rezultnd (Tabelul 3.1):
Timp (min.) Pn la 30 30-60 60-90 90-120 120 i peste Total Numr de persoane (frecvene) ni 47 51 76 24 2 200 xi 15 45 75 105 135 Tabelul 3.1 xi ni 705 2295 5700 2520 270 11490
CAPITOLUL 3
x=
i =1 r
xini
i =1
ni
Asupra mediei aritmetice sunt de fcut cteva observaii i de subliniat cteva proprieti: a) Pentru un ir de valori constante, media este egal cu constanta; b) Media are ntotdeauna valoarea cuprins ntre valoarea minim din serie (xmin) i valoarea maxim (xmax); c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se compenseaz perfect); d) Dac valorile individuale ale unei variabile sunt mrite sau micorate cu constanta a, atunci media se modific i ea, n acelai sens, cu aceeai constant a; e) Dac valorile individuale ale unei variabile sunt modificate de h ori, media se modific i ea de h ori; Din aceste dou proprieti, d) i e), rezult formula de calcul simplificat al mediei aritmetice, pentru valori reduse cu constanta a i de h x a , i = 1, n : ori x i = i h n n x a xi i x = i =1 h + a = i =1 h h + a (3.3) n n iar pentru o serie de distribuie de frecvene: r x a r ni xini i x = i =1 h + a = i =1 h h +a (3.4)
i =1
ni
i =1
ni
EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75, h=30 i atunci:
STATISTIC ECONOMIC Tabelul 3.2 Timp (min.) < 30 30-60 60-90 90-120 120 i peste Total Frecvene ni 47 51 76 24 2 200
r
xi 15 45 60 105 135
x i =
xi a h
x i n i
-2 -1 0 1 2
- 94 - 51 0 24 4 -117
x=
i =1 r
xini
i =1
h +a =
ni
f) ntr-o serie de distribuie de frecvene, dac frecvenele sunt modificate de c ori, media rmne neschimbat.
i =1
frecvenele
deci:
ni c
ni , i = 1, r i rezult, n
x=
i =1
(3.5)
xi ni 100
*%
(3.6)
g) Dac o serie statistic este alctuit din mai multe serii componente, pentru care s-au calculat medii pariale x j , j = 1, m , atunci media ntregii serii poate fi calculat ca o medie aritmetic ponderat din mediile pariale:
( )
x=
x jn j
j=1 m
(3.7)
nj
j=1
CAPITOLUL 3
h) Pentru dou caracteristici statistice X i Y, pentru care s-au calculat mediile x i, respectiv, y , media sumei valorilor individuale (xi + yi) este ntotdeauna egal cu suma mediilor: x+y=x+y (3.8) i) Pentru dou caracteristici statistice X i Y, pentru care s-au calculat x i y , media produsului (xi yi) este egal cu produsul mediilor, doar dac cele dou variabile sunt independente:
xy = x y
(3.9)
n cazul n care variabila studiat este de tip alternativ (dihotomic), atunci celor dou variante de rspuns (afirmativ i negativ) li se vor acorda, convenional, valorile numerice 1 i, respectiv, 0. Pentru calculul mediei aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3 Varianta de rspuns Afirmativ Negativ Total xi 1 0 Frecvene ni m n-m n Frecvene relative n * i
m =f n nm = 1 f n
1
STATISTIC ECONOMIC
x=
i =1
xini n
1 m + 0(n m ) m = =f n n
(3.10)
Indicatorii medii de poziie sunt: modul i mediana. Mediana face parte din indicatorii (mai generali) de poziie, numii cuantile, alturi de cuartile, decile etc.
3.3.3.1 Valoarea modal Modul (M0) reprezint valoarea cel mai des ntlnit ntr-o serie statistic sau cea care are cea mai mare frecven de apariie. n cazul seriilor de distribuie de frecvene pe intervale de variaie, determinarea modului presupune mai nti, identificarea intervalului cu frecven maxim (int M0). Apoi, modul se poate determina conform relaiei:
d1 M 0 = x inf M 0 + d + d h M 0 2 1 unde: xinfMo reprezint limita inferioar a intervalului modal; h M0 reprezint mrimea intervalului modal;
d1
(3.11)
reprezint diferena dintre frecvena intervalului modal i a celui reprezint diferena dintre frecvena intervalului modal i a celui
precedent;
d2
urmtor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modal este: (76 51) M 0 = 60 + 30 = 69,74 minute (76 51) + (76 24)
O distribuie cu un singur mod se numete unimodal (fig. 3.3a), o distribuie este bimodal dac are dou valori dominante (moduri) (fig. 3.3b) i multimodal dac are mai mult de dou moduri (fig. 3.3c).
CAPITOLUL 3
y
y
Frecvene
Frecvene
Frecvene
M0 a)
x o
M01 b)
M02
x o
M01
M02 c)
M03
3.3.3.2 Mediana Mediana (Me) este un indicator mediu de poziie care face parte din categoria cuantilelor. Ea reprezint valoarea/varianta din mijlocul unei serii de date, serie n care observaiile au fost ordonate cresctor (sau descresctor). Dac datele au fost sistematizate ntr-o serie de distribuie de frecvene pe variante, pentru determinarea medianei vom calcula, mai nti, frecvenele cumulate (Fci). Prima frecven cumulat mai mare dect (n+1)/2, adic mai mare dect locul medianei, ne indic varianta median. EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au sistematizat datele privind numrul membrilor de familie, rezultnd distribuia de frecvene (Tabelul 3.4):
Numrul membrilor de familie 1 2 3 4 5 Total Numr de familii ni 12 23 30 8 7 80 Tabelul 3.4 Frecvene cumulate Fci 12 35 65 73 80
Varianta 3 membrii de familie reprezint varianta median, situat n mijlocul distribuiei; Pentru o serie de repartiie de frecvene pe intervale de variaie (date de tip continuu), mediana se va ncadra n intervalul median, primul
STATISTIC ECONOMIC
interval cu frecvena cumulat mai mare dect locul (rangul, poziia) medianei. 1 r n i + 1 FC( Me1) 2 i=1 n Me
Me = x inf Me + h Me unde:
(3.12)
reprezint mrimea intervalului median; 1 r n +1 reprezint locul medianei n serie; n i + 1 = 2 i =1 2 FC(Me - 1) reprezint frecvena cumulat a intervalului anterior celui median; nMe reprezint frecvena absolut a intervalului median.
h Me
EXEMPLUL
3.7:
Pe
baza
datelor
din
Tabelul
3.1,
100,5 98 Me = 60 + 30 61 76
minute
Pentru o distribuie simetric, media, mediana i modul coincid (Fig. 3.3a). Dac distribuia este cu tendin de normalitate dar pozitiv nclinat, spre valori mari (cu coada mai lung a distribuiei spre valorile mari) atunci x > Me > M 0 (Fig. 3.4b); dac distribuia este moderat oblic i negativ ncheiat, spre valorile mici (cu coada mai lung a distribuiei spre valorile mici, atunci x < Me < M 0 (Fig. 3.4c). n general, pentru repartiii moderat asimetrice, exist o relaie empiric ntre cele trei valori i anume:
M 0 x 3 Me x
(3.13)
CAPITOLUL 3
x=Me=Mo
Mo Me x
x Me Mo
Fig. 3.4 - a) distribuie simetric; b) distribuie cu asimetrie pozitiv; c) distribuie cu asimetrie negativ
3.3.3.4. Cuantilele Cuantilele, categorie de indicatori de poziie din care face parte i mediana, pot fi uor nelese intuitiv prin extinderea noiunii de median i reprezint valori ce mpart seria n pri egale.
y
de ordin n patru
25% din n numr 25% 25% 25% 25% (fig. x Q1 Q2=Me Q3 o cuartila Fig. 3.5 - Cuartilele ntr-o serie de repartiie egal mediana, cuartila superioar. Similar se pot determina cuantile de ordin superior, ca de pild decilele (care sunt D1, ...., D9 i delimiteaz cte 10% din observaii, D5 = Me) ori percentile (delimiteaz cte 1% din observaii).
3.3.4. Alte tipuri de medii 3.3.4.1. Media armonic Media armonic x h este o medie de calcul cu aplicaii speciale, care se determin, pentru o serie de date cantitative, ca valoarea invers a
Astfel, cuartilele (cuantile patru) mpart seria pri egale, ele delimitnd cte observaii. Ele sunt de trei: Q1, Q2, Q3 3.5); Q1 se numete inferioar, Q2 este ntotdeauna cu Q3 se numete
Frecvene relative
( )
STATISTIC ECONOMIC
mediei aritmetice, calculat din inversele valorilor seriei. Aadar media armonic simpl este: n xh = n (3.14) 1 i =1 x i Pentru o serie de distribuie de frecvene, media armonic ponderat este: xh =
i =1
ni
1 ni i =1 x i 1 xh = r 1 * ni i =1 x i 100 xh = r 1 *% ni i =1 x i
r
(3.15)
(3.16)
(3.17)
EXEMPLUL 3.8: Un conductor auto cumpr ulei de motor, la preul de 90.000 lei/litru, n valoare total de 450.000 lei dintr-un magazin, iar din alt magazin, la preul de 120.000 lei/litru, n valoare total de 480.000 lei. Care a fost preul mediu pe litru, pe care l-a pltit?
p= 450000 + 480000 vi vi = = = 103333,3 1 1 1 qi v 450000 + 480000 i pi 90000 120000
lei/litru
3.3.4.2. Media ptratic Media ptratic x p este tot o medie de calcul cu aplicaii speciale i reprezint valoarea care, nlocuind termenii seriei, nu modific suma ptratelor lor. Aadar:
xp =
i =1
xi n
(3.18)
CAPITOLUL 3
xp =
i =1 r
(3.19)
ni
xp =
i =1
xi ni 1
2 *
(3.20)
xp =
i =1
xi ni 100
2 *%
(3.21)
3.3.4.3. Media geometric Media geometric x g se calculeaz ca rdcina de ordinul n din produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care nlocuind termenii seriei nu modific produsul lor:
( )
xg = n xi
i =1
(3.22)
ni
(3.23)
(3.24)
STATISTIC ECONOMIC
n analiza unei serii statistice de date cantitative ne intereseaz, pe lng indicatorii tendinei centrale i indicatorii variabilitii, ai mprtierii valorilor. Astfel, dou serii statistice pot diferi prin tendina central (Fig 3.6a), prin mprtierea datelor (Fig. 3.6b) sau prin amndou (Fig. 3.6c).
y y y
a)
b)
Fig. 3.6 - a) Distribuii cu tendin central diferit; b) Distribuii cu variabilitate diferit; c) Distribuii cu tendin central i variabilitate diferite
c)
Aceti indicatori msoar mprtierea valorilor individuale ale seriei, una fa de alta, ori fa de o valoare tipic.
3.4.1.1. Amplitudinea variaiei Amplitudinea variaiei (Ax) se calculeaz ca valoarea maxim minus valoarea minim a variabilei: (3.25) Ax = xmax xmin
CAPITOLUL 3
Indicatorul are unitatea de msur a variabilei studiate i uneori se folosete i valoarea sa njumtit, indicator cunoscut ca abaterea semiintercuartilic:
A Q = Q 3 Q1 2
(3.28)
(3.29)
d i% =
xi x x
(3.30)
De asemenea, prezint interes abaterea maxim pozitiv: d + = x max x max i abaterea maxim negativ: d = x min x max
3.4.2. Indicatori sintetici ai variabilitii 3.4.2.1. Abaterea medie liniar O prim soluie la care putem apela pentru a surprinde, printr-o singur msur, ntreaga mprtiere din serie este s calculm media abaterilor individuale. Dar, pentru c aceste abateri se compenseaz
(3.31)
(3.32)
STATISTIC ECONOMIC
reciproc, trebuie s le considerm n valoare absolut. Obinem, astfel, abaterea medie liniar d x calculat pentru o serie simpl:
dx =
i =1
xi x
n
( )
(3.33)
xi x ni
i =1 r
ni
(3.34)
dx =
i =1
x i x n *% i
100
(3.35)
Abaterea medie liniar se exprim n unitatea de msur a caracteristicii i ne arat cu ct se abat, n medie, valorile individuale de la media lor.
EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obinem:
Tabelul 3.5 Timp (min.) pn la 30 30-60 60-90 90-120 120 i peste Total Nr. de persoane (ni) 47 51 76 24 2 200
xi
15 45 75 105 135
xi x ni
x = 57,45 minute
dx
i =1
xi x ni
i =1
ni
min
3.4.2.2. Dispersia Dispersia s 2 se calculeaz ca media aritmetic a ptratelor x abaterilor individuale ale valorilor de la tendina central (uzual de la medie). Pentru o serie simpl, formula dispersiei este:
( )
CAPITOLUL 3
s2 = x
i =1
(x i x )
n
(3.36)
2
(x i x ) n i
r i =1 r
ni
2
(3.37)
(x i x ) n *% i
100
(3.38)
xi 15 45 75 105 135
(x i x )2 ni
84694,12 7905,13 23408,19 54264,06 12028,00 182299,50
Tabelul 3.6
(x i x ) n i
2 i =1
ni
Se cuvine s facem i asupra dispersiei cteva observaii i s remarcm cteva din proprietile sale: a) Pentru un ir de valori constante, dispersia este nul; b) Dispersia calculat fa de medie s 2 este mai mic dect orice x alt dispersie calculat fa de o valoare a, cu ptratul distanei dintre medie i constanta a: 2 2 s 2 = s a (x a ) (3.39) x c) Dac valorile variabilei statistice studiate sunt modificate (micorate sau mrite) cu constanta a, dispersia seriei rmne neschimbat;
( )
STATISTIC ECONOMIC
d) Dac valorile variabilei statistice studiate se modific de h ori, dispersia se modific (n acelai sens) de h2 ori Rezult i n calculul dispersiei c, dac vom combina proprietile 2 i 4, vom obine formula de calcul simplificat al dispersiei, pentru o serie simpl:
x a i h 2 h xa s 2 = i=1 x n
n 2
)2
(3.40)
i =1
ni
2
h2 x a
)2
)2
(3.41)
x i a *% ni h s 2 = i=1 h2 x a x 100
(3.42)
nem:
Tabelul 3.7 Timp (min) <30 30-60 60-90 90-120 120 i peste Total Frecvene ni 47 51 76 24 2 200
xi a ni i =1 h
x a x = i i h
(x )
2 i
x a = i h
x n i i
-2 -1 0 1 2
4 1 0 1 4
188 51 0 24 8 271
s2 = x
i =1
ni
h2 x a
CAPITOLUL 3
s2 = x
x i2 i =1
n
x =
x i2 i =1
n
n xi i=1 n
(3.43)
x i2 n i
i =1 r
ni
2 x = i=1
x i2 n i
i =1 r
ni
(3.44)
2
s 2 = i=1 x
x i2 n *% i
100
2 x = i=1
x i2 n *% x i n *% i i
100
i=1 100
(3.45)
f) Dac o serie este compus din m serii componente (grupuri), fiecare serie component fiind de volum nj, j = 1, m , atunci se pot calcula mediile seriilor componente, x j , j = 1, m i dispersiile seriilor componente:
s2 = x
j
i =1
(x i x j )
nj
nj
, j = 1, m
(3.46)
Dispersia general a colectivitii poate s fie scris n funcie de dispersiile seriilor componente (grupurilor):
s2 = x
s2 j n j x
j=1 m
(x j x ) n j
m 2 j=1
n j
j=1
nj
j=1
(3.47)
Expresia:
s2 j n j x
j=1 m
nj
j=1
STATISTIC ECONOMIC
sx =
s2j n j x
j=1 m
(3.48)
nj
j=1 2
Expresia:
(x j x ) n j
m j=1
nj
j=1
media general, doar ca urmare a aciunii factorului dup care s-au alctuit grupurile, seriile componente. Aceast expresie se numete dispersia dintre grupe d 2 : x
( )
d2 = x
(x j x ) n j
m 2 j=1
n j
j=1
(3.49)
(3.50)
Putem spune c d 2 explic msura n care factorul de grupare x determin variaia variabilei studiate i s calculm coeficientul de determinaie:
R2 = d2 x s2 x
( )
(3.51)
d2 x s2 x
100
(3.52)
Evident, msura n care ali factori (din interiorul grupelor) determin variaia variabilei, este dat de coeficientul de nedeterminaie:
K2 = sx s2 x
2
= 1 R2
(3.53)
CAPITOLUL 3
sx s2 x
2 100 = 100 R %
(3.54)
EXEMPLUL 3.12: O firm ce comercializeaz produse cosmetice a realizat ntr-o lun de var, prin cele 30 de magazine de desfacere situate pe litoral, o vnzare medie de 400 milioane lei pe magazin, cu o dispersie a vnzrilor de 2500; iar prin cele 20 de magazine din zona montan, o vnzare medie de 200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul n care zona de amplasare a magazinelor determin variaia vnzrilor, vom calcula: x L n L + x M n M 30 400 + 20 200 16000 x= = = = 320 mil lei nL + nM 50 50
sx = d2 = x
2
Aadar
2 R% =
d2 x s2 x
100 =
(3.55)
n studiul variabilitii datelor se folosete rdcina ptrat a dispersiei, indicator numit abaterea medie ptratic:
STATISTIC ECONOMIC
sx = s2 = x
r
i =1
(x i x )
n
n
2
(3.56)
(x i x ) n i
i =1 r
ni
2
(3.57)
sx =
i =1
(x i x ) n *% i
100
(3.58)
Abaterea medie ptratic (numit i abatere tip, abatere standard, deviaie standard sau ecart tip) este calculat ca o medie ptratic din abaterile termenilor seriei de la media lor. O regul empiric ne spune c, pentru serii de distribuie de frecvene cu tendin de normalitate (simetrice sau moderat asimetrice), abaterea medie liniar reprezint aproximativ patru cincimi din abaterea medie ptratic:
dx 4 sx 5
(3.59)
(3.60)
minute
Pentru asigurarea comparabilitii mprtierii datelor se folosete expresia relativ a variabilitii, coeficientul de variaie:
CAPITOLUL 3
s v = x 100 x
(3.61)
Cu ct valoarea coeficientului de variaie este mai mic, cu att acest lucru semnific o omogenitate crescut a datelor.
EXEMPLUL 3.14. Pentru seriile de date: A: 10; 11; 12; 13; 14; 15; 16 B: 60; 61; 62; 63; 64; 65; 66
vA = vB = sxA xA sx B xB 100 = 100 = 2 100 = 15,4% 13 2 100 = 3,2% 63
O regul empiric, care se aplic distribuiei normale simetrice sau moderat asimetrice, ne spune c: aproximativ 68%din valori se situeaz n intervalul x x ;
aproximativ 95% din valori se situeaz n intervalul x 2 x ; aproximativ 99,8% din valori se situeaz n intervalul x 3 x . (fig. 3.7)
13,5%
34%
34%
13,5%
STATISTIC ECONOMIC
Forma unei distribuii de frecvene se analizeaz, comparativ cu distribuia ideal, normal, prin: indicatori asimetrici (oblicitii) i indicatori ai boltirii (excesului).
3.5.1. Indicatori ai asimetriei (oblicitii) Asimetria, n valoare absolut, se poate msura cu indicatorii:
AS = x M 0
(3.62)
sau
A S1 = 3 x Me
(3.63)
indicatori care au unitatea de msur a variabilei studiate i care sunt pozitivi sau negativi, n funcie de tipul de asimetrie (coada mai lung a distribuiei spre valorile mari sau spre valorile mici).
Coeficientul de asimetrie (Pearson) este:
C as = x M0 sx
(3.64)
coeficient care ia valori pozitive n cazul curbelor alungite spre dreapta (asimetrie pozitiv) i valori negative n cazul curbelor alungite spre stnga (asimetrie negativ). Coeficientul de asimetrie poate s fie scris i pe baza relaiei dintre medie i median:
C as1 = 3 x Me sx
(3.65)
CAPITOLUL 3
C as1 = 3 x Me 57,45 61 = = 0,118 sx 30,19
ceea ce semnific o asimetrie negativ moderat (coada mai lung a distribuiei nspre valorile mici). Analiza oblicitii (asimetriei) se poate face i pe baza momentelor centrate de ordin 3: m 3 = i =1 sau, utiliznd frecvene: m 3 = i =1
r
(x i x )
n
n
3
(3.66)
(x i x ) n i
i =1
ni
2 m3
= i =1
(x i x ) n *% i
r 3
100
(3.67)
(3.68)
Coeficientul 1 va avea valoare mai mare dect zero n cazul asimetriei pozitive, valoare mai mic dect zero n cazul asimetriei negative i va fi egal cu zero n cazul seriei perfect simetrice.
3.5.2. Indicatorii de poziie i forma distribuiei
dar, pentru a o exprima n coeficieni adimensionali, o vom raporta la indicatorul de mprtiere abaterea intercuartilic AQ (3.60) i obinem coeficientul de asimetrie (Yule i Kendall): C asq =
(3.70)
STATISTIC ECONOMIC
Pe baza indicatorilor de poziie se poate alctui un rezumat al celor cinci indicatori, care ofer informaii privind tendina central, dar i forma distribuiei studiate. Aceste cinci valori sunt: valoarea, minim xmin (denumit, uneori, percentila 0); cuartila inferioar Q1 (delimiteaz cele mai mici 25% din valori); mediana Me (delimiteaz50% din valori); cuartila superioar Q3 (delimiteaz cele mai mari 25% din valori); valoarea maxim xmax (denumit, uneori, a 100-a percentil). Cele cinci valori se reprezint grafic prin intermediul diagramei Box-Plot (fig. 3.8). Pe grafic pot fi marcate i media i modul.
X m in
25%
Q1
25%
Me
25%
Q3
25%
X m ax
3.6. MRIMI RELATIVE DEFINIIE: Mrimile relative reprezint rezultatul comparrii sub form de raport a doi indicatori statistici: un indicator comparat (raportat) i un indicator de baz de comparaie (baz de raportare).
(3.71)
CAPITOLUL 3
k reprezint un numr ntreg ce poate fi egal cu: k=0 i atunci exprimarea se face n coeficieni; k=2 i atunci exprimarea se face n procente (%); k=3, k=4, k=5 ,exprimarea se face n promile (0/00), respectiv prodecimile (0/000) i procentimile (0/0000).
3.6.1. Mrimi relative de structur Mrimile relative de structur se calculeaz sub forma unui raport ntre parte i ntreg, prezentnd astfel structura colectivitilor statistice sistematizate att dup variabile cantitative ct i dup variabile calitative. Mrimile relative de structur pot fi: greuti specifice (ponderi) i frecvene relative. Greutatea specific (ponderea) este:
g ix = xi
i =1
xi
(3.72)
g ix % =
xi
i =1
xi
100
(3.73)
i ne arat ponderea nivelului caracteristicii dintr-o unitate n nivelul total al caracteristicii din colectivitatea statistic. Dac datele au fost sistematizate pe grupe/clase, atunci greutatea specific este:
g ix =
i =1 j=1 ni
x ij x ij
100 (3.75)
j=1 r ni
x ij
(3.74)
ni
g ix % =
i =1 j=1
x ij
j=1 r ni
STATISTIC ECONOMIC
EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules i sistematizat date privind producia zilnic realizat de muncitori (Tabelul 3.8)
Judeul/Filiala
0
Numr de muncitori
1
4 3 6
Filiala
0
A B C Total
Rezultatul ne arat de cte ori este mai mare (dac rezultatul este supraunitar), sau mai mic (dac rezultatul este subunitar) nivelul variabilei n unitatea (grupa, colectivitatea) i fa de nivelul variabilei n unitatea (grupa, colectivitatea) j. Exprimarea rezultatului mrimii relative de coordonare (numit i raport de coordonare) se poate face i n procente . Reprezentarea grafic a mrimilor relative de coordonare se face prin intermediul diagramei prin benzi, coloane ori suprafee.
CAPITOLUL 3
Pe baza datelor din Tabelul 3.8, col. 1 i din Tabelul 3.9, col.1,obtinem (vezi Tabelul 3.10):
Filiala
0
A B C
(3.77)
x y
i =1 n
zy
i =1
i =1
z gi
(3.78)
Reprezentarea grafic a mrimilor relative de intensitate se face cu ajutorul diagramelor prin coloane, prin benzi ori prin suprafee. Pe baza datelor din Tabelul 3.8, col.1 i Tabelul 3.9, col.1, putem calcula producia obinut de un muncitor (buci pe muncitor) (Tabelul 3.11):
Filiala
0
A B C Total
STATISTIC ECONOMIC
3.6.4. Mrimi relative de dinamic Mrimile relative de dinamic sunt folosite pentru analiza evoluiei n timp a fenomenelor social-economice. x x i 1 0i = 1i (3.79) x 0i x x i 1 0 = 1i 100 (3.80) x 0i De remarcat c, la nivel totalizator (de ntreg), calculm indicii ntruna din variantele: - ca medie aritmetic a indicilor individuali:
I1 x = 0 i =1 n
x1i
i =1
x 0i
x x = i1 0i g 0i = i=1
i =1
x i1 0i x 0i
i =1 n
x 0i
(3.81)
x i =1 i1 0i
1 1
=
x g1i
x i =1 i1 0i
i =1
x1i
1
x x1i
(3.82)
Evident, pentru o exprimare procentual, rezultatele se nmulesc cu 100. Reprezentarea grafic a mrimilor relative de dinamic se poate face prin diagrama prin coloane, benzi, ori suprafee.
3.6.5. Mrimi relative ale planului (prevederilor) Mrimile relative ale planului sunt: mrimea relativ (indicele) sarcinii programate:
x i p 0i =
x pi x 0i
(3.83)
CAPITOLUL 3
x i p %i = 0
x pi x 0i
100
(3.84)
x 1i x pi x 1i 100 x pi
(3.85)
x i1 % = pi
(3.86)
Se observa ca:
x x i p %i i 1 % = 0 pi
x pi x 1i x 1i x = = i 1 0i x 0i x pi x 0i
(3.87)
Reprezentarea grafic a mrimilor relative ale prevederilor se face cu ajutorul diagramei prin coloane, benzi ori suprafee.
STATISTIC ECONOMIC
ntrebri recapitulative 1. Ce este indicatorul statistic? 2. Care sunt funciile indicatorilor statistici? 3. Ce sunt indicatorii statistici? Cum se obin ei? 4. Ce sunt indicatorii tendinei centrale? 5. Care sunt principalele tipuri de indicatori ai tendinei centrale? 6. Media aritmetic: definiie, proprieti, observaii, utilizri. 7. Care sunt indicatorii de poziie? 8. Modul: definiie, calcul, utilizri, proprieti. 9. Mediana: definiie, calcul, utilizri, proprieti 10. Cum se determin mediana pentru o serie de distribuie pe variante? Dar pe intervale de variaie? 11. Analiza comparativ a celor trei indicatori ai tendinei centrale. 12. Ce sunt cuantilele? 13. Care este semnificaia cuantilelor de ordin 4? 14. Media armonic: definiie, calcul, utilizri, proprieti. 15. Media ptratic: definiie, calcul, utilizri, proprieti. 16. Media geometric: definiie, calcul, utilizri, proprieti. 17. Ce se nelege prin variabilitatea datelor statistice? 18. Necesitatea msurrii variabilitii. 19. Ce este amplitudinea datelor? Calcul i interpretare. 20. Care sunt indicatorii simpli ai variabilitii? 21. Ce reprezint abaterea medie liniar? 22. Dispersia: determinare, observaii, proprieti. 23. Cum se determin media i dispersia unei variabile alternative? 24. Cum se determin abaterea medie ptratic? Semnificaie, utilizri. 25. Coeficientul de variaie: calcul, utilizri. 26. Cum se compune dispersia pentru o serie structurat n serii componente? 27. Cum se interpreteaz abaterea medie ptreatic folosind regula empiric? 28. Ce reprezint oblicitatea unei repartiii? 29. Cum se analizeaz asimetria (oblicitatea) unei repartiii? 30. Cum se analizeaz boltirea/aplatizarea unei repartiii? 31. Cum se poate studia forma distribuiei folosind indicatorii de poziie? 32. Cum se construiete i interpreteaz diagrama Box-Plot? 33. Cum se obin indicatorii statistici derivai? 34. Ce sunt mrimile relative?
CAPITOLUL 3
35. Mrimile relative de structur: definiie, utilizare, reprezentare grafic, exemple. 36. Mrimile relative de coordonare: definiie, utilizare, reprezentare grafic, exemple. 37. Mrimile relative de intensitate: definiie, utilizare, reprezentare grafic, exemple. 38. Mrimile relative de dinamic: definiie, utilizare, reprezentare grafic, exemple. 39. Mrimile relative ale planului: definiie, utilizare, reprezentare grafic, exemple. 40. Care sunt cele trei proprieti pe care urmrim s le analizm i s le descriem n analiza unui set de date numerice?