Documente Academic
Documente Profesional
Documente Cultură
Remus BUTNESCU-VOLANIN
STATISTIC
DESCRIPTIV
Refereni tiinifici:
Prof. dr. ec. Doina-Maria Simion, Universitatea Lucian Blaga din Sibiu
Prof. dr. ec. Dr. H. C. Ioan Bogdan, Universitatea Lucian Blaga din
Sibiu & Universitatea Romno-American din Bucureti
Prof. dr. ing. i ec. Moise uurea, Universitatea Lucian Blaga din
Sibiu
CUPRINS
CAPITOLUL 1. Locul statisticii n cunoaterea uman
13
15
15
16
22
24
25
28
29
31
41
44
46
46
47
49
51
58
67
73
80
81
4.1. Cuantilele
83
4.2. Mediana
83
4.3. Moda
90
4.4. Mediala
98
105
108
122
128
10
133
6.1. Amplitudinea
137
138
140
140
150
151
153
153
6.9. Covariana
154
159
161
169
175
177
177
11
181
195
BIBLIOGRAFIE SELECTIV
197
212
221
12
LOCUL STATISTICII N
CUNOATEREA UMAN
1.
OBIECTIVELE CAPITOLULUI
Obiectivul principal al acestui capitol este de a v introduce n lumea statisticii,
ajutndu-v:
s nelegei rolul statisticii n cunoaterea uman;
s reinei principalele concepte ale limbajului statistic;
s facei distincia ntre preocuprile statisticii descriptive i cele ale statisticii
infereniale;
s reinei diferitele niveluri posibile de msurare a datelor.
14
Cf. Dicionarului explicativ al limbii romne, Academia Romn, Institutul de Lingvistic "Iorgu
Iordan", Editura Univers Enciclopedic, ediia 1998, http://dexonline.ro/
15
16
Populaia statistic
Aeroporturile internaionale
participante la topul ACI
Nivelurile de vnzri
nregistrate n primele 6 luni
ale anului 2006 pentru
automobilele marca Daewoo
calitative sau
nenumerice
Variabile statistice
cantitative sau
numerice
17
Frecvene absolute
Frecvene relative
Ianuarie
7540
Februarie
9635
8,49%
Martie
13314
11,73%
Aprilie
11186
9,86%
Mai
10163
8,96%
Iunie
12981
11,44%
Iulie
10056
8,86%
August
2921
2,57%
Septembrie
7343
6,47%
Octombrie
10841
9,55%
Noiembrie
9442
8,32%
Decembrie
8067
7,11%
Total
113489
100,00%
18
19
Ludwig von Mises, The Ultimate Foundation of Economic Science, Van Nostrand Edition, 1962, p. 55:
As far as there is discernible regularity in the succession of phenomena, no recourse to statistics is
needed.
20
Numr
decedai
Spor natural
Decembrie 2006
15288
23423
-8135
Ianuarie 2007
18795
25578
-6783
(-6783) (-8135) =
Variaie
3507
2155
3507 2155 =
1352
Statistica inferenial
Statistica modern s-a dezvoltat mai ales prin apariia i dezvoltarea
metodelor de investigare parial. Metodele de investigare statistic
parial sunt metode ale aa-numitei statistici infereniale. Statistica
inferenial i propune s caracterizeze populaia statistic studiat prin
observarea doar a uneia sau mai multor pri ale acesteia, denumite
eantioane. Bineneles, o astfel de caracterizare nu poate fi dect una
estimativ, valorile statistice obinute la nivel de eantion statistic fiind
denumite estimatori statistici. Estimarea statisticilor unei populaii prin
intermediul unor astfel de metode se numete infereniere statistic (figura
1.2).
Eantionul este o parte din ntregul definit de o populaie statistic, parte
care, atunci cnd este corect constituit (adic innd cont de principii
statistice izvorte din teoria seleciei), este suficient de reprezentativ
pentru ntreaga populaie statistic din care provine.
Conform comunicatelor de pres ale Institului Naional de Statistic - nr. 35 din 15 februarie 2007 i,
respectiv, nr. 56 din 20 martie 2007, http://www.insse.ro/statistici/comunicate/pop.htm
21
E s tim a r e a
s ta tis tic ii
E A N T I O N la
n iv e lu l c r u ia
s e d e te r m in
e s tim a to r u l
P O P U L A IE
d e s c r is d e
s ta tis tic a
S E L E C IA
a le a to a r e a u n u i
e a n tio n i
c a lc u lu l u n e i
a l
e s tim a to r
s ta tis tic ii
22
23
Raional
Interval
Ordinal
Nominal
25
27
1.7. Erorile de
nregistrate
observare
statistic.
Controlul
datelor
Erorile de observare statistic sunt determinate cel mai des de: omisiuni de
nregistrare a variantelor particulare ale variabilelor studiate; nelegerea
sau transmiterea greit a unor mrimi numerice; culegerea de date
conform unor instruciuni greit nelese; nregistrri pe baz de date
inexacte (din memorie) etc.
n general, erorile de observare statistic se mpart n:
erori ntmpltoare erori foarte des ntlnite, care se produc de cele
mai multe ori din neatenie. Acest gen de erori afecteaz rezultatele
observrii ntr-o mic msur deoarece ele se produc n ambele sensuri,
compensnd-se;
erori sistematice erori care se produc n acelai sens, determinnd
abateri semnificative de la nivelul real al caracteristicilor studiate.
Aceste erori sunt determinate, de cele mai multe ori, de redactarea
necorespunztoare a instruciunilor de culegere a datelor.
Cele dou grupe de erori amintite pot aprea i pe parcursul celorlalte dou
etape ale programului de cercetare statistic (prelucrarea primar i analiza
datelor statistice).
Pentru evitarea apariiei de erori n etapa de observare statistic, se
recomand:
efectuarea unor observri de prob;
aplicarea de operaii de control pentru depistarea la timp a eventualelor
erori. Controlul poate fi de tip aritmetic sau de tip logic. Controlul
aritmetic presupune efectuarea de operaii simple de calcul (pe baza
unor "chei de calcul") pentru analiza i verificarea unor date derivate.
Controlul logic const n testarea concordanei logice ntre variantele
28
unde:
30
A x max x min
=
ng
ng
mi =
unde:
n g = numrul de grupe;
b. dac nu se fixeaz anterior numrul de grupe, se folosete relaia
propus de H.A. Sturges:
mi =
x max xmin
1 + 3,322 log n
31
titlul general, prin care este prezentat, ntr-o form complet, dar i
concis, obiectul tabelului. Pentru a fi complet, titlul general trebuie s
defineasc populaia statistic att n spaiu, ct i n timp. Concizia
titlului general nu trebuie s afecteze, desigur, precizia i claritatea sa;
titlurile interioare, adic cele ale rndurilor i coloanelor tabelului.
Titlurile interioare definesc gruparea sau gruprile datelor statistice
prezentate;
macheta tabelului, adic reeaua de rnduri i coloane (care formeaz
rubricile n care se nscriu datele);
unitile de msur utilizate pentru exprimarea datelor;
eventualele note explicative necesare pentru interpretarea corect a
datelor;
sursele datelor, a cror cunoatere permite verificarea, de ctre cei
interesai, a exactitii informaiilor.
Dup numrul i natura variabilelor statistice implicate, se ntocmesc:
diagramele statistice;
histograma;
poligonul frecvenelor;
ogiva;
cartograma;
cronograma;
corelograma.
Diagramele statistice
Principalele tipuri de diagrame statistice sunt:
1991
95947
1992
137411
1993
117025
1994
75179
Total
425562
75179
1993
117025
1992
137411
1991
95947
0
50000
100000
150000
Coloanele difer ntre ele doar prin nlime, aceasta fiind direct
proporional cu mrimea valorilor reprezentate. Diagramele prin coloane
se folosesc cel mai des pentru reprezentarea evoluiei n timp a
fenomenelor studiate. n figura 1.5 sunt reprezentate grafic datele din
tabelul 1.4, optndu-se de aceast dat pentru o diagram prin coloane.
100000
95947
75179
50000
0
1991
1992
1993
1994
N u m r u l d e u n it i n m a tr ic u la te
75179
95947
117025
137411
1991
1992
1993
1994
n figura 1.7 este redat, tot printr-o diagram de tip plcint, structura
rspunsurilor la ntrebarea Cum apreciai c a fost nivelul de trai n 2006
fa de 2005? pe care compania de cercetare a pieei Daedalus
Consulting a pus-o celor chestionai n cadrul unui studiu de analiz a
percepiei persoanelor din mediul urban cu privire la nivelul de trai din
anul 2006, fa de anul 2005 5 .
Rezultatele studiului au fost preluate din ziarul Adevrul, nr. 5189, din 17 martie 2007,
http://www.adevarulonline.ro/articole/oficial-traim-mai-bine/306308
36
Histograma
Histograma se folosete pentru reprezentarea repartiiilor variabilelor
statistice definite pe intervale.
Ea se construiete ntr-un sistem rectangular de axe astfel:
37
5
30
19
17
7
16
29
23
19
8
3
24
19
10
2
32
18
19
3
9
11
21
1
20
18
35
18
2
9
3
17
16
9
10
27
10
11
3
1
22
Frecvene absolute
14
9
3
13
6
3
2
Total
50
Frecvene absolute
15
10
14
13
9
6
3
0
[0-5]
(5-10]
(10-15]
(15-20]
(20-25]
(25-30]
2
(30-35] Ani
38
Frecvene absolute
15
10
14
P oligonul frecvenelor
13
9
0
[0-5]
(5-10]
(10-15]
(15-20]
(20-25]
(25-30]
2
(30-35] Ani
Frecvene
14
9
3
13
6
3
2
Total
50
Frecvene absolute
14
23
26
39
45
48
50
Cartograma i cartodiagrama
Cartogramele sunt grafice care se folosesc pentru evidenierea variaiilor
care apar la nivelul diferitelor uniti statistice teritoriale. Ele se reprezint
direct pe hri i se folosesc n cazul variabilelor statistice teritoriale.
Combinaiile dintre diagrame i cartograme se numesc cartodiagrame.
Cronograma
Cronograma se folosete n cazul seriilor statistice cronologice. Ea este, de
fapt, o diagram pentru care una dintre axe este axa timpului.
Corelograma
Corelograma se folosete pentru evidenierea legturilor statistice dintre
fenomenele cercetate. Este o diagram pentru care pe cele dou axe sunt
reprezentate cele dou variabile supuse cercetrii din punctul de vedere al
legturii statistice dintre ele.
Cel mai des se folosete metoda grafic a "norului de puncte". "Punctele"
au ca i coordonate perechile de valori pe care le nregistreaz cele dou
variabile studiate din punctul de vedere al corelaiei statistice.
n figura 1.11 este reprezentat un astfel de nor de puncte pentru
evidenierea legturii statistice dintre variabila "cheltuieli cu reclama" i
variabila "vnzri", ale cror valori au fost nregistrate pentru un numr de
8 companii.
1200
Vnzri totale
1000
800
600
400
200
0
0
10
20
30
40
50
60
70
C h e ltu ie li c u re c la m a
40
EXPRIMAREA N MRIMI
RELATIVE A
INFORMAIILOR
STATISTICE
2.
OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate mrimile relative disponibile pentru descrierea
comparativ a colectivitilor statistice, ajutndu-v:
s reinei principalele tipuri de mrimi relative disponibile pentru descrierea
statistic;
s nelegei, prin apelul la exemple, utilitatea apelului la mrimile relative n
cercetarea statistic;
s nelegei cum se alege unitatea de msur statistic n funcie de mrimile
relative la care se face apel.
manifestate
ntre
diferite
variabile
statistice
44
a) la sfritul anului 2006, circa 58% din localitile din Romnia erau
alimentate cu gaze naturale:
Pentru comparaii
de volum la nivelul
unei repartiii
statistice
unde:
Ri reprezint frecvena relativ de apariie a variantei i a variabilei X;
Fi = frecvena absolut de apariie a variantei i a variabilei X
Gi = ponderea nregistrat de varianta i a variabilei X;
Xi = nivelul nregistrat de variabila X n varianta i.
45
unde:
A i B reprezint nivelurile sau frecvenele nregistrate pentru grupele
comparate.
2.3. Mrimile relative de dinamic
Mrimile relative de dinamic se folosesc pentru caracterizarea evoluiei
nregistrate sau dorite n timp a fenomenului studiat.
Mrimile relative de dinamic sunt expresii numerice ale comparaiilor
pentru dou momente sau perioade de timp diferite. Ele se mai numesc i
indici ai dinamicii.
Tabelul 2.2 Relaii de calcul folosite pentru calculul mrimilor relative
de dinamic
Mrimi relative de
Mrimi relative de
dinamic nregistrat dinamic planificat
Mrimi relative de
dinamic realizat
unde:
V1 reprezint o valoare (nivel sau frecven) nregistrat la momentul
sau pentru perioada curent;
V0 = o valoare (nivel sau frecven) nregistrat la momentul sau
pentru perioada care s-a ales ca baz de comparaie;
VPL = o valoare (nivel sau frecven) planificat pentru un moment sau
o perioad de timp din viitor.
46
47
48
DESCRIEREA STATISTIC
A TENDINEI CENTRALE:
STATISTICILE MEDII
3.
OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile medii disponibile pentru descrierea
statistic a tendinei centrale, ajutndu-v:
s nelegei coninutul informaional al celor 4 statistici medii importante:
media aritmetic, media geometric, media ptratic i media armonic;
s contientizai limitele statisticilor medii n ce privete reprezentativitatea lor
pentru colectivitatea statistic studiat;
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor medii.
51
52
unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
S presupunem, de exemplu, c n urma unei cercetri statistice asupra
unui eantion de 20 familii, s-au centralizat datele din tabelul 3.1,
privitoare la variabila discret numr de copii / familie:
Tabelul 3.1
Numr de copii (X)
Total
Numr de familii
(Frecvene absolute, F)
20
0,20
0,30
0,40
0,05
0,05
Frecvene relative,
unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
54
2,5
14
0,28
35,0
0,70
(5-10]
7,5
0,18
67,5
1,35
(10-15]
12,5
0,06
37,5
0,75
(15-20]
17,5
13
0,26
227,5
4,55
(20-25]
22,5
0,12
135,0
2,70
(25-30]
27,5
0,06
82,5
1,65
(30-35]
32,5
0,04
65,0
1,30
50
1,00
650,0
13,00
Total
56
57
Definiia mediei aritmetice se regsete n relaia (a se vedea paragraful privind calculul mediei
aritmetice pentru un ir de valori):
58
Salariu
mediu net
(RON)
ianuarie
826
1,0000000
februarie
767
0,9285714
0,9285714
martie
828
1,0024213
1,0795306
aprilie
839
1,0157385
1,0132850
mai
833
1,0084746
0,9928486
iunie
835
1,0108959
1,0024010
iulie
842
1,0193705
1,0083832
august
841
1,0181598
0,9988124
septembrie
860
1,0411622
1,0225922
1,0411622
Produs
59
Dup cum se observ n tabelul 3.3, produsul indicilor cu baz n lan este
egal cu ultimul indice cu baz fix. Aceasta nseamn c dac toi indicii cu
baz n lan ar fi egali cu media lor geometric, indicele de dinamic
nregistrat pentru ntreaga perioad a celor 9 luni nu s-ar modifica (a se
vedea tabelul 3.4).
Calculul mediei geometrice pentru un ir de valori
Din definiia mediei geometrice rezult uor relaiile de calcul ale acesteia,
prin egalizarea produsului valorilor nregistrate cu produsul care ar rezulta
n urma nlocuirii tuturor cu valoarea mediei lor geometrice. Considernd,
astfel, o variabil X pentru care s-a nregistrat irul de valori X1, X2 XN,
media geometric (g) se poate determina pornind de la egalitatea:
Produs (X1, X2 XN) = Produs (g, g g)
Folosind simbolurile matematice obinuite:
Salariu mediu
Indici cu
net (RON)
baz n lan
ianuarie
februarie
martie
aprilie
mai
iunie
iulie
august
septembrie
Produs
Medie geometric
826
767
828
839
833
835
842
841
860
0,9285714
1,0795306
1,0132850
0,9928486
1,0024010
1,0083832
0,9988124
1,0225922
= 1,0411622
= 1,0050549
60
2001
2002
2003
2004
2005
Profit realizat
(mil. RON)
12
24
60
150
Indici de
dinamic cu
baz n lan
1,2
2,5
2,5
Anul
2,5
Total
0,2
0,4
0,4
62
63
Tabelul 3.7
Intervale de
variaie (ani)
CR
[0-5]
2,5
14
0,28
1,2925
(5-10]
7,5
0,18
1,4372
(10-15]
12,5
0,06
1,1636
(15-20]
17,5
13
0,26
2,1047
(20-25]
22,5
0,12
1,4530
(25-30]
27,5
0,06
1,2200
(30-35]
32,5
0,04
1,1494
50
1,00
Total
Produs
9,2691
n cazul repartiiilor statistice se va recurge, desigur, la ponderarea cu frecvenele absolute (F) sau
relative (R):
64
Tabelul 3.8.
Intervale de
variaie (ani)
lnC
[0-5]
2,5
14
0,28
0,9163
0,2566
(5-10]
7,5
0,18
2,0149
0,3627
(10-15]
12,5
0,06
2,5257
0,1515
(15-20]
17,5
13
0,26
2,8622
0,7442
(20-25]
22,5
0,12
3,1135
0,3736
(25-30]
27,5
0,06
3,3142
0,1989
(30-35]
32,5
0,04
3,4812
0,1392
50
1,00
Total
(lnC)R
2,2267
Pentru repartiiile statistice dup variabile continue definite pe intervale, relaia se va aplica asupra
centrelor intervalelor (C):
65
Y
11,2
12,3
13,4
12,6
11,8
274460,9
XY
257,6
418,2
281,4
340,2
424,8
4380995404483,25
X/Y
2,05
2,76
1,57
2,14
3,05
58,16
27,58
12,24
337,53
2,25
337,53
2,25
produs
Pentru ca proprietatea s fie aplicabil, se impune condiia ca cele 2 variabile s fie definite de acelai
numr de variante observate.
66
67
68
unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
Calculul mediei ptratice pentru repartiii statistice dup variabile
continue
Pentru distribuiile statistice continue, media ptratic se calculeaz cu
ajutorul relaiei:
unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
Estimarea mediei ptratice pentru repartiii statistice dup variabile
continue definite pe intervale
Pentru repartiiile statistice continue dup variabile definite pe intervale,
media ptratic se poate aproxima cu media ptratic a centrelor
intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:
69
70
Tabelul 3.10
Intervale de
variaie (ani)
C2
[0-5]
2,5
6,25 14
(5-10]
7,5
56,25
(10-15]
12,5
156,25
(15-20]
C2F
C2R
0,28
87,50
1,750
0,18
506,25
10,125
0,06
468,75
9,375
17,5
306,25 13
0,26
3981,25
79,625
(20-25]
22,5
506,25
0,12
3037,50
60,750
(25-30]
27,5
756,25
0,06
2268,75
45,375
(30-35]
32,5
1056,3
0,04
2112,50
42,250
50
1,00
12462,50
249,250
Total
n cazul repartiiilor statistice dup variabile continue definite pe intervale, sunt considerate cemtrele
intervalelor:
71
Ptratul mediei ptratice a abaterilor nregistrate fa de media aritmetic se numete dispersie sau
varian statistic (a se vedea capitolul 6, Descrierea statistic a variaiei).
72
D = X (X)
73
74
Vitez (km./h.)
40
5/40 = 0,125
20
3/20 = 0,150
2/4 = 0,500
Total
0,775
75
unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
Calculul mediei armonice pentru repartiii statistice dup variabile
continue
Pentru repartiii statistice dup variabile continue, media armonic se
calculeaz cu ajutorul relaiei:
unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
Estimarea mediei armonice pentru repartiii statistice dup variabile
continue definite pe intervale
Pentru repartiii statistice dup variabile continue definite pe intervale,
media armonic se poate aproxima cu media armonic a centrelor
intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:
76
1/C
(1/C)F
(1/C)R
[0-5]
2,5
0,4000
14
0,28
5,6000
0,1120
(5-10]
7,5
0,1333
0,18
1,2000
0,0240
(10-15]
12,5
0,0800
0,06
0,2400
0,0048
(15-20]
17,5
0,0571
13
0,26
0,7429
0,0149
(20-25]
22,5
0,0444
0,12
0,2667
0,0053
(25-30]
27,5
0,0364
0,06
0,1091
0,0022
(30-35]
32,5
0,0308
0,04
0,0615
0,0012
50
1,00
8,2202
0,1644
Total
Media armonic este cea mai mic dintre cele 4 medii statistice:
77
Tabelul 3.12
Intervale de
variaie (ani)
1/C
CF
(1/C)(CF)
[0-5]
2,5
0,4000
14
35
14
(5-10]
7,5
0,1333
67,5
(10-15]
12,5
0,0800
37,5
(15-20]
17,5
0,0571
13
227,5
13
(20-25]
22,5
0,0444
135
(25-30]
27,5
0,0364
82,5
(30-35]
32,5
0,0308
65
50
650
50
Total
Se poate constata c:
Y = X 1 = 1/X
43
25
0,0233
0,0400
64
0,0156
76
0,0132
29
0,0345
suma
media aritmetic
237
47,4
0,1265
0,025304
media armonic
39,51899
0,021097
0,021097
39,51899
0,025304
47,4
79
80
DESCRIEREA STATISTIC
A TENDINEI CENTRALE:
STATISTICILE DE
POZIIE
4.
OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile de poziie disponibile pentru descrierea
statistic a tendinelor, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
poziie;
s nelegei coninutul informaional al celor mai importante statistici de
poziie: mediana, cuartilele laterale i mediala;
s ptrundei semnificaia relaiei de ordine dintre media aritmetic, median i
modala central pentru aprecierea global a gradului de simetrie care descrie o
repartiie statistic;
s reinei utilitatea medianei i medialei n ce privete aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat.
4.1.
Cuantilele
Mediana
Mediana este cea mai central valoare, avnd n vedere poziia de mijloc
pe care o ocup atunci cnd irul de valori studiat este ordonat dup
criteriul mrimii. Se poate spune, astfel, c reprezentativitatea ei pentru o
repartiie statistic este dat de poziia central pe care o ocup.
Dependena poziiei centrale doar de numrul de valori statistice i nu de
diferenele dintre acestea, face ca reprezentativitatea medianei, spre
deosebire de cea a mediei aritmetice, s fie mult mai puin sensibil la
valorile aberante.
Faptul c mediana ocup poziia central ntr-o repartiie statistic este
echivalent cu faptul c ea este acea valoare pentru care numrul valorilor
inferioare ei este egal cu numrul valorilor superioare ei, din punctul de
vedere al mrimii lor.
83
unde:
RMe reprezint rangul valorii mediane;
N = volumul colectivitii statistice.
De exemplu, pentru irul de valori (2, 10, 15, 7, 23, 17, 9) mediana este
valoarea care cade la mijloc n urma ordonrii cresctoare a irului: (2, 7,
9, 10, 15, 17, 23), adic 10.
Folosind relaia de mai sus: Me = X(N+1)/2 = X(7+1)/2 = X4, adic cea de-a 4-a
valoare n ordine cresctoare (sau descresctoare), acesta fiind, conform
seriei ordonate, egal cu 10.
Dac numrul valorilor seriei este par, atunci mediana se va calcula ca
medie a celor 2 valori care cad la mijloc n urma ordonrii dup criteriul
mrimii:
85
Tabelul 4.1
Numr
Numr
de copii de familii
Frecvena
cumulat
cresctor
Frecvena
cumulat
descresctor
10
10
100
25
35
90
30
65
65
15
80
35
10
90
20
95
10
100
TOTAL
N = 100
Numr de muncitori
Frecvene cumulate
600 650
650 700
15
18
700 750
19
37
750 800
21 (= FMe)
58 (> 50,5 = R)
800 850
20
78
850 900
17
95
900 950
99
950 1000
100
Total
N = 100
86
Numr de muncitori
Frecvene cumulate
600 650
650 700
15
18
700 750
19
37 (= rl)
750 782,1429
13,5 (= R rl = r)
50,5 [= R = (N + 1)/2]
782,1429 800
7,5
58 (= rL)
800 850
20
78
850 900
17
95
900 950
99
950 1000
100
Total
N = 100
87
unde:
Me reprezint valoarea median a unei repartiii statistice pe intervale;
l = limita inferioar a intervalului median;
d = lungimea intervalului median (diferena dintre captul superior i
captul inferior al intervalului median)
r = rangul valorii mediane relativ la valorile nregistrate pe lungimea
intervalului median;
R = rangul valorii mediane pe lungimea total a repartiiei statistice;
rl = rangul captului inferior al intervalului median, echivalent cu frecvena
absolut cumulat pn la acesta;
rL = rangul captului superior al intervalului median;
rMe = diferena de rang ntre capetele intervalului median (rMe = rL rl),
echivalent cu frecvena absolut nregistrat pe acesta (FMe).
Acelai procedeu de interpolare poate fi aplicat i pentru determinarea
celorlalte cuantile pentru cazul variabilelor statistice continue definite pe
intervale.
Proprieti ale medianei
1. n cazul repartiiei unei variabile definite de o funcie continu, abscisa
valorii mediane mparte n 2 pri egale aria de sub graficul funciei care
definete variabila statistic (a se vedea figura 4.1).
Egalitatea ariilor suprafeelor S1 i S2 din figura 4.1 este echivalent cu
egalitatea:
unde:
Me reprezint mediana repartiiei statistice dup variabila X;
f(X) = funcia continu care definete variabila statistic X;
88
S1 = S2
S2
S1
Me
Figura 4.1
2. ntruct media aritmetic este afectat de valorile extreme pe care le
nregistreaz variabila statistic, rezult c pentru o repartiie statistic cu o
concentrare mai mare n jurul valorilor mai mici, mediana este mai mic
dect media aritmetic. Invers, pentru o repartiie statistic cu o
concentrare mai mare n jurul valorilor mai mari, mediana este mai mare
dect media aritmetic.
Primul caz este cel al repartiiei din tabelul 4.1, precum i al repartiiei din
figura 4.1. Pentru a ne edifica, s calculm media aritmetic a repartiiei
din tabelul 4.1. Calculele necesare sunt nlesnite prin construirea tabelului
4.4.
Tabelul 4.4
Numr de copii (X)
0
1
2
3
4
5
6
TOTAL
(XF)
0
25
60
45
40
25
30
225
2,25
89
Moda
Moda este varianta pe care o variabil statistic o nregistreaz cel mai des.
Moda se mai numete i valoare dominant sau n termeni probabilistici
valoarea cea mai probabil.
S presupunem, de exemplu, c managerul unui magazin de mbrcminte
a observat c cele 10 perechi de pantaloni vndute n ziua anterioar au
avut urmtoarele mrimi:
32, 34, 36, 33, 31, 34, 30, 34, 32, 38
Moda pentru acest ir de valori este egal cu 34, ntruct aceast valoare sa nregistrat cel mai des (din cele 10 perechi de pantaloni vndute, 3
perechi au avut aceast mrime, celelalte mrimi nregistrndu-se fie doar
de 2 ori, fie doar o singur dat). Media aritmetic a mrimilor vndute
este de 33,4, iar mediana este egal cu 33,5. Conform acestor dou
statistici, valoarea 33 ar fi cea mai reprezentativ pentru irul considerat.
Totui, luarea deciziei de aprovizionare viitoare n funcie de acest rezultat
ar putea fi o eroare. Pentru o asemenea decizie, este necesar cunoaterea
modei.
Determinarea modei pentru repartiii statistice dup variabile calitative
n cazul unei repartiii statistice dup o variabil calitativ, calculul mediei
aritmetice sau al medianei nu are sens. ntr-o asemenea situaie se poate
determina totui, ca i statistic a tendinei centrale, moda.
S considerm, de exemplu, datele din tabelul 4.5, referitoare la
repartizarea pe domenii a celor 250 de angajai cu studii superioare ai unei
firme.
Variabila domeniu cu variantele sale contabilitate, finane,
management, marketing i altele este o variabil atributiv calitativ.
Deoarece, pentru varianta contabilitate se nregistreaz cea mai mare
frecven (75, n cifre absolute; 30,00%, n cifre relative), rezult c moda
corespunde acestei variante.
90
Tabelul 4.5
Domeniul
Frecvene
relative
Contabilitate
Finane
Management
Marketing
Altele
75
50
62
38
25
30,00%
20,00%
24,80%
15,20%
10,00%
TOTAL
250
100,00%
80
70
60
50
40
30
20
10
0
X1
X2
...
Mo
...
Xk
Figura 4.2
Din diagram rezult c pentru grupul de familii analizat moda este Mo = 4
(copii), adic varianta pentru care s-au nregistrat 70 de observaii.
Dac exist dou sau mai multe variante ale variabilei considerate pentru
care se nregistreaz frecvena maxim, repartiia statistic este
91
80
70
60
50
40
30
20
10
0
Mo
X1
...
Mo
...
Xk
Figura 4.3
Se poate vorbi i despre mode secundare ale unei repartiii statistice.
Modele secundare sunt date de acele variante ale variabilei pentru care
frecvenele de apariie sunt foarte apropiate de frecvena modei principale.
De exemplu, n diagrama din figura 4.4, variantele X4 i X6 pot fi
considerate ca i mode secundare ale repartiiei statistice reprezentate.
80
70
60
50
40
30
20
10
0
X1
X2
X3
X4
X5 = Mo
X6
X7
X8
Figura 4.4
Determinarea modei pentru repartiii statistice dup variabile cantitative
92
unde:
Mo reprezint moda repartiiei statistice studiate;
l, L = limita inferioar i, respectiv, limita superioar a intervalului
modal.
b. dac se dorete o valoare mai tiinific a modei, n determinarea
acesteia se va ine cont i de frecvenele intervalelor vecine
intervalului modal, aplicndu-se relaia:
unde:
l reprezint limita inferioar a intervalului modal;
d = distana intervalului modal;
1 = diferena dintre frecvena intervalului modal i frecvena
intervalului imediat anterior lui;
2 = diferena dintre frecvena intervalului modal i frecvena
intervalului imediat urmtor lui.
c. aceeai valoare obinut pentru mod prin relaia anterioar se poate
obine i prin modalitatea grafic prezentat n figura 4.5, folosinduse pentru aceasta o hrtie milimetric:
93
Mo
Figura 4.5
Tabelul 4.6
Variabila X grupe de vrst pentru o
populaie supus studiului
Frecvene absolute, F
10 - 20
20 - 30
30 - 40
20
40 - 50
11
50 - 60
TOTAL
50
94
Frecvena absolut
numrul de
librrii (F)
Distana
intervalului
(d)
Frecvene
corectate
(F = F/d)
10 - 20
40
10
4,00
20 - 30
90
10
9,00
30 - 50
240
20
12,00
50 - 80
110
30
3,67
80 - 100
20
20
1,00
Total
500
Conform valorilor din tabel, intervalul modal este intervalul (30 50),
ntruct frecvena corectat a acestui interval este cea mai mare. Moda este,
prin urmare:
95
max F(X)
Mo
Me
Figura 4.6
2. Spre deosebire de media aritmetic, moda nu este afectat de valorile
aberante nregistrate de ctre variabila statistic;
96
3. n cazul repartiiilor bi- sau pluri-modale, cele dou sau mai multe mode
nu pot fi sintetizate pentru obinerea unei singure mode care s fie
repezentativ pentru ntreaga colectivitate statistic;
4. Cunoaterea modei se dovedete util n caracterizarea gradului de
asimetrie al unei repartiii statistice;
5. Moda este cea mai reprezentativ statistic de poziie pentru cunoaterea
comportamentului pe pia al unui produs.
Relaii ntre media aritmetic, median i mod
Dac variabila este una cantitativ continu i repartiia ei este una
simetric fa de media aritmetic, moda este egal cu mediana i cu media
aritmetic (a se vedea figura 4.7). Majoritatea repartiiilor statistice nu sunt
ns simetrice, ele fiind caracterizate de un anumit grad de asimetrie.
40
35
30
25
20
15
10
5
0
media
mediana
moda
Figura 4.7
Pentru repartiiile cu asimetrie la stnga sau cu coad la dreapta (a se
vedea figura 4.8, a), se verific relaia Mo < Me < . Pentru repartiiile cu
asimetrie la dreapta sau cu coad la stnga (a se vedea figura 4.8, b), se
verific relaia Mo > Me > .
n cazul unei repartiii unimodale cu o asimetrie moderat, se poate verifica
urmtoarea relaie aproximativ ntre cele trei statistici ale tendinei
centrale:
97
a. asimetrie
la stnga
b. asimetrie
la dreapta
Media
aritmetic,
Media
aritmetic,
Mediana, Me
Moda, Mo
Moda, Mo
Mediana, Me
Figura 4.8
4.4.
Mediala
unde:
R reprezint rangul medialei;
i = rangurile celor N valori, obinute n urma ordonrii acestora.
S considerm din nou, pentru exemplificare, irul de salarii (n RON):
(550, 920, 600, 800, 750, 2500, 740). Pentru a determina mediala acestui
ir de valori, este necesar mai nti ordonarea acestora dup criteriul
mrimii: (550, 600, 740, 750, 800, 920, 2500), urmat de nsumarea lor
treptat: (550, 1150, 1890, 2640, 3440, 4360, 6860).
Jumtate din suma total a valorilor nseamn 6860/2 = 3430. ntruct
aceast valoare este depit pentru prima dat de ctre suma cumulat
treptat a salariilor prin adugarea celei de-a 5-a valori (3440 > 3430),
rezult c mediala are rangul egal cu 5, valoarea sa fiind egal cu 800 (a se
vedea figura 4.9).
De obicei, aa cum s-a ntmplat i n exemplul considerat, mediala este
mai mare dect mediana unui ir de valori sau a unei repartiii statistice
(pentru exemplul nostru, Ml = 800 > Me = 750).
98
8000
6860
Valori cumulate
6000
4360
4000
3430
3440
2640
2000
1890
1150
550
0
0
5
Ml
Figura 4.9
Determinarea medialei pentru date grupate
Dac datele sunt grupate, determinarea medialei este, ca i n cazul
medianei, puin mai complex.
Pornind de la definiia medialei (valoarea care mparte n dou pri egale
suma irului ordonat al valorilor nregistrate), rezult c n cazul
repartiiilor statistice mediala este acea valoare pentru care suma valorilor
cumulat cresctor este egal cu suma valorilor cumulat descresctor.
Pentru exemplificarea acestui fapt, vom considera din nou cele dou
situaii posibile: cea a variabilelor statistice discrete i cea a variabilelor
statistice continue, definite pe intervale.
99
Numr total de
copii, cumulat
[(XF)]
10
25
25
25
30
60
85
15
45
10
40
170
25
195
30
225
TOTAL
N = 100
225
Numr de
muncitori
(F)
Sume
salarii pe
grupe
(CF)
Suma
salariilor,
cumulat
[(CF)]
600 650
625
1875
1875
650 700
675
15
10125
12000
700 750
725
19
13775
25775
750 800
775
21
16275
42050 >
78100/2
800 850
825
20
16500
58550
850 900
875
17
14875
73425
900 950
925
3700
77125
950 1000
975
975
78100
N = 100
78100
Total
unde:
Ml reprezint valoarea medial a unei repartiii statistice pe intervale;
l = limita inferioar a intervalului medial;
101
Suma
salariilor,
cumulat
[(CF)]
600 650
1875
1875
650 700
10125
12000
700 750
13775
25775
750 790,7834
790,7834 800
3000
42050
800 850
16500
58550
850 900
14875
73425
900 950
3700
77125
950 1000
975
78100 (= S)
Total
78100
loc doar n cazul unei echirepartiii) cu suma valorilor mai mari dect
mediana.
2. Cunoaterea mrimii medialei n raport cu mrimea medianei este util
n aprecierea gradului de concentrare statistic. Astfel, cu ct mediala este
mai deplasat fa de median, cu att gradul de concentrare statistic este
mai mare.
103
104
DESCRIEREA STATISTIC
A VARIAIEI INTERNE CONCENTRAREA I
DIVERSIFICAREA
STATISTIC
5.
OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate statisticile disponibile pentru descrierea variaiei
interne, ajutndu-v:
s nelegei utilitatea cunoaterii gradului de concentrare / diversificare
statistic;
s reinei cele trei statistici abaterea medial-median; coeficientul de
concentrare i indicele de concentrare Gini disponibile pentru descrierea
variaie interne n cazul variabilelor statistice cantitative cu valori pozitive;
s reinei cele cinci statistici raportul de concentrare; energia informaional
Onicescu; diferena Hirschman; coeficientul de concentrare Gini i coeficientul
de concentrare Strck disponibile pentru descrierea variaiei interne n cazul
variabilelor statistice calitative.
Abaterea medial-median
n capitolul dedicat statisticilor de poziie, am artat c mediala unei
repartiii statistice este ntotdeauna egal sau mai mare dect mediana
acesteia:
unde:
MM reprezint abaterea medial-median care caracterizeaz repartiia
statistic studiat;
Ml = mediala repartiiei statistice studiate;
Me = mediana repartiiei statistice studiate.
O valoare mai mare a abaterii medial-median nseamn o concentrare
statistic mai puternic. Dac abaterea medial-median este nul (mediala
este egal cu mediana), nseamn c repartiia statistic este una egalitar
(echirepartiie). Pentru exemplificare, s considerm repartiia statistic a
notelor obinute la un examen de o grup de 15 studeni, conform tabelului
5.1.
Pentru aceast repartiie, rangul medianei este egal cu (15 + 1) / 2 = 8, ceea
ce nseamn c mediana ia valoarea 7 (pentru aceast valoare, frecvena
absolut cumulat depete pentru prima dat rangul medianei; 9 > 8).
Pentru a calcula mediala, este necesar, mai nti, cumularea produselor
dintre notele obinute i frecvenele absolute nregistrate, conform tabelului
5.2.
108
Numr studeni
4
5
6
7
9
10
Total
1
2
1
5
3
3
15
1
3
4
9 > 8 = (15 + 1)/2
12
15
Tabelul 5.2
Nota obinut
(Xk)
Frecvene absolute
(Fk)
(XkFk)
(XkFk), cumulat
10
14
20
35
55
27
82 > 56 = 112/2
10
30
112
Total
15
unde:
CC reprezint coeficientul de concentrare statistic;
A = amplitudinea statistic;
XMAX = valoarea maxim a repartiiei statistice;
XMIN = valoarea minim a repartiiei statistice.
ntruct abaterea medial-median a unei repartiii statistice ia valori
cuprinse ntre zero i valoarea amplitudinii statistice a acesteia, coeficientul
de concentrare statistice poate nregistra doar valori cuprinse pe intervalul
[0, 1]. Apropierea de 0 indic o slab concentrare statistic, iar apropierea
de 1 arat o concentrare statistic puternic. Pentru o repartiie statistic
egalitar (echirepartiie), coeficientul de concentrare ia valoarea 0. Dac ia
valoarea 1, coeficientul de concentrare pune n eviden concentrarea
majoritii unitilor statistice n jurul unei anumite valori.
Pentru repartiia statistic din tabelul 5.1, coeficientul de concentrare este:
Xi
Fi
(Fi),
cumula
t = Ni
0,0667
0,0357
0,2000
10
14
0,1250
0,2667
20
0,1786
0,6000
35
55
0,4911
12
0,8000
27
82
0,7321
10
15
1,0000
30
112
1,0000
XiFi
Total 15
cumula
t = Vi
112
113
unde:
Ri sunt valorile nregistrate de variabila frecvenei statistice relative.
114
Tabelul 5.4
Ni XiFi
Vi
Qi
Qi 1 + Qi
(Qi 1 + Qi) Ri
0,04
0,04
0,0024
10
14
0,13
0,16
0,0214
0,07
20
0,18
0,30
0,0202
0,33
35
55
0,49
0,67
0,2232
0,20
12
27
82
0,73
1,22
0,2446
10
0,20
15
30 112
1,00
1,73
0,3464
15
1,00
Xi
Fi
Ri
0,07
0,13
112
0,8583
115
Se poate observa c suma ariilor trapezelor QiQi 1Di 1Di este egal cu 1/2,
ntruct aceste trapeze compun mpreun triunghiul de deasupra diagonalei
ptratului Gini. Prin urmare, indicele Gini este:
116
Tabelul 5.5
Xi
Fi Ni
Pi Pi+Pi-1 XiFi
Vi
Qi Qi-Qi-1
(Qi-Qi-1)
(Pi+Pi-1)
1 0,0667 0,0667
4 0,0357 0,0357
0,0024
3 0,2000 0,2667
10
14 0,1250 0,0893
0,0238
4 0,2667 0,4667
20 0,1786 0,0536
0,0250
9 0,6000 0,8667
35
55 0,4911 0,3125
0,2708
3 12 0,8000 1,4000
27
82 0,7321 0,2411
0,3375
10
3 15 1,0000 1,8000
0,4821
15
1,0000
112
1,1417
unde:
reprezint diferena medie Gini;
= media aritmetic.
Trebuie subliniat c, sub aceast form, indicele Gini se apropie, ca
semnificaie i interpretare, de coeficientul de variaie (v) expresia
relativ a varianei sau dispersiei statistice. Diferena dintre cele dou
statistici const n faptul c una evideniaz variaia sintetic dintre toate
perechile de valori nregistrate, fiind, astfel, o expresie sintetic a variaiei
statistice interne, n timp ce cealalt este o msur sintetic a variaiei
tuturor valorilor nregistrate fa de tendina central.
Reamintim c:
117
unde:
i i j iau valori de la 1 la N.
S determinm indicele de concentrare Gini pentru datele din tabelul 5.1
Pentru aceasta am construit tabelul 5.6, n care sunt calculate toate
diferenele posibile dintre cele 225 de perechi [(Xi, Xj), i, j = 115] care
se pot forma cu cele 15 valori (152 = 225).
Dintre cele 225 diferene, o parte sunt nule. n tabelul 5.6 acestea sunt
evideniate prin ncadrarea zonelor n care apar. Dup cum se poate
observa, numrul diferenelor nule este n strns legtur cu frecvenele de
apariie a variantelor pe care le nregistreaz variabila statistic. Mai exact,
la fiecare variant nregistrat de variabila statistic studiat corespunde un
numr de diferene nule egal cu ptratul frecvenei absolute de apariie a
acelei variante.
Prin urmare, numrul total de diferene nule este egal cu suma ptratelor
frecvenelor absolute de apariie ale variantelor statistice nregistrate de
variabila statistic studiat:
unde:
D0 reprezint numrul total de diferene nule;
Fi = frecvenele absolute nregistrate de variantele (i) corespunztoare
variabilei statistice studiate.
Pentru exemplul nostru, conform coloanei frecvenelor absolute din tabelul
5.2:
F
1
F2
F3
F4
F5
F6
F7
F2
F3
F4
F5
F6
F7
9 10 10 10 Total
52
39
39
30
23
23
23
23
23
29
29
29
10
38
10
38
10
38
xj
F1
F1
Total
476
Acest fapt constituie i motivul pentru care media aritmetic de la numitorul fraciei din relaia de
determinare a coeficientului de concentrare Gini se multiplic cu 2.
119
unde:
Ni reprezint frecvena absolut cumulat pn la varianta i, inclusiv.
Prin urmare, putem considera urmtoarea relaie general:
unde:
N este numrul valorilor statistice considerate;
i = varianta i a variabilei statistice considerate;
k = numrul de variante pe care le nregistreaz variabila statistic
considerat;
Ni = frecvene absolute cumulate;
d = distana (constant) dintre variantele variabilei statistice considerate.
Aadar, diferena medie Gini se poate calcula cu ajutorul relaiei:
120
Tabelul 5.7
Nota
Frecven
obinut (Xi) absolut (Fi)
14
14
12
36
11
44
54
12
36
10
15
Total
15
238
121
(XiFi)
10
35
27
10
30
Total
15
112
Media aritmetic
5.2.
Raportul de concentrare
Folosit deseori n cercetrile de marketing, raportul de concentrare (Ca)
exprim ponderea deinut de primele a (un numr stabilit ca relevant)
cele mai frecvente variante nregistrate de variabila calitativ dup care
este studiat colectivitatea statistic:
unde:
Ca reprezint raportul de concentrare pentru primele a variante;
a = un numr stabilit ca relevant n funcie de scopul cercetrii statistice i
de caracteristicile colectivitii statistice studiate;
Ri = frecvena relativ a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
Ni = frecvena absolut a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
k = numrul de variante ale variabilei dup care este studiat colectivitatea
statistic;
N = volumul colectivitii statistice studiate.
De exemplu, raportul de concentrare C3 (a = 3) pentru repartiia statistic
din tabelul 5.1 este, conform rezultatelor din tabelul 5.4 (n care sunt
calculate i frecvenele relative ale variantelor statistice):
unde:
Es reprezint energia informaional Onicescu;
Ri = frecvena statistic relativ nregistrat pentru varianta i (Ri = 1);
s = numrul de variante i, n consecin, de stri ale sistemului.
De exemplu, pentru repartiia statistic din tabelul 5.1 energia
informaional Onicescu este egal, conform rezultatelor din tabelul 5.9, cu
0,2178.
Tabelul 5.9
Xi
Fi
Ri
0,0667
0,0044
0,1333
0,0178
0,0667
0,0044
0,3333
0,1111
0,2000
0,0400
10
0,2000
0,0400
15
1,0000
0,2178
1
2
3
4
5
6
7
8
9
10
Total
0
0
0
1
2
1
5
0
3
3
15
126
unde:
CG reprezint coeficientul de concentrare Gini;
Ri = frecvena statistic relativ nregistrat (ponderea) pentru varianta i
(Ri = 1);
k = numrul de variante pe care le poate nregistra variabila statistic.
ntruct Ri = 1, valoarea maxim a coeficientului de concentrare Gini este
1. Valoarea minim a coeficientului de concentrare Gini se obine, ca i n
cazul energiei informaionale Onicescu, n cazul unei echirepartiii, adic
atunci cnd toate frecvenele relative nregistrate de cele n variante
statistice sunt egale ntre ele i egale, n consecin, cu 1/n. Aceasta
nseamn c valoarea minim a coeficientului de concentrare Gini, obinut
n cazul unei echirepartiii, este:
127
128
unde:
Da reprezint raportul de diversificare pentru primele a variante;
Ca = raportul de concentrare pentru primele a variante;
a = un numr stabilit ca relevant n funcie de scopul cercetrii statistice i
de caracteristicile colectivitii statistice studiate;
Ri = frecvena relativ a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
Ni = frecvena absolut a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
k = numrul de variante ale variabilei dup care este studiat colectivitatea
statistic;
N = volumul colectivitii statistice studiate.
Astfel, pentru repartiia statistic din tabelul 5.1 raportul de diversificare
D3 (a = 3) este, conform rezultatelor din tabelul 5.4 (n care sunt calculate
i frecvenele relative ale variantelor statistice):
unde:
D reprezint indicele de diversificare;
H = indicele de concentrare Hirschman-Herfindahl;
Es = energia informaional Onicescu;
Ri = frecvena statistic relativ nregistrat pentru varianta i (Ri = 1);
s = numrul de variante ale variabilei statistice sau de stri ale sistemului
Onicescu.
Trebuie spus ns c n literatura de specialitate valoarea Agresti este
definit ntr-o manier probabilistic. Astfel, valoarea Agresti este dat de
suma probabilitilor ca dou uniti statistice dintr-o colectivitate statistic
s aparin la variante diferite ale variabilei statistice considerate:
unde:
VA reprezint valoarea Agresti;
pi = probabilitatea de nregistrare a variantei i a variabilei statistice
considerate;
qi = probabilitatea de nregistrare a unei variante diferite de varianta i a
variabilei statistice considerate;
s = numrul de variante ale variabilei statistice sau de stri ale sistemului
Onicescu.
Pornind de la considerentul c probabilitatea de nregistrare a variantei i a
variabilei statistice considerate poate fi estimat pe baza frecvenei relative
(Ri) de apariie a acesteia, rezult c valoarea Agresti se poate determina ca
valoare complementar a energiei informaionale Onicescu sau a indicelui
de concentrare Hirschman-Herfindahl:
130
131
132
DESCRIEREA STATISTIC
A VARIAIEI FA DE
TENDINA CENTRAL
6.
OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
variaiei, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
variaie;
s nelegei coninutul informaional al celor mai importante statistici de
variaie: abaterea medie liniar, variana, abaterea standard i coeficientul de
variaie;
s reinei utilitatea coeficientului de variaie n ce privete aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat;
s nelegei coninutul informaional al covarianei ca statistic de variaie
simultan (co-variaie) a dou variabile statistice.
Total
Reeaua de
magazine A
15
12
12
59
Reeaua de
magazine B
15
13
14
59
La nivelul celor dou reele de magazine se obin pentru cele trei statistici
ale tendinei centrale urmtoarele valori:
Figura 6.1
Statisticile de variaie rspund unor probleme ca:
verificarea reprezentativitii mediei ca valoare tipic a unei repartiii
statistice;
verificarea gradului de omogenitate al unei repartiii statistice;
verificarea sistematizrii corespunztoare a informaiilor prin gruparea
statistic utilizat;
caracterizarea gradului i a formei de variaie pentru o repartiie
statistic;
cunoaterea gradului de influen a factorilor/cauzelor dup care s-a
fcut gruparea unitilor statistice, fiind astfel posibil evidenierea
aciunii cauzelor eseniale, precum i separarea acesteia de aciunea
cauzelor ntmpltoare;
caracterizarea gradului i a formei de variaie n cadrul fiecrei grupe de
uniti statistice i calculul statisticilor de variaie dintre grupe.
136
Amplitudinea
m in
m in
m ax
m ax
iru l B
m in
m ax
iru l C
Abaterile individuale
respectiv,
138
respectiv,
respectiv,
coeficientul de variaie.
6.3.
unde:
(|D|) reprezint abaterea medie liniar;
D = abateri individuale fa de media aritmetic;
F = frecvenele absolute care caracterizeaz repartiia statistic studiat;
R = frecvenele relative care caracterizeaz repartiia statistic studiat.
Este posibil ca n anumite situaii s prezinte interes calculul abaterii medii
liniare fa de median.
Pentru repartiiile statistice dup variabile continue definite pe intervale, n
determinarea abaterii medii liniare se iau n considerare, conveional, ca
valori reprezentative ale intervalelor, centrele acestora (C):
6.4.
Calculul varianei
Variana este o statistic sintetic de variaie a crei utilitate se extinde n
domeniul statisticii infereniale. Variana sau dispersia este media
aritmetic a ptratelor abaterilor individuale absolute fa de media
aritmetic. Ea se noteaz cu 2, iar relaiile ei de calcul sunt prezentate n
140
tabelul 6.2:
Tabelul 6.2
pentru iruri de valori
unde:
D reprezint abaterile individuale fa de media aritmetic;
N = numrul de valori ale unei variabile simple, negrupate;
F = frecvenele absolute ale variantelor unei variabile grupate;
R = frecvenele relative ale variantelor unei variabile grupate.
Proprieti ale varianei
Cele mai importante proprieti ale varianei sunt:
pentru un ir de valori egale, variana este nul;
pentru orice variabil X, variana este egal cu diferena dintre media
aritmetic a ptratelor valorilor nregistrate de variabila X i ptratul
mediei aritmetice a variabilei X (media ptratelor minus ptratul
mediei...):
141
X1 = X c
X2 = X + c
X1 = X c
Figura 6.3
Pentru exemplificare, s considerm dou colectiviti statistice mici,
studiate dup o variabil pentru care s-au nregistrat urmtoarele valori
individuale:
A: 7, 8, 9, 10, 11, 12, 13
B: 1, 4, 7, 10, 13, 16, 19
Media aritmetic la nivelul ambelor colectiviti este 10.
Valorile individuale ale celor dou populaii sunt reprezentate pe axe
orizontale, n figura 6.4. Aa cum se observ n aceast figur, valorile
nregistrate la nivelul colectivitii B sunt mult mai dispersate fa de
media lor aritmetic dect valorile nregistrate la nivelul colectivitii A.
O prim msur a variaiei fa de medie o obinem determinnd
143
colectivitatea A
colectivitatea B
Figura 6.4
Deoarece abaterile individuale nregistrate la nivelul colectivitii B
sunt de 3 ori mai mari dect abaterile individuale nregistrate la nivelul
colectivitii A, variana nregistrat la nivelul colectivitii B este de 32
= 9 ori mai mare dect variana nregistrat la nivelul colectivitii A:
144
10
11
Frecvene
pariale
12
Frecvene
pariale
10
34
146
unde:
VAR(Y) reprezint variana nregistrat la nivelul variabilei Y;
(Y/X) = mediile aritmetice pariale nregistrate la nivelul variabilei Y
condiionat de variantele nregistrate de variabila X;
VAR(Y/X) = varianele pariale nregistrate la nivelul variabilei Y
condiionat de variantele nregistrate de variabila X.
Pentru verificarea regulii de adunare a varianelor este util dezvoltarea
tabelului 6.3 prin adugarea unor coloane pentru calculele intermediare
necesare. Se obine, astfel, tabelul 6.4:
Tabelul 6.4
Y
Total,
[F(Y/X)]
[YF(Y/X)]
Medii pariale,
9 10 11
67
8,3750
12
112
9,3333
89
9,8889
(Y/X)
(Y) = 305/34
Total
4 8 10 9 3
34
305
= 8,9706
147
148
Tabelul 6.5
Y2
X
[Y2F(Y2/X)]
(Y2/X)
567
70,8750
12
1054
87,8333
885
98,3333
4 8 10 9
34
2781
Total
Tabelul 6.6
X
7,4000
54,7600 55,0000
8,3750
70,1406 70,8750
0,7344
12
9,3333
87,1111 87,8333
0,7222
9,8889
97,7901 98,3333
0,5432
Total
34
Note
(|D|)
D2
-1
+1
4/7 = 0,57
+1
-1
-2
+2
6/7 = 0,86
-1
+1
150
4/7 = 0,57
0,755
10/7 = 1,43
1,196
unde:
V(X) repezint coeficientul de variaie la nivelul repartiiei statistice dup
variabila X;
(X) = abaterea standard la nivelul repartiiei statistice dup variabila X;
151
Tabelul 6.8
Luna
Total
Produsul A - tone
13
10
41
17
10
47
152
Tabelul 6.9
Produsul
6.7.
(|D|)
|D|
D2
4,2
17,64
0,2
0,04
11
31/5 = 6,2
4,8
13,2/5 = 2,64
23,04
1,8
3,24
2,2
4,84
31
13,2
48,8
2,4
5,76
1,4
1,96
17
47/5 = 9,4
7,6
16,4/5 = 3,28
57,76
10
0,6
0,36
4,4
19,36
47
16,4
85,2
48,8/5 = 9,76
= 3,12
85,2/5 = 17,04
= 4,13
unde;
X reprezint variabila statistic;
N = volumul colectivitii statistice;
F = frecvenele absolute nregistrate de ctre variantele variabilei statistice.
Momentele de ordinul p, cu parametrul a = 0 se numesc momente
necentrate, iar momentele de ordinul p, cu parametrul a = (X) se numesc
momente centrate.
Se observ c momentul necentrat de ordinul 1 este chiar media aritmetic,
iar momentul centrat de ordinul 2 este chiar variana.
6.9.
Covariana
154
155
157
158
DESCRIEREA STATISTIC
A FORMEI
REPARTIIILOR
STATISTICE UNIMODALE:
OBLICITATEA I
KURTOSISUL
7.
OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
formei repartiiilor statistice unimodale, ajutndu-v:
s nelegei semnificaia noiunilor folosite n legtur cu descrierea statistic
a formei repartiiilor statistice unimodale: oblicitatea i kurtosis-ul;
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor
disponibile pentru descrierea formei repartiiilor statistice unimodale;
s reinei utilitatea noiunii de simetrie/asimetrie pentru aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat.
160
Statisticile de oblicitate
Variabila X
Me = = Mo
se constat n dreapta (figura 7.2, a) sau n stnga modei (figura 7.2, b).
a. oblicitate sau asimetrie
pozitiv
moda
mediana
media
aritmetic
media
aritmetic
moda
mediana
unde:
OYK reprezint coeficientul de oblicitate al lui Yule i Kendall;
Q1 i Q3 = cuartilele laterale (prima i, respectiv, a treia cuartil) ale
repartiiei pentru care se determin gradul de oblicitate;
Me = cuartila median a repartiiei pentru care se determin gradul de
oblicitate;
162
Q1
Me
Q3
Me
Q3
X
Q1
Me
Q3
164
Tabelul 7.1
Grupe de salarii
(RON)
600 650
650 700
15
18
700 750
19
37 (> 25 = RQ1)
750 800
21
58
800 850
20
78 (> 75 = RQ3)
850 900
17
95
900 950
99
950 1000
100
Total
N = 100
165
unde:
OP1 reprezint primul coeficient de oblicitate al lui Pearson;
= media aritmetic a repartiiei statistice studiate;
Mo = moda repartiiei statistice studiate;
= abaterea standard a repartiiei statistice studiate.
n cazul repartiiilor statistice simetrice, acest coeficient de oblicitate este
egal cu zero, deoarece pentru aceste repartiii are loc egalitatea dintre
media aritmetic i mod (a se revedea figura 7.1). Aadar, cu ct primul
coeficient de oblicitate al lui Pearson este mai apropiat de 0, cu att
repartiia statistic studiat este mai simetric.
Pentru repartiiile statistice cu oblicitate pozitiv > Mo (a se revedea
figura 7.2, a). Prin urmare, pentru asemenea repartiii ( Mo) > 0. Cum
abaterea standard este ntodeauna nenul, rezult c o valoare pozitiv a
celui dinti coeficient de oblicitate propus de Pearson indic existena
unei obliciti pozitive pentru repartiia statistic studiat.
Pentru repartiiile statistice cu oblicitate negativ < Mo (a se revedea
166
figura 7.2, b). Prin urmare, pentru asemenea repartiii ( Mo) < 0.
Rezult c o valoare negativ a celui dinti coeficient de oblicitate propus
de Pearson indic existena unei obliciti negative pentru repartiia
statistic studiat.
Cu ct oblicitatea unei repartiii statistice este mai pronunat, cu att
distana dintre media aritmetic i mod se apropie mai mult de valoarea
abaterii standard [( Mo) ]. Prin urmare, o valoare apropiat de 1
a celui dinti coeficient de oblicitate propus de Pearson indic existena
unei obliciti mai pronunate pentru repartiia statistic studiat.
Pornind de la constatarea c pentru repartiiile statistice moderat oblice
distana dintre media aritmetic i mod este de aproximativ trei ori mai
mare dect distana dintre media aritmetic i median [( Mo) 3(
Me), a se revedea figura 7.2, a i b], Karl Pearson a propus, pentru
asemenea repartiii statistice, i un al doilea coeficient de oblicitate:
unde:
OP2 reprezint cel de-al doilea coeficient de oblicitate al lui Pearson;
= media aritmetic a repartiiei statistice studiate;
Me = mediana repartiiei statistice studiate;
= abaterea standard a repartiiei statistice studiate.
Interpretarea celui de-al doilea coeficient de oblicitate al lui Pearson este
similar interpretrii celui dinti coeficient de oblicitate al lui Pearson, cu
meniunea c aplicabilitatea sa este restrns la cazul repartiiilor
statistice moderat oblice.
Coeficientul de oblicitate 1 al lui Pearson
Un alt coeficient de oblicitate propus de Karl Pearson este coeficientul 1,
determinat ca raport ntre ptratul momentului centrat de ordinul 3 i
cubul momentului centrat de ordinul 2:
167
unde:
1 reprezint coeficientul 1 de oblicitate al lui Pearson;
2 = momentul centrat de ordinul 2 al repartiiei statistice studiate;
3 = momentul centrat de ordinul 3 al repartiiei statistice studiate;
D = abaterile individuale nregistrate fa de media aritmetic;
= abaterea standard a repartiiei statistice studiate;
2 = variana repartiiei statistice studiate;
N = volumul colectivitii a crei repartiie statistic este studiat.
Coeficientul de oblicitate 1 al lui Fisher
Statisticianul britanic Ronald Fisher a propus ca i coeficient de oblicitate
aa-numitul coeficient 1, determinat ca rdcin a coeficientului 1 de
oblicitate al lui Pearson:
X D (= X )
D2
D3
-5,2
27,04
-140,608
-3,2
10,24
-32,768
12
3,8
14,44
54,872
-0,2
0,04
-0,008
-4,2
17,64
-74,088
11
2,8
7,84
21,952
14
5,8
33,64
195,112
-7,2
51,84
-373,248
15
6,8
46,24
314,432
10
0,8
0,64
0,512
11
10
1,8
3,24
5,832
12
-3,2
10,24
-32,768
13
-1,2
1,44
-1,728
14
13
4,8
23,04
110,592
15
-2,2
4,84
-10,648
123
252,4
37,44
/N 8,2 (= )
16,8267 (= 2)
2,496 (= 3)
169
Figura 7.6
7.2.
Statisticile de kurtosis
Etimologic, leptocurtic nseamn cu umfltur sau cocoa subire (leptos = gr. subire).
170
vrf
ascuit
vrf
rotunjit
coad
plat
a. kurtosis pozitiv
umr
larg
b. kurtosis negativ
Etimologic, platicurtic nseamn cu umfltur sau cocoa lat (platus = gr. lat).
171
unde:
2 reprezint coeficientul 2 de kurtosis al lui Pearson;
2 = momentul centrat de ordinul 2 al repartiiei statistice studiate;
4 = momentul centrat de ordinul 4 al repartiiei statistice studiate;
D = abaterile individuale nregistrate fa de media aritmetic;
N = volumul colectivitii a crei repartiie statistic este studiat;
= abaterea standard a repartiiei statistice studiate.
Interpretarea kurtosis-ului unei repartiii statistice cu ajutorul acestui
coeficient este urmtoarea:
o valoare cuprins ntre 1 i 3 este caracteristic unei repartiii
platicurtice;
o valoare apropiat de 3 este caracteristic unei repartiii normale;
o valoare mai mare dect 3 este caracteristic unei repartiii
leptocurtice.
Coeficientul de kurtosis 2 al lui Fisher (coeficientul de exces de
kurtosis)
Cu ajutorul coeficientului de kurtosis 2 al lui Fisher se determin excesul
de kurtosis al repartiiei statistice studiate fa de kurtosis-ul repartiiilor
statistice normale:
172
D2
D4
27,04
10,24
14,44
0,04
17,64
7,84
33,64
51,84
46,24
0,64
3,24
10,24
1,44
23,04
4,84
252,4
731,1616
104,8576
208,5136
0,0016
311,1696
61,4656
1131,6496
2687,3856
2138,1376
0,4096
10,4976
104,8576
2,0736
530,8416
23,4256
8046,448
16,8267 (= 2)
536,4299 (= 4)
X D (= X )
3
-5,2
5
-3,2
3,8
12
-0,2
8
-4,2
4
2,8
11
5,8
14
-7,2
1
15
6,8
0,8
9
1,8
10
5
-3,2
-1,2
7
4,8
13
-2,2
6
123
/N 8,2 (= )
173
174
DESCRIEREA STATISTIC
A LEGTURILOR DINTRE
FENOMENE
8.
OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
corelaiei dintre dou sau mai multe variabile, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
corelaie i regresie;
s nelegei coninutul informaional al celor mai importante statistici de
corelaie i regresie: coeficientul de corelaie liniar Pearson, coeficienii de
regresie liniar i raportul de determinaie;
s stpnii metoda celor mai mici ptrate de eroare ca metod de regresie
statistic.
8.1.
178
0,1
0,4
0,3
0,8
0,2
0,5
0,7
0,1
0,9
0,13
0,6
0,9
0,5
0,7
179
Tabelul 8.2.
X
aX+b
a'Y+b'
0,1
0,4
5,23
6,20
0,3
0,8
5,69
9,00
0,2
0,5
5,46
6,90
0,7
0,1
6,61
4,10
0,9
0,13
7,07
4,31
0,6
0,9
6,38
9,70
0,5
0,7
6,15
8,30
Figura 8.1
Aa cum se observ i n figura 8.1, pentru cele dou perechi de
variabile corelaia este identic, ceea ce difer fiind doar scara de
mrime. Este, prin urmare, firesc s se menin identitatea i n ce
privete coeficientul de corelaie liniar Pearson:
180
respectiv,
8.3.
182
i
183
Prin urmare,
185
186
unde:
OAB reprezint triunghiul dreptunghic format la creterea cu o
unitate a variabilei explicative X (figura 8.2):
187
188
Conform:
http://www.ubs.com/1/ShowMedia/ubs_ch/wealth_mgmt_ch/research?contentId=103982&name=eng.pd
f
190
Tabelul 8.3
Nr.
crt.
Oraul
Numr ore
de munc
pe an (X)
Numr de zile de
concediu remunerate
pe an (Y)
Amsterdam
1687
25
Atena
1714
24
Berlin
1611
29
Bratislava
1760
20
Bruxelles
1672
21
Budapesta
1834
26
Copenhaga
1644
22
Dublin
1727
21
Helsinki
1603
29
10
Lisabona
1708
22
11
Ljubljana
1756
21
12
Londra
1782
20
13
Luxemburg
1725
25
14
Madrid
1724
22
15
Nicosia
1753
22
16
Paris
1481
27
17
Praga
1771
20
18
Riga
1737
20
19
Roma
1747
21
20
Stockholm
1726
25
21
Tallinn
1746
20
22
Varovia
1772
24
23
Viena
1649
25
24
Vilnius
1744
21
191
Figura 8.3
Figura 8.4
Trebuie observat faptul c figurile 8.3 i 8.4 nu sunt identice, diferena
esenial dintre ele fiind cea n legtur cu scara de reprezentare a
variabilei abscisei (X).
Figura 8.5
Pentru a sesiza corect modificarea coeficientului de regresie, deci a
pantei liniei ecuaiei de regresie n urma nmulirii tuturor valorilor
variabilei X cu o constant (n exemplul nostru, n valoare de = 0,5),
este necesar reprezentarea noului nor de puncte la aceeai scar, ca n
192
figura 8.5. Dup cum se poate observa n aceast figur, panta noii linii
de regresie se obine prin nmulirea pantei vechii linii de regresie cu
inversa acelei constante (n exemplul nostru, egal cu 1/= 2).
Revenind la figura 8.4, se poate observa c aici scara de reprezentare a
variabilei abscisei a fost, n fapt, modificat fa de cea din figura 8.3
tot prin nmulirea cu inversa constantei n discuie;
multiplicarea variabilei explicate cu o constant determin multiplicarea
cu aceeai constant a coeficientului de regresie liniar:
193
194
DESCRIEREA STATISTIC
A VARIAIEI N TIMP
9.
OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate statisticile disponibile pentru descrierea statistic
a variaiei n timp, ajutndu-v:
s nelegei utilitatea cunoaterii variaiei n timp la nivelul fenomenelor
studiate statistic;
s stpnii metodele disponibile pentru descrierea statistic a variaiei n timp
n forma nivelurilor, volumelor i sporurilor absolute sau relative;
s nelegei cum se construiesc indicii agregai ponderali i s cunoatei
cteva aplicaii mai importante ale acestora.
unde:
Vi reprezint volumul absolut al primelor i momente sau perioade de
timp;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i.
197
unde:
i/0 reprezint sporul absolut cu baz fix al momentului sau perioadei
de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
X0 = nivelul absolut al variabilei X, nregistrat pentru primul momentul
sau pentru prima perioad de timp (0) care definete variabila
statistic studiat;
sporuri cu baz mobil (diferenele sunt de fiecare dat fa de nivelul
absolut nregistrat anterior):
unde:
i/i-1 reprezint sporul absolut cu baz mobil al momentului sau
perioadei de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
Xi-1 = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i-1.
Relaii existente ntre sporurile absolute
ntre sporurile absolute cu baz fix i sporurile absolute cu baz mobil
determinate la nivelul unei aceleiai repartiii statistice cronologice, se pot
evidenia urmtoarele dou relaii:
198
unde:
Ri/0 reprezint ritmul sau indicele cu baz fix al momentului sau perioadei
de timp i;
Ri/i-1 = ritmul sau indicele cu baz mobil al momentului sau perioadei de
timp i;
199
200
unde:
ri/0 reprezint ritmul sporului cu baz fix al momentului sau perioadei de
timp i;
ri/i-1 = ritmul sporului cu baz mobil al momentului sau perioadei de timp
i;
i/0 = sporul absolut cu baz fix al momentului sau perioadei de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
X0 = nivelul absolut al variabilei X, nregistrat pentru primul moment sau
pentru prima perioad de timp (0) care definete cronologic variabila
statistic studiat;
Ri/0 = ritmul sau indicele cu baz fix al momentului sau perioadei de timp
i;
i/i-1 = sporul absolut cu baz mobil al momentului sau perioadei de timp
i;
Xi-1 = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i-1;
Ri/i-1 = ritmul sau indicele cu baz mobil al momentului sau perioadei de
timp i.
Indicii agregai
Operaia de agregare const n nsumarea elementelor componente ale
unei mulimi care caracterizeaz un fenomen studiat statistic. n funcie de
natura acestor elemente componente, se poate face apel la operaii de:
agregare simpl (atunci cnd elementele componente sunt omogene);
agregare ponderat (atunci cnd elementele componente sunt
eterogene).
Indicii agregai simpli se obin prin raportarea nivelurilor absolute
agregate simplu pentru dou momente sau perioade diferite de timp:
201
unde:
X1/0 reprezint indicele agregat simplu al momentului/perioadei de timp 1
fa de momentul/perioada de timp 0;
Xi1 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 1;
Xi0 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 0.
Indicii agregai ponderai se obin prin raportarea nivelurilor absolute
agregate ponderat pentru dou momente sau perioade diferite de timp:
unde:
I1/0 reprezint indicele agregat ponderat al momentului/perioadei de timp 1
fa de momentul/perioada de timp 0;
Fi = factor de ponderare pentru elementul i; concret, el poate fi dat de:
Fi1 (frecvena nregistrat de ctre elementul i la momentul sau pentru
perioada de timp 1) sau Fi0 (frecvena nregistrat de ctre elementul i la
momentul sau pentru perioada de timp 0).
Valorile absolute ale procentelor de cretere
Valorile absolute ale procentelor de cretere se pot obine pornind de la
relaiile de determinare a ritmurilor sporurilor, considernd din nou fie o
baz fix, fie o baz mobil de raportare:
202
unde:
reprezint nivelul mediu al repartiiei cronologice a variabilei X, dup
variabila de timp T, definit de perioadele/intervalele de timp t;
Xt = nivelul nregistrat de variabila X n perioada/intervalul de timp t;
N = numrul de perioade/intervale de timp care definesc variabila de timp
T.
Pentru repartiiile cronologice dup o variabil definit de momente de
timp, nivelul mediu se calculeaz ca o medie cronologic a nivelurilor
nregistrate pentru momentele (t) de timp considerate.
Dac distanele de timp dintre momentele considerate sunt egale, atunci
media cronologic se poate calcula ca o medie simpl:
203
Sporul mediu ( )
Sporul mediu reflect modificarea medie n cifre absolute care s-a
nregistrat pe parcursul perioadei de timp pentru care este construit
repartiia cronologic studiat. Desigur, se pot determina i sporuri medii
pariale pentru subperioade de timp care intereseaz n demersul cercetrii
realizate.
Sporurile medii se calculeaz ca medii aritmetice ale sporurilor cu baz
mobil:
unde:
N reprezint numrul sporurilor cu baz mobil considerate.
Ritmul mediu ( )
Denumit i indice mediu, ritmul mediu reflect modificarea medie n cifre
relative care s-a nregistrat pe parcursul perioadei de timp pentru care este
construit repartiia cronologic studiat. Desigur, se pot determina i
204
unde:
N reprezint numrul ritmurilor cu baz mobil considerate.
Dup cum se observ, n determinarea ritmului mediu prin aceast metod
se ine cont doar de valorile de la nceputul i de la sfritul perioadei
studiate, ceea ce face ca gradul de reprezentativitate al acestei statistici s
fie unul foarte sczut.
Pentru exemplificare, s considerm repartiia cronologic a profitului net
obinut de firma ABC n perioada 2002-2007, conform tabelului 9.1.
Tabelul 9.1
Anul
2002
3,1
2003
3,4
2004
3,6
2005
4,5
2006
5,2
2007
5,8
Tabelul 9.2
i
Xi
Ri/i-1
3,1
3,4
1,0968
3,6
1,0588
4,5
1,2500
5,2
1,1556
5,8
1,1154
Xi
Verificare
2002
3,1
3,1
2003
3,4
3,11,133478 = 3,513783
2004
3,6
3,5137831,133478 = 3,982797
2005
4,5
3,9827971,133478 = 4,514415
2006
5,2
4,5144151,133478 = 5,116992
2007
5,8
5,1169921,133478 = 5,8
206
de unde rezult c:
Suma din partea dreapt a relaiei astfel obinut este egal cu suma
termenilor unei progresii geometrice cu raia
Aadar, relaia se mai poate scrie:
207
Xi
Verificare
2002
3,1
3,1
2003
3,4
3,11,126912 = 3,493427
2004
3,6
2005
4,5
2006
5,2
2007
5,8
Total
25,6
25,6
, se poate
unde:
i reprezint erorile de modelare regresional a variabilei de interes X dup
variabila de timp i.
Pentru a face posibil aplicarea metodei celor mai mici ptrate de eroare
este necesar mai nti logaritmarea relaiei care descrie funcia
exponenial de trend:
unde:
Ritmul mediu
cu condiia ca:
Xi
i2
ln(Xi)
iln(Xi)
2002
-5
3,1
25
0,491362
-2,456808
2003
-3
3,4
0,531479
-1,594437
2004
-1
3,6
0,556303
-0,556303
2005
+1
4,5
0,653213
0,653213
2006
+3
5,2
0,716003
2,148010
2007
+5
5,8
25
0,763428
3,817140
Total
25,6
70
3,711787
2,010815
Pe baza calculelor din tabelul 9.5 putem obine valoarea ritmului mediu:
210
unde:
(i) este 0 deoarece i este 0.
Prin urmare, pentru exemplul nostru este:
211
Tabelul 9.6
Anul
Xi
Xi (estimat) = i = ( )i
2002
-5
3,1
4,1555751,06838(-5) = 2,985393
2003
-3
3,4
4,1555751,06838(-3) = 3,407637
2004
-1
3,6
4,1555751,06838(-1) = 3,889603
2005
+1
4,5
4,1555751,06838(+1) = 4,439735
2006
+3
5,2
4,1555751,06838(+3) = 5,067677
2007
+5
5,8
4,1555751,06838(+5) = 5,784433
Total
25,6
25,574479
9.2.
212
unde:
http://www.eumed.net/cursecon/economistas/Laspeyres.htm
213
unde:
I1/0(X F) reprezint indicele agregat general;
L1/0(X) = indicele Laspeyres pentru factorul de ponderare X;
L1/0(F) = indicele Laspeyres pentru factorul de ponderare F;
indicele Paasche (P1/0) propus n 1874 de ctre economistul i
statisticianul german Hermann Paasche (1851-1925) 2 :
unde:
Xi1 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 1;
Xi0 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 0;
http://www.eumed.net/cursecon/economistas/Paasche.htm
214
unde:
I1/0(X F) reprezint indicele agregat general;
P1/0(X) = indicele Paasche pentru factorul de ponderare X;
P1/0(F) = indicele Paasche pentru factorul de ponderare F;
indicele Fisher (F1/0) propus n 1922 de ctre economistul i
statisticianul american Irving Fisher (1867-1947) 3 :
http://www.eumed.net/cursecon/economistas/irving_fisher.htm
http://www.econlib.org/library/Enc/bios/Fisher.html
215
unde:
I1/0(X F) reprezint indicele agregat general;
Fi1/0(X) = indicele Fisher pentru factorul de ponderare X;
Fi1/0(F) = indicele Fisher pentru factorul de ponderare F;
Se poate observa c indicele Fisher este construit ca o medie geometric
a indicilor Laspeyres i Paasche:
http://www.eumed.net/cursecon/economistas/Edgeworth.htm
http://www-history.mcs.st-andrews.ac.uk/Biographies/Edgeworth.html
216
Produsul A
100
120
4,5
Produsul B
250
500
217
Tabelul 9.8
Preuri
practicate, p
Cantiti
vndute, q
Perioada
Produsul A
100
120
4,5
Produsul B
250
500
Total
360
540
450
indicele Paasche:
indicele Fisher:
indicele Edgeworth:
218
indicele Drobisch:
219
220
BIBLIOGRAFIE
SELECTIV
225
226