Sunteți pe pagina 1din 224

Lect. dr. ec.

Remus C-tin BUTNESCU-VOLANIN,


Statistic descriptiv
Sibiu, 2008

Remus BUTNESCU-VOLANIN

STATISTIC
DESCRIPTIV

EDITURA UNIVERSITII LUCIAN BLAGA


SIBIU, 2008

Copert i tehnoredactare: Remus C-tin Butnescu-Volanin

Refereni tiinifici:
Prof. dr. ec. Doina-Maria Simion, Universitatea Lucian Blaga din Sibiu
Prof. dr. ec. Dr. H. C. Ioan Bogdan, Universitatea Lucian Blaga din
Sibiu & Universitatea Romno-American din Bucureti
Prof. dr. ing. i ec. Moise uurea, Universitatea Lucian Blaga din
Sibiu

Prezentri power-point, precum i aplicaii excel pe marginea textului


de fa se pot consulta n seciunea Files a grupului de la adresa:
http://groups.yahoo.com/group/RemusButanescu-Volanin_Statistica
Butnescu-Volanin Remus

Descrierea CIP a Bibliotecii Naionale a Romniei


BUTNESCU, REMUS
Statistic descriptiv / Butnescu-Volanin Remus. Sibiu : Editura Universitii Lucian Blaga din Sibiu, 2008
Bibliogr.
ISBN 978-973-739-675-4
519.22(075.8)

Cursul de Statistic descriptiv al domnului Butnescu-Volanin


Remus este o lucrare academic bine documentat, bine structurat i
coerent, cuprinznd nou capitole care se succed ntr-o ordine fireasc,
de la simplu la complex, dezvoltate n coninutul lor, de la general la
particular, pn la nivelul de detaliu obligatoriu necesar pentru cei
interesai n abordarea acestei arii teoretice.
Cursul mbin cunoaterea profund a teoriei cu o excelent
experien didactic, lucru care face ca parcurgerea acestuia s devin o
adevarat plcere. Frazele scurte i concentrate, metodologia statistic
uor lizibil, aspectul tehnic i de punere n pagin a lucrrii, plcut, fac
din cursul domnului Butnescu-Volanin un bun suport de abordare,
nelegere i asimilare a statisticii. De asemenea, exemplele practice care
completeaz coninutul teoretic, selectate i dezvoltate cu atenie,
ntregesc nelegerea i faciliteaz formarea deprinderilor de studiu
statistic.
Cursul permite, prin trimiterile de subsol i prin bibliografia
bogat, extinderea nvrii particulare spre detalii i spre diverse i
variate puncte de vedere.
Consider lucrarea de fa un excelent material pentru mbogirea
cunoaterii statisticii, pentru studeni i pentru oricare specialist interesat.
Prof. dr. ec. Doina Maria Simion
Facultatea de Stiinte Economice
Universitatea Lucian Blaga din Sibiu

CUPRINS
CAPITOLUL 1. Locul statisticii n cunoaterea uman

13

1.1. Rolul statisticii n cunoaterea uman

15

1.2. Planificarea cercetrii statistice

15

1.3. Concepte de baz folosite n statistic

16

1.4. Datele statistice i nivelurile de msurare a acestora

22

1.5. Utilizarea calculatorului n prelucrarea i analiza


statistic a datelor

24

1.6. Observarea statistic

25

1.7. Erorile de observare statistic. Controlul datelor


nregistrate

28

1.8. Prelucrarea primar a datelor statistice.

29

1.9. Prezentarea rezultatelor prelucrrii primare a datelor

31

CAPITOLUL 2. Exprimarea n mrimi relative a


informaiilor statistice

41

2.1. Mrimile relative de structur

44

2.2. Mrimile relative de coordonare (coresponden)

46

2.3. Mrimile relative de dinamic

46

2.4. Mrimi relative de intensitate

47

CAPITOLUL 3. Descrierea statistic a tendinei centrale:


statisticile medii

49

3.1. Media aritmetic

51

3.2. Media geometric

58

3.3. Media ptratic

67

3.4. Media armonic

73

3.5. Media generalizat sau media de ordinul "r"

80

CAPITOLUL 4. Descrierea statistic a tendinei centrale:


statisticile de poziie

81

4.1. Cuantilele

83

4.2. Mediana

83

4.3. Moda

90

4.4. Mediala

98

CAPITOLUL 5. Descrierea statistic a concentrrii i


diversificrii
5.1. Statistici disponibile n descrierea numeric a
concentrrii statistice pentru variabile statistice cantitative cu
valori pozitive
5.2. Statistici disponibile pentru descrierea numeric a
concentrrii statistice pentru variabile statistice calitative
5.3. Statistici ale diversificrii

105
108
122
128

10

CAPITOLUL 6. Descrierea statistic a variaiei

133

6.1. Amplitudinea

137

6.2. Abaterile individuale

138

6.3. Abaterea medie liniar

140

6.4. Variana sau dispersia

140

6.5. Abaterea medie ptratic sau abaterea standard

150

6.6. Coeficientul de variaie sau de omogenitate

151

6.7.Alegerea statisticilor de variaie

153

6.8. Momente centrate i momente necentrate

153

6.9. Covariana

154

CAPITOLUL 7. Descrierea statistic a formei


repartiiilor statistice unimodale: oblicitatea i kurtosisul

159

7.1. Statisticile de oblicitate

161

7.2. Statisticile de kurtosis

169

CAPITOLUL 8. Descrierea statistic a legturilor dintre


fenomene

175

8.1. Ce este corelaia statistic?

177

8.2. Coeficientul de corelaie liniar Pearson

177

11

8.3. Regresia statistic liniar

181

CAPITOLUL 9. Descrierea statistic a variaiei n timp

195

9.1. Descrierea statistic a variaiei de nivel pentru repartiiile


statistice cronologice
9.2. Descrierea statistic a variaiei de structur pentru
repartiiile statistice cronologice. Indicii agregai ponderai

BIBLIOGRAFIE SELECTIV

197
212

221

12

LOCUL STATISTICII N
CUNOATEREA UMAN

1.

OBIECTIVELE CAPITOLULUI
Obiectivul principal al acestui capitol este de a v introduce n lumea statisticii,
ajutndu-v:
s nelegei rolul statisticii n cunoaterea uman;
s reinei principalele concepte ale limbajului statistic;
s facei distincia ntre preocuprile statisticii descriptive i cele ale statisticii
infereniale;
s reinei diferitele niveluri posibile de msurare a datelor.

14

1.1. Rolul statisticii n cunoaterea uman.


Conceptele i metodele statistice sunt aplicate de fiecare dat cnd este
avut n vedere o anumit generalizare n legtur cu un fenomen studiat,
ceea ce impune existena urmtoarelor condiii:
1. Condiia de volum: considerarea unui numr mare de cazuri
individuale;
2. Condiia de justificare a analizei statistice: existena unui anumit grad
de variabilitate de la un caz la altul, dat de influenele mai multor
factori de natur diferit.
Generalizrile obinute pe calea studiului statistic sunt reprezentri
nedeterministe sau de tip stocastic, lund forma aa-numitelor legi
statistice, legi care descriu tendine predominante la nivelul cazurilor
individuale aflate n legtur cu fenomenul studiat.
Cea mai important lege statistic este legea numerelor mari, formulat
pentru prima dat de ctre Jacob Bernoulli (1654-1705) n celebra sa
lucrare Ars Conjectandi.
Ea se constituie ca un principiu fundamental al cercetrii statistice,
afirmnd c ntr-un numr suficient de mare de cazuri individuale,
influenele diverilor factori se pot compensa, astfel nct s se ajung la o
anumit valoare tipic, reprezentativ pentru ntreg ansamblul.
Respectarea acestui principiu presupune, prin urmare, ca n cercetarea
statistic s fie luat n considerare un numr suficient de mare de cazuri
individuale condiia de volum la care ne-am referit i mai sus astfel
nct abaterile ntr-un sens sau altul s se poat compensa.
Statistica nu trebuie confundat cu un simplu domeniu al matematicii, dei
ea presupune folosirea, ntr-o proporie covritoare, a instrumentarului
matematic. Acesta din urm face, de altfel, obiectul unei discipline
distincte i mult mai recente, i anume al statisticii matematice, ramur a
matematicii care elaboreaz noiunile i metodele folosite n statistic 1 .

1.2. Planificarea cercetrii statistice.


Un loc important n cercetarea statistic trebuie acordat etapei de
planificare a acesteia.
Cei care investigheaz trebuie s fie contieni de limitele caracteristice
cercetrilor statistice. Astfel de limite sunt, de exemplu, cele determinate
de indisponibilitatea tuturor datelor statistice necesare.

Cf. Dicionarului explicativ al limbii romne, Academia Romn, Institutul de Lingvistic "Iorgu
Iordan", Editura Univers Enciclopedic, ediia 1998, http://dexonline.ro/

15

Planificarea unei cercetri statistice poate fi sensibil mbuntit dac este


fcut efortul de plasare nu doar n postura de productori ai rezultatelor
statistice, ci i n aceea de consumatori ai acestora. n acest fel, se pot
identifica mai bine factorii relevani care trebuie studiai pentru atingerea
obiectivelor fixate, factori pe baza crora se vor putea defini criteriile de
observare statistic, adic variabilele statistice.
S presupunem, de pild, c dorim s rspundem la ntrebarea: Sunt
brbaii oferi mai buni dect femeile sau invers? n acest caz, ar fi incorect
s ncercm s cutm rspunsul analiznd ratele accidentelor de main pe
o anumit perioad, pentru a compara rata accidentelor provocate de
brbai cu rata accidentelor provocate de femei. Pentru o concluzie corect
sunt necesare mai multe criterii. Astfel, accidentele sunt determinate i de
nclinaia de expunere la risc, care difer la femei fa de brbai. Este,
aadar, incorect s presupunem ca singur factor al accidentelor de main
abilitatea de a conduce, nelund n calcul i nclinaia de expunere la risc.

1.3. Concepte de baz folosite n statistic.


Statistica i-a elaborat pe parcursul dezvoltrii sale un limbaj specific. n
continuare vor fi prezentate conceptele de baz cu care opereaz statistica.
Populaia i unitatea statistic
Populaia statistic reprezint mulimea tuturor elementelor a cror
observare este necesar pentru obinerea statisticilor dorite. Ea se mai
numete i colectivitate statistic sau univers statistic.
Definirea populaiei statistice asigur stabilirea explicit a ntinderii i
naturii mulimii de date pe baza crora se vor trasa concluziile cercetrii
statistice. De aceea este necesar specificarea exact n cadrul etapei de
planificare a cercetrii statistice a granielor care definesc n timp i
spaiu populaia statistic. Aceste granie se stabilesc n funcie de
statisticile care fac obiectul cercetrii.
Elementele unei populaii statistice sunt denumite uniti statistice.
n tabelul 1.1 sunt prezentate cteva exemple de populaii statistice definite
corespunztor informaiilor statisticile dorite.
Populaiile statistice pot fi abordate static sau dinamic. Abordarea static
este cea prin care populaia statistic este studiat la un anumit moment n
timp. n cadrul abordrii dinamice, populaia statistic este observat n
devenirea sa n timp.

16

Tabelul 1.1 Exemple de populaii statistice


Informaii statistice dorite

Populaia statistic

Cea mai mare companie privat din


Romnia n anul 2006, dup cifra de
afaceri

Companiile private care


funcionau n Romnia n
anul 2006

Numrul de cstorii care au avut loc n


Romnia n anul 2006

Cstoriile ncheiate n anul


2006 n Romnia

Traficul mediu de pasageri pentru


primele 10 aeroporturi din topul ACI
(Airports Council International)

Aeroporturile internaionale
participante la topul ACI

Media vnzrilor lunare pentru


automobilele marca Daewoo n prima
jumtate a anului 2006

Nivelurile de vnzri
nregistrate n primele 6 luni
ale anului 2006 pentru
automobilele marca Daewoo

Variabilele i repartiiile statistice


Variabilele statistice sunt criteriile de interes dup care unitile statistice
sunt supuse studiului statistic. Se numesc aa deoarece pot lua valori
diferite de la o unitate statistic la alta. n figura 1.1 este prezentat
clasificarea variabilelor statistice n funcie de natura lor.

calitative sau
nenumerice

alternative (de tipul


DA/NU)
nealternative
(cronologice, teritoriale,
atributive)

Variabile statistice

cantitative sau
numerice

discrete (cu valori n


salturi)
continue (definite pe
intervale)

Figura 1.1 Clasificarea variabilelor statistice

17

O problem important n cercetarea statistic o reprezint stabilirea listei


de variabile dup care se studiaz populaia statistic. n aceast list
trebuie s apar doar variabilele care rspund direct obiectivului propus.
Valorile particulare pe care le poate nregistra o variabil statistic la
nivelul unitilor statistice se numesc variante.
Numrul de apariii ale unei anumite variante statistice n urma efecturii
unei observri statistice se numete frecven statistic. Frecvenele
statistice se exprim n valori absolute sau relative. Frecvenele statistice
relative se obin prin raportarea frecvenelor statistice absolute la totalul
frecvenelor nregistrate la nivelul populaiei statistice.
Pentru datele grupate, poate fi util i determinarea volumelor statistice,
adic a subtotalurilor corespunztoare variantelor nregistrate de ctre o
variabil statistic numeric, obinute ca produse ntre variante i
frecvenele lor de apariie.
Ansamblul format din irul de variante pe care le nregistreaz o variabil
statistic la nivelul tuturor unitilor statistice dintr-o populaie statistic,
mpreun cu irul de frecvene statistice nregistrate se numete repartiie
sau distribuie statistic.
Tabelul 1.2 Repartiia absolut i repartiia relativ a vnzrilor de
autoturisme autohtone nregistrate n Romnia n 2005 2

Frecvene absolute

Frecvene relative

Ianuarie

7540

7540 / 113489 = 6,64%

Februarie

9635

8,49%

Martie

13314

11,73%

Aprilie

11186

9,86%

Mai

10163

8,96%

Iunie

12981

11,44%

Iulie

10056

8,86%

August

2921

2,57%

Septembrie

7343

6,47%

Octombrie

10841

9,55%

Noiembrie

9442

8,32%

Decembrie

8067

7,11%

Total

113489

100,00%

Sursa datelor: APIA Asociaia Productorilor i Importatorilor de Automobile.

18

n afar de repartiiile statistice empirice (reale, experimentale), n


cercetarea statistic se folosesc i repartiii statistice teoretice sau
probabilistice, pentru care irului de variante ale variabilei statistice i
corespunde un ir de probabiliti de apariie. n tabelul 1.2 sunt prezentate
repartiiile statistice ale frecvenelor absolute i relative nregistrate n
Romnia n anul 2005 pentru vnzrile de autoturisme autohtone.
Dac nu se prevd modificri eseniale n evoluia lunar a vnzrilor de
autoturisme autohtone pentru anul 2006, se poate considera repartiia
frecvenelor relative nregistrate n anul 2005 ca repartiie probabilistic a
vnzrilor de autoturisme autohtone pentru anul 2006.
Indicatorii statistici sau statisticile
Indicatorii statistici sau statisticile sunt valori reprezentative pentru
repartiiile statistice, obinute prin diversele operaii numerice (de calcul,
cumulare, agregare etc.).
Statisticile se pot clasifica n:
statistici de descriere a tendinei centrale media aritmetic, mediana,
modul etc.;
statistici ale concentrrii abaterea medial-median, indicele de
concentrare Gini, energia informaional Onicescu etc.;
statistici ale diversificrii gradul de diversificare, raportul de
diversificare, indicele de diversificare;
statistici de variaie amplitudinea sau cmpul de variaie, abaterea
medie ptratic, dispersia sau variana, coeficientul de variaie etc.;
statistici de caracterizare a formei repartiiei coeficientul lui Pearson,
coeficientul lui Fisher etc.;
statistici de corelaie covariana, coeficientul de corelaie liniar,
raportul de corelaie, raportul de determinaie, coeficientul de corelaie
Kendall, coeficientul de corelaie Spearman etc.
Statistica descriptiv
Metodele statisticii descriptive rspund nevoilor de descriere a unei
colectiviti de uniti statistice prin valorile lor reprezentative, adic prin
statistici. Fac obiectul descrierii statistice acele experiene care sunt n
legtur cu fenomene care nu sunt caracterizate de o uniformitate
sistematic. n msura n care se poate discerne o regularitate n derularea
unui fenomen, recursul la descrierea statistic a acestuia nu mai este

19

necesar 3 . De exemplu, scopul statisticii demografice privind durata medie


de via a unei populaii nu este acela de a evidenia faptul c toi oamenii
sunt muritori, ci de a informa n legtur cu lungimea vieii umane, a crei
magnitudine, nu este, conform observaiilor statistice, uniform.
Pentru obinerea statisticilor prin care se pot descrie colectivitile statistice
studiate este necesar parcurgerea urmtoarelor dou etape:
centralizarea datelor obinute n urma observrilor statistice;
prelucrarea datelor centralizate cu ajutorul tehnicilor de calcul statistice.
n urma centralizrii datelor statistice se obin statisticile primare, iar prin
prelucrarea, cu ajutorul tehnicilor de calcul statistice, a statisticilor primare,
se obin statisticile derivate.
Att statisticile primare, ct i statisticile derivate, sunt expresii numerice
ale fenomenelor studiate statistic.
Statisticile primare descriu n mrimi absolute fenomenele studiate,
exprimnd direct nivelurile cantitative ale variabilelor studiate. Ele se pot
determina global sau prin cumulare treptat. Centralizarea la nivelul
ntregii colectiviti statistice este calea obinerii statisticilor primare
globale, iar centralizarea la nivelul grupelor colectivitii statistice asigur
obinerea statisticilor primare cumulate.
Statisticile primare se exprim n unitile de msur specifice variabilelor
studiate (buci, kilograme, metri etc.). Cu ajutorul lor se pot face doar
aprecieri globale privind fenomenele studiate. Statisticile derivate sunt
necesare pentru evidenierea tendinelor specifice (care intereseaz n
cercetrile ntreprinse) manifestate la nivelul colectivitilor statistice
studiate. Pentru cunoaterea multilateral, din punct de vedere statistic, a
fenomenelor, este necesar utilizarea combinat a statisticilor absolute
(primare) i a celor derivate.
Am ales pentru exemplificare statisticile primare privind natalitatea,
mortalitatea i sporul natural pentru lunile decembrie 2006 i ianuarie
2007, centralizate la nivelul Institului Naional de Statistic din Romnia.
Acestea sunt prezentate n tabelul 1.3.
Dup cum se poate observa, pe baza statisticilor primare au fost calculate
direct n tabelul 1.3 statisticile derivate privind sporul natural i variaia de
la o lun la alta, obinndu-se urmtoarele informaii suplimentare:
- n luna ianuarie 2007 s-a nregistrat un numr de nscui-vii mai
mare cu 3.507 fa de luna decembrie 2006;

Ludwig von Mises, The Ultimate Foundation of Economic Science, Van Nostrand Edition, 1962, p. 55:
As far as there is discernible regularity in the succession of phenomena, no recourse to statistics is
needed.

20

- n luna ianuarie 2007 s-a nregistrat un numr de decedai mai mare


cu 2155 fa de luna decembrie 2006;
- creterea mai mare a numrului de nscui-vii fa de cea a
numrului de decedai a dus la o cretere cu 1.352 a sporului natural
(diferena dintre numrul de nscui-vii i numrul de decedai);
acesta s-a meninut ns, n continuare, negativ (de la -8.135 a ajuns
la -6.783).
Tabelul 1.3 Statistici ale Institului Naional de Statistic din Romnia
privind natalitatea, mortalitatea i sporul natural pentru lunile
decembrie 2006 i ianuarie 2007 4
Numr
nscui-vii

Numr
decedai

Spor natural

Decembrie 2006

15288

23423

-8135

Ianuarie 2007

18795

25578

-6783
(-6783) (-8135) =

Variaie

3507

2155

3507 2155 =
1352

Statistica inferenial
Statistica modern s-a dezvoltat mai ales prin apariia i dezvoltarea
metodelor de investigare parial. Metodele de investigare statistic
parial sunt metode ale aa-numitei statistici infereniale. Statistica
inferenial i propune s caracterizeze populaia statistic studiat prin
observarea doar a uneia sau mai multor pri ale acesteia, denumite
eantioane. Bineneles, o astfel de caracterizare nu poate fi dect una
estimativ, valorile statistice obinute la nivel de eantion statistic fiind
denumite estimatori statistici. Estimarea statisticilor unei populaii prin
intermediul unor astfel de metode se numete infereniere statistic (figura
1.2).
Eantionul este o parte din ntregul definit de o populaie statistic, parte
care, atunci cnd este corect constituit (adic innd cont de principii
statistice izvorte din teoria seleciei), este suficient de reprezentativ
pentru ntreaga populaie statistic din care provine.

Conform comunicatelor de pres ale Institului Naional de Statistic - nr. 35 din 15 februarie 2007 i,
respectiv, nr. 56 din 20 martie 2007, http://www.insse.ro/statistici/comunicate/pop.htm

21

E s tim a r e a
s ta tis tic ii

E A N T I O N la
n iv e lu l c r u ia
s e d e te r m in
e s tim a to r u l

P O P U L A IE
d e s c r is d e
s ta tis tic a
S E L E C IA
a le a to a r e a u n u i
e a n tio n i
c a lc u lu l u n e i
a l
e s tim a to r
s ta tis tic ii

Figura 1.2 Inferenierea statistic

1.4. Datele statistice i nivelurile de msurare a acestora.


Pentru a fi complete, datele statistice trebuie s conin urmtoarele
elemente:
noiunea, care precizeaz fenomenul sau procesul la care se refer data
statistic;
identificatorii de spaiu, de timp i de organizare;
valoarea numeric nsoit, dac este cazul, de unitatea de msur.
De exemplu, pentru data statistic venitul mediu pe un membru al familiei
Popescu din oraul Sibiu, pe anul 2006, este de 585 RON noiunea este
venitul mediu pe un membru al unei familii, identificatorul organizatoric
este familia Popescu, identificatorul de spaiu este Sibiu,
identificatorul de timp este anul 2006 iar valoarea numeric este 585,
cu unitatea de msur RON.
Datele statistice sunt purttoare de informaii statistice, acestea din urm
constnd n mesajele semnificative oferite de datele statistice.
Datele statistice se pot clasifica dup nivelurile de msurare folosite n
exprimarea lor n:
date statistice nominale;
date statistice ordinale;
date statistice de tip interval;
date statistice raionale.

22

Nivelul de msurare nominal a datelor


Valorile numerice corespunztoare datelor aflate pe nivelul nominal de
msurare pot fi utilizate doar n clasificri ale acestora. Variabilele
statistice generatoare de astfel de date sunt variabilele calitative, adic
variabilele ale cror variante sunt reprezentate de diferite atribute
nenumerice.
S considerm, de pild, variabila profesie, cu urmtoarele 4 variante: 1.
profesor; 2. avocat; 3. medic; 4. altele. Valorile numerice 1, 2, 3 i 4
desemnate pentru variante nu pot fi folosite dect pentru clasificarea
acestora.
Tehnicile statistice care rspund analizei unor astfel de date sunt, prin
urmare, foarte limitate.
Nivelul de msurare ordinal a datelor
Acest nivel de msurare este superior nivelului nominal din punctul de
vedere al puterii de prelucrare a datelor. Astfel, pe acest nivel de msurare
a datelor se pot efectua, pe lng clasificri, i ordonri ale datelor.
Ca exemplu, s considerm variabila statistic calitate, definit de
urmtoarele 5 variante: 1. Foarte rea; 2. Rea; 3. Medie; 4. Bun; 5. Foarte
bun.
Dup cum se observ, valorile numerice asociate variantelor pot fi folosite
att pentru clasificarea datelor, ct i pentru ordonarea acestora.
Nivelul de msurare pe intervale a datelor
Nivelul de msurare pe intervale este superior nivelurilor prezentate
anterior, prin faptul c ntre valorile numerice asociate variantelor
variabilelor statistice sunt distane egale (intervale), ceea ce d posibilitatea
utilizrii de tehnici statistice suplimentare pentru astfel de date statistice.
Variabila pe care o alegem ca exemplu este temperatura, avnd ca i
variante valorile numerice ale scrii Celsius.
Pentru astfel de date nu sunt ns disponibile operaiile aditive sau
multiplicative ntre variante.
Nivelul de msurare raional al datelor
Fa de nivelul de msurare pe intervale, acestui nivel i este caracteristic
n plus existena unei valori numerice nule, a unui zero absolut.

23

ntruct, n aceste condiii devin disponibile i operaiile aditive sau


multiplicative, nivelul de msurare raional a datelor este cel mai nalt
nivel de msurare.
Nivelurile de msurare i tehnicile statistice corespunztoare.
Tehnicile statistice se pot mpri n:
tehnici parametrice;
tehnici neparametrice.
Tehnicile parametrice cer ca datele s fie aflate pe nivelurile de msurare
raional sau pe intervale. Dac datele se afl pe niveluri de msurare
inferioare ordinal sau nominal atunci sunt disponibile doar tehnicile
statistice neparametrice, care pot fi folosite i pentru date aflate pe
nivelurile de msurare superioare.
n figura 1.3 este sugerat potenialul de analiz statistic pentru cele 4
niveluri de msurare a datelor. Desigur, nivelul raional este caracterizat de
potenialul maxim de prelucrare i analiz statistic.

Raional
Interval
Ordinal
Nominal

Figura 1.3 Potenialul de analiz statistic pentru cele 4 niveluri de


msurare a datelor statistice

1.5. Utilizarea calculatorului n prelucrarea i analiza


statistic a datelor
Dezvoltarea deosebit a calculatoarelor a deschis multe oportuniti noi
pentru activitatea de prelucrare i de analiz statistic a unui volum din ce
n ce mai mare de date necesare n activitile umane.
24

Calculatorul permite stocarea, regsirea i transferul rapid a unei mari


cantiti de date.
n ultimii ani s-au dezvoltat programe tot mai sofisticate dedicate acestor
scopuri.
Anumite tehnici statistice, foarte utile n luarea deciziilor pe care le implic
desfurarea corespunztoare a activitilor umane, sunt n acelai timp
foarte greoaie i plictisitoare, predispunnd la multe greeli n ce privete
calculele realizate manual sau chiar cu ajutorul unor minicalculatoare.
Acest fapt a fcut ca aceste tehnici s fie folosite practic de puini
utilizatori nainte de dezvoltarea i utilizarea pe scar larg a
calculatoarelor.
Astzi sunt disponibile ns multe pachete software dedicate prelucrrii i
analizei statistice.
Printre cele mai cunoscute pachete software dedicate prelucrrii i analizei
statistice se pot meniona: SPSS; STATISTICA; SAS; Minitab etc.
Alturi de aceste pachete dedicate, se pot folosi i pachete software de tip
"spreadsheet", adic pentru "calcul tabelar", dintre care cel mai cunoscut i
folosit este EXCEL.
Foarte utile pot fi i aplicaiile statistice on-line. Astfel, pe site-ul aflat la
adresa http://www.statistics.com se pot gsi diverse mici aplicaii statistice,
o mare parte dintre acestea fiind oferite gratuit spre descrcare i instalare.
De asemenea, la adresa http://www.wessa.net se poate folosi un foarte
puternic calculator statistic on-line.

1.6. Observarea statistic


Cercetarea statistic se desfoar n urmtoarele trei etape:
observarea statistic, adic culegerea datelor statistice;
prelucrarea datelor obinute n faza precedent;
analiza i interpretarea rezultatelor obinute n urma prelucrrii.
Aceste etape trebuie abordate mpreun, ca un tot unitar, asigurndu-se
astfel premisa reducerii riscului unor erori de culegere, prelucrare sau
analiz statistic.
Pentru a putea satisface corespunztor necesitile de cercetare statistic,
observarea statistic trebuie s ndeplineasc dou condiii:
condiia de volum, care presupune culegerea datelor de la toate unitile
care compun populaia sau eantionul statistic, aa cum au fost definite
acestea n etapa de planificare statistic;

25

condiia de calitate, care presupune nregistrarea de date autentice,


reale.
Dup modul de organizare a lor n timp, observrile statistice se pot
clasifica n:
observri permanente (cum sunt, de exemplu, cele realizate prin
raportrile statistice din cadrul Sistemelor Informaionale Statistice
(SIS) Naionale);
observri fr caracter permanent, cum sunt recensmintele, anchetele,
monografiile statistice etc.
Dup numrul unitilor supuse observrii, observrile statistice se pot
mpri n:
observri totale n urma crora se obin date de la toate unitile care
compun populaia statistic int (recensminte, rapoarte statistice etc.);
observri pariale (observri prin sondaj sau prin selecie) prin care se
culeg date doar de la o parte (eantion) din unitile care compun
populaia statistic int.
Principalele metode de observare statistic sunt:
recensmntul;
sistemul de raportare statistic;
sondajul sau selecia statistic;
ancheta statistic;
observarea prii principale (panelul);
monografia statistic.
Recensmntul
Recensmntul este cea mai veche metod de observare statistic, constnd
n culegerea periodic de date statistice de la toate unitile care compun
populaia statistic int.
Caracterul periodic (de exemplu, recensmintele demografice se
organizeaz, de regul, din 10 n 10 ani) al recensmntului este impus de
eforturile mari pe care acesta le presupune.
Sistemul de raportare statistic
Prin intermediul unui sistem de raportare statistic se dorete o observare
permanent a tuturor unitilor statistice componente ale populaiei
statistice int.
26

n cadrul unui sistem de raportare statistic, unitile statistice trebuie s


furnizeze permanent datele statistice solicitate, astfel nct s poat fi
surprins evoluia n timp a fenomenelor cercetate.
Sondajul sau selecia statistic
Sondajul sau selecia statistic este o metod de observare statistic
parial a populaii statistice int.
O observare statistic parial este motivat prin eforturile mai mici pe care
aceasta le presupune.
n cazul unei asemenea observri se cere ns rezolvat problema
reprezentativitii eantionului (partea din populaie care este selectat
pentru a fi supus observrii) ales pentru studiu.
Cerina de asigurare a reprezentativitii face din alegerea eantionului o
problem destul de complex.
Ancheta statistic
Ancheta statistic este metoda de observare statistic parial n cadrul
creia nu se ine cont de problema reprezentativitii eantionului
constituit.
Ea se bazeaz, de regul, pe distribuirea direct (cu ocazia unor trguri,
expoziii etc.) sau indirect (de exemplu, prin pot) de chestionare a cror
completare este benevol.
Avantajul acestei metode const n economicitatea ei. n schimb,
neasigurarea condiiei de reprezentativitate a eantionului face dificil
controlul privind erorile statistice ale rezultatelor obinute. n consecin,
rezultatele obinute se pot extinde asupra ntregii colectiviti statistice
numai cu o aproximaie necontrolabil.
Observarea prii principale (masivul principal sau panelul)
Observarea prii principale este metoda de observare statistic parial
prin care se culeg date numai de la cele mai semnificative uniti ale
populaiei statistice int.
Prin aceast metod se nltur dezavantajul metodei precedente,
asigurndu-se reprezentativitatea unitilor statistice supuse studiului.
Spre deosebire de metoda sondajului, unde reprezentativitatea se asigur
printr-o eantionare statistic, n cazul metodei observrii prii principale
reprezentativitatea se asigur prin stabilirea unei pri din colectivitatea
statistic, numit parte principal, masiv principal sau panel, parte supus
permanent observrii statistice.

27

Dificultatea acestei metode const n stabilirea prii principale i n


asigurarea receptivitii acesteia la solicitarea permanent de date.
Monografia statistic
Monografia statistic este, propriu-zis, o metod de cercetare statistic,
realizat cu scopul depistrii de noi elementele care apar la nivelul
populaiei statistice studiate, ceea ce presupune o anumit aprofundare a
etapei de observare statistic.
Monografia statistic presupune nu numai culegerea datelor ci i
interpretarea acestora. O ontribuie important la dezvoltarea colii
statistice monografice a adus-o i sociologul romn Dimitrie Gusti.

1.7. Erorile de
nregistrate

observare

statistic.

Controlul

datelor

Erorile de observare statistic sunt determinate cel mai des de: omisiuni de
nregistrare a variantelor particulare ale variabilelor studiate; nelegerea
sau transmiterea greit a unor mrimi numerice; culegerea de date
conform unor instruciuni greit nelese; nregistrri pe baz de date
inexacte (din memorie) etc.
n general, erorile de observare statistic se mpart n:
erori ntmpltoare erori foarte des ntlnite, care se produc de cele
mai multe ori din neatenie. Acest gen de erori afecteaz rezultatele
observrii ntr-o mic msur deoarece ele se produc n ambele sensuri,
compensnd-se;
erori sistematice erori care se produc n acelai sens, determinnd
abateri semnificative de la nivelul real al caracteristicilor studiate.
Aceste erori sunt determinate, de cele mai multe ori, de redactarea
necorespunztoare a instruciunilor de culegere a datelor.
Cele dou grupe de erori amintite pot aprea i pe parcursul celorlalte dou
etape ale programului de cercetare statistic (prelucrarea primar i analiza
datelor statistice).
Pentru evitarea apariiei de erori n etapa de observare statistic, se
recomand:
efectuarea unor observri de prob;
aplicarea de operaii de control pentru depistarea la timp a eventualelor
erori. Controlul poate fi de tip aritmetic sau de tip logic. Controlul
aritmetic presupune efectuarea de operaii simple de calcul (pe baza
unor "chei de calcul") pentru analiza i verificarea unor date derivate.
Controlul logic const n testarea concordanei logice ntre variantele
28

diferitelor variabile nregistrate la aceeai unitate de observare sau ntre


diferite variante pentru aceeai variabil;
instruirea atent a celor nsrcinai cu culegerea datelor;
formularea i transmiterea de instruciuni clare, fiind chiar indicat
menionarea expres a cazurilor cnd riscul de apariie a erorilor este
mai mare;
n cazul observrii indirecte, elaborarea de formulare complete n care
s se indice foarte clar ce anume trebuie s se nregistreze.

1.8. Prelucrarea primar a datelor statistice.


Coninutul prelucrrii primare a datelor statistice
Pentru obinerea unei prime imagini asupra colectivitii (populaie sau
eantion) statistice studiate, dar i pentru asigurarea condiiilor necesare
unor prelucrri aprofundate a datelor, este necesar mai nti prelucrarea
primar a datelor colectate.
Prelucrarea primar este prima faz a prelucrrii statistice a datelor
colectate i const n operaii de grupare i centralizare a acestora.
n urma prelucrrii primare, se obin primele statistici privind colectivitatea
statistic studiat, denumite statistici primare. De asemenea, prelucrarea
primar a datelor statistice ofer posibilitatea descrierii grafice, prin
intermediul tabelelor i diagramelor statistice, a colectivitii statistice
studiate.

Centralizarea datelor statistice


Centralizarea datelor statistice se poate realiza global sau pe grupe.
Centralizarea global se realizeaz prin cumularea datelor obinute pentru
ntreaga colectivitate statistic.
Centralizrile globale pot furniza informaii importante, numrndu-se
deseori ntre principalele obiective ale cercetrii statistice. De pild, prin
centralizarea datelor obinute n urma organizrii unui recensmnt
demografic se poate obine numrul de locuitori al unei ri la momentul
efecturii acestuia.
Centralizarea pe grupe se realizeaz prin cumularea datelor care au fost n
prealabil ordonate i grupate dup anumite criterii de interes.
Centralizarea pe grupe ofer posibilitatea unei cunoateri detaliate a
fenomenului studiat, prin analiza acestuia pe elementele sale de structur.
De exemplu, prin centralizarea pe grupe a datelor obinute n urma unui
recensmnt demografic se poate obine numrul de locuitori pe judee, pe
29

sexe, pe categorii socio-profesionale etc., n funcie de criteriile stabilite


pentru gruparea datelor.
Prin gruparea datelor statistice pot fi satisfcute necesiti ale analizei
statistice. De exemplu, prin gruparea datelor statistice se pot pune n
eviden efectele unei relaii cauzale dintre dou sau mai multe variabile.
Gruparea datelor trebuie realizat cu respectarea condiiei de omogenitate.
Aceasta nseamn c diferenele nregistrate n interiorul grupei nu pot
depi anumite limite fixate anterior.

Clasificarea gruprilor statistice


n funcie de numrul criteriilor (variabilelor) de grupare, gruparea poate
fi:
simpl, adic dup un singur criteriu, rezultatul gruprii putnd fi redat
printr-un tabel simplu;
combinat, realizate dup dou sau mai multe variabile concomitent,
rezultatul urmnd a fi redat printr-un tabel combinat.
n funcie de natura criteriilor de grupare, se pot realiza:
grupri cronologice, realizate dup un criteriu de timp (ziua, luna, anul
etc.). Coleciile de date obinute n urma centralizrii datelor dup
asemenea criterii se numesc serii statistice cronologice;
grupri spaiale sau teritoriale, realizate dup un criteriu de spaiu (ara,
judeul, zona geografic etc.). Coleciile de date obinute n urma
centralizrii datelor dup asemenea criterii se numesc serii statistice
teritoriale;
grupri dup variabile atributive (de exemplu, grupri pe tipuri, pe
feluri etc.);
grupri dup variabile cantitative, care la rndul lor pot fi cu variaie
discret (grupri pe variante, pe valori discrete) sau cu variaie continu
(grupri pe intervale).
Gruparea statistic pe intervale egale
Pentru gruparea datelor pe intervale egale se recomand parcurgerea
urmtoarelor etape:
1. Stabilirea amplitudinii variaiei, cu ajutorul relaiei:
A = x max x min

unde:
30

A reprezint amplitudinea variaiei;


x max = limita superioar de variaie (varianta maxim pe care o poate lua
variabila statistic);

x min = limita inferioar de variaie (varianta minim pe care o poate lua


variabila statistic).

2. Stabilirea mrimii intervalului de grupare.


a. dac numrul de grupe este anterior fixat, se folosete relaia:

A x max x min
=
ng
ng

mi =
unde:

m i reprezint mrimea intervalului de grupare;

n g = numrul de grupe;
b. dac nu se fixeaz anterior numrul de grupe, se folosete relaia
propus de H.A. Sturges:

mi =

x max xmin
1 + 3,322 log n

unde n reprezint numrul de uniti statistice.


3. Formarea intervalelor de grupare pornind de la limita inferioar de
variaie.
Intervalele pot fi deschise doar la unul dintre capete.

1.9. Prezentarea rezultatelor prelucrrii primare a datelor


Gruparea i centralizarea datelor statistice asigur posibilitatea descrierii
grafice a colectivitii statistice studiate prin intermediul tabelelor i
diagramelor statistice.
Asemenea descrieri grafice sunt publicate n rapoarte, buletine sau anuare
statistice etc. i pot fi folosite pentru continuarea studiului statistic al
datelor respective prin determinarea diverselor statistici, prin analize
statistice aprofundate etc.
Tabelele statistice
Tabelele statistice se construiesc n aa fel nct s conin urmtoarele
elemente:

31

titlul general, prin care este prezentat, ntr-o form complet, dar i
concis, obiectul tabelului. Pentru a fi complet, titlul general trebuie s
defineasc populaia statistic att n spaiu, ct i n timp. Concizia
titlului general nu trebuie s afecteze, desigur, precizia i claritatea sa;
titlurile interioare, adic cele ale rndurilor i coloanelor tabelului.
Titlurile interioare definesc gruparea sau gruprile datelor statistice
prezentate;
macheta tabelului, adic reeaua de rnduri i coloane (care formeaz
rubricile n care se nscriu datele);
unitile de msur utilizate pentru exprimarea datelor;
eventualele note explicative necesare pentru interpretarea corect a
datelor;
sursele datelor, a cror cunoatere permite verificarea, de ctre cei
interesai, a exactitii informaiilor.
Dup numrul i natura variabilelor statistice implicate, se ntocmesc:

tabele simple sau descriptive, prezentnd repartiia populaiei analizate


dup o singur variabil statistic. Ele nlesnesc prezentarea datelor
statistice ordonate din punct de vedere cronologic, teritorial sau
organizatoric;
tabele combinate, n care datele sunt prezentate n urma gruprilor
combinate dup dou sau mai multe variabile. Cnd exist o dependen
ntre cele dou variabile, tabelul este unul de corelaie sau de asociere
statistic.
Diagramele statistice
Calea cea mai expresiv de prezentare a datelor statistice este cea grafic.
Prin reprezentarea grafic a datelor statistice se asociaz acestora o imagine
spaial, cu caracter convenional, prin care se reliefeaz ceea ce este
esenial populaiei statistice care face obiectul cercetrii.
Pentru a fi complet, reprezentarea grafic trebuie s conin urmtoarele
elemente:

titlul graficului, care arat la ce se refer reprezentarea grafic, cu


specificarea locului i perioadei pentru care sunt prezentate datele;
axele de coordonate. Coordonatele pot fi rectangulare sau polare (n
cazul seriilor cronologice);
titlurile interioare, care arat ce se msoar pe fiecare ax de
coordonate.
32

reeaua graficului, format din linii paralele, orizontale i verticale,


trasate explicit sau subnelese, servind la nscrierea simbolurilor i
figurilor. Reelele pot fi aritmetice, logaritmice, semilogaritmice sau
polare;
scara de msur, prin care este stabilit relaia dintre unitatea grafic
de msur i unitatea de msur a variabilei (de exemplu: 1 cm =
100.000 de lei). Se folosesc scri de msur uniforme (scara aritmetic,
n care diviziunile sunt echidistante) sau neuniforme (scara logaritmic,
folosit, n special, pentru reprezentarea grafic a seriilor statistice
cronologice);
legenda, care arat semnificaia simbolurilor folosite n grafic;
sursa datelor;
una sau mai multe note explicative, indicnd ipotezele de lucru avute n
vedere la construirea graficului.
Principalele tipuri de grafice statistice sunt:

diagramele statistice;
histograma;
poligonul frecvenelor;
ogiva;
cartograma;
cronograma;
corelograma.
Diagramele statistice
Principalele tipuri de diagrame statistice sunt:

diagramele prin benzi;


diagramele prin coloane;
diagramele de structur;
diagramele polar;
diagramele n batoane sau bare;
diagramele prin suprafee.
Diagramele prin benzi
Diagramele prin benzi sunt grafice n care datele statistice, grupate prin
metodele de grupare prezentate, sunt reprezentate prin ariile unor
33

dreptunghiuri construite cu bazele pe ordonata unui sistem rectangular de


axe. Dreptunghiurile (benzile) astfel construite sunt desprite prin spaii
egale. Benzile pot fi diferite ntre ele doar prin lungimile lor (limea este
egal pentru toate benzile), acestea variind direct proporional cu mrimile
valorilor reprezentate.
Diagramele prin benzi se folosesc atunci cnd:

ntre valorile reprezentate exist variaii foarte mari;


datele sunt distribuite cronologic inegal.
Pentru exemplificare am ales datele din tabelul 1.4, reprezentate grafic n
figura 1.4.
Tabelul 1.4. Numrul societilor nmatriculate n perioada 1991-1994
Anul

Numarul de societi nmatriculate

1991

95947

1992

137411

1993

117025

1994

75179

Total

425562

N um rul de societi nm atriculate


1994

75179

1993

117025

1992

137411

1991

95947
0

50000

100000

150000

Figura 1.4 Diagrama prin benzi a societilor nmatriculate n


perioada 1991-1994
Diagramele prin coloane
Cu ajutorul diagramelor prin coloane, datele statistice sunt reprezintate tot
prin dreptunghiuri, construite ns pe vertical, cu bazele pe abscis
(coloane).
34

Coloanele difer ntre ele doar prin nlime, aceasta fiind direct
proporional cu mrimea valorilor reprezentate. Diagramele prin coloane
se folosesc cel mai des pentru reprezentarea evoluiei n timp a
fenomenelor studiate. n figura 1.5 sunt reprezentate grafic datele din
tabelul 1.4, optndu-se de aceast dat pentru o diagram prin coloane.

N um rul de societi nm atriculate


150000
137411
117025

100000
95947

75179

50000
0
1991

1992

1993

1994

Figura 1.5 Diagrama prin coloane a societilor nmatriculate n


perioada 1991-1994
Diagramele de structur
Diagramele de structur se folosesc pentru reprezentarea repartiiilor
statistice pe principalele variante considerate. Cu alte cuvinte, sunt puse n
eviden ponderile principalelor pri componente ale populaiei statistice
analizate. Pentru reprezentarea grafic se folosesc diverse figuri
geometrice: cercul, ptratul, dreptunghiul etc. Suprafaa total a figurii
corespunde volumului ntregii populaii statistice, n timp ce suprafeele
diferitelor poriuni ale figurii corespund prilor componente ale populaiei
statistice studiate. n figura 1.6 este reprezentat repartiia pe ani (nu
evoluia n timp!) a societilor nmatriculate n perioada 1991-1994,
conform datelor din tabelul 1.4, diagrama aleas fiind una de tip
"plcint".

N u m r u l d e u n it i n m a tr ic u la te

75179

95947

117025
137411

1991
1992
1993
1994

Figura 1.6 Diagrama de tip plcint a societilor nmatriculate n


perioada 1991-1994
35

n figura 1.7 este redat, tot printr-o diagram de tip plcint, structura
rspunsurilor la ntrebarea Cum apreciai c a fost nivelul de trai n 2006
fa de 2005? pe care compania de cercetare a pieei Daedalus
Consulting a pus-o celor chestionai n cadrul unui studiu de analiz a
percepiei persoanelor din mediul urban cu privire la nivelul de trai din
anul 2006, fa de anul 2005 5 .

Figura 1.7 Structura rspunsurilor la ntrebarea Cum apreciai c a


fost nivelul de trai n 2006 fa de 2005? conform unui studiu
realizat de ctre compania de cercetare a pieei Daedalus Consulting
Diagramele prin batoane sau bare
Diagramele prin batoane sau bare se folosesc tot pentru reprezentarea
structurii populaiei statistice. Ele pot fi confundate cu diagramele prin
coloane.
Se disting ns prin faptul c valorile variabilei statistice se reprezint prin
batoane sau bare verticale care au nlimi care prin nsumare dau valoarea
1 (dac frecvenele relative iau forma coeficienilor) sau 100 (dac
frecvenele relative se exprim prin procente).
Diagrama polar
Se mai numete i diagram radial i se folosete pentru ilustrarea
sezonalitii caracteristice anumitor fenomene statistice studiate. Diagrama
polar se construiete folosind o reea radial.

Rezultatele studiului au fost preluate din ziarul Adevrul, nr. 5189, din 17 martie 2007,
http://www.adevarulonline.ro/articole/oficial-traim-mai-bine/306308

36

Histograma
Histograma se folosete pentru reprezentarea repartiiilor variabilelor
statistice definite pe intervale.
Ea se construiete ntr-un sistem rectangular de axe astfel:

pe abscis se reprezint prin segmente de dreapt mrimile intervalelor


de grupare;
pe ordonat se reprezint prin segmente de dreapt frecvenele
repartiiei statistice;
se construiesc dreptunghiuri care au ca baze segmentele de dreapt ce
reprezint mrimile intervalelor de grupare i nlimi egale cu
segmentele de pe ordonat corespunztoare frecvenelor statistice.
Pentru exemplificare, s presupunem variabila "vechime n munc", pentru
care au fost nregistrate, la nivelul unei firme, valorile din tabelul 1.5. Ca
etap preliminar este necesar construirea repartiiei statistice a
frecvenelor. Pentru aceasta parcurgem urmtorii pai:
a) calculm amplitudinea variabilei statistice:
A = XMAX XMIN = 35 1 = 34 ani
b) stabilim lungimile intervalelor. Alegem mprirea pe intervale egale de
lungime L = 5;
c) calculm numrul de intervale:
k = A : L = 34 : 5 = 6,8 7 intervale
d) construim cele 7 intervale, considernd ca limit minim valoarea 0 i
ca limit maxim valoarea 35. Se obine astfel repartiia frecvenelor
absolute din tabelul 1.6.
Histograma corespunztoare repartiiei din tabelul 1.6 este prezentat n
figura 1.7.
Poligonul frecvenelor
Poligonul frecvenelor este linia poligonal care unete, n cadrul unui
sistem rectangular de axe, punctele de coordonate corespunztoare
valorilor nregistrate de ctre variabila statistic studiat. Se poate construi
i pornind de la histogram prin unirea mijloacelor bazelor de sus ale
dreptunghiurilor acesteia.
Poligonul frecvenelor obinut pe baza repartiiei frecvenelor absolute din
tabelul 1.6 este prezentat n figura 1.9.

37

Tabelul 1.5 Vechimea n munc nregistrat pentru cei 50 de angajai


ai firmei ABC
20
4
6
5
15
23
25
1
2
3

5
30
19
17
7
16
29
23
19
8

3
24
19
10
2
32
18
19
3
9

11
21
1
20
18
35
18
2
9
3

17
16
9
10
27
10
11
3
1
22

Tabelul 1.6 Repartiia variabilei "vechime n munc" pentru cei 50 de


angajai ai firmei ABC
Intervale de variaie (ani)
[0-5]
(5-10]
(10-15]
(15-20]
(20-25]
(25-30]
(30-35]

Frecvene absolute
14
9
3
13
6
3
2

Total

50

Frecvene absolute
15
10

14

13
9

6
3

0
[0-5]

(5-10]

(10-15]

(15-20]

(20-25]

(25-30]

2
(30-35] Ani

Figura 1.8 Histograma vechimii n munc pentru cei 50 de angajai ai


firmei ABC

38

Frecvene absolute

15
10

14

P oligonul frecvenelor

13
9

0
[0-5]

(5-10]

(10-15]

(15-20]

(20-25]

(25-30]

2
(30-35] Ani

Figura 1.9 Poligonul frecvenelor pentru vechimea n munc


nregistrat pentru cei 50 de angajai ai firmei ABC
Ogiva
Ogiva este linia poligonal care unete, n cadrul unui sistem rectangular
de axe, punctele care au ca i coordonate variantele nregistrate de ctre
variabila statistic i frecvenele statistice cumulate determinate pentru
acestea. Acestea din urm se obin prin nsumarea treptat a frecvenelor
absolute sau relative. Frecvenele absolute cumulate pentru repartiia din
tabelul 1.6 sunt calculate n tabelul 1.7. Ogiva obinut pe baza acelorai
valori este prezentat n figura 1.10.
Tabelul 1.7 Frecvene absolute cumulate
Intervale de
[0-5]
(5-10]
(10-15]
(15-20]
(20-25]
(25-30]
(30-35]

Frecvene
14
9
3
13
6
3
2

Total

50

Frecvene absolute
14
23
26
39
45
48
50

Figura 1.10 Ogiva


39

Cartograma i cartodiagrama
Cartogramele sunt grafice care se folosesc pentru evidenierea variaiilor
care apar la nivelul diferitelor uniti statistice teritoriale. Ele se reprezint
direct pe hri i se folosesc n cazul variabilelor statistice teritoriale.
Combinaiile dintre diagrame i cartograme se numesc cartodiagrame.
Cronograma
Cronograma se folosete n cazul seriilor statistice cronologice. Ea este, de
fapt, o diagram pentru care una dintre axe este axa timpului.
Corelograma
Corelograma se folosete pentru evidenierea legturilor statistice dintre
fenomenele cercetate. Este o diagram pentru care pe cele dou axe sunt
reprezentate cele dou variabile supuse cercetrii din punctul de vedere al
legturii statistice dintre ele.
Cel mai des se folosete metoda grafic a "norului de puncte". "Punctele"
au ca i coordonate perechile de valori pe care le nregistreaz cele dou
variabile studiate din punctul de vedere al corelaiei statistice.
n figura 1.11 este reprezentat un astfel de nor de puncte pentru
evidenierea legturii statistice dintre variabila "cheltuieli cu reclama" i
variabila "vnzri", ale cror valori au fost nregistrate pentru un numr de
8 companii.

1200

Vnzri totale

1000
800
600
400
200
0
0

10

20

30

40

50

60

70

C h e ltu ie li c u re c la m a

Figura 1.11 Corelograma legturii statistice dintre variabilele


"cheltuieli cu reclama" i "vnzri" pentru 8 companii studiate

40

EXPRIMAREA N MRIMI
RELATIVE A
INFORMAIILOR
STATISTICE

2.

OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate mrimile relative disponibile pentru descrierea
comparativ a colectivitilor statistice, ajutndu-v:
s reinei principalele tipuri de mrimi relative disponibile pentru descrierea
statistic;
s nelegei, prin apelul la exemple, utilitatea apelului la mrimile relative n
cercetarea statistic;
s nelegei cum se alege unitatea de msur statistic n funcie de mrimile
relative la care se face apel.

n demersul statistic sunt necesare deseori comparaii prin care se


evideniaz:
relaii cantitative
considerate;

manifestate

ntre

diferite

variabile

statistice

relaii cantitative manifestate ntre diferite pri ale colectivitilor


statistice studiate;
dinamica manifestat la nivelul colectivitilor statistice studiate;
relaii cantitative ntre diferite fenomene supuse studiului.
Prin compararea sub form de raport (cel mai des) sau diferen, a dou
valori se exprim proporiile unora fa de celelalte (acestea din urm fiind
stabilite, astfel, ca baze de raportare).
Forma de exprimare a rezultatelor obinute n urma comparrii trebuie
aleas n funcie de diferenele de proporie dintre valorile comparate.
Astfel, atunci cnd valoarea de comparat este mai mare dect valoarea
fixat ca baz de comparaie, rezultatele se vor exprima n uniti.
Dac valoarea de comparat este mai mic dect valoarea fixat ca baz de
comparaie, rezultatele se vor exprima, cel mai des, n coeficieni sau
procente. Se alege exprimarea n procente dac se urmrete descrierea
structurii sau a dinamicii fenomenului studiat. Procentele se obin prin
nmulirea cu 100 a rezultatelor, obinndu-se astfel comparaii la 100 de
uniti.
Dac valoarea de comparat este de mii, de zeci de mii sau de sute de mii de
ori mai mic dect valoarea fixat, exprimarea se va face n promile,
prodecimile sau procentimile. Se obin astfel comparaii la 1.000, 10.000
sau 100.000 de uniti, valorile indicatorilor obinndu-se prin nmulirea
rezultatelor cu 1.000, 10.000 sau 100.000. De exemplu, se exprim n
promile eficiena folosirii activelor fixe msurat prin indicatorul care arat
valoarea produciei ce revine la 1.000 lei active fixe. n prodecimi se va
exprima proporia studenilor n ansamblul populaiei, msurat prin
indicatorul care arat numrul studenilor ce revin la 10.000 de locuitori. n
sfrit, este necesar exprimarea n procentimi a dezvoltrii comerciale n
mediul rural, msurat prin indicatorul care arat numrul de magazine ce
revin la 100.000 de locuitori din mediul rural.
nainte de efectuarea calculelor pe care le presupune evidenierea, prin
recursul la mrimile relative, a diferitelor relaii cantitative care intereseaz
n demersul statistic, trebuie verificat ndeplinirea condiiei de
comparabilitate a fenomenelor studiate.
Condiia de comparabilitate se verific n timp, n spaiu, i/sau dup alte
criterii specifice. Verificarea condiiei de comparabilitate a fenomenelor
studiate constituie premisa alegerii corecte a bazei de comparaie.
43

Comparabilitatea este dat de o legtur logic ntre fenomenele studiate,


legtur care poate fi de condiionare, de coresponden, de cauzalitate sau
de alt natur.
Nerespectarea condiiei de comparabilitate este cauzat cel mai des de:
definiri diferite ale noiunilor din programul de observare statistic;
modificri de structur ale populaiilor supuse observaiei;
modificri n modul de culegere i prelucrare a datelor statistice;
folosirea unor preuri diferite;
folosirea unor surse de informaii diferite.
Dac nu se pot nltura diferenele de coninut sau de form de exprimare
ale valorilor de comparat, diferene care afecteaz comparabilitatea
acestora, este necesar renunarea la folosirea mrimilor relative,
menionndu-se doar, alturate, valorile nregistrate pentru fenomenele n
cauz.
Mrimile relative se pot grupa n:
mrimi relative de structur;
mrimi relative de coordonare (denumite i de coresponden);
mrimi relative de dinamic (nregistrat, planificat i, respectiv,
realizat);
mrimi relative de intensitate.
2.1. Mrimile relative de structur
Atunci cnd criteriile de analiz statistic impun mprirea colectivitii
statistice n mai multe grupe, sunt utile informaiile privind structura
acesteia.
S exemplificm utilitatea unor asemenea informaii pornind de la
urmtoarele date statistice privind acoperirea cu localitilor din Romnia
cu reele de distribuie a gazului natural. Conform datelor furnizate de
Autoritatea Naional de Reglementare n domeniul Gazelor Naturale
(ANRGN), din cele 3.140 de localiti (municipii, orae, comune)
nregistrate n Romnia, doar 1.822 aveau, la finele anului 2006, sisteme de
distribuie a gazelor naturale puse n funciune, n timp ce 665 de localiti
au fost conectate la reeaua de distribuie a gazelor naturale n perioada
2000-2006 1 . Pe baza acestor date se pot obine urmtoarele date statistice
derivate:

Adevrul, nr. 5196, din 26 Martie 2007.

44

a) la sfritul anului 2006, circa 58% din localitile din Romnia erau
alimentate cu gaze naturale:

b) n perioada 2000-2006, au fost conectate la reeaua de distribuie a


gazelor naturale circa 21% din localitile din Romnia:

Aceste dou reazultate sunt exemple de mrimi relative de structur, adic


de expresii numerice ale unor comparaii de tip parte-ntreg. Atunci cnd
sunt vizate frecvenele de apariie, rezultatele comparaiilor de tip partentreg constau n frecvenele relative nregistrate. Atunci cnd sunt vizate
nivelurile nregistrate, rezultatele comparaiilor de tip parte-ntreg constau
n ponderi nregistrate.
n tabelul 2.1 sunt prezentate relaiile disponibile pentru determinarea
mrimilor relative de structur la nivelul unei colectiviti statistice studiate
dup o variabil statistic X.
Tabelul 2.1 Relaii disponibile pentru determinarea mrimilor relative
de structur
Pentru comparaii Pentru comparaii
de frecvene
de volum la
nivelul unei serii
statistice

Pentru comparaii
de volum la nivelul
unei repartiii
statistice

unde:
Ri reprezint frecvena relativ de apariie a variantei i a variabilei X;
Fi = frecvena absolut de apariie a variantei i a variabilei X
Gi = ponderea nregistrat de varianta i a variabilei X;
Xi = nivelul nregistrat de variabila X n varianta i.
45

2.2. Mrimile relative de coordonare (coresponden)


Mrimile relative de coordonare, denumite i mrimi relative de
coresponden, se folosesc atunci cnd se compar ntre ele dou grupe
diferite ale colectivitii statistice studiate.
Prin urmare, mrimile relative de coordonare sunt expresii numerice ale
unor comparaii de tip parte-parte, dup o relaie de tipul:

unde:
A i B reprezint nivelurile sau frecvenele nregistrate pentru grupele
comparate.
2.3. Mrimile relative de dinamic
Mrimile relative de dinamic se folosesc pentru caracterizarea evoluiei
nregistrate sau dorite n timp a fenomenului studiat.
Mrimile relative de dinamic sunt expresii numerice ale comparaiilor
pentru dou momente sau perioade de timp diferite. Ele se mai numesc i
indici ai dinamicii.
Tabelul 2.2 Relaii de calcul folosite pentru calculul mrimilor relative
de dinamic
Mrimi relative de
Mrimi relative de
dinamic nregistrat dinamic planificat

Mrimi relative de
dinamic realizat

unde:
V1 reprezint o valoare (nivel sau frecven) nregistrat la momentul
sau pentru perioada curent;
V0 = o valoare (nivel sau frecven) nregistrat la momentul sau
pentru perioada care s-a ales ca baz de comparaie;
VPL = o valoare (nivel sau frecven) planificat pentru un moment sau
o perioad de timp din viitor.

46

Comparaiile se pot realiza i fa de valori planificate, obinndu-se astfel


statistici comparative de dinamic planificat. Prin comparaii ale valorilor
realizate cu cele planificate se obin mrimi relative de dinamic realizat,
care ofer informaii utile pentru aprecierea eficienei managementului
diferitelor activiti social-economice.
Relaiile care se pot folosi pentru calculul mrimilor relative de dinamic
sunt prezentate n tabelul 2.2.
2.4. Mrimi relative de intensitate
Mrimile relative de intensitate sunt expresii ale comparaiilor ntre valori
nregistrate pentru fenomene de natur diferit, dar ntre care exist o
anumit relaie de interdependen.
Natura diferit a fenomenelor pentru care se realizeaz comparaii
determin necesitatea exprimrii mrimilor relative de intensitate n uniti
de msur complexe.
De pild, pentru statistica de intensitate productivitatea orar a muncii la
nivelul unei secii productive, n condiiile exprimrii cantitii de produse
obinute n buci i a cantitii de munc n numr de ore, este necesar
exprimarea rezultatului cu ajutorul unitii de msur complexe
"buci/or".

47

48

DESCRIEREA STATISTIC
A TENDINEI CENTRALE:
STATISTICILE MEDII

3.

OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile medii disponibile pentru descrierea
statistic a tendinei centrale, ajutndu-v:
s nelegei coninutul informaional al celor 4 statistici medii importante:
media aritmetic, media geometric, media ptratic i media armonic;
s contientizai limitele statisticilor medii n ce privete reprezentativitatea lor
pentru colectivitatea statistic studiat;
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor medii.

Tendina central care se manifest n comportamentul unitilor unei


colectiviti statistice se poate descrie cu ajutorul statisticilor medii i a
statisticilor de poziie. Cele dou tipuri de statistici ofer informaii
complementare.
Statisticile medii
Statisticile medii sunt valori reprezentative din punctul de vedere al
diferitelor rezultate algebrice semnificative pentru demersul de descriere
statistic: suma, produsul, suma ptratelor i suma inverselor. Celor 4
rezultate algebrice le corespund urmtoarele statistici medii:
media aritmetic;
media geometric;
media ptratic;
media armonic.
3.1. Media aritmetic
Media aritmetic este valoarea reprezentativ din punctul de vedere al
sumei valorilor nregistrate. Concret, aceasta nseamn c prin nlocuirea
tuturor valorilor nregistrate cu media lor aritmetic, suma lor nu se
modific.
S considerm, de pild, o firm cu 5 angajai, ale cror salarii sunt, n
ordine cresctoare, de 620, 675, 710, 735 i 760 RON. Aceste salarii
determin un fond de salarii 1 de 3.500 RON. ntruct din acest fond cei 5
angajai ar putea fi retribuii n mod egal cu cte 700 RON, nseamn c
acest nivel de salarizare reprezint nivelul mediu al salariilor din cadrul
firmei (nlocuirea tuturor salariilor iniiale cu salariul mediu nu ar modifica
fondul de salarii al firmei).
Calculul mediei aritmetice pentru un ir de valori
Din definiia mediei aritmetice rezult uor relaiile de calcul ale acesteia,
prin egalizarea sumei valorilor nregistrate cu suma care ar rezulta n urma
nlocuirii tuturor cu valoarea mediei lor aritmetice. Considernd, astfel, o
variabil X pentru care s-a nregistrat irul de valori X1, X2 XN, media
aritmetic () se poate determina pornind de la egalitatea:
Sum (X1, X2 XN) = Sum (, )
Folosind simbolurile matematice obinuite:
1

Fondul de salarii este egal cu suma salariilor.

51

S calculm, de exemplu, vechimea medie n munc a celor 50 de angajai


ai firmei ABC, pentru care valorile individuale ale vechimii n munc
sunt redate n tabelul 1.5:

Calculul mediei aritmetice pentru repartiii statistice dup variabile


discrete
n calculul mediei aritmetice pentru repartiii statistice discrete, se ine cont
de frecvenele (absolute sau relative) nregistrate pentru fiecare dintre
variantele discrete care definesc variabilele statistice:

52

unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
S presupunem, de exemplu, c n urma unei cercetri statistice asupra
unui eantion de 20 familii, s-au centralizat datele din tabelul 3.1,
privitoare la variabila discret numr de copii / familie:
Tabelul 3.1
Numr de copii (X)

Total

Numr de familii
(Frecvene absolute, F)

20

0,20

0,30

0,40

0,05

0,05

Frecvene relative,

Pentru a afla ci copii revin n medie familiilor din eantionul supus


observaiei, trebuie mprit numrul total de copii la numrul total de
familii care fac parte din eantion.
Numrul total de copii al familiilor din eantionul ales se obine prin
ponderarea variantelor (discrete) nregistrate de ctre variabila studiat
(variabila numr de copii, notat cu X) cu frecvenele de apariie
constatate (F).
53

Prin urmare, media aritmetic se determin ca o medie aritmetic


ponderat:

Sunt de reinut dou observaii:


relaia de calcul a mediei aritmetice ponderate se poate reduce la relaia
de calcul a mediei aritmetice pentru un ir de valori;
valoarea obinut are n primul rnd o semnificaie statistic, relevant
mai ales n comparaiile cu mediile nregistrate la nivelul altor
colectiviti statistice de interes.
Calculul mediei aritmetice pentru repartiii statistice dup variabile
continue
Pentru repartiii statistice continue, media aritmetic se calculeaz cu
ajutorul relaiei:

unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
54

Estimarea mediei aritmetice pentru repartiii statistice dup variabile


continue definite pe intervale
Pentru repartiii statistice continue definite pe intervale, media aritmetic
se poate aproxima cu media aritmetic a mediilor convenionale ale
intervalelor, ponderate cu frecvenele (abolute sau relative) nregistrate;
mediile convenionale ale intervalelor sunt mediile capetelor acestora,
adic centrele intervalelor:

unde C este variabila centrelor intervalelor care definesc variabila


statistic;
F = frecvenele absolute nregistrate pe intervale;
R = frecvenele relative nregistrate pe intervale.
De exemplu, vechimea medie n munc a celor 50 de angajai ai firmei
ABC, pentru care s-a obinut distribuia din tabelul 1.6, se determin pe
baza tabelului 3.2.
Tabelul 3.2
Intervale Centre ale Frecvene Frecvene Centre
Centre
de
intervalelor absolute relative ponderate ponderate
variaie de variaie
(F)
(R)
cu
cu
(ani)
(C)
frecvenele frecvenele
absolute
relative
(CF)
(CR)
[0-5]

2,5

14

0,28

35,0

0,70

(5-10]

7,5

0,18

67,5

1,35

(10-15]

12,5

0,06

37,5

0,75

(15-20]

17,5

13

0,26

227,5

4,55

(20-25]

22,5

0,12

135,0

2,70

(25-30]

27,5

0,06

82,5

1,65

(30-35]

32,5

0,04

65,0

1,30

50

1,00

650,0

13,00

Total

Pe baza datelor din tabelul 3.2, rezult:


55

Se constat o diferen de 0,6 ani ntre estimarea mediei aritmetice cu


media aritmetic ponderat (= 13 ani) i valoarea (real) a mediei
aritmetice, calculat pentru cele 50 de valori cunoscute (= 13,6 ani a se
vedea paragraful privind Calculul mediei aritmetice pentru un ir de
valori). Concluzia care se poate formula este aceea c atunci cnd datele
statistice sunt culese grupat, statisticile nu se pot calcula dect cu o anumit
aproximaie.
Proprieti ale mediei aritmetice
Fiind o valoare numeric, media aritmetic se poate calcula doar pentru
serii statistice cu valori numerice;
Mrimea mediei aritmetice este unic, o serie neputnd fi caracterizat
de dou sau mai multe medii aritmetice;
Media aritmetic a unui ir de valori egale cu o constant (a) este egal
cu acea constant:

56

Media aritmetic a sumei/diferenei dintre dou variabile, este egal cu


suma/diferena mediilor aritmetice ale celor dou variabile:

unde X i Y sunt dou variabile statistice pentru care s-a nregistrat un


acelai numr (N) de valori.
O consecin a celor 2 proprieti anterioare const n faptul c
adugarea sau scderea unei constante la toate valorile unui ir de
observaii statistice determin creterea sau scderea mediei lor
aritmetice cu aceeai constant:

unde a este o constant;


Multiplicarea (sau divizarea) cu o constant a tuturor valorilor
nregistrate de o variabil statistic (X) determin multiplicarea sau
divizarea cu aceeai constant a mediei sale aritmetice:

Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor


absolute (F) ale unei distribuii statistice nu produce modificri n ce
privete mrimea mediei aritmetice ponderate 2 :

unde b este o constant;

n cazul repartiiilor statistice definite pe intervale, sunt considerate cemtrele intervalelor:

57

Suma abaterilor dintre valorile individuale nregistrate i media lor


aritmetic este nul. Aceast proprietate deriv din nsi definiia
mediei aritmetice 3 :

Media aritmetic este sensibil la aa-numitele valori aberante sau


deplasate. Valorile aberante sunt valori nereprezentative pentru
eantionul sau populaia care face obiectul cercetrii statistice. De
exemplu, pentru irul de valori (1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 80) media
aritmetic este egal cu 8,92. Dac s-ar elimina valoarea aberant sau
nereprezentativ 80 (foarte deplasat de celelalte), media aritmetic a
valorilor rmase ar fi egal cu 2,45, valoare cu mult mai reprezentativ
pentru irul de valori considerat. Este astfel necesar verificarea atent a
reprezentativitii statisticilor obinute n urma unei cercetri. Dac
datele sunt colectate corespunztor i apar totui valori aberante, este
indicat calculul mediilor pariale, adic pentru fiecare tip calitativ al
variabilei statistice studiate.
3.2. Media geometric
Media geometric este valoarea reprezentativ din punctul de vedere al
produsului valorilor nregistrate. Concret, aceasta nseamn c prin
nlocuirea tuturor valorilor nregistrate cu media lor geometric, produsul
lor nu se modific.
Prin urmare, media geometric este util doar atunci cnd produsul
valorilor nregistrate are semnificaie n cadrul cercetrii realizate. De
exemplu, s presupunem c un plasament financiar a adus un profit de
10% n anul 2004, de 50% n anul 2005 i de 30% n anul 2006. Rata
medie a profitului obinut n perioada 2004-2006 pe seama acestui
plasament financiar nu se poate calcula ca o medie aritmetic, ci ca o
medie geometric, ntruct valorile procentuale anuale ale ratelor de profit
nregistrate (10%, 50% i 30%) sunt valori care arat multiplicarea de la
un an la altul a investiiei financiare realizate. Astfel, suma de bani
investit la nceput s-a multiplicat pn la sfritul anului 2004 de 1,10 ori,
suma astfel obinut s-a multiplicat n 2005 de 1,50 ori, iar ceea ce a
rezultat s-a mai multiplicat n 2006 de 1,30 ori. Dac notm cu s suma de
3

Definiia mediei aritmetice se regsete n relaia (a se vedea paragraful privind calculul mediei
aritmetice pentru un ir de valori):

58

bani investit la nceputul perioadei 2004-2006, cu S suma de bani de la


sfritul acestei perioadei, adic de la sfritul anului 2006, i cu X
variabila multiplicrilor anuale ale sumei investite, atunci exist
urmtoarea relaie:

Se observ c valoarea 1,2897 poate nlocui valorile individuale ale


multiplicrilor anuale, ea fiind media geometric a acestora.
Media geometric este util n descrierea statistic a dinamicii unui
fenomen studiat prin intermediul indicilor de dinamic. Mai precis, este
vorba despre relaia dintre indicii cu baz fix i cei cu baz n lan.
S considerm, de exemplu, dinamica salariului mediu net pe economie n
primele 9 luni ale anului 2006, redat n tabelul 3.3.
Tabelul 3.3
Luna

Salariu
mediu net
(RON)

Indici cu baz fix


(prin raportare la
luna ianuarie)

Indici cu baz n lan


(prin raportare la
luna precedent)

ianuarie

826

1,0000000

februarie

767

0,9285714

0,9285714

martie

828

1,0024213

1,0795306

aprilie

839

1,0157385

1,0132850

mai

833

1,0084746

0,9928486

iunie

835

1,0108959

1,0024010

iulie

842

1,0193705

1,0083832

august

841

1,0181598

0,9988124

septembrie

860

1,0411622

1,0225922
1,0411622

Produs

59

Dup cum se observ n tabelul 3.3, produsul indicilor cu baz n lan este
egal cu ultimul indice cu baz fix. Aceasta nseamn c dac toi indicii cu
baz n lan ar fi egali cu media lor geometric, indicele de dinamic
nregistrat pentru ntreaga perioad a celor 9 luni nu s-ar modifica (a se
vedea tabelul 3.4).
Calculul mediei geometrice pentru un ir de valori
Din definiia mediei geometrice rezult uor relaiile de calcul ale acesteia,
prin egalizarea produsului valorilor nregistrate cu produsul care ar rezulta
n urma nlocuirii tuturor cu valoarea mediei lor geometrice. Considernd,
astfel, o variabil X pentru care s-a nregistrat irul de valori X1, X2 XN,
media geometric (g) se poate determina pornind de la egalitatea:
Produs (X1, X2 XN) = Produs (g, g g)
Folosind simbolurile matematice obinuite:

n tabelul 3.4 este calculat indicele mediu de dinamic a salariului mediu


net pentru primele 9 luni ale anului 2006.
Tabelul 3.4
Luna

Salariu mediu
Indici cu
net (RON)
baz n lan

ianuarie
februarie
martie
aprilie
mai
iunie
iulie
august
septembrie
Produs
Medie geometric

826
767
828
839
833
835
842
841
860

0,9285714
1,0795306
1,0132850
0,9928486
1,0024010
1,0083832
0,9988124
1,0225922
= 1,0411622
= 1,0050549
60

Salariu net n ipoteza unei


dinamici constante (RON)
826,00
826,00 1,0050549 = 830,18
830,18 1,0050549 = 834,37
834,37 1,0050549 = 838,59
838,59 1,0050549 = 842,83
842,83 1,0050549 = 847,09
847,09 1,0050549 = 851,37
851,37 1,0050549 = 855,67
855,67 1,0050549 = 860,00

Cu ajutorul indicelui mediu de dinamic astfel calculat, se pot determina


nivelurile pe care le-ar fi nregistrat salariului net n cele 9 luni, n ipoteza
unei dinamici constante (a se vedea ultima coloan a tabelului 3.4).
Calculul mediei geometrice pentru repartiii statistice dup variabile
discrete
n calculul mediei geometrice pentru repartiii statistice discrete, se ine
cont de frecvenele (absolute sau relative) nregistrate pentru fiecare dintre
variantele care definesc variabilele statistice:

Xi reprezint valoarea i nregistrat de variabila X;


Xj = varianta discret j care definete variabila X;
61

Fj = frecvena absolut de apariie a variantei discrete Xj;


F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
S presupunem, de exemplu, o firm al crei profit a nregistrat dinamica
prezentat n tabelul 3.5.
Tabelul 3.5
2000

2001

2002

2003

2004

2005

Profit realizat
(mil. RON)

12

24

60

150

Indici de
dinamic cu
baz n lan

1,2

2,5

2,5

Anul

n tabelul 3.6 este prezentat repartiia celor 5 indici cu baz n lan ai


dinamicii nregistrate de profitul firmei.
Tabelul 3.6
1,2

2,5

Total

Frecvene absolute (F)

Frecvene relative (R)

0,2

0,4

0,4

Indici de dinamic cu baz n lan

Pe baza acestei repartiii, putem calcula indicele mediu de dinamic a


profitului ca o medie geometric ponderat a indicilor de dinamic cu baz
n lan:

62

Estimarea mediei geometrice pentru repartiiile statistice dup variabile


continue definite pe intervale
Pentru repartiiile statistice dup variabile continue definite pe intervale,
media geometric se poate aproxima cu media geometric a centrelor
intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:

unde C este variabila centrelor intervalelor care definesc variabila


statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt
frecvenele relative nregistrate pe intervale.
Proprieti ale mediei geometrice
Fiind o valoare numeric, media geometric se poate calcula doar
pentru variabile numerice;
Mrimea mediei geometric este unic, un ir de valori neputnd fi
caracterizat de dou sau mai multe medii geometrice;
Calculul mediei geometrice are sens numai atunci cnd ntre termenii
seriei exist o relaie de produs (multiplicativ);
Dac cel puin o valoare a seriei este nul sau negativ, calculul mediei
geometrice este lipsit de sens;
Media geometric este mai mic sau egal cu media aritmetic a
acelorai valori:

Aceast proprietate este exemplificat pentru datele din tabelul 3.2,


reluate n tabelul 3.7.

63

Tabelul 3.7
Intervale de
variaie (ani)

CR

[0-5]

2,5

14

0,28

1,2925

(5-10]

7,5

0,18

1,4372

(10-15]

12,5

0,06

1,1636

(15-20]

17,5

13

0,26

2,1047

(20-25]

22,5

0,12

1,4530

(25-30]

27,5

0,06

1,2200

(30-35]

32,5

0,04

1,1494

50

1,00

Total

Produs

9,2691

Media geometric este mai mic dect media aritmetic:

Media geometric a unei variabile X este egal cu valoarea exponenial


a mediei aritmetice a variabilei X logaritmate:

Aceast proprietate este util pentru calculul simplificat al mediei


geometrice 4 . Pentru exemplificare, n tabelul 3.8 sunt reluate datele din
tabelul 3.2.

n cazul repartiiilor statistice se va recurge, desigur, la ponderarea cu frecvenele absolute (F) sau
relative (R):

64

Tabelul 3.8.
Intervale de
variaie (ani)

lnC

[0-5]

2,5

14

0,28

0,9163

0,2566

(5-10]

7,5

0,18

2,0149

0,3627

(10-15]

12,5

0,06

2,5257

0,1515

(15-20]

17,5

13

0,26

2,8622

0,7442

(20-25]

22,5

0,12

3,1135

0,3736

(25-30]

27,5

0,06

3,3142

0,1989

(30-35]

32,5

0,04

3,4812

0,1392

50

1,00

Total

(lnC)R

2,2267

Media geometric este:

Produsul raporturilor dintre valorile individuale nregistrate i media lor


geometric este egal cu 1. Aceast proprietate deriv din definiia
mediei geometrice:

Pentru repartiiile statistice dup variabile continue definite pe intervale, relaia se va aplica asupra
centrelor intervalelor (C):

65

Media geometric a produsului/raportului dintre dou variabile, este


egal cu produsul/raportul mediilor geometrice ale celor dou
variabile 5 :

Aceast proprietate este exemplificat pentru dou variabile (X i Y) n


tabelul 3.9.
Tabelul 3.9
X
23
34
21
27
36
15962184

Y
11,2
12,3
13,4
12,6
11,8
274460,9

XY
257,6
418,2
281,4
340,2
424,8
4380995404483,25

X/Y
2,05
2,76
1,57
2,14
3,05
58,16

27,58

12,24

337,53

2,25

produs/raport medii geometrice

337,53

2,25

produs

O consecin a proprietii anterioare const n faptul c multiplicarea


sau divizarea cu o constant a tuturor valorilor unui ir de observaii
statistice determin multiplicarea sau divizarea cu aceeai constant a
mediei lor geometrice 6 ;

Pentru ca proprietatea s fie aplicabil, se impune condiia ca cele 2 variabile s fie definite de acelai
numr de variante observate.

Proprietatea rezult prin nlocuirea, n relaiile proprietii anterioare, a variabilei Y cu o constant.

66

Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor


absolute (F) ale unei distribuii statistice nu produce modificri n ce
privete mrimea mediei geometrice ponderate 7 :

unde b este o constant;


Media geometric este afectat mai tare de valorile mai mici
nregistrate. n consecin, media geometric se calculeaz deseori
pentru punerea n eviden a valorilor mai mici nregistrate;
Media geometric se aplic i atunci cnd fenomenul studiat are o
evoluie aproximativ exponenial. Cel mai des, media geometric se
utilizeaz pentru determinarea indicilor i ritmurilor medii ale
dinamicii;
Ca i media aritmetic, media geometric este sensibil la valorile
aberante nregistrate.
3.3. Media ptratic
Media ptratic este valoarea reprezentativ din punctul de vedere al sumei
ptratelor valorilor nregistrate. Concret, aceasta nseamn c prin
nlocuirea tuturor valorilor nregistrate cu media lor ptratic, suma
ptratelor acestora nu se modific.
Utilitatea cea mai important a mediei ptratice este n legtur cu
determinarea varianei sau dispersiei statistice (a se vedea capitolul 6
Descrierea statistic a variaiei).
Calculul mediei ptratice pentru un ir de valori
Din definiia mediei ptratice rezult relaiile de calcul ale acesteia, prin
egalizarea sumei ptratelor valorilor nregistrate cu suma ptratelor care ar
rezulta n urma nlocuirii tuturor cu valoarea mediei lor ptratice.
Considernd, astfel, o variabil X pentru care s-a nregistrat setul de valori
7

n cazul repartiiilor statistice definite pe intervale, sunt considerate cemtrele intervalelor:

67

X1, X2 XN, media ptratic (p) se poate determina pornind de la


egalitatea:
Sum de ptrate (X1, X2 XN) = Sum de ptrate (p, p p)
Folosind simbolurile matematice obinuite:

Calculul mediei ptratice pentru repartiii statistice dup variabile


discrete
Pentru o repartiie statistic discret, media ptratic se calculeaz ca o
medie ptratic a variantelor discrete ponderate fie cu frecvenele absolute,
fie cu frecvenele relative:

68

unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
Calculul mediei ptratice pentru repartiii statistice dup variabile
continue
Pentru distribuiile statistice continue, media ptratic se calculeaz cu
ajutorul relaiei:

unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
Estimarea mediei ptratice pentru repartiii statistice dup variabile
continue definite pe intervale
Pentru repartiiile statistice continue dup variabile definite pe intervale,
media ptratic se poate aproxima cu media ptratic a centrelor
intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:

69

unde C este variabila centrelor intervalelor care definesc variabila


statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt
frecvenele relative nregistrate pe intervale.
Proprieti ale mediei ptratice
Fiind o valoare numeric, media ptratic se poate calcula doar pentru
variabile numerice;
Pentru un set de valori, media ptratic este unic;
Ptratul mediei ptratice pentru un set de valori este egal cu media
aritmetic a ptratelor acestor valori:

Aceast proprietate rezult direct din definiia mediei ptratice;


Media ptratic este mai mare sau egal cu media aritmetic a acelorai
valori:

Aceast proprietate este exemplificat pentru datele din tabelul 3.2,


reluate n tabelul 3.10. Pentru repartiia statistic din acest tabel, se
poate constata c media ptratic este mai mare dect media aritmetic:

70

Tabelul 3.10
Intervale de
variaie (ani)

C2

[0-5]

2,5

6,25 14

(5-10]

7,5

56,25

(10-15]

12,5

156,25

(15-20]

C2F

C2R

0,28

87,50

1,750

0,18

506,25

10,125

0,06

468,75

9,375

17,5

306,25 13

0,26

3981,25

79,625

(20-25]

22,5

506,25

0,12

3037,50

60,750

(25-30]

27,5

756,25

0,06

2268,75

45,375

(30-35]

32,5

1056,3

0,04

2112,50

42,250

50

1,00

12462,50

249,250

Total

Multiplicarea sau mprirea cu o constant a tuturor valorilor


nregistrate pentru o variabil statistic determin multiplicarea sau
divizarea cu aceeai constant a mediei ptratice a acesteia:

unde a este o constant;


Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor
absolute care caracterizeaz o repartiie statistic dup o variabil X, nu
produce modificri n ce privete mrimea mediei ptratice (ponderate) 8
a variabilei X:

n cazul repartiiilor statistice dup variabile continue definite pe intervale, sunt considerate cemtrele
intervalelor:

71

unde b este o constant;


Pentru orice variabil X, ptratul mediei ptratice este egal cu suma
dintre ptratul mediei aritmetice a variabilei X i ptratul mediei
ptratice a abaterilor nregistrate fa de media aritmetic a variabilei
X9:

Ptratul mediei ptratice a abaterilor nregistrate fa de media aritmetic se numete dispersie sau
varian statistic (a se vedea capitolul 6, Descrierea statistic a variaiei).

72

unde (X) reprezint media ptratic a variabilei abaterilor (D)


nregistrate fa de media aritmetic 10 .
Aceast proprietate poate fi considerat ca argument pentru cea de-a 4-a
proprietate (p ).
Media ptratic este influenat ntr-o msur foarte mare de valorile
individuale mai mari. Din acest motiv, ea se calculeaz deseori atunci
cnd se dorete punerea n eviden a valorilor individuale mai mari;
Ca i celelalte medii, media ptratic este sensibil la valorile aberante
nregistrate.
3.4. Media armonic
Media armonic este valoarea reprezentativ din punctul de vedere al
sumei inverselor valorilor nregistrate. Concret, aceasta nseamn c prin
nlocuirea tuturor valorilor nregistrate cu media lor armonic, suma
inverselor acestora nu se modific.
Media armonic se folosete n cazul unor colecii de valori pariale sau de
mrimi relative de structur. n economie, este utilizat, de exemplu, n
10

D = X (X)

73

calculul indicelui mediu armonic al preurilor.


Calculul mediei armonice pentru un ir de valori
Din definiia mediei armonice rezult relaiile de calcul ale acesteia, prin
egalizarea sumei inverselor valorilor nregistrate cu suma inverselor care ar
rezulta n urma nlocuirii tuturor cu valoarea mediei lor armonice.
Considernd, astfel, o variabil X pentru care s-a nregistrat setul de valori
X1, X2 XN, media armonic (h) se poate determina pornind de la
egalitatea:
Sum de inverse (X1, X2 XN) = Sum de inverse (h, h h)
Folosind simbolurile matematice obinuite:

S presupunem, de exemplu, c o persoan parcurge distana de 10 km.


astfel:
5 km cu viteza de 40 km./h.;
3 km cu viteza de 20 km./h.;
2 km cu viteza de 4 km./h.
Viteza medie cu care persoana parcurge ntreaga distan de 10 km. trebuie
calculat ca o medie armonic (ponderat):

Dac toat distana ar fi fost parcurs cu aceast vitez medie, durata de


timp necesar pentru aceasta ar fi fost egal cu:

74

Aceast durat de timp este echivalent cu durata de timp necesar pentru


parcurgerea distanei cu cele 3 viteze diferite, aa cum se poate observa n
tabelul 3.11.
Tabelul 3.11
Distan (km.)

Vitez (km./h.)

Durat de timp necesar (h.)

40

5/40 = 0,125

20

3/20 = 0,150

2/4 = 0,500

Total

0,775

Calculul mediei armonice pentru repartiii statistice dup variabile


discrete
Pentru o repartiie statistic dup o variabil discret, media armonic, la
fel ca toate celelalte medii statistice, se calculeaz ca medie armonic a
variantelor ponderate fie cu frecvenele absolute, fie cu frecvenele
relative:

75

unde:
Xi reprezint valoarea i nregistrat de variabila X;
Xj = varianta discret j care definete variabila X;
Fj = frecvena absolut de apariie a variantei discrete Xj;
F = variabila frecvenelor absolute de apariie a variantelor discrete ale
variabilei X;
R = variabila frecvenelor relative de apariie a variantelor discrete ale
variabilei X;
k = numrul de variante discrete care definesc variabila statistic X.
Calculul mediei armonice pentru repartiii statistice dup variabile
continue
Pentru repartiii statistice dup variabile continue, media armonic se
calculeaz cu ajutorul relaiei:

unde:
f(X) este funcia care definete variabila continu X;
m = limita inferioar de variaie a variabilei X;
M = limita superioar de variaie a variabilei X.
Estimarea mediei armonice pentru repartiii statistice dup variabile
continue definite pe intervale
Pentru repartiii statistice dup variabile continue definite pe intervale,
media armonic se poate aproxima cu media armonic a centrelor
intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:
76

unde C este variabila centrelor intervalelor care definesc variabila


statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt
frecvenele relative nregistrate pe intervale.
Proprieti ale mediei armonice
Fiind o valoare numeric, media armonic se poate calcula doar pentru
variabile numerice;
Mrimea mediei armonice este unic, un ir de valori neputnd fi
caracterizat de dou sau mai multe medii armonice;
Pentru aceleai valori, media armonic este cea mai mic dintre cele 4
medii statistice calculate:

Aceast proprietate este exemplificat pentru datele din tabelul 3.2,


reluate n tabelul 3.11.
Tabelul 3.11
Intervale de
variaie (ani)

1/C

(1/C)F

(1/C)R

[0-5]

2,5

0,4000

14

0,28

5,6000

0,1120

(5-10]

7,5

0,1333

0,18

1,2000

0,0240

(10-15]

12,5

0,0800

0,06

0,2400

0,0048

(15-20]

17,5

0,0571

13

0,26

0,7429

0,0149

(20-25]

22,5

0,0444

0,12

0,2667

0,0053

(25-30]

27,5

0,0364

0,06

0,1091

0,0022

(30-35]

32,5

0,0308

0,04

0,0615

0,0012

50

1,00

8,2202

0,1644

Total

Media armonic este cea mai mic dintre cele 4 medii statistice:
77

Multiplicarea sau divizarea cu o constant a tuturor valorilor


nregistrate determin multiplicarea sau divizarea cu aceeai constant a
mediei lor armonice:

unde a este o constant;


Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor
absolute ale unei repartiii statistice nu produce modificri n ce privete
mrimea mediei armonice ponderate:

Dac pentru calculul mediei armonice se folosesc frecvene compuse


(XF) iar pentru calculul mediei aritmetice se folosesc frecvene simple
(F) atunci cele dou medii vor fi egale:

Aceast proprietate este exemplificat, pe baza datelor din tabelul 3.2,


reluate n tabelul 3.12.
78

Tabelul 3.12
Intervale de
variaie (ani)

1/C

CF

(1/C)(CF)

[0-5]

2,5

0,4000

14

35

14

(5-10]

7,5

0,1333

67,5

(10-15]

12,5

0,0800

37,5

(15-20]

17,5

0,0571

13

227,5

13

(20-25]

22,5

0,0444

135

(25-30]

27,5

0,0364

82,5

(30-35]

32,5

0,0308

65

50

650

50

Total
Se poate constata c:

unde h* reprezint media armonic determinat pe baza frecvenelor


compuse (CF).
Tabelul 3.13
X

Y = X 1 = 1/X

43
25

0,0233
0,0400

64

0,0156

76

0,0132

29

0,0345

suma
media aritmetic

237
47,4

0,1265
0,025304

media armonic

39,51899

0,021097

inversa mediei aritmetice

0,021097

39,51899

inversa mediei armonice

0,025304

47,4

79

Dac ntre dou variabile exist o relaie de invers proporionalitate,


atunci media aritmetic a uneia dintre ele este egal cu inversa mediei
armonice a celeilalte. Aceast proprietate este exemplificat pentru
variabilele X i Y din tabelul 3.13.
Ca i celelalte medii, media armonic este sensibil la valorile aberante
nregistrate.
3.5. Media generalizat sau media de ordinul "r"
Cele 4 medii statistice se pot calcula i pe baza urmtoarei relaii
generalizate:

unde r este media generalizat sau media de ordinul "r".


Astfel, pentru anumite valori ale lui r, se pot obine cele 4 medii:
pentru r = 1, se obine media aritmetic, ;
pentru r = , un numr pozitiv foarte mic, se estimeaz destul de bine
media geometric, g;
pentru r = 2, se obine media ptratic, p;
pentru r = -1, se obine media armonic, h.

80

DESCRIEREA STATISTIC
A TENDINEI CENTRALE:
STATISTICILE DE
POZIIE

4.

OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile de poziie disponibile pentru descrierea
statistic a tendinelor, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
poziie;
s nelegei coninutul informaional al celor mai importante statistici de
poziie: mediana, cuartilele laterale i mediala;
s ptrundei semnificaia relaiei de ordine dintre media aritmetic, median i
modala central pentru aprecierea global a gradului de simetrie care descrie o
repartiie statistic;
s reinei utilitatea medianei i medialei n ce privete aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat.

4.1.

Cuantilele

Informaiile vizate n cadrul cercetrilor statistice impun deseori descrieri


statistice nu doar la nivelul ntregii colectiviti statistice studiate, ci i la
nivelul unor subcolectiviti semnificative din punct de vedere statistic.
Poate fi de interes, de exemplu, descrierea statistic a celor mai mari 10%
dintre valorile nregistrate. Pentru stabilirea unor asemenea subcolectiviti
semnificative din punct de vedere statistic, se dovedesc utile valorile
reprezentative din punctul de vedere al relaiei de ordine dup criteriul
mrimii. Aceste valori sunt denumite, n forma lor general, cuantile.
Cuantilele sunt statistici care descriu poziii specifice, semnificative pentru
analiza statistic a unui ir de valori nregistrate. Prin poziiile ocupate n
urma ordonrii valorilor observate dup criteriul mrimii, cuantilele mpart
irul acestor valori ntr-un anumit numr de pri egale. Prin urmare,
cuantilele sunt definite de numrul de pri egale n care ele mpart irul
valorilor observate supuse ordonrii dup criteriul mrimii, prin poziiile
pe care ele le ocup n urma acestei ordonri. Astfel:
mediana este cuantila care mparte irul ordonat al valorilor observate
n dou pri egale;
cuartilele sunt cele 3 cuantile care mpart irul ordonat al valorilor
observate n 4 pri egale; a doua cuartil este, astfel, chiar mediana;
decilele sunt cele 9 cuantile care mpart irul ordonat al valorilor
observate n 10 pri egale; a cincea decil este, astfel, chiar mediana;
centilele sunt cele 99 cuantile care mpart irul ordonat al valorilor
observate n 100 pri egale; a 50-a centil este, astfel, chiar mediana; a
25-a centil este prima cuartil etc.
4.2.

Mediana

Mediana este cea mai central valoare, avnd n vedere poziia de mijloc
pe care o ocup atunci cnd irul de valori studiat este ordonat dup
criteriul mrimii. Se poate spune, astfel, c reprezentativitatea ei pentru o
repartiie statistic este dat de poziia central pe care o ocup.
Dependena poziiei centrale doar de numrul de valori statistice i nu de
diferenele dintre acestea, face ca reprezentativitatea medianei, spre
deosebire de cea a mediei aritmetice, s fie mult mai puin sensibil la
valorile aberante.
Faptul c mediana ocup poziia central ntr-o repartiie statistic este
echivalent cu faptul c ea este acea valoare pentru care numrul valorilor
inferioare ei este egal cu numrul valorilor superioare ei, din punctul de
vedere al mrimii lor.
83

Aceast definiie poate fi formulat i ntr-o manier probabilistic. Astfel,


mediana (Me) se identific cu valoarea care satisface relaia:

Determinarea medianei pentru un ir de valori


Dac numrul valorilor irului considerat este impar, atunci mediana se
determin dup relaia:

unde:
RMe reprezint rangul valorii mediane;
N = volumul colectivitii statistice.
De exemplu, pentru irul de valori (2, 10, 15, 7, 23, 17, 9) mediana este
valoarea care cade la mijloc n urma ordonrii cresctoare a irului: (2, 7,
9, 10, 15, 17, 23), adic 10.
Folosind relaia de mai sus: Me = X(N+1)/2 = X(7+1)/2 = X4, adic cea de-a 4-a
valoare n ordine cresctoare (sau descresctoare), acesta fiind, conform
seriei ordonate, egal cu 10.
Dac numrul valorilor seriei este par, atunci mediana se va calcula ca
medie a celor 2 valori care cad la mijloc n urma ordonrii dup criteriul
mrimii:

Pentru exemplificare, s adugm valoarea de 25 la irul de valori


considerat: (2, 10, 15, 7, 23, 17, 9, 25). Ordonnd acest nou ir de valori,
obinem irul ordonat (2, 7, 9, 10, 15, 17, 23, 25) cu un numr de 8 valori.
Cele dou valori din mijlocul irului ordonat sunt XN/2 = X4 = 10 i X(N/2)+1
= X5 = 15. Prin urmare, Me = (10 + 15)/2 = 12,5.
Datorit efectelor exagerate pe care le are asupra mediei aritmetice aanumitele valori statistice aberante, mediana ar trebui s fie preferat mediei
aritmetice ca mrime de pornire n negocierile de salarii ale sindicatelor cu
patronatele.
84

S considerm, de exemplu, irul de salarii (n RON): (550, 920, 600, 800,


750, 2500, 740). Pentru a determina mediana acestui ir de valori, este
necesar nti ordonarea lor dup criteriul mrimii: (550, 600, 740, 750,
800, 920, 2500).
Deoarece N = 7, care este o valoare impar, rangul termenului din mijlocul
seriei este (N + 1)/2 = (7 + 1)/2 = 4, mediana fiind astfel egal cu cea de-a
4-a valoare a irului ordonat, adic 750. Se observ c din punctul de
vedere al intereselor sindicatelor salariul de 750 RON este mult mai
reprezentativ dect salariul mediu, = (550 + 600 + 740 + 750 + 800 +
920 + 2500)/7 = 6860/7 = 980 RON. Diferena destul de mare dintre
salariul median i cel mediu este determinat de influena foarte mare pe
care o are cel mai mare salariu (2500) asupra salariului mediu.
Mediana este utilizat deseori pentru caracterizarea tendinei centrale a
datelor calitative aranjate n ranguri (de exemplu, ordini de preferine
crora li se acord ranguri).
Determinarea medianei pentru date grupate
Dac datele sunt grupate, determinarea medianei este puin mai complex,
presupunnd ca i calcule suplimentare pe cele ale frecvenelor statistice
cumulate.
Pornind de la definiia medianei (valoarea care mparte n dou pri egale
irul ordonat al valorilor nregistrate), rezult c n cazul repartiiilor sau
distribuiilor statistice mediana este acea valoare pentru care frecvena
cumulat cresctor este cea mai apropiat de frecvena cumulat
descresctor. Vom considera pentru exemplificarea acestui fapt dou
situaii posibile: cea a variabilelor statistice discrete i cea a variabilelor
statistice continue, definite pe intervale.
Cazul unei variabile statistice discrete
S considerm datele nregistrate n legtur cu variabila numr de copii
pentru o populaie statistic format din 100 de familii, conform tabelului
4.1.
ntruct pentru varianta a treia a variabilei (2 copii) frecvena cumulat
cresctor este cea mai apropiat de frecvena cumulat descresctor (n
cazul de fa, acestea sunt chiar egale), ea se identific cu mediana, Me =
2.
Se verific, astfel, definiia medianei: numrul de familii cu mai puin de 2
copii este egal cu numrul de familii cu mai mult de 2 copii (35 de familii).

85

Tabelul 4.1
Numr
Numr
de copii de familii

Frecvena
cumulat
cresctor

Frecvena
cumulat
descresctor

10

10

100

25

35

90

30

65

65

15

80

35

10

90

20

95

10

100

TOTAL

N = 100

Cazul unei variabile statistice continue, definit pe intervale


S considerm repartiia statistic din tabelul 4.2.
Tabelul 4.2
Grupe de salarii (RON)

Numr de muncitori

Frecvene cumulate

600 650

650 700

15

18

700 750

19

37

750 800

21 (= FMe)

58 (> 50,5 = R)

800 850

20

78

850 900

17

95

900 950

99

950 1000

100

Total

N = 100

Deoarece numrul total de muncitori este 100, nseamn c mediana


trebuie s fie o valoare localizat ntre cel de-al 50-lea i al 51-lea salariu
n ordinea mrimii:
R = media[(N/2, (N/2)+1] = (N + 1)/2 = (100 + 1)/2 = 50,5.

86

Se observ c frecvena cumulat a primelor 3 grupe de salarii este de 37,


iar frecvena cumulat a primelor 4 grupe depete rangul valorii mediane
(58 > 50,5). Prin urmare, mediana ar trebui s fie o valoare cuprins n cel
de-al patrulea interval (intervalul median), ea putnd fi aflat prin
interpolare, presupunnd c salariile celor 21 de muncitori din acest grup
sunt repartizate uniform n intervalul respectiv (de la 750 la 800 RON).
Astfel, valoarea median se obine adugnd la captul inferior al
intervalului median (l = 750) lungimea intervalului median (d = 800 750
= 50) ponderat cu raportul dintre rangul valorii mediane pe lungimea
intervalului median (r = 50,5 37 = 13,5) i diferena total de rang pe
intervalul median, dat de frecvena absolut nregistrat pe acesta (21).
Prin urmare, salariul median este egal cu 750 + 50 (13,5/21) 750 +
32,1429 782,1429 RON. Aceasta nseamn c jumtate dintre muncitori
ctig pn la 782,1429 RON.
Poziia valorii mediane astfel obinute este ilustrat n tabelul 4.3:
Tabelul 4.3
Grupe de salarii
(RON)

Numr de muncitori

Frecvene cumulate

600 650

650 700

15

18

700 750

19

37 (= rl)

750 782,1429

13,5 (= R rl = r)

50,5 [= R = (N + 1)/2]

782,1429 800

7,5

58 (= rL)

800 850

20

78

850 900

17

95

900 950

99

950 1000

100

Total

N = 100

Generaliznd, relaia de calcul a medianei n cazul unei variabile statistice


continue, definit pe intervale este:

87

unde:
Me reprezint valoarea median a unei repartiii statistice pe intervale;
l = limita inferioar a intervalului median;
d = lungimea intervalului median (diferena dintre captul superior i
captul inferior al intervalului median)
r = rangul valorii mediane relativ la valorile nregistrate pe lungimea
intervalului median;
R = rangul valorii mediane pe lungimea total a repartiiei statistice;
rl = rangul captului inferior al intervalului median, echivalent cu frecvena
absolut cumulat pn la acesta;
rL = rangul captului superior al intervalului median;
rMe = diferena de rang ntre capetele intervalului median (rMe = rL rl),
echivalent cu frecvena absolut nregistrat pe acesta (FMe).
Acelai procedeu de interpolare poate fi aplicat i pentru determinarea
celorlalte cuantile pentru cazul variabilelor statistice continue definite pe
intervale.
Proprieti ale medianei
1. n cazul repartiiei unei variabile definite de o funcie continu, abscisa
valorii mediane mparte n 2 pri egale aria de sub graficul funciei care
definete variabila statistic (a se vedea figura 4.1).
Egalitatea ariilor suprafeelor S1 i S2 din figura 4.1 este echivalent cu
egalitatea:

unde:
Me reprezint mediana repartiiei statistice dup variabila X;
f(X) = funcia continu care definete variabila statistic X;
88

[a, b] = cmpul de variaie al variabilei statistice X.

S1 = S2

S2

S1

Me

Figura 4.1
2. ntruct media aritmetic este afectat de valorile extreme pe care le
nregistreaz variabila statistic, rezult c pentru o repartiie statistic cu o
concentrare mai mare n jurul valorilor mai mici, mediana este mai mic
dect media aritmetic. Invers, pentru o repartiie statistic cu o
concentrare mai mare n jurul valorilor mai mari, mediana este mai mare
dect media aritmetic.
Primul caz este cel al repartiiei din tabelul 4.1, precum i al repartiiei din
figura 4.1. Pentru a ne edifica, s calculm media aritmetic a repartiiei
din tabelul 4.1. Calculele necesare sunt nlesnite prin construirea tabelului
4.4.
Tabelul 4.4
Numr de copii (X)
0
1
2
3
4
5
6
TOTAL

Numr de familii (F)


10
25
30
15
10
5
5
100

(XF)
0
25
60
45
40
25
30
225
2,25

89

Se verific, astfel, relaia Me (= 2) < (= 2,25);


3. Spre deosebire de media aritmetic, mediana prezint avantajul c nu
este afectat de valorile aberante nregistrate de ctre variabila statistic.
4.3.

Moda

Moda este varianta pe care o variabil statistic o nregistreaz cel mai des.
Moda se mai numete i valoare dominant sau n termeni probabilistici
valoarea cea mai probabil.
S presupunem, de exemplu, c managerul unui magazin de mbrcminte
a observat c cele 10 perechi de pantaloni vndute n ziua anterioar au
avut urmtoarele mrimi:
32, 34, 36, 33, 31, 34, 30, 34, 32, 38
Moda pentru acest ir de valori este egal cu 34, ntruct aceast valoare sa nregistrat cel mai des (din cele 10 perechi de pantaloni vndute, 3
perechi au avut aceast mrime, celelalte mrimi nregistrndu-se fie doar
de 2 ori, fie doar o singur dat). Media aritmetic a mrimilor vndute
este de 33,4, iar mediana este egal cu 33,5. Conform acestor dou
statistici, valoarea 33 ar fi cea mai reprezentativ pentru irul considerat.
Totui, luarea deciziei de aprovizionare viitoare n funcie de acest rezultat
ar putea fi o eroare. Pentru o asemenea decizie, este necesar cunoaterea
modei.
Determinarea modei pentru repartiii statistice dup variabile calitative
n cazul unei repartiii statistice dup o variabil calitativ, calculul mediei
aritmetice sau al medianei nu are sens. ntr-o asemenea situaie se poate
determina totui, ca i statistic a tendinei centrale, moda.
S considerm, de exemplu, datele din tabelul 4.5, referitoare la
repartizarea pe domenii a celor 250 de angajai cu studii superioare ai unei
firme.
Variabila domeniu cu variantele sale contabilitate, finane,
management, marketing i altele este o variabil atributiv calitativ.
Deoarece, pentru varianta contabilitate se nregistreaz cea mai mare
frecven (75, n cifre absolute; 30,00%, n cifre relative), rezult c moda
corespunde acestei variante.

90

Tabelul 4.5
Domeniul

Numrul de angajai cu studii


superioare (frecvene absolute)

Frecvene
relative

Contabilitate
Finane
Management
Marketing
Altele

75
50
62
38
25

30,00%
20,00%
24,80%
15,20%
10,00%

TOTAL

250

100,00%

Determinarea modei pentru repartiii statistice dup variabile cantitative


cu variaie discret
Pentru repartiii statistice dup variabile cantitative cu variaie discret,
moda poate fi uor determinat cu ajutorul diagramelor.
S considerm, de pild, variabila numr de copii / familie, cu variantele
X1, X2, ..., Xk (de exemplu, X1 = 0 copii, X2 = 1 copil .a.m.d.).
n figura 4.2 este reprezentat, cu ajutorul unei diagrame prin coloane, o
repartiie statistic dup aceast variabil. Moda, adic valoarea pentru care
se nregistreaz frecvena maxim, este valoarea pe care am notat-o cu Mo.

80
70
60
50
40
30
20
10
0

X1

X2

...

Mo

...

Xk

Figura 4.2
Din diagram rezult c pentru grupul de familii analizat moda este Mo = 4
(copii), adic varianta pentru care s-au nregistrat 70 de observaii.
Dac exist dou sau mai multe variante ale variabilei considerate pentru
care se nregistreaz frecvena maxim, repartiia statistic este
91

caracterizat de dou (repartiie bimodal; un exemplu este cel din figura


4.3) sau mai multe mode (repartiie plurimodal).
Atunci cnd pentru toate variantele unei caracteristici se nregistreaz
aceeai frecven, nu se poate vorbi de mod.

80
70
60
50
40
30
20
10
0

Mo

X1

...

Mo

...

Xk

Figura 4.3
Se poate vorbi i despre mode secundare ale unei repartiii statistice.
Modele secundare sunt date de acele variante ale variabilei pentru care
frecvenele de apariie sunt foarte apropiate de frecvena modei principale.
De exemplu, n diagrama din figura 4.4, variantele X4 i X6 pot fi
considerate ca i mode secundare ale repartiiei statistice reprezentate.

80
70
60
50
40
30
20
10
0

X1

X2

X3

X4

X5 = Mo

X6

X7

X8

Figura 4.4
Determinarea modei pentru repartiii statistice dup variabile cantitative
92

cu variaie continu definite pe intervale


Trebuie considerate cele dou cazuri:
cnd variabila este definit pe intervale egale;
cnd variabila este definit pe intervale neegale.
Pentru repartiiile dup variabile cantitative cu variaie continu, definite
pe intervale egale, n determinarea modei trebuie parcurse dou etape:
1. se determin intervalul modal, adic intervalul pentru care se
nregistreaz cea mai mare frecven statistic;
2. se determin moda, apelndu-se una dintre urmtoarele trei modaliti:
a. dac se dorete doar o valoare aproximativ a modei, aceasta se
determin ca medie aritmetic a limitelor intervalului modal:

unde:
Mo reprezint moda repartiiei statistice studiate;
l, L = limita inferioar i, respectiv, limita superioar a intervalului
modal.
b. dac se dorete o valoare mai tiinific a modei, n determinarea
acesteia se va ine cont i de frecvenele intervalelor vecine
intervalului modal, aplicndu-se relaia:

unde:
l reprezint limita inferioar a intervalului modal;
d = distana intervalului modal;
1 = diferena dintre frecvena intervalului modal i frecvena
intervalului imediat anterior lui;
2 = diferena dintre frecvena intervalului modal i frecvena
intervalului imediat urmtor lui.
c. aceeai valoare obinut pentru mod prin relaia anterioar se poate
obine i prin modalitatea grafic prezentat n figura 4.5, folosinduse pentru aceasta o hrtie milimetric:
93

Mo
Figura 4.5

S determinm, de exemplu, moda pentru repartiia statistic din tabelul


4.6. n acest tabel este marcat deja intervalul modal. Mai trebuie doar s
aplicm relaia:

Tabelul 4.6
Variabila X grupe de vrst pentru o
populaie supus studiului

Frecvene absolute, F

10 - 20

20 - 30

30 - 40

20

40 - 50

11

50 - 60

TOTAL

50

nlocuind simbolurile din dezvoltarea final a relaiei cu valorile cunoscute


din tabel, se obine:

94

Pentru repartiiile dup variabile cantitative cu variaie continu, definite


pe intervale neegale, n determinarea modei este necesar parcurgerea
urmtorilor pai:
1. se calculeaz distanele dk ale tuturor celor k intervale;
2. se calculeaz, pentru toate intervalele, frecvenele corectate, ca raporturi
ntre frecvenele absolute ale intervalelor i distanele acestora (F =
F/d). Se poate identifica astfel intervalul modal, acesta fiind cel care are
frecvena corectat cea mai mare;
3. se determin moda, folosind una dintre aceleai trei modaliti ca i n
cazul repartiiilor dup variabile cantitative cu variaie continu,
definite pe intervale egale.
S determinm, de exemplu, moda pentru repartiia dup variabila statistic
numr de cri vndute n librrii, pornind de la datele din tabelul 4.7.
Tabelul 4.7
Variabila X
numrul de
cri vndute

Frecvena absolut
numrul de
librrii (F)

Distana
intervalului
(d)

Frecvene
corectate
(F = F/d)

10 - 20

40

10

4,00

20 - 30

90

10

9,00

30 - 50

240

20

12,00

50 - 80

110

30

3,67

80 - 100

20

20

1,00

Total

500

Conform valorilor din tabel, intervalul modal este intervalul (30 50),
ntruct frecvena corectat a acestui interval este cea mai mare. Moda este,
prin urmare:

95

Proprieti ale modei


n decizia de alegere a modei ca statistic a tendinei, precum i n calculul
acesteia, este util cunoaterea urmtoarelor proprieti ale modei:
1. n cazul repartiiei unei variabile definite de o funcie continu, moda
corespunde valorii variabilei pentru care se nregistreaz maximul acestei
funcii (a se vedea figura 4.6).

max F(X)

Mo
Me

Figura 4.6
2. Spre deosebire de media aritmetic, moda nu este afectat de valorile
aberante nregistrate de ctre variabila statistic;
96

3. n cazul repartiiilor bi- sau pluri-modale, cele dou sau mai multe mode
nu pot fi sintetizate pentru obinerea unei singure mode care s fie
repezentativ pentru ntreaga colectivitate statistic;
4. Cunoaterea modei se dovedete util n caracterizarea gradului de
asimetrie al unei repartiii statistice;
5. Moda este cea mai reprezentativ statistic de poziie pentru cunoaterea
comportamentului pe pia al unui produs.
Relaii ntre media aritmetic, median i mod
Dac variabila este una cantitativ continu i repartiia ei este una
simetric fa de media aritmetic, moda este egal cu mediana i cu media
aritmetic (a se vedea figura 4.7). Majoritatea repartiiilor statistice nu sunt
ns simetrice, ele fiind caracterizate de un anumit grad de asimetrie.

40
35
30
25
20
15
10
5
0

media
mediana
moda

Figura 4.7
Pentru repartiiile cu asimetrie la stnga sau cu coad la dreapta (a se
vedea figura 4.8, a), se verific relaia Mo < Me < . Pentru repartiiile cu
asimetrie la dreapta sau cu coad la stnga (a se vedea figura 4.8, b), se
verific relaia Mo > Me > .
n cazul unei repartiii unimodale cu o asimetrie moderat, se poate verifica
urmtoarea relaie aproximativ ntre cele trei statistici ale tendinei
centrale:

97

a. asimetrie
la stnga

b. asimetrie
la dreapta

Media
aritmetic,

Media
aritmetic,
Mediana, Me

Moda, Mo

Moda, Mo

Mediana, Me

Figura 4.8
4.4.

Mediala

Mediala este valoarea reprezentativ prin poziia central pe care o ocup


n urma nsumrii treptate a valorilor nregistrate, considerate n ordinea
mrimii lor. Spre deosebire de median, care mparte valorile ordonate n
dou pri egale, mediala mparte suma acelorai valori n dou pri egale.
Prin urmare, mediala (Ml) se identific cu prima valoare pentru care este
satisfcut relaia:

unde:
R reprezint rangul medialei;
i = rangurile celor N valori, obinute n urma ordonrii acestora.
S considerm din nou, pentru exemplificare, irul de salarii (n RON):
(550, 920, 600, 800, 750, 2500, 740). Pentru a determina mediala acestui
ir de valori, este necesar mai nti ordonarea acestora dup criteriul
mrimii: (550, 600, 740, 750, 800, 920, 2500), urmat de nsumarea lor
treptat: (550, 1150, 1890, 2640, 3440, 4360, 6860).
Jumtate din suma total a valorilor nseamn 6860/2 = 3430. ntruct
aceast valoare este depit pentru prima dat de ctre suma cumulat
treptat a salariilor prin adugarea celei de-a 5-a valori (3440 > 3430),
rezult c mediala are rangul egal cu 5, valoarea sa fiind egal cu 800 (a se
vedea figura 4.9).
De obicei, aa cum s-a ntmplat i n exemplul considerat, mediala este
mai mare dect mediana unui ir de valori sau a unei repartiii statistice
(pentru exemplul nostru, Ml = 800 > Me = 750).
98

Abaterea dintre aceste dou statistici constituie ea nsi o nou statistic, a


crei utilitate este n legtur cu caracterizarea gradului de concentrare
statistic, aa cum se va vedea pe parcursul capitolului 5, dedicat
statisticilor de concentrare/diversificare statistic.
Egalitatea ntre medial i median are loc doar n cazul unei echirepartiii
statistice, adic a unei repartiii caracterizate de o concentrare statistic
nul.

8000
6860

Valori cumulate

6000
4360

4000
3430

3440
2640

2000

1890
1150
550

0
0

5
Ml

Figura 4.9
Determinarea medialei pentru date grupate
Dac datele sunt grupate, determinarea medialei este, ca i n cazul
medianei, puin mai complex.
Pornind de la definiia medialei (valoarea care mparte n dou pri egale
suma irului ordonat al valorilor nregistrate), rezult c n cazul
repartiiilor statistice mediala este acea valoare pentru care suma valorilor
cumulat cresctor este egal cu suma valorilor cumulat descresctor.
Pentru exemplificarea acestui fapt, vom considera din nou cele dou
situaii posibile: cea a variabilelor statistice discrete i cea a variabilelor
statistice continue, definite pe intervale.

99

Cazul unei variabile statistice discrete


S revenim la datele din tabelul 4.1, nregistrate n legtur cu variabila
numr de copii pentru o populaie statistic format din 100 de familii.
Pentru aflarea medialei este necesar cumularea treptat a sumei valorilor
nregistrate de variabila statistic. Pentru aceasta, am construit tabelul 4.8.
ntruct pentru varianta a patra a variabilei (3 copii), numrul total de
copii, cumulat, este pentru prima dat mai mare dect jumtate din numrul
de copii care revin tuturor celor 100 de familii, rezult c mediala se
identific cu aceast variant a repartiiei statistice. Aadar, Ml = 3.
Tabelul 4.8
Numr
Numr
de copii de familii
(X)
(F)

Numr total de copii


pe grupe de familii
(XF)

Numr total de
copii, cumulat
[(XF)]

10

25

25

25

30

60

85

15

45

130 > 225/2

10

40

170

25

195

30

225

TOTAL

N = 100

225

Cazul unei variabile statistice continue, definit pe intervale


S revenim la repartiia statistic din tabelul 4.2. n scopul determinrii
medialei, construim tabelul 4.9.
ntruct suma total a salariilor este egal cu 78100, nseamn c mediala
corespunde acelui salariu a crui adugare la suma cumulat a salariilor
mai mici determin pentru prima dat o sum cumulat parial egal sau
mai mare dect 78100/2 = 39050. Conform datelor din tabelul 4.9, acest
salariu se afl undeva pe intervalul 750-800 (intervalul medial al repartiiei
considerate).
Valoarea medialei se poate afla prin interpolare. Astfel, ea se obine
adugnd la captul inferior al intervalului medial (l = 750) lungimea
intervalului medial (d = 800 750 = 50) ponderat cu raportul dintre
partea din suma de salarii de pe intervalul medial, care mai trebuie
adugat la suma cumulat a valorilor pn la limita inferioar a
100

intervalului medial (sl) pentru obinerea unei sume cumulate a salariilor


egal cu jumtate din suma total (S) a acestora (s = S/2 sl = 39050
25775 = 13275) i suma total a salariilor de pe intervalul medial (SMl =
16275). Prin urmare, salariul medial este egal cu 750 + 50 (13275/16275)
750 + 40,7834 790,7834 RON. Aceasta nseamn c jumtate din
suma (fondul) de salarii este repartizat pentru salariile de pn la
790,7834 RON. Poziia valorii mediane astfel obinute este ilustrat n
tabelul 4.10.
Tabelul 4.9
Grupe de
Salarii
salarii, reprezentative
RON
(centre ale
(X)
intervalelor,
C)

Numr de
muncitori
(F)

Sume
salarii pe
grupe
(CF)

Suma
salariilor,
cumulat
[(CF)]

600 650

625

1875

1875

650 700

675

15

10125

12000

700 750

725

19

13775

25775

750 800

775

21

16275

42050 >
78100/2

800 850

825

20

16500

58550

850 900

875

17

14875

73425

900 950

925

3700

77125

950 1000

975

975

78100

N = 100

78100

Total

Generaliznd, relaia de calcul a medialei n cazul unei variabile statistice


continue, definit pe intervale este:

unde:
Ml reprezint valoarea medial a unei repartiii statistice pe intervale;
l = limita inferioar a intervalului medial;
101

d = lungimea intervalului medial (diferena dintre captul superior i


captul inferior al intervalului medial)
SMl = suma total a valorilor de pe intervalul medial;
sl = suma cumulat a valorilor pn la limita inferioar a intervalului
medial;
s = partea din suma valorilor de pe intervalul medial, care mai trebuie
adugat la sl pentru obinerea unei sume cumulate a valorilor egal cu
jumtate din suma total a acestora;
S = suma total a valorilor nregistrate.
Tabelul 4.10
Grupe de
salarii, RON
(X)

Sume salarii pe grupe


(CF)

Suma
salariilor,
cumulat
[(CF)]

600 650

1875

1875

650 700

10125

12000

700 750

13775

25775

750 790,7834

13275 (=S/2 sl = s) 39050 (= S/2)

790,7834 800

3000

42050

800 850

16500

58550

850 900

14875

73425

900 950

3700

77125

950 1000

975

78100 (= S)

Total

78100

Acelai procedeu de interpolare poate fi aplicat i pentru determinarea, n


cazul variabilelor statistice continue definite pe intervale, a altor statistici
care mpart suma valorilor ntr-un numr specificat (4, 10, 100 ...) de pri
egale.
Proprieti ale medialei
1. Pentru orice repartiie statistic, mediala nu poate fi mai mic dect
mediana. Aceast proprietate se explic prin faptul c suma valorilor mai
mici dect mediana nu poate fi dect mai mic sau egal (egalitatea avnd
102

loc doar n cazul unei echirepartiii) cu suma valorilor mai mari dect
mediana.
2. Cunoaterea mrimii medialei n raport cu mrimea medianei este util
n aprecierea gradului de concentrare statistic. Astfel, cu ct mediala este
mai deplasat fa de median, cu att gradul de concentrare statistic este
mai mare.

103

104

DESCRIEREA STATISTIC
A VARIAIEI INTERNE CONCENTRAREA I
DIVERSIFICAREA
STATISTIC

5.

OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate statisticile disponibile pentru descrierea variaiei
interne, ajutndu-v:
s nelegei utilitatea cunoaterii gradului de concentrare / diversificare
statistic;
s reinei cele trei statistici abaterea medial-median; coeficientul de
concentrare i indicele de concentrare Gini disponibile pentru descrierea
variaie interne n cazul variabilelor statistice cantitative cu valori pozitive;
s reinei cele cinci statistici raportul de concentrare; energia informaional
Onicescu; diferena Hirschman; coeficientul de concentrare Gini i coeficientul
de concentrare Strck disponibile pentru descrierea variaiei interne n cazul
variabilelor statistice calitative.

Variaia intern - concentrarea i diversificarea statistic


Informaii statistice suplimentare n legtur cu structura colectivitii
statistice pot fi obinute pe baza statisticilor de variaie intern, statistici
care evideniaz gradul de concentrare / diversificare statistic.
Statisticile de variaie intern sunt expresii ale gradului de aglomerare a
valorilor nregistrate la nivelul unitilor statistice n jurul unei/unor valori
semnificative. Ele evideniaz, prin urmare, inegalitile din cadrul unei
repartiii statistice.
Dintre nevoile la care rspund statisticile de variaie intern sunt de
menionat mai ales cele privind:
caracterizarea structurii pieelor, necesar n orientarea strategic a
companiilor;
descrierea distribuiei sarcinilor de management, n scopul coordonrii
eficiente a activitilor desfurate n cadrul unei organizaii;
evidenierea inegalitilor sociale prin prisma veniturilor obinute,
necesar n definirea politicilor sociale ale guvernelor.
Studirea statistic a variaiei interne prin evidenierea gradului de
concentrare / diversificare statistic este posibil atunci cnd variabila
statistic este definit fie ca o variabil calitativ, fie ca o variabil
cantitativ cu valori pozitive.
Concentrarea statistic poate fi descris numeric, prin intermediul
diferitelor statistici de concentrare, sau grafic, prin intermediul aanumitelor curbe de concentrare statistic.
Descrierea numeric a concentrrii statistice
Pentru descrierea numeric a concentrrii statistice sunt disponibile
urmtoarele statistici:
a). pentru variabile statistice cantitative cu valori pozitive:
abaterea medial-median;
coeficientul de concentrare;
indicele de concentrare Gini.
b). pentru variabile statistice calitative:
raportul de concentrare;
energia informaional Onicescu;
diferena Hirschman;
coeficientul de concentrare Gini;
107

coeficientul de concentrare Strck.


5.1.

Statistici disponibile n descrierea numeric a concentrrii


statistice pentru variabile statistice cantitative cu valori pozitive

Abaterea medial-median
n capitolul dedicat statisticilor de poziie, am artat c mediala unei
repartiii statistice este ntotdeauna egal sau mai mare dect mediana
acesteia:

Atunci cnd exist, diferena valoric dintre mediala i mediana unei


repartiii statistice este rezultatul inegalitilor care o caracterizeaz, adic
al unei anumite concentrri a valorilor nregistrate la nivelul unitilor
statistice n jurul unei/unor valori semnificative.
Aceast diferen se numete abatere medial-median i este statistica cea
mai simpl care este disponibil pentru descrierea concentrrii statistice a
unei variabile cantitative cu valori pozitive:

unde:
MM reprezint abaterea medial-median care caracterizeaz repartiia
statistic studiat;
Ml = mediala repartiiei statistice studiate;
Me = mediana repartiiei statistice studiate.
O valoare mai mare a abaterii medial-median nseamn o concentrare
statistic mai puternic. Dac abaterea medial-median este nul (mediala
este egal cu mediana), nseamn c repartiia statistic este una egalitar
(echirepartiie). Pentru exemplificare, s considerm repartiia statistic a
notelor obinute la un examen de o grup de 15 studeni, conform tabelului
5.1.
Pentru aceast repartiie, rangul medianei este egal cu (15 + 1) / 2 = 8, ceea
ce nseamn c mediana ia valoarea 7 (pentru aceast valoare, frecvena
absolut cumulat depete pentru prima dat rangul medianei; 9 > 8).
Pentru a calcula mediala, este necesar, mai nti, cumularea produselor
dintre notele obinute i frecvenele absolute nregistrate, conform tabelului
5.2.
108

ntruct unitatea medialei este egal cu 112 / 2 = 56, nseamn c mediala


ia valoarea 9, deoarece pentru aceast valoare, produsele (XF) cumulate
depesc pentru prima dat unitatea medialei; 82 > 56.
Tabelul 5.1
Nota obinut

Numr studeni

Numr studeni cumulat

4
5
6
7
9
10
Total

1
2
1
5
3
3
15

1
3
4
9 > 8 = (15 + 1)/2
12
15

Tabelul 5.2
Nota obinut
(Xk)

Frecvene absolute
(Fk)

(XkFk)

(XkFk), cumulat

10

14

20

35

55

27

82 > 56 = 112/2

10

30

112

Total

15

Prin urmare, MM = 9 7 = 2, ceea ce evideniaz existena unei oarecare


concentrri statistice a notelor obinute de cei 15 studeni.
Coeficientul de concentrare
Pentru realizarea de comparaii ntre diferite repartiii statistice n ce
privete gradul de concentrare statistic, este necesar exprimarea abaterii
medial-median n form relativ, prin raportarea ei la amplitudinea
statistic. Prin aceast operaie, rezult o nou statistic de concentrare
statistic, denumit coeficient de concentrare statistic (CC):
109

unde:
CC reprezint coeficientul de concentrare statistic;
A = amplitudinea statistic;
XMAX = valoarea maxim a repartiiei statistice;
XMIN = valoarea minim a repartiiei statistice.
ntruct abaterea medial-median a unei repartiii statistice ia valori
cuprinse ntre zero i valoarea amplitudinii statistice a acesteia, coeficientul
de concentrare statistice poate nregistra doar valori cuprinse pe intervalul
[0, 1]. Apropierea de 0 indic o slab concentrare statistic, iar apropierea
de 1 arat o concentrare statistic puternic. Pentru o repartiie statistic
egalitar (echirepartiie), coeficientul de concentrare ia valoarea 0. Dac ia
valoarea 1, coeficientul de concentrare pune n eviden concentrarea
majoritii unitilor statistice n jurul unei anumite valori.
Pentru repartiia statistic din tabelul 5.1, coeficientul de concentrare este:

Coeficientul de concentrare statistic se poate exprima i procentual.


Pentru exemplul nostru, valoarea procentual a coeficientului de
concentrare statistic este de 33%.
Indicele de concentrare Gini
Acest indicator statistic sintetic al concentrrii unei repartiii statistice a
fost propus n lucrarea Variabilitate i mutabilitate, publicat n anul
1912 de ctre italianul Corrado Gini, cu ocazia studierii distribuiei
salariilor i veniturilor populaiei.
Indicele de concentrare Gini se definete n strns legtur cu curba
(liniar) de concentrare Lorenz-Gini, care se obine prin unirea punctelor
care au ca i coordonate frecvenele statistice relative cumulate (P) i
volumele statistice relative cumulate (Q) care caracterizeaz repartiia
statistic studiat.
n figura 5.1 este reprezentat curba de concentrare Lorenz-Gini pentru
repartiia din tabelul 5.1, n urma determinrii, cu ajutorul tabelului 5.3, a
110

frecvenelor statistice relative cumulate (P) i a volumelor statistice relative


cumulate (Q).
Tabelul 5.3
(XiFi),

Xi

Fi

(Fi),
cumula
t = Ni

0,0667

0,0357

0,2000

10

14

0,1250

0,2667

20

0,1786

0,6000

35

55

0,4911

12

0,8000

27

82

0,7321

10

15

1,0000

30

112

1,0000

XiFi

Total 15

cumula
t = Vi

112

Figura 5.1 Curba (liniar) de concentrare Lorenz-Gini


Indicele de concentrare Gini se obine ca rezultat al raportrii ariilor a dou
suprafee:
111

la numrtor: aria suprafeei de concentrare (Sc), adic a suprafeei


cuprinse ntre curba de concentrare Lorenz-Gini i diagonala ptratului
Gini (ptratul Gini este ptratul cu laturile corespunztoare variaiei
totale a variabilelor P i Q adic de la 0 la 1 pe abscisa i pe ordonata
de reprezentare grafic a se vedea figura 5.2);
la numitor: aria triunghiului dreptunghic de sub diagonala ptratului
Gini, adic jumtate din aria ptratului Gini. Aceasta corespunde valorii
maxime pe care o poate nregistra aria suprafeei de concentrare.

Figura 5.2 Determinarea grafic a indicelui de concentrare Gini


ntruct ptratul Gini are ntotdeauna latura egal cu 1, rezult c indicele
de concentrare Gini este egal cu dublul ariei suprafeei de concentrare:

Pornind de relaia de mai sus, o prim metod de determinare a indicelui de


concentrare Gini este cea grafic. Aceasta const n reprezentarea ct mai
exact a suprafeei de concentrare pe hrtie milimetric, n aa fel nct s
poat fi calculat estimativ aria acesteia (n acest scop, se va stabili latura
ptratului Gini ca fiind egal cu 100 de milimetri).
Indicele de concentrare Gini poate lua valori cuprinse n intervalul [0, 1]
(sau, dac se exprim n procente, [0, 100%]). Cu ct valoarea
112

coeficientului diferenei medii Gini este mai aproapiat de 0, cu att


concentrarea statistic este mai slab. Cu ct valoarea indicelui de
concentrare Gini este mai apropiat de 1, cu att concentrarea statistic este
mai puternic.
n afara metodei grafice, pentru determinarea indicelui de concentrare Gini
mai sunt disponibile urmtoarele trei metode:
metoda trapezelor de sub curba Lorenz-Gini;
metoda trapezelor de concentrare;
metoda determinrii indicelui de concentrare Gini ca expresie relativ a
diferenei medii Gini.
Metoda trapezelor de sub curba Lorenz-Gini pentru determinarea
indicelui de concentrare Gini
Aceast metod const n calcularea ariei suprafeei de concentrare prin
scderea din aria triunghiului dreptunghic de sub diagonala ptratului Gini
a sumei ariilor trapezelor Pi 1PiGiGi 1, care au bazele (Bi i bi) egale cu
valorile Qi i Qi 1 nregistrate de variabila volumului statistic relativ
cumulat i nlimea (hi) egal cu (Pi Pi 1), unde Pi 1 i Pi sunt valorile
nregistrate de variabila frecvenei statistice relative cumulate, iar Gi 1 i
Gi sunt punctele corespunztoare acestor valori pe curba de concentrare
Lorenz-Gini (a se vedea figura 5.3).
B

ntruct aria ptratului Gini este egal cu 1, rezult c aria triunghiului


dreptunghic de sub diagonala ptratului Gini este egal cu 1/2 = 0,5.
Prin urmare, ariei suprafeei de concentrare (Sc) este:

113

unde:
Ri sunt valorile nregistrate de variabila frecvenei statistice relative.

Figura 5.3 Metoda trapezelor de sub curba Lorenz-Gini pentru


determinarea indicelui de concentrare Gini
Pentru exemplificare, n tabelul 5.4 sunt efectuate calculele necesare n
determinarea indicelui de concentrare Gini prin metoda trapezelor de sub
curba Lorenz-Gini pentru repartiia statistic din tabelul 5.1.
Conform rezultatelor din tabelul 5.4, indicele de concentrare Gini pentru
repartiia statistic din tabelul 5.1 este:

114

Tabelul 5.4
Ni XiFi

Vi

Qi

Qi 1 + Qi

(Qi 1 + Qi) Ri

0,04

0,04

0,0024

10

14

0,13

0,16

0,0214

0,07

20

0,18

0,30

0,0202

0,33

35

55

0,49

0,67

0,2232

0,20

12

27

82

0,73

1,22

0,2446

10

0,20

15

30 112

1,00

1,73

0,3464

15

1,00

Xi

Fi

Ri

0,07

0,13

112

0,8583

Metoda trapezelor de concentrare pentru determinarea indicelui de


concentrare Gini
Aceast metod const n calcularea ariei suprafeei de concentrare prin
nsumarea ariilor trapezelor de concentrare Di 1DiGiGi 1 care compun
suprafaa de concentrare (a se vedea figura 5.4). Aria fiecrui trapez de
concentrare Di 1DiGiGi 1 se poate calcula prin scderea din aria
dreptunghiului TiGiQiQi 1 a ariei triunghiului TiGiGi 1 i a ariei
trapezului QiQi 1Di 1Di.

Figura 5.4 Metoda trapezelor de concentrare pentru determinarea


indicelui de concentrare Gini

115

Se poate observa c suma ariilor trapezelor QiQi 1Di 1Di este egal cu 1/2,
ntruct aceste trapeze compun mpreun triunghiul de deasupra diagonalei
ptratului Gini. Prin urmare, indicele Gini este:

Pentru exemplificare, n tabelul 5.5 sunt efectuate calculele necesare n


determinarea indicelui de concentrare Gini prin metoda trapezelor de
concentrare pentru repartiia statistic din tabelul 5.1.
Conform rezultatelor din tabelul 5.5, indicele de concentrare Gini pentru
repartiia statistic din tabelul 5.1 este:

116

Tabelul 5.5
Xi

Fi Ni

Pi Pi+Pi-1 XiFi

Vi

Qi Qi-Qi-1

(Qi-Qi-1)
(Pi+Pi-1)

1 0,0667 0,0667

4 0,0357 0,0357

0,0024

3 0,2000 0,2667

10

14 0,1250 0,0893

0,0238

4 0,2667 0,4667

20 0,1786 0,0536

0,0250

9 0,6000 0,8667

35

55 0,4911 0,3125

0,2708

3 12 0,8000 1,4000

27

82 0,7321 0,2411

0,3375

10

3 15 1,0000 1,8000

30 112 1,0000 0,2679

0,4821

15

1,0000

112

1,1417

Indicele de concentrare Gini ca expresie relativ a diferenei medii Gini


Indicele de concentrare Gini este i expresia relativ a diferenei medii
Gini. Astfel, indicele de concentrare Gini se obine prin raportarea
diferenei medii Gini la dublul mediei aritmetice a valorilor statistice
considerate:

unde:
reprezint diferena medie Gini;
= media aritmetic.
Trebuie subliniat c, sub aceast form, indicele Gini se apropie, ca
semnificaie i interpretare, de coeficientul de variaie (v) expresia
relativ a varianei sau dispersiei statistice. Diferena dintre cele dou
statistici const n faptul c una evideniaz variaia sintetic dintre toate
perechile de valori nregistrate, fiind, astfel, o expresie sintetic a variaiei
statistice interne, n timp ce cealalt este o msur sintetic a variaiei
tuturor valorilor nregistrate fa de tendina central.

Reamintim c:

117

Diferena medie Gini se calculeaz ca medie a celor N2 diferene dintre


toate perechile posibile de valori [(Xi, Xj), i, j = 1N] care se pot forma
din irul valorilor statistice considerate:

unde:
i i j iau valori de la 1 la N.
S determinm indicele de concentrare Gini pentru datele din tabelul 5.1
Pentru aceasta am construit tabelul 5.6, n care sunt calculate toate
diferenele posibile dintre cele 225 de perechi [(Xi, Xj), i, j = 115] care
se pot forma cu cele 15 valori (152 = 225).
Dintre cele 225 diferene, o parte sunt nule. n tabelul 5.6 acestea sunt
evideniate prin ncadrarea zonelor n care apar. Dup cum se poate
observa, numrul diferenelor nule este n strns legtur cu frecvenele de
apariie a variantelor pe care le nregistreaz variabila statistic. Mai exact,
la fiecare variant nregistrat de variabila statistic studiat corespunde un
numr de diferene nule egal cu ptratul frecvenei absolute de apariie a
acelei variante.
Prin urmare, numrul total de diferene nule este egal cu suma ptratelor
frecvenelor absolute de apariie ale variantelor statistice nregistrate de
variabila statistic studiat:

unde:
D0 reprezint numrul total de diferene nule;
Fi = frecvenele absolute nregistrate de variantele (i) corespunztoare
variabilei statistice studiate.
Pentru exemplul nostru, conform coloanei frecvenelor absolute din tabelul
5.2:

n ce privete diferenele nenule dintre valorile considerate, n tabelul 5.6


se poate observa c ele se distribuie simetric fa de diagonala principal a
tabelului, ceea ce nseamn c este suficient cuantificarea diferenelor din
118

partea aflat deasupra diagonalei principale a tabelului, urmnd ca


rezultatele s fie multiplicate cu 2.
Tabelul 5.6
F
xi

F
1

F2

F3

F4

F5

F6

F7

F2

F3

F4

F5

F6

F7

9 10 10 10 Total

52

39

39

30

23

23

23

23

23

29

29

29

10

38

10

38

10

38

xj

F1

F1

Total

476

Se mai poate observa, pe de alt parte, c i frecvenele de apariie ale


acestor diferene pot fi puse n strns legtur cu frecvenele absolute de
apariie ale variantelor variabilei statistice considerate. Condiia necesar
pentru aceasta este ca distanele dintre variantele cosniderate pentru
variabila statistic s fie egale ntre ele (i egale cu o constant d), motiv
pentru care a fost considerat i varianta i = 8, dei frecvena ei de apariie
este egal cu 0.
Astfel, suma diferenelor din partea aflat deasupra diagonalei principale a
tabelului (DS) se poate determina strict n funcie de frecvenele absolute de
apariie ale variantelor variabilei statistice considerate:

Acest fapt constituie i motivul pentru care media aritmetic de la numitorul fraciei din relaia de
determinare a coeficientului de concentrare Gini se multiplic cu 2.

119

unde:
Ni reprezint frecvena absolut cumulat pn la varianta i, inclusiv.
Prin urmare, putem considera urmtoarea relaie general:

unde:
N este numrul valorilor statistice considerate;
i = varianta i a variabilei statistice considerate;
k = numrul de variante pe care le nregistreaz variabila statistic
considerat;
Ni = frecvene absolute cumulate;
d = distana (constant) dintre variantele variabilei statistice considerate.
Aadar, diferena medie Gini se poate calcula cu ajutorul relaiei:
120

Aceast relaie se poate folosi i n cazul variabilelor cantitative continue


definite pe intervale egale, constanta d fiind, n acest caz, egal cu
lungimea intervalelor.
Revenind la exemplul nostru, pentru determinarea diferenei medii Gini
construim, pe baza tabelului 5.2, tabelul 5.7.
Conform rezultatelor obinute n tabelul 5.7, diferena medie Gini este:

Tabelul 5.7
Nota
Frecven
obinut (Xi) absolut (Fi)

Frecven absolut N - Ni Ni (N - Ni)


cumulat (Ni)

14

14

12

36

11

44

54

12

36

10

15

Total

15

238

Pentru a determina indicele de concentrare Gini mai este necesar aflarea


mediei aritmetice a repartiiei. Calculul mediei aritmetice este realizat cu
ajutorul tabelului 5.8.
Conform rezultatelor obinute n tabelul 5.8, indicele de concentrare Gini
este:

121

Valoarea obinut (destul de apropiat de 0) reflect o concentrare destul


de slab a notelor obinute de ctre cei 15 studeni.
Tabelul 5.8
Nota obinut (Xi)

Frecvene absolute (Fi)

(XiFi)

10

35

27

10

30

Total

15

112

Media aritmetic

5.2.

Statistici disponibile pentru descrierea numeric a concentrrii


statistice pentru variabile statistice calitative

n afara statisticilor de concentrare prezentate, pentru descrierea numeric a


concentrrii statistice mai sunt disponibile i urmtoarele 5 statistici, care
pot fi folosite att pentru variabile statistice cantitative, ct i pentru
variabile statistice calitative:
raportul de concentrare;
energia informaional Onicescu;
diferena Hirschman;
coeficientul de concentrare Gini;
coeficientul de concentrare Strck.
122

Raportul de concentrare
Folosit deseori n cercetrile de marketing, raportul de concentrare (Ca)
exprim ponderea deinut de primele a (un numr stabilit ca relevant)
cele mai frecvente variante nregistrate de variabila calitativ dup care
este studiat colectivitatea statistic:

unde:
Ca reprezint raportul de concentrare pentru primele a variante;
a = un numr stabilit ca relevant n funcie de scopul cercetrii statistice i
de caracteristicile colectivitii statistice studiate;
Ri = frecvena relativ a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
Ni = frecvena absolut a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
k = numrul de variante ale variabilei dup care este studiat colectivitatea
statistic;
N = volumul colectivitii statistice studiate.
De exemplu, raportul de concentrare C3 (a = 3) pentru repartiia statistic
din tabelul 5.1 este, conform rezultatelor din tabelul 5.4 (n care sunt
calculate i frecvenele relative ale variantelor statistice):

Aceasta nseamn c cele mai frecvente note nregistrate, adic 7, 9 i 10


au fost obinute de 73,33% din studenii grupei studiate.
Energia informaional Onicescu (Es)
Energia informaional Onicescu este o statistic sintetic a concentrrii n
definirea creia se pornete de la considerentul c ntreaga colectivitate
statistic supus studiului formeaz un sistem, ale crui stri sunt definite
de variantele nregistrate de variabila statistic. Fiecrei stri (i) a
123

sistemului i corespunde o anumit pondere, echivalent cu frecvena


statistic relativ nregistrat pentru varianta corespunztoare acelei stri (i
Ri). Energia informaional Onicescu este dat de suma ptratelor
ponderilor tuturor strilor sistemului astfel definit:

unde:
Es reprezint energia informaional Onicescu;
Ri = frecvena statistic relativ nregistrat pentru varianta i (Ri = 1);
s = numrul de variante i, n consecin, de stri ale sistemului.
De exemplu, pentru repartiia statistic din tabelul 5.1 energia
informaional Onicescu este egal, conform rezultatelor din tabelul 5.9, cu
0,2178.
Tabelul 5.9
Xi

Fi

Ri

0,0667

0,0044

0,1333

0,0178

0,0667

0,0044

0,3333

0,1111

0,2000

0,0400

10

0,2000

0,0400

15

1,0000

0,2178

n literatura de specialitate, energia informaional Onicescu este deseori


ntlnit sub numele de indicele Hirschman-Herfindahl, indice determinat
n legtur cu cotele juctorilor de pe o anumit pia.
ntruct Ri = 1, valoarea maxim a energiei informaionale Onicescu este
1. Valoarea minim a energiei informaionale Onicescu se obine n cazul
unei echirepartiii, adic atunci cnd toate frecvenele relative ale strilor
sistemului sunt egale ntre ele i egale, n consecin, cu 1/s (s fiind
numrul de variante i, totodat, de stri ale sistemului). Aceasta nseamn
124

c valoarea minim a energiei informaionale Onicescu, obinut n cazul


unei echirepartiii, este:

Aadar, energia informaional Onicescu ia valori cuprinse pe intervalul


[1/s, 1] (s fiind numrul de variante i, n consecin, de stri ale
sistemului). Cu ct valoarea energiei informaionale Onicescu este mai
apropiat de valoarea 1/s, cu att concentrarea statistic a repartiiei
studiate este mai redus. Cu ct valoarea energiei informaionale Onicescu
este mai apropiat de 1, cu att concentrarea statistic a repartiiei studiate
este mai puternic.
Energia informaional Onicescu ia valoarea 1 n cazul unul monopol
(sistemul se manifest totdeauna ntr-o singur stare sau, altfel spus,
variabila statistic nregistreaz totdeauna doar una i aceeai variant
dintre toate cele posibile).
Trebuie subliniat c pentru repartiia statistic din tabelul 5.1 valoarea
minim pe care o poate nregistra energia informaional Onicescu este
egal cu 1/10 = 0,1 i nu cu 1/6, ntruct notele obinute de ctre studeni
pot varia de la 1 la 10, astfel c repartiia nregistrat este de fapt cea din
tabelul 5.10:
Tabelul 5.10
Nota obinut (Xi)

Frecvene absolute (Fi)

1
2
3
4
5
6
7
8
9
10
Total

0
0
0
1
2
1
5
0
3
3
15

Energia informaional Onicescu corectat


Pentru eliminarea inconvenientului variabilitii valorii minime posibile
(1/s) n funcie de numrul de variante sau de stri ale sistemului (s), s-a
125

definit i o form corectat a energiei informaionale Onicescu, conform


relaiei:

n forma corectat, energia informaional Onicescu ia valori cuprinse pe


intervalul [0, 1]. Cu ct valoarea energiei informaionale Onicescu n forma
corectat este mai apropiat de 0, cu att concentrarea statistic a repartiiei
studiate este mai redus. Cu ct valoarea energiei informaionale Onicescu
n forma corectat este mai apropiat de 1, cu att concentrarea statistic a
repartiiei studiate este mai puternic.
De exemplu, pentru repartiia statistic din tabelul 5.1 energia
informaional Onicescu n forma corectat este:

Valoarea destul de apropiat de 0 a energiei informaionale Onicescu n


forma corectat arat o concentrare slab a repartiiei statistice din tabelul
5.1.
Diferena Hirschman (H)
Diferena Hirschman (H) este diferena dintre valoarea particular a
indicelui Hirschman-Herfindahl (notat cu H i echivalent, aa cum s-a
artat, cu energia informaional Onicescu) obinut pentru o repartiie
statistic i valoarea teoretic (He) pe care acest indice ar fi avut-o dac
repartiia studiat ar fi fost una egalitar (echirepartiie). Aceast valoare
teoretic He este valoarea minim pe care indicele Hirschman-Herfindahl o
poate nregistra pentru o variabil statistic definit de un numr s de
variante. Aa cum s-a artat mai sus, valoarea minim a indicelui
Hirschman-Herfindahl este egal cu 1/s. Aadar, diferena Hirschman se
poate determina cu ajutorul relaiei:

126

De exemplu, pentru repartiia statistic din tabelul 5.10 diferena


Hirschman este:

Dup cum se poate observa, diferena Hirschman este echivalent cu


numrtorul raportului pe baza cruia se determin energia informaional
Onicescu n forma corectat.
Coeficientul de concentrare Gini
Pentru cazul variabilelor statistice calitative, Corrado Gini a propus ca i
msur a concentrrii coeficientul obinut ca rdcin ptrat a sumei
ptratelor ponderilor nregistrate de variantele variabilei statistice:

unde:
CG reprezint coeficientul de concentrare Gini;
Ri = frecvena statistic relativ nregistrat (ponderea) pentru varianta i
(Ri = 1);
k = numrul de variante pe care le poate nregistra variabila statistic.
ntruct Ri = 1, valoarea maxim a coeficientului de concentrare Gini este
1. Valoarea minim a coeficientului de concentrare Gini se obine, ca i n
cazul energiei informaionale Onicescu, n cazul unei echirepartiii, adic
atunci cnd toate frecvenele relative nregistrate de cele n variante
statistice sunt egale ntre ele i egale, n consecin, cu 1/n. Aceasta
nseamn c valoarea minim a coeficientului de concentrare Gini, obinut
n cazul unei echirepartiii, este:

127

Prin urmare, coeficientul de concentrare Gini ia valori cuprinse pe


intervalul:

k fiind numrul de variante pe care le poate nregistra variabila statistic.


Coeficientul de concentrare Gini, la fel ca i energia informaional
Onicescu, prezint dezavantajul variabilitii valorii sale minime n funcie
de numrul de variante nregistrate de variabila statistic.
Acest inconvenient a fost nlturat prin elaborarea unei forme corectate a
coeficientului de concentrare Gini, propus de ctre Strck:

Coeficientul de concentrare propus de Strck corespunde, dup cum se


poate observa, formei corectate a energiei informaionale Onicescu, putnd
lua valori pe intervalul [0, 1].
5.3.

Statistici ale diversificrii

Statisticile diversificrii se determin n strns legtur cu statisticile


concentrrii statistice, fiind de fapt complementare acestora.
De exemplu, se poate determina raportul de diversificare, ca o statistic cu
o valoare complementar la unitate a raportului de concentrare:

128

unde:
Da reprezint raportul de diversificare pentru primele a variante;
Ca = raportul de concentrare pentru primele a variante;
a = un numr stabilit ca relevant n funcie de scopul cercetrii statistice i
de caracteristicile colectivitii statistice studiate;
Ri = frecvena relativ a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
Ni = frecvena absolut a variantei i a variabilei calitative dup care este
studiat colectivitatea statistic;
k = numrul de variante ale variabilei dup care este studiat colectivitatea
statistic;
N = volumul colectivitii statistice studiate.
Astfel, pentru repartiia statistic din tabelul 5.1 raportul de diversificare
D3 (a = 3) este, conform rezultatelor din tabelul 5.4 (n care sunt calculate
i frecvenele relative ale variantelor statistice):

Aceasta nseamn c 26,67% din studenii grupei studiate au obinut notele


cu cele mai mici frecvene de apariie (i.e. notele 4, 5 i 6).
n mod asemntor, se poate determina un indice de diversificare,
complementar indicelui de concentrare Hirschman-Herfindahl sau
energiei informaionale Onicescu.
Acest indice de diversificare este cunoscut n literatura de specialitate i
sub numele de valoare Agresti i se determin ca o valoare complementar
la unitate a indicelui de concentrare Hirschman-Herfindahl sau a energiei
informaionale Onicescu:
129

unde:
D reprezint indicele de diversificare;
H = indicele de concentrare Hirschman-Herfindahl;
Es = energia informaional Onicescu;
Ri = frecvena statistic relativ nregistrat pentru varianta i (Ri = 1);
s = numrul de variante ale variabilei statistice sau de stri ale sistemului
Onicescu.
Trebuie spus ns c n literatura de specialitate valoarea Agresti este
definit ntr-o manier probabilistic. Astfel, valoarea Agresti este dat de
suma probabilitilor ca dou uniti statistice dintr-o colectivitate statistic
s aparin la variante diferite ale variabilei statistice considerate:

unde:
VA reprezint valoarea Agresti;
pi = probabilitatea de nregistrare a variantei i a variabilei statistice
considerate;
qi = probabilitatea de nregistrare a unei variante diferite de varianta i a
variabilei statistice considerate;
s = numrul de variante ale variabilei statistice sau de stri ale sistemului
Onicescu.
Pornind de la considerentul c probabilitatea de nregistrare a variantei i a
variabilei statistice considerate poate fi estimat pe baza frecvenei relative
(Ri) de apariie a acesteia, rezult c valoarea Agresti se poate determina ca
valoare complementar a energiei informaionale Onicescu sau a indicelui
de concentrare Hirschman-Herfindahl:

130

Definia valorii Agresti n literatura de specialitate este, de fapt, definiia


unei msuri a varianei unei repartiii statistice dup o variabil calitativ,
ceea ce pune n eviden faptul c statisticile de concentrare sunt msuri
complementare ale variaiei statistice.
Dup cum se poate observa uor, valoarea Agresti poate varia pe intervalul
[0, 1 (1/s)].
Conform rezultatelor din tabelul 5.9, valoarea Agresti pentru repartiia
statistic din tabelul 5.1 este egal cu 1 0,2178 = 0,7822. ntruct aceast
valoare este destul de apropiat de valoarea maxim Agresti pentru aceast
repartiie (egal cu 1 (1/s) = 1 0,1 = 0,9), putem spune c avem de-a
face, n acest caz, cu o repartiie statistic diversificat.

131

132

DESCRIEREA STATISTIC
A VARIAIEI FA DE
TENDINA CENTRAL

6.

OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
variaiei, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
variaie;
s nelegei coninutul informaional al celor mai importante statistici de
variaie: abaterea medie liniar, variana, abaterea standard i coeficientul de
variaie;
s reinei utilitatea coeficientului de variaie n ce privete aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat;
s nelegei coninutul informaional al covarianei ca statistic de variaie
simultan (co-variaie) a dou variabile statistice.

n afara descrierii tendinei statistice centrale, pentru completarea tabloului


statistico-descriptiv sunt necesare i alte descrieri ale repartiiilor statistice
studiate.
Astfel, nu este suficient descrierea statistic a unei colectiviti studiate
doar cu ajutorul mediei, medianei i modei, ntruct pot exista repartiii
destul de diferite, care s fie caracterizate totui de statistici ale tendinei
centrale identice.
S presupunem, de exemplu, dou reele de magazine concurente, A i B,
formate din cte 7 magazine, la nivelul crora cifra de afaceri a nregistrat,
pe parcursul anului 2006, valorile din tabelul 6.1.
Tabelul 6.1
Cifra de afaceri nregistrat pe,
parcursul anului 2006, la nivelul
magazinelor din reea, n mil. RON

Total

Reeaua de
magazine A

15

12

12

59

Reeaua de
magazine B

15

13

14

59

La nivelul celor dou reele de magazine se obin pentru cele trei statistici
ale tendinei centrale urmtoarele valori:

Me(A) = Me(B) = 8 (rezultate n urma ordonrii cresctoare a valorilor);


Mo(A) = Mo(B) = 4 (cifra de afaceri cu frecvena cea mai mare).
Aadar, toate cele trei statistici ale tendinei centrale sunt identice pentru
cele dou iruri de valori nregistrate de ctre variabila cifr de afaceri.
Este fireasc ntrebarea: Prin ce anume sunt totui diferite din punct de
vedere statistic, n expresie sintetic, cele dou iruri de valori? Rspunsul
la aceast ntrebare este n legtur cu variaia statistic n jurul tendinei
centrale.
n figura 6.1 sunt prezentate grafic perechi de repartiii statistice care dei
sunt caracterizate de aceleai valori ale celor trei statistici ale tendinei
135

centrale, sunt diferite din punctul de vedere al variaiei statistice n jurul


acestei tendine centrale.
1. Variaie mare n jurul
mediei aritmetice

2. Variaie mic n jurul


mediei aritmetice

a. repartiii statistice simetrice

b. repartiii statistice oblice sau asimetrice

Figura 6.1
Statisticile de variaie rspund unor probleme ca:
verificarea reprezentativitii mediei ca valoare tipic a unei repartiii
statistice;
verificarea gradului de omogenitate al unei repartiii statistice;
verificarea sistematizrii corespunztoare a informaiilor prin gruparea
statistic utilizat;
caracterizarea gradului i a formei de variaie pentru o repartiie
statistic;
cunoaterea gradului de influen a factorilor/cauzelor dup care s-a
fcut gruparea unitilor statistice, fiind astfel posibil evidenierea
aciunii cauzelor eseniale, precum i separarea acesteia de aciunea
cauzelor ntmpltoare;
caracterizarea gradului i a formei de variaie n cadrul fiecrei grupe de
uniti statistice i calculul statisticilor de variaie dintre grupe.
136

Statisticile simple ale variaiei


Statisticile simple ale variaiei sunt uor de determinat i ele dau primele
informaii cu privire la gradul de mprtiere statistic a valorilor
nregistrate.
6.1.

Amplitudinea

Amplitudinea unui ir de valori nregistrate este diferena numeric dintre


cea mai mare i cea mai mic valoare ale acestuia. Amplitudinea se poate
calcula sub form absolut sau sub form relativ.
Amplitudinea absolut a variaiei
Amplitudinea absolut a variaiei se determin ca diferen absolut ntre
cea mai mare i cea mai mic valoare observat:

Dezavantajul acestei statistici l reprezint, ca i n cazul mediei aritmetice,


sensibilitatea ei prea mare la valorile extreme aberante. Ca atare,
amplitudinea este reprezentativ, ca i statistic a variaiei, doar pentru
repartiiile statistice cu un grad suficient de omogenitate.
Astfel, de exemplu, singurul ir de valori reprezentate n figura 6.2, pentru
care are relevan calculul amplitudinii, ca i statistic a variaiei, este irul
A.
iru l A

m in

m in

m ax

m ax

iru l B

m in

m ax

iru l C

Figura 6.2 Importana omogenitii statistice pentru relevana


amplitudinii ca statistic de variaie statistic
Amplitudinea absolut se exprim prin aceeai unitate de msur ca i
variabila analizat.
137

Din aceast cauz, utilizarea ei pentru comparaii se face numai repartiii


dup variabile statistice exprimate n uniti de msur identice.
Eliminarea acestui inconvenient se poate asigura prin calculul amplitudinii
relative a variaiei.
Amplitudinea relativ a variaiei (A %)
Amplitudinea relativ a variaiei se obine prin raportarea amplitudinii
absolute la media aritmetic a valorilor nregistrate:

Amplitudinea relativ se poate folosi i pentru comparaii ntre colectiviti


statistice studiate dup variabile de grupare exprimate n uniti de msur
diferite. Nici aceast statistic nu ofer ns posibilitatea cunoaterii
structurii interioare a colectivitii statistice studiate.
Amplitudinea variaiei statistice se folosete pentru alegerea numrului i a
mrimii intervalelor de grupare statistic.
Pentru o repartiie statistic dup o variabil continu definit pe intervale,
amplitudinea se calculeaz ca diferen ntre limita maxim a intervalului
superior i limita minim a intervalului inferior.
6.2.

Abaterile individuale

Variaia statistic se concretizeaz n abaterile valorilor individuale


nregistrate fa de tendina lor central, sintetizat, n mod obinuit, prin
media lor aritmetic sau, uneori, prin valoarea lor median. Aceste abateri
se pot exprima, de asemenea, ntr-o form absolut sau ntr-o form
relativ.
Abaterile individuale absolute.
Abaterile individuale absolute sunt abaterile, n cifre absolute, ale valorilor
individuale nregistrate fa de medie sau fa de median:

respectiv,

138

n practic se calculeaz, n special, abaterile individuale maxime:

respectiv,

Abaterile individuale relative


Abaterile individuale relative se obin prin raportarea abaterilor individuale
absolute la media aritmetic sau la mediana repartiiei statistice studiate:

respectiv,

Statisticile sintetice ale variaiei


Statisticile sintetice ale variaiei ofer informaii privind variaia la nivelul
ntregii colectiviti statistice studiate.
Statisticile sintetice ale variaiei sunt:
abaterea medie liniar:
variana sau dispersia:
abaterea medie ptratic, cunoscut sub denumirea de abatere standard:
139

coeficientul de variaie.
6.3.

Abaterea medie liniar

Abaterea medie liniar este media aritmetic a abaterilor individuale


absolute fa de media aritmetic:

La nivelul unei repartiii statistice, abaterea medie liniar se poate


determina cu ajutorul relaiei:

unde:
(|D|) reprezint abaterea medie liniar;
D = abateri individuale fa de media aritmetic;
F = frecvenele absolute care caracterizeaz repartiia statistic studiat;
R = frecvenele relative care caracterizeaz repartiia statistic studiat.
Este posibil ca n anumite situaii s prezinte interes calculul abaterii medii
liniare fa de median.
Pentru repartiiile statistice dup variabile continue definite pe intervale, n
determinarea abaterii medii liniare se iau n considerare, conveional, ca
valori reprezentative ale intervalelor, centrele acestora (C):

6.4.

Variana sau dispersia

Calculul varianei
Variana este o statistic sintetic de variaie a crei utilitate se extinde n
domeniul statisticii infereniale. Variana sau dispersia este media
aritmetic a ptratelor abaterilor individuale absolute fa de media
aritmetic. Ea se noteaz cu 2, iar relaiile ei de calcul sunt prezentate n
140

tabelul 6.2:
Tabelul 6.2
pentru iruri de valori

pentru repartiii statistice

unde:
D reprezint abaterile individuale fa de media aritmetic;
N = numrul de valori ale unei variabile simple, negrupate;
F = frecvenele absolute ale variantelor unei variabile grupate;
R = frecvenele relative ale variantelor unei variabile grupate.
Proprieti ale varianei
Cele mai importante proprieti ale varianei sunt:
pentru un ir de valori egale, variana este nul;
pentru orice variabil X, variana este egal cu diferena dintre media
aritmetic a ptratelor valorilor nregistrate de variabila X i ptratul
mediei aritmetice a variabilei X (media ptratelor minus ptratul
mediei...):

141

dac se adaug sau se scade o constant la fiecare valoare nregistrat


de o variabil X, variana acesteia nu se modific (a se vedea figura
6.3). Aceast proprietate deriv din proprietatea anterioar i din
proprietile mediei aritmetice:

unde a este o constant;


dac fiecare valoare individual nregistrat de o variabil X se
multiplic sau se mparte cu o constant, atunci variana acesteia se
multiplic sau se micoreaz cu ptratul acelei constante (a se vedea
figura 6.3):
142

unde a este o constant.

X1 = X c

X2 = X + c

X1 = X c

Figura 6.3
Pentru exemplificare, s considerm dou colectiviti statistice mici,
studiate dup o variabil pentru care s-au nregistrat urmtoarele valori
individuale:
A: 7, 8, 9, 10, 11, 12, 13
B: 1, 4, 7, 10, 13, 16, 19
Media aritmetic la nivelul ambelor colectiviti este 10.
Valorile individuale ale celor dou populaii sunt reprezentate pe axe
orizontale, n figura 6.4. Aa cum se observ n aceast figur, valorile
nregistrate la nivelul colectivitii B sunt mult mai dispersate fa de
media lor aritmetic dect valorile nregistrate la nivelul colectivitii A.
O prim msur a variaiei fa de medie o obinem determinnd
143

abaterile individuale fa de media aritmetic, reprezentate n figura 6.4


prin linii cu sgei.
Varianele pentru cele dou colectiviti sunt:

colectivitatea A

colectivitatea B

Figura 6.4
Deoarece abaterile individuale nregistrate la nivelul colectivitii B
sunt de 3 ori mai mari dect abaterile individuale nregistrate la nivelul
colectivitii A, variana nregistrat la nivelul colectivitii B este de 32
= 9 ori mai mare dect variana nregistrat la nivelul colectivitii A:

pentru dou constante a i b, relaia de calcul a varianei devine:

144

dac fiecare frecven absolut sau relativ a unei repartiii statistice se


multiplic sau se mparte cu o constant, atunci variana la nivelul
acelei repartiii nu se modific:

pentru repartiiile statistice dup variabile definite pe intervale,


deoarece n calcul se consider centrele de interval, variana calculat
145

este una aproximativ i nu exact; de asemenea, cu ct intervalele sunt


mai largi cu att variana este mai puin semnificativ;
pentru repartiiile statistice dup variabile alternative, pentru calculul
varianei se folosete relaia:

unde p reprezint ponderea nregistrrilor variantei de tipul Da;


variana, ca i media aritmetic, este sensibil la valorile aberante;
variana nu poate fi folosit dect la comparaii privind variaia
statistic nregistrat la nivelul unor colectiviti de dimensiuni egale i
studiate dup aceeai variabil;
variana este util n determinarea mai multor statistici necesare n
demersul de infereniere statistic;
pentru o repartiie statistic bivariat (repartiie statistic dup dou
variabile considerate simultan), se poate verifica regula de adunare a
varianelor: variana la nivelul ntregii repartiii este egal cu suma
dintre media aritmetic a varianelor pariale i variana mediilor
aritmetice pariale (media varianelor plus variana mediilor....). Pentru
nelegerea acestei proprieti importante, este util exemplul care
urmeaz.
Exemplu privind regula de adunare a varianelor
S considerm o colectivitate format din 34 de studeni pentru care s-a
obinut repartiia statistic bivariat din tabelul 6.3 (dup variabilele X =
nota obinut la examenul susinut la disciplina statistic i Y =
frecvena la cursurile disciplinei statistic).
Tabelul 6.3
Y

10

11

Frecvene
pariale

12

Frecvene
pariale

10

34

146

S verificm regula de adunare a varianelor pentru variabila Y


condiionat de variabila X:

unde:
VAR(Y) reprezint variana nregistrat la nivelul variabilei Y;
(Y/X) = mediile aritmetice pariale nregistrate la nivelul variabilei Y
condiionat de variantele nregistrate de variabila X;
VAR(Y/X) = varianele pariale nregistrate la nivelul variabilei Y
condiionat de variantele nregistrate de variabila X.
Pentru verificarea regulii de adunare a varianelor este util dezvoltarea
tabelului 6.3 prin adugarea unor coloane pentru calculele intermediare
necesare. Se obine, astfel, tabelul 6.4:
Tabelul 6.4
Y

Total,
[F(Y/X)]

[YF(Y/X)]

Medii pariale,

9 10 11

67

8,3750

12

112

9,3333

89

9,8889

(Y/X)

(73) + (82) = 37 37/5 = 7,4000

(Y) = 305/34

Total

4 8 10 9 3

34

305

= 8,9706

Conform rezultatelor din tabelul 6.4, media aritmetic general i variana


nregistrate la nivelul variabilei Y sunt:

147

Mediile pariale ale variabilei Y sunt mediile valorilor pe care le


nregistreaz aceasta condiionat de variantele variabilei X. De exemplu, la
nivelul celor 5 studeni care au obinut nota 5, s-a nregistrat o prezen
medie la cursuri de 7,4000. Pentru verificarea relaiei de adunare a
varianelor, trebuie s determinm variana acestor medii pariale n jurul
mediei lor, aceasta din urm fiind identic cu media general a variabilei
Y. S determinm, aadar, variana mediilor pariale ale variabilei Y:

Trebuie s mai determinm media varianelor pariale ale variabilei Y,


condiionat de variabila X: [VAR(Y/X)], unde VAR(Y/X) = (Y2/X)
[(Y/X)]2. Pentru aceasta construim tabelele 6.5 i 6.6.
Conform rezultatelor din tabelul 6.6, media varianelor pariale ale
variabilei Y, condiionat de variabila X este:

148

Se poate verifica acum relaia de adunare a varianelor pentru variabila Y


condiionat de variabila X:

Tabelul 6.5
Y2
X

[Y2F(Y2/X)]

49 64 81 100 121 Total

(Y2/X)

5 (493) + (642) = 275 275/5 = 55,0000

567

70,8750

12

1054

87,8333

885

98,3333

4 8 10 9

34

2781

Total

Tabelul 6.6
X

[F(Y/X)] (Y/X) [(Y/X)]2 (Y2/X) VAR(Y/X) = (Y2/X) [(Y/X)]2

7,4000

54,7600 55,0000

0,2400 = 55,0000 54,7600

8,3750

70,1406 70,8750

0,7344

12

9,3333

87,1111 87,8333

0,7222

9,8889

97,7901 98,3333

0,5432

Total

34

Analiza de varian (ANOVA) metod disponibil pentru verificarea


semnificaiei factorului/factorilor principal(i) de grupare
O aplicaie foarte important derivat din regula de adunare a varianelor o
constituie analiza de varian (ANOVA = ANalysis Of VArinace).
ANOVA, denumit i analiz dispersional const n determinarea gradului
n care valorile reale ale unei variabile statistice se abat de la valorile
teoretice, calculate ca statistici medii sau pe baza ecuaiilor de regresie
statistic.
Ceea ce face foarte util ANOVA este n legtur cu studirea preliminar a
legturii statistice dintre dou sau mai multe variabile statistice de grupare
a colectivitii statistice studiate, constituindu-se astfel i ca metod de
149

verificare a reprezentativitii unui eantion statistic, etap preliminar


deosebit de important pentru inferenierea statistic. Acesta este motivul
pentru care ANOVA va fi abordat n cadrul volumului dedicat statisticii
infereniale.
6.5.

Abaterea medie ptratic sau abaterea standard

Calculul abaterii standard


Abaterea medie ptratic, numit i abaterea standard, este media ptratic
a abaterilor valorilor nregistrate fa de media lor aritmetic.
Abaterea standard se poate determina ca rdcin ptratic a varianei:

Pentru exemplificare, n tabelul 6.7 este calculat abaterea standard a


notelor acordate de ctre 5 experi pentru calitatea a dou produse.
Tabelul 6.7
Produsul

Note

(|D|)

D2

-1

+1

4/7 = 0,57

+1

-1

-2

+2

6/7 = 0,86

-1

+1

150

4/7 = 0,57

0,755

10/7 = 1,43

1,196

Proprieti ale abaterii standard


Principalele proprieti ale abaterii standard sunt:
Abaterea standard se exprim n unitatea de msur n care se exprim
i variantele variabilei studiate, motiv pentru care ea nu poate fi folosit
pentru comparaia variaiei a dou repartiii statistice dup variabile
exprimate n uniti de msur diferite. De asemenea, nu se pot
compara, din punctul de vedere al abaterii standard, dou populaii ale
cror valori au ordine de mrime diferite, rezultatul comparaiei fiind
unul deformat. Statistica cu ajutorul creia se pot nltura aceste
neajunsuri este coeficientul de variaie, obinut prin relativizarea n
funcie de media aritmetic a abaterii standard;
Abaterea medie ptratic este mai mare sau egal fa de abaterea medie
liniar. Aceast proprietate rezult din relaia de mrime dintre media
aritmetic i media ptratic;
Abaterea standard se folosete n calculele de corelaie i regresie
statistic, precum i n inferenierea statistic (la estimarea erorilor de
sondaj, la verificarea semnificaiei anumitor statistici etc.);
i n cazul abaterii medii ptratice se pstreaz neajunsul sensibilitii la
valorile aberante;
Abaterea standard se folosete i pentru alctuirea de intervale
semnificative din punct de vedere statistic la nivelul colectivitii
statistice studiate. Aceste intervale sunt construite n jurul mediei i au o
utilitate n inferenierea statistic. Asemenea intervale sunt, de exemplu:
( ; + ), ( 2; + 2) etc.
6.6.

Coeficientul de variaie sau de omogenitate

Coeficientul de variaie este statistica propus de Karl Pearson pentru a


rspunde necesitii de comparaie din punctul de vedere al variaiei pentru
oricare dou sau mai multe repartiii statistice.
Coeficientul de variaie este rezultatul relativizrii abaterii standard la
media aritmetic a repartiiei statistice studiate:

unde:
V(X) repezint coeficientul de variaie la nivelul repartiiei statistice dup
variabila X;
(X) = abaterea standard la nivelul repartiiei statistice dup variabila X;
151

(X) = media aritmetic la nivelul repartiiei statistice dup variabila X,


medie n jurul creia s-au nregistrat abaterile sintetizate n statistica (X).
Pentru o mai mare expresivitate, coeficientul de variaie se exprim n
procente:

S considerm, pentru exemplificare, datele din tabelul 6.8, referitoare la


vnzrile nregistrate ntr-o perioad de 5 luni pentru dou produse diferite
(A i B),.
Mediile aritmetice ale vnzrilor nregistrate pentru cele dou produse
sunt:
pentru produsul A: A = 41/5 = 8,2 tone;
pentru produsul B: B = 47/5 = 9,4 mil. RON.
B

Tabelul 6.8
Luna

Total

Produsul A - tone

13

10

41

Produsul B - mil. RON

17

10

47

Statisticile de variaie ale vnzrilor nregistrate pentru cele dou produse


sunt determinate n tabelul 6.9.
Dei valorile statisticilor de variaie sunt mai mari la nivelul produsului B,
nu putem afirma c variaia vnzrilor din acest produs este mai mare dect
variaia vnzrilor din produsul A, deoarece unitile de msur ale
acestora sunt diferite (tone pentru produsul A; milioane RON pentru
produsul B). Prin anularea unitilor de msur la nivelul coeficienilor de
variaie se nltur acest neajuns:
pentru produsul A: V(A)% = (3,12/6,2) 100 = 50,39%;
pentru produsul B: V(B)% = (4,13/9,4) 100 = 43,91%.
Se poate observa c variaia cea mai mare se nregistreaz la nivelul
vnzrilor pentru produsul A, n ciuda faptului c abaterea medie liniar,
variana i abaterea standard nregistreaz toate valori mai mari pentru
vnzrile din produsul B.

152

Tabelul 6.9
Produsul

6.7.

(|D|)

|D|

D2

4,2

17,64

0,2

0,04

11

31/5 = 6,2

4,8

13,2/5 = 2,64

23,04

1,8

3,24

2,2

4,84

31

13,2

48,8

2,4

5,76

1,4

1,96

17

47/5 = 9,4

7,6

16,4/5 = 3,28

57,76

10

0,6

0,36

4,4

19,36

47

16,4

85,2

48,8/5 = 9,76
= 3,12

85,2/5 = 17,04
= 4,13

Alegerea statisticilor de variaie

Alegerea statisticilor de variaie trebuie s se fac n funcie de tipul de


variabil dup care se realizeaz cercetarea statistic:
dac variabila statistic este una nominal (sau calitativ), analiza
variaiei statistice nu are sens:
dac variabila este una de ordine (ale cror valori sunt note de
importan, cum este de exemplu calitatea avnd ca i variante: calitatea
I, calitatea II, calitatea III etc.) variaia statistic se descrie cu ajutorul
intervalelor intercuantilice: Q3 Q1 (intervalul intercuartilic); Q9 Q1
(intervalul interdecilic); Q99 Q1 (intervalul intercentilic) etc.;
dac variabila este una cantitativ, variaia statistic se descrie cu
ajutorul abaterii medii liniare, al varianei, al abaterii standard sau al
coeficientului de variaie, n funcie de scopul analizei;
6.8.

Momente centrate i momente necentrate

Media i dispersia sunt cazuri particulare de momente ale unei repartiii


statistice.
153

Se numete moment de ordinul p n raport cu un parametru cunoscut a,


valoarea:

unde;
X reprezint variabila statistic;
N = volumul colectivitii statistice;
F = frecvenele absolute nregistrate de ctre variantele variabilei statistice.
Momentele de ordinul p, cu parametrul a = 0 se numesc momente
necentrate, iar momentele de ordinul p, cu parametrul a = (X) se numesc
momente centrate.
Se observ c momentul necentrat de ordinul 1 este chiar media aritmetic,
iar momentul centrat de ordinul 2 este chiar variana.
6.9.

Covariana

Covariana este variana simultan a dou variabile:

Pentru dou variabile identice, covariana este identic cu variana


statistic:

Proprieti ale covarianei


Covariana poate lua att valori pozitive, ct i valori negative.
Covariana este pozitiv atunci cnd predomin tendina de variaie n
acelai sens pentru cele dou variabile, ceea ce face ca suma produselor
abaterilor individuale ale lor s fie pozitiv. Covariana este negativ
atunci cnd predomin tendina de variaie n sensuri opuse pentru cele

154

dou variabile, ceea ce face ca suma produselor abaterilor individuale


ale lor s fie negativ;
Covariana unei variabile X cu o variabil constant (a) este nul:

Covariana este comutativ:

unde X, Y sunt variabile statistice;


DX = abaterile individuale ale valorilor variabilei X;
DY = abaterile individuale ale valorilor variabilei Y;
Pentru dou variabile X i Y, covariana este egal cu diferena dintre
media aritmetic a produselor valorilor simultane ale variabilelor i
produsul mediilor aritmetice ale valorilor simultane ale variabilelor
(media produselor minus produsul mediilor...):

155

Aceast relaie este una de calcul simplificat al covarianei.


Covariana este distributiv n raport cu adunarea sau scderea
variabilelor:

unde X, Y i Z sunt variabile statistice;


Adugarea sau scderea unei constante la toate valorile nregistrate de o
variabil X nu determin modificarea covarianei sale cu o variabil Y:

unde a reprezint o constant;


Multiplicarea sau mprirea cu o constant a tuturor valorilor
nregistrate de o variabil X determin multiplicarea sau mprirea cu
aceeai constant a covarianei sale cu o variabil Y:
156

unde a reprezint o constant;


Prin raportarea ei la produsul abaterilor standard nregistrate pentru
dou variabile X i Y, covariana este util n msurarea corelaiei
statistice dintre acestea:

157

158

DESCRIEREA STATISTIC
A FORMEI
REPARTIIILOR
STATISTICE UNIMODALE:
OBLICITATEA I
KURTOSISUL

7.

OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
formei repartiiilor statistice unimodale, ajutndu-v:
s nelegei semnificaia noiunilor folosite n legtur cu descrierea statistic
a formei repartiiilor statistice unimodale: oblicitatea i kurtosis-ul;
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor
disponibile pentru descrierea formei repartiiilor statistice unimodale;
s reinei utilitatea noiunii de simetrie/asimetrie pentru aprecierea
reprezentativitii mediei aritmetice pentru o colectivitate statistic studiat.

160

Statisticile de variaie prezentate n capitolul 6 ofer doar informaii n


legtur cu cantitatea de variaie nregistrat n jurul unei valori centrale
(media aritmetic sau mediana). Deseori prezint ns interes i
cunoaterea formei acestei variaii, aceasta putnd diferenia repartiii
statistice pentru care se nregistreaz o cantitate echivalent de variaie
statistic. Forma variaiei repartiiilor statistice unimodale poate fi
descris cu ajutorul a 2 tipuri de statistici:
statistici de oblicitate, care exprim gradul de asimetrie al variaiei n
jurul mediei aritmetice;
statistici ale kurtosis-ului, care exprim gradul n care valorile
extreme contribuie la cantitatea de variaie nregistrat.
7.1.

Statisticile de oblicitate

Oblicitatea unei repartiii statistice unimodale exprim gradul de


asimetrie al variaiei n jurul modei, ca statistic a tendinei centrale.
O repartiie statistic unimodal este simetric atunci cnd valorile
nregistrate sunt identic dispersate de o parte i de alta a modei acesteia.
Pentru o astfel de repartiie, cele trei statistici principale care descriu
tendina central (media aritmetic, mediana i moda) coincid (a se vedea
figura 7.1).
Frecvene

Variabila X
Me = = Mo

Figura 7.1 Repartiia statistic simetric


Oblicitatea sau asimetria repartiiilor statistice unimodale poate fi
pozitiv sau negativ, dup cum prelungirea irului de frecvene statistice
161

se constat n dreapta (figura 7.2, a) sau n stnga modei (figura 7.2, b).
a. oblicitate sau asimetrie
pozitiv

moda
mediana

b. oblicitate sau asimetrie


negativ

media
aritmetic

media
aritmetic

moda
mediana

Figura 7.2 Repartiii statistice asimetrice


Principalele statistici propuse pe parcursul timpului pentru msurarea
gradului de oblicitate sunt:
coeficientul de oblicitate al lui Yule i Kendall (OYK);
coeficientul de oblicitate 1 al lui Pearson;
coeficientul de oblicitate 1 al lui Fisher.
Coeficientul de oblicitate al lui Yule i Kendall
Scoianul George Udny Yule (18 februarie, 1871 26 iunie, 1951) i
britanicul Maurice George Kendall (6 septembrie, 1907 29 martie,
1983) sunt statisticienii care au propus ca i statistic pentru msurarea
gradului de oblicitate un coeficient calculat n funcie de poziiile
cuartilelor laterale fa de cuartila median:

unde:
OYK reprezint coeficientul de oblicitate al lui Yule i Kendall;
Q1 i Q3 = cuartilele laterale (prima i, respectiv, a treia cuartil) ale
repartiiei pentru care se determin gradul de oblicitate;
Me = cuartila median a repartiiei pentru care se determin gradul de
oblicitate;
162

IQ = intervalul intercuartilic al repartiiei pentru care se determin gradul


de oblicitate.
Pentru o repartiie statistic simetric cuartilele laterale sunt egal
distanate fa de median, ceea ce nseamn c OYK = 0 (a se vedea
figura 7.3).
F

(Me Q1) = (Q3 Me)


OYK = 0

Q1

Me

Q3

Figura 7.3 Coeficientul lui Yule i Kendall pentru o repartiie


statistic simetric
Pentru o repartiie statistic cu oblicitate pozitiv, cuartila a treia este mai
distanat fa de median dect prima cuartil, ceea ce nseamn c OYK
> 0, (a se vedea figura 7.4).
F

Deoarece (Q3 Me) > (Me Q1), OYK = +/+ = +


Cu ct OYK este mai mare, cu att oblicitatea
pozitiv este mai pronunat (frecvenele se
etaleaz mai mult la dreapta).
X
Q1

Me

Q3

Figura 7.4 Coeficientul lui Yule i Kendall pentru o repartiie cu


oblicitate pozitiv
n cazul a dou repartiii comparabile din punctul de vedere al variabilei
i al populaiei statistice, oblicitatea pozitiv este mai pronunat pentru
cea al crei coeficient OYK este mai mare.
Pentru o repartiie statistic cu oblicitate negativ, prima cuartil este mai
distanat fa de median dect cea de-a treia cuartil, ceea ce nseamn
163

c OYK < 0. O asemenea repartiie este reprezentat n figura 7.4:


F
Deoarece (Q3 Me) > (Me Q1),
OYK = /+ =
Cu ct valoare absolut a lui OYK
este mai mare, cu att oblicitatea
negativ este mai pronunat
(frecvenele se etaleaz mai mult
la stnga).

X
Q1

Me

Q3

Figura 7.5 Coeficientul lui Yule i Kendall pentru o repartiie cu


oblicitate negativ
n cazul a dou repartiii comparabile din punctul de vedere al variabilei
i al populaiei statistice, oblicitatea negativ este mai pronunat pentru
cea al crei coeficient OYK are o valoare absolut mai mare.
Pentru exemplificare, s revenim la repartiia statistic din tabelul 4.2.
Valoarea calculat a medianei (cuartila a doua) este de 782,1429 RON.
Pentru determinarea coeficientului lui Yule i Kendall, mai trebuie
calculate valorile celorlalte dou cuartile, Q1 i Q3.
Rangurile acestor dou cuartile sunt:

Intervalele n care se afl cele dou cuartile sunt identificate cu ajutorul


tabelului 7.1. Astfel, prima cuartil apare n intervalul (700 750), iar cea
de-a treia cuartil apare n intervalul (800 850).
Prin urmare, cuartilele laterale sunt:

164

Tabelul 7.1
Grupe de salarii
(RON)

Numr de Frecvene cumulate


muncitori

600 650

650 700

15

18

700 750

19

37 (> 25 = RQ1)

750 800

21

58

800 850

20

78 (> 75 = RQ3)

850 900

17

95

900 950

99

950 1000

100

Total

N = 100

Putem determina acum coeficientul de oblicitate al lui Yule i Kendall:

165

Valoarea negativ, dar mic a coeficientului de asimetrie indic o uoar


asimetrie negativ a repartiiei statistice.
Coeficienii de oblicitate ai lui Pearson
Primul coeficient de oblicitate propus de ctre statisticianul britanic Karl
Pearson (27 martie 1857 27 aprilie 1936) este rezultatul raportrii
distanei dintre media aritmetic i mod (nenul n cazul existenei
oblicitii) la abaterea standard (ca msur a variaiei statistice):

unde:
OP1 reprezint primul coeficient de oblicitate al lui Pearson;
= media aritmetic a repartiiei statistice studiate;
Mo = moda repartiiei statistice studiate;
= abaterea standard a repartiiei statistice studiate.
n cazul repartiiilor statistice simetrice, acest coeficient de oblicitate este
egal cu zero, deoarece pentru aceste repartiii are loc egalitatea dintre
media aritmetic i mod (a se revedea figura 7.1). Aadar, cu ct primul
coeficient de oblicitate al lui Pearson este mai apropiat de 0, cu att
repartiia statistic studiat este mai simetric.
Pentru repartiiile statistice cu oblicitate pozitiv > Mo (a se revedea
figura 7.2, a). Prin urmare, pentru asemenea repartiii ( Mo) > 0. Cum
abaterea standard este ntodeauna nenul, rezult c o valoare pozitiv a
celui dinti coeficient de oblicitate propus de Pearson indic existena
unei obliciti pozitive pentru repartiia statistic studiat.
Pentru repartiiile statistice cu oblicitate negativ < Mo (a se revedea
166

figura 7.2, b). Prin urmare, pentru asemenea repartiii ( Mo) < 0.
Rezult c o valoare negativ a celui dinti coeficient de oblicitate propus
de Pearson indic existena unei obliciti negative pentru repartiia
statistic studiat.
Cu ct oblicitatea unei repartiii statistice este mai pronunat, cu att
distana dintre media aritmetic i mod se apropie mai mult de valoarea
abaterii standard [( Mo) ]. Prin urmare, o valoare apropiat de 1
a celui dinti coeficient de oblicitate propus de Pearson indic existena
unei obliciti mai pronunate pentru repartiia statistic studiat.
Pornind de la constatarea c pentru repartiiile statistice moderat oblice
distana dintre media aritmetic i mod este de aproximativ trei ori mai
mare dect distana dintre media aritmetic i median [( Mo) 3(
Me), a se revedea figura 7.2, a i b], Karl Pearson a propus, pentru
asemenea repartiii statistice, i un al doilea coeficient de oblicitate:

unde:
OP2 reprezint cel de-al doilea coeficient de oblicitate al lui Pearson;
= media aritmetic a repartiiei statistice studiate;
Me = mediana repartiiei statistice studiate;
= abaterea standard a repartiiei statistice studiate.
Interpretarea celui de-al doilea coeficient de oblicitate al lui Pearson este
similar interpretrii celui dinti coeficient de oblicitate al lui Pearson, cu
meniunea c aplicabilitatea sa este restrns la cazul repartiiilor
statistice moderat oblice.
Coeficientul de oblicitate 1 al lui Pearson
Un alt coeficient de oblicitate propus de Karl Pearson este coeficientul 1,
determinat ca raport ntre ptratul momentului centrat de ordinul 3 i
cubul momentului centrat de ordinul 2:

167

unde:
1 reprezint coeficientul 1 de oblicitate al lui Pearson;
2 = momentul centrat de ordinul 2 al repartiiei statistice studiate;
3 = momentul centrat de ordinul 3 al repartiiei statistice studiate;
D = abaterile individuale nregistrate fa de media aritmetic;
= abaterea standard a repartiiei statistice studiate;
2 = variana repartiiei statistice studiate;
N = volumul colectivitii a crei repartiie statistic este studiat.
Coeficientul de oblicitate 1 al lui Fisher
Statisticianul britanic Ronald Fisher a propus ca i coeficient de oblicitate
aa-numitul coeficient 1, determinat ca rdcin a coeficientului 1 de
oblicitate al lui Pearson:

Interpretarea sensului oblicitii cu ajutorul coeficienilor 1 i 1 are la


baz interpretarea semnului momentului centrat de ordinul 3:
dac 3 > 0, atunci repartiia statistic studiat este caracterizat de o
oblicitate pozitiv. Explicaia const n faptul c 3 > 0 doar atunci
cnd suma abaterilor individuale pozitive fa de medie este mai mare
dect suma abaterilor individuale negative fa de medie, condiie
ndeplinit n cazul repartiiilor cu oblicitate pozitiv;
dac 3 < 0, atunci repartiia statistic studiat este caracterizat de o
oblicitate negativ. Explicaia const n faptul c 3 < 0 doar atunci
cnd suma abaterilor individuale negative fa de medie este mai mare
168

dect suma abaterilor individuale pozitive fa de medie, condiie


ndeplinit n cazul repartiiilor cu oblicitate negativ;
dac 3 = 0, atunci repartiia statistic studiat este una simetric.
Intensitatea oblicitii, dac aceasta exist, este cu att mai mare cu ct
valoarea coeficienilor 1 sau 1 este mai deprtat de 0.
Pentru exemplificarea determinrii oblicitii cu ajutorul coeficienilor 1
i 1, s considerm irul celor 15 valori nregistrate de ctre variabila X,
din tabelul 7.2.
Tabelul 7.2
Numr curent

X D (= X )

D2

D3

-5,2

27,04

-140,608

-3,2

10,24

-32,768

12

3,8

14,44

54,872

-0,2

0,04

-0,008

-4,2

17,64

-74,088

11

2,8

7,84

21,952

14

5,8

33,64

195,112

-7,2

51,84

-373,248

15

6,8

46,24

314,432

10

0,8

0,64

0,512

11

10

1,8

3,24

5,832

12

-3,2

10,24

-32,768

13

-1,2

1,44

-1,728

14

13

4,8

23,04

110,592

15

-2,2

4,84

-10,648

123

252,4

37,44

/N 8,2 (= )

16,8267 (= 2)

2,496 (= 3)

169

Conform rezultatelor din tabelul 7.2, se poate constata existena unei


oarecare obliciti pozitive, indicat de semnul pozitiv al momentului
central de ordinul 3, iar pentru coeficienii de oblicitate 1 i 1 se obin
urmtoarele valori:

Valorile mici ale coeficienilor de oblicitate 1 i 1 indic un grad redus


de oblicitate pentru irul de valori considerat, fapt evideniat de altfel i n
urma reprezentrii grafice a repartiiei statistice a acestor valori (a se
vedea figura 7.6).

Figura 7.6
7.2.

Statisticile de kurtosis

Termenul statistic kurtosis provine din cuvntul grecesc kurtos, care


nseamn umflat, bombat.
n funcie de kurtosis se pot ntlni repartiiile statistice:
leptocurtice 1 , pentru care kurtosis-ul este pozitiv;

Etimologic, leptocurtic nseamn cu umfltur sau cocoa subire (leptos = gr. subire).

170

mezocurtice, pentru care kurtosis-ul este nul (cele mai cunoscute


repartiii mezocurtice sunt repartiiile statistice normale, a se vedea
figura 7.7);
platicurtice 2 , pentru care kurtosis-ul este negativ.
Din punct de vedere grafic, o repartiie cu un kurtosis pozitiv are un
vrf mai ascuit i cozi mai plate (a se vedea figura 7.8, a), n timp ce
o repartiie cu un kurtosis negativ are un vrf mai rotunjit i umeri
mai largi (a se vedea figura 7.8, b).
F

Figura 7.7 Repartiie statistic normal

vrf
ascuit

vrf
rotunjit
coad
plat

a. kurtosis pozitiv

umr
larg

b. kurtosis negativ

Figura 7.8 Repartiii statistice lepto- (a) i plati-curtice (b)


Din punctul de vedere al variaiei statistice, o repartiie statistic are
kurtosis pozitiv atunci cnd unei variaii mici a variabilei dup care este
construit i corespunde o variaie mare a frecvenelor sale relative; la
polul opus, o repartiie statistic are kurtosis negativ atunci cnd unei
2

Etimologic, platicurtic nseamn cu umfltur sau cocoa lat (platus = gr. lat).

171

variaii mari a variabilei dup care este construit i corespunde o variaie


mic a frecvenelor sale relative.
Coeficientul de kurtosis 2 al lui Pearson
Karl Pearson a propus ca i statistic a kurtosis-ului aa-numitul
coeficient 2, definit ca raport ntre momentul centrat de ordinul 4 i
ptratul momentului centrat de ordinul 2:

unde:
2 reprezint coeficientul 2 de kurtosis al lui Pearson;
2 = momentul centrat de ordinul 2 al repartiiei statistice studiate;
4 = momentul centrat de ordinul 4 al repartiiei statistice studiate;
D = abaterile individuale nregistrate fa de media aritmetic;
N = volumul colectivitii a crei repartiie statistic este studiat;
= abaterea standard a repartiiei statistice studiate.
Interpretarea kurtosis-ului unei repartiii statistice cu ajutorul acestui
coeficient este urmtoarea:
o valoare cuprins ntre 1 i 3 este caracteristic unei repartiii
platicurtice;
o valoare apropiat de 3 este caracteristic unei repartiii normale;
o valoare mai mare dect 3 este caracteristic unei repartiii
leptocurtice.
Coeficientul de kurtosis 2 al lui Fisher (coeficientul de exces de
kurtosis)
Cu ajutorul coeficientului de kurtosis 2 al lui Fisher se determin excesul
de kurtosis al repartiiei statistice studiate fa de kurtosis-ul repartiiilor
statistice normale:

172

Interpretarea acestui coeficient este urmtoarea:


o valoare mai mic dect 0 este caracteristic unei repartiii
platicurtice;
o valoare apropiat de 0 este caracteristic unei repartiii normale;
o valoare mai mare dect 0 este caracteristic unei repartiii
leptocurtice.
Pentru exemplificarea determinrii kurtosis-ului s considerm irul celor
15 valori nregistrate de ctre variabila X, din tabelul 7.2. n tabelul 7.3
sunt realizate calculele suplimentare necesare.
Tabelul 7.3
Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

D2

D4

27,04
10,24
14,44
0,04
17,64
7,84
33,64
51,84
46,24
0,64
3,24
10,24
1,44
23,04
4,84
252,4

731,1616
104,8576
208,5136
0,0016
311,1696
61,4656
1131,6496
2687,3856
2138,1376
0,4096
10,4976
104,8576
2,0736
530,8416
23,4256
8046,448

16,8267 (= 2)

536,4299 (= 4)

X D (= X )
3
-5,2
5
-3,2
3,8
12
-0,2
8
-4,2
4
2,8
11
5,8
14
-7,2
1
15
6,8
0,8
9
1,8
10
5
-3,2
-1,2
7
4,8
13
-2,2
6
123

/N 8,2 (= )

173

Conform rezultatelor din tabelul 7.3, pentru coeficienii de kurtosis se


obin urmtoarele valori:

Valoarea coeficientului 2 indic un kurtosis negativ, ceea ce nseamn c


repartiia statistic a celor 15 valori este una platicurtic, aa cum se poate
constata, de altfel, i cu ajutorul reprezentrii grafice din figura 7.6.

174

DESCRIEREA STATISTIC
A LEGTURILOR DINTRE
FENOMENE

8.

OBIECTIVELE CAPITOLULUI
n acest capitol sunt prezentate statisticile disponibile pentru descrierea statistic a
corelaiei dintre dou sau mai multe variabile, ajutndu-v:
s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor de
corelaie i regresie;
s nelegei coninutul informaional al celor mai importante statistici de
corelaie i regresie: coeficientul de corelaie liniar Pearson, coeficienii de
regresie liniar i raportul de determinaie;
s stpnii metoda celor mai mici ptrate de eroare ca metod de regresie
statistic.

8.1.

Ce este corelaia statistic?

Prin corelaie statistic se nelege intensitatea i direcia legturii


statistice dintre dou sau mai multe variabile. Este important de reinut
faptul c legtura sau corelaia statistic dintre dou sau mai multe
variabile nu implic necesar i legtura cauzal dintre acestea.
8.2.

Coeficientul de corelaie liniar Pearson

Karl Pearson a propus ca statistic de msurare a intensitii i direciei


legturii statistice liniare dintre dou variabile coefcientul care-i poart
numele, definit ca raport ntre covariana statistic i produsul abaterilor
standard ale variabilelor studiate:

unde (X, Y) reprezint coeficientul de corelaie liniar Pearson;


(X, Y) = covariana statistic a variabilelor X i Y;
(X), (Y) = abaterile standard ale variabilelor X i Y.
Proprieti ale coeficientului de corelaie liniar Pearson
coeficientul de corelaie liniar Pearson poate nregistra valori cuprinse
ntre 1 i +1. ntruct abaterile standard nu pot fi negative, nseamn c
semnul coeficientului de corelaie liniar Pearson este dat de semnul
covarianei. Deoarece covariana este pozitiv atunci cnd predomin
tendina de variaie n acelai sens pentru variabilele studiate, nseamn
c o valoare pozitiv a coeficientului de corelaie liniar Pearson indic
o corelaie statistic direct ntre variabile. Invers, ntruct covariana
este negativ atunci cnd predomin tendina de variaie n sensuri
opuse pentru variabilele studiate, nseamn c o valoare negativ a
coeficientului de corelaie liniar Pearson indic o corelaie statistic
invers ntre variabile;
coeficientul de corelaie liniar Pearson dintre o variabil X i o
variabil constant este egal cu 0:

unde a este o variabil constant;


177

dac ntre dou variabile exist o legtur funcional liniar, atunci


coeficientul de corelaie liniar Pearson nregistreaz valorile 1:

unde ecuaia Y = aX + b exprim legtura liniar funcional dintre


variabilele X i Y (a, b = constantele care definesc legtura liniar
funcional);
coeficientul de corelaie liniar Pearson este comutativ:

unde X, Y sunt variabile statistice;


adugarea sau scderea unei constante la toate valorile nregistrate de o
variabil X nu determin modificarea coeficientului de corelaie liniar
Pearson dintre variabila X i o alt variabil Y:

unde a reprezint o constant;


multiplicarea sau mprirea cu o constant a tuturor valorilor
nregistrate de o variabil X nu determin modificarea coeficientului de
corelaie liniar Pearson dintre variabila X i o alt variabil Y:

178

unde a reprezint o constant;


coeficientul de corelaie liniar Pearson este invariant la schimbarea
originii i a unitii de scar (a se vedea i figura 8.1):

S considerm, de exemplu, variabilele X i Y din tabelul 8.1.


Tabelul 8.1
X

0,1

0,4

0,3

0,8

0,2

0,5

0,7

0,1

0,9

0,13

0,6

0,9

0,5

0,7

Alegnd parametrii a = 2,3; b = 5; a' = 7 i b' = 3,4 se obin valorile din


tabelul 6.2, reprezentate grafic n figura 8.1.

179

Tabelul 8.2.
X

aX+b

a'Y+b'

0,1

0,4

5,23

6,20

0,3

0,8

5,69

9,00

0,2

0,5

5,46

6,90

0,7

0,1

6,61

4,10

0,9

0,13

7,07

4,31

0,6

0,9

6,38

9,70

0,5

0,7

6,15

8,30

Figura 8.1
Aa cum se observ i n figura 8.1, pentru cele dou perechi de
variabile corelaia este identic, ceea ce difer fiind doar scara de
mrime. Este, prin urmare, firesc s se menin identitatea i n ce
privete coeficientul de corelaie liniar Pearson:

180

respectiv,

8.3.

Regresia statistic liniar

Regresia statistic este folosit pentru modelarea legturilor statistice


dintre variabile. Modelele construite prin regresie pot fi folosite apoi la
realizarea de predicii statistice.
Prin regresia statistic se modeleaz legturile statistice dintre una sau mai
multe variabile endogene (denumite i variabile prezise, explicate sau
dependente, i notate uzual cu Y) i una sau mai multe variabile exogene
(denumite i variabile predictoare, explicative sau independente, i notate
uzual cu X).
Tipuri de regresie statistic
Pentru regresia statistic sunt disponibile modele liniare, construite pe
baza unor ecuaii sau funcii matematice liniare, i modele neliniare,
construite pe baza unor ecuaii sau funcii matematice neliniare.
Modelele construite cu o singur variabil explicate sunt modele de
regresie univariat, iar modelele construite cu mai multe variabile
explicate sunt modele de regresie multivariat. Modelele de regresie
univariat pot fi, la rndul lor, modele de regresie simpl, construite pentru
181

o singur variabil explicativ, i modele de regresie multipl, care implic


mai multe variabile explicative n relaie cu variabila explicat considerat.
Dac toate variabilele explicative considerate ntr-o cercetare sunt variabile
atributive, atunci analiza statistic a regresiei se rezum la o analiz de
varian. Dac doar o parte dintre variabilele explicative considerate ntr-o
cercetare sunt variabile atributive, celelalte fiind variabile cantitative,
atunci analiza statistic a regresiei poate mbrca forma unei analize de
covarian.
Metoda cea mai folosit pentru construcia modelelor de regresie liniar
este metoda celor mai mici ptrate de eroare statistic. Atunci cnd au la
baz aceast metod, modelele de regresie liniar pot lua forma unor
modele total parametrice sau semi-parametrice. n cazul modelelor de
regresie liniar total parametrice, se pornete de la ipoteza c erorile de
regresie sunt distribuite normal. Dac erorile de regresie nu sunt distribuite
normal, modelele vor fi unele semi-parametrice. Deseori, n practic, astfel
de modele sunt nlocuite cu modele diferite de cele construite pe baza
metodei celor mai mici ptrate. De exemplu, dac erorile statistice
nregistreaz valori aberante, regresia robust va fi, de regul, preferat.
n afara acestor modele de regresie statistic, sunt disponibile i alte
modele speciale, dintre care amintim modelul regresiei Poisson, modelul
nvrii supervizate etc.
Erorile i valorile reziduale de regresie
Eroarea statistic de regresie pentru o anumit unitate statistic extras
aleator din populaia statistic studiat, const n abaterea valorii observate
pentru aceast unitate statistic de la valoarea ateptat conform modelului
de regresie care s-ar aplica la nivelul ntregii populaii statistice studiate.
Atunci cnd este observabil doar un eantion din populaia statistic
studiat 1 , aceste erori vor putea fi doar estimate.
Erorile statistice de regresie pot fi confundate uor cu valorile estimate ale
lor, denumite valori reziduale de regresie. Acestea din urm sunt abateri ale
valorilor observate de la valorile ateptate conform modelului de regresie
aplicat doar la nivelul unui eantion observabil din populaia statistic
studiat. Cu alte cuvinte, valorile reziduale de regresie sunt estimrile
observabile (simbolizate obinuit cu ) ale erorilor statistice de regresie
(simbolizate obinuit cu ).

Este cazul, n general, al prognozelor realizate pe baza regresiei statistice.

182

Regresia liniar simpl pe baza metodei celor mai mici ptrate;


coeficientul de regresie liniar
Regresia liniar se numete aa ntruct ea are la baz ipoteza c rspunsul
variabilei explicate la variabila explicativ mbrac forma unei funcii
liniare cu anumii parametri. Deseori se consider, n mod eronat, c
motivul pentru care regresia se numete liniar const n faptul c
graficul funciei variabilei explicate, Y = + X, este o linie. De fapt, i
n anumite situaii n care modelul este, din punct de vedere grafic, neliniar,
regresia se poate reduce tot la un model liniar. Astfel, de exemplu, modelul
Y = + X + X2 poate fi considerat un model liniar (de regresie
multipl) n care Y este variabila endogen iar X2 i X sunt variabilele
exogene.
Metoda celor mai mici ptrate const n minimizarea sumei ptratelor
abaterilor de regresie. Abaterile de regresie sunt abateri ale valorilor reale
ale variabilei explicate (Y) de la valorile teoretice, calculate pe baza
modelului de regresie liniar (Yc) aplicat la nivelul eantionului observat.
Ele pot lua forma fie a erorilor statistice de regresie (dac sunt observabile
toate rspunsurile variabilei explicate la variabila explicative), fie a
valorilor reziduale de regresie (dac nu sunt observabile toate rspunsurile
variabilei explicate la variabila explicative, regresia fiind aplicat doar la
nivelul unui eantion de observaii).
nainte de minimizarea sumei ptratelor erorilor statistice de regresie este
util observarea urmtoarelor echivalene:

unde reprezint erorile statistice de regresie;


X = variabila explicativ n cadrul modelului de regresie;
Y = variabila explicat prin modelul de regresie;
, = parametrii de regresie liniar ntre variabilele X i Y.
Minimizarea sumei ptratelor erorilor statistice de regresie nseamn
ndeplinirea a 2 condiii:
1. Condiia ca derivatele pariale de ordinul nti n raport cu parametrii ,
s fie egale cu 0:

i
183

2. Condiia ca matricea derivatelor pariale de ordinul doi n raport cu


parametrii , s fie pozitiv definit:

Derivatele pariale sunt:

Prin urmare,

Din prima condiie necesar pentru minimizarea sumei ptratelor erorilor


statistice de regresie se obine sistemul de ecuaii:
184

Folosind metoda determinanilor pentru acest sistem de ecuaii, se pot gsi


relaiile de determinare a parametrilor de regresie , . Pentru aceasta, se
construiete mai nti matricea sistemului n funcie de parametrii , :

Determinanii necesari sunt:

185

Relaiile de determinare a parametrilor , sunt:

mprind cu N2 att numrtorul, ct i numitorul fraciei care definete


parametrul , se obine mai departe:

Aadar, parametrul se determin ca raport ntre covariana celor dou


variabile ale modelului de regresie liniar (X i Y) i variana variabilei
explicative (X). Acest parametru se numete coeficient de regresie liniar
i este echivalent, din punct de vedere grafic, cu tangenta unghiului pe care
linia de regresie reprezentat n sistemul de axe 0X i 0Y l formeaz cu
abscisa (0X), motiv pentru care el mai este identificat i cu panta de
regresie liniar (a se vedea figura 8.2, precum i prima proprietate a
coeficientului de regresie liniar, prezentat la pag. 187-188).
Pornind de la cea de-a doua ecuaie a sistemului se poate obine, de
asemenea, o relaie simplificat pentru determinarea parametrului :

186

Dup cum se observ, parametrul este echivalent, din punct de vedere


grafic, cu intercepia liniei de regresie cu ordonata 0Y (a se vedea figura
8.2), fiind egal cu valoarea pe care variabila teoretic Yc o nregistreaz
atunci cnd variabila explicativ, X, ia valoarea 0:

Proprietile coeficientului de regresie liniar ()


aa cum s-a anticipat deja, coeficientul de regresie liniar reprezint,
din punct de vedere grafic, tangenta unghiului pe care linia de
regresie reprezentat n sistemul de axe 0X i 0Y l formeaz cu abscisa
(figura 8.2):

unde:
OAB reprezint triunghiul dreptunghic format la creterea cu o
unitate a variabilei explicative X (figura 8.2):

187

Figura 8.2 Regresia liniar


este util considerarea simultan a regresiei liniare a variabilei Y n
funcie de X i a regresiei liniare a variabilei X n funcie de Y, pentru a
se evidenia reciprocitatea legturii statistice dintre cele dou variabile.
Astfel, dac cele dou linii de regresie sunt reprezentate n acelai plan,
ele formeaz ntre ele un unghi cu att mai mic cu ct intensitatea
reciprocitii legturii statistice dintre cele dou variabile este mai mare.
Cele dou linii de regresie sunt determinate de ecuaiile:

188

Prin urmare, tangenta unghiului dintre cele dou linii de regresie


este dat de relaia:

Dac reciprocitatea legturii statistice dintre cele dou variabile este


total, cele dou linii de regresie se vor confunda, unghiul dintre ele
fiind nul. Aceasta se ntmpl atunci cnd tg() = 0, ceea ce nseamn
c produsul celor doi coeficieni de regresie, , este egal cu 1. n
concluzie, reciprocitatea legturii statistice liniare dintre dou variabile
X i Y este total atunci cnd coeficientul de regresie liniar al lui Y n
funcie de X este egal cu inversul coeficientului de regresie liniar al lui
X n funcie de Y. De altfel, n acest caz legtura dintre cele dou
variabile este una funcional, coeficientul de corelaie liniar Pearson
fiind egal cu 1. Proprietatea poate fi demonstrat i pornind de la
raportul dintre cei doi coeficieni de regresie liniar:

ntruct numitorul fraciei care definete coeficientul de regresie liniar


este ntotdeauna pozitiv (fiind egal cu o varian statistic), coeficientul
de regresie liniar are semnul covarianei celor dou variabile ale
modelului de regresie liniar (X i Y). n consecin, o valoare pozitiv
a coeficientului de regresie liniar indic o legtur statistic direct
ntre cele dou variabile, iar o valoare negativ a acestuia indic o
legtur statistic invers ntre acestea. Totodat, dac valoarea
coeficientului de regresie liniar este 0, nseamn c ntre cele dou
variabile nu exist legtur statistic liniar;
coeficientul de regresie liniar este invariant la schimbarea originii:
189

multiplicarea variabilei explicative cu o constant determin divizarea


cu aceeai constant a coeficientului de regresie liniar:

S considerm, pentru exemplificare, datele statistice privind numrul


mediu de ore de munc i numrul mediu de zile de concediu
remunerate la nivelul capitalelor rilor din EU-25, conform studiului
Prices and Earnings realizat de UBS n anul 2006 1 (a se vedea tabelul
8.3).
Conform ecuaiei de regresie liniar determinat cu ajutorul
programului Excel, coeficientul de regresie liniar a variabilei numrul
mediu de zile de concediu remunerate n funcie de variabila numrul
mediu de ore de munc este egal cu 0,0221 (a se vedea figura 8.3).
S vedem ce s-ar ntmpla dac numrul de ore de munc pe an la
nivelul fiecrei ri ar scdea la jumtate fa de nivelul nregistrat n
2006. Folosind acelai program (Excel), n urma acestei modificri
coeficientul de regresie liniar se modific la valoarea de 0,0442 (a se
vedea figura 8.4), verificndu-se relaia:

Conform:
http://www.ubs.com/1/ShowMedia/ubs_ch/wealth_mgmt_ch/research?contentId=103982&name=eng.pd
f

190

Tabelul 8.3
Nr.
crt.

Oraul

Numr ore
de munc
pe an (X)

Numr de zile de
concediu remunerate
pe an (Y)

Amsterdam

1687

25

Atena

1714

24

Berlin

1611

29

Bratislava

1760

20

Bruxelles

1672

21

Budapesta

1834

26

Copenhaga

1644

22

Dublin

1727

21

Helsinki

1603

29

10

Lisabona

1708

22

11

Ljubljana

1756

21

12

Londra

1782

20

13

Luxemburg

1725

25

14

Madrid

1724

22

15

Nicosia

1753

22

16

Paris

1481

27

17

Praga

1771

20

18

Riga

1737

20

19

Roma

1747

21

20

Stockholm

1726

25

21

Tallinn

1746

20

22

Varovia

1772

24

23

Viena

1649

25

24

Vilnius

1744

21

Pentru La Valetta, capitala Maltei, studiul nu a publicat, din pcate, date.

191

Figura 8.3

Figura 8.4
Trebuie observat faptul c figurile 8.3 i 8.4 nu sunt identice, diferena
esenial dintre ele fiind cea n legtur cu scara de reprezentare a
variabilei abscisei (X).

Figura 8.5
Pentru a sesiza corect modificarea coeficientului de regresie, deci a
pantei liniei ecuaiei de regresie n urma nmulirii tuturor valorilor
variabilei X cu o constant (n exemplul nostru, n valoare de = 0,5),
este necesar reprezentarea noului nor de puncte la aceeai scar, ca n
192

figura 8.5. Dup cum se poate observa n aceast figur, panta noii linii
de regresie se obine prin nmulirea pantei vechii linii de regresie cu
inversa acelei constante (n exemplul nostru, egal cu 1/= 2).
Revenind la figura 8.4, se poate observa c aici scara de reprezentare a
variabilei abscisei a fost, n fapt, modificat fa de cea din figura 8.3
tot prin nmulirea cu inversa constantei n discuie;
multiplicarea variabilei explicate cu o constant determin multiplicarea
cu aceeai constant a coeficientului de regresie liniar:

combinnd cele dou proprieti anterioare, rezult:

Raportul de determinaie (R2)


Se poate arta c variana variabilei dependente sau explicate (Y) se poate
descompune n:
1. variana explicat de modelul de regresie, desemnnd variana valorilor
de regresie ale variabilei explicate n jurul mediei acesteia;
2. variana rezidual, adic variana neexplicat de ctre modelul de
regresie, dat de abaterile valorilor reale ale variabilei Y fa de valorile
estimate ale acesteia de ctre modelul de regresie.
Putem scrie, astfel, relaia:

193

Pe baza acestei relaii, se poate construi raportul de determinaie (R2), care


este raportul dintre variana explicat de modelul de regresie i variana
total a variabilei explicate (Y), artnd care este ponderea n care aceast
variabil este determinat sau explicat de ctre modelul de regresie, fiind,
astfel, o statistic de apreciere a calitii modelului de regresie considerat:

Dup cum se poate uor observa, raportul de determinaie poate lua,


teoretic, valori cuprinse ntre 0 i 1, o apropiere mai mare de 1 indicnd o
calitate mai bun a modelului de regresie.

194

DESCRIEREA STATISTIC
A VARIAIEI N TIMP

9.

OBIECTIVELE CAPITOLULUI
n acest capitol vor fi prezentate statisticile disponibile pentru descrierea statistic
a variaiei n timp, ajutndu-v:
s nelegei utilitatea cunoaterii variaiei n timp la nivelul fenomenelor
studiate statistic;
s stpnii metodele disponibile pentru descrierea statistic a variaiei n timp
n forma nivelurilor, volumelor i sporurilor absolute sau relative;
s nelegei cum se construiesc indicii agregai ponderali i s cunoatei
cteva aplicaii mai importante ale acestora.

Descrierea statistic a variaiei n timp presupune culegerea de date pentru


un ir de momente sau de perioade/intervale de timp, rezultatele obinute
astfel putnd fi prezentate sub forma repartiiilor statistice cronologice (de
momente sau de intervale).
n descrierea statistic a variaiei care caracterizeaz asemenea repartiii
statistice sunt avute n vedere:
modificrile de nivel (creteri sau descreteri) care au loc de la un
moment la altul sau de la o perioad la alta. Asemenea modificri pot fi
evideniate fie sub forma sporurilor, ritmurilor (indicilor individuali)
sau indicilor agregai simpli;
modificrile de structur care au loc de la un moment la altul sau de la
o perioad la alta. Asemenea modificri pot fi evideniate cu ajutorul
indicilor agregai ponderai.
9.1.

Descrierea statistic a variaiei de nivel pentru repartiiile statistice


cronologice

Descrierea statistic a variaiei de nivel pentru repartiiile statistice


cronologice se poate realiza n cifre absolute, n expresie relativ, sau n
cifre medii, ca expresii ale tendinei statistice manifestate n timp.
Descrierea statistic n cifre absolute a variaiei cronologice de nivel
Descrierea statistic n cifre absolute a variaiei cronologice de nivel
implic apelul la niveluri, volume i sporuri absolute.
Nivelurile absolute ale unei variabile cronologice sunt date de valorile pe
care aceasta le nregistreaz la momentele sau n perioadele/intervalele de
timp considerate.
Volumele absolute care pot fi determinate la nivelul unei variabile
cronologice vor fi obinute ca rezultate ale nsumrii nivelurilor absolute
nregistrate pentru momentele sau perioadele/intervalele care definesc
aceast variabil:

unde:
Vi reprezint volumul absolut al primelor i momente sau perioade de
timp;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i.
197

Sporurile absolute care pot fi determinate la nivelul unei variabile


cronologice vor fi obinute ca diferene ntre nivelurile absolute ale unei
variabile cronologice nregistrate pentru momente sau perioade/intervale de
timp succesive ale acesteia. Acestea se pot grupa n:
sporuri cu baz fix (diferenele sunt de fiecare dat fa de primul
nivel absolut nregistrat):

unde:
i/0 reprezint sporul absolut cu baz fix al momentului sau perioadei
de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
X0 = nivelul absolut al variabilei X, nregistrat pentru primul momentul
sau pentru prima perioad de timp (0) care definete variabila
statistic studiat;
sporuri cu baz mobil (diferenele sunt de fiecare dat fa de nivelul
absolut nregistrat anterior):

unde:
i/i-1 reprezint sporul absolut cu baz mobil al momentului sau
perioadei de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
Xi-1 = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i-1.
Relaii existente ntre sporurile absolute
ntre sporurile absolute cu baz fix i sporurile absolute cu baz mobil
determinate la nivelul unei aceleiai repartiii statistice cronologice, se pot
evidenia urmtoarele dou relaii:

198

ceea ce nseamn c suma tuturor sporurilor absolute cu baz mobil este


egal cu ultimul spor absolut cu baz fix;

ceea ce nseamn c sporul absolut cu baz mobil pentru momentul sau


perioada de timp i este egal cu diferena dintre sporul absolut cu baz
fix pentru acelai moment sau perioad de timp i i sporul absolut cu
baz fix pentru momentul sau perioada de timp anterioar (i-1).
Descrierea statistic n expresie relativ a variaiei cronologice de nivel
Descrierea statistic n expresie relativ a variaiei cronologice de nivel se
poate realiza cu ajutorul:
ritmurilor (sau indicilor individuali) de variaie;
ritmurilor sporurilor de variaie;
indicilor agregai de variaie;
valorilor absolute ale procentelor de cretere.
Ritmurile (sau indicii individuali) de variaie arat de cte ori a crescut
sau a sczut nivelul unei variabile la un moment sau ntr-o perioad de
timp fa de un moment sau o perioad de timp anterioar (baza de
raportare).
Dup baza de raportare, ritmurile (sau indicii) de variaie se mpart, de
asemenea, n ritmuri sau indici cu baz fix i ritmuri sau indici cu baz
mobil, i se pot exprima sub form de coeficieni sau sub form
procentual:

unde:
Ri/0 reprezint ritmul sau indicele cu baz fix al momentului sau perioadei
de timp i;
Ri/i-1 = ritmul sau indicele cu baz mobil al momentului sau perioadei de
timp i;
199

Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau


perioada de timp i;
X0 = nivelul absolut al variabilei X, nregistrat pentru primul moment sau
pentru prima perioad de timp (0) care definete cronologic variabila
statistic studiat;
Xi-1 = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i-1.
Relaii existente ntre ritmuri
ntre ritmurile cu baz fix i ritmurile cu baz mobil determinate la
nivelul unei aceleiai repartiii statistice cronologice, se pot evidenia
urmtoarele dou relaii:

ceea ce nseamn c produsul tuturor ritmurilor cu baz mobil este egal cu


ultimul ritm cu baz fix;

ceea ce nseamn c ritmul cu baz mobil pentru momentul sau perioada


de timp i este egal cu raportul dintre ritmul cu baz fix pentru acelai
moment sau perioad de timp i i ritmul cu baz fix pentru momentul
sau perioada de timp anterioar (i-1).
Ritmurile sporurilor
Ritmurile sporurilor arat cu ct s-au modificat, n expresie relativ,
nivelurile nregistrate de o variabil de la un moment sau perioad de timp
la alt moment sau perioad de timp. i ele se pot calcula folosind ca baz
de raportare fie o baz fix fie o baz mobil, putndu-se exprima ca i
coeficieni sau procentual:

200

unde:
ri/0 reprezint ritmul sporului cu baz fix al momentului sau perioadei de
timp i;
ri/i-1 = ritmul sporului cu baz mobil al momentului sau perioadei de timp
i;
i/0 = sporul absolut cu baz fix al momentului sau perioadei de timp i;
Xi = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i;
X0 = nivelul absolut al variabilei X, nregistrat pentru primul moment sau
pentru prima perioad de timp (0) care definete cronologic variabila
statistic studiat;
Ri/0 = ritmul sau indicele cu baz fix al momentului sau perioadei de timp
i;
i/i-1 = sporul absolut cu baz mobil al momentului sau perioadei de timp
i;
Xi-1 = nivelul absolut al variabilei X, nregistrat pentru momentul sau
perioada de timp i-1;
Ri/i-1 = ritmul sau indicele cu baz mobil al momentului sau perioadei de
timp i.
Indicii agregai
Operaia de agregare const n nsumarea elementelor componente ale
unei mulimi care caracterizeaz un fenomen studiat statistic. n funcie de
natura acestor elemente componente, se poate face apel la operaii de:
agregare simpl (atunci cnd elementele componente sunt omogene);
agregare ponderat (atunci cnd elementele componente sunt
eterogene).
Indicii agregai simpli se obin prin raportarea nivelurilor absolute
agregate simplu pentru dou momente sau perioade diferite de timp:

201

unde:
X1/0 reprezint indicele agregat simplu al momentului/perioadei de timp 1
fa de momentul/perioada de timp 0;
Xi1 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 1;
Xi0 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 0.
Indicii agregai ponderai se obin prin raportarea nivelurilor absolute
agregate ponderat pentru dou momente sau perioade diferite de timp:

unde:
I1/0 reprezint indicele agregat ponderat al momentului/perioadei de timp 1
fa de momentul/perioada de timp 0;
Fi = factor de ponderare pentru elementul i; concret, el poate fi dat de:
Fi1 (frecvena nregistrat de ctre elementul i la momentul sau pentru
perioada de timp 1) sau Fi0 (frecvena nregistrat de ctre elementul i la
momentul sau pentru perioada de timp 0).
Valorile absolute ale procentelor de cretere
Valorile absolute ale procentelor de cretere se pot obine pornind de la
relaiile de determinare a ritmurilor sporurilor, considernd din nou fie o
baz fix, fie o baz mobil de raportare:

202

Descrierea statistic n cifre medii a variaiei cronologice de nivel


Statisticile medii ale variaiei cronologice de nivel sunt:
nivelul mediu;
sporul mediu;
rimtul mediu.
Nivelul mediu ( )
Nivelurile medii ( ) ale repartiiilor cronologice se determin n funcie de
tipul variabilei de timp (T) dup care sunt construite acestea.
Astfel, pentru repartiiile cronologice dup o variabil definit de
perioade/intervale de timp, nivelul mediu se calculeaz ca o medie
aritmetic simpl a nivelurilor nregistrate pentru perioadele/intervalele (t)
de timp considerate:

unde:
reprezint nivelul mediu al repartiiei cronologice a variabilei X, dup
variabila de timp T, definit de perioadele/intervalele de timp t;
Xt = nivelul nregistrat de variabila X n perioada/intervalul de timp t;
N = numrul de perioade/intervale de timp care definesc variabila de timp
T.
Pentru repartiiile cronologice dup o variabil definit de momente de
timp, nivelul mediu se calculeaz ca o medie cronologic a nivelurilor
nregistrate pentru momentele (t) de timp considerate.
Dac distanele de timp dintre momentele considerate sunt egale, atunci
media cronologic se poate calcula ca o medie simpl:

203

Dac distanele de timp dintre momentele considerate sunt neegale, atunci


media cronologic trebuie calculat ca o medie ponderat:

Sporul mediu ( )
Sporul mediu reflect modificarea medie n cifre absolute care s-a
nregistrat pe parcursul perioadei de timp pentru care este construit
repartiia cronologic studiat. Desigur, se pot determina i sporuri medii
pariale pentru subperioade de timp care intereseaz n demersul cercetrii
realizate.
Sporurile medii se calculeaz ca medii aritmetice ale sporurilor cu baz
mobil:

unde:
N reprezint numrul sporurilor cu baz mobil considerate.
Ritmul mediu ( )
Denumit i indice mediu, ritmul mediu reflect modificarea medie n cifre
relative care s-a nregistrat pe parcursul perioadei de timp pentru care este
construit repartiia cronologic studiat. Desigur, se pot determina i
204

ritmuri medii pariale pentru subperioade de timp care intereseaz n


demersul cercetrii realizate.
Pentru determinarea ritmului mediu sunt disponibile trei metode de calcul:
metoda mediei geometrice;
metoda mediei parabolice;
metoda trendului exponenial;
Determinarea ritmului mediu prin metoda mediei geometrice
Prin aceast metod, ritmul mediu se calculeaz ca medie geometric a
ritmurilor cu baz mobil:

unde:
N reprezint numrul ritmurilor cu baz mobil considerate.
Dup cum se observ, n determinarea ritmului mediu prin aceast metod
se ine cont doar de valorile de la nceputul i de la sfritul perioadei
studiate, ceea ce face ca gradul de reprezentativitate al acestei statistici s
fie unul foarte sczut.
Pentru exemplificare, s considerm repartiia cronologic a profitului net
obinut de firma ABC n perioada 2002-2007, conform tabelului 9.1.
Tabelul 9.1
Anul

Profitul net obinut de firma ABC (mil. RON) Xi

2002

3,1

2003

3,4

2004

3,6

2005

4,5

2006

5,2

2007

5,8

Pentru aplicarea metodei mediei geometrice n determinarea ritmului


mediu de cretere a profitului net pentru firma ABC, este necesar
construirea tabelului 9.2:
205

Tabelul 9.2
i

Xi

Ri/i-1

3,1

3,4

1,0968

3,6

1,0588

4,5

1,2500

5,2

1,1556

5,8

1,1154

Ritmul mediu de cretere a profitului net pentru firma ABC, determinat


prin metoda mediei geometrice este, aadar:

Verificarea rezultatului este realizat cu ajutorul tabelului 9.3:


Tabelul 9.3
i

Xi

Verificare

2002

3,1

3,1

2003

3,4

3,11,133478 = 3,513783

2004

3,6

3,5137831,133478 = 3,982797

2005

4,5

3,9827971,133478 = 4,514415

2006

5,2

4,5144151,133478 = 5,116992

2007

5,8

5,1169921,133478 = 5,8

206

Determinarea ritmului mediu prin metoda mediei parabolice


Metoda mediei parabolice pentru determinarea ritmului mediu a fost
propus n 1949 de ctre matematicianul romn Froda i pornete de la
considerentul c orice valoare nregistrat pe parcursul perioadei de timp
pentru care se determin ritmul mediu se poate obine, n cifre medii, pe
baza relaiei generale:

unde i reprezint perioada sau momentul de timp i.


Prin nsumarea celor doi termeni ai relaiei de mai sus pentru toate valorile
nregistrate pe parcursul perioadei de timp studiate, se obine:

de unde rezult c:

Suma din partea dreapt a relaiei astfel obinut este egal cu suma
termenilor unei progresii geometrice cu raia
Aadar, relaia se mai poate scrie:

i primul termen egal cu 1.

Pe baza acestei relaii, ritmul mediu se poate calcula prin ncercri


succesive.
Pentru exemplificare, s considerm din nou repartiia cronologic a
profitului net pentru firma ABC din tabelul 9.1. Relaia specific
metodei mediei parabolice pentru determinarea ritmului mediu devine
pentru acest exemplu:

207

Prin ncercri succesive se obine:

Verificarea rezultatului este realizat cu ajutorul tabelului 9.4:


Tabelul 9.4
i

Xi

Verificare

2002

3,1

3,1

2003

3,4

3,11,126912 = 3,493427

2004

3,6

3,4934271, 126912 = 3,936785

2005

4,5

3,9367851, 126912 = 4,436410

2006

5,2

4,4364101, 126912 = 4,999444

2007

5,8

4,9994441, 126912 = 5,633933

Total

25,6

25,6

Dup cum se poate observa, n determinarea ritmului mediu prin aceast


metod se exagereaz importana primei valori cronologice nregistrate
(X0), ceea ce i imprim, ca i n cazul metodei anterioare, un caracter de
nereprezentativitate. Acesta este motivul pentru care n literatura de
specialitate s-a propus o a treia metod de determinare a ritmului mediu
metoda trendului exponenial.
Determinarea ritmului mediu prin metoda trendului exponenial
Metoda mediei trendului exponenial pentru determinarea ritmului mediu a
pornete de la echivalarea ritmului mediu cu parametrul de trend al
208

funciei exponeniale de trend care descrie variabila de interes X dup


variabila de timp i:

Valoarea parametrului de trend , respectiv a ritmului mediu


obine prin aplicarea metodei celor mai mici ptrate de eroare:

, se poate

unde:
i reprezint erorile de modelare regresional a variabilei de interes X dup
variabila de timp i.
Pentru a face posibil aplicarea metodei celor mai mici ptrate de eroare
este necesar mai nti logaritmarea relaiei care descrie funcia
exponenial de trend:

Se ajunge astfel la o estimare pe baza unui model de regresie liniar.


Conform relaiilor de estimare specifice modelului general de regresie
liniar, valoarea estimat pentru parametrul log() este:

Valorile variabilei de timp i se pot ns fixa n aa fel nct suma lor s


fie egal cu 0, ceea ce face ca relaia de mai sus s devin:
209

unde:

Ritmul mediu

se poate determina, prin urmare, folosind relaia:

cu condiia ca:

Pentru exemplificare, s considerm din nou repartiia cronologic a


profitului net pentru firma ABC din tabelul 9.1. Pentru aplicarea metodei
trendului exponenial este necesar construirea tabelului 9.5:
Tabelul 9.5
Anul

Xi

i2

ln(Xi)

iln(Xi)

2002

-5

3,1

25

0,491362

-2,456808

2003

-3

3,4

0,531479

-1,594437

2004

-1

3,6

0,556303

-0,556303

2005

+1

4,5

0,653213

0,653213

2006

+3

5,2

0,716003

2,148010

2007

+5

5,8

25

0,763428

3,817140

Total

25,6

70

3,711787

2,010815

Pe baza calculelor din tabelul 9.5 putem obine valoarea ritmului mediu:
210

Pentru a analiza gradul de precizie al rezultatului este necesar i


determinarea parametrului al funciei exponeniale de trend care descrie
variabila de interes X dup variabila de timp i. Pentru aceasta facem din
nou apel la relaiile de estimare specifice modelului general de regresie
liniar, valoarea estimat pentru parametrul ln() fiind:

unde:
(i) este 0 deoarece i este 0.
Prin urmare, pentru exemplul nostru este:

Gradul de precizie al valorii obinute pentru ritmul mediu este ilustrat cu


ajutorul tabelului 9.6.
Metoda trendului exponenial prezint avantajul reprezentativitii valorii
obinute pentru ritmul mediu, asigurat prin considerarea, n determinarea
ei, a tuturor valorilor nregistrate n cadrul repartiiei cronologice pentru
variabila X studiat.

211

Tabelul 9.6
Anul

Xi

Xi (estimat) = i = ( )i

2002

-5

3,1

4,1555751,06838(-5) = 2,985393

2003

-3

3,4

4,1555751,06838(-3) = 3,407637

2004

-1

3,6

4,1555751,06838(-1) = 3,889603

2005

+1

4,5

4,1555751,06838(+1) = 4,439735

2006

+3

5,2

4,1555751,06838(+3) = 5,067677

2007

+5

5,8

4,1555751,06838(+5) = 5,784433

Total

25,6

25,574479

9.2.

Descrierea statistic a variaiei de structur pentru repartiiile


statistice cronologice. Indicii agregai ponderai structural.

Teste utile pentru construcia adecvat a indicilor agregai ponderai


n consutrucia indicilor agregai ponderai structural trebuie s se asigure
n primul rnd identificarea precis a factorului cantitativ i, respectiv, a
factorului calitativ care au fost luai n considerare la construcia indicilor
agregai ponderai. Dac aceast condiie esenial este respectat, pentru
construcia adecvat a indicilor agregai ponderai structural, se poate apela
mai departe la utilizarea urmtoarelor teste:
proporionalitatea orice multiplicare/divizare la nivelul factorului
calitativ trebuie s fie urmat de aceeai multiplicare/divizare la nivelul
indicelui agregat ponderat ales;
comensurabilitatea indicele agregat ponderat ales trebuie s fie
invariant la modificrile operate asupra unitilor de msur (de
exemplu, dac preurile considerate n determinarea unui indice de
preuri sunt exprimate iniial n RON, iar apoi n euro, indicele de
preuri ar trebui s nregistreze aceiai valoare n ambele situaii);
monotonia dac unul sau mai multe preuri cresc n perioada curent
i nici unul nu scade, atunci indicele preurilor ar trebui s creasc;
reversibilitatea n timp valoarea indicelui agregat ponderat calculat ca
raport ntre nivelul perioadei curente i cel al perioadei de baz trebuie
s fie egal cu inversa valorii indicelui agregat ponderat calculat ca
raport ntre nivelul perioadei de baz i cel al perioadei curente:

212

Aceast condiie se verific n cazul indicilor calculai din valori direct


nsumabile. n cazul valorilor care nu sunt nsumabile direct, condiia
poate fi respectat prin alegerea corespunztoare a ponderilor;
reversibilitatea factorilor indicele agregat general, I1/0(X F), trebuie
s fie egal cu produsul indicilor agregai ponderai dup factorii luai n
considerare (X, respectiv F) la construcia acestuia:

tranzitivitatea (circularitatea) nsemnnd egalitatea dintre indicele cu


baz fix al unei perioade i produsul indicilor cu baz n lan construii
succesiv pentru un ir de subperioade egale ale perioadei considerate:

Tipuri de indici agregai ponderai structural


Variaia de structur pentru repartiiile cronologice poate fi evideniat cu
ajutorul indicilor agregai ponderai structural. n funcie de sistemele de
ponderare folosite, se pot construi diferii astfel de indici:
indicele Laspeyres (L1/0) propus n 1864 de ctre economistul i
statisticianul german de origine belgian Etienne Laspeyres (18341913) 1 :

unde:

http://www.eumed.net/cursecon/economistas/Laspeyres.htm

213

Xi1 = nivelul absolut nregistrat de ctre elementul i la momentul sau


pentru perioada de timp 1;
Xi0 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 0;
Fi0 = factorul de ponderare Laspeyres dat de frecvena nregistrat de
ctre elementul i la momentul sau pentru perioada de timp 0.
Limita acestui indice este dat de faptul c nu ndeplinete condiia de
reversibilitate a factorilor:

unde:
I1/0(X F) reprezint indicele agregat general;
L1/0(X) = indicele Laspeyres pentru factorul de ponderare X;
L1/0(F) = indicele Laspeyres pentru factorul de ponderare F;
indicele Paasche (P1/0) propus n 1874 de ctre economistul i
statisticianul german Hermann Paasche (1851-1925) 2 :

unde:
Xi1 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 1;
Xi0 = nivelul absolut nregistrat de ctre elementul i la momentul sau
pentru perioada de timp 0;

http://www.eumed.net/cursecon/economistas/Paasche.htm

214

Fi1 = factorul de ponderare Paasche dat de frecvena nregistrat de


ctre elementul i la momentul sau pentru perioada de timp 1.
Se poate observa c nici acest indice nu ndeplinete condiia de
reversibilitate a factorilor:

unde:
I1/0(X F) reprezint indicele agregat general;
P1/0(X) = indicele Paasche pentru factorul de ponderare X;
P1/0(F) = indicele Paasche pentru factorul de ponderare F;
indicele Fisher (F1/0) propus n 1922 de ctre economistul i
statisticianul american Irving Fisher (1867-1947) 3 :

ca indice care satisface, de aceast dat, condiia de reversibilitate a


factorilor:

http://www.eumed.net/cursecon/economistas/irving_fisher.htm

http://www.econlib.org/library/Enc/bios/Fisher.html

215

unde:
I1/0(X F) reprezint indicele agregat general;
Fi1/0(X) = indicele Fisher pentru factorul de ponderare X;
Fi1/0(F) = indicele Fisher pentru factorul de ponderare F;
Se poate observa c indicele Fisher este construit ca o medie geometric
a indicilor Laspeyres i Paasche:

indicele Edgeworth (E1/0) propus de ctre economistul irlandez Francis


Ysidro Edgeworth (1845-1926) 4 :

Indicele Edgeworth nu ndeplinete condiia de reversibilitate a


factorilor.
indicele Drobisch (D1/0) propus n 1871 de ctre Sidgwik Drobisch:

http://www.eumed.net/cursecon/economistas/Edgeworth.htm

http://www-history.mcs.st-andrews.ac.uk/Biographies/Edgeworth.html

216

Se poate observa c indicele Drobisch este construit ca o medie


aritmetic a indicilor Laspeyres i Paasche:

Nici indicele Drobisch nu ndeplinete condiia de reversibilitate a


factorilor.
S determinm, pentru exemplificare, dinamica preurilor agregate a 2
produse (A i B), pentru care se cunosc preurile practicate i, respectiv,
cantitile vndute pentru 2 perioade succesive (0 i 1), conform tabelului
9.7.
Factorul de ponderare este dat, n aceast situaie, de variabila cantitate
(q), ntruct aceasta exprim, de fapt, frecvena de manifestare a preului (p
factorul calitativ, adic factorul a crui dinamic vrem s o determinm),
pentru un anumit produs i ntr-o anumit perioad.
Tabelul 9.7
Preuri practicate, p Cantiti vndute, q
Perioada

Produsul A

100

120

4,5

Produsul B

250

500

Pentru realizarea calculelor necesare, este util construirea tabelului 9.8, n


care sunt aplicate ponderile (cantitile) la preurile celor 2 produse, pentru
fiecare dintre cele 2 perioade.
Pe baza rezultatelor obinute n tabelul 9.8, se pot determina indicii
agregai ponderai structural:
indicele Laspeyres:

217

Tabelul 9.8
Preuri
practicate, p

Cantiti
vndute, q

Perioada

Produsul A

100

120

4,5

Produsul B

250

500

Total

p0q0 p1q0 p1q1 p0q1


300

360

540

450

500 1000 2500 1250


800 1360 3040 1700

indicele Paasche:

indicele Fisher:

indicele Edgeworth:

218

indicele Drobisch:

219

220

BIBLIOGRAFIE
SELECTIV

Tudorel ANDREI, Stelian STANCU, Statistica - Teorie i aplicaii,


Editura ALL, Bucureti, 1995.
Constantin ANGHELACHE, Statistic teoretic i economic teorie i
aplicaii, Editura Economic, Bucureti, 2004.
Mariana-Elena BALU, Bazele statisticii, Editura Fundaiei Romnia de
Mine, Bucureti, 2007.
Tudor BARON, Constantin ANGHELACHE, Emilia IAN, Statistic,
Editura Economic, Bucureti, 1996.
Maria BDI, Silvia Elena CRISTACHE, Statistic aplicaii practice,
Editura Mondan, Bucureti, 1998.
Peter C. BELL, Peter E. F. NEWSON, Statistics for Business with
Spreadsheets: Text and Cases, 2nd edition, Scientific Press, South San
Francisco, California, 1992.
Elena BIJI, Tudor BARON, Statistic teoretic i economic, Editura
didactic i pedagogic, Bucureti, 1995.
Ken BLACK, Business statistics. An introductory course, West Publishing
Company, 1999.
Harvey J. BRIGHTMAN, Howard SCHNEIDER, Statistics for Business
Problem Solving, South-Western Publishing Company, 1992.
Remus BUTNESCU, Statistic n afaceri (manual pentru uzul
studenilor), Editura Mira Design Sibiu, 2000.
Iosif Constantin DRGAN, Mihai C. DEMETRESCU, Practica
prospectrii pieii, Editura Europa Nova, Bucureti, 1996.
John E. FREUND, Ronald E. WALPOLE, Mathematical Statistics, 4th
edition, Prentice-Hall Inc., 1987.
Stan GIBILISCO, Statistics Demystified: A Self-teaching Guide, McGrawHill Professional, 2004,
http://books.google.com/books?id=u9FVZSSEoEQC
Morris HAMBURG, Basic Statistics: A Modern Approach, 3rd edition,
Harcourt Brace Jovanovich, 1985.
Donald L. HARNETT, Introduction to Statistical Methods, 3rd edition,
Addison-Wesley Longman Publishing Company, 1982.
Dumitru IACOB, Statistica, Editura Universitii tefan cel Mare,
Suceava, 2000.
Alexandru ISAIC-MANIU, Constantin MITRU, Vergil VOINEAGU,
Statistica pentru managementul afacerilor, ediia a II-a, Editura
223

Economic, Bucureti, 1999.


Elisabeta JABA, Ana GRAMA, Analiza statistica cu SPSS sub Windows,
Editura Polirom, Iai, 2004.
Elisabeta JABA, Statistica, ediia a II-a, Editura Economic, Bucureti,
2000.
Gerald KELLER, Brian WARRACK, Henry BARTEL, Statistics for
management and economics, 3rd edition, Duxbury Press, 1994.
Ludwig von MISES, The Ultimate Foundation of Economic Science, Van
Nostrand Edition, 1962, http://www.mises.org
Neil J. SALKIND, Statistics for People who (think They) Hate Statistics,
2nd edition, Sage Publications, Inc., 2003,
http://books.google.com/books?id=naHRZCYkJ3sC
Doina Maria SIMION, Statistic descriptiv, Editura Universitii Lucian
Blaga din Sibiu, 2002.
Murray R. SPIEGEL, David P. LINDSTROM, Statistics, McGraw-Hill
Professional, 2000, http://books.google.com/books?id=KdDzrQGAlnkC
Liliana SPIRCU, Mihai CALCIU, Tiberiu SPIRCU, Analiza Datelor de.
Marketing, Editura ALL, Bucureti, 1994.
Vladimir TREBICI (coord.), Mic enciclopedie statistic, Editura
Stiinific i Enciclopedic, Bucureti, 1985.
Emilia IAN, Simona GHI, Angelica BCESCU-CRBUNARU,
Bazele statisticii, Editura Meteora Press, Bucureti, 2002.
*** Anuarul statistic al Romaniei 2006, Institutul Naional de Statistic,
Bucureti, 2001, http://www.insse.ro (accesat ultima dat n 26 septembrie
2008).
*** Buletinul Statistic de Comer Internaional, colecia 2007 iunie
2008, Institutul Naional de Statistic, Bucureti, 2001, http://www.insse.ro
(accesat ultima dat n 26 septembrie 2008).
*** Buletinul Statistic de Industrie, colecia 2007 iulie 2008, Institutul
Naional de Statistic, Bucureti, 2001, http://www.insse.ro (accesat ultima
dat n 26 septembrie 2008).
*** Buletinul Statistic de Preuri, colecia 2007 iulie 2008, Institutul
Naional de Statistic, Bucureti, 2001, http://www.insse.ro (accesat ultima
dat n 26 septembrie 2008).
*** Buletinul Statistic Lunar, colecia 2007 iulie 2008, Institutul
Naional de Statistic, Bucureti, 2001, http://www.insse.ro (accesat ultima
dat n 26 septembrie 2008).
224

*** Business Standard, http://www.standard.ro


*** Capital, http://www.capital.ro
*** Tribuna Economic, http://www.tribunaeconomica.ro/
*** Ziarul Financiar, http://www.zf.ro

225

226

S-ar putea să vă placă și