Sunteți pe pagina 1din 29

UNITATEA DE NVARE 6

PARAMETRII REPARTIIILOR STATISTICE

CUPRINS

6.1. Obiective 1
6.2. Parametrii tendinei centrale. Parametrii variaiei 2
6.3. Media i variana caracteristicii alternative. 18
Parametrii asimetriei i ai boltirii
6.4. Test de autoevaluare 22
6.5. Rspunsuri Test de autoevaluare 24
6.6. Lucrare de verificare 27
6.7. Rezumat 29
6.8. Bibliografie 29

OBIECTIVE. n Unitatea de nvare 6,


PARAMETRII REPARTIIILOR STATISTICE, n vederea cercetrii
statistice a tendinelor i a regulilor de manifestare, repartiia unei
variabile economice trebuie generalizat, astfel nct ntreaga ei esen
s fie concentrat n civa parametri sintetici:
parametrii tendinei centrale;
parametrii variaiei sau ai mprtierii;
parametrii asimetriei i ai boltirii.
6.2. Parametrii tendinei centrale. Parametrii variaiei

6.2.1. Parametrii tendinei centrale.

n cadrul oricrei repartiii de date, valorile observate manifest tendina


de grupare n jurul unei valori tipice, numit centru de grupare. Caracterizarea
statistic a centrului de grupare se realizeaz cu ajutorul unei serii de parametri
sau indicatori medii, cunoscui sub numele generic de mrimi medii. 1
Mrimile medii exprim n mod sintetic i generalizant ceea ce este
tipic, esenial pentru unitile unei populaii statistice distribuite dup una sau
mai multe caracteristici. Pentru a servi pe deplin scopului lor, mrimile medii
trebuie s ndeplineasc o serie de condiii, cum ar fi: 2
s fie precis definite, fie printr-o formul, fie printr-o definiie,
astfel nct, oricine ar efectua calculele referitoare la aceeai distribuie de date
s ajung la acelai rezultat;
s fie reprezentative pentru toi termenii seriei la care se refer, cu
condiia, desigur, ca populaia studiat s fie omogen. Dac populaia nu e
omogen, atunci ea trebuie separat pe grupe omogene i se determin mrimile
medii pentru fiecare grup n parte;
s fie relativ uor de calculat i s se preteze la calcule algebrice
ulterioare;
s fie stabile, puin influenate de fluctuaiile seleciei, adic,
indiferent de eantioanele care sunt utilizate pentru cercetarea statistic a
populaiei respective, mrimile medii s fie aproximativ aceleai.
Este de la sine neles c toate aceste condiii nu pot fi ndeplinite
cumulativ de ctre orice mrime medie, dar este foarte important s se
cunoasc, pentru fiecare valoare medie n parte, ce condiii nu sunt satisfcute.
Mrimile medii pot fi clasificate dup numeroase criterii, dintre care
cele mai importante sunt dup rol i dup modul de calcul.
Dup rolul lor, mrimile medii sunt mrimi utilizate pentru calcul
(media aritmetic, media geometric, media ptratic etc.) i mrimi medii de
poziie (mediana, modul, quantilele, etc.).

1
I.D. Resa, t. Petrescu, M. Precupa, Al. Cra, Probleme de statistic rezolvate pe calculator,
Editura Facla, Timioara, 1984, pag. 19
2
Elisabeta Jaba, Statistica, Editura Sedcom Libris, Iai, 1996, pag. 98

2
n funcie de modul de calcul, mrimile medii pot fi simple (n cazul
seriilor simple de date) sau ponderate (n cazul seriilor grupate pe intervale de
frecven).
n afar de mrimile de calcul (n special media), prezentate pe larg n
capitolul 2, pentru a studia tendina central se mai determin i mrimile de
poziie, dintre care cele mai cunoscute sunt mediana, modul i quantilele.
Prin mediana (Me) unei serii de distribuie se nelege acea valoare
pentru care probabilitatea ca variabila aleatoare X s ia valori inferioare lui Me
este egal cu probabilitatea ca X s ia valori superioare lui Me, conform relaiei:

P (X< ME) = P (X > ME) (6.1)

Mediana este, deci, valoarea central a unei serii ordonate cresctor sau
descresctor, care mparte repartiia n dou pri egale.
A. Pentru date negrupate, mediana se determin n dou variante 3:
dac numrul unitilor observate este impar, de forma n = 2p + 1,
atunci mediana este egal cu valoarea unitii situate n mijlocul seriei de date
(de rang p + 1), adic:

ME = XP+1 (6.2)
dac numrul unitilor observate este par, de forma n = 2p, atunci
mediana este egal cu media aritmetic simpl a celor dou valori situate n
mijlocul seriei de date (de rang p, respectiv, p + 1), conform relaiei:

x p + x p +1
Me = (6.3)
2

B. Pentru date grupate pe intervale de frecven, calculul medianei


presupune parcurgerea urmtoarelor etape:
1. Se determin frecvenele absolute cumulate ale intervalelor de grupare
(Ni);
2. Se stabilete intervalul median (n interiorul cruia se afl mediana),
ca fiind intervalul corespunztor primei frecvene absolute cumulate mai mare
sau egal cu locul medianei n serie (n/2);
3. Se calculeaz mediana, prin interpolare, conform relaiei:

3
D.M. Levine, D. Stephan, T.C. Krehbiel, M.L. Berenson, Statistics for Managers using
Microsoft Excel, Third Edition, Prentice Hall, 2002, pag. 112114

3
n
N e1
Me = le + he 2 (6.4)
ne

unde: le este limita inferioar a intervalului median;


he reprezint dimensiunea intervalului median;
Ne-1 este frecvena absolut cumulat a intervalului anterior celui median;
ne reprezint frecvena intervalului median.
Mediana prezint avantajul c este mai puin dependent de intervalele de
grupare i de forma de repartiie n comparaie media, fiind mai util atunci
cnd datele sunt prezentate ntr-o form n care calculul mediei este afectat de
nchiderea convenional a intervalelor deschise.
Pentru o mai bun cunoatere a structurii unei repartiii continue de date,
se pot folosi i alte valori de poziie, cum sunt quantilele, care se obin prin
extinderea noiunii de median 4.
Quantilele sunt mrimi de poziie reprezentate de valori ale caracteristicii
care mpart seria de date studiat n q grupe de dimensiuni egale. Constanta q
definete ordinul quantilelor. Astfel, mediana este quantila de ordinul 2,
deoarece mparte seria de date n dou grupe egale. Quantilele de ordinul 4 sunt
cele care mpart seria de date n patru grupe egale i poart numele de quartile.
Quartilele sunt n numr de trei, notate de obicei Q1, Q2 i Q3. Quartila
mijlocie (Q2) este chiar mediana, iar celelalte dou se determin tot prin
interpolare, conform relaiilor:

n
N Q1 1
Q1 = lQ1 + hQ1 4 (6.5)
nQ1
3n
N Q3 1
Q3 = lQ 3 + hQ 3 4 (6.6)
nQ 3

n mod asemntor se determin i celelalte categorii de quantile, i


anume, decilele, care mpart seria de date n zece grupe egale, centilele, care
mpart seria n o sut de grupe egale i promilele, care mpart seria n o mie de
pri egale.

4
Andrei T., Stancu S., op. cit., pag. 8893

4
Modul (Mo) sau dominanta unei variabile aleatoare este valoarea
caracteristicii cu frecvena maxim de apariie, adic valoarea cea mai des
ntlnit n repartiia de date analizate.
n cazul variabilelor discrete, modul se determin, conform definiiei sale,
ca fiind valoarea cu cea mai mare frecven sau probabilitate de apariie .
5

n cazul unei repartiii continue, grupat pe intervale de frecven, modul


este valoarea corespunztoare vrfului curbei de frecven.
n acest caz, determinarea lui presupune parcurgerea urmtoarelor etape:
1. Se determin intervalul cu frecvena maxim de apariie, care devine,
astfel, interval modal (intervalul care conine modul);
2. Se calculeaz modul, prin interpolare, conform relaiei:

1
Mo = lo + h0 (6.7)
1 + 2

unde: lo este limita inferioar a intervalului modal;


ho reprezint dimensiunea intervalului modal;
1 este diferena dintre frecvena intervalului modal i frecvena
intervalului anterior acestuia;
2 este diferena dintre frecvena intervalului modal i frecvena
intervalului urmtor acestuia.
Dac exist mai multe intervale cu frecvena maxim de apariie, atunci
modul nu poate fi determinat ca valoare unic a seriei de date, adic seria
respectiv este plurimodal.
Ca aplicabilitate practic, modul poate nlocui media, atunci cnd aceasta
nu poate fi calculat, sau determinarea ei nu are sens (de exemplu, determinarea
modelului mediu al automobilelor vndute nu are sens, astfel nct se va lua n
considerare ca valoare central modelul cel mai frecvent vndut).
ntr-o repartiie de date perfect simetric i unimodal, cei trei parametri
fundamentali ai tendinei centrale media, mediana i modul au aceeai
valoare, ntre ei existnd relaia de egalitate:

x = ME = MO (6.8)

n cazul repartiiilor asimetrice, cele trei valori centrale sunt diferite, iar
relaia dintre ele se poate exprima astfel:

5
Berenson M.L., Levine D.M., Krehbiel T.C., Basic Busines Statistics. Concepts and
Applications, Ninth Edition, Pearson Prentice Hall, 2004, pag. 91

5
x MO = 3 ( x ME) (6.9)

Alegerea celui mai semnificativ parametru central al unei serii de date


difer de la o situaie concret la alta, existnd, ns, cteva caracteristici
particulare ale valorilor centrale, n funcie de care pot fi difereniate:
media aritmetic este influenat de fiecare valoare a seriei, datorit
faptului c se determin prin calcul, pe baza tuturor termenilor seriei. Din acest
motiv, ea este sensibil la eventualele valori extreme, aberante, care pot afecta
calitatea interpretrilor. De aceea este indicat ca media aritmetic s fie utilizat
pentru serii relativ omogene sau dac este posibil, s se separe seriile de date pe
grupe omogene i apoi s se determine media fiecrei grupe, iar, n final s se
calculeze media mediilor grupelor;
mediana i modul, fiind mrimi de poziie, sunt influenate mai mult
de numrul de date al seriei i de concentrarea acestora n anumite zone i mai
puin de valorile extreme. Acestea prezint i avantajul c sunt uor de obinut
(uneori, chiar prin observare direct), chiar i atunci cnd limitele seriei nu sunt
cunoscute. Dezavantajele lor constau n aceea c, uneori, sunt valori
aproximative i, mai ales n faptul c nu pot fi utilizate n calculele algebrice,
ceea ce le limiteaz drastic aplicabilitatea. 6

6.2.2. Parametrii variaiei

Necesitatea determinrii altor parametri dect cei ai tendinei centrale a


aprut datorit faptului c acetia nu dau nici o informaie referitoare la
dispersarea, mprtierea valorilor repartiiei de date, unele fa de altele sau n
raport cu un centru de grupare. Astfel, valorile centrale pot fi aceleai pentru
mai multe repartiii de date, n timp ce gradul de dispersare al termenilor seriilor
n jurul centrului de grupare s fie diferit.
Din acest motiv, nu este suficient determinarea valorilor centrale ale unei
repartiii de date, ci este necesar s se reflecte structura pe grupe omogene a
acesteia i abaterile termenilor fa de media lor, datorate aciunii unor factori
cunoscui sau ntmpltori.
Importana determinrii parametrilor variaiei este, n primul rnd, aceea
c permite separarea influenei cauzelor eseniale, cuantificabile ale variaiilor
valorilor unei repartiii de date de influena cauzelor aleatoare, ntmpltoare,
necuantificabile.

6
C. ipo, C. Preda, Statistic Economic, Editura Mirton, Timioara, 2004, pag. 46 47

6
Parametrii simpli i sintetici ai variaiei

Parametrii simpli ai variaiei msoar mprtierea fiecrei valori fa de


nivelul mediu sau fa de o anumit valoare a variabilei studiate. Ei pot fi
determinai att n mrime absolut, ct i relativ i sunt urmtorii:
amplitudinea variaiei;
abaterile individuale.
Amplitudinea variaiei n mrime absolut (A) se determin ca diferen
ntre valoarea maxim (xmax) i cea minim (xmin) a caracteristicii studiate,
conform relaiei:

A = XMAX XMIN (6.10)

Pentru date grupate pe intervale de frecven, amplitudinea se calculeaz


ca diferen ntre limita superioar a ultimului interval i limita inferioar a
primului interval.
Amplitudinea n mrime absolut, datorit faptului c este calculat
numai pe baza valorilor extreme ale variabilei studiate, reflect doar ntinderea
domeniului de variaie, nu i structura intern sau cauzele acesteia. Fiind o
mrime absolut, ea nu permite nici compararea gradului de variaie a dou
populaii statistice diferite.
Amplitudinea variaiei n mrime relativ (A%) se determin ca raport
procentual ntre amplitudinea absolut i media aritmetic a variabilei studiate,
astfel:
A x xmin
A% = 100 = max 100 (6.11)
x x

Amplitudinea relativ elimin dezavantajul amplitudinii absolute n ceea


ce privete comparabilitatea seriilor de date, dar rmne la fel de limitat n
reflectarea structurii i cauzelor variaiei.
Amplitudinea reprezint, de fapt, un parametru foarte simplu al variaiei,
care n sine nu este foarte relevant, dar care servete la prelucrarea ulterioar a
informaiilor n vederea gruprii datelor pe intervale de frecven.
Abaterea individual absolut (di) se determin ca diferen ntre fiecare
valoare a variabilei studiate i media acesteia, conform relaiei:

di = xi x (6.12)

7
Abaterea individual relativ (d%i) se calculeaz ca raport procentual
ntre abaterea individual absolut i media variabilei studiate, astfel:

di x x
d %i = 100 = i 100 (6.13)
x x

n cazul utilizrii mediei aritmetice, conform proprietilor acesteia, suma


abaterilor individuale fa de medie, fie c sunt absolute sau relative, este nul:

n n
di = d %i = 0 (6.14)
i =1 i =1

Importan practic prezint, de regul, abaterea individual minim i


abaterea individual maxim pentru a analiza poziia valorilor extreme n raport
cu media.
Parametrii simpli ai variaiei prezint dezavantajul c nu pot exprima
complet variaia caracteristicii studiate, fapt pentru care este necesar
determinarea unor parametrii sintetici.
Parametrii sintetici ai variaiei exprim dispersia tuturor valorilor
individuale n jurul centrului de grupare, reprezentat, de regul, de media
aritmetic. Ei pot fi determinai ca mrimi medii sau relative (coeficieni) i sunt
urmtorii:
abaterea medie liniar;
variana (dispersia);
abaterea standard (abaterea medie ptratic);
coeficientul de variaie.

Abaterea medie liniar

Abaterea medie liniar ( d ) pe date negrupate se determin ca o medie


aritmetic simpl a abaterilor individuale, luate n valoare absolut, astfel:

n
xi x
i =1
d=
n

8
Pentru date grupate pe intervale de frecven, abaterea medie liniar se
determin dup relaia:

x i x ni
d = i =1
n (6.15)

Caracteristica abaterii medii liniare const n aceea c nu se ine cont de


semnul abaterilor individuale luate n considerare, ceea ce n unele cazuri poate
constitui un dezavantaj. Dac, ns, abaterile individuale nu ar fi luate n valoare
absolut, atunci s-ar ajunge la suma abaterilor individuale fa de medie este
nul).
Abaterea medie liniar este un parametru concludent al variaiei numai
pentru populaiile statistice omogene. Neajunsurile abaterii medii liniare sunt
nlturate prin calcularea varianei.

Variana

Variana (2) sau dispersia, cum mai este ea denumit, reprezint


momentul centrat de ordinul 2 i se determin ca o medie aritmetic a ptratelor
abaterilor valorilor studiate de la media lor. Relaia de calcul pentru date
negrupate este:

(x x)
2
i
2 = i =1
n (6.16)

Pentru date grupate pe k intervale de frecven, variana se determin


dup relaia:

(x i x ) n i
k 2
i =1
2 = (6.17)
n

Variana pe date grupate, precum i valorile medii calculate pe date


grupate, sunt cu att mai aproximative cu ct intervalele de grupare sunt mai
mari, ceea ce conduce la ideea c este de preferat s se determine aceti
parametri pe baza valorilor individuale negrupate.

9
Variana mai poate fi calculat i cu metoda momentelor, astfel:

2
n x
i
n 2
xi
i =1
2 = i =1 n (6.18)
n

pentru date negrupate, iar pe date grupate pe intervale de frecven:

2
k
xi ni
xi2 ni i =1
k

n
2 = i =1
n (6.19)

De asemenea, variana are anumite proprieti, dintre care mai importante


7
sunt :
variana unei constante este nul: VAR(c) = 0;

variana sumei a dou sau mai multe variabile independente Xi

este egal cu suma varianelor variabilelor respective: VAR(X1 +
X2 + + Xk) = VAR(X1) + VAR(X2) + + VAR(Xk);
variana produsului dintre o constant a i o variabil X este egal
cu produsul dintre ptratul constantei i variana variabilei:
VAR(aX) = a2 VAR(X).
Variana, fiind de ordinul ptratului valorilor studiate, este un parametru
abstract, fr unitate de msur i cuantific variaia total a caracteristicii
datorit cauzelor eseniale i ntmpltoare. Ea este util n verificarea unor
ipoteze statistice i st la baza determinrii altor parametrii ai variaiei, cu
aplicabilitate practic mai larg, cum sunt abaterea standard i coeficientul de
variaie.

Abaterea standard

Abaterea standard () sau abaterea medie ptratic se determin ca o


medie ptratic a abaterilor valorilor seriei fa de media lor, respectiv, ca
rdcin ptrat din varian. Pe date negrupate, relaia ei de calcul este:

7
I.D. Resa i alii, op. cit., pag. 25

10
(x i x)
n 2

= i =1
= 2 (6.20)
n

Pentru date grupate pe k intervale de frecven, abaterea standard se


determin conform relaiei:

(x i x ) n i
k 2

= i =1
= 2 (6.21)
n

Avantajele abaterii standard constau n aceea c acord fiecrei abateri de


la medie importana cuvenit i c poate fi utilizat n interpretrile economice
datorit faptului c, spre deosebire de varian, este de acelai ordin de mrime
cu valorile studiate.
Abaterea standard este utilizat ndeosebi la estimarea erorilor de sondaj,
n calculele referitoare la regresie i corelaie, precum i n verificarea
semnificaiei anumitor indicatori statistici.
Dezavantajul utilizrii acestui parametru const n faptul c, datorit
exprimrii sale n aceleai uniti de msur ca i valorile caracteristicii studiate,
nu permite compararea a dou colectiviti care se exprim n uniti de msur
diferite.
Acest dezavantaj poate fi nlturat prin calcularea ultimului parametru al
variaiei, coeficientul de variaie.

Coeficientul de variaie

Coeficientul de variaie (V) este raportul procentual dintre abaterea


standard i media aritmetic, conform relaiei:


V= 100
x (6.22)

Fiind un parametru relativ al mprtierii, coeficientul de variaie permite


compararea variaiei mai multor caracteristici diferite, att ca ordin de mrime,
ct i ca natur. Mrimea lui este direct proporional cu variaia caracteristicii.

11
Coeficientul de variaie poate lua valori ntre 0 i 100% i are urmtoarele
interpretri:
dac V = 0%, nseamn c toate valorile caracteristicii sunt egale ntre
ele, respectiv, egale cu media aritmetic, variaia lor fiind nul;
dac V 0%, nseamn c variaia caracteristicii este mic, adic
populaia statistic studiat este omogen, iar media este reprezentativ pentru
aceasta. Se consider c o populaie statistic are un grad ridicat de omogenitate
atunci cnd V< 35%;
dac valoarea coeficientului de variaie depete 70%, atunci variaia
caracteristicii este foarte mare, media nu este reprezentativ i structura
populaiei studiate este eterogen. n aceste condiii, se impune regruparea
datelor, cu respectarea riguroas a principiilor teoretice de omogenizare a
grupelor. De cele mai multe ori, n asemenea cazuri este necesar separarea
populaiei statistice n mai multe grupe omogene, care vor fi studiate separat.
Datorit posibilitilor multiple de interpretare pe care le prezint,
coeficientul de variaie poate fi considerat cel mai sintetic parametru al variaiei.

Exemplul.1. Pentru determinarea parametrilor sintetici ai variaiei pe date


negrupate, se iau n considerare valorile vnzrilor din tabelul 6.1:

Tabelul 6.1
165 168 164 185 201
156 180 156 195 181
159 170 189 186 173
167 166 138 201 193
170 180 153 165 164
146 161 180 175 160
140 171 160 187 200
151 169 172 177 142
164 179 142 166 184
158 191 155 165 149

Se determin mai nti media vnzrilor: x = 169,38 mil. lei.


Abaterea medie liniar pe date negrupate se calculeaz astfel:

12
50

x i 169 ,38
d = i =1
50 = 12,97 mil. lei

Variana pe date negrupate:

50

(x 169 ,38 )
2
i
2 = i =1
50 = 257,31

Abaterea standard pe date negrupate


50

(x 169 ,38 )
2
i
= i =1
50 = 257 ,31 = 16,04 mil. lei

Coeficientul de variaie pe date negrupate:

16 ,04
V = 100 = 100
x 169 ,38 = 9,47%

Se observ c valoarea coeficientului de variaie este destul de mic, fapt


pentru care se poate spune c vnzrile sunt omogene, iar media lor este
reprezentativ.

Exemplul 2. Parametrii sintetici ai variaiei pentru date grupate pe


intervale de frecven se determin lund n considerare valorile vnzrilor din
tabelul 6.2:

Tabelul 6.2.
Vnzri (xi) ni Mijloacele
intervalelor (xi* )
135 145 4 140
145 155 4 150
155 165 11 160
165 175 13 170
175 185 8 180

13
185 195 6 190
195 205 4 200
TOTAL 50

Media pe date grupate este: x = 170,2 mil. lei


Datele se prelucreaz n vederea determinrii abaterii medii liniare pe
date grupate, conform tabelului 6.3:

Tabelul 6.3
Vnzri (xi) ni Mijloacele |xi* - x| |xi* - x | ni
intervalelo
r (xi* )
135 145 4 140 30,2 30,2 4 = 120,8
145 155 4 150 20,2 20,2 4 = 80,8
155 165 11 160 10,2 10,2 11= 112,2
165 175 13 170 0,2 0,2 13 = 2,6
175 185 8 180 9,8 9,8 8 = 78,4
185 195 6 190 19,8 19,8 6 = 118,8
195 205 4 200 29,8 29,8 4 = 119,2
TOTAL 50 632,8

Conform relaiei 6.28, abaterea medie liniar pe date grupate este:

x
i =1
i x ni
632 ,8
d = =
n 50 = 12,65 mil. lei

Pentru a determina variana pe date grupate, se vor efectua operaiunile


descrise n tabelul 6.4:

Tabelul 6.4
Vnzri (xi) ni Mijloacele (xi* - x )2 (xi* - x )2 ni
intervalelor
(xi* )
135 145 4 140 912,04 3648,16
145 155 4 150 408,04 1632,16
155 165 11 160 104,04 1144,44

14
165 175 13 170 0,04 0,52
175 185 8 180 96,04 768,32
185 195 6 190 392,04 2352,24
195 205 4 200 888,04 3552,16
TOTAL 50 13098

Conform relaiei 6.30, variana pe date grupate este:

(x x ) ni
2
i
13098
2 = i =1
=
n 50 = 261,96

Abaterea standard pe date grupate se va obine prin extragerea radicalului


din varian, astfel:

= 261,96 = 16,18 mil. lei

Coeficientul de variaie pe date negrupate este:


16 ,18
V = 100 = 100 = 9 ,50%
x 170 ,2

Diferenele care apar ntre valorile parametrilor sintetici ai variaiei,


determinate pe date negrupate, respectiv, grupate pe intervale de frecven sunt
prezentate n tabelul 6.5:

Tabelul 6.5
Parametrul sintetic Valoare pe date Valoare pe date
al variaiei negrupate grupate
Abaterea medie liniar 12,97 12,65
Variana 257,31 261,96
Abaterea standard 16,04 16,18
Coeficientul de variaie 9,47 9,50

Aa cum s-a specificat anterior, parametrii variaiei determinai pe date


grupate sunt cu att mai aproximativi cu ct intervalele de grupare sunt mai
mari, ceea ce conduce la ideea c, atunci cnd este posibil, e de preferat s se
determine aceti parametri pe baza valorilor individuale negrupate.

15
Parametrii factoriali ai variaiei

Variabilitatea fenomenelor socialeconomice este influenat, n general,


att de aciunea factorilor eseniali, determinani, ct i de aciunea unor factori
aleatori, ntmpltori. Cuantificarea influenei tuturor acestor factori asupra
variaiei fenomenului sau procesului economic studiat se realizeaz cu ajutorul
analizei varianei sau ANOVA (analysis of variance) , care are la baz sistemul
8

parametrilor factoriali ai variaiei.


Procedeul const n descompunerea variaiei totale a unui ansamblu de
date nregistrate pentru fenomenul economic studiat n componente ale variaiei,
definite dup sursele acesteia, precum i compararea componentelor respective
pentru a stabili dac factorii considerai cauz au influen semnificativ. n
funcie de cauzele care determin variaia, componentele acesteia pot fi grupate
n dou categorii:
componenta numit explicativ sau efect, ce reprezint variaia
determinat de factorii de influen luai n considerare;
componenta numit rezidual, care nu poate fi pus pe seama unui
anumit factor de influen, fiind efectul cumulat al tuturor factorilor aleatori ce
acioneaz asupra fenomenului studiat.
Parametrii factoriali ai variaiei sunt:
variana de grup (parial) j2;
media varianelor de grup 2 ;
variana mediilor de grup fa de media general 2;
variana total (general) 02.
Variana de grup sau parial cuantific influena factorilor aleatori,
neeseniali, care determin variaia valorilor studiate n cadrul unei grupe.
Ea se calculeaz ca medie aritmetic ponderat a ptratelor abaterilor
xj
valorilor caracteristicii (xi) de la media grupei ( ), conform relaiei:

m
(
xi x j
i =1
)2 n ij m
(
xi x j
i =1
)2 n ij
2j = m
= (6.23)
n ij nj
i =1

8
Tehnica ANOVA este prezentat pe larg n: M.L. Berenson, D.M. Levine, T.C. Krehbiel, op.
cit., pag. 387432; P. Newbold, W.L. Carlson, B. Thorne, op. cit., 579620; Elisabeta Jaba, op.
cit., pag. 303320

16
Varianele de grup (intragrup) se vor calcula pentru fiecare grup n
parte i vor avea valori mai mari sau mai mici, n funcie de gradul de
eterogenitate, respectiv, de omogenitate a grupelor populaiei statistice studiate.
Media varianelor de grup se determin ca o medie aritmetic ponderat
a varianelor de grup, astfel:

k
jn j
2
j=1
2 = k (6.24)
nj
j=1

Acest parametru factorial al variaiei cuantific influena factorilor


aleatori pe ntreaga populaie statistic, deci sintetizeaz variaia rezidual,
ntmpltoare a caracteristicii studiate.
Variana mediilor de grup fa de media general (variana intergrupe) se
determin ca o medie aritmetic ponderat a ptratelor abaterilor mediilor de
xj
grup ( ) fa de media populaiei statistice ( x ), conform relaiei:

k
(
xj x nj
j=1
)2
2 = k (6.25)
nj
j=1

Variana intergrupe reflect variaia caracteristicii datorat cauzelor


eseniale pe ntreaga populaie statistic studiat.

Variana total (general) se calculeaz ca o medie aritmetic ponderat


a ptratelor abaterilor valorilor fa de media populaiei statistice, dup relaia:

(x i x) ni
m 2

02 = i=1 m (6.26)
ni
i =1

Variana total cuantific variaia datorat aciunii conjugate a tuturor


cauzelor, eseniale sau ntmpltoare, care se manifest la nivelul ntregii

17
populaii statistice. Dac populaia statistic este omogen, valoarea varianei
totale este mic, iar dac populaia este eterogen, variana total este mare.
Pentru seriile de date bidimensionale, alturi de medii i variane, se
determin i covariana, ca o medie ponderat a produselor abaterilor
variabilelor X i Y, astfel:

Cov(x , y ) = (x i x )(y i y )n ij
1 m k
(6.27)
n i =1j=1

Pornind de la parametrii factoriali ai variaiei, se poate cuantifica gradul


de influen a celor dou categorii de factori, cu ajutorul a doi coeficieni:

6.3. Media i variana caracteristicii alternative. Parametrii


asimetriei si ai boltirii

6.3.1. Media i variana caracteristicii alternative

Parametrii unei caracteristici alternative se mai numesc i parametri ai


variabilei aleatoare Bernoulli 9. Datorit caracterului dihotomic al caracteristicii,
unitile statistice nu se pot gsi dect n una din cele dou situaii posibile:
posed nsuirea analizat (DA = 1) sau nu posed nsuirea respectiv (NU =
0). Distribuia de frecven pentru o caracteristic alternativ este prezentat n
tabelul 6.6:
Tabelul 6.6
Valori ale Frecvenele de apariie
caracteristicii Absolute Relative
N1 n
p= 1
Da: x1 = 1 n
N n1 n n1
q=
Nu: x2 = 0 n
Total N P+q=1

9
C. Chilrescu, O. Ciorc, C. Preda, C. ipo, N. Surulescu, op. cit., pag. 99103

18
Media unei caracteristici alternative ( x ) se determin pornind de la
relaia de calcul a mediei aritmetice, astfel:

xini
1 n 1 + 0 (n n 1 ) n 1
x= i
= = =p (6.28)
ni n n
i

Se observ, deci, c media caracteristicii alternative este chiar ponderea


unitilor care posed nsuirea analizat n totalul unitilor populaiei statistice.
Din acest motiv, media caracteristicii alternative poate fi considerat mrime
relativ de structur, pondere sau greutate specific, precum i probabilitate de
apariie a cazurilor favorabile. Aceste interpretri sunt valabile i pentru
probabilitatea de apariie a cazurilor nefavorabile (q).
Variana caracteristicii alternative (2) se determin ca produs ntre cele
dou frecvene relative p i q, conform relaiei:

2 = p q = p (1p) (6.29)

Abaterea standard () se va determina ca radical din varian, astfel:

= p(1 p ) (6.30)

Parametrii unei caracteristici alternative au o larg utilizare n calculul


erorilor de eantionare, la controlul calitii produselor etc.

6.3.2. Parametrii asimetriei i ai boltirii

n analiza seriilor de distribuie unidimensionale, un interes aparte l


prezint cunoaterea formei distribuiei. Forma unei distribuii statistice poate fi
apreciat cu ajutorul parametrilor asimetriei i ai boltirii.
Parametrii asimetriei dau informaii asupra modului de repartizare a
frecvenelor de o parte i de alta a valorii centrale a unei serii. Ca valori centrale
n vederea aprecierii asimetriei sunt folosite media aritmetic ( x ), modul (Mo)
i mediana (Me). Astfel, n practic pot exista distribuii empirice care se abat
de la curba normal a frecvenelor i care sunt fie uor asimetrice, fie pronunat
asimetrice, nclinate spre stnga sau spre dreapta.
Pentru cuantificarea asimetriei sunt utilizai numeroi parametri, dar cei
mai cunoscui i mai des utilizai sunt parametrii asimetriei propui de Pearson:

19
1. Asimetria n mrime absolut (As), care se determin conform relaiei:

As = x Mo (6.31)

Atunci cnd volumul eantionului studiat este foarte mare, pe baza


relaiei dintre valorile centrale, asimetria se poate exprima i n funcie de
median, dup relaia:

As = 3( x Me) (6.32)

Dac media este mai mic dect modul i mediana, atunci As < 0 i curba
este nclinat spre dreapta, iar dac media este mai mare dect celelalte valori
centrale, atunci As > 0 i curba este nclinat spre stnga.
2. Coeficientul de asimetrie Pearson (Cas) se determin ca raport ntre
asimetria absolut i abaterea standard, astfel:

x Mo
Cas = (6.33)

Acest coeficient ia valori n intervalul (1, 1) i se interpreteaz astfel:


dac cele dou valori centrale sunt foarte apropiate, Cas 0 i atunci
distribuia studiat este simetric;
dac media este mai mic dect modul, atunci Cas < 0 i distribuia
este nclinat spre dreapta;
dac media este mai mare dect modul, atunci Cas > 0 i distribuia
este nclinat spre stnga;
dac Cas < 0,3 atunci seria este uor asimetric, iar dac Cas >
0,3 atunci seria este pronunat asimetric.
3. Coeficientul de asimetrie se mai poate determina n cazul seriilor uor
asimetrice cu un volum mare de date conform relaiei:

3( x Me)
Cas = (6.34)

Acest coeficient ia valori n intervalul (3, 3), iar interpretarea sa este
similar cu cea a coeficientului anterior.

20
Parametrii boltirii arat n ce msur curba repartiiei empirice este mai
nalt sau mai aplatizat n raport cu curba repartiiei normale. n acest sens, mai
des utilizai sunt doi coeficieni:
1. Coeficientul boltirii Pearson (), care se determin pe baza
momentelor centrate, astfel:

4
= = 42
2
2
2 ( ) (6.35)

unde: 4 este momentul centrat de ordinul patru, calculat cu relaia:

(x i x ) n i
n 4
i =1
4 = (6.36)
n

iar 2 este momentul centrat de ordinul doi, adic variana (2).


Pentru o distribuie cu o boltire normal, coeficientul de boltire ia
valoarea 3. Astfel, dac < 3, atunci repartiia empiric este aplatizat, iar dac
> 3, atunci repartiia empiric studiat are o curb mai nalt dect cea
normal.
2. Coeficientul boltirii Fisher (), care cuantific excesul fa de boltirea
unei repartiii normale. Deoarece pentru o repartiie normal coeficientul boltirii
Pearson () are valoarea 3, gradul de exces se calculeaz astfel:

4
=3= 3 (6.37)
22

Interpretarea lui este urmtoarea:


dac = 0, repartiia empiric are o boltire normal;
dac < 0, curba repartiiei empirice este mai plat dect cea normal;
dac > 0, curba repartiiei empirice este mai nalt dect cea
normal;

21
6.4. Test de autoevaluare

1.Au fost nregistrate vnzrile lunare ale unei firme (V) pe o perioad de 15
luni (mil. lei):

V 13 18 15 12 16 18 14 11 6 7 13 9 15 14 17

Determinai mediana.

2. Au fost nregistrate vnzrile lunare ale aceleiai firme (V) pe o perioad de


16 luni (mil. lei):

V 13 18 15 12 16 18 14 11 16 17 13 19 15 14 17 18
Determinai mediana.

3.Se iau n considerare datele grupate pe intervale de frecven din tabelul de


mai jos. Pentru calculul medianei se determin frecvenele cumulate absolute,
astfel:

Tabelul 1
Vnzri (xi) ni Frecvenele cumulate
mil. lei absolute (Ni )
135 145 4 4
145 155 4 8
155 165 11 19
165 175 13 32
175 185 8 40
185 195 6 46
195 205 4 50
TOTAL 50
Determinai mediana, Q1, Q2, Q3.

22
4.Dac se iau n considerare datele referitoare la vnzrile unei firme, prezentate
n tabelul de mai jos:

V 13 8 15 9 16 18 14 11

Determinai parametrii simpli ai variaiei.

23
Rspunsuri Test de autoevaluare

1. Pentru a se determina mediana, n primul rnd este necesar ordonarea


datelor seriei i stabilirea rangului fiecrui termen al seriei. De regul,
ordonarea se face cresctor, astfel:

V 11 12 13 13 14 14 15 15 16 16 17 17 18 18 19
Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Avnd n vedere faptul c volumul seriei de date este impar (15 valori),
mediana va fi egal cu valoarea situat pe poziia din mijloc, adic
valoarea de rang 8:
Me = x8 = 15 mil. Lei
2. Se ordoneaz cresctor datele:

V 11 12 13 13 14 14 15 15 16 16 17 17 18 18 18 19
Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Avnd n vedere faptul c volumul seriei de date este, de aceast dat, par (16
valori), mediana va fi egal cu media aritmetic simpl a valorilor situate pe
poziiile din mijloc, adic a celor de rang 8, respectiv 9:

x8 + x9 15 + 16
ME = = = 15,5 mil. lei
2 2

3.Se observ c primul interval a crui frecven absolut cumulat este mai
mare dect locul medianei n serie (n/2 = 25) este intervalul de la 165 la 175
(N4 = 32), care devine, astfel, interval median. n aceste condiii, mediana este:

25 19
Me = 165 + 10 = 169,61 mil. lei
13

Lund n considerare datele din tabelul 1 din exerciiul 2, intervalele quartilice


sunt:

24
Tabelul 2
Vnzri (xi) ni Frecvenele cumulate
mil. lei absolute (Ni )
135 145 4 4
145 155 4 8
155 165 11 19
165 175 13 32
175 185 8 40
185 195 6 46
195 205 4 50
TOTAL 50

Se observ c primul interval a crui frecven absolut cumulat este mai mare
dect locul quartilei 1 n serie (n/4 = 12,5) este intervalul de la 155 la 165 (N3 =
19), intervalul quartilei 2 este cel median, iar intervalul quartilei 3 este de la 175
la 185, deoarece frecvena sa absolut cumulat (N5 = 40) este prima cu valoare
mai mare dect locul quartilei 3 n serie (3n/4 = 37,5). n aceste condiii, cele
trei quartile sunt:

12 ,5 8
Q1 = 155 + 10 = 159,09 mil. lei
11

Q2 = Me = 169,61 mil. lei

37 ,5 32
Q3 = 175 + 10 = 181,87 mil. lei
8

4.Lund n considerare datele din tabel, valoarea maxim, cea minim i media
aritmetic sunt: xmax = 19; xmin = 11; x = 15,5.
n aceste condiii, amplitudinea absolut a variaiei este:

A = 19 11 = 8 MIL. LEI

25
Amplitudinea relativ a variaiei este:

19 11
A% = 100 = 51,61%
15,5
Abaterile individuale absolute sunt:
d1 = 13 15,5 = 2,5 d5 = 16 15,5 = + 0,5
d2 = 18 15,5 = + 2,5 d6 = 18 15,5 = + 2,5
d3 = 15 15,5 = 0,5 d7 = 14 15,5 = 1,5
d4 = 19 15,5 = + 3,5 d8 = 11 15,5 = 4,5
Se observ c: d1 + d2 + d3 + d4 + d5 + d6 + d7 + d8 = 0

Abaterile individuale relative sunt:

d%1 = 13 15,5 = 16,12% d%5 = 16 15,5 = + 3,22%


d%2 = 18 15,5 = + 16,12% d%6 = 18 15,5 = + 16,12%
d%3 = 15 15,5 = 3,22% d%7 = 14 15,5 = 9,67%
d%4 = 19 15,5 = + 22,58% d%8 = 11 15,5 = 29,03%

Se observ c: d%1 + d%2 + d%3 + d%4 + d%5 + d%6 + d%7 + d%8 = 0

26
6.6. Lucrare de verificare

1. Managerul unei bnci dorete s studieze evoluia ratei dobnzilor. n acest


sens, a fost selectat un eantion format din 36 de valori ale ratei dobnzii anuale
nregistrate lunar timp de 3 ani. Datele sunt urmtoarele:

An 1 An 2 An 3
3,3 4,5 4,8
4,1 4,5 4,6
4,6 4,1 4,2
3,6 4,9 3,1
3,2 4,8 3,7
3,3 4,1 3,4
3,4 5,1 3,6
3,1 4,7 3,5
3,5 4,1 4,3
3,5 4,9 4,7
4,4 4,7 4,8
4,3 4,3 4,5

Se cere: a) S se determine parametrii tendinei centrale att pe date grupate pe


intervale de frecven i ct i pe date negrupate;
b) S se determine parametrii variaiei pe date grupate i negrupate;
c) S se determine parametrii asimetriei i ai boltirii.

2. Un institut de cercetri dorete s studieze evoluia ratei omajului. Pentru


aceasta a fost selectat un eantion format din 30 de valori lunare ale ratei
omajului, astfel:

27
4,9 7,0 5,3
7,2 6,9 6,7
5,8 6,4 6,8
5,7 4,8 4,8
6,3 5,3 5,8
5,3 5,1 6,8
7,3 6,7 4,3
5,6 5,2 7,8
6,7 7,2 4,8
5,9 4,2 7,8

Se cere: a) S se determine parametrii tendinei centrale att pe date grupate pe


intervale de frecven i ct i pe date negrupate;
b) S se determine parametrii variaiei pe date grupate i negrupate;
c) S se determine parametrii asimetriei i ai boltirii

28
Rezumat. n Unitatea de nvare 6, Parametrii repartiiilor
statistice, dup nota dominant pe care o pun n eviden parametrii ce
caracterizeaz o variabil aleatoare, acetia s-au grupat astfel:
parametrii tendinei centrale;
parametrii variaiei sau ai mprtierii;
parametrii asimetriei i ai boltirii.

BIBLIOGRAFIE

1. Anderson D.R., Williams Th.A., Sweeney D.J., Statistics for Business and
Economics, West Publishing Company, 1990

2. Baron T., Anghelache C., ian E., Statistic, Editura Economic,


Bucureti, 1996

3. Berenson M.L., Levine D.M., Krehbiel T.C., Basic Business Statistics.


Concepts and Applications, 9th Edition, Pearson Prentice Hall,
2004

4. Jaba E., Statistica, Editura Sedcom Libris, Iai, 1996

5. Levine D.M., Berenson M.L., Stephan D., Statistics for Managers using
Microsoft Excel, Second Edition, Prentice Hall, 1999

6. Newbold P., Carlson W.L., Thorne B., Statistics for Business and
Economics, Fifth Edition, Pearson Prentice Hall, 2003

7. Resa I.D., Petrescu t., Precupa M., Cra Al., Probleme de statistic
rezolvate pe calculator, Editura Facla, Timioara, 1984

8. ipo C., Preda C., Statistic economic, Editura Mirton, Timioara, 2004

9. ian E., Statistic macroeconomic, A.S.E., Bucureti, 1996

***
10. Anuarul Statistic al Romniei, anii 2000 2005

11. ***
Rapoartele anuale i lunare ale Bncii Naionale a Romniei, anii 2000
2007

29