Sunteți pe pagina 1din 25

CURS 6

Indicatori ai variaiei (mprtierii)


6) Coeficientul de variaie (omogenitate)

Ct de nsemnat este abaterea medie ptratic, numai
comparaia cu media o poate arta. Aceast comparaie se
realizeaz prin intermediul coeficientului de variaie (v sau
Cv).
Coeficientul de variaie descrie abaterea medie ptratic ca
procent din media aritmetic.
Coeficientul de variaie permite compararea mprtierii
valorilor care nu sunt exprimate n aceeai unitate de
msur (de exemplu, compararea variabilitii salariilor din
dou ri i n diferite monede, compararea variabilitii
compartimentului unor produse pe diferite piee etc.) i se
exprim n procente.
Coeficientul de variaie (Cv) se definete ca raport ntre
abaterea medie ptratic i media aritmetic a ansamblului
de observaii:
| | % 100
x
Cv
o
=
ntruct anumite serii statistice pot fi mai bine reprezentate de
median sau mod, n numitorul formulei de calcul al
coeficientului de variaie media poate fi nlocuit prin
median sau mod.
Coeficientul de variaie este cel mai sintetic indicator al
mprtierii, nu numai pentru c permite comparaia
variabilitii, dar i pentru faptul c valorile sale sunt
localizate n intervalul {0,100}, astfel:
cu ct valorile sale sunt mai apropiate de zero, cu att seria
este mai omogen (media este mai reprezentativ);
cu ct valorile sale sunt mai apropiate de 100 cu att
ansamblul valorilor individuale observate este mai eterogen
(mprtierea este mai mare, iar media calculat este mai
puin reprezentativ).
n literatura de specialitate se avanseaz nivelul de 35% ca
limit maxim admisibil pentru coeficientul de variaie,
care a stabilit acest prag de trecere de la starea de
omogenitate la cea de eterogenitate. Intervalul de valori se
poate mpri astfel:
0 < v < 35%, variatia este mica, media ca indicator al tendintei
centrale este semnificativa, abaterile variantelor x
i
de la medie
sunt mici, valorile mici graviteaza n jurul mediei, colectivitatea
este omogena, adica e formata din unitati ce apartin aceluiasi tip
calitativ, gruparea ca metoda de sistematizare este bine facuta.
35% < v < 50%, variatie relativ mare, ceea ce nseamna ca
aspectele prezentate mai sus devin discutabile.
50% < v < 100%, variatie foarte mare, media nu este
semnificativa, deoarece mascheaza abateri mari ale termenilor ,
termeni care sunt pozitionati la distante mari unul fata de
altul.Gruparea nu este corect facuta, se recomanda mpartirea
colectivitatii n grupe omogene si determinarea indicatorilor
sintetici pentru fiecare grupa.

Coeficientul de variatie poate fi folosit ca test de verificare a
reprezentativitatii mediei, distingndu-se cazurile:
0 < v < 17%, media este strict (foarte) reprezentativa ;
17% < v < 35%, media este moderat reprezentativ;
35% < v < 50%, media este relativ reprezentativa;
v >50%, media nu este reprezentativa.
Pentru determinarea coeficientului de variaie de multe ori se utilizeaz
abaterea medie absolut:


Diferena dintre Cv i Cv' poart amprenta diferenei dintre abaterea
medie ptratic i abaterea medie absolut.
n exemplul cu rata omajului pe ri, coeficientul de variaie este:



Aadar, colectivitatea considerat n acest exemplu este eterogen.
rile incluse n analiz sunt foarte diferite din punct de vedere al
nivelului de dezvoltare i al sistemului economic specific, ceea ce
determin diferene mari n mrimea indicatorului considerat. Se
poate ncerca o grupare n: ri dezvoltate, ri mai puin dezvoltate
i fostele ri socialiste.
n cazul exemplului cu cifra de afaceri realizat de 200 ageni
economici, coeficientul de variaie este egal cu 20,6% ceea ce
indic faptul c media este moderat reprezentativ.
100
x
d
Cv
'
=
% 4 , 45 100
6 , 9
36 , 4
100
x
Cv = =
o
=
Analiza indicatorilor tendinei centrale i a indicatorilor variaiei trebuie s se fac
n mod combinat. Interpretarea lor izolat poate conduce la erori. De
exemplu, dou serii statistice pot avea aceeai dispersie, dar medii diferite,
ca n figura 4. Uneori, seriile statistice au aceeai medie, dar dispersii diferite
ca n figura 5.
Figura 4
Figura 5
C. Indicatori ai formei distribuiei

Calculul i analiza indicatorilor simpli i sintetici ai mprtierii
valorilor individuale ale caracteristicilor n jurul tendinei lor
centrale ofer informaii utile pentru cunoaterea manifestrii
fenomenelor de mas i pentru fundamentarea deciziilor.
Pentru profunzimea analizei ntreprinse, aceste informaii trebuie
completate cu altele referitoare la concentrarea valorilor
individuale i la deplasarea acestora fa de anumite valori
tipice. Prin urmare, analiza mprtierii (variaiei) valorilor
individuale trebuie s fie urmat de analiza formelor n care
se distribuie acestea.
Forma unei distribuii de frecvene se analizeaz, comparativ cu
distribuia ideal, normal, prin indicatorii:
asimetriei (oblicitii) analizeaz deplasarea valorilor
individuale fa de anumite valori tipice ale tendinei centrale
boltirii (excesului, aplatizrii) curbei frecvenelor.
Seriile empirice cu care lucreaz statistica tind deseori ctre
modelul repartiiei normale, care este o distribuie perfect
simetric.
Distribuia perfect simetric se caracterizeaz prin
egalitatea dintre medie, median i mod (mod).
Frecvenele se distribuie simetric la dreapta i la stnga
valorii centrale, care are frecvena maxim. Graficul are
form de clopot (fig. 6). n acest caz, aciunea factorilor
ntmpltori are caracter regulat, astfel nct aciunea lor
se repartizeaz uniform, n ambele sensuri, fa de medie.
Figura 6. Distribuia perfect simetric
Comparaia ntre medie i ceilali indicatori ai tendinei centrale
permite interpretarea gradului de asimetrie a unei distribuii
de frecvene. Graficul (histograma, poligonul frecvenelor
etc.) ofer o prim imagine asupra gradului de asimetrie.
De exemplu (tabelul 8), considernd gruparea agenilor
economici dintr-o ramur dup cifra de afaceri (miliarde lei) :
Tabelul 8
Repartiia agenilor economici dup cifra de afaceri tinde
ctre repartiia normal, concluzie care rezult din
figura 7 i 8 si din faptul c frecvenele relative descresc
ctre capetele seriei (tabelul 9).
Figura 7
Figura 8
Dac, de exemplu, intereseaz ci din totalul agenilor
economici au avut o cifr de afaceri de cel mult 32
miliarde lei (vezi tabelul 9) se cumuleaz frecvenele
absolute corespunztoare primelor patru intervale,
deci 136, respectiv 68% din totalul agenilor .
Tabelul 9
O repartiie asimetric (sau oblic) se caracterizeaz prin
faptul c frecvenele valorilor caracteristicii urmrite sunt
deplasate mai mult sau mai puin, ntr-o parte i alta fa
de tendina central (exprimat prin: Me, Mo sau ).
n figura 9 se prezint distribuii unimodale oblice la
dreapta sau la stnga valorilor tendinei centrale.
Distribuie cu asimetrie pozitiv sau oblic spre
dreapta (figura 9,a) este distribuia care are mai multe
valori extrem de mari i mai puine extrem de mici
comparativ cu distribuia normal, care are aceeai
medie i dispersie. Ea este cauzat de apariia unor
valori extreme mari ale caracteristicii, de unde rezult
urmtoarea relaie de inegalitate:


Pentru acest tip de distribuie de frecvene, media
reprezint mai bine valorile mari ale seriei; dimpotriv,
valorile mici sunt mult distanate fa de medie.
x
Figura 9, a
Figura 9, b
Distribuie cu asimetrie negativ sau oblic spre
stnga (figura 9,b) este distribuia care are mai multe
valori extrem de mici i mai puine extrem de mari
comparativ cu distribuia normal, care are aceeai
medie i dispersie. Ea este cauzat de apariia unor
valori extreme mici ale caracteristicii, de unde rezult
urmtoarea relaie de inegalitate:


n acest caz, media este semnificativ pentru valorile mici
ale caracteristicii; termenii cu valori mari ai seriei
statistice nu sunt bine reprezentai.
De exemplu, considernd gruparea agenilor economici
dintr-o ramur dup cifra de afaceri (miliarde lei) ,
valorile medianei, modei i mediei aritmetice sunt:
Prima frecven cumulat cresctor > 100,5 este 136.
Deci, 28 < Me < 32












Deoarece > Me > Mo, distribuia prezint o asimetrie
pozitiv.
lei miliarde 91 , 28 46 / ) 90 5 , 100 ( 4 28
n
n 1 n
2
1
h x Me
Me
1 Me
1 i
i
r
1 i
i
Me 0
= + =

|
|
.
|

\
|
+
+ =


= =
( ) ( )
lei miliarde 45 , 27
46 50 25 50
25 50
4 24 h x Mo
2 1
1
Mo 0
=
+

+ =
A + A
A
+ =
lei miliarde 06 , 29
200
5812
n
n x
X
r
1 1
i
r
1 i
i
'
i
= =

=
=
X
Distribuiile de frecvene care sunt numai uor (moderat)
asimetrice verific urmtoarea legtur ntre medie, median
i mod:


Amploarea asimetriei statistice unimodale se caracterizeaz
sintetic cu ajutorul unor coeficieni adimensionali.
Msurarea asimetriei se bazeaz pe indicatori care compar
media cu moda (sau mediana), n condiiile unui anumit grad
de mprtiere a unitilor colectivitii (msurat prin abaterea
medie ptratic).

1) Asimetria, n valoare absolut, se msoar prin:


indicatori care au unitatea de msur a variabilei studiate i care
sunt pozitivi sau negativi, n funcie de tipul de asimetrie
(coada mai lung a distribuiei spre valorile mari sau spre
valorile mici).
( ) Me x 3 x Mo =
Mo x As =
( ) Me x 3 As
'
=
2) Coeficientul de asimetrie Pearson, Cas
Cel mai frecvent, n practic se utilizeaz coeficienii de
asimetrie Pearson (pentru distribuii uor asimetrice mai
ales), ca raport ntre asimetria absolut i abaterea
medie ptratic, n dou variante:





Ambii coeficieni au valori:
Pozitive, cnd distribuia de frecvene are asimetrie
pozitiv (curbelor alungite spre dreapta)
Negative, n cazul asimetriei negative (curbelor alungite
spre stnga).
Pentru serii perfect simetrice valoarea lor este zero.
o

=
Mo x
C
as
( )
o

=
Me x 3
Cas
'
( ) 1 , 1 C
as
e
( ) 3 , 3 Cas
'
e
Cu ct valorile acestui coeficient sunt mai apropiate de
zero (Cas=0), cu att seria este mai simetric.
Cu ct valorile sale sunt mai apropiate de unu (Cas=1) cu
att seria este mai asimetric (indicatorii tendinei
centrale tind s fie nereprezentativi).
Seriile de distribuie moderat asimetrice au valoarea
coeficientului de asimetrie |Cas|< 0,3.
Distribuia agenilor economici dup cifra de afaceri este
moderat asimetric:



Pentru a completa analiza simetriei, respectiv aplatizrii n
seriile de distribuie unidimensionale se poate apela i la
momentele centrate de diverse ordine, notate .
Mrimile
2
(dispersia,
2
),
3
i
4
, sunt momente centrate
de ordinul 2, 3 i 4 unde:
27 , 0
6
45 , 27 06 , 29 Mo x
C
as
=

=
o

=
Pe baza acestor indicatori, Pearson i Fisher au propus i
ali indicatori de asimetrie i respectiv de aplatizare,
indicai pentru seriile foarte mari, respectiv.

3) Coeficientul de asimetrie Pearson
1
:



n cazul unei distribuii simetrice, |
1
=0, iar n cazul unei
distribuii asimetrice, |
1
> 0.
Sensul asimetriei este dat de semnul lui
3
i anume
3
> 0
n cazul distribuiilor cu asimetrie la dreapta i
3
< 0 n
cazul distribuiilor cu asimetrie la stnga.
( )


=
i
i
2
i
'
2
n
n x x

( )


=
i
i
3
i
'
3
n
n x x

( )


=
i
i
4
i
'
4
n
n x x

3
2
2
3
1

= |
4) Coeficientul de asimetrie al lui Fisher
1
, care este o
transformare ulterioar a coeficientului lui Pearson :


Interpretarea coeficientului lui Fisher pornete de la
observaia c momentele centrate de ordin impar ale
seriilor de distribuie perfect simetrice sunt egale cu zero.
Deci, n particular
3
=0.
Pentru seriile n care predomin termenii cu abateri
negative fa de medie (x
i
< 0) vom avea
3
<0, iar
n timp ce pentru cazurile n care predomin termenii cu
abateri pozitive fa de medie (x
i
> 0) vom avea

3
>0. Deci,
2
fiind ntotdeauna pozitiv, coeficientul
1

va fi < 0 sau > 0 dup semnul lui
3
.
n concluzie, coeficientul
1
va avea valoare mai mare
dect zero n cazul asimetriei pozitive, valoare mai
mic dect zero n cazul asimetriei negative i va fi
egal cu zero n cazul seriei perfect simetrice.
x
x
( )
3
3
2
3
2
3
3
2
2
3
1 1
o

= | =
5) Coeficientul de aplatizare al lui Pearson
2
:

Coeficienii 1 i 2 reflect intensitatea concentrrii
frecvenelor n centrul distribuiei.

6) Coeficientul de aplatizare al lui Fisher
2


Graficele seriilor de distribuie de frecven sunt mai mult
sau mai puin aplatizate n comparaie cu graficul legii
normale (Gauss-Laplace). Prin urmare, o distribuie este
aplatizat dac o mare variaie a caracteristicii urmrite
antreneaz o uoar variaie a frecvenelor i invers.
Acest raionament este vizualizat n figura 10.
2
2
4
2

= |
3 3
2
2
4
2 2

= | =
Analiznd cei doi coeficieni
2
i
2
, etalonul pentru aprecierea
gradului de aplatizare al unei serii empirice l reprezint
distribuia normal, unde
2
=3 (deci,
2
=0). Astfel, dac:

2
> 3 (sau
2
> 0) distribuia este mai boltit dect cea
normal i se numete leptokurtic, avnd un vrf mai
ascuit i cozi mai lungi dect la cea normal;

2
< 3 (sau
2
< 0) distribuia este mai puin boltit dect
cea normal i se numete platikurtic, avnd un vrf mai
aplatizat (turtit) i cozi mai scurte dect la cea normal;

2
~ 3 (sau
2
~ 0) - distribuia se numete mezokurtic i
este echivalent cu cea normal n privina gradului de
aplatizare;
Figura 10
7) Coeficientul de asimetrie a lui Yule i Kendall, care folosete
distanele dintre cuartile ca msur a asimetriei.



Observm urmtoarele:
C
asYK
= 0 simetrie (cuartilele sunt echidistante);
C
asYK
> 0 asimetrie pozitiv (sau etalarea frecvenelor spre
dreapta);
C
asYK
< 0 asimetrie negativ (sau etalarea frecvenelor spre
stnga)
C
asYK
< 0,1 seria este considerat moderat asimetric
C
asYK
> 0,3 seria este pronunat asimetric;
Coeficientul lui Yule i Kendall nu poate fi utilizat n compararea
asimetriei mai multor repartiii de frecvene.
Calculul i interpretarea coeficienilor de aplatizare prezentai trebuie
completat cu analiza graficului distribuiei empirice comparativ cu
cel al distribuiei normale.
Analiza asimetriei i aplatizrii are sens numai n cazul distribuiilor
empirice unidimensionale care prezint o singur valoare modal.
( ) ( )
( ) ( )
1 3
1 3
1 3
1 3
YK
as
Q Q
Me 2 Q Q
Q Me Me Q
Q Me Me Q
C

+
=
+

= | | 1 , 1 C
asYK
+ e
Cuartilele sunt 3 valori care mpart seria n patru pri egale, ele
delimitnd cte 25% din observaii. Ele sunt n numr de trei: Q
1
, Q
2
,
Q
3
(figura 11); Q
1
se numete cuartila inferioar, Q
2
este egal
ntotdeauna cu mediana, Q
3
se numete cuartila superioar.
Cuartilele, ca i mediana, se determin pe baza valorilor ordonate ale
seriei statistice. Prima operaie const n localizarea celor trei cuartile.




Figura 11: Cuartilele ntr-o serie de repartiie
Calculul cuartilelor se face prin interpolare n cadrul intervalului n
care a fost localizat fiecare cuartil:








x
0
- limita inferioar a intervalului n care se afl Q
1
, respectiv Q
3
;
d
Q1
, d
Q3
mrimea intervalului n care se situeaz cuartila
inferioar, respectiv superioar;
n
Q1
, n
Q3
frecvena intervalului n care se afl Q
1
, respectiv Q
3
;

- suma frecvenelor intervalelor care preced
intervalul cuartilei inferioare, respectiv superioare.

=
1
1
q
1 i
i
n

=
1
3
q
1 i
i
n

S-ar putea să vă placă și