Sunteți pe pagina 1din 8

Capitolul 4

Indicatorii variaţiei, indicatorii medii de poziţie şi asimetria


În practica statistică sunt deseori utilizate seriile de repartiţie de frecvenţe pentru a
caracteriza gradul de variaţie al unei caracteristici la nivelul unei colectivităţi statistice, în
funcţie de numărul factorilor de influenţă şi intensitatea cu care acţionează aceştia. Principalele
proprietăţi ale acestor serii se referă la:
- omogenitatea termenilor, care au acelaşi conţinut şi sunt rezultatul acţiunii factorilor
esenţiali;
- variabilitatea termenilor, care este rezultatul combinării factorilor esenţiali cu cei
întâmplători, în condiţii diferite; cu cât numărul factorilor este mai mare, cu atât variaţia în
cadrul seriei este mai mare; variaţia termenilor poate fi mare datorită factorilor esenţiali, caz în
care trebuie făcută analiza separat, pe componente sau datorită factorilor întâmplători; aceasta
impune utilizarea, în cadrul analizei a indicatorilor variaţiei, pentru a determina cauzele variaţiei
şi a separa influenţa factorilor esenţiali de cea a factorilor întâmplători;
- independenţa termenilor, unităţile statistice putând fi caracterizate individual, dar ca
părţi ale colectivităţii, astfel încât să poată fi centralizate şi sistematizate într-o serie de repartiţie
de frecvenţe;
- tendinţa de concentrare a frecvenţelor; dacă factorii au o influenţă , o intensitate
constantă, repartiţia frecvenţelor este uniformă; în caz contrar, există un punct sau anumite
puncte în jurul cărora se concentrează valorile seriei.
Alături de calcularea indicatorilor cu ajutorul cărora se poate caracteriza variaţia din
cadrul seriilor de repartiţie de frecvenţe, se utilizează frecvent şi graficele.
Pentru orice serie, se pot calcula frecvenţele absolute "ni", care reprezintă numărul de
unităţi pentru care caracteristica analizată înregistrează aceeaşi valoare sau numărul de unităţi
din fiecare grupă şi frecvenţele relative, care reprezintă ponderile frecvenţelor absolute în total,
după formula:

ni
n* 
n

Pe baza frecvenţelor relative se poate aprecia importanţa fiecărei unităţi sau grupe,
acestea fiind cu atât mai importante cu cât valoarea "n*" este mai mare, precum şi gradul de
concentrare a unităţilor.

4.1. Indicatorii simpli ai variaţiei

Indicatorii simpli ai variaţiei se calculează la nivelul fiecărei unităţi statistice sau grupe,
deci sunt reprezentativi doar la nivelul acestora, nu şi al ansamblului. Se măsoară, în general, în
aceeaşi unitate de măsură ca şi variabila la care se referă. Sunt:
- amplitudinea absolută a variaţiei, care este diferenţa dintre valoarea cea mai mare şi
valoarea cea mai mică pe care le înregistrează caracteristica analizată în cadrul seriei:

A = X max - X min

- amplitudinea relativă a variaţiei:

31
X max  X min
A%= 100
X

În ambele forme, amplitudinea este puternic influenţată de valorile extreme din serie,
care ar putea fi excepţii, fără semnificaţie pentru tendinţa înregistrată la nivelul majorităţii. Este
un indicator reprezentativ numai dacă valorile din serie sunt omogene, deci uniform repartizate.
- abaterile intercuantilice: sunt diferenţa dintre cuantila superioară şi cea inferioară;
pentru cazul în care seria a fost impărţită în patru părţi egale, Q = Q 3 - Q1, care conţine 50 % din
totalul observaţiilor; când seria a fost impărţită în zece părţi egale, D = D 9 - D1, care conţine 80
% din totalul observaţiilor; acest indicator nu mai este sensibil la valorile extreme şi oferă
informaţii despre gradul de concentrare a valorilor individuale;
- abaterile individuale absolute de la medie arată cu cât diferă variantele la nivelul
unităţilor faţă de valoarea medie calculată, " X "; se determină câte o abatere pentru fiecare
unitate statistică:

di = Xi - X

- abaterile individuale relative de la medie:

X i X
di % = 100
X

Se pot utiliza, în locul mediei şi ceilalţi indicatori ai tendinţei centrale. Pentru seriile de
distribuţie de frecvenţe, la calcularea acestui indicator, se utilizează centrele de interval.
Abaterile pot fi atât negative, dacă variantele sunt mai mici decât media, cât şi pozitive, când
variantele sunt mai mari decât media.
Pentru seriile perfect simetrice, abaterile pozitive şi cele negative au frecvenţe egale de
apariţie şi se compensează reciproc. de asemenea, abaterea absolută maximă pozitivă are aceeaşi
valoare cu abaterea absolută maximă negativă, dar de semn contrar acesteia. Pentru ca analiza să
fie reprezentativă, este necesar să se lucreze cu modulul, deci cu valoarea absolută a abaterilor
individuale.
Indicatorii simpli ai variaţiei nu oferă o imagine de ansamblu asupra gradului de
împrăştiere a variantelor deoarece se referă doar la relaţia dintre două valori din serie sau dintre
fiecare valoare individuală şi medie, deci nu reprezintă o sinteză a întregii variaţii, pe ansamblu.

4.2. Indicatorii sintetici ai variaţiei

Acest tip de indicatori ai variaţiei sintetizează într-o singură expresie numerică întreaga
variaţie a caracteristicii analizate. Se pot calcula atât pentru serii simple, cât şi pentru serii de
frecvenţe, când colectivitatea este împărţită în grupe. Când nu se lucrează cu serii de frecvenţe,
indicatorii sintetici au formulele:
- abaterea medie liniară:

x
i 1
i x
x1  x  x 2  x ...... x n  x
d 
n n

32
în care, se observă că d i = x i - x reprezintă abaterile individuale absolute de la medie; sunt
introduse în formulă în modul deoarece altfel, s-ar putea compensa abaterile pozitive cu cele
negative, ajungându-se la o concluzie eronată; rezultatul care reprezintă mărimea abaterii se
consideră valabil pentru ambele sensuri, pozitiv şi negativ; "n" este numărul de unităţi statistice
care compun colectivitatea studiată;
- abaterea medie pătratică:

 x  x
2

i 1
i
x 1  x    x 2  x  ...... x n  x 
2 2 2

 
n n
care, este, de fapt, media părtatică a abaterilor individuale absolute;
- dispersia: este, ca notaţie şi mod de calcul, 2
- coeficientul de variaţie:

 d
v= * 100 sau v= * 100
x x

cele două formule având numărătorul diferit, conduc la rezultate diferite; oricare dintre formule
se aplică, "v" are o valoare pozitivă, cuprinsă între 0 % şi 100 %, (între 0 şi 1), iar seria este cu
atât mai omogenă cu cât valoarea sa este mai mică, deci este un test de verificare a gradului de
omogenitate; pentru un "v" > 35 - 40 %, deja gradul de omogenitate al colectivităţii nu mai este
satisfăcător, astfel încât media nu mai poate fi considerată reprezentativă, impunându-se o nouă
grupare, în funcţie de o altă caracteristică.
Pentru a exemplifica modul de calcul al indicatorilor simpli şi sintetici ai variaţiei pentru
o caracteristică oarecare "X" şi o serie simplă, nedivizată în grupe, se consideră exemplul:

Unităţi X di di2 di%


statistice
U1 3,71 - 1,15 1,32 0,24
U2 3,28 - 1,58 2,50 0,33
U3 2,63 - 2,23 4,97 0,46
U4 3,79 - 1,07 1,14 0,22
U5 5,89 + 1,03 1,06 0,21
U6 9,94 + 5,08 25,81 1,05
U7 2,14 - 2,72 7,40 0,56
U8 4,47 - 0,39 0,15 0,08
U9 6,22 + 1,36 1,85 0,28
U10 7,40 + 2,54 6,45 0,52
U11 3,96 - 0,90 0,81 0,19
Total 53,43 ± 1,82 53,47 -

Se cunosc informaţiile cuprinse în primele două coloane ale tabelului. Celelalte două
coloane se adaugă după ce se efectuează calculele necesare. Pentru a determina indicatorii
simpli şi sintetici ai variaţiei este necesar să se calculeze, mai întâi media. Dacă aceasta este o
medie aritmetică simplă, atunci:

x1 .... x11 53,43


x  = 4,86
11 11

Indicatorii simpli ai variaţiei:

33
- amplitudinea absolută a variaţiei:

A = X max - X min = 9,94 - 2,14 = 7,80

- amplitudinea relativă a variaţiei:

X max  X min
A%= 100 = 160,49 %
X

- abaterile individuale absolute de la medie:

di = Xi - X ,

pentru fiecare din cele 11 unităţi statistice:

d 1 = X 1 - X = 3,71 - 4,86 = - 1,15


d 2 = X 2 - X =3,28 - 4,86 = - 1,58
....................
d 11 = X 11 - X = 3,96 - 4,86 = - 0,90

- abaterile individuale relative de la medie:

X i X
di % = 100
X

d1 % = 24 %, d2 % = 33 %, ......, d11 % = 19 %.

Indicatorii sintetici ai variaţiei:


- abaterea medie liniară:

x
i 1
i x
x1  x  x 2  x ...... x n  x =
d 
n n

20,05
= = 1,82
11

- abaterea medie pătratică:

 x  x
2

i 1
i
x 1  x    x 2  x  ...... x n  x  =
2 2 2 53,47
 4,8605 = 2,21
  11
n n

Se observă că abaterea medie liniară are o valoare mai mare decât cea medie pătratică.

- dispersia:

2 = 2,21 2 = 4,86

34
- coeficientul de variaţie:

 2,21
v= * 100 = 4,86 * 100 = 45,47 %
x
d 1,82
sau v= * 100 = * 100 = 37,45 %
x 486

Valorile fiind peste 35 %, rezultă că seria nu este omogenă, deci trebuie să se realizeze mai întâi
gruparea şi apoi analiza să se facă separat, pe grupe.

Abaterile medii sunt măsurate în aceeaşi unitate de măsură ca şi caracteristica la care se


referă. Abaterea medie liniară, ca şi media aritmetică, prezintă dezavantajul că este mai puternic
influenţată de abaterile mai mari ca valoare în ambele sensuri. Se poate calcula şi în cazul
seriilor teritoriale şi cronologice. Când se utilizează abaterea medie pătratică, se acordă o
importanţă mai mare abaterilor mai mari ca valoare şi este eliminat inconvenientul semnelor
contrare, plus sau minus, ale abaterilor. Fiind o medie pătratică, este întotdeauna mai mare ca
valoare decât abaterea medie liniară. Se foloseşte deseori în estimarea erorilor de selecţie şi în
analiza corelaţiei, în studii de marketing sau în analiza riscului în plasamentele în titluri
mobiliare: cu cât este mai mică, cu atât riscul este mai mic. Abaterea medie pătratică şi dispersia
măsoară întreaga variaţie din serie, atât cea datorată factorilor esenţiali, cât şi cea datorată
factorilor întâmplători. În general, abaterea medie liniară este 4/5 din cea medie pătratică.
Dacă colectivitatea este împărţită în grupe, cu cât intervalele de grupare sunt mai mari,
cu atât mai mare este diferenţa dintre indicatorii calculaţi pe baza valorilor individuale - mai
reprezentativi - şi cei calculaţi pe baza centrelor de interval. În formule intervin frecvenţele şi
centrele de interval:
- abaterea medie liniară:

x
i 1
i  x * fi
x1  x * f 1  x 2  x * f 2 ..... xn  x * f n
d 
n
f 1  f 2 .... f n
f
i 1
i

- abaterea medie pătratică:

i 1
( xi  x ) 2 * f i
 n
=
f
i 1
i

( x1  x ) 2 * f 1  ( x 2  x ) 2 * f 2 .....( x n  x ) 2 * f n
=
f 1  f 2 ..... f n

- dispersia: 2
- coeficientul de variaţie:

 d
v= * 100 sau v= * 100
x x

35
în care variabilele utilizate sunt determinate tot ca medii ponderate.
Se pot calcula şi indicatori sintetici la nivelul fiecărei grupe, care evidenţiază variaţia din
cadrul grupei respective. De exemplu, pentru cel mai des utilizat dintre aceşti indicatori,
dispersia, cu cât grupa este mai puţin omogenă, cu atât valoarea dispersiei este mai mare şi se
apropie ca mărime de valoarea dispersiei pe total colectivitate. Se poate calcula ulterior şi o
dispersie medie, a dispersiilor calculate la nivel de grupe, pentru a sintetiza variaţia pe total. De
asemenea, pentru a determina influenţa factorului de grupare asupra caracteristicii analizate, se
poate calcula dispersia dintre grupe, pe baza abaterilor mediilor pe grupe de la media
coelctivităţii totale. Suma ultimilor doi indicatori de mai sus constituie dispersia totală, ceea ce
se numeşte "regula adunării dispersiilor".

4.3. Indicatorii medii de poziţie

Sunt utilizaţi pentru a caracteriza forma repartiţiei, tendinţa de concentrare a valorilor


variabilei analizate într-o serie de repartiţie. Alături de mărimile medii caracterizează tendinţa
cantrală, se măsoară în unitatea de măsură a caracteristicii analizate şi cupind: valoarea modală
şi cuantilele - mediana, cuartilele, decilele, centilele. În funcţie de abaterile dintre aceşti
indicatori, se poate determina forma de reaprtiţie a frecvenţelor.
Valoarea modală aparţine variantei care are cea mai mare frecvenţă, deci corespunde
celui mai mare număr de unităţi din colectivitate.
Există serii care au mai multe valori modale, care, însă nu au proprietatea de a putea fi
însumate sau sintetizate pentru a calcula o valoare modală unică. Similar, se poate determina
"valoarea antimodală", care corespunde frecvenţei minime.
Mediana împarte o serie în două părţi egale. Astfel, jumătate din termeni sunt mai mici
decât mediana, iar jumătate sunt mai mari.
Cuartilele împart seria în patru părţi egale, deci există trei cuartile: Q 1, Q2 şi Q3. Astfel,
un sfert din termenii seriei sunt mai mici decât prima cuartilă, jumătate mai mici decât a doua şi
trei sferturi mai mici decât a treia.
Similar, decilele împart seria în zece părţi egale, deci există nouă decile, din acare a
cincea este egală cu mediana. Formulele sunt asemănătoare, iar la numărător coeficienţii cu care
se înmulţeşte fracţia sunt 1/10, 2/10, ......, 9/10.
Cele 99 de centile împart seria în 100 de părţi egale, iar cea din mijloc, a cincizecea, este
egală cu mediana. A douăzecişicincea centilă este egală cu prima cuartilă, iar a şaptezecişicincea
centilă este egală cu a treia cuartilă.
Când valoarea modală este egală cu cea mediană şi cu media, atunci distribuţia este
perfect simetrică.
Pentru o serie perfect simetrică, factorii întâmplători acţionează cu o anumită
regularitate, iar influenţele lor sunt repartizate în ambele sensuri.

4.4. Indicatorii asimetriei

Seriile de repartiţie de frecvenţe pot fi simetrice sau asimetrice. Cele perfect simetrice
sunt cele în care influenţa factorilor întlmplători este regulată şi se repartizează în ambele
sensuri. Pe măsura creşterii intensităţii influenţei, scad frecvenţele de apariţie a variantelor în
serie.Gradul de simetrie / asimetrie se apreciază cu ajutorul mediei, medianei şi valorii modale.
Pentru o serie perfect simetrică, media este egală cu valoarea modală deoarece abaterile
egale în valoare absolută se compensează reciproc pentru acelaşi număr de cazuri observate şi pe
total. Grafic se reprezintă:

Y
36
0 X

Când frecvenţele de apariţie ale abaterilor nu respectă regularitatea de mai sus, seriile
sunt asimetrice. În seriile cu asimetrie de dreapta, pozitivă, media este mai mare decât valoarea
modală:

0 X negativă, media este mai mică decât valoarea modală:


La seriile cu asimetrie de stânga,

0
X

Indicatorii asimetriei:
- coeficientul de asimetrie al lui Pearson:

x  Mo
Cas =

numărătorul reprezintă asimetria absolută; "Cas" poate lua valori între -1 şi +1; cu cât valoarea sa
este mai apropiată de zero, cu atât asimetria este mia mică; este egal cu zero dacă seria este
perfect simetrică; o valoare negativă arată o asimetrie negativă, iar o valoare pozitivă arată o
asimetrie pozitivă; se mai poate calcula şi pe baza medianei:

3( x  Me)
Cas =

poate lua valori intre -3 şi +3, iar interpretarea este similară cu cea de mai sus;
- coeficientul lui Yule şi Kendall1, pe baza cuartilelor:
1
A. Isaic-Maniu, C. Mitruţ, V. Voineagu, “Statistică”, Editura Universitară, Bucureşti, 2003

37
(Q3  Me)  ( Me  Q1 )
Casyk =
(Q3  Me)  ( Me  Q1 )

poate avea valori cuprinse între -1 şi +1; dacă valoarea sa absolută este mai mare decât 0,3, seria
are o asimetrie pronunţată.

38

S-ar putea să vă placă și