Documente Academic
Documente Profesional
Documente Cultură
ni
n*
n
Pe baza frecvenţelor relative se poate aprecia importanţa fiecărei unităţi sau grupe,
acestea fiind cu atât mai importante cu cât valoarea "n*" este mai mare, precum şi gradul de
concentrare a unităţilor.
Indicatorii simpli ai variaţiei se calculează la nivelul fiecărei unităţi statistice sau grupe,
deci sunt reprezentativi doar la nivelul acestora, nu şi al ansamblului. Se măsoară, în general, în
aceeaşi unitate de măsură ca şi variabila la care se referă. Sunt:
- amplitudinea absolută a variaţiei, care este diferenţa dintre valoarea cea mai mare şi
valoarea cea mai mică pe care le înregistrează caracteristica analizată în cadrul seriei:
A = X max - X min
31
X max X min
A%= 100
X
În ambele forme, amplitudinea este puternic influenţată de valorile extreme din serie,
care ar putea fi excepţii, fără semnificaţie pentru tendinţa înregistrată la nivelul majorităţii. Este
un indicator reprezentativ numai dacă valorile din serie sunt omogene, deci uniform repartizate.
- abaterile intercuantilice: sunt diferenţa dintre cuantila superioară şi cea inferioară;
pentru cazul în care seria a fost impărţită în patru părţi egale, Q = Q 3 - Q1, care conţine 50 % din
totalul observaţiilor; când seria a fost impărţită în zece părţi egale, D = D 9 - D1, care conţine 80
% din totalul observaţiilor; acest indicator nu mai este sensibil la valorile extreme şi oferă
informaţii despre gradul de concentrare a valorilor individuale;
- abaterile individuale absolute de la medie arată cu cât diferă variantele la nivelul
unităţilor faţă de valoarea medie calculată, " X "; se determină câte o abatere pentru fiecare
unitate statistică:
di = Xi - X
X i X
di % = 100
X
Se pot utiliza, în locul mediei şi ceilalţi indicatori ai tendinţei centrale. Pentru seriile de
distribuţie de frecvenţe, la calcularea acestui indicator, se utilizează centrele de interval.
Abaterile pot fi atât negative, dacă variantele sunt mai mici decât media, cât şi pozitive, când
variantele sunt mai mari decât media.
Pentru seriile perfect simetrice, abaterile pozitive şi cele negative au frecvenţe egale de
apariţie şi se compensează reciproc. de asemenea, abaterea absolută maximă pozitivă are aceeaşi
valoare cu abaterea absolută maximă negativă, dar de semn contrar acesteia. Pentru ca analiza să
fie reprezentativă, este necesar să se lucreze cu modulul, deci cu valoarea absolută a abaterilor
individuale.
Indicatorii simpli ai variaţiei nu oferă o imagine de ansamblu asupra gradului de
împrăştiere a variantelor deoarece se referă doar la relaţia dintre două valori din serie sau dintre
fiecare valoare individuală şi medie, deci nu reprezintă o sinteză a întregii variaţii, pe ansamblu.
Acest tip de indicatori ai variaţiei sintetizează într-o singură expresie numerică întreaga
variaţie a caracteristicii analizate. Se pot calcula atât pentru serii simple, cât şi pentru serii de
frecvenţe, când colectivitatea este împărţită în grupe. Când nu se lucrează cu serii de frecvenţe,
indicatorii sintetici au formulele:
- abaterea medie liniară:
x
i 1
i x
x1 x x 2 x ...... x n x
d
n n
32
în care, se observă că d i = x i - x reprezintă abaterile individuale absolute de la medie; sunt
introduse în formulă în modul deoarece altfel, s-ar putea compensa abaterile pozitive cu cele
negative, ajungându-se la o concluzie eronată; rezultatul care reprezintă mărimea abaterii se
consideră valabil pentru ambele sensuri, pozitiv şi negativ; "n" este numărul de unităţi statistice
care compun colectivitatea studiată;
- abaterea medie pătratică:
x x
2
i 1
i
x 1 x x 2 x ...... x n x
2 2 2
n n
care, este, de fapt, media părtatică a abaterilor individuale absolute;
- dispersia: este, ca notaţie şi mod de calcul, 2
- coeficientul de variaţie:
d
v= * 100 sau v= * 100
x x
cele două formule având numărătorul diferit, conduc la rezultate diferite; oricare dintre formule
se aplică, "v" are o valoare pozitivă, cuprinsă între 0 % şi 100 %, (între 0 şi 1), iar seria este cu
atât mai omogenă cu cât valoarea sa este mai mică, deci este un test de verificare a gradului de
omogenitate; pentru un "v" > 35 - 40 %, deja gradul de omogenitate al colectivităţii nu mai este
satisfăcător, astfel încât media nu mai poate fi considerată reprezentativă, impunându-se o nouă
grupare, în funcţie de o altă caracteristică.
Pentru a exemplifica modul de calcul al indicatorilor simpli şi sintetici ai variaţiei pentru
o caracteristică oarecare "X" şi o serie simplă, nedivizată în grupe, se consideră exemplul:
Se cunosc informaţiile cuprinse în primele două coloane ale tabelului. Celelalte două
coloane se adaugă după ce se efectuează calculele necesare. Pentru a determina indicatorii
simpli şi sintetici ai variaţiei este necesar să se calculeze, mai întâi media. Dacă aceasta este o
medie aritmetică simplă, atunci:
33
- amplitudinea absolută a variaţiei:
X max X min
A%= 100 = 160,49 %
X
di = Xi - X ,
X i X
di % = 100
X
d1 % = 24 %, d2 % = 33 %, ......, d11 % = 19 %.
x
i 1
i x
x1 x x 2 x ...... x n x =
d
n n
20,05
= = 1,82
11
x x
2
i 1
i
x 1 x x 2 x ...... x n x =
2 2 2 53,47
4,8605 = 2,21
11
n n
Se observă că abaterea medie liniară are o valoare mai mare decât cea medie pătratică.
- dispersia:
2 = 2,21 2 = 4,86
34
- coeficientul de variaţie:
2,21
v= * 100 = 4,86 * 100 = 45,47 %
x
d 1,82
sau v= * 100 = * 100 = 37,45 %
x 486
Valorile fiind peste 35 %, rezultă că seria nu este omogenă, deci trebuie să se realizeze mai întâi
gruparea şi apoi analiza să se facă separat, pe grupe.
x
i 1
i x * fi
x1 x * f 1 x 2 x * f 2 ..... xn x * f n
d
n
f 1 f 2 .... f n
f
i 1
i
i 1
( xi x ) 2 * f i
n
=
f
i 1
i
( x1 x ) 2 * f 1 ( x 2 x ) 2 * f 2 .....( x n x ) 2 * f n
=
f 1 f 2 ..... f n
- dispersia: 2
- coeficientul de variaţie:
d
v= * 100 sau v= * 100
x x
35
în care variabilele utilizate sunt determinate tot ca medii ponderate.
Se pot calcula şi indicatori sintetici la nivelul fiecărei grupe, care evidenţiază variaţia din
cadrul grupei respective. De exemplu, pentru cel mai des utilizat dintre aceşti indicatori,
dispersia, cu cât grupa este mai puţin omogenă, cu atât valoarea dispersiei este mai mare şi se
apropie ca mărime de valoarea dispersiei pe total colectivitate. Se poate calcula ulterior şi o
dispersie medie, a dispersiilor calculate la nivel de grupe, pentru a sintetiza variaţia pe total. De
asemenea, pentru a determina influenţa factorului de grupare asupra caracteristicii analizate, se
poate calcula dispersia dintre grupe, pe baza abaterilor mediilor pe grupe de la media
coelctivităţii totale. Suma ultimilor doi indicatori de mai sus constituie dispersia totală, ceea ce
se numeşte "regula adunării dispersiilor".
Seriile de repartiţie de frecvenţe pot fi simetrice sau asimetrice. Cele perfect simetrice
sunt cele în care influenţa factorilor întlmplători este regulată şi se repartizează în ambele
sensuri. Pe măsura creşterii intensităţii influenţei, scad frecvenţele de apariţie a variantelor în
serie.Gradul de simetrie / asimetrie se apreciază cu ajutorul mediei, medianei şi valorii modale.
Pentru o serie perfect simetrică, media este egală cu valoarea modală deoarece abaterile
egale în valoare absolută se compensează reciproc pentru acelaşi număr de cazuri observate şi pe
total. Grafic se reprezintă:
Y
36
0 X
Când frecvenţele de apariţie ale abaterilor nu respectă regularitatea de mai sus, seriile
sunt asimetrice. În seriile cu asimetrie de dreapta, pozitivă, media este mai mare decât valoarea
modală:
0
X
Indicatorii asimetriei:
- coeficientul de asimetrie al lui Pearson:
x Mo
Cas =
numărătorul reprezintă asimetria absolută; "Cas" poate lua valori între -1 şi +1; cu cât valoarea sa
este mai apropiată de zero, cu atât asimetria este mia mică; este egal cu zero dacă seria este
perfect simetrică; o valoare negativă arată o asimetrie negativă, iar o valoare pozitivă arată o
asimetrie pozitivă; se mai poate calcula şi pe baza medianei:
3( x Me)
Cas =
poate lua valori intre -3 şi +3, iar interpretarea este similară cu cea de mai sus;
- coeficientul lui Yule şi Kendall1, pe baza cuartilelor:
1
A. Isaic-Maniu, C. Mitruţ, V. Voineagu, “Statistică”, Editura Universitară, Bucureşti, 2003
37
(Q3 Me) ( Me Q1 )
Casyk =
(Q3 Me) ( Me Q1 )
poate avea valori cuprinse între -1 şi +1; dacă valoarea sa absolută este mai mare decât 0,3, seria
are o asimetrie pronunţată.
38