Documente Academic
Documente Profesional
Documente Cultură
xmin xmax
xmin xmax
xmin xmax
xmin xmax
Amplitudinea este un indicator de împrăştiere "destul de rezonabil"
numai dacă valorile individuale ale seriei sunt repartizate în mod uniform,
omogen (fără să existe valori aberante).
130 Statistică generală
3) În cazul seriilor de distribuţie de frecvenţă pe intervale calculul
ampliutudinii este lipsit de sens;
4) Amplitudinea se utilizează frecvent în prelucrarea statistică la
alegerea numărului de intervale de grupare a datelor şi la stabilirea mărimii
intervalelor.
b) Abaterea intercuantilică se calculează, ca diferenţă între cuantila
superioară şi cuantila inferioară ambele având acelaşi ordin. Astfel, pentru
cuantilele definite în capitolul anterior observăm:
- pentru r = 4 Q3- Q1, conţine 50% din numărul observaţiilor;
- pentru r = 10 D9-D1, conţine 80% din numărul observaţiilor.
Într-o distibuţie normală abaterea intercuartilică se exemplifică în
figura 5.1.
Abaterea intercuantilică
( Q 3- Q )
1
Q1 Q2 Q3
Observaţii:
1) Acest indicator se exprimă în unitatea de măsură a caracteristicii;
2) Calculul abaterii intercuartilice, spre deosebire de cel al
amplitudinii, prezintă avantajul că evită valorile individuale extreme sau
aberante. Prin calculul acestui indicator se pierd, însă, informaţii dar are
câştig de cauză omogenitatea valorilor individuale.
3) Acest indicator oferă informaţii despre concentrarea valorilor
individuale în cadrul seriei, pentru analiza asimetriei distribuţiilor;
4) Ca şi amplitudinea împrăştierii, abaterea intercuartilică nu poate fi
utilizată în calcule algebrice etc.
c) Abaterile individuale ca măsuri ale împrăştierii într-o serie
exprimă cu câte unităţi de măsură sau de câte ori (sau cât la sută) valoarea
Capitolul V 131
caracteristicii urmărită, la fiecare unitate a colectivităţii, se abate de la
mărimea calculată a unui indicator al tendinţei centrale.
Prin urmare, tendinţa centrală se exprimă prin media aritmetică,
abaterile individuale în mărimi absolute
−
sau relative şi se calculează astfel:
− Xi − X
d i = Xi − X sau d i % = X− % 100 (pentru orice i = 1, n) (5.3)
−
Xi − X −
Observaţii: di% = −
di = X i − X
X
1) În relaţia (5.3) valorile individuale se compară cu valoarea lor
medie, dar la fel de bine poate fi utilizat pentru comparare oricare alt
indicator al tendinţei centrale (de exemplu: mediana).
−
2) Media abaterilor individuale { d i} (cu i = 1,n) calculate în raport
cu media variantelor caracteristicii este nulă, deoarece abaterile într-un sens
sau altul, în sinteză, se compensează reciproc.
3) În cursul seriilor de distribuţie de frecvenţe pe intervale, pentru
calculul abateriilor individuale se iau în considerare centrele de interval.
4) În analizele statistice se urmăreşte în mod deosebit abaterile
maxime pozitive (dmax+) şi negative (dmax-) calculate în cifre absolute şi
relative astfel:
d m ax +
dmax+=xmax-x sau dmax+%= X− % 100 (5.4)
d max −
d max − = x max − x sau d max − % = × 10 0 (5.5)
x
5) În cazul unui distribuţii simetrice d max + = d max − , iar în
interiorul seriei la abateri egale, (dar de semne contrare), le corespund
frecvenţe egale de apariţie. Aceasta conduce la compensarea pe total (la
nivelul întregului ansamblu) a abaterilor individuale.
6) În funcţie de scopul analizei statistice întreprinse se pot studia şi
seriile {dj}, {dj,nj}, {dj,fj}. Se determină în acest sens toţi indicatorii
prezentaţi în capitolul anterior, dar abaterile individuale se iau în modul (în
valoare absolută).
Analiza conţinutului şi metodologiei de calcul a indicatorilor simpli
ai împrăştierii, sub aspect informaţional, prezintă dezavantajul că unii nu ţin
seama decât de un număr redus de valori individuale, iar alţii - cu toate că au
în vedere relaţia dintre fiecare valoare individuală şi media lor
corespunzătoare - permit numai o caracterizare aproximativă a împrăştierii
în cadrul seriei.
132 Statistică generală
−
Σ xj −xnj k
j=1
sau d x = ∑ x j − x f j
−
dx = k
(5.7.)
j=1
Σ nj
j= k
unde:
k = numărul de variante distincte sau intervale de grupare;
nj (cu j=1, k) = frecvenţe absolute;
fj (cu j=1, k) = frecvenţe relative, exprimate sub formă de coeficienţi1.
Este posibil ca în unele analize statistice să prezinte interes abaterea
medie absolută a abaterilor valorilor individuale de mediană d Me . În
asemenea situaţii aceasta se determină după următoarele relaţii:
1
În cazul în care frecvenţele relative sunt în % atunci numitorii relaţiilor (5.7) şi
(5.9), unde intervin acestea, vor fi egali cu 100.
Capitolul V 133
- cazul seriei simple:
n
− Σ x i − Me
i =1
d Me = (5.8)
n
- cazul seriei de distribuţie de frecvenţe:
k
− Σ x j − Me n j k
j=1
d Me = k
sau d x = ∑ x j − Me f j (5.9)
j=1
Σ nj
j=1
Conţinutul şi metodologia de calcul a abaterii medii absolute conduc
la unele observaţii cum ar fi:
1) ea se exprimă în unitatea de măsură a caracteristicii urmărite;
2) în cazul seriilor de distribuţie pe intervale de grupare pentru
calculul ei se iau în considerare centrele acestora;
3) abaterea absolută medie calculată în funcţie de media valorilor
individuale este mai mică sau egală cu aceea calculată în funcţie de media
aritmetică:
− −
−
d Me ≤ d x (5.10)
4) ea se calculează şi se analizează nu numai pentru seriile de
distribuţie, dar şi pentru seriile cronologice sau teritoriale;
5) calculul şi analiza acestui indicator sintetic al împrăştierii este
justificat numai în măsura în care prezintă interes, pentru caracterizarea
variabilităţii, mărimea abaterilor şi nu şi semnul lor (pozitiv sau negativ).
Aplicaţia 5.1. Se consideră seria simplă {1, 2, 4, 5, 7, 8, 9, 10, 11, 13}pentru
care s-a calculat media x = 7 şi Me=7,5. Se construieşte tabelul următor care
conţine abaterile absolute faţă de medie şi mediană ( xi −X si xi −Me) precum
şi sumele corespunzătoare:
Tabelul 5.1.
xi 1 2 4 5 7 8 9 10 11 13 Total
xi − 7 6 5 3 2 0 1 2 3 4 6 32
xi − 7,5 6,5 5,5 3,5 2,5 0,5 0,5 1,5 2,5 3,5 5,5 32
5.3.2. Dispersia
Valoarea absolută ale diferenţelor xi - x calculate în (5.6), (5.7) (sau
5.8) şi (5.9) elimină sensul (semnul) abaterilor faţă de tendinţa centrală.
Acelaşi obiectiv poate fi atins dacă diferenţele respective se ridică la pătrat.
Luându-se în considerare pătratele abaterilor valorilor individuale de la
tendinţa lor centrală se obţine o valoare tipică a împrăştierii, numită
dispersie (" x ).
2
sau
k xj −a 2 2
" 2x = h fj /h2 − (x − a)
j=1 (5.15)
Capitolul V 137
În relaţiile (5.14) şi (5.15), numite şi relaţii de calcul simplificat ale
dispersiei, valorile lui "a" şi "h" sunt valori convenabil stabilite. De exemplu,
în cazul distribuţiei pe intervale egale de grupare se iau, deseori, astfel:
a = centrul de interval care are cea mai mare frecvenţă;
h = mărimea intervalului de grupare sau cel mai mare divizor comun
al valorilor [xi-a].
Aplicaţia 5.3.
Exemplificăm determinarea dispersiei după relaţia (4.15) utilizând
datele din tabelul 5.3.
Tabelul 5.3.
Determinarea dispersiei prin relaţia de calcul simplificat
Tabelul 5.4
Societatea
Filiala "AND" S.A. Filiala " MIR" S.A.
"ANDMIR" S.A.
Salarii
Salarii medii Salarii medii
medii nete
Nr. de săptămânal Nr. de nete Nr. de nete
persoane persoane săptămânale persoane săptămânale
e
na nb (mii lei) na+nb (mii lei)
(mii lei)
xa xb xa +b
Muncitori 30 210 100 180 130 186,6
Personal
operativ cu
20 378 10 310 30 355,3
studii
superioare
Cadre de
10 600 5 510 15 570
conducere
TOTAL 60=na 331= x a 115=nb 205,7= xb 175 248,6= x a + b
2
Dispersia generală " X a+b a salariilor din societatea comercială
"ANDMIR" S.A. este:
1
"2Xa+b = 175 [30$ 2102 +20$ 3782 +10$ 6002 +100$ 1802 +10$ 3102 +5$ 5102]−
−248,62 =14096,211
Dispersia dintre grupă:
−2
n a( X a−X ) 2+n b( X b−X ) 2 n aX −2
a +n bX b
2Xa+b = n a+n b + n a+n b − X2a+b
Capitolul V 141
1
2Xa+b = 175 [60 $ 3312 + 115 $ 205, 72 ] − 248, 62 = 3567, 162
Media dispersiilor parţiale se calculează ca o medie aritmetică
2
ponderată a acestora " X a+b :
n a" 2X +n b" 2X
a 1
" 2X a,b = n a+n b
b
= 175 [60 $ 20117 + 115 $ 5526, 64] = 10529, 049
1
" 2X a = 60 [30 $ 210
2
+ 20 $ 378 + 10 $ 6002 ] − 3312 = 20117
2
Prin urmare:
" 2X a+b = " 2X a,,b + 2Xa,,b e 14096, 211 = 10529, 049 + 3567, 162
Rezultatele obţinute demonstrează că dispersia (variaţia) salariilor în
societatea comercială "ANDMIR" S.A. se explică 74,7% printr-o
împrăştiere a salariilor ca urmare a acţiunii factoriilor specifici care
acţionează în cadrul fiecărei fialiale "AND" S.A. şi "MIR" A.S., iar în mică
parte (25,3%) se explică prin împrăştierea salariilor medii ale filialelor faţă
de salariu din societatea "ANDMIR" S.A.
O altă observaţie care se impune este următoare: dispersia ca şi
media valorilor individuale este sensibilă la prezenţa valorilor
extreme, aberante. Această se constată, în mod evident, şi din
exemplul următor:
Tabelul 5.5.
Tabelul 5.6.
Abaterea Abaterea
Seria notelor Nota medie Dispersia
medie absolută medie pătratică
acordate
Xy dy σ 2x σx
Produsul A:
4 0,4 0,25 0,5
{3, 5, 4, 4, 5, 3, 4, 5}
{2,5; 5,5; 3,5; 4,5; 4} 4 0,8 1,2499 1,118
Tabelul 5.7
Suma
Valori
210 222 226 235 244 245 250 diferenţelor
individuale
pe linii
210 0 12 16 25 34 35 40 162
222 -12 0 4 13 22 23 28 90
226 -16 -4 0 9 18 19 24 70
235 -25 -13 -9 0 9 10 15 34
244 -34 -22 -18 -9 0 1 6 7
245 -35 -23 -19 -10 -1 0 5 5
250 -40 -28 -24 -15 -6 -5 0 0
368
nj
Me= Mo = x xj
nj nj
_ _
Mo Me x xj x Me Mo
_ _ xj
fi
Leptokurtică
Mezokurtică
Platikurtică
xi
Figura 5.5. Distribuţii cunimodale cu grade diferite de aplatizare
qi qi
qi
100% 100%
100%
50% 50%
50%
pi pi pi
50% 100% 50% 100% 50% 100%
(a) Concentrare (b) Lipsa concentrării (c) Concentrare
slabă (echirepartiţie) puternică
Figura 5.6 Curba de concentrare cu grade diferite de
concentrare/diversificare
Suprafata de concentrare
IG = = 2 ⋅ Suprafata de concentrare (5.43)
Aria patratului
2
Observaţii:
valorile indicelui de concentrare Gini sunt cuprinse în intervalul
[0;1] sau[0;100%] – dacă se exprimă procentual.
IG este adimensional şi respectă condiţia de tranzitivitate în timp
şi spaţiu ceea ce permite utilizarea sa în efectuarea comparaţiilor.
Acestea sunt elemente care determină ca IG să fie cel mai
Capitolul V 157
frecvent în analiza concentrării, în paralel cu preocupările
multiple de determinare a unor noi relaţii de calcul.
În aria preocupărilor de determinare a IG un loc aparte îl ocupă
metoda grafică.
Aproximarea valorii IG pe cale grafică are ca punct de pornire curba
de concentrare trasată pe baza datelor înregistrate (vezi şi fig. 5.6). Pe baza
acestei curbe suprafaţa de concentrare se poate aproxima diminuând aria
triunghiului ABC cu suma ariilor trapezelor de tipul celor evidenţiate în fig.
5.7.
qi
1 D C
qi
qi-1
h B
0A pi-1 pi 1 pi
Figura 5.7 Determinarea suprafeţei de concentrare
1
EO −
EO | = N ∈ [0;1] (5.46.1)
1
1−
N
3. Entropia C. Shannon (H) este un alt indicator cu care se
apreciază concentrarea/diversificarea sau organizarea/dezorganizarea şi se
determină după următoarea relaţie:
N 1
H = ∑ g i ln (5.47)
i =1 gi
Mulţimea valorilor acestui indicator este intervalul [0; ln N], iar
interpretarea sa este similară cu cea a „energiei informaţionale Onicescu”.
4. Diferenţa Hirschman (DH)
În literatura de specialitate „energia informaţională Onicescu” mai
este cunoscută şi sub alte denumiri – indicele Hirschman – Herfindahl sau
pătratul lungimii vectorului frecvenţelor.
Diferenţa Hirschman (DH) se determină ca diferenţă între EO (sau
indicele Hirschman) şi valoarea aceluiaşi indicator pentru unităţile de talie
1
egală (EOE). În această situaţie reprezintă numărul unităţilor din
EOE
populaţia statistică, de volum N, care au talia egală.
DH = EO – EOE (5.48)
Diferenţa Hirschman într-o situaţie reală se datorează inegalităţilor
de talie a unităţilor populaţiei.
5. Coeficientul de concentrare Corrado Gini (CG)
Aceta se determină după relaţia următoare:
K
CG = ∑ g i2 (5.49)
i =1
Unde: K=numărul de categorii ale variabilei analizate
1
CG ∈ ,1 ceea ce înseamnă că prezintă ca şi EO dezavantajul
K
variabilităţii limitei minime.
Pentru a elimina neajunsul precizat în analiză (în comparaţii) se
utilizează forma corectată a coeficientului de concentrare Corrado Gini
cunoscută şi sub denumirea de coeficientul de concentrare Strück (CS).
Relaţia de calcul a acestuia este:
160 Statistică generală
K
K ∑ g i2 − 1
i =1
CS = (5.50)
K −1
În această formă CS corespunde cu EO| şi prezintă valori în
intervalul [0;1]. Valoarea minimă este independentă de numărul categoriilor
considerate.
Capitolul V 161
Întrebări de autoevaluare
• Care sunt principalele caracteristici ale indicatorului abatere medie
absolută ?
• Care este principalul dezavantaj al indicatorului amplitudinea
valorilor ?
• Ce probleme de cunoaştere rezolvă sistemul indicatorilor împrăştieri
valorilor ?
• Care sunt avantajele comparative ale diferitelor modalităţi de calcul
a dispersiei?
• Acre sunt proprietăţile dispersiei şi utilizarea lor practică ?
• În analizele financiar – bursiere abaterea medie pătratică se
utilizează ca măsură a riscului ?
• Abaterea medie pătratică se poate utiliza pentru compararea
variabilităţii mai multor caracteristici de natură diferită ?
1. Da
2. Nu
• Care sunt principalii indicatori ai simetriei şi relaţiile lor de calcul ?
• Coeficientul de variaţie arată:
a) de câte ori este mai mare abaterea standard (tip) faţă de media
aritmetică;
b) cu câte procente este depăşită limita de omogenitate admisă;
c) cu cât este mai mare abaterea standard faţă de media aritmetică;
d) de câte ori se cuprinde abaterea standard în medie;
e) câte procente din abaterea standard reprezintă media aritmetică.
• Dispersia este invers proporţională cu:
a) volumul eşantionului;
b) volumul caracteristicilor studiate;
c) abaterea standard;
d) coeficientul de asimetrie;
e) este o mărime asimetrie.
• Pătratul abaterii tip măsoară:
a) amplitudinea dispersiei unui set de date în jurul mediei lor;
b) omogenitatea unui set de date;
c) asimetria unei distribuţii;
d) tendinţa centrală a unui set de date;
e) gradul de concentrare a frecvenţelor.
• Coeficientul de asimetrie propus de Paarson se află în relaţie de
inversă proporţionalitate cu:
162 Statistică generală
a) abaterea standard;
b) abaterea standard şi valoarea modală;
c) dispersia şi valoarea modală;
d) media aritmetică;
e) valoarea modală.
• Dispersia, calculată prin metoda momentelor, este:
a) momentul iniţial de ordin doi;
b) momentul iniţial de ordin patru împărţit la momentul iniţial de
ordin doi la pătrat;
c) momentul centrat de ordin doi la pătrat;
d) momentul iniţial de ordin doi minus momentul iniţial de ordinul
întâi la pătrat;
e) momentul centrat de ordin doi minus momentul iniţial de ordin
unu la pătrat.
• Salariaţii unei întreprinderi au salariul mediu de 7.00 mil. lei, cu o
abatere medie pătratică a salariilor de 1.50 mil. lei. Patronul firmei
hotărăşte să mărească fiecare salariu individual de 1,3 ori. Dispersia
noilor salarii faţă de salariul mediu va fi:
a) 150;
b) 22.500;
c) 29.250;
d) 253,5;
e) 38.025.
• Care dintre următoarele afirmaţii referitoare la coeficientul de
variaţie nu este adevărată:
a) este un indicator sintetic al împrăştierii;
b) este expresia relativă a abaterii medii pătratice;
c) valori mici ale coeficientului de variaţie semnifică un grad mare
de reprezentativitate a mediei caracteristicii studiate;
d) valori mici ale coeficientului de variaţie reflectă o tendinţă
accentuată de simetrie a distribuţiei;
e) valori mici ale coeficientului de variaţie reflectă omogenitatea
colectivităţii din punctul de vedere al caracteristicii studiate.
• Într-o populaţie statistică s-au cules date despre două variabile
numerice distincte. Seriile formate în urma sistematizării sunt:
{xi}i = 1.7 = {2;2;2;10;18;18;18} şi {yi}i=1.7 = {9;9;9;10;11;11;11}.
Observând variantele celor două serii se constată că:
a) seria formată după Y este mai omogenă decât cea formată după X;
b) seria formată după X este mai omogenă decât cea formată după Y;
Capitolul V 163
c) cele două serii prezintă aceeaşi omogenitate, deoarece au aceeaşi
medie şi mediane egale cu 10;
d) nu are sens comparabilitatea omogenităţii din cele două serii,
deoarece sunt formate după variabile distincte;
e) seria formată după X este mai omogenă deoarece abaterile
individuale faţă de valoarea mediană sunt mai mari.
• Fie colectivitatea statistică sistematizată în r grupe după valorile
caracteristicii de grupare X şi în m grupe după valorile variabilei
analizate Y şi pentru care s-au calculat dispersiile:
σ 2 = dispersia totală, σ i2 = dispersiile de grupă
−
σ 2 = media dispersiilor de grupă.
Contribuţia factorului de grupă X la variaţia generală a variabilei Y
să măsoară cu indicatorul:
−2
σ
a) R2 = 2 ;
σ
δ2
b) R2 = 2 ;
σ
2 δ2
c) R = 1 − 2 ;
σ
r m −
Σ σ i2 n i Σ ( y j − y) 2 n j
j=1
d) R2 = 1 − i =1r : m
;
Σ ni Σ nj
i =1 j=1
r m − m −
Σ Σ (y j − yi ) 2 n i j Σ ( y j − y) 2 n j
i =1 j=1 j=1
e) R2 = 1 − r m
: m
;
Σ Σ ni j Σ nj
i =1 j=1 j=1
• Pentru 200 de salariaţi ai unei societăţi comerciale fondul de
salarizare a fost, într-o săptămână, de 150 milioane lei. Ştiind că cei
mai mulţi dintre salariaţi au avut un salariu de 820 mii lei, iar
coeficientul de asimetrie al repartiţiei după salariu a fost de -0,35,
coeficientul de variaţie a fost:
a) 24,5%;
b) 200%;
c) -25,52%;
d) 37,5%;
164 Statistică generală
e) 26,67%.
• Se cunosc următoarele date (convenţionale) asupra repartiţiei unei
caracteristici:
Grupe Frecvenţe
11,0-13,0 12
13,0-15,0 18
15,0-17,0 8
17,0-19,0 2
Total n=40
Date fiind valoarea modală Mo (xmo) = 13,75; valoarea medie = 14,0
coeficientul de asimetrie (Pearson) are valoarea:
a) 0,377;
b) 0,677;
c) 1,377;
d) 0,963;
e) 0,09.
• Pentru seria de date reprezentând distribuţia familiilor după nivelul de venit:
Foarte Foarte
Venit Scăzut Mediu Ridicat
scăzut ridicat
Nr. familii 10 20 40 20 10
Coeficientul de asimetrie propus de Pearson este:
a) zero;
b) unitar;
c) egal cu -1;
d) nu se poate calcula;
e) egal cu coeficientul de variaţie.
• Dacă pentru o serie de distribuţie de frecvenţe coeficientul de
variaţie indică un nivel ridicat de eterogenitate, atunci se recomandă
împărţirea colectivităţii în grupe după un factor de grupare
semnificativ, ceea ce duce la:
a) creşterea gradului de omogenitate în interiorul grupelor;
b) creşterea gradului de eterogenitate în interiorul grupelor;
c) scăderea gradului de omogenitate în interiorul grupelor;
d) creşterea nivelului coeficientului de variaţie în interiorul
grupelor;
e) nivelul de omogenitate în interiorul grupei va fi întotdeauna egal
cu cel calculat pentru distribuţia marginală.
• Să se precizeze care dintre seriile de repartiţie, caracterizate prin
următoarele seturi de valori, prezintă o asimetrie pozitivă:
−
a) x = 40 u.m.; Me = 40 u.m.; Mo = 40 u.m.;
Capitolul V 165
−
b) x = 2.500 u.m.; Me = 3.000 u.m.; Mo = 3.300;
−
c) x = 151,25 u.m.; Me = 138,75 u.m.; Mo = 112, 58 u.m.;
−
d) x = 180 u.m.; Me = 180 u.m.; Mo = 140 u.m. şi 220 u.m.
−
e) x = Me = Mo = 0.
• Dacă între cuartilele calculate pentru o serie de repartiţie există relaţie
Q2 = (Q1+Q3)/2 atunci repartiţie este:
a) asimetrică spre valorile mari;
b) asimetrică spre valorile mici;
c) normală;
d) hiperbolică;
e) bidimensională.
• O grupă de 25 de studenţi susţine la două discipline câte un test pentru
verificarea cunoştinţelor. Testele au punctaje diferite, iar pe baza lor
se cunoaşte:
25 25
- la testul A: Σ xi2 A = 9000 Σ xi A = 450
i =1 i =1
25 25
- la testul B: Σ xi2 B = 425 Σ xi B = 100
i =1 i =1