Documente Academic
Documente Profesional
Documente Cultură
Cuprins:
☺ Exemplul 1
Fie următoarele seturi de date:
2 4 6 8 10 12 14
x1 Me1
5 6 7 8 9 10 11
x 2 Me 2
Se observă că deşi cele două serii au aceeaşi medie şi mediană x1 x 2 Me1 Me 2 ,
ele diferă prin modul de împrăştiere a valorilor. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.
Indicatorii simpli ai variaţiei se exprimă atât în mărimi absolute (având aceleaşi unităţi
de măsură ca şi caracteristica studiată), cât şi în mărimi relative (obţinute prin raportarea
mărimii absolute la medie).
Indicatorii simpli ai variaţiei sunt:
amplitudinea absolută a variaţiei;
amplitudinea relativă a variaţiei;
abaterile individuale absolute;
abaterile individuale relative.
Amplitudinea absolută a variaţiei (Ax) se determină ca diferenţă între valoarea
maximă (xmax) şi valoarea minimă (xmin) a caracteristicii şi arată câmpul maxim de împrăştiere
a valorilor caracteristicii.
Ax = xmax - xmin
Are unitatea de măsură a valorilor caracteristicii şi din acest motiv nu poate fi folosită la
compararea seriilor după caracteristici exprimate în unităţi de măsură diferite.
Se utilizează în etapa de grupare a datelor, mai precis la construirea intervalelor de
variaţie şi se mai utilizează şi la construirea graficelor.
Amplitudinea este foarte sensibilă la valorile extreme. Cu cât acestea sunt mai
îndepărtate cu atât câmpul de împrăştiere a valorilor este mai mare.
Amplitudinea relativă a variaţiei (Ax(%)) se obţine prin raportarea amplitudinii
absolute la medie. Se exprimă în coeficient sau procente, deci pot fi comparate serii după
caracteristici exprimate în unităţi de măsură diferite:
Ax
A x (%) 100
x
Abaterile individuale absolute care ne arată împrăştierea fiecărei valori de la valoarea
medie:
di xi x
d min x min x 0
d i x i x 0
n n
i 1 i 1
Suma abaterilor maxime şi minime luate în modul este egală cu amplitudinea absolută a
variaţiei:
d max d min A x
Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea abaterii
minime absolute luată în modul, atunci pentru seria respectivă trebuie calculaţi pe lângă
indicatorii variaţiei şi indicatorii de asimetrie.
Într-o serie simetrică:
d min d max
În cazul în care seria de distribuţie de frecvenţe este pe intervale, atunci x i este centrul
intervalului.
- pentru o serie de distribuţie de frecvenţe relative:
k
x i x n *i
d i 1 - dacă n *i sunt exprimate în procente
100
k
d x i x n *i - dacă n *i sunt exprimate în coeficienţi
i 1
☺ Exemplul 2
Repartiţia salariaţilor unei întreprinderi după prima obţinută la sfârşitul anului este prezentată
în tabelul următor:
x i ni
24.500
x i 1
5
245 lei / salariat
n
100
i
i 1
x i x ni
9.650
x i 1
5
96,5 lei / salariat
n
100
i
i 1
Dispersia se calculează ca medie aritmetică simplă (în cazul seriilor simple) sau
ponderată (în cazul seriilor de distribuţie de frecvenţă) a pătratelor abaterilor termenilor seriei
de la tendinţa centrală (cel mai adesea media aritmetică).
- pentru o serie simplă:
x i x
n 2
2 i 1
n
- pentru o serie de frecvenţe absolute:
x i x
k 2
ni
2 i 1
k
ni
i 1
x i x
k 2
n *i
2 i 1
100
sau
2 n *i
k
2 xi x
i 1
Dacă datele provin din eşantioane de volum redus şi le folosim pentru extinderea rezultatelor
la nivelul colectivităţii generale (le folosim pentru o inferenţă statistică), atunci în calculul
dispersiei la numitor se va folosi (n-1) şi nu “n” fiind astfel dispersia eşantionului un
estimator mai bun al dispersiei în colectivitatea generală:
x i x
n 2
s 2 i 1
n 1
Dispersia prezintă dezavantajul că este un indicator abstract care nu are o unitate
concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul tendinţei
centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci acea serie nu
prezintă variaţie, toţi termenii ei fiind egali. Cu cât valoarea dispersiei creşte faţă de zero, cu
atât împrăştierea termenilor seriei creşte şi ea.
Este un indicator deosebit de util în studiile statistice, fiind utilizată în calculul
asimetriei, excesului, boltirii unei serii, precum şi în calculul altor indicatori statistici.
x i x
2 2
ni
2w i 1
1 w 2 m 0 w 2 (n m)
2 n
ni
i 1
nm
1 w 2 1 w 2 w w 2 (1 w )
m
w2
n n
w 1 w 1 w w w 1 w
Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe
relative.
☺ Exemplul 3
Prima (lei) Nr. salariaţi (ni)
sub 300 65
300 35
Total 100
Să se calculeze dispersia caracteristicii alternative “salariaţi cu prima sub 300 RON”.
m 65
w 0,65
n 100
atunci 2w înregistrează o creştere mai rapidă la început şi mai lentă când se apropie
de limita superioară;
dacă w 1 – w, adică w 0,5 şi w creşte uniform în cadrul intervalului (0,5, 1)
Abaterea medie pătratică (abatere standard, abatere tip sau ecart tip) se calculează
ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.
Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de la
tendinţa centrală (de obicei media):
- pentru o serie simplă:
x i x
n 2
2 i 1
n
- pentru o serie de frecvenţe absolute:
x i x
k 2
ni
2 i 1
k
ni
i 1
x i x
k 2
n *i
2 i 1
100
☺ Exemplul 4
Fie 2 serii:
S1: 1 2 3 4 5 6
Cele două serii au aceeaşi amplitudine, aceeaşi abatere medie liniară şi aceeaşi abatere medie
pătratică. Cu toate acestea, împrăştierea din seria A este mai mare decât cea din seria B.
Este foarte dificil să comparăm serii de date după caracteristici exprimate prin aceeaşi
unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.
Abaterea medie pătratică are aceeaşi semnificaţie ca şi abaterea medie liniară, dar ea
obţinându-se prin ridicarea la pătrat a abaterilor individuale de la tendinţa centrală (medie)
înlătură dezavantajul acordării aceleiaşi importanţe atât abaterilor mari cât şi celor mici.
Abaterea medie pătratică are aceeaşi unitate de măsură cu a caracteristicii studiate, de
aici provenind dezavantajul că nu pot fi comparate colectivităţi după caracteristici exprimate
prin unităţi de măsură diferite.
Deoarece x x p rezultă că d .
În cazul unei serii de distribuţie de frecvenţe simetrică sau uşor asimetrică, adică pentru
o serie cu tendinţă de normalitate între abaterea medie liniară şi abaterea medie pătratică
există relaţia:
d 0,8
☺ Exemplu 5
Se utilizează datele din Exemplul 2.
d 96,5
0,8 seria este simetrică adică are o repartiţie normală.
120,31
Abaterea medie pătratică este un indicator care ne oferă informaţii privind modul de
împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o regulă empirică spune:
- 68,37% din termenii unei serii se situează în intervalul x , x ;
1.Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre
aceste conturi. Sumele sunt date în Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) să se calculeze suma medie de bani existentă într-un cont
b) să se caracterizeze gradul de omogenitatea al seriei.
Deşi cel mai adesea coeficientul de variaţie se calculează utilizând media (deoarece
respectă cele mai multe din condiţiile impuse de Yule), acest indicator se poate calcula
utilizând şi alţi indicatori ai tendinţei centrale (mediana, mediala, modul).
Acest indicator nu se poate utiliza (adică este lipsit de semnificaţie) în cazul în care
media aritmetică este apropiată de zero sau când valorile termenilor seriei sunt foarte
apropiate.
☺ Exemplul 6
Se utilizează datele din Exemplul 2 şi Exemplul 5.
120,31
v 100 100 49,1% 35% seria nu este omogenă
x 245
d 96,5
v' 100 100 39,3%
x 245
3. Indicatorii de asimetrie
Asimetria unei serii de distribuţie empirice poate fi determinată atât prin metoda grafică
cât şi prin calculul indicatorilor de asimetrie.
Reprezentarea grafică cea mai utilizată pentru aprecierea asimetriei este poligonul
frecvenţelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului de asimetrie, fără
a putea să-l măsoare printr-o valoare exactă.
ni ni ni
xx Me Mo xi Mo Me x xi x Me Mo xi
ni ni
0 xi 0 xi
0 xi
ni
0
xi
Repartiţie complexă obţinută prin suprapunerea a trei repartiţii: una în formă de J şi
două moderat asimetrice. Acest tip de repartiţii apare frecvent când gruparea nu a fost
executată corect.
Indicatorii asimetriei sunt:
- asimetrie absolută:
As x Mo sau
As 3 x Me
Aceşti indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă
dezavantajul că nu pot fi comparate din punct de vedere al asimetriei serii după caracteristici
exprimate prin unităţi de măsură diferite.
Aceşti indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în cazul
asimetriei de dreapta).
Datorită faptului că o distribuţie se caracterizează şi prin variabilitate, pentru aceeaşi
asimetrie absolută, o serie care are variabilitatea mai mică va fi mai pronunţat oblică, iar
pentru una cu variabilitatea mai mare, oblicitatea se va atenua.
- asimetrie relativă:
De aceea se calculează coeficientul de asimetrie propus de Pearson (statistician
englez 1857-1936):
x Mo
Cas 1, 1
Dacă Cas = 0 seria este perfect simetrică:
x Me Mo
Cas
3 x Me
3, 3
Acest indicator este recomandat numai pentru serii de repartiţie uşor asimetrice când
între cei trei indicatori ai tendinţei centrale există relaţia:
Mo x 3 Me x
Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se apropie
de extremităţile intervalului, asimetria devine mai pronunţată.
Aceşti doi indicatori ai asimetriei sunt cei mai utilizaţi în practică, dar în afară de aceştia
se mai utilizează şi alţi indicatori.
☺ Exemplul 7
Se utilizează datele din Exemplul 2.
1 10
Mo x 0 h 200 100 266,66
1 2 10 5
x Mo 21,66
Cas 0,18 0
120,31
Cas 0,3, 0,3 seria este uşor asimetrică, cu asimetrie negativă sau de dreapta, deci
☺ Exersaţi în … Excel
Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De
asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute
de studenţi la examen au fost următoarele:
8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6
Se obţin rezultatele:
Note
Mean 7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este
8,4 (Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură
valoare.
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10.
Amplitudinea (diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este
2,15 (Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj
statistic) este 0,215 (Standard Error).
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic
asimetrică negativ, curba fiind alungită spre stânga.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie
leptocurtică).
Testul de autoevaluare 2
sub 6 10
6-12 22
12-18 25
18-24 23
24-30 17
30 şi peste 3
Total 100
Se cere:
a) să se aprecieze dacă media e reprezentativă;
b) caracterizaţi asimetria distribuţiei;
c) să se calculeze media şi dispersia caracteristicii „profitul ≥18 mil lei”.
Testul de autoevaluare 3
1.Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă
dintr-un an se prezintă astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariaţi 2 6 10 15 8 5 4
Se cere:
a) să se calculeze indicatorii sintetici ai variaţiei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile de
concediu mai mare sau egal cu 17”.
2.Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un
magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:
Testul de autoevaluare 1
x
10
2
i x
2 i 1
2086,889
10
Deoarece v, v’ 35%, apreciem că seria este omogenă, variaţia este mică, media este
reprezentativă.
Testul de autoevaluare 2
1. a) Pentru a aprecia dacă media este reprezentativă, vom utiliza coeficientul de variaţie.
Pentru a calcula coeficientul de variaţie trebuie mai întâi să calculăm media şi abaterea medie
pătratică.
6
x n i i
x i 1
6
n
i 1
i
*
Putem lucra cu relaţia de mai sus dacă calculăm din ni (din ipoteza, din tabel) şi
ni
10
n1 200 20 agenţi economici;
100
22
n2 200 44
100
25
n3 200 50
100
23
n4 200 46
100
17
n5 200 34
100
3
n6 200 6
100
xi reprezintă centrele de interval
sau putem calcula media utilizând relaţia:
6
x n *
i i
3 10 9 22 15 25 21 23 27 17 33 3
x i 1
16,44 mil. lei
100 100
Profitul mediu al unui agent economic este egal cu 16,44 mil lei.
Centrele de interval xi se determină ca o medie aritmetică simplă a capetelor fiecărui
interval. Rezultatele sunt prezentate în tabelul următor
Testul de autoevaluare 3
1. a) Pentru a calcula indicatorii sintetici ai variaţiei, va trebui să calculăm mai întâi
media – care se calculează ca o medie aritmetică ponderată:
7
xini
14 2 15 6 16 10 17 15 18 8 19 5 20 4
x i 1
7 50
ni
i 1
852
17,04 zile concediu
50
Indicatorii sintetici ai variaţiei sunt:
- abaterea medie liniară:
7
xi x ni 14 17,04 2 15 17,04 6 16 17,04 10
d i 1
7 50
ni
i 1
17 17,04 15 18 17,04 8 19 17,04 5 20 17,04 4
50
58,64
1,1728 zile
50
Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de
zile de concediu cu 1,1728 zile.
- dispersia:
x i x
7 2
ni
2 i 1
14 17,042 2 15 17,042 6
7 50
ni
i 1
16 17,042 10 17 17,042 15 18 17,042 8
50
19 17,04 2
5 20 17,042 4 115,92
2,3184
50 50
- abaterea medie pătratică:
x Mo 17,04 17
Cas 0,026
1,5226
Deoarece Cas 0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se
găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale
caracteristicii.
Cas [-0,3; 0,3] seria este uşor asimetrică (Cas este foarte apropiat de zero).
c) Avem o caracteristică alternativă:
- salariaţi care au avut un concediu 17 zile;
- salariaţi care au avut un concediu 17 zile.
Frecvenţele absolute
Varianta xi
ni
DA (peste 17 zile) 1 m = 32
NU (sub 17 zile) 0 n – m = 18
Total - n = 50
Deoarece Cas 0 seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic
mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de
brânză cu multe calorii.
Cas [-0,3; 0,3] seria este uşor asimetrică.
c) Avem o caracteristică alternativă:
- cutii care au sub 95 calorii;
- cutii care au peste 95 calorii.
Frecvenţele absolute
Varianta xi
ni
DA (sub 95 calorii) 1 m = 15
NU (peste 95 calorii) 0 n – m = 35
Total - n = 50
Media caracteristicii alternative:
m 15
w 0,3
n 50
30% dintre cutii au sub 95 calorii.
Dispersia caracteristicii alternative:
2w w(1 w) 0,3 (1 0,3) 0,21
5. Teme de control
5.Un studiu privind durata de viaţă în ore a unui produs electrocasnic efectuat pe 100 aparate
a condus la următoarele rezultate:
Durata de viaţă (ore) Structura numărului de aparate electrocasnice
0 – 1000 8
1000 – 2000 20
2000 – 3000 26
3000 – 4000 22
4000 – 5000 18
5000 - 6000 6
Total 100
Se cere:
a) să se aprecieze dacă media este reprezentativă;
b) să se caracterizeze gradul de asimetrie;
c) să se determine media şi dispersia caracteristicii “aparate care au durata de viaţă mai
mică de 3000 ore”.
Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa unui număr mare
de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat indicator al tendinţei
centrale, să nu fie suficientă pentru analiza acestor fenomene. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.
Indicatorii variaţiei pentru o serie statistică se clasifică în:
indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor una
faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;
indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul lor,
sintetizând într-o singură valoare întreaga împrăştiere din serie.
Cu ajutorul indicatorilor variaţiei putem:
studia reprezentativitatea mediei pentru o serie de date;
aprecia gradul de omogenitate a seriei;
caracteriza gradului de variaţie a unei serii;
compara în timp şi spaţiu a mai multor serii de repartiţie pentru aceeaşi caracteristică sau
pentru caracteristici diferite care au fost înregistrate pentru aceeaşi colectivitate;
cunoaşte gradul de influenţă a factorilor după care s-a efectuat gruparea;
cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia normală
1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004
2. Danciu A.,Niculescu I., Gruiescu M., Statistică economică, Editura Enciclopedică,
Bucureşti, 2009
3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistică, Editura Universitară, Bucureşti, 2003;
4. Voineagu V., Ţiţan E., Ghiţă S., Boboc C., Todose D. – Statistică. Baze teoretice şi
aplicaţii, Editura Economică, Bucureşti, 2007;
5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995