Sunteți pe pagina 1din 23

CURS STATISTICĂ - Unitatea de învăţare nr.

ANALIZA STATISTICĂ A DISTRIBUŢIILOR DE FRECVENŢE.


INDICATORII VARIAŢIEI ŞI ASIMETRIEI

Cuprins:

1.Obiectivele Unităţii de învăţare.


2.Clasificarea indicatorilor variatiei.
2.1. Indicatorii simpli ai variaţiei.
2.2. Indicatorii sintetici ai variaţiei.
3.Indicatorii asimetriei.
4. Răspunsuri şi comentarii la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unităţii de învăţare.
7. Bibliografia Unităţii de învăţare.

1. Obiectivele unităţii de învăţare

În analiza unei serii statistice ne interesează, pe lângă analiza tendinţei centrale şi


analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei.
Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa
unui număr mare de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat
indicator al tendinţei centrale, să nu fie suficientă pentru analiza acestor fenomene.

☺ Exemplul 1
Fie următoarele seturi de date:
2 4 6 8 10 12 14

x1  Me1
5 6 7 8 9 10 11

x 2  Me 2


Se observă că deşi cele două serii au aceeaşi medie şi mediană x1  x 2  Me1  Me 2 , 
ele diferă prin modul de împrăştiere a valorilor. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.

In urma parcurgerii acestui capitol, studenţii vor putea :


 studia reprezentativitatea mediei pentru o serie de date;
 aprecia gradul de omogenitate a seriei;
 caracteriza gradului de variaţie a unei serii;
 compara în timp şi spaţiu variaţia mai multor serii de repartiţie pentru aceeaşi
caracteristică sau pentru caracteristici diferite care au fost înregistrate pentru aceeaşi
colectivitate;
 cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia
normală

2. Clasificarea indicatorilor variaţiei

Indicatorii variaţiei pentru o serie statistică se clasifică în:


 indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor
una faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;
 indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul
lor, sintetizând într-o singură valoare întreaga împrăştiere din serie.

2.1. Indicatorii simpli ai variaţiei

Indicatorii simpli ai variaţiei se exprimă atât în mărimi absolute (având aceleaşi unităţi
de măsură ca şi caracteristica studiată), cât şi în mărimi relative (obţinute prin raportarea
mărimii absolute la medie).
Indicatorii simpli ai variaţiei sunt:
 amplitudinea absolută a variaţiei;
 amplitudinea relativă a variaţiei;
 abaterile individuale absolute;
 abaterile individuale relative.
Amplitudinea absolută a variaţiei (Ax) se determină ca diferenţă între valoarea
maximă (xmax) şi valoarea minimă (xmin) a caracteristicii şi arată câmpul maxim de împrăştiere
a valorilor caracteristicii.
Ax = xmax - xmin
Are unitatea de măsură a valorilor caracteristicii şi din acest motiv nu poate fi folosită la
compararea seriilor după caracteristici exprimate în unităţi de măsură diferite.
Se utilizează în etapa de grupare a datelor, mai precis la construirea intervalelor de
variaţie şi se mai utilizează şi la construirea graficelor.
Amplitudinea este foarte sensibilă la valorile extreme. Cu cât acestea sunt mai
îndepărtate cu atât câmpul de împrăştiere a valorilor este mai mare.
Amplitudinea relativă a variaţiei (Ax(%)) se obţine prin raportarea amplitudinii
absolute la medie. Se exprimă în coeficient sau procente, deci pot fi comparate serii după
caracteristici exprimate în unităţi de măsură diferite:
Ax
A x (%)   100
x
Abaterile individuale absolute care ne arată împrăştierea fiecărei valori de la valoarea
medie:
di  xi  x

În practică se utilizează mai mult abaterea absolută maximă şi abaterea absolută


minimă:
d max  x max  x  0

d min  x min  x  0

Abaterile individuale absolute se exprimă prin aceeaşi unitate de măsură ca şi


caracteristica studiată şi pot lua valori negative sau pozitive după cum valoarea individuală
este mai mică sau mai mare ca media.
Dacă di în valoare absolută au valori mari putem concluziona că datele sunt împrăştiate,
adică există o variaţie mare în interiorul seriei.
Suma valorilor abaterilor individuale absolute este nulă:

 d i   x i  x   0
n n

i 1 i 1

Suma abaterilor maxime şi minime luate în modul este egală cu amplitudinea absolută a
variaţiei:
d max  d min  A x

Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea abaterii
minime absolute luată în modul, atunci pentru seria respectivă trebuie calculaţi pe lângă
indicatorii variaţiei şi indicatorii de asimetrie.
Într-o serie simetrică:
d min  d max

Abaterile individuale relative se exprimă în coeficienţi sau procente şi se calculează


raportând abaterile individuale absolute la medie:
 d
d  max  100
di  max(%) x
d i(%)   100 
d min
x  d min(%)   100
 x
Toţi aceşti indicatori simpli prezintă dezavantajul că nu sintetizează, într-o singură
valoare, împrăştierea tuturor termenilor din seria analizată.
Pentru a elimina acest dezavantaj calculăm indicatorii sintetici ai variaţiei.

2.2. Indicatorii sintetici ai variaţiei

Indicatorii sintetici ai variaţiei sunt:


 abaterea medie liniară d ; 
 dispersia (varianţa);
 abaterea medie pătratică (abatere medie standard sau tip);
 coeficientul de variaţie.

Abaterea medie liniară d se calculează ca o medie aritmetică simplă (în cazul seriilor
simple) sau ponderată (în cazul seriilor de distribuţie de frecvenţe) a abaterilor termenilor
seriei de la media lor în valoare absolută.
- pentru o serie simplă:
n
 xi  x
d  i 1
n
- pentru o serie de distribuţie de frecvenţe absolute:
k
 xi  x  ni
d  i 1
k
 ni
i 1

În cazul în care seria de distribuţie de frecvenţe este pe intervale, atunci x i este centrul
intervalului.
- pentru o serie de distribuţie de frecvenţe relative:
k
 x i  x  n *i
d  i 1 - dacă n *i sunt exprimate în procente
100
k
d   x i  x  n *i - dacă n *i sunt exprimate în coeficienţi
i 1

În locul mediei, pot fi folosiţi şi alţi indicatori ai tendinţei centrale.


Dezavantaje ale abaterii medii liniare:
 se exprimă în aceeaşi unitate de măsură ca şi caracteristica analizată, deci nu poate fi
utilizată la compararea a două sau mai multe serii după caracteristici exprimate în
unităţi de măsură diferite;
 nu ţine seama de semnul algebric;
 nu ţine seama de faptul că abaterile mai mari în valoare absolută influenţează în mai
mare măsură gradul de variaţie al unei caracteristici comparativ cu abaterile mici.
Pentru a înlătura aceste dezavantaje se calculează şi alţi indicatori sintetici ai variaţiei.

☺ Exemplul 2
Repartiţia salariaţilor unei întreprinderi după prima obţinută la sfârşitul anului este prezentată
în tabelul următor:

Nr. salariaţi Centrul xi  x xi  x  ni


Prima (lei) xini
ni xi
sub 100 15 50 750 +195 2.925
100 – 200 20 150 3.000 +95 1.900
200 – 300 30 250 7.500 5 150
300 – 400 25 350 8.750 105 2.625
peste 400 10 450 7.500 205 2.050
Total 100 - 24.500 - 9.650
5

x i  ni
24.500
x i 1
5
  245 lei / salariat
n
100
i
i 1

x i  x  ni
9.650
x i 1
5
  96,5 lei / salariat
n
100
i
i 1

Prima unui salariat se abate în medie de la prima medie cu  96,5 lei.

Dispersia se calculează ca medie aritmetică simplă (în cazul seriilor simple) sau
ponderată (în cazul seriilor de distribuţie de frecvenţă) a pătratelor abaterilor termenilor seriei
de la tendinţa centrală (cel mai adesea media aritmetică).
- pentru o serie simplă:

 x i  x 
n 2

 2  i 1
n
- pentru o serie de frecvenţe absolute:

 x i  x 
k 2
 ni
2 i 1
 
k
 ni
i 1

- pentru o serie de frecvenţe relative:

 x i  x 
k 2
 n *i
 2  i 1
100
sau

 2  n *i
k
2   xi  x
i 1

Dacă datele provin din eşantioane de volum redus şi le folosim pentru extinderea rezultatelor
la nivelul colectivităţii generale (le folosim pentru o inferenţă statistică), atunci în calculul
dispersiei la numitor se va folosi (n-1) şi nu “n” fiind astfel dispersia eşantionului un
estimator mai bun al dispersiei în colectivitatea generală:

 x i  x 
n 2

s 2  i 1
n 1
Dispersia prezintă dezavantajul că este un indicator abstract care nu are o unitate
concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul tendinţei
centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci acea serie nu
prezintă variaţie, toţi termenii ei fiind egali. Cu cât valoarea dispersiei creşte faţă de zero, cu
atât împrăştierea termenilor seriei creşte şi ea.
Este un indicator deosebit de util în studiile statistice, fiind utilizată în calculul
asimetriei, excesului, boltirii unei serii, precum şi în calculul altor indicatori statistici.

Dispersia caracteristicii alternative:


Frecvenţa
Varianta xi Frecvenţe relative
ni
DA 1 m m
n
nm
NU 0 n–m 1 w
n
Total - n 1

 x i  x 
2 2
 ni
 2w  i 1

1  w 2  m  0  w 2  (n  m) 
2 n
 ni
i 1
nm
 1  w 2   1  w 2  w  w 2  (1  w ) 
m
 w2 
n n
 w 1  w 1  w  w   w 1  w 

Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe
relative.

☺ Exemplul 3
Prima (lei) Nr. salariaţi (ni)
sub 300 65
 300 35
Total 100
Să se calculeze dispersia caracteristicii alternative “salariaţi cu prima sub 300 RON”.

m 65
w   0,65
n 100

 2w  w(1  w)  0,65  0,35  0,2275

Dispersia caracteristicii alternative prezintă următoarele particularităţi:


 dispersia caracteristicii alternative poate lua valori doar în intervalul:
 2w  0, 0,25

 când w = 1 – w, adică w = 0,5, dispersia atinge valoarea maximă  2w  0,25 ;


 dacă w  1 – w, adică w  0,5 şi w creşte uniform în cadrul intervalului (0, 0,5)

atunci  2w înregistrează o creştere mai rapidă la început şi mai lentă când se apropie
de limita superioară;
 dacă w  1 – w, adică w  0,5 şi w creşte uniform în cadrul intervalului (0,5, 1)

atunci  2w înregistrează o scădere în acelaşi ritm în care a avut loc creşterea.

Abaterea medie pătratică (abatere standard, abatere tip sau ecart tip) se calculează
ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.
Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de la
tendinţa centrală (de obicei media):
- pentru o serie simplă:

 x i  x 
n 2

   2  i 1
n
- pentru o serie de frecvenţe absolute:

 x i  x 
k 2
 ni
2 i 1
  
k
 ni
i 1

- pentru o serie de frecvenţe relative:

 x i  x 
k 2
 n *i
   2  i 1
100

☺ Exemplul 4
Fie 2 serii:

S1: 1 2 3 4 5 6

S2: 101 102 103 104 105 106

Cele două serii au aceeaşi amplitudine, aceeaşi abatere medie liniară şi aceeaşi abatere medie
pătratică. Cu toate acestea, împrăştierea din seria A este mai mare decât cea din seria B.
Este foarte dificil să comparăm serii de date după caracteristici exprimate prin aceeaşi
unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.
Abaterea medie pătratică are aceeaşi semnificaţie ca şi abaterea medie liniară, dar ea
obţinându-se prin ridicarea la pătrat a abaterilor individuale de la tendinţa centrală (medie)
înlătură dezavantajul acordării aceleiaşi importanţe atât abaterilor mari cât şi celor mici.
Abaterea medie pătratică are aceeaşi unitate de măsură cu a caracteristicii studiate, de
aici provenind dezavantajul că nu pot fi comparate colectivităţi după caracteristici exprimate
prin unităţi de măsură diferite.
Deoarece x  x p rezultă că d   .
În cazul unei serii de distribuţie de frecvenţe simetrică sau uşor asimetrică, adică pentru
o serie cu tendinţă de normalitate între abaterea medie liniară şi abaterea medie pătratică
există relaţia:
d  0,8  

☺ Exemplu 5
Se utilizează datele din Exemplul 2.

   2  14475  120,31 RON / salariat

d  96,5 RON / salariat

d 96,5
  0,8  seria este simetrică adică are o repartiţie normală.
 120,31

Abaterea medie pătratică este un indicator care ne oferă informaţii privind modul de
împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o regulă empirică spune:
 
- 68,37% din termenii unei serii se situează în intervalul x  , x   ;

- 98,45% din termenii unei serii se situează în intervalul x  2, x  2;

- 99,73% din termenii unei serii se situează în intervalul x  3, x  3;

- 99,94% din termeni se găsesc în intervalul x  4, x  4


Abaterea medie pătratică este un indicator deosebit de util la estimarea erorilor de
selecţie, la calcule de corelaţie precum şi la orice comparaţie statistică în timp şi spaţiu.
Coeficientul de variaţie este cel mai utilizat şi mai semnificativ indicator pentru
analiza variaţiei. Se calculează ca raport între abaterea medie pătratică sau liniară şi medie.
 d
v  100 sau v'   100
x x
v  v’
Coeficientul de variaţie se exprimă procentual, deci putem aprecia că el reprezintă
exprimarea relativă a lui  sau a lui d .
Dacă v = 0 seria este perfect omogenă, toţi termenii seriei sunt egali între ei şi sunt egali
cu media: în acest caz nu există variaţie.
Dacă v  5%, seria este foarte omogenă, variaţia este foarte mică, media este foarte
reprezentativă, iar gruparea a fost foarte bine executată (în cazul seriilor de distribuţie de
frecvenţe).
Dacă v  35%, seria este omogenă.
Dacă v  70-75%, seria este eterogenă, variaţia este foarte mare, media nu este
reprezentativă, iar gruparea trebuie refăcută.
Testul de autoevaluare 1

1.Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre
aceste conturi. Sumele sunt date în Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) să se calculeze suma medie de bani existentă într-un cont
b) să se caracterizeze gradul de omogenitatea al seriei.

Deşi cel mai adesea coeficientul de variaţie se calculează utilizând media (deoarece
respectă cele mai multe din condiţiile impuse de Yule), acest indicator se poate calcula
utilizând şi alţi indicatori ai tendinţei centrale (mediana, mediala, modul).
Acest indicator nu se poate utiliza (adică este lipsit de semnificaţie) în cazul în care
media aritmetică este apropiată de zero sau când valorile termenilor seriei sunt foarte
apropiate.

☺ Exemplul 6
Se utilizează datele din Exemplul 2 şi Exemplul 5.

 120,31
v  100   100  49,1%  35% seria nu este omogenă
x 245

d 96,5
v'   100   100  39,3%
x 245
3. Indicatorii de asimetrie

Asimetria unei serii de distribuţie empirice poate fi determinată atât prin metoda grafică
cât şi prin calculul indicatorilor de asimetrie.
Reprezentarea grafică cea mai utilizată pentru aprecierea asimetriei este poligonul
frecvenţelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului de asimetrie, fără
a putea să-l măsoare printr-o valoare exactă.

ni ni ni

xx  Me  Mo xi Mo Me x xi x Me Mo xi

Serie perfect simetrică Serie asimetrică cu Serie asimetrică cu


(Clopotul lui Gauss) asimetrie de stânga sau asimetrie de dreapta sau
pozitivă, predomină negativă, predomină
valorile mici valorile mari
x  Me  Mo x  Me  Mo

Pentru distribuţii moderat asimetrice, între x, Me, Mo există următoarea



relaţie: Mo  x  3 Me  x 
Tipuri de repartiţii cu asimetrie pronunţată:

ni ni

0 xi 0 xi

Repartiţii în formă de J se întâlnesc în cazul în care frecvenţele sunt maxime la un capăt


sau altul al intervalului de variaţie.
ni

0 xi

Repartiţie în formă de U se întâlneşte atunci când frecvenţele maxime apar la capetele


intervalului de variaţie, iar frecvenţele minime în centrul intervalului.

ni

0
xi
Repartiţie complexă obţinută prin suprapunerea a trei repartiţii: una în formă de J şi
două moderat asimetrice. Acest tip de repartiţii apare frecvent când gruparea nu a fost
executată corect.
Indicatorii asimetriei sunt:
- asimetrie absolută:
As  x  Mo sau 
As  3 x  Me 
Aceşti indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă
dezavantajul că nu pot fi comparate din punct de vedere al asimetriei serii după caracteristici
exprimate prin unităţi de măsură diferite.
Aceşti indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în cazul
asimetriei de dreapta).
Datorită faptului că o distribuţie se caracterizează şi prin variabilitate, pentru aceeaşi
asimetrie absolută, o serie care are variabilitatea mai mică va fi mai pronunţat oblică, iar
pentru una cu variabilitatea mai mare, oblicitatea se va atenua.
- asimetrie relativă:
De aceea se calculează coeficientul de asimetrie propus de Pearson (statistician
englez 1857-1936):
x  Mo
Cas    1, 1

Dacă Cas = 0 seria este perfect simetrică:
x  Me  Mo

Dacă Cas  0 seria prezintă asimetrie pozitivă sau de stânga:


x  Me  Mo (predomină valorile mici)
Dacă Cas  0 seria prezintă asimetrie negativă sau de dreapta:
x  Me  Mo (predomină valorile mari)

Cu cât Cas este mai apropiată de 1 seria este mai asimetrică.


Dacă Cas  [-0,3; 0,3] seria este uşor sau moderat asimetrică.
Acest coeficient este recomandat numai pentru serii de repartiţie uşor asimetrice.
Dacă se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula cu relaţia:

Cas 

3 x  Me 
  3, 3

Acest indicator este recomandat numai pentru serii de repartiţie uşor asimetrice când
între cei trei indicatori ai tendinţei centrale există relaţia:

Mo  x  3 Me  x 
Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se apropie
de extremităţile intervalului, asimetria devine mai pronunţată.
Aceşti doi indicatori ai asimetriei sunt cei mai utilizaţi în practică, dar în afară de aceştia
se mai utilizează şi alţi indicatori.

☺ Exemplul 7
Se utilizează datele din Exemplul 2.

As  x  Mo  245  266,66  21,55 RON  0  asimetrie negativă sau de dreapta

1 10
Mo  x 0  h   200  100   266,66
1   2 10  5

Mo 200, 300

x  Mo  21,66
Cas    0,18  0
 120,31
Cas   0,3, 0,3  seria este uşor asimetrică, cu asimetrie negativă sau de dreapta, deci

predomină salariaţii cu prime mari. x  Me  Mo

☺ Exersaţi în … Excel
Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De
asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute
de studenţi la examen au fost următoarele:

8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6

Rezolvare folosind EXCEL:

1. Se introduc datele. În A1 tastaţi „Nota“.


2. Apăsaţi Tools/Data Analysis şi Descriptive Statistics.
3. Introduceţi Input Range (A1:A101) conţinând şi numele variabilei. Selectaţi Labels in First
Row.
4. Apăsaţi Summary Statistics şi OK.

Se obţin rezultatele:
Note

Mean 7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100

Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este
8,4 (Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură
valoare.
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10.
Amplitudinea (diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este
2,15 (Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj
statistic) este 0,215 (Standard Error).
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic
asimetrică negativ, curba fiind alungită spre stânga.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie
leptocurtică).

Testul de autoevaluare 2

Pentru 200 de agenţi economici se cunosc datele:

Grupe de agenţi economici după mărimea Structura agenţilor economici


profilului (mil. lei) (%)

sub 6 10
6-12 22
12-18 25
18-24 23
24-30 17
30 şi peste 3

Total 100
Se cere:
a) să se aprecieze dacă media e reprezentativă;
b) caracterizaţi asimetria distribuţiei;
c) să se calculeze media şi dispersia caracteristicii „profitul ≥18 mil lei”.

Testul de autoevaluare 3
1.Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă
dintr-un an se prezintă astfel:

Zile concediu 14 15 16 17 18 19 20
Nr. salariaţi 2 6 10 15 8 5 4
Se cere:
a) să se calculeze indicatorii sintetici ai variaţiei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile de
concediu mai mare sau egal cu 17”.

2.Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un
magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:

Calorii 75-85 85-95 95-105 105-115 115-125


Nr. cutii cu
5 10 15 14 6
brânză topită
Se cere:
a) să se aprecieze omogenitatea seriei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “cutii de brânză care au sub 95 de
calorii”

4. Răspunsuri şi comentarii la testele de autoevaluare

Testul de autoevaluare 1

Notăm cu xi = suma existentă în contul i


i  1, 10
a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:
10
 xi
150  175  195  200  235  240  250  256  275  294
x  i 1  
10 10
2270
  227 Euro
10
b) Gradul de omogenitate al seriei se apreciază prin coeficienţii de variaţie (v, v’).
 45,68
v  100   100  20,12%
x 227
d 37,6
v'   100   100  16,56%
x 227
   2  2086,889  45,68

 x 
10
2
i x
2  i 1
 2086,889
10
Deoarece v, v’  35%, apreciem că seria este omogenă, variaţia este mică, media este
reprezentativă.

Testul de autoevaluare 2

1. a) Pentru a aprecia dacă media este reprezentativă, vom utiliza coeficientul de variaţie.
Pentru a calcula coeficientul de variaţie trebuie mai întâi să calculăm media şi abaterea medie
pătratică.
6

x n i i
x i 1
6

n
i 1
i

*
Putem lucra cu relaţia de mai sus dacă calculăm din ni (din ipoteza, din tabel) şi

n i  200 (din enunţ) pe ni .


ni
ni   100 , rezultă:
*

 ni
10
n1   200  20 agenţi economici;
100
22
n2   200  44
100
25
n3   200  50
100
23
n4   200  46
100
17
n5   200  34
100
3
n6   200  6
100
xi reprezintă centrele de interval
sau putem calcula media utilizând relaţia:
6

x n *
i i
3  10  9  22  15  25  21  23  27  17  33  3
x i 1
  16,44 mil. lei
100 100
Profitul mediu al unui agent economic este egal cu 16,44 mil lei.
Centrele de interval xi se determină ca o medie aritmetică simplă a capetelor fiecărui
interval. Rezultatele sunt prezentate în tabelul următor

Mărimea profitului (mil lei) Frecvenţe relative ni*(%) Centre de interval xi


0-6 10 3
6-12 22 9
12-18 25 15
18-24 23 21
24- 17 27
30-36 3 33
Total 100 -
Indicatorul cu ajutorul căruia se apreciază dacă media e reprezentativă este coeficientul de
variaţie.
 7,92
v  100   100  48,17%
x 16,44
   2  62,726 4  7,92 mil.lei
 x 
6
2
 x  ni*
i
(3  16,44) 2  10  (9  16,44) 2  22 
2  i 1

100 100
 (15  16,44)  25  ( 21  16,44)  23  ( 27  16,44) 2  17  (33  16,44) 2  3
2 2

100
 62.7264
Interpretarea coeficientului de variaţie 35%<v≤75% media e slab reprezentativă.
b) Asimetria se caracterizează cu ajutorul indicatorilor de asimetrie propuşi de Pearson.

- asimetria absolută: as  x  Mo =16,44-15,6=0,84 mil. lei


- coeficientul de asimetrie:
as 0,84
Cas    0,106
 7,92
Cas >0 deci avem serie uşor asimetrică cu asimetrie pozitivă sau de stânga, deci predomină
agenţii economici cu valori mici ale profitului.
c) media şi dispersia caracteristicii „profitul≥18 mil lei”
Avem o caracteristică alternativă sau binară:
- profitul ≥18 mil lei
- profitul <18 mil lei

Varianta xi Frecvenţele relative ( ni*


)
DA (profitul ≥18 mil lei) 1 m = 43
NU (profitul <18 mil lei) 0 n – m = 57
Total - n = 100
Media caracteristicii alternative:
m 43
w   0,43 
n 100
43% dintre agenţii economici au profitul ≥18 mil.lei.
Dispersia caracteristicii alternative:
 w2  w(1  w)  0,43  (1  0,43)  0,2451

Testul de autoevaluare 3
1. a) Pentru a calcula indicatorii sintetici ai variaţiei, va trebui să calculăm mai întâi
media – care se calculează ca o medie aritmetică ponderată:
7
 xini
14  2  15  6  16  10  17  15  18  8  19  5  20  4
x  i 1  
7 50
 ni
i 1
852
  17,04 zile concediu
50
Indicatorii sintetici ai variaţiei sunt:
- abaterea medie liniară:
7
 xi  x  ni 14  17,04  2  15  17,04  6  16  17,04  10
d  i 1  
7 50
 ni
i 1
17  17,04  15  18  17,04  8  19  17,04  5  20  17,04  4
 
50
58,64
  1,1728 zile
50
Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de
zile de concediu cu  1,1728 zile.
- dispersia:

 x i  x 
7 2
 ni
 2 i 1

14  17,042  2  15  17,042  6 
7 50
 ni
i 1


16  17,042  10  17  17,042  15  18  17,042  8 
50


19  17,04 2
 5  20  17,042  4 115,92
  2,3184
50 50
- abaterea medie pătratică:

   2  2,3184  1,5226 zile

Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de


zile de concediu cu  1,5226 zile.
- coeficientul de variaţie:
 1,5226
v  100   100  8,93%
x 17,04
d 1,1728
v'   100   100  6,88%
x 17,04
Deoarece v, v’  35%  seria este omogenă, variaţia este mică, media este
reprezentativă.
b) Aprecierea asimetriei:

x  Mo 17,04  17
Cas    0,026
 1,5226
Deoarece Cas  0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se
găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale
caracteristicii.
Cas  [-0,3; 0,3]  seria este uşor asimetrică (Cas este foarte apropiat de zero).
c) Avem o caracteristică alternativă:
- salariaţi care au avut un concediu  17 zile;
- salariaţi care au avut un concediu  17 zile.
Frecvenţele absolute
Varianta xi
ni
DA (peste 17 zile) 1 m = 32
NU (sub 17 zile) 0 n – m = 18
Total - n = 50

Media caracteristicii alternative:


m 32
w   0,64 
n 50
64% dintre salariaţi au avut un concediu  17 zile
Dispersia caracteristicii alternative:
 2w  w(1  w)  0,64  (1  0,64)  0,2304

2. Se observă că avem o serie de repartiţie de frecvenţă pe intervale egale.


Notăm cu: xi = numărul de calorii
ni = numărul de cutii de brânză topită
Media – se calculează ca o medie aritmetică ponderată
xi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita
inferioară şi limita superioară a fiecărui interval:
5
 xini
80  5  90  10  100  15  110  14  120  6 5060
x  i 1    101,2 calorii
5 50 50
 ni
i 1
Omogenitatea seriei se apreciază cu ajutorul coeficientului de variaţie:
 11,6
v  100   100  11,46%
x 101,2
   2  134,56  11,6 calorii
 x i  x 
5 2
 ni
2 i 1 6728
    134,56
5 50
 ni
i 1
Deoarece v  35%  seria este omogenă, variaţia este mică, media este reprezentativă.
b) Gradul de asimetrie:
x  Mo 101,2  103,33
Cas    0,18
 11,6

Deoarece Cas  0  seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic
mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de
brânză cu multe calorii.
Cas  [-0,3; 0,3]  seria este uşor asimetrică.
c) Avem o caracteristică alternativă:
- cutii care au sub 95 calorii;
- cutii care au peste 95 calorii.
Frecvenţele absolute
Varianta xi
ni
DA (sub 95 calorii) 1 m = 15
NU (peste 95 calorii) 0 n – m = 35
Total - n = 50
Media caracteristicii alternative:
m 15
w   0,3 
n 50
30% dintre cutii au sub 95 calorii.
Dispersia caracteristicii alternative:
 2w  w(1  w)  0,3  (1  0,3)  0,21

5. Teme de control

1. Presupunând că la fiecare termen al unei serii se adaugă aceeaşi constantă “a”:


a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia, dar abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?

2. Presupunem că fiecare termen al unei serii se multiplică cu aceeaşi constantă “k”:


a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia şi abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?

3. Preţurile de vânzare pentru un calculator ştiinţific cu aceleaşi caracteristici, fabricat de


aceeaşi firmă, au fost înregistrate în 20 de magazine. Rezultatele sunt redate mai jos şi sunt
exprimate în lei:
10,50 12,75 11,00 16,50 19,30 20,00 16,50 13,90 17,50 18,00
13,50 17,75 18,50 20,00 15,00 14,45 17,85 15,00 17,50 13,50
Se cere:
a) să se caracterizeze gradul de asimetrie al seriei;
b) să se caracterizeze gradul de variaţie al seriei;

4.Despre angajaţii unei sucursale a unei bănci comerciale se cunosc datele:


Grupe de salariaţi după vechime (ani) Nr. salariaţi
0–4 2
4–8 6
8 – 12 10
12 – 16 8
16 - 20 4
Total 30
Se cere:
a) să se verifice dacă distribuţia salariaţilor după vechime este omogenă;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “salariaţi cu vechimea sub vechimea
medie”.

5.Un studiu privind durata de viaţă în ore a unui produs electrocasnic efectuat pe 100 aparate
a condus la următoarele rezultate:
Durata de viaţă (ore) Structura numărului de aparate electrocasnice
0 – 1000 8
1000 – 2000 20
2000 – 3000 26
3000 – 4000 22
4000 – 5000 18
5000 - 6000 6
Total 100
Se cere:
a) să se aprecieze dacă media este reprezentativă;
b) să se caracterizeze gradul de asimetrie;
c) să se determine media şi dispersia caracteristicii “aparate care au durata de viaţă mai
mică de 3000 ore”.

6. În tabelul următor este prezentată repartiţia gospodăriilor dintr-o localitate în funcţie de


numărul de copii:
Nr. copii 0 1 2 3 4 5 6 7 8
Nr. gospodării 286 380 416 258 112 62 47 12 7
Se cere:să se calculeze numărul mediu de copii pe gospodărie şi să se verifice dacă
media este reprezentativă;

6. Rezumatul Unităţii de învăţare

Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa unui număr mare
de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat indicator al tendinţei
centrale, să nu fie suficientă pentru analiza acestor fenomene. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.
Indicatorii variaţiei pentru o serie statistică se clasifică în:
 indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor una
faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;
 indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul lor,
sintetizând într-o singură valoare întreaga împrăştiere din serie.
Cu ajutorul indicatorilor variaţiei putem:
 studia reprezentativitatea mediei pentru o serie de date;
 aprecia gradul de omogenitate a seriei;
 caracteriza gradului de variaţie a unei serii;
 compara în timp şi spaţiu a mai multor serii de repartiţie pentru aceeaşi caracteristică sau
pentru caracteristici diferite care au fost înregistrate pentru aceeaşi colectivitate;
 cunoaşte gradul de influenţă a factorilor după care s-a efectuat gruparea;
 cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia normală

7. Bibliografia Unităţii de învăţare

1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004
2. Danciu A.,Niculescu I., Gruiescu M., Statistică economică, Editura Enciclopedică,
Bucureşti, 2009
3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistică, Editura Universitară, Bucureşti, 2003;
4. Voineagu V., Ţiţan E., Ghiţă S., Boboc C., Todose D. – Statistică. Baze teoretice şi
aplicaţii, Editura Economică, Bucureşti, 2007;
5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995

S-ar putea să vă placă și