Sunteți pe pagina 1din 8

Curs 6

Variabilitatea

II. Indicatori sintetici ai variabilităţii

1. Abaterea medie liniară ( d ) se determină ca medie aritmetică a abaterilor individuale,


considerate în valoare absolută:
n

x
r r
i x  x i  x ni x i  x ni*%
d  i 1
sau d i 1
r
 i 1

n
n
100
i
i 1

d se exprimă în unitatea de măsură a variabilei;


d arată cu cât se abat, în medie, valorile individuale de la media lor ;
d nu poate fi utilizată în calcule algebrice;
d acordă aceeaşi importanţă atât abaterilor mici cât şi abaterilor mari ale valorilor de la
media lor, însă variabilitatea datelor este afectată, în mod deosebit, de abaterile mari de la
medie.

2. Dispersia (variance, în engl.) se determină ca medie aritmetică a pătratelor abaterilor


individuale.

Formula de calcul a dispersiei este:


ESTIMATOR PARAMETRU
(Dispersia variabilei în eşantion, (Dispersia variabilei în populaţia statistică)
sample variance, în engl.)

 x  x
n N
2
 x  
2
i i

s2  i 1 2  i 1

n 1 N

În cazul datelor sistematizate dispersia se determină astfel:

1
 x  x n
r
2
i i
i 1
s2 
n 1

Dispersia este cel mai utilizat indicator pentru analiza variabilităţii datelor datorită
proprietăţilor sale algebrice;
Dispersia acordă o importanţă mai mare abaterilor individuale mari (prin calcularea
pătratului abaterilor), sintetizând astfel mai fidel variabilitatea datelor;
Dispersia are o unitate de măsură dificil de interpretat (prin determinarea pătratelor
abaterilor individuale sunt ridicate la pătrat şi unităţile de măsură ale variabilei)
În cazul eşantioanelor de volum mare ( n  30 ), putem lua în calcul următoarea aproximare
n 1  n , dispersia în eşantion fiind:

 x 
n
2
i x
i 1
s2 
n
Dispersia se poate determina şi prin metoda momentelor (dispersia este momentul centrat
de ordinul 2 şi se calculează ca diferenţă dintre momentul iniţial de ordinul 2 şi pătratul
momentului iniţial de ordinul 1):
2
n
 n n

 x  x   xi
2
i
2
i 
  i1 
2
s 
2 i 1
x  i 1
n n  n 
 
 

3. Abaterea/deviaţia standard (standard deviation, în engl.) reprezintă rădăcina pătrată a


dispersiei.

Abaterea standard determinată la nivelul eşantionului (sample standard deviation, în engl.) –


estimator este:

 x   x 
n n
2 2
i x i  x  ni
s  s2  i 1
sau s  s 2  i 1

n 1 n 1
Abaterea standard a variabilei în populaţia statistică – parametru este:

2
N

 x  
2
i
  2  i 1

Abaterea standard (numită şi abatere medie pătratică) este cel mai utilizat indicator de
caracterizare a împrăştierii datelor, fiind un parametru al repartiţiei normale;
Între indicatorii variabilităţi abatere medie liniară ( d ) şi abatere standard ( s ) există
următoarea relaţie:
4
d  s, d  s
5
Abaterea standard are unitatea de măsură a variabilei;
În dezvoltarea teoriei statistice, majoritatea modelelor tradiţionale sunt bazate pe
distribuţii descrise de media aritmetică şi abaterea standard;
În analizele financiare abaterea standard este considerată o măsură a „riscului”:
Exemplu: Considerând două proiecte de investiţii, A şi B, pentru care profiturile medii sunt
aproximativ egale, iar deviaţia standard a proiectului A este de 3000 Eur şi deviaţia standard a
proiectului B este de aproximativ 7000 Eur, atunci investiţia prudentă (cu un risc mai redus) este
investiţia cu deviaţia standard mai mică, adică investiţia A.

4. Coeficientul de variaţie reprezintă expresia relativă a variabilităţii, fiind calculat ca raport


între abaterea standard şi medie:

s
v 100
x
Indicatorii sintetici ai variabilităţii, exprimaţi în mărimi absolute, nu permit realizarea
comparaţiilor între serii statistice, din perspectiva variabilităţii/omogenităţii datelor;
Variabilitatea depinde de ordinul de mărime al datelor chiar şi pentru variabilele
exprimate în aceeaşi unitate de măsură;
Exprimarea în mărime relativă a variabilităţii, prin intermediul coeficientului de variaţie,
face posibilă compararea seriilor statistice din punctul de vedere al variabilităţii;
Omogenitatea ridicată a datelor este asigurată de valori mici ale coeficientului de variaţie;
Dacă două serii statistice au coeficienţi de variaţie diferiţi, seria care are coeficientul de
variaţie mai mic este mai omogenă;
Seriile pentru care v  30-35% sunt considerate omogene (cu variabilitate redusă), cu
medii reprezentative care caracterizează corect tendinţa centrală a seriei.

3
Coeficientul de variaţie nu se poate calcula dacă media este nulă ( x  0 ), iar pentru valori
ale mediei apropiate de zero, valoarea coeficientului de variaţie poate să fie lipsită de
semnificaţie.

Considerăm exemple prezentate anterior (în cazul variabilelor numerice) pentru a


arăta modul de calcul al indicatorilor variabilităţii.

Exemplul 3. Distribuţia celor 120 de salariaţi ai firmei Papirus în funcţie de numărul copiilor minori
în întreţinere:
Număr copii
Număr
minori în
salariaţi d i  ( xi  x)  ni xi  x  ni
întreţinere Fci ( xi  x) 2  ni
( ni )
( xi )
0 10 (0-2,25)*10 = -22,5 10 22,5 50.625
1 20 (1-2,25)*20 = -25 30 25 31.25
2 35 (2-2,25)*35 = -8,75 65 8,75 2.1875
3 40 (3-2,25)*40 = 30 105 30 22.5
4 15 (4-2,25)*15 =26,25 120 26,25 45.9375
Total 120 0 - 112,5 152,5

Indicatorii variabilităţii determinaţi sunt:


1. Amplitudinea absolută
Ax = xmax — xmin = 4 - 0 = 4 copii
2. Abaterea individuală pentru o serie de distribuţie de frecvenţe

 x  x  n
n
d i  ( xi  x)  ni , i  1,5 , x  2.33 , i i 0
i 1

3. Abaterea intercuartilică
AI  Q3  Q1 = 3-2 = 1

LocQ1 
1
n  1  30.25, LocQ3  3 n  1  90.75
4 4
primaFci  65  LocQ1  30.25, primaFci  105  LocQ3  90.75

Q1 = 2 copii, Q3 = 3 copii
4. Abaterea medie liniară
r

x i  x ni
112.5
d  i 1
r
  0.94  1 copil
n
120
i
i 1

4
5. Dispersia

 x 
r
2
i  x ni
152.5
s2  i 1
  1.29
n 1 119
6. Abaterea standard

s  s 2  1.29  1.1357  1 copil


7. Coeficientul de variaţie
s 1.1357
v 100  100  51%  30% , distribuţia salariaţilor în funcţie de numărul
x 2.25
minorilor în întreţinere are un grad ridicat de variabilitate, nu este omogenă, iar media
determinată nu caracterizează adecvat tendinţa centrală.

Exemplul 4. Distribuţia celor 120 de salariaţi ai firmei Papirus în funcţie de veniturile salariale este:
Centrul/
Venituri Număr
mijlocul
salariale salariaţi
intervalului d i  ( xi  x)  ni Fci xi  x  ni ( xi  x) 2  ni
(mii lei) ( ni )
( xi )
Sub 1,5
10 1,25 -10.21 10 10.21 10.42
(1,0 - 1,5]
1,5 – 2,0 40 1,75 -20.83 50 20.83 10.85
2,0 - 2,5 30 2,25 -0.62 80 0.62 0.01
2,5 – 3,0 20 2,75 9.58 100 9.58 4.59
3,0 – 3,5 15 3,25 14.69 115 14.69 14.38
Peste 3,5
5 3,75 7.40 120 7.40 10.94
(3,5 - 4,0]
Total 120 - 0 - 63,33 51,20
Notă: Limita superioară inclusă în interval

Indicatorii variabilităţii determinaţi sunt:


1. Amplitudinea absolută
Ax = xmax — xmin = 4,0 – 1,0 = 3,0 mii lei
2. Abaterea individuală pentru o serie de distribuţie de frecvenţe

 x  x  n
n
d i  ( xi  x)  ni , i  1,6 , i i 0
i 1

x  2.270833  2.27 mii lei


3. Abaterea intercuartilică
AI  Q3  Q1 = 2,77-1,76 = 1,01 mii lei

LocQ1 
1
n  1  30.25, LocQ3  3 n  1  90.75
4 4
primaFci  50  LocQ1  30.25, primaFci  100  LocQ3  90.75

5
Q1  1.5 , 2.0
Q3  2.5 , 3.0

Q1  1.75 mii lei


Q3  2.75 mii lei
4. Abaterea medie liniară
r

x i  x ni
63.33332
d  i 1
r
  0.53 mii lei
n
120
i
i 1

5. Dispersia

 x 
r
2
i  x ni
51.2
s2  i 1
  0.43
n 1 119
6. Abaterea standard

s  s 2  0.43  0.656 mii lei


7. Coeficientul de variaţie
s 0.656
v  100   100  29%  30% , distribuţia salariaţilor în funcţie de veniturile
x 2.27
salariale are un grad redus de variabilitate, este omogenă, iar media determinată
caracterizează adecvat tendinţa centrală.

Exemplul 6. Pentru un eşantion de 9 unităţi de cazare turistică dintr-o anumită regiune au fost
înregistrate date referitoare la numărul angajaţilor pe perioadă nedeterminată:
8, 6, 5, 9, 5, 8, 6, 10, 6.

Indicatorii variabilităţii determinaţi sunt:


1. Amplitudinea absolută
Ax = xmax — xmin = 10 – 5 = 5 angajaţi
2. Abaterea individuală pentru o serie simplă (date negrupate)
Număr angajaţi ( xi ) 5 5 6 6 6 8 8 9 10
Rangul/poziţia valorii xi 1 2 3 4 5 6 7 8 9

 x 
n
d i  xi  x , i  1,9 , i  x  0 , x  7 angajati
i 1

d1  x1  x  5  7  2 ; d 2  2 ; d 3  x3  x  6  7  1 ; d 4  1 ; d 5  1 ;

d 6  x6  x  8  7  1 ; d 7  1 ; d8  x8  x  9  7  2 ; d 9  x9  x  10  7  3

6
 x 
n

i x 0
i 1

3. Abaterea intercuartilică
AI  Q3  Q1 = 8,5 – 5,5 = 3 angajaţi

LocQ1 
1
n  1  2.5, LocQ3  3 n  1  7.5
4 4

56 89
Q1   5.5 , Q3   8.5
2 2
4. Abaterea medie liniară
n

x
i 1
i x
14
d   1.56
n 9
5. Dispersia

 x 
r
2
i x
26
s2  i 1
  3.25
n 1 8
6. Abaterea standard

s  s 2  3.25  1.8  2 angajaţi


7. Coeficientul de variaţie
s 1.8
v  100   100  26%  30% , seria referitoare la numărul angajaţilor unităţilor de
x 7
cazare turistică din eşantion fiind omogenă, iar media determinată caracterizează adecvat
tendinţa centrală.

Exemplul 7. Considerăm seria de date referitoare la preţurile de vânzare pentru 50 de loturi cu


destinaţie agricolă din judeţul Giurgiu (Eur/ha):
280 284 295 295 298 298 300 300 300 305
306 310 310 314 315 315 318 318 320 320
325 326 328 329 331 332 332 335 337 338
338 339 339 340 341 342 345 345 346 348
350 353 353 355 355 357 360 365 368 369

Indicatorii variabilităţii o fi determinaţi cu uşurinţă folosind funcţii statistice implementate de


Microsoft Office – Excel sau comenzi SPSS.

Funcţiile EXCEL utilizate sunt:


AVEDEV pentru determinarea abaterii medii liniare
VAR.S pentru determinarea estimatorului dispersiei în eşantion

7
STDEV pentru determinarea estimatorului abaterii standard în eşantion

Valorile obţinute folosind funcţiile EXCEL sunt:

d = 18.96
s2 = 514.86
s = 22.69

S-ar putea să vă placă și