Sunteți pe pagina 1din 39

TEMA

INDICATORII VARIAȚIEI
PLAN:

1. ROLUL INDICATORILOR VARIAȚIEI. INDICATORII


SIMPLI AI VARIAȚIEI

2. INDICATORII SINTETICI AI VARIAȚIEI


Obiectivele temei

 Să știți cum se clasifică indicatorii variației


 Să puteți calcula indicatorii variației în cazul seriilor
simple
 Să puteți calcula indicatorii variației în cazul
distribuțiilor de frecvențe (pe variante sau pe intervale)
 Sa puteți explica caracteristicile, aplicabilitatea,
aventajele și dezavantajele indicatorilor variației
 Să puteți compara variabilitatea pentru 2 sau mai multe
șiruri de valori ale variabilelor statistice
 Să puteți identifica valorile aberante din cadrul unui set
de date
Rolul indicatorilor variației. Indicatorii
simpli ai variației
Variabilitatea este o trăsătură esenţială a fenomenelor şi proceselor de
masă, iar indicatorii medii nu ne dau nici o indicaţie asupra împrăştierii,
respectiv a modului în care termenii seriei se abat între ei sau de la medie.
Media poate fi aceeaşi pentru 2 sau mai multe variabile, însă gradul de
împrăştiere a valorilor să fie total diferit.

Exemplu:
Seria I (xi): 7, 9, 8, 10, 8, 6, 13, 11 X 9

Seria II (yi): 3, 11, 12, 5, 7, 6, 15, 13 Y 9

Aceiași medie dar o


dispersie diferită
Indicatorii variației tocmai oferă informații cu privire la variabilitatea,
dispersarea sau împrăștierea valorilor unei serii.

Indicatorii variaţiei asigură:


 verificarea gradului de omogenitate a colectivităţii şi implicit a
reprezentativităţii mediei;
 caracterizarea formei de repartiţie şi a variaţiei unei caracteristici;
 testarea corectitudinii efectuării grupării datelor;
 compararea gradului de variaţie pentru doua şi mai multe serii de
repartiţie

După complexitate sau numărul termenilor implicaţi în calcul, deosebim:


 Indicatori simpli ai variației
 Indicatori sintetici ai variației
Indicatorii simpli ai variaţiei
Caracterizează gradul de împrăştiere a termenilor unei serii statistice,
utilizând în calcul doar două valori ale seriei.

Amplitudinea variaţiei (A) în engleza – Range

în mărimi absolute A  X max  X min

A  14  1  13
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Neajunsuri ale Amplitudinii variației

 Amplitudinea ignoră modul în care sunt distribuite valorile în cadrul seriei

7 8 9 10 11 12 7 8 9 10 11 12
A = 12 – 7 = 5 A = 12 – 7 = 5

 Amplitudinea este sensibilă faţă de valorile aberante

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
A=5–1=4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
A = 120 – 1 = 119
Amplitudinea intercuartilică (AQ) calculată ca diferență dintre cuartila
superioară și cea inferioară. (în engleza – IQR – Interquartile Range)

AQ  Q3  Q1
Prin calcularea abaterii intercuartilice sunt eliminate unele neajunsuri în
analiză aduse de valorile aberante ale seriei.

Xmin Q1 Q2=Me Q3 Xmax


25% 25% 25% 25%

12 30 45 57 70

AQ= 57 – 30 = 27

Diagrama Box Plot


Abaterea individuală de la medie (di) arată cu cât este mai mare sau
mai mica fiecare valoare a seriei decât media. (în engleza – d – Deviations
from the mean)

în mărimi absolute d i  xi  X

xi  X
în mărimi relative di %  100
X

Suma abaterilor individuale de la medie este 0


n n

 d   ( x  X ) 0
i 1
i
i 1
i
Indicatorii sintetici ai variației
Abaterea medie liniară (d ) se calculează ca medie aritmetica a
abaterilor individuale de la medie luate în
modul. (în engleza – AD – Average Deviation)

n n

d i x X i
pentru seria simplă d i 1
 i 1
n n
r r

d i  ni  x  X n
i i
pentru seria de frecvenţe d i 1
 i 1
n n
 Exprimă cu cât în mediu se abat valorile seriei de la media aritmetica
calculată pentru întreaga serie
 Forma de exprimare este cea în care se exprimă caracteristica studiată
Dispersia sau varianța ( S 2 ) (în engleza – S2 – Variance)

n n

 i
d 2
 i
( x  X ) 2

pentru seria simplă S2  i 1


 i 1
n 1 n 1

r r

 i  ni
d 2
 i
( x  X ) 2
 ni
pentru seria de frecvenţe S2  i 1
 i 1
n 1 n 1
Dispersia poate fi calculata şi în baza metodei momentelor

 i
x 2

(  xi ) 2

pentru seria simplă


S 
2 n
n 1

 i i
x 2
n 
(  x n
i i ) 2

pentru seria de frecvenţe


S 
2 n
n 1
Abaterea medie pătratică (S ) (în engleza – S – Standard Deviation)

 i
d 2

pentru seria simplă


S i 1
 S2
n 1
n

 i  ni
d 2

pentru seria de frecvenţe S i 1


 S2
n 1
 Exprimă cu cât în mediu se abat valorile seriei de la media aritmetica
calculată pentru întreaga serie
 Fiecare termen al seriei este utilizat în calculul
 O importanță mai mare se acordă valorilor îndepărtate de medie
(deoarece abaterile de la medie sunt ridicate la pătrat)
Coeficientul variației (V) este o mărime relativă a nivelului de variaţie a
și măsoară gradul de omogenitate a valorilor unei variabile
(in engleză – CV – Coefficient of Variation)
S
V  100
X
 Exprimă variația relativă față de medie
 Se exprimă în procente
 Oferă posibilitatea comparării gradului de variaţie pentru 2 şi mai multe
serii
 Cu cit valoarea acestui indicator se apropie de 0 cu atât gradul de
variaţie este mai mic.
 Daca V<35% atunci valorile seriei sunt omogene, media calculată este
reprezentativă şi dacă datele au fost grupate procedeul de grupare este
bine realizat.
Seria I Seria II
xi yi
7 3
9 11
8 12
10 5
8 7
6 6
13 15
11 13

Se cere: Comparați aceste 2 serii din perspectiva variației valorilor. Pentru


care serie media valorilor este reprezentativă?
Seria I Seria II
xi yi
7 3
9 11
8 12
10 5
8 7
6 6
13 15
11 13

Amplitudinea variaţiei A  X max  X min

A x  13  6  7 A y  15  3  12
Seria I Seria II
xi yi
7 3
9 11
8 12
10 5
8 7
6 6
13 15
11 13

Abaterile individuale de la medie di  ?

d i  xi  X
Seria I Seria II
xi di yi di
7 3
9 11
8 12
10 5
8 7
6 6
13 15
11 13
Total 72 Total 72

X
 x i

72
9 Y 
 y i

72
9
n 8 n 8
Seria I Seria II
xi di yi di
7 -2 3 -6
9 0 11 2
8 -1 12 3
10 1 5 -4
8 -1 7 -2
6 -3 6 -3
13 4 15 6
11 2 13 4
Total 72 0 Total 72 0

X 9 Y 9
Seria I Seria II
xi di yi di
7 -2 3 -6
9 0 11 2
8 -1 12 3
10 1 5 -4
8 -1 7 -2
6 -3 6 -3
13 4 15 6
11 2 13 4
Total 72 0 Total 72 0

Dispersia S2  ? S2 
 i
d 2

n 1
Abaterea medie pătratică S ? S  S2
S
Coeficientul variației V ? V  100
X
Seria I Seria II
xi di di 2 yi di di 2
7 -2 4 3 -6 36
9 0 0 11 2 4
8 -1 1 12 3 9
10 1 1 5 -4 16
8 -1 1 7 -2 4
6 -3 9 6 -3 9
13 4 16 15 6 36
11 2 4 13 4 16
Total 72 0 36 Total 72 0 130
Seria I Seria II
xi di di 2 yi di di 2
7 -2 4 3 -6 36
9 0 0 11 2 4
8 -1 1 12 3 9
10 1 1 5 -4 16
8 -1 1 7 -2 4
6 -3 9 6 -3 9
13 4 16 15 6 36
11 2 4 13 4 16
Total 72 0 36 Total 72 0 130

X
 x i

72
9
n 8

S x2 
 d 2
i

36
 5,14
n 1 7
S x  S x2  5,14  2,27
Sx 2,27
Vx  100  100  25,1%
X 9
Seria I Seria II
xi di di 2 yi di di2
7 -2 4 3 -6 36
9 0 0 11 2 4
8 -1 1 12 3 9
10 1 1 5 -4 16
8 -1 1 7 -2 4
6 -3 9 6 -3 9
13 4 16 15 6 36
11 2 4 13 4 16
Total 72 0 36 Total 72 0 130

72 72
X 9 Y  9
8 8
36 130
S x2   5,14 S y2   18,57
7 7
S x  5,14  2,27 S y  18,57  4,31
Valorile Seriei I sunt mai
2,27 omogene. Vx <30%, astfel 4,31
Vx  100  25,2% Vy  100  47,9%
9 media este reprezentativă 9
Exemplu: Este dată repartiţia veniturilor lunare ale unor persoane
Venitul Numărul
(mii $) pers.
ni
2-4 10
4-6 16
6-8 25
8-10 15
10-12 9
12-14 5
Total 80
Se cere: Calculați indicatorii variației. Trageți concluzie privind variația
veniturilor
Amplitudinea variaţiei A? A  X max  X min

A  14  2  12 mii$
Venitul Numărul
(mii $) pers.
ni
2-4 10
4-6 16
6-8 25
8-10 15
10-12 9
12-14 5
Total 80

Abaterile individuale de la medie di  ? d i  xi  X


r r

 x n  x n
i i i i r
X
n

i 1
n i
i 1
unde n
i 1
i n
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni
ni xi
2-4 10 3 30
4-6 16 5 80
6-8 25 7 175
8-10 15 9 135
10-12 9 11 99
12-14 5 13 65
Total 80 584

Abaterile individuale de la medie d i  xi  X


r

 x n i i
584
X i 1
  7,3 mii$ / pers
n 80
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di
ni xi
2-4 10 3 30 -4,3
4-6 16 5 80 -2,3
6-8 25 7 175 -0,3
8-10 15 9 135 1,7
10-12 9 11 99 3,7
12-14 5 13 65 5,7
Total 80 584

Abaterile individuale de la medie d i  xi  X

X  7,3 mii$ / pers


Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di
ni xi
2-4 10 3 30 -4,3
4-6 16 5 80 -2,3
6-8 25 7 175 -0,3
8-10 15 9 135 1,7
10-12 9 11 99 3,7
12-14 5 13 65 5,7
Total 80 584
r

d i  ni
Abaterea medie liniară d ? d i 1
n
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di |di|*ni
ni xi
2-4 10 3 30 -4,3 43
4-6 16 5 80 -2,3 36,8
6-8 25 7 175 -0,3 7,5
8-10 15 9 135 1,7 25,5
10-12 9 11 99 3,7 33,3
12-14 5 13 65 5,7 28,5
Total 80 584 174,6
r

d i  ni
174,6
Abaterea medie liniară d i 1
  2,18 mii$
n 80
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di |di|*ni
ni xi
2-4 10 3 30 -4,3 43
4-6 16 5 80 -2,3 36,8
6-8 25 7 175 -0,3 7,5
8-10 15 9 135 1,7 25,5
10-12 9 11 99 3,7 33,3
12-14 5 13 65 5,7 28,5
Total 80 584 174,6

d i
2
 ni
Dispersia S2  ? S2  i 1
n 1
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di |di|*ni di2*ni
ni xi
2-4 10 3 30 -4,3 43 184,9
4-6 16 5 80 -2,3 36,8 84,64
6-8 25 7 175 -0,3 7,5 2,25
8-10 15 9 135 1,7 25,5 43,35
10-12 9 11 99 3,7 33,3 123,21
12-14 5 13 65 5,7 28,5 162,45
Total 80 584 174,6 600,8

d i
2
 ni
600,8
Dispersia  2 i 1
  7,61
n 1 79
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni xi2*ni
ni xi
2-4 10 3 30 90
4-6 16 5 80 400
6-8 25 7 175 1225
8-10 15 9 135 1215
10-12 9 11 99 1089
12-14 5 13 65 845
Total 80 584 4864

 xi ni 
2 (  x n
i i ) 2

metoda momentelor S2  n
n 1
584 2
4864 
80 600,8
S 
2
  7,61
79 79
Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di |di|*ni di2*ni
ni xi
2-4 10 3 30 -4,3 43 184,9
4-6 16 5 80 -2,3 36,8 84,64
6-8 25 7 175 -0,3 7,5 2,25
8-10 15 9 135 1,7 25,5 43,35
10-12 9 11 99 3,7 33,3 123,21
12-14 5 13 65 5,7 28,5 162,45
Total 80 584 174,6 600,8

Abaterea medie pătratică S ?

S  S 2  7,61  2,76 mii$


Venitul Numărul mijlocul
(mii $) pers. intervalului xi*ni di |di|*ni di2*ni
ni xi
2-4 10 3 30 -4,3 43 184,9
4-6 16 5 80 -2,3 36,8 84,64
6-8 25 7 175 -0,3 7,5 2,25
8-10 15 9 135 1,7 25,5 43,35
10-12 9 11 99 3,7 33,3 123,21
12-14 5 13 65 5,7 28,5 162,45
Total 80 584 174,6 600,8

Coeficientul variației V ?
S 2,76
V  100  100  37,7%
X 7,3
V>35% valorile variabilei sunt neomogene și media (7,3 mii $/pers.) este
nereprezentativă
Determinarea valorilor aberante (în engleza – Outliers)
29 34
Q1=25
20 25 25 26 28 30 32 33 37 57 Q3=34
Me=29
Q1 Me Q3

20 25 30 35 40 45 50 55
Determinarea valorilor aberante (în engleza – Outliers)
29 34
Q1=25
20 25 25 26 28 30 32 33 37 57 Q3=34
Me=29
Q1 Me Q3

20 25 30 35 40 45 50 55

Amplitudinea intrercuartilică Limita inferioară admisă Limita superioară admisă


AQ= Q3 – Q1 Q1 – 1,5*AQ Q3 + 1,5*AQ
AQ= 34 – 25 = 9 25 – 1,5*9 = 11,5 34 + 1,5*9 = 47,5
Determinarea valorilor aberante (în engleza – Outliers)

20 25 25 26 28 30 32 33 37 57

20 25 30 35 40 45 50 55
Regula Empirică

Dacă distribuția de frecvențe a unei variabile este normală (are forma unui
clopot), adică histograma frecvențelor este unimodală și aproximativ
simetrică atunci:

 aproximativ 68% din valorile variabilei se vor încadra în intervalul µ±1σ

68%

μ
μ  1σ
 aproximativ 95% din valorile variabilei vor fi distanțate la 2 abateri
standard de la medie, vor aparține intervalului µ±2σ
 aproximativ 99,7% din valorile variabilei vor aparține intervalului µ±3σ

95% 99,7%

μ  2σ μ  3σ

S-ar putea să vă placă și