Sunteți pe pagina 1din 45

C4

Indicatorii variaţiei
Analiza variabilelor numerice
Descrierea datelor

Tendința centrală Variatia

Media Amplitudine

Mediana Abateri individuale

Modul Dispersie

Deviatia standard

Coeficient de variatie
I. Indicatori simpli ai variației

1. Amplitudinea variaţiei este diferenţa dintre valorile


extreme (xmax şi xmin).
• Amplitudinea absolută:

A  xmax  xmin
• se exprimă în unitatea de măsură a variablei X.
• pentru date grupate se calculează ca diferenţă între
limita superioară a ultimei grupe şi limita inferioară a
primei grupe.
Advantaje: uşor de calculat şi interpretat.

Dezavantaje:
1. ignoră modul în care sunt distribuite datele.

7 8 9 10 11 12 7 8 9 10 11 12
A = 12 - 7 = 5 A = 12 - 7 = 5

2. depinde doar de valorile extreme => instabilă, sensibilă la


valori mari.
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
A=5-1=4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

A = 120 - 1 = 119
• Amplitudinea relativă permite comparaţii între
variabile diferite:

A
A %   100
x
x
- media aritmetică.
2. Abaterile individuale de la medie măsoară
distanţa fiecărei unităţi statistice faţă de media
colectivităţii.

• Abaterile individuale absolute (di)

di  xi  x
• Abaterile individuale relative (di%)

di
di(%)   100
x
3. Abaterea intercuartilică
AQ = Q3 −Q1
Exemplu:

Mediana
X Q1 (Q2) Q3 X maxim
minim
25% 25% 25% 25%

12 30 45 57 70

AQ= 57 – 30 = 27
II.Indicatori sintetici ai variaţiei
• arată împrăştierea tuturor valorilor variabilei →
sintetizează într-un număr toate abaterile individuale
absolute.
• măsoară variatia faţă de o valoare reprezentativă
(media).
1. Abaterea medie liniară este media aritmetică a
tuturor abaterilor individuale absolute di (indiferent de
semn):
n
- date negrupate:
 x x i
d i1
n
• date grupate, frecvenţe absolute
k

 x  x n
i i
d i1
k

n
i1
i

• date grupate, frecvenţe relative


k
d   xi  x  n *
i
i1
2. Dispersia este media abaterilor individuale ridicate la
pătrat: n _
• date negrupate :
2

(xi  x )2

σ  i1
n
• date grupate, frecvenţe absolute :
k _

2
 i
(x  x )2
 ni
σ  i1
k

n i1
i

• date grupate,frecvenţe relative :

 
k
2
σ   xi  x  n
2 *
i
i1
Formule de calcul simplificat (I)

Pentru distribuţii de frecvenţe pe intervale egale


de variaţie:

k 2
 xi  a 
2
 
i1  h 
  ni
2
_
2
  k
 h  ( x  a)
 ni
i1
Formule de calcul simplificat (II)
• date negrupate n

x
2
i
2 2
σ  i1
x
n

x
2
• date grupate
i  ni
(pe variante sau 2 2
σ  i1
k
x
intervale de variatie)
n
i1
i
3. Abaterea medie pătratică
(deviația sau abaterea standard): n _

• date negrupate :  (x  x ) i
2

σ i1
n

k _

• date grupate, frecvenţe absolute :  i


(x  x )2
 ni
σ i1
k

n i1
i

 x  x   n
• date grupate, frecvenţe relative : k
2 *
σ i i
i1
• Se exprimă în unitatea de măsură a variabilei X.
Ex. Deviatia standard

Date (xi) : 10 12 14 15 17 18 18 24
n=8 Media= x = 16
(10  X ) 2  (12  x) 2  (14  x) 2    (24  x) 2
 
n

(10  16)2  (12  16)2  (14  16)2    (24  16)2



8

126 Abaterea medie de la x = 4,24


  4.24
8
Teorema lui Cebîșev

Indiferent cum sunt distribuite datele, cel


puțin (1 - 1/k2) din valori se află la cel
mult k abateri standard distanță față de
medie (k > 1)
– Ex: Cel puțin între
(1 - 1/12) = 0% ……..... k=1 (x ± 1σ)
(1 - 1/22) = 75% …........ k=2 (x ± 2σ)
(1 - 1/32) = 89% ………. k=3 (x ± 3σ)
Pentru distribuţia normală sau moderat
asimetrică se aplică regula empirică:

1.aproximativ 68%din valori se situează în


intervalul X  1σ

68%

X  1σ
Regula empirică
2. aproximativ 3. aproximativ
95%din valori 99,7%din valori
se situează în se situează în
intervalul X  2σ intervalul X  3σ

95% 99,7%

X  2σ X  3σ
4. Coeficientul de variaţie :

σ d
v _
 100 sau v  100
_
x x
• măsoară variaţia relativă => permite compararea variaţiei unor
variabile diferite.
• Are valori între 0 şi 100.

– Cu cât valoarea este mai mică cu atât seria statistică este


mai omogenă şi deci media mai reprezentativă. Pentru media nu mai
este reprezentativă iar seria este eterogenă, mai precis astfel:
– 0% ,   17%
Pentru media este strict reprezentativă;
– Pentru
17% ,   35%media este moderat reprezentativă;
– 35% ,   50%media este reprezentativă în sens larg;
Pentru
– Pentru , %
  50 media este nereprezentativă.
Compararea coeficienţilor de variaţie

• Bunul A:
– Preț mediu= 50
– Deviatie standard = 5
5
VA   100%  10%
50 Ambele bunuri
au aceeași
• Bunul B: deviație
– Preț mediu= 100 standard, dar B
variază mai
– Deviatie standard = 5 puțin relativ la
preț.
5
VB  100%  5%
100
Me
X
Mo
Media=Mediana=Modulul
X=Me=Mo Modulul≤Mediana≤Media
Mo≤Me≤X

Mo
Me
X

Media≤Mediana≤Modulul
X≤Me≤Mo
Asimetrie la stânga O Asimetrie la dreapta

-1,0 -0,3 -0,1 +0,1 +0,3 +1,0


Moderat
asimetrică

Moderat
asimetrică
Dispersia variabilei alternative:
Varianta Valoare (xi) Frecv. Frecv.
absolute relative (ni*)
(ni)
afirmativă 1 m w
negativă 0 n-m 1-w
Total - n 1
2
σ   xi  w   ni* 
2 2
w
i1

 1 w  w  0  w  1 w   w 1 w 


2 2
Măsurarea variaţiei pentru grupări
bidimensionale
Atunci când o colectivitate este grupată simultan
după două variabile (x şi y) se obţin două
distribuţii marginale independente:
1.valorile variabilei independente xi cu frecvenţele
ni
2. valorile variabilei independente yj cu frecvenţele
nj
şi o distributie combinată în funcţie de ambele
variabile (valorile xi şi yj cu frecvenţele comune nij).
Grupe Subgrupe după y Total Medii pt. Dispersii
după x pt. x grupele pt.
y1 ... yj ... ym (ni. ) lui x grupele
lui x
2
y1  1

x1 n11 ...


n1j ... n1m n1.  
yi  2
i

x i
ni1… 
nij … nim ni.
  
2
yr  r

r m
nr1…nrj … nrm

nr. n ij y
i 1 j 1
Categorii de variatii:
1. Variaţia totală:
y  y j
2. Variaţia în interiorul grupelor stabilite după X:

3. Variaţia între grupe:


y  y 
j i

Pentru fiecare unitate i: y  y 


i

y  y   y  y  y  y 
j j i i
Media generală: r

 y n . i i
y i1
r

• yi - media aritmetică a grupei i; n .


i1
i
• ni. – totalul frecvenţelor grupei i;
• r  – numărul de grupe după x
m
Mediile grupelor i:  y n
j1
j ij

yi  m
• i = 1,..., r n j1
ij
• nij – frecvenţe combinate.
Fiecare tip de variatie poate fi exprimat printr-o dispersie.
1. Dispersia totală a variabilei y :

 y 
m
2
j  y n.j
2 j1
σ 
y m

• yj –  valorile variabilei y;  n.


j1
j

•  y - media generală;
• n.j – frecvenţele grupelor după y.
 y 
m
2
2. Dispersiile grupelor :
j  yi nij
i = 1,2,…,r j1
2
σ 
i m

n
j1
ij

Media dispersiilor grupelor :


r
Surprinde influenţa
factorilor aleatori asupra
2 2
σ n . 2
i i
variaţiei lui y. σ y/r σ  i1
r

n .
i1
i
3.Dispersia dintre grupe este calculată pe baza
abaterilor mediilor de grupă de la media generală:

 y  y  n .
r
2
i i
2 2
σ y/x δ  i1
r

n .
i1
i

Măsoară influenţa factorului x asupra variabilei y.


2 2 2
• Regula adunării dispersiilor: σ δ σ y

• Raportul de determinaţie măsoară influenţa factorului de


grupare x asupra variabilei dependente y:
2
2 δ
R  2
100
σ y
→Factorul x influenţează decisiv variaţia
variabilei dependente y dacă R2 > 50 %.
• Raportul de nedeterminaţie exprimă variaţia lui y datorată
factorilor aleatori: 2
σ 2
N  2  100
σy
2 2
R  N  100%
Nivelul de omogenitate este măsurat cu coeficienţii de
variaţie.
Pentru fiecare grupă i:
σi
v i   100 unde σi  σ 2
i
yi

Pentru colectivitatea totală:


σy 2
v  100 unde σy  σ y
y
Cel mai mic coeficient de variaţie indică cel mai omogen
grup.
Exemplu. Numărul unităţilor din administraţie după tip şi
mărime în 2006
Tipul de Subgrupe după mărime, în funcţie de Total
administraţie numărul de angajaţi (y)
(x)
sub 10 10 - 50 50 - 250 250 şi peste

0 1 2 3 4 5

Publică 20407 9452 3232 345 33436

Privată 23152 47 26 8 23233

Total 43559
Sursa: Anuarul statistic al României9499
1997. 3258 353 56669
Mediile de grupă = nr mediu de angajaţi din sectorul public/privat:
m

 y n
j1
j ij

yi  m yj – centrele de

350.
n j1
ij interval: 5, 30, 150,

1. administraţie
5  20407 publică:
 30  9452  150  3232  350  345
y1   30
33436

2. administraţie privată:
5  23152  30  47  150  26  350  8
y2  5
23233
Media totală (incluzând ambele tipuri de
administrație: public şi privat)

 y n . i i
30  33436  5  2333
y i1
r
  20
56669
n .
i1
i

angajaţi.
Dispersiile de grupă

 y 
m
2
j  yi  nij
j1
σ i2  m

n j1
ij

Grupa 1. administraţie publică :

σ 2

5  30 
2
 20407  30  30   9452  150  30   3232
2 2

1
33436


350  30   345
2
 2829,98
33436
Grupa 2. administraţie privată:

 22 
5  5 2
 23152  30  5  47  150  5  26  350  5  8
2 2 2

23233
 65,78

Media dispersiilor de grupă


r
2
 i  ni .

2 i 1 2829,98  33436  65,79  23233
  r
  1696,73
56669
 ni .
i 1
Dispersia dintre grupe:

 y 
r
2
 y  ni .
2
  i 1
i

30  20 
2
 33436  5  20  23233
2


r
56669
n .
i 1
i

 151,25
Dispersia totală:

 y 
m
2
 y  n. j
2
 
j 1
j


5  20  43559  30  20  9499
2 2


y m
56669
 n.
j 1
j


 2
 2
150  20  3258  350  20  353
 1848,03
56669
• Regula de adunare a dispersiilor:
2 2 2
      1848.03  151.25  1696.73
y

• Raportul de determinaţie
2
2 151.25
R  2  100   8.18%
y 1848.03

este f. mic =>Tipul administraţiei (public sau


privat) nu este un factor important pentru
mărimea unităţilor administrative.
4. INDICATORI AI LEGĂTURILOR DINTRE ELEMENTELE DISTRIBUŢIEI:
a. Regresie;
b. Coeficient de corelaţie;
c. Asociere.

S-ar putea să vă placă și