Sunteți pe pagina 1din 40

C4.

Indicatorii
variaţiei
Analiza variabilelor numerice
Descrierea datelor

Tendința centrală Variatia

Media Amplitudine

Mediana Abateri individuale

Modul Dispersie

Deviatia standard

Coeficient de variatie
I. Indicatori simpli ai variației

1. Amplitudinea variaţiei este diferenţa dintre valorile


extreme (xmax şi xmin).
• Amplitudinea absolută:

A  xmax  xmin
• se exprimă în unitatea de măsură a variablei X.
• pentru date grupate se calculează ca diferenţă între
limita superioară a ultimei grupe şi limita inferioară a
primei grupe.
Advantaje: uşor de calculat şi interpretat.

Dezavantaje:
1. ignoră modul în care sunt distribuite datele.

7 8 9 10 11 12 7 8 9 10 11 12
A = 12 - 7 = 5 A = 12 - 7 = 5

2. depinde doar de valorile extreme => instabilă, sensibilă la


valori mari.
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
A=5-1=4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

A = 120 - 1 = 119
• Amplitudinea relativă permite comparaţii între
variabile diferite:

A
A%   100
x - media aritmetică.
x
2. Abaterile individuale de la medie măsoară
distanţa fiecărei unităţi statistice faţă de media
colectivităţii.

• Abaterile individuale absolute (di)

d i  xi  x
• Abaterile individuale relative (di%)

di
d i (%)   100
x
3. Abaterea intercuartilică
AQ = Q3 −Q1
Exemplu:

Mediana
X Q1 (Q2) Q3 X maxim
minim
25% 25% 25% 25%

12 30 45 57 70

AQ= 57 – 30 = 27
II.Indicatori sintetici ai variaţiei
• arată împrăştierea tuturor valorilor variabilei →
sintetizează într-un număr toate abaterile individuale
absolute.
• măsoară variatia faţă de o valoare reprezentativă
(media).
1. Abaterea medie liniară este media aritmetică a
tuturor abaterilor individuale absolute di (indiferent de
semn):
n

x
- date negrupate:
i x
d i 1
n
• date grupate, frecvenţe absolute
k

x i  x  ni
d i 1
k

n
i 1
i

• date grupate, frecvenţe relative


k
d   xi  x  n *
i
i 1
2. Dispersia este media abaterilor individuale ridicate la
pătrat: n _
• date negrupate : 
( xi  x ) 2

 
2 i 1
n
• date grupate, frecvenţe absolute :
k _

(x i  x )  ni 2

 
2 i 1
k

n
i 1
i

• date grupate,frecvenţe relative :

 
k
   xi  x  n
2 2 *
i
i 1
Formule de calcul simplificat (I)

Pentru distribuţii de frecvenţe pe intervale egale


de variaţie:

 xi  a 
k 2

 
i 1  h 
  ni _
 
2
k
 h 2
 ( x  a ) 2

 ni
i 1
Formule de calcul simplificat (II)
• date negrupate n

x
2
i
 
2 i 1
x 2

x  ni
• date grupate 2
i
(pe variante sau 2

intervale de variatie)
 
2 i 1
k
x
n
i 1
i
3. Abaterea medie pătratică
(deviația sau abaterea standard): n _

• date negrupate :
(x i  x) 2

 i 1
n

k _

• date grupate, frecvenţe absolute :  i


( x  x ) 2
 ni
  i 1
k

n
i 1
i

• date grupate, frecvenţe relative : k


  x  x  n
2 *
i i
i 1
• Se exprimă în unitatea de măsură a variabilei X.
Ex. Deviatia standard

Date (xi) : 10 12 14 15 17 18 18 24
n=8 Media= x = 16

(10  X ) 2  (12  x) 2  (14  x) 2    (24  x) 2


 
n

(10  16) 2  (12  16) 2  (14  16) 2    (24  16) 2



8

Abaterea medie de la x = 16
126
  4.24
8
Teorema lui Cebîșev

Indiferent cum sunt distribuite datele, cel


puțin (1 - 1/k2) din valori se află la cel
mult k abateri standard distanță față de
medie (k > 1)
– Ex: între
Cel puțin
(1 - 1/12) = 0% ……..... k=1 (x ± 1σ)
(1 - 1/22) = 75% …........ k=2 (x ± 2σ)
(1 - 1/32) = 89% ………. k=3 (x ± 3σ)
Pentru distribuţia normală sau moderat
asimetrică se aplică regula empirică:

1.aproximativ 68%din valori se situează în


intervalul X  1σ

68%

X  1σ
Regula empirică
2. aproximativ 3. aproximativ
95%din valori 99,7%din valori
se situează în se situează în
intervalul X  2σ intervalul X  3σ

95% 99,7%

X  2σ X  3σ
4. Coeficientul de variaţie :
 d
v _
 100 sau v _
 100
x x
• măsoară variaţia relativă => permite compararea
variaţiei unor variabile diferite.
• Are valori între 0 şi 100%.

– v < 35-40% → populaţia este omogenă şi media este


reprezentativă.
– v > 40% → populaţia este eterogenă şi media este
nereprezentativă.
Compararea coeficienților de variaţie

• Bunul A:
– Preț mediu= 50
– Deviatie standard = 5
5
VA   100%  10%
50 Ambele bunuri
• Bunul B: au aceeași
deviație
– Preț mediu= 100 standard, dar B
variază mai
– Deviatie standard = 5 puțin relativ la
preț.
5
VB   100%  5%
100
Descriptive Statistics cu Microsoft® Excel
1

1. data
3
2. data analysis

3. descriptive
4
 statistics
4.Se selectează
datele

5.Se bifează
summary
statistics

6.Click OK
7. Excel output
Dispersia variabilei alternative:
Varianta Valoare (xi) Frecv. Frecv.
absolute relative
(ni) (ni*)
afirmativă 1 m w
negativă 0 n-m 1-w
Total - n 1
2
    x i  w   ni* 
2 2
w
i 1

 1  w  w  0  w  1  w   w 1  w 
2 2
Măsurarea variaţiei pentru grupări
bidimensionale
Atunci când o colectivitate este grupată simultan
după două variabile (x şi y) se obţin două
distribuţii marginale independente:
1.valorile variabilei independente xi cu
frecvenţele ni
2. valorile variabilei independente yj cu
frecvenţele nj
şi o distributie combinată în funcţie de ambele
variabile (valorile xi şi yj cu frecvenţele comune
nij).
Grupe Subgrupe după y Total pt. Medii pt. Dispersii
după x x grupele pt. grupele
y1 ... yj ... ym (ni. ) lui x lui x
x1 n11 ... n1j ... n1m n1. y1  2
1

    
ni1… nij … nim
xi ni. yi  2
i

    
nr1…nrj … nrm
xr nr. yr  2
r

r m

 n
Total n.1 ... n.j ... n.m
pt. y (n.j) ij y
i 1 j 1
Categorii de variatii:
1. Variaţia totală:
y j  y
2. Variaţia în interiorul grupelor stabilite după X:
y j  yi 
3. Variaţia între grupe:

 y i  y
Pentru fiecare unitate i:

y j  y  y j  yi   yi  y
Media generală: r

y
i 1
i  ni .
y r

• y i - media aritmetică a grupei i; n .


i 1
i
• ni. – totalul frecvenţelor grupei i;
• r – numărul de grupe după x
m
Mediile grupelor i: y
j 1
j  nij
yi  m
• i = 1,..., r n
j 1
ij
• nij – frecvenţe combinate.
Fiecare tip de variatie poate fi exprimat printr-o dispersie.
1. Dispersia totală a variabilei y :

  y j  y  n. j
m 2

j 1
 2
y m

• yj – valorile variabilei y;  n. j
j 1
• y - media generală;
• n.j – frecvenţele grupelor după y.
  y j  y i  nij
m 2
2. Dispersiile grupelor :
i = 1,2,…,r j 1
  2
i m
 nij
j 1
Media dispersiilor grupelor :
r
Surprinde influenţa
factorilor aleatori asupra 2
 2
i ni .
variaţiei lui y.  2
y/r   i 1
r
 ni .
i 1
3.Dispersia dintre grupe este calculată pe baza
abaterilor mediilor de grupă de la media generală:

  yi  y  ni .
r 2

 2
y/ x  
2 i 1
r
 ni .
i 1
Măsoară influenţa factorului x asupra variabilei y.
• Regula adunării dispersiilor:    
2
y
2 2

• Raportul de determinaţie măsoară influenţa factorului de


grupare x asupra variabilei dependente y:
 2

R 
2
 100
 2
y
→Factorul x influenţează decisiv variaţia variabilei
dependente y dacă R2 > 50 %.
• Raportul de nedeterminaţie exprimă variaţia lui y datorată
factorilor aleatori:
 2
N  2  100
2

y
R  N  100%
2 2
Nivelul de omogenitate este măsurat cu coeficienţii de
variaţie.
Pentru fiecare grupă i:
i
vi   100 unde i   2
i
yi

Pentru colectivitatea totală:


y y   2
v  100 unde y
y
Cel mai mic coeficient de variaţie indică cel mai omogen
grup.
Exemplu. Numărul unităţilor din administraţie după tip şi
mărime în 1996
Tipul de Subgrupe după mărime, în funcţie de Total
administraţie numărul de angajaţi (y)
(x)
sub 10 10 - 50 50 - 250 250 şi peste
0 1 2 3 4 5

Publică 20407 9452 3232 345 33436

Privată 23152 47 26 8 23233

Total 43559 9499 3258 353 56669


Sursa: Anuarul statistic al României 1997.
Mediile de grupă = nr mediu de angajaţi din sectorul public/privat:
m

y
j 1
j  nij
yi  m yj – centrele de
nj 1
ij
interval: 5, 30, 150, 350.

1. administraţie publică:
5  20407  30  9452  150  3232  350  345
y1   30
33436
2. administraţie privată:

5  23152  30  47  150  26  350  8


y2  5
23233
Media totală (incluzând ambele tipuri de
administrație: public şi privat)

y i  ni .
30  33436  5  2333
y i 1
r
  20
n .
56669
i
i 1
angajaţi.
Dispersiile de grupă

 y  y i   nij
m
2
j
j 1
 
2
i m

n j 1
ij

Grupa 1. administraţie publică :

 
2 5  30 2
 20407  30  30 2
 9452  150  30 2
 3232

1
33436


350  302  345
 2829,98
33436
Grupa 2. administraţie privată:

 22 
5  5 2
 23152  30  5  47  150  5  26  350  5  8
2 2 2

23233
 65,78

Media dispersiilor de grupă


r
 i  ni .
 2
2 i 1 2829,98  33436  65,79  23233
  r
  1696,73
56669
 ni .
i 1
Dispersia dintre grupe:

 y 
r
2
 y  ni .
 
2 i 1
i

30  20
2
 33436  5  20 23233
2


r

n .
56669
i
i 1

 151,25
Dispersia totală:

 y 
m
2
 y  n. j
 
2 j 1
j


5  20   43559  30  20   9499
2 2


y m
56669
 n.
j 1
j


   
150  20  3258  350  20  353
2 2

 1848,03
56669
• Regula de adunare a dispersiilor:
2
      1848.03  151.25  1696.73
2
y
2

• Raportul de determinaţie
2 151.25
R  2  100 
2
 8.18%
y 1848.03

este f. mic =>Tipul administraţiei (public sau


privat) nu este un factor important pentru
mărimea unităţilor administrative.

S-ar putea să vă placă și