Sunteți pe pagina 1din 40

C4.

Indicatorii
variaiei


Analiza variabilelor numerice
Media
Mediana
Modul
Descrierea datelor
Dispersie
Deviatia standard
Coeficient de variatie
Amplitudine
Abateri individuale
Tendina central Variatia
I. Indicatori simpli ai variaiei

1. Amplitudinea variaiei este diferena dintre valorile
extreme (x
max
i x
min
).
Amplitudinea absolut:


se exprim n unitatea de msur a variablei X.
pentru date grupate se calculeaz ca diferen ntre
limita superioar a ultimei grupe i limita inferioar a
primei grupe.
min max
x x A




2. depinde doar de valorile extreme => instabil, sensibil la
valori mari.



7 8 9 10 11 12
A = 12 - 7 = 5
7 8 9 10 11 12
A = 12 - 7 = 5


Advantaje: uor de calculat i interpretat.

Dezavantaje:
1. ignor modul n care sunt distribuite datele.


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
A = 5 - 1 = 4
A = 120 - 1 = 119

Amplitudinea relativ permite comparaii ntre
variabile diferite:



- media aritmetic.

100
x
A
A
%
x

2. Abaterile individuale de la medie msoar
distana fiecrei uniti statistice fa de media
colectivitii.

Abaterile individuale absolute (d
i
)



Abaterile individuale relative (d
i
%)

x x d
i i
100
x
d
d
i
i (%)
Mediana
(Q
2
)
X
maxim
X
minim
Q
1
Q
3
Exemplu:
25% 25% 25% 25%
12 30 45 57 70
A
Q
= 57 30 = 27
3. Abaterea intercuartilic
A
Q
= Q
3
Q
1
II.Indicatori sintetici ai variaiei

arat mprtierea tuturor valorilor variabilei
sintetizeaz ntr-un numr toate abaterile individuale
absolute.
msoar variatia fa de o valoare reprezentativ
(media).
1. Abaterea medie liniar este media aritmetic a
tuturor abaterilor individuale absolute d
i
(indiferent de
semn):
- date negrupate:


n
x x
d
n
i
i
= 1

date grupate, frecvene absolute






date grupate, frecvene relative





=
=

=
k
i
i
k
i
i i
n
n x x
d
1
1
*
i
k
i
i
n x x d
=1

2. Dispersia este media abaterilor individuale ridicate la
ptrat:
date negrupate :


date grupate, frecvene absolute :





date grupate,frecvene relative :
n
x x
n
i
i
=

=
1
2
_
2
) (
o
=
=

=
k
i
i
k
i
i i
n
n x x
1
1
2
_
2
) (
o
=
=
k
i
i i
n x x
1
2
2 *
o

Formule de calcul simplificat (I)

Pentru distribuii de frecvene pe intervale egale
de variaie:
2
_
2
1
1
2
2
) ( a x h
n
n
h
a x
k
i
i
k
i
i
i
=
=
Formule de calcul simplificat (II)
date negrupate





date grupate
(pe variante sau
intervale de variatie)

2
1
2
2
x
n
x
n
i
i
=
=
o
2
1
1
2
2
x
n
n x
k
i
i
k
i
i i

=
=
=
o

3. Abaterea medie ptratic
(deviaia sau abaterea standard):

date negrupate :





date grupate, frecvene absolute :




date grupate, frecvene relative :



Se exprim n unitatea de msur a variabilei X.
n
x x
n
i
i
=

=
1
2
) (
_
o
=
=

=
k
i
i
k
i
i i
n
n x x
1
1
2
_
) (
o
=
=
k
i
i i
n x x
1
*
2
o
Ex. Deviatia standard

Date (x
i
) : 10 12 14 15 17 18 18 24
n = 8 Media= x = 16
4.24
8
126
8
16) (24 16) (14 16) (12 16) (10
n
) x (24 ) x (14 ) x (12 ) X (10
2 2 2 2
2 2 2 2
= =
+ + + +
=
+ + + +
=

o
Abaterea medie de la x = 16
Indiferent cum sunt distribuite datele, cel
puin (1 - 1/k
2
) din valori se afl la cel
mult k abateri standard distan fa de
medie (k > 1)
Ex:
(1 - 1/1
2
) = 0% ..... k=1 (x 1)
(1 - 1/2
2
) = 75% ........ k=2 (x 2)
(1 - 1/3
2
) = 89% . k=3 (x 3)
Teorema lui Cebev
ntre
Cel puin
Pentru distribuia normal sau moderat
asimetric se aplic regula empiric:

1.aproximativ 68%din valori se situeaz n
intervalul
68%
1 X
1 X
X
2. aproximativ
95%din valori
se situeaz n
intervalul

Regula empiric
99,7% 95%
2 X 3 X
3 X
2 X
3. aproximativ
99,7%din valori
se situeaz n
intervalul


4. Coeficientul de variaie :

sau


msoar variaia relativ => permite compararea
variaiei unor variabile diferite.
Are valori ntre 0 i 100%.

v < 35-40% populaia este omogen i media este
reprezentativ.
v > 40% populaia este eterogen i media este
nereprezentativ.
100
_
x
v
100
_
x
d
v
Compararea coeficienilor de variaie
Bunul A:
Pre mediu= 50
Deviatie standard = 5


Bunul B:
Pre mediu= 100
Deviatie standard = 5

Ambele bunuri
au aceeai
deviaie
standard, dar B
variaz mai
puin relativ la
pre.
10% 100%
50
5
V
A
= =
5% 100%
100
5
V
B
= =
Descriptive Statistics cu Microsoft

Excel
1. data
2. data analysis
3. descriptive
statistics

1
4
3
2
4.Se selecteaz
datele


5.Se bifeaz
summary
statistics

6.Click OK
7. Excel output
Varianta Valoare (x
i
) Frecv.
absolute
(n
i
)
Frecv.
relative
(n
i
*
)
afirmativ 1 m w
negativ 0 n-m 1-w
Total - n 1
Dispersia variabilei alternative:
w w w w w w
n w x
i
i i w
= + =
= =
=
1 1 0 1
2 2
2
1
2
2 *
o
Msurarea variaiei pentru grupri
bidimensionale
Atunci cnd o colectivitate este grupat simultan
dup dou variabile (x i y) se obin dou
distribuii marginale independente:
1.valorile variabilei independente x
i
cu
frecvenele n
i

2. valorile variabilei independente y
j
cu
frecvenele n
j

i o distributie combinat n funcie de ambele
variabile (valorile x
i
i y
j
cu frecvenele comune
n
ij
).
Grupe
dup x
Subgrupe dup y Total pt.
x
(n
i.
)
Medii pt.
grupele
lui x
Dispersii
pt. grupele
lui x
y
1

... y
j
... y
m

x
1


x
i




x
r

n
11
... n
1j
... n
1m


n
i1
n
ij
n
im


n
r1
n
rj
n
rm


n
1.


n
i.


n
r.
Total
pt. y (n.
j
)
n.
1
... n.
j
... n.
m

1
y
r
y
i
y
= =
r
i
m
j
ij
n
1 1
2
1
o
2
r
o
2
i
o

y

Categorii de variatii:
1. Variaia total:

2. Variaia n interiorul grupelor stabilite dup X:


3. Variaia ntre grupe:


Pentru fiecare unitate i:
i j
y y
y y
i
y y
j
y y y y y y
i i j j

Media general:



- media aritmetic a grupei i;
n
i.
totalul frecvenelor grupei i;
r numrul de grupe dup x

Mediile grupelor i:


i = 1,..., r
n
ij
frecvene combinate.
=
=
r
i
i
r
i
i i
n
n y
y
1
1
.
.
i
y
=
=
m
j
ij
m
j
ij j
i
n
n y
y
1
1

Fiecare tip de variatie poate fi exprimat printr-o dispersie.
1. Dispersia total a variabilei y :




y
j
valorile variabilei y;
- media general;
n
.j
frecvenele grupelor dup y.

=
=

=
m
j
j
m
j
j j
y
n
n y y
1
1
2
2
.
.
o
y

2. Dispersiile grupelor :
i = 1,2,,r



Media dispersiilor grupelor :
=
=
r
i
i
r
i
i i
r y
n
n
1
1
2
2
2
/
.
.
=
=
m
j
ij
m
j
ij
i
j
i
n
n y y
1
1
2
2
Surprinde influena
factorilor aleatori asupra
variaiei lui y.

3.Dispersia dintre grupe este calculat pe baza
abaterilor mediilor de grup de la media general:






Msoar influena factorului x asupra variabilei y.
=
=
r
i
i
r
i
i i
x y
n
n y y
1
1
2
2 2
/
.
.


Regula adunrii dispersiilor:

Raportul de determinaie msoar influena factorului de
grupare x asupra variabilei dependente y:



Factorul x influeneaz decisiv variaia variabilei
dependente y dac R
2
> 50 %.
Raportul de nedeterminaie exprim variaia lui y datorat
factorilor aleatori:
2 2 2
y
100
2
2
2
=
y
R
o
o
100
2
2
2
=
y
N
o
o
% 100
2 2
= + N R

Nivelul de omogenitate este msurat cu coeficienii de
variaie.
Pentru fiecare grup i:

unde


Pentru colectivitatea total:

unde


Cel mai mic coeficient de variaie indic cel mai omogen
grup.
100 =
i
i
i
y
v
o
2
i i
100
y
v
y
2
y y
Tipul de
administraie
(x)
Subgrupe dup mrime, n funcie de
numrul de angajai (y)
Total
sub 10 10 - 50 50 - 250 250 i peste
0 1 2 3 4 5
Public 20407 9452 3232 345 33436
Privat 23152 47 26 8 23233
Total 43559 9499 3258 353 56669
Exemplu. Numrul unitilor din administraie dup tip i
mrime n 1996
Sursa: Anuarul statistic al Romniei 1997.

Mediile de grup = nr mediu de angajai din sectorul public/privat:



y
j
centrele de
interval: 5, 30, 150, 350.


1. administraie public:



2. administraie privat:
=
=

=
m
j
ij
m
j
ij j
i
n
n y
y
1
1
30
33436
345 350 3232 150 9452 30 20407 5
1
~
+ + +
= y

5
23233
8 350 26 150 47 30 23152 5
2
~
+ + +
= y


Media total (incluznd ambele tipuri de
administraie: public i privat)






angajai.
20
56669
2333 5 33436 30
1
1
~
+
=

=
=
=
r
i
i
r
i
i i
n
n y
y
.
.

Dispersiile de grup





Grupa 1. administraie public :

=
=

=
m
j
ij
m
j
ij i j
i
n
n y y
1
1
2
2
o
( ) ( ) ( )
( )
98 2829
33436
345 30 350
33436
3232 30 150 9452 30 30 20407 30 5
2
2 2 2
2
1
, =

+
+
+ +
= o


Grupa 2. administraie privat:




Media dispersiilor de grup
( ) ( ) ( ) ( )
78 65
23233
8 5 350 26 5 150 47 5 30 23152 5 5
2 2 2 2
2
2
, =
=
+ + +
= o
73 1696
56669
23233 79 65 33436 98 2829
1
1
2
2
,
, ,
. n
. n
r
i
i
r
i
i i
=
+
=

=
=
o
o

Dispersia dintre grupe:




Dispersia total:
( ) ( )
25 151
56669
23233 20 5 33436 20 30
2 2
1
1
2
2
,
.
.
=
=
+
=

=

=
=
r
i
i
r
i
i i
n
n y y
o
( ) ( )
( ) ( )
03 1848
56669
353 20 350 3258 20 150
56669
9499 20 30 43559 20 5
2 2
2 2
1
1
2
2
,
.
.
=
+
+
+
+
=

=

=
=
m
j
j
m
j
j j
y
n
n y y
o

Regula de adunare a dispersiilor:



Raportul de determinaie


este f. mic =>Tipul administraiei (public sau
privat) nu este un factor important pentru
mrimea unitilor administrative.
73 1696 25 151 03 1848
2
2 2
. . . + ~ + = o o o
y
% .
.
.
18 8
03 1848
25 151
100
2
2
2
= = =
y
R
o
o