Documente Academic
Documente Profesional
Documente Cultură
Cap 3
Cap 3
CAPITOLUL 3
ANALIZA I DESCRIEREA NUMERIC A
SERIILOR STATISTICE UNIVARIATE
Consideraii preliminare
Cel mai adesea, urmrim s caracterizm prin indicatori statistici
msuri cantitative datele statistice pe care le avem la dispoziie. Scopul
capitolului urmtor este s prezinte indicatorii statistici, primari i derivai,
simpli i sintetici, ce se folosesc n mod frecvent pentru caracterizarea
statistic a seriilor statistice.
Vom putea, astfel, s analizm tendina central, dar i variabilitatea
datelor, forma distribuiilor i concentrarea datelor.
S notm i faptul c, datorit particularitilor lor, indicatorii
statistici ai seriilor cronologice vor fi tratai ntr-un capitol distinct.
Termeni cheie
abatere individual
abatere intercuartilic
abatere medie liniar
abatere medie ptratic
abatere semiintercuartilic
amplitudine
aplatizare.
asimetrie
boltire
coeficient de determinaie
coeficient de variaie
cuantile
cuartile
decile
diagram Box- Plot
dispersie
indicator
indicatori de poziie
indicatori derivai
indicatori primari
mrime medie
mrimi relative
median
medie aritmetic
medie armonic
medie geometric
medie ptratic
mod
percentile
regula de adunare a dispersiilor
variabilitate
STATISTIC ECONOMIC
Noiuni teoretice
3.1. INTRODUCERE
n acest capitol, vom continua s examinm modalitile prin care
putem s rezumm seturile de date statistice, n aa fel nct trsturile lor
eseniale s poat fi puse n eviden. n capitolele precedente, am nvat
cum s grupm datele brute ntr-o form mai uor de interpretat i cum s
construim diferite reprezentri grafice ale datelor sistematizate. Avnd la
dispoziie un set de date numerice, am nceput analiza statistic prin
determinarea valorii maxime i valorii minime, apoi am determinat o
distribuie de frecvene, histograma i poligonul frecvenelor. Aceste
instrumente au permis identificarea formei aproximative a distribuiei i au
indicat n jurul crei valori sunt mai concentrate nivelurile individuale ale
variabilei.
Dei o distribuie de frecvene este, cu siguran, util n conturarea
unei idei de ansamblu privind distribuia datelor ntre cele dou valori
extreme, vom dori, n continuare, s rezumm mai mult datele, calculnd
civa indicatori statistici descriptivi. Indicatorii numerici descriptivi ofer
valori precise i determinate n mod obiectiv, valori care pot fi uor folosite,
interpretate i comparate una cu alta. Pe scurt, acetia permit o analiz mai
atent a datelor, fa de impresia general pe care o ofer prezentarea datelor
sub form de serii, tabele i grafice.
3.2. INDICATORI STATISTICI PRIMARI I DERIVAI
CAPITOLUL 3
x=
xi
i =1
(3.1)
n
EXEMPLUL 3.1: Vechimea n munc a fost nregistrat pentru cinci
salariai ai unei firme i anume: 7, 5, 6,7 i 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x=
=
= 6,6 ani
5
5
Observm din fig. 3.1. cum media aritmetic pune n balan toate
valorile individuale:
5
7
X =6,6 ani
STATISTIC ECONOMIC
5 + 4 + ... + 4 + 20
= 6,6 ani
10
10
15
20
X =6,6 ani
x=
xini
i =1
r
(3.2)
ni
i =1
EXEMPLUL 3.2: Presupunem c pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut n faa televizorului,
rezultnd (Tabelul 3.1):
Timp (min.)
Pn la 30
30-60
60-90
90-120
120 i peste
Total
Numr de persoane
(frecvene) ni
47
51
76
24
2
200
xi
15
45
75
105
135
Tabelul 3.1
xi ni
705
2295
5700
2520
270
11490
CAPITOLUL 3
x=
xini
i =1
r
ni
11490
= 57,45 minute
200
i =1
, i = 1, n :
ori x i = i
h
n
n x a
xi
i
x = i =1 h + a = i =1 h h + a
(3.3)
n
n
iar pentru o serie de distribuie de frecvene:
r x a
r
ni
xini
i
x = i =1
h + a = i =1 h
h +a
(3.4)
r
ni
i =1
ni
i =1
EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 i atunci:
STATISTIC ECONOMIC
Tabelul 3.2
Timp (min.)
Frecvene ni
< 30
30-60
60-90
90-120
120 i peste
Total
47
51
76
24
2
200
r
x=
15
45
60
105
135
xini
i =1
r
xi
h +a =
ni
x i =
xi a
h
-2
-1
0
1
2
x i n i
- 94
- 51
0
24
4
-117
117
30 + 75 = 57,45 minute
200
i =1
frecvenele
ni
c
i =1
ni
, i = 1, r i rezult,
n
deci:
r
x=
xi ni
i =1
1
sau, dac frecvenele relative au fost exprimate n procente:
r
x=
(3.5)
*%
xi ni
i =1
(3.6)
100
( )
x=
x jn j
j=1
m
nj
j=1
(3.7)
CAPITOLUL 3
x F n F + x M n M 24 38,1 + 36 42,2
=
= 40,56 ani
nF + nM
60
(3.9)
xi
Frecvene ni
Frecvene relative n *i
Afirmativ
Negativ
n-m
m
=f
n
nm
= 1 f
n
Total
STATISTIC ECONOMIC
2
x=
xini
i =1
1 m + 0(n m ) m
= =f
n
n
(3.10)
d1
h M 0
M 0 = x inf M 0 +
d1 + d 2
unde: xinfMo reprezint limita inferioar a intervalului modal;
h M0 reprezint mrimea intervalului modal;
d1
(3.11)
precedent;
d2
urmtor.
EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modal este:
(76 51)
M 0 = 60 +
30 = 69,74 minute
(76 51) + (76 24)
CAPITOLUL 3
y
Frecvene
Frecvene
Frecvene
o
M0
a)
x o
M01
M02
x o
M01
M02
M03
c)
b)
3.3.3.2 Mediana
Mediana (Me) este un indicator mediu de poziie care face parte din
categoria cuantilelor. Ea reprezint valoarea/varianta din mijlocul unei serii
de date, serie n care observaiile au fost ordonate cresctor (sau descresctor).
Dac datele au fost sistematizate ntr-o serie de distribuie de frecvene pe variante, pentru determinarea medianei vom calcula, mai nti,
frecvenele cumulate (Fci). Prima frecven cumulat mai mare dect
(n+1)/2, adic mai mare dect locul medianei, ne indic varianta median.
EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au sistematizat datele privind numrul membrilor de familie, rezultnd distribuia
de frecvene (Tabelul 3.4):
Numrul membrilor de
familie
1
2
3
4
5
Total
Numr de familii ni
12
23
30
8
7
80
Tabelul 3.4
Frecvene cumulate Fci
12
35
65
73
80
STATISTIC ECONOMIC
interval cu frecvena cumulat mai mare dect locul (rangul, poziia) medianei.
1 r
n i + 1 FC( Me1)
2 i=1
n Me
Me = x inf Me + h Me
(3.12)
unde:
x inf Me reprezint limita inferioar a intervalului median;
EXEMPLUL
3.7:
100,5 98
Me = 60 + 30
61
76
Pe
baza
datelor
din
Tabelul
3.1,
minute
M 0 x 3 Me x
(3.13)
CAPITOLUL 3
x=Me=Mo
Mo Me x
x Me Mo
3.3.3.4. Cuantilele
Cuantilele, categorie de indicatori de poziie din care face parte i
mediana, pot fi uor nelese intuitiv prin extinderea noiunii de median i
reprezint valori ce mpart seria n pri egale.
Astfel,
cuartilele (cuantile
patru) mpart seria
pri egale, ele
delimitnd
cte
observaii. Ele sunt
de trei: Q1, Q2, Q3
3.5); Q1 se numete
inferioar, Q2 este
ntotdeauna
cu
Q3 se numete
de ordin
n patru
Frecvene relative
25% din
n numr
25% 25% 25% 25%
(fig.
x
Q1 Q2=Me Q3
o
cuartila
Fig. 3.5 - Cuartilele ntr-o serie de repartiie
egal
mediana,
cuartila superioar.
Similar se pot determina cuantile de ordin superior, ca de pild
decilele (care sunt D1, ...., D9 i delimiteaz cte 10% din observaii, D5 =
Me) ori percentile (delimiteaz cte 1% din observaii).
3.3.4. Alte tipuri de medii
3.3.4.1. Media armonic
( )
STATISTIC ECONOMIC
i =1 x i
Pentru o serie de distribuie de frecvene, media armonic ponderat
este:
r
xh =
ni
i =1
1
ni
i =1 x i
1
xh = r
1 *
ni
i =1 x i
100
xh = r
1 *%
ni
i =1 x i
r
(3.15)
(3.16)
(3.17)
450000 + 480000
vi
vi
=
=
= 103333,3
1
1
1
qi v
450000
+
480000
i
pi
90000
120000
lei/litru
xp =
xi
i =1
(3.18)
CAPITOLUL 3
xi ni
i =1
r
xp =
(3.19)
ni
i =1
2 *
xi ni
i =1
xp =
1
r
2 *%
xi ni
i =1
xp =
(3.20)
100
(3.21)
( )
xg = n xi
i =1
(3.22)
ni
x g = i =1 x in i
i =1
(3.23)
(3.24)
STATISTIC ECONOMIC
a)
b)
c)
x max x min
x
100
(3.26)
(3.27)
CAPITOLUL 3
Q 3 Q1
2
(3.28)
(3.29)
d i% =
xi x
x
(3.30)
(3.31)
(3.32)
STATISTIC ECONOMIC
( )
dx =
xi x
i =1
(3.33)
dx =
xi x ni
i =1
(3.34)
ni
i =1
r
dx =
x i x n *i%
i =1
(3.35)
100
xi
xi x ni
pn la 30
30-60
60-90
90-120
120 i peste
Total
47
51
76
24
2
200
15
45
75
105
135
1995,15
634,95
1333,8
1141,2
155,1
5260,2
x = 57,45 minute
r
xi x ni
dx
i =1
ni
5260,2
= 26,30
200
min
i =1
3.4.2.2. Dispersia
( )
CAPITOLUL 3
(x i x )
n
s 2x =
i =1
(3.36)
s 2x =
i =1
(3.37)
ni
i =1
s 2x =
i=1
(3.38)
100
Timp (min.)
xi
pn la 30
30-60
60-90
90-120
120 i peste
Total
47
51
76
24
2
200
15
45
75
105
135
(x i x ) n i
r
s 2x =
(x i x )2 ni
84694,12
7905,13
23408,19
54264,06
12028,00
182299,50
i =1
ni
182299,5
= 911,4975
200
i =1
( )
STATISTIC ECONOMIC
x a
i
h 2
h xa
s 2x = i=1
n
n
)2
(3.40)
xi a
ni
i =1 h
r
s 2x =
h2 x a
ni
)2
(3.41)
i =1
x i a *%
ni
h
s 2x = i=1
h2 x a
100
r
)2
(3.42)
nem:
Tabelul 3.7
Timp (min)
Frecvene
ni
x a
x i = i
h
<30
30-60
60-90
90-120
120 i peste
Total
47
51
76
24
2
200
-2
-1
0
1
2
2
i
x a
= i
4
1
0
1
4
x i n i
188
51
0
24
8
271
xi a
ni
i =1 h
r
s 2x =
(x )
ni
h2 x a
271
)2 = 200
30 2 (57,45 75)2 = 911,4975
i =1
CAPITOLUL 3
n
s 2x =
x i2
i =1
x =
x i2
i =1
n
n
xi
i=1
n
(3.43)
x i2 n i
s 2x = i=1
x i2 n i
2
x = i=1
ni
ni
i =1
r
x i2 n *i%
s 2x = i=1
i =1
r
xini
i=1
r
ni
i=1
100
(3.44)
i=1
100
x i2 n *i% x i n *i%
2
x = i=1
100
(3.45)
s 2x =
i =1
nj
, j = 1, m
(3.46)
Dispersia general a colectivitii poate s fie scris n funcie de dispersiile seriilor componente (grupurilor):
(x j x ) n j
s 2x =
s 2x j n j
j=1
m
n j
j=1
j=1
(3.47)
nj
j=1
Expresia:
s 2x j n j
j=1
m
nj
j=1
STATISTIC ECONOMIC
m
s 2x j n j
j=1
m
sx =
(3.48)
nj
j=1
(x j x ) n j
m
Expresia:
j=1
nj
j=1
media general, doar ca urmare a aciunii factorului dup care s-au alctuit
grupurile, seriile componente. Aceast expresie se numete dispersia dintre
grupe d 2x :
( )
(x j x ) n j
m
d 2x =
j=1
(3.49)
n j
j=1
s 2x = s x + d 2x
(3.50)
( )
d 2x
(3.51)
s 2x
d 2x
s 2x
100
(3.52)
sx
s 2x
= 1 R2
(3.53)
CAPITOLUL 3
sx
s 2x
2
100 = 100 R %
(3.54)
sx =
d 2x =
50
480000
= 9600
50
Aadar
2
R%
=
d 2x
s 2x
100 =
9600
100 = 81,77%
11740
(3.55)
STATISTIC ECONOMIC
(x i x )
n
i =1
s x = s 2x =
(3.56)
sx =
i =1
(3.57)
ni
i =1
(x i x ) n *i%
r
sx =
i =1
(3.58)
100
4
sx
5
(3.59)
2
sx
3
(3.60)
minute
d x 26,30
=
0,87
sx
30,19
CAPITOLUL 3
s
v = x 100
x
(3.61)
sxA
xA
sx B
xB
100 =
2
100 = 15,4%
13
100 =
2
100 = 3,2%
63
13,5%
34%
34%
13,5%
2,5%
o 2,5%
x
x-
x+
x-3 x-2
x+2 x+3
Amplitudine
STATISTIC ECONOMIC
(3.62)
AS = x M 0
sau
A S1 = 3 x Me
(3.63)
indicatori care au unitatea de msur a variabilei studiate i care sunt pozitivi sau negativi, n funcie de tipul de asimetrie (coada mai lung a distribuiei spre valorile mari sau spre valorile mici).
Coeficientul de asimetrie (Pearson) este:
C as =
x M0
sx
(3.64)
3 x Me
sx
(3.65)
x M 0 57,45 69,74
=
= 0,407
sx
30,19
CAPITOLUL 3
C as1 =
3 x Me 57,45 61
=
= 0,118
sx
30,19
ceea ce semnific o asimetrie negativ moderat (coada mai lung a distribuiei nspre valorile mici).
Analiza oblicitii (asimetriei) se poate face i pe baza momentelor
centrate de ordin 3:
(x i x )
n
m 3 = i =1
(3.66)
(x i x ) n i
r
m 3 = i =1
ni
(x i x ) n *i%
r
= i =1
100
(3.67)
i =1
m3
s 3x
m 32
m 32
(3.68)
(3.69)
dar, pentru a o exprima n coeficieni adimensionali, o vom raporta la indicatorul de mprtiere abaterea intercuartilic AQ (3.60) i obinem
coeficientul de asimetrie (Yule i Kendall):
C asq =
(3.70)
STATISTIC ECONOMIC
Q1
X m in
25%
Q3
Me
25%
25%
X m ax
25%
(3.71)
CAPITOLUL 3
xi
(3.72)
xi
i =1
xi
g ix % =
(3.73)
100
xi
i =1
g ix =
x ij
j=1
r ni
(3.74)
x ij
i =1 j=1
ni
g ix % =
x ij
j=1
r ni
x ij
i =1 j=1
100
(3.75)
STATISTIC ECONOMIC
EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules i
sistematizat date privind producia zilnic realizat de muncitori (Tabelul
3.8)
Judeul/Filiala
Tabelul 3.8
Producia individual (buc.)
Numr de muncitori
Alba/A
Bacu/B
Constana/C
4
3
6
120;130;120;90
80;120;100;
140;70;90;100;110;120
Filiala
Producia pe
filial (buc.)
A
B
C
Total
Structura produciei pe
filiale (%)
460
300
630
1390
33,09
21,58
45,33
100,00
Tabelul 3.9
Structura
colectivitii de
muncitori (%)
3
30,77
23,08
46,15
100,00
Rezultatul ne arat de cte ori este mai mare (dac rezultatul este
supraunitar), sau mai mic (dac rezultatul este subunitar) nivelul variabilei
n unitatea (grupa, colectivitatea) i fa de nivelul variabilei n unitatea
(grupa, colectivitatea) j.
Exprimarea rezultatului mrimii relative de coordonare (numit i
raport de coordonare) se poate face i n procente .
Reprezentarea grafic a mrimilor relative de coordonare se face
prin intermediul diagramei prin benzi, coloane ori suprafee.
CAPITOLUL 3
Filiala
0
A
B
C
1,33
1,00
2,00
1,53
1,00
2,10
(3.77)
Z=
i =1
n
i =1
zy
i =1
n
(3.78)
z gi
i =1
i =1
Tabelul 3.11
Productivitatea muncii (buc./muncitor)
A
B
C
Total
115
100
105
106,92
STATISTIC ECONOMIC
I1x0 =
x1i
i =1
n
x 0i
i1x 0i x 0i
i =1
= i1x 0i g 0xi =
i=1
(3.81)
x 0i
i =1
i =1
I1x0 =
1
1
x
i =1 i1 0i
g1xi
x1i
i =1
x
i =1 i1 0i
(3.82)
x1xi
x pi
x 0i
(3.83)
CAPITOLUL 3
i px %0i =
x pi
x 0i
100
(3.84)
x 1i
x pi
(3.85)
i 1x %pi =
x 1i
100
x pi
(3.86)
Se observa ca:
i px %0i i 1x %
pi =
x pi x 1i x 1i
=
= i 1x 0i
x 0i x pi x 0i
(3.87)
STATISTIC ECONOMIC
ntrebri recapitulative
1. Ce este indicatorul statistic?
2. Care sunt funciile indicatorilor statistici?
3. Ce sunt indicatorii statistici? Cum se obin ei?
4. Ce sunt indicatorii tendinei centrale?
5. Care sunt principalele tipuri de indicatori ai tendinei centrale?
6. Media aritmetic: definiie, proprieti, observaii, utilizri.
7. Care sunt indicatorii de poziie?
8. Modul: definiie, calcul, utilizri, proprieti.
9. Mediana: definiie, calcul, utilizri, proprieti
10. Cum se determin mediana pentru o serie de distribuie pe variante?
Dar pe intervale de variaie?
11. Analiza comparativ a celor trei indicatori ai tendinei centrale.
12. Ce sunt cuantilele?
13. Care este semnificaia cuantilelor de ordin 4?
14. Media armonic: definiie, calcul, utilizri, proprieti.
15. Media ptratic: definiie, calcul, utilizri, proprieti.
16. Media geometric: definiie, calcul, utilizri, proprieti.
17. Ce se nelege prin variabilitatea datelor statistice?
18. Necesitatea msurrii variabilitii.
19. Ce este amplitudinea datelor? Calcul i interpretare.
20. Care sunt indicatorii simpli ai variabilitii?
21. Ce reprezint abaterea medie liniar?
22. Dispersia: determinare, observaii, proprieti.
23. Cum se determin media i dispersia unei variabile alternative?
24. Cum se determin abaterea medie ptratic? Semnificaie, utilizri.
25. Coeficientul de variaie: calcul, utilizri.
26. Cum se compune dispersia pentru o serie structurat n serii componente?
27. Cum se interpreteaz abaterea medie ptreatic folosind regula
empiric?
28. Ce reprezint oblicitatea unei repartiii?
29. Cum se analizeaz asimetria (oblicitatea) unei repartiii?
30. Cum se analizeaz boltirea/aplatizarea unei repartiii?
31. Cum se poate studia forma distribuiei folosind indicatorii de poziie?
32. Cum se construiete i interpreteaz diagrama Box-Plot?
33. Cum se obin indicatorii statistici derivai?
34. Ce sunt mrimile relative?
CAPITOLUL 3