Documente Academic
Documente Profesional
Documente Cultură
CURS 5
1
Msuri statistice descriptive pentru date univariate
2
Msurarea tendinei centrale
Indicatorii fundamentali ai tendinei centrale sunt:
1. media aritmetic ( x )
2. mediana (Me)
3. modul (Mo)
Aceti indicatori au o putere cu att mai mare de caracterizare a tendinei
centrale cu ct se determin pe baza unor date mai omogene.
3
Media aritmetic
Formula de calcul a mediei este:
n
- pentru eantion - estimator
x i =1
i
x=
n
- pentru colectivitatea general parametru
N
x
i =1
i
=
N
x n + x2 n2 + ... + xr nr
x k nk x k nk
k =1 k =1
x= 1 1 = r
=
n1 + n2 + ... + nr n
nk
k =1
4
Media aritmetic
Exemplu
Vechimea n munc a fost nregistrat pentru cinci salariai ai unei firme i
anume: 7, 5, 6, 7 i 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x= = = 6,6 ani.
5 5
5 6 7 8
x =6,6 ani
5
Media aritmetic
Media aritmetic este afectat de orice valoare sau valori extreme.
Exemplu
Datele pentru vechimea n munc a 10 salariai sunt: 5, 4, 5, 5, 6, 6, 4 i 20,
atunci vechimea medie este:
5 + 4 + ... + 4 + 20
x= = 6,6 ani
10
0 5 10 15 20
x = 6,6 ani
5 + 4 + ... + 6 + 4
x= = 5,1 ani
9
6
Exemplu
7
Exemplu
8
Media aritmetic
6. Dac o serie statistic este alctuit din m serii componente, pentru care s-au
( )
calculat mediile pariale x j , j = 1, m , atunci media ntregii serii poate fi calculat
ca o medie aritmetic ponderat din mediile pariale
m
x
j =1
j nj
x = m
n
j =1
j
unde nj (
reprezint volumul seriei componente j j = 1, m . )
10
Mediana
2. Mediana (median, n engl.) reprezint valoarea din
mijlocul unei serii de date ordonate.
- este un indicator mediu de poziie care face parte din categoria
cuantilelor
- mediana este un indicator al tendinei centrale, fiind situat n
centrul seriei
- 50% dintre valori sunt situate la stnga medianei, iar 50% la
dreapta medianei
- ia n consideraie doar poziia observaiilor n serie, nu i mrimea
lor efectiv (nu este afectat de prezena valorilor extreme).
11
Mediana
Pentru a determina mediana se introduce noiunea de ranguri,
adic numere de ordine asociate observaiilor, de la cea mai
mic (cu rangul 1), pn la cea mai mare (rangul n)
Rangul (locul ) medianei va fi, atunci, (n+1)/2, deci rangul
unitii din mijlocul seriei.
Exemplu
Pentru o serie numeric de forma {30, 32, 40, 35, 32, 37, 34, 32, 35, 41},
mediana se determin astfel:
- ordonm cresctor valorile seriei: {30, 32, 32, 32, 34, 35, 35, 37, 40, 41}
- calculm locul medianei: Loc Me = (n+1)/2 = 11/2=5,5
- mediana este valoarea cuprins ntre al 5-lea i al 6-lea termen al seriei
ordonate i se calculeaz ca fiind media aritmetic a celor doi termeni aflai n
centrul distribuiei:
Astfel, jumtate dintre valorile seriei sunt mai mici dect valoarea 34,5.
12
Mediana
13
Mediana
- Pentru o repartiie de frecvene pe intervale de variaie, mediana se va
ncadra n intervalul median
- Intervalul median este primul interval cu frecvena cumulat mai mare dect
locul (rangul, poziia) medianei.
1 r
nk + 1 Fc ( Me 1)
2 k =1
Me = xinf Me + hMe
nMe ,
unde:
xinf Me reprezint limita inferioar a intervalului median;
hMe reprezint mrimea intervalului median;
1 r n +1
nk + 1 =
2 k =1 2 reprezint locul medianei n serie;
Fc (Me - 1) reprezint frecvena cumulat a intervalului anterior celui median;
nMe reprezint frecvena absolut a intervalului median.
14
Mediana
Mediana poate fi determinat i pentru variabilele
nenumerice msurate pe scala ordinal.
Pentru o variabil nenumeric, determinarea medianei
este mai uoar dac datele sunt sistematizate
Se parcurg urmtorii pai :
- calcularea frecvenelor cumulate cresctor, (Fck)
- determinarea locului medianei cu formula (n+1)/2
- determinarea Me ca fiind valoarea (varianta)
corespunztoare primei frecvene cumulate mai mare
dect (n+1)/2
15
Mediana
n cazul datelor privind clasamentul general la competiiile
internaionale oficiale pentru Federaia Romn de Atletism, n anul
2006, mediana se determin astfel:
Locul Nr. sportivi Frecvene cumulate (Fci)
I 50 50
Me = II 36 86>65
III 31 117
IV 2 119
V 3 122
VI 7 129
Total 129 -
Loc Me = 130/2 = 65, iar valoarea median este locul II, ceea ce
nseamn c jumtate dintre cei 129 de sportivi situai n primele ase
locuri la competiiile internaionale, au ocupat locurile I i II, sau, astfel
spus, jumtate dintre cei 129 de sportivi s-au clasat pe locurile III, IV, V
i VI.
16
Indicatori ai poziiei relative cuantilele
17
Indicatori ai poziiei relative cuantilele
Cuantilele de ordin 4 (cuartile, notate Q1, Q2, Q3, care mpart seria
n patru pri egale, delimitnd cte 25% din observaii, Q2=Me)
18
Indicatori ai poziiei relative cuantilele
y
Frecvene relative
19
Modul
3. Modul (Mo, mode n engl.) reprezint valoarea cel mai
des ntlnit ntr-o serie de date (valoarea care are cea
mai mare frecven de apariie)
Valoarea modal se poate determina pentru orice tip de variabil (nenumeric sau
numeric), indiferent de scala de msurare.
Modul este singurul indicator ce poate fi determinat pentru variabilele msurate pe scala
nominal.
Grafic, ntr-o histogram ori poligon al frecvenelor, modul reprezint valoarea de pe abscis,
corespunztoare vrfului reprezentrii.
O serie de date statistice poate s aib una sau mai multe valori modale.
20
Modul
ni
ni
a) b)
xi
xi
Mo Mo 1 Mo2
ni
c)
xi
Mo 1 Mo2 Mo 3
21
Modul
I. Determinarea modului pentru o variabil nenumeric
tiinele naturii 44
Istoria tehnicii i tiinei 21
Istorie 117
Etnografie 115
Mo = Istoria culturii ni max = 152
Art 149
Mixte 70
Total 668
Sursa: Anuarul Statistic al Romniei, 2008.
22
Modul
II. Determinarea modului pentru o variabil numeric
Pentru o serie numeric de forma {30, 32, 40, 35, 32, 37, 34,
32, 35, 41}, Mo = 32, deoarece valoarea 32 apare de cele mai
multe ori.
Dac toate valorile apar cu aceeai frecven spunem c seria nu are mod.
23
MODUL
1
Mo = x 0 + h
1 + 2
unde:
x0 este limita inferioar a intervalului modal;
h este mrimea intervalului modal;
1 = nMo nMo1 este diferena ntre frecvena intervalului
modal i frecvena intervalului anterior celui modal;
24
Modul
Exemplu
Se cunoate distributia a 200 de agenti economici in functie de cifra de afaceri:
15-25 15
25-35 120
35-45 40
45-55 20
Total 200
120 15
M o = 25 + 10 = 30 ,67
(120 15 ) + (120 40 )
Cele mai multe firme au realizat o cifr de afaceri de aproximativ 30,67 zeci mii euro. 25
Analiza comparativ a indicatorilor tendinei centrale
26
Analiza comparativ a indicatorilor tendinei centrale
27
Analiza comparativ a indicatorilor tendinei centrale
28
Analiza comparativ indicatorilor tendinei centrale
y y y
o x=Me=Mo x o Mo Me x x o x Me Mo x
(
x M 0 3 x Me )
29