Documente Academic
Documente Profesional
Documente Cultură
CURS 5
1
Măsuri statistice descriptive pentru date univariate
2
Măsurarea tendinţei centrale
Indicatorii fundamentali ai tendinţei centrale sunt:
1. media aritmetică ( x )
2. mediana (Me)
3. modul (Mo)
Aceşti indicatori au o putere cu atât mai mare de caracterizare a tendinţei
centrale cu cât se determină pe baza unor date mai omogene.
3
Media aritmetică
Formula de calcul a mediei este:
- pentru eşantion - estimator
n
x
i =1
i
x=
n
- pentru colectivitatea generală – parametru
N
x
i =1
i
=
N
x n
i =1
i i
x= r
n
i =1
i
4
Media aritmetică
Exemplu
Vechimea în muncă a fost înregistrată pentru cinci salariaţi ai unei firme şi
anume: 7, 5, 6, 7 şi 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x= = = 6,6 ani.
5 5
5 6 7 8
x =6,6 ani
5
Media aritmetică
Media aritmetică este afectată de orice valoare sau valori extreme.
Exemplu
Datele pentru vechimea în muncă a 10 salariaţi sunt: 5, 4, 5, 5, 6, 6, 4 şi 20,
atunci vechimea medie este:
5 + 4 + ... + 4 + 20
x= = 6,6 ani
10
0 5 10 15 20
x = 6,6 ani
5 + 4 + ... + 6 + 4
x= = 5,1 ani
9
6
Exemplu
7
Exemplu
Pentru a putea calcula media se procedează la fixarea limitelor inferioară, respectiv
superioară pentru aceste intervale.
Limitele se determină astfel încât toate intervalele să aibă aceeaşi mărime, adică
1,10.
Astfel intervalele devin:5,15-6,25, respectiv 12,85-13,95.
r
x n
i =1
i i
422,5
x= = = 8,45.
Media va fi:
r
50
n
i =1
i
8
Media aritmetică
Particularităţi în calculul mediei
x n
i =1
i
*%
i
x= .
100
6. Dacă o serie statistică este alcătuită din m serii componente, pentru care s-au
( )
calculat mediile parţiale x j , j = 1, m , atunci media întregii serii poate fi calculată
ca o medie aritmetică ponderată din mediile parţiale
m
x j =1
j nj
x= m
nj =1
j
unde nj (
reprezintă volumul seriei componente j j = 1, m . )
10
Mediana
2. Mediana (median, în engl.) reprezintă valoarea din
mijlocul unei serii de date ordonate.
- este un indicator mediu de poziţie care face parte din categoria
cuantilelor
- mediana este un indicator al tendinţei centrale, fiind situată în
centrul seriei
- 50% dintre valori sunt situate la stânga medianei, iar 50% la
dreapta medianei
- ia în consideraţie doar poziţia observaţiilor în serie, nu şi mărimea
lor efectivă (nu este afectată de prezenţa valorilor extreme).
11
Mediana
Pentru a determina mediana se introduce noţiunea de ranguri,
adică numere de ordine asociate observaţiilor, de la cea mai
mică (cu rangul 1), până la cea mai mare (rangul n)
Rangul (locul ) medianei va fi, atunci, (n+1)/2, deci rangul
unităţii din mijlocul seriei.
Exemplu
Pentru o serie numerică de forma {30, 32, 40, 35, 32, 37, 34, 32, 35, 41},
mediana se determină astfel:
- ordonăm crescător valorile seriei: {30, 32, 32, 32, 34, 35, 35, 37, 40, 41}
- calculăm locul medianei: Loc Me = (n+1)/2 = 11/2=5,5
- mediana este valoarea cuprinsă între al 5-lea şi al 6-lea termen al seriei
ordonate şi se calculează ca fiind media aritmetică a celor doi termeni aflaţi în
centrul distribuţiei:
Astfel, jumătate dintre valorile seriei sunt mai mici decât valoarea 34,5.
12
Mediana
13
Mediana
- Pentru o repartiţie de frecvenţe pe intervale de variaţie, mediana se va
încadra în intervalul median
- Intervalul median este primul interval cu frecvenţa cumulată mai mare decât
locul (rangul, poziţia) medianei.
1 r
ni + 1 − FC ( Me−1)
2 i =1
Me = xinf Me + hMe ,
nMe
unde:
xinf Me reprezintă limita inferioară a intervalului median;
hMe reprezintă mărimea intervalului median;
1 r
n +1
ni + 1 =
2 i =1 2 reprezintă locul medianei în serie;
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului ante-rior celui median;
nMe reprezintă frecvenţa absolută a intervalului median.
14
Mediana
Mediana poate fi determinată şi pentru variabilele
nenumerice măsurate pe scala ordinală.
Pentru o variabilă nenumerică, determinarea medianei
este mai uşoară dacă datele sunt sistematizate
Se parcurg următorii paşi :
- calcularea frecvenţelor cumulate crescător, (Fci)
- determinarea locului medianei cu formula (n+1)/2
- determinarea Me ca fiind valoarea (varianta)
corespunzătoare primei frecvenţe cumulate mai mare
decât (n+1)/2
15
Mediana
În cazul datelor privind clasamentul general la competiţiile
internaţionale oficiale pentru Federaţia Română de Atletism, în anul
2006, mediana se determină astfel:
Locul Nr. sportivi Frecvenţe cumulate (Fci)
I 50 50
Me = II 36 86>65
III 31 117
IV 2 119
V 3 122
VI 7 129
Total 129 -
Loc Me = 130/2 = 65, iar valoarea mediană este locul II, ceea ce
înseamnă că jumătate dintre cei 129 de sportivi situaţi în primele şase
locuri la competiţiile internaţionale, au ocupat locurile I şi II, sau, astfel
spus, jumătate dintre cei 129 de sportivi s-au clasat pe locurile III, IV, V
şi VI.
16
Indicatori ai poziţiei relative – cuantilele
17
Indicatori ai poziţiei relative – cuantilele
Cuantilele de ordin 4 (cuartile, notate Q1, Q2, Q3, care împart seria
în patru părţi egale, delimitând câte 25% din observaţii, Q2=Me)
18
Indicatori ai poziţiei relative – cuantilele
19
Modul
3. Modul (Mo, mode în engl.) reprezintă valoarea cel mai
des întâlnită într-o serie de date (valoarea care are cea
mai mare frecvenţă de apariţie)
Valoarea modală se poate determina pentru orice tip de variabilă (nenumerică sau
numerică), indiferent de scala de măsurare.
Modul este singurul indicator ce poate fi determinat pentru variabilele măsurate pe scala
nominală.
Grafic, într-o histogramă ori poligon al frecvenţelor, modul reprezintă valoarea de pe abscisă,
corespunzătoare vârfului reprezentării.
O serie de date statistice poate să aibă una sau mai multe valori modale.
20
Modul
ni
ni
a) b)
xi
xi
Mo Mo1 Mo2
ni
c)
xi
Mo1 Mo2 Mo3
21
Modul
I. Determinarea modului pentru o variabilă nenumerică
Ştiinţele naturii 44
Istoria tehnicii şi ştiinţei 21
Istorie 117
Etnografie 115
Mo = Istoria culturii ni max = 152
Artă 149
Mixte 70
Total 668
Sursa: Anuarul Statistic al României, 2016.
22
Modul
II. Determinarea modului pentru o variabilă numerică
Pentru o serie numerică de forma {30, 32, 40, 35, 32, 37, 34,
32, 35, 41}, Mo = 32, deoarece valoarea 32 apare de cele mai
multe ori.
Dacă toate valorile apar cu aceeaşi frecvenţă spunem că seria nu are mod.
23
MODUL
1
Mo = x0 + h
1 + 2
unde:
• x0 este limita inferioară a intervalului modal;
• h este mărimea intervalului modal;
24
Modul
Exemplu
Se cunoaşte distributia a 200 de agenti economici in functie de cifra de afaceri:
5-15 5
15-25 15
25-35 120
35-45 40
45-55 20
Total 200
120 − 15
Mo = 25 + 10 = 30,67
(120 − 15) + (120 − 40)
Cele mai multe firme au realizat o cifră de afaceri de aproximativ 30,67 zeci mii euro. 25
Analiza comparativă a indicatorilor tendinţei centrale
26
Analiza comparativă a indicatorilor tendinţei centrale
27
Analiza comparativă a indicatorilor tendinţei centrale
28
Analiza comparativă indicatorilor tendinţei centrale
(
x − M 0 3 x − Me )
29