Documente Academic
Documente Profesional
Documente Cultură
2011
Statistica descriptivă
1. Organizarea datelor
2. Tendința centrală
3. Variația (împrăștierea) datelor
4. Asimetria și boltirea
distribuției
1
14.03.2011
1. …
1. …
Obținem: (N=35)
Valoarea X Frecventa f
1 2
2 0
3 1
4 3
5 4
6 4
7 9
8 7
9 3
10 2
2
14.03.2011
N=20
2. …
Cantitate 2
Calitate 6
Utilitate 3
Pret 9
3
14.03.2011
Exemplu:
De ordonat pe intervale, rezultatele intervievării a 48 de
subiecti.
X = (17, 12, 8, 5, 10, 12, 23, 21, 22, 11, 14, 20, 18, 17, 15,
14, 21, 7, 10, 14, 18, 23, 25, 18, 17, 16, 29, 14, 19, 6, 27,
15, 17, 19, 14, 16, 10, 24, 17, 19, 15, 16, 12, 4, 22, 31, 19,
18).
4
14.03.2011
METODA 1: exemplu
5
14.03.2011
• Media
• Mediana
• Modul
6
14.03.2011
Media
7
14.03.2011
Mediana
Mediana este acel parametru care prin pozitia sa, se afla în mijlocul
seriei de date. Ea reprezinta punctul central al seriei, deoarece la
stânga si la dreapta ei se situeaza câte 50% din totalitatea datelor.
Mediana coincide cu media în cazul unei distributii teoretice
normale si se îndeparteaza mult de aceasta daca distributia este
asimetrica.
Pentru a calcula mediana în cazul distributiei simple a datelor
exista doua situatii:
1. Când n este impar locul medianei se stabileste astfel:
Loc mediana = (n+1) / 2
2. Când n este par sunt adunate valorile din centrul seriei si se împart
la doi.
8
14.03.2011
N +1
− ncpm
Me = x0 + h 2
nm
unde: x0 este limita inferioară a intervalului median
h este mărimea intervalului median (ceea ce am notat mai sus cu i)
N este numarul total al cazurilor
nm este frecvența intervalului median
ncpm este frecvențele cumulativă până la intervalul median
9
14.03.2011
… exemplu
10
14.03.2011
Cuartilele și decilele
Cuartilele sunt acele valori ale caracteristicii, care separă seria în patru
părŃi egale:
cuartila inferioară, notată cu Q1, este mai mare sau egală de 25% din
termenii seriei şi mai mică sau egală de 75% dintre ei;
cuartila a doua Q2 și decila a cincea D5 coincide cu Me şi separă seria în
două părŃi egale;
cuartila superioară Q3 este mai mare sau egală de 75% din numărul
termenilor şi mai mică sau egală de 25% din numărul lor.
În cazul în care se calculează decilele, seria se divide în zece părŃi egale
folosind în acest scop nouă decile (D1, D2 … D9).
Cuartilele și decilele
N +1
− ncpq unde:
Q1 = x0 + h 4 Q1, Q3 – cuartila 1 (25%) și 3 (75%)
nq x0 este limita inferioară a intervalului
( N + 1) cuartilei, decilei
3 − ncpq h este mărimea intervalului cuartilei, decilei
Q 3 = x0 + h 4
N este numarul total al cazurilor
nq
nq și nd frecvența intervalului cuartilei,
( N + 1) decilei
1 − ncpd ncpq și ncpd - frecvențele cumulative până la
D1 = x0 + h 10
intervalul cuartilei, decilei
nd
11
14.03.2011
… exemplu
Modul
12
14.03.2011
Pentru date grupate, se cauta intervalul care are cea mai mare
frecventa. În cazul nostru, acest interval este 18-20 în interiorul
caruia se afla 10 valori.
Valoarea modala este egala cu valoarea gasita în centrul acestui
interval, în cazul de fata Mo = 19.
Intervalul (i) Frecventa (f) Intervalul (i) Frecventa (f)
30-32 (31) 1 15-17 (16) 9
27-29 (28) 2 12-14 (13) 5
24-26 (25) 4 9-11 (10) 5
21-23 (22) 6 6-8 (9) 3
18-20 (19) 10 3-5 (4) 2
13
14.03.2011
N n
∑ (x − µ)
i
2
∑ (x − x)
i
2
σ= i =1
S= i =1
N n
Exemplu
14
14.03.2011
k
k
∑ (x − µ) n
i
2
i ∑ (x − x) n
i
2
i
σ= i =1
k S= i =1
k
∑n
i =1
i ∑n
i =1
i
Exemplu
15
14.03.2011
Coeficientul de variabilitate
S
V= ⋅100
x
Unde: S este abaterea standard a esantionului studiat; X este media
eșantionului.
Spre exemplu, daca X = 11,40, iar S = 2,7, vom avea:
V = (2,7/11,4)*100 = 23,68%
Pentru cazul de mai sus V = (6,28/17,5)*100 = 36%
Interpretarea coeficientului de
variabilitate
16
14.03.2011
Asimetrie (skewness)
∑ ( xi − x )3
Ca =
nσ 3
17
14.03.2011
Reprezentarea grafică
fi fi fi
fmax fmax fmax
xi xi xi
x =Me=Mo Mo Me x x Me Mo
Boltire (kurtosis)
18
14.03.2011
91 – 100 60 Me = 86,67
mii lei
101 – 110 30
x = 80,17 mii lei
Total 300
σ = 16,10
… asimetrie
C as / 6 / n ∈ [− 2 ; + 2 ]
19
14.03.2011
… boltire
24 / n = 24 / 300 = 0 , 283
Cb / 24 / n ∈ [− 2 ; + 2 ]
Adică în cazul nostru: − 0 , 819 / 0 , 283 = − 2 , 89 ∉ [− 2 ; + 2 ]
Adică putem vorbi despre un nivel de aplatizare excesiv
20