Documente Academic
Documente Profesional
Documente Cultură
1.
Statistica descriptiv
2. Tabele de contingen
3. Testarea neparametric
4. Testarea parametric
5.
Eantionarea
6.
7.
Corelarea i regresia
8.
Analiza discriminant
Caracteristici
Tip scal
Clasificri
Ordonri
Intervale
egale
Intervale
proporionale
Nominal
Ordinal
Interval
Proporional
20-29
30- 39
40-49
(interval)
2.1.
n cazul unei distributii simple a frecventei sunt
necesari urmatorii pasi:
Valoarea, X
Frecvena, f
1
2
3
4
5
6
7
8
9
10
2
0
1
3
4
4
9
7
3
2
n cazul datelor nominale n prima coloan sunt incluse valorile calitative ale
acestora (cuvinte, nu cifre)
Rezolvare:
1.
X = (4, 5, 6, 7, 8, 10, 10, 10, 11, 12, 12, 12, 14, 14, 14, 14, 14, 15, 15, 15, 16,
16, 16, 17,17, 17, 17,17, 18, 18, 18, 18, 19, 19, 19, 19, 20, 21, 21, 22, 22,
23, 23, 24, 25, 27, 29, 31).
2.
3.
4.
Rezolvare:
De exemplu,
Rezolvare:
Opiuni de intervale pentru h=3
Intervale [2;31]
1
24
2
57
3
810
4
1113
5
1416
6
1719
7
2022
8
2325
9
2628
10
2931
Extremiti
[3;32] [4;33]
35
46
68
79
911
1012
1214 1315
1517 1618
1820 1921
2123 2224
2426 2527
2729 2830
3032 3133
Media
Mediana
Modul
Media
fi * Xi
X =
fi
fi = 48
Centrul (Xi)
31
28
25
22
19
16
13
10
7
4
Frecventa (fi)
1
2
2
6
9
11
8
4
3
2
Xi * f i
31
56
50
132
171
176
104
40
21
8
= 48
= 789
Mediana
Mediana este acel parametru care prin pozitia sa, se afla n mijlocul seriei
de date. Ea reprezinta punctul central al seriei, deoarece la stnga si la
dreapta ei se situeaza cte 50% din totalitatea datelor. Mediana coincide
cu media n cazul unei distributii teoretice normale si se ndeparteaza mult
de aceasta daca distributia este asimetrica.
1.
2.
Cnd n este par sunt adunate valorile din centrul seriei si se mpart la doi.
Me = 8.
10
exemplu
Intervalul
30-32
27-29
24-26
21-23
18-20
15-17
12-14
9-11
6-8
3-5
Centrul i
31
28
25
22
19
16
13
10
7
4
Frecventa (fi)
1
2
2
6
9
11
8
4
3
2
Frecventa cumulata
48
47
45
43
37
28
17
9
5
2
48 1
17
Me 14,5 3 2
16,6
11
Stabilirea punctului mai jos i mai sus de care se situeaza cte 50% din cazuri
(N+1)/2. n cazul dat vom avea (48+1)/2=24,5;
Se calculeaza frecventele cumulate, care preced clasa care contine mediana 17;
11
Cuartilele i decilele
Cuartilele sunt acele valori ale caracteristicii, care separ seria n patru pri
egale:
cuartila inferioar, notat cu Q1, este mai mare sau egal de 25% din termenii
seriei i mai mic sau egal de 75% dintre ei;
cuartila superioar Q3 este mai mare sau egal de 75% din numrul termenilor i
mai mic sau egal de 25% din numrul lor.
n cazul n care se calculeaz decilele, seria se divide n zece pri egale folosind n
acest scop nou decile (D1, D2 D9).
Cuartilele i decilele
N 1
ncpq
Q1 x 0 h 4
nq
unde:
Q1, Q3 cuartila 1 (25%) i 3 (75%)
x0 este limita inferioar a intervalului cuartilei,
decilei
( N 1)
ncpq
4
Q 3 x0 h
nq
( N 1)
n cpd
10
D1 x0 h
nd
12
exemplu
Intervalul
30-32
27-29
24-26
21-23
18-20
15-17
12-14
9-11
6-8
3-5
Centrul i
31
28
25
22
19
16
13
10
7
4
Frecventa (fi)
1
2
2
6
9
11
8
4
3
2
Frecventa cumulata
48
47
45
43
37
28
17
9
5
2
48 1
28
4
Q 3 17,5 3
20,4
9
3
Modul
Modul este parametrul care corespunde celei mai mari frecvente, adica este valoarea
cea mai frecvent ntlnita.
13
Pentru date grupate, se cauta intervalul care are cea mai mare frecven. n
cazul de mai jos, acest interval este 1517, n interiorul caruia se afla 11
valori.
Frecventa (f)
11
8
4
3
2
14
i 1
(
i 1
Unde:
Xi sunt valorile individuale;
X este media esantionului;
este media populatiei
N, n este numarul de subiecti observati
(mrimea populaiei i respectiv, a eantionului)
Exemplu
X-X
-2,6
-0,6
0,4
2,4
1,4
-1,6
1,4
-3,6
3,4
-0,6
(X-X) 2
6,76
0,36
0,16
5,76
1,96
2,56
1,96
12,96
11,56
0,36
(XX)2 = 44,40
44,40
2,10
10
15
(x
i 1
) 2 ni
S
n
i 1
( xi x ) ni
i 1
ni
i 1
Exemplu
De calculat S pentru urmatoarele date:
(i)
Xi
ni
(Xi-X)
(Xi-X)2
ni * (Xi-X)2
30-32
31
213,2
213,2
28
11,6
134,6
269,1
24-26
25
8,6
73,96
147,9
21-23
22
5,6
31,36
188,2
18-20
19
2,6
6,76
60,84
15-17
16
-0,4
0,16
1,76
12-14
13
-3,4
11,56
92,48
9-11
10
-6,4
40,96
163,8
6-8
-9,4
88,36
265,1
3-5
1
2
2
6
9
11
8
4
3
2
14,6
27-29
-12,4
153,8
307,5
X = 16,4
ni = 48
ni *(XX)2 = 1709,9
1709,9
5,97
48
16
Coeficientul de variaie
S
100
x
V = (2,7/11,4)*100 = 23,68%
daca V este cuprins ntre 0 si 15%, atunci mprastierea datelor (variaia) este
foarte mica, iar media este reprezentativ, deoarece eantionul msurat este
omogen;
daca valoarea lui este ntre 15 si 30%, variaia datelor este mijlocie, media fiind
nca suficient de reprezentativa;
17
Indicele
mediana,
Vorbim despre o asimetrie negativ n situatia n care media este mai mic dect
caz n care indicele de asimetrie ia valori negative si apare o deplasare a
datelor spre dreapta.
mediana,
Reprezentarea grafic
fi
fi
fmax
fi
fmax
xi
x =Me=Mo
serie perfect simetric
fmax
xi
Mo Me x
asimetrie pozitiv
xi
x
Me Mo
asimetrie negativ
18
Asimetrie (skewness)
a
1
2
2
3
3
3
4
4
4
4
5
5
5
6
6
7
d
0
0
0
0
0
0
0
0
0
0
0
0
0
1
2
3
e
2
2
2
2
2
2
2
2
2
2
2
2
2
1
0
0
19
Ca = 0,000
Ca = 2,411
20
Ca = -2,082
Boltire (kurtosis)
( x i x )
4
n
21
Boltire: 2 cazuri
b
1
1
1
1
1
1
1
5
6
9
9
9
9
9
9
9
c
1
2
3
3
3
3
3
3
3
3
3
3
3
3
4
5
Cb = - 2,118
22
Cb = 3,913
Vnzri lunare
(mii lei)
Nr. comis
voiajori
41 50
10
51 60
30
61 70
50
71 80
50
81 90
70
91 100
60
101 110
30
Total
300
= 16,10
23
asimetrie
Coeficientul de asimetrie se calculeaz n baza formulei:
( x i x )
n 3
C as
ni
315797
300 16 , 07
0 , 254
6 / n
6 / 300 0 ,141
C as /
6 / n 2 ; 2
boltire
Coeficientul de boltire se calculeaz conform formulei:
Cb
( x i x ) 4n i
3
n 4
43620028
2 ,1806
300 16 , 07 4
3 0 ,819
Cb /
24 / n 2 ; 2
24