Documente Academic
Documente Profesional
Documente Cultură
1 Introducere
Niveluri de msur
Alegerea unei tehnici statistice depinde de nivelul la care au fost msurate variabilele de interes. Nivelurile de msur ale variabilelor sunt clasificate ntr-o ierarhie, n funcie de complexitatea lor. Orice tehnic statistic aplicabil la nivelul n este aplicabil la nivelul n + 1, reciproca nefiind valabil. Msurarea unei variabile la nivel nominal const din clasificarea diferitelor cazuri n categoriile prestabilite ale unei variabile. Exemple: sex, denominaia religioas, culoarea ochilor. n cazul msurrii la nivel ordinal, pe lng clasificarea cazurilor n categorii, cazurile repartizate ntr-o categorie sau alta pot fi ordonate, n funcie de gradul calitativ n care acestea posed trstura msurat. Exemplu: nivel de colarizare .
Niveluri de msur
n msurarea la nivel de interval, pe lng clasificare i ordonare, distanele (intervalele) dintre oricare dou cazuri aflate n categorii succesive sunt egale. Cu alte cuvinte, la acest nivel variabilele sunt msurabile n uniti care au intervale egale. Exemplu: nivelul de stabilitate emoional. La acest nivel sunt permise toate operaiile matematice. n msurarea la nivel de raport, pe lng toate trsturile unei msurri de interval, se poate determina msura exact
(proporia) n care un caz aflat ntr-o categorie satisface caracteristica msurat, n raport cu un caz aflat ntr-o alt categorie i apare un punct zero natural, care reflect absena caracteristicii msurate. Exemple: vechimea n munc, venitul.
Procente i proporii
f 1. Proporie (p) = n f 100 2. Procent (%) = n
f = frecvena sau numrul de cazuri n fiecare
This image cannot currently be display ed. This image cannot currently be display ed.
Procente i proporii
Tabelul 1 Opinia fa de interzicerea fumatului n locurile publice Opinia Acord Dezacord Nu tiu/Nu rspund TOTAL Frecvena (f) Proporia (p) Procentul (%) 167 72 30 269 0,621 0,268 0,111 1,000 62,1 26,8 11,1 100,0
Procente i proporii
Tabelul 2 Numrul de studeni nscrii pe specializri la dou universiti
Universitatea A Universitatea B 103 82 137 93 415 312 279 188 217 996
10
Procente i proporii
Tabelul 3 Procentul de studeni nscrii pe specialiti la dou universiti
Universitatea A Universitatea B 24,8 19,8 33,0 22,4 100,0 (415) 31,3 28,0 18,9 21,8 100,0 (996)
11
Raporturi
fi 3. Raport = fj fi = numrul de cazuri din categoria i fj = numrul de cazuri din categoria j
This image cannot currently be display ed.
Raportul ne spune n ce msur categoria i depete n numr de cazuri categoria j. Raportul studenilor nscrii la tiine economice fa de cei nscrii la Psihologie n Universitatea B este 279/188 = 1,48: pentru fiecare student la Psihologie exist 1,48 studeni la tiine economice.
12
Distribuii de frecvene
Tabelul 4 Scoruri obinute la un test de cunotine (180 subieci)
68 55 65 42 64 45 56 59 56 42 38 50 37 42 53 52 54 57 49 63 54 38 46 49 33 43 40 29 43 60 69 54 64 41 63 44 55 58 55 41 37 49 36 41 52 51 53 49 48 64 55 37 47 50 34 44 39 30 42 61 43 33 51 50 54 63 68 57 43 56 54 47 37 52 49 36 48 56 24 45 55 46 58 45 32 56 55 49 47 55 44 32 50 49 53 62 67 56 42 55 53 46 36 51 48 35 47 48 25 46 56 45 59 46 33 57 54 50 46 56 54 47 53 53 50 50 65 60 53 40 57 39 36 63 38 57 57 56 55 40 46 48 62 40 45 46 56 44 48 48 55 48 52 52 49 49 64 59 52 39 56 38 35 62 37 56 56 55 56 41 47 49 63 41 46 45 55 45 49 47
13
Distribuii de frecvene
Tabelul 5 Distribuie de frecvene pentru datele din Tabelul 4
Scorul 24 25 26 27 28 29 30 31 32 33 34 35
f
1 1 0 0 0 1 1 0 2 3 1 2
Scorul 36 37 38 39 40 41 42 43 44 45 46 47
f
4 5 4 3 4 5 5 4 4 7 9 7
Scorul 48 49 50 51 52 53 54 55 56 57 58 59
f
8 11 7 3 6 7 7 12 14 6 2 3
Scorul 60 61 62 63 64 65 66 67 68 69
f
2 1 3 5 4 2 0 1 2 1
14
Distribuii de frecvene
Tabelul 6 Distribuie de frecvene cu intervale de clas (n = 5) pentru datele din Tabelul 4
Intervale de clas
2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL
f
1 2 7 18 22 42 30 37 15 6 180
% 0,56 1,11 3,89 10,00 12,22 23,33 16,67 20,56 8,33 3,33 100,0
15
16
f
1 2 7 18 22 42 30 37 15 6 180
fc
1 3 10 28 50 92 122 159 174 180
% 0,56 1,11 3,89 10,00 12,22 23,33 16,67 20,56 8,33 3,33 100,0
%c 0,56 1,67 5,56 15,56 27,78 51,11 67,78 88,34 96,67 100,0
17
f
1 2 7 18 22 42 30 37 15 6 180
20
n care X i = suma scorurilor dintr-o mulime de scoruri n = numrul total de scoruri din mulime Media aritmetic se calculeaz doar pentru variabile msurate la nivel de interval/raport. Pentru media aritmetic a unei populaii se folosete simbolul .
22
f
1 4 1 2 3
TOTAL 11
23
24
(X
X) = 0
Cu alte cuvinte, suma diferenelor dintre scoruri i media lor aritmetic este egal cu 0. Aceast proprietate arat c pentru orice distribuie de scoruri, media aritmetic este punctul n jurul cruia toate scorurile se anuleaz.
25
(X X)
i
<
(X X )
i j
Aceast proprietate arat c media aritmetic este punctul n jurul cruia suma abaterilor ptratice ale scorurilor este minim.
26
Xi X
3 2 2 2 2 1 0 0 4 4 4 0
( X i X )2
9 4 4 4 4 1 0 0 16 16 16 74
X i 17 1 0 0 0 0 1 2 2 6 6 6
( X i 17) 2
1 0 0 0 0 1 4 4 36 36 36 118
27
30
O distribuie unimodal este simetric, dac media aritmetic i mediana au aceeai valoare.
Frecvena
~ X = X
Cel mai nalt punct al curbei este modul, deoarece este punctul n care sunt nregistrate cele mai multe cazuri, este mediana, deoarece numrul de cazuri nregistrate la stnga acestui punct este egal cu numrul de cazuri nregistrat la dreapta sa i este media aritmetic, deoarece scorurile aflate n partea dreapt ntrec scorul median n aceeai msur n care scorurile aflate n partea stng sunt mai mici dect scorul median.
31
Frecvena
~ X X
32
Frecvena
~ X
33
n X
i
n care ni = numrul de scoruri din fiecare grup X i = media aritmetic a fiecrui grup N = numrul total de scoruri
34
Dac am fi fcut media aritmetic a valorilor 7,33 i 8,45 am fi obinut 7,89, ceea ce ar fi fost incorect, deoarece grupurile difer n privina numrului de scoruri.
35
Percentile
Poziia unui scor individual ntr-o distribuie poate fi determinat cu ajutorul percentilelor. Cea de-a m-a percentil a unei mulimi de scoruri, Pm, este valoarea fa de care cel mult m% din scoruri sunt mai mici dect m i cel mult (100 m)% din scoruri sunt mai mari dect m. ntruct mediana unei mulimi este valoarea fa de care cel mult 50% din scoruri sunt mai mici i cel mult 50% din scoruri sunt mai mari, mediana este cea de-a 50-a percentil a acelei mulimi. Tot aa cum exist un nume special pentru cea de-a 50-a percentil a unei mulimi de scoruri, exist nume speciale pentru percentilele care mpart o mulime ordonat de scoruri n sferturi i n zecimi: cuartile i, respectiv, decile.
36
Percentile
Lista urmtoare prezint cele mai utilizate percentile, mpreun cu simbolurile uzuale pentru cuartile i decile (considernd c este vorba despre o mulime de scoruri ordonat cresctor):
D1 = Prima decil = P10 Q1 = Prima cuartil = P25 Q2 = A doua cuartil = P50 = Q3 = A treia cuartil = P75 D9 = A noua decil = P90
~ X
37
Percentile
Fie urmtoarea mulime ordonat de 15 scoruri: 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30 Prima cuartil este valoarea fa de care cel mult 25% din scoruri, i.e. cel mult 3,75 din scoruri sunt mai mici i cel mult 75% din scoruri, i.e. 11,25 scoruri sunt mai mari. Deci Q1 = 5. Cea de-a doua cuartil, mediana, este scorul central, i.e. 12. Cea de-a treia cuartil este valoarea fa de care cel mult 75% din scoruri, i.e. 11,25 din scoruri sunt mai mici i cel mult 25% din scoruri, i.e. 3,75 scoruri sunt mai mari. Deci Q3 = 21.
38
Percentile
Uneori, percentila cutat cade ntre dou scoruri din mulimea respectiv. ntr-un astfel de caz, prin convenie, se ia media aritmetic a celor dou scoruri pentru a aproxima percentila cutat. Cea de-a 20-a percentil din mulimea de mai sus ar fi valoarea fa de care cel mult 3 scoruri sunt mai mici i cel mult 12 scoruri sunt mai mari. ntruct orice numr cuprins ntre 4 i 5 (inclusiv) satisface acest criteriu, vom lua 4,50 drept cea de-a 20-a percentil.
39
Mrimile dispersiei
Mrimile dispersiei furnizeaz informaii despre eterogenitatea sau varietatea unei distribuii de scoruri. De exemplu, o medie aritmetic de 6,33 poate fi obinut dintro mulime de scoruri similare, concentrate n jurul acestei valori precum 6, 6, 7 sau dintr-o mulime de scoruri nesimilare, mprtiate n raport cu aceast valoare precum 1, 8, 10. n cazul unor scoruri similare sau cu variabilitate sczut, media aritmetic este mai adecvat pentru msurarea tendinei centrale dect n cazul unor scoruri nesimilare sau cu variabilitate nalt. Cele mai des folosite mrimi ale dispersiei: indicele variaiei calitative, amplitudinea i amplitudinea intercuartilic, abaterea standard i coeficientul de variaie.
40
Colectivitatea
A
90 0 0 90
B
60 20 10 90
C
30 30 30 90
42
k(n2 f 2 ) n2 (k 1)
n care k = numrul de categorii n = numrul total de cazuri din cele k categorii f 2 = suma ptratelor frecvenelor din fiecare categorie
43
IQV =
IQV =
A = Xmax Xmin
Amplitudinea intercuartilic (Q) este diferena dintre cea de-a treia i prima cuartil a unei distribuii de scoruri ordonate cresctor:
Q = Q3 Q1
Pentru mulimea de scoruri 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30, A = 30 2 = 28 i Q = 21 5 = 16.
45
4.
s=
n 1
46
X i nX 2
2
n 1
6.
s=
Xi
(X )
i
n 1
Formula 6 este cu deosebire util n calculul s, deoarece folosete doar scorurile individuale.
47
2 i
s=
4045
49
4 Distribuia normal
Noiunea de distribuie normal este foarte important n statistic. Distribuia normal poate fi folosit n combinaie cu abaterea standard pentru a formula enunuri descriptive precise despre distribuii particulare i st la baza multor tehnici statistice infereniale.
n onoarea matematicienilor Carl Friedrich Gauss i Pierre Simon de Laplace, care au descoperit independent dinstribuia normal n secolul al XIX-lea, curba normal este numit i clopotul lui Gauss sau curba Gauss-Laplace.
51
Xi X Z= s
Aceast formul transform orice scor brut Xi n scorul Z corespunztor. Numrtorul fraciei indic distana n uniti brute a scorului Xi fa de media aritmetic. Prin mprirea acestei distane la s aflm distana n (fraciuni de) abateri standard a scorului Xi fa de medie.
53
55
57
68,26
13,59
13,59
2,15 0,13 +3
58
Aria dintre Z = +0,75 i medie = 27,34% din aria total. Aria aflat sub medie = 50% din aria total. Procentul de cazuri cu IQ 115 este 27,34% + 50% = 77,34% (aproximativ 773 de subieci au scoruri IQ 115). Acelai model de calcul se utilizeaz pentru a afla aria situat peste un scor Z negativ.
59
+0,75
1,25
Aria dintre Z = 1,25 i medie = 39,44% din aria total. Procentul de cazuri cu IQ 75 = 50% 39,44 = 10,56% (aproximativ 105 subieci au scoruri IQ < 75). Acelai model de calcul se utilizeaz pentru a afla aria situat peste un scor Z pozitiv.
60
0,25 +1,25
Aria dintre Z = 0,25 i medie = 9,87% din aria total, iar aria dintre Z = +1,25 i medie =39,44% din aria total. Procentul de cazuri cu 95 IQ 125 este de 9,87% + 39,44% = 49,31% (aproximativ 493 de subieci au scoruri 95 IQ 125).
61
+0,75 +1,25
Aria dintre un Z = +0,75 i medie = 27,34% din aria total. Aria dintre un Z = +1,25 i medie = 39,44% din aria total. Procentul de cazuri cu 115 IQ 125 este de 39,44 27,34 = 12,10 (aproximativ 121 de subieci au scoruri 115 IQ 125).
62