Documente Academic
Documente Profesional
Documente Cultură
f
Formula 2.1 Proporţie ( p ) =
n
f
Formula 2.2 Procent (%) = 100
n
Pentru a afla proporţia cazurilor din prima categorie (De acord cu interzicerea
fumatului în locurile publice), notăm că avem aici 167 de cazuri ( f = 167) faţă de 269
de cazuri în eşantion (n = 269). Astfel:
f 167
Proporţie ( p ) = = = 0, 621
n 269
Procedând la fel, aflăm proporţiile cazurilor din celelalte categorii. Rezultatele pot fi
exprimate sub formă de procente. Astfel, procentul de cazuri din cea de-a treia categorie
(Nu ştiu/Nu răspund) este
f 30
Procent (%) = 100 = 100 = 11,1%
n 269
Să considerăm din nou tabelul 2.2. Cât de mulţi studenţi sunt înscrişi la Ştiinţe
economice în comparaţie cu cei înscrişi la Psihologie în Universitatea B? Putem folosi
frecvenţele pentru a răspunde la această întrebare, dar un răspuns mai uşor de înţeles
poate fi dat folosind un raport. Raporturile se calculează împărţind frecvenţa cazurilor
dintr-o categorie la frecvenţa cazurilor din altă categorie, permiţând astfel compararea
categoriilor în termeni de frecvenţă relativă. Definiţia matematică a raportului este
următoarea:
fi
Formula 2.3 Raport =
fj
fi 279
Raport = = = 1,48
fj 188
Aceasta înseamnă că pentru fiecare student înscris la Psihologie există 1,48 studenţi
înscrişi la Ştiinţe Economice.
Raporturile pot fi multiplicate cu 100 pentru a elimina virgulele. Astfel, raportul
calculat mai sus poate fi prezentat ca 148, ceea ce înseamnă că pentru fiecare 100 de
studenţi înscrişi la psihologie există 148 de studenţi înscrişi la Ştiinţe Economice.
Ratele se calculează împărţind numărul de cazuri reale (efective) la numărul de
cazuri posibile pentru variabila de interes pe o anumită unitate de timp. De pildă, rata
brută a natalităţii pentru o populaţie se calculează împărţind numărul de născuţi vii la
numărul total de persoane din acea populaţie pe an, câtul astfel obţinut fiind înmulţit cu
1000. Se spune că rezultatul este exprimat în promile (0/00). Dacă, de pildă, într-un oraş
cu 7000 de locuitori s-au înregistrat într-un anumit an 100 de născuţi vii, rata brută a
natalităţii este
100
Rata brută a natalităţii (0/00) = 1000 0,0143 1000 14,3 0/00
7000
Aceasta înseamnă că pentru fiecare mie de locuitori au fost în acel an 14,3 născuţi vii.
Ca modalităţi de a exprima frecvenţe relative, procentele, proporţiile, raporturile
şi ratele sunt utile în special atunci când dorim să comparăm diferite grupuri sau/şi
acelaşi grup în momente diferite.
2 PREZENTAREA DATELOR STATISTICE Pagina 5 din 16
68 52 69 51 43 36 44 35 54 57 55 56
55 54 54 53 33 48 32 47 47 57 48 56
65 57 64 49 51 56 50 48 53 56 52 55
42 49 41 48 50 24 49 25 53 55 52 56
64 63 63 64 54 45 53 46 50 40 49 41
45 54 44 55 63 55 62 56 50 46 49 47
56 38 55 37 68 46 67 45 65 48 64 49
59 46 58 47 57 58 56 59 60 62 59 63
56 49 55 50 43 45 42 46 53 40 52 41
42 33 41 34 56 32 55 33 40 45 39 46
38 43 37 44 54 56 53 57 57 46 56 45
50 40 49 39 47 55 46 54 39 56 38 55
37 29 36 30 37 49 36 50 36 44 35 45
42 43 41 42 52 47 51 46 63 48 62 49
53 60 52 61 49 55 48 56 38 48 37 47
Datele brute din tabelul 2.4 sunt greu de urmărit şi greu de înţeles. Sub supoziţia
că este vorba despre date de interval, putem construi o distribuţie de frecvenţe listând
scorurile diferite în ordine crescătoare şi înregistrând frecvenţa de apariţie a fiecărui
scor. Distribuţia de frecvenţe astfel obţinută este următoarea:
Intervale de clasă f %
20–24 1 0,56
25–29 2 1,11
30–34 7 3,89
35–39 18 10,00
40–44 22 12,22
45–49 42 23,33
50–54 30 16,67
55–59 37 20,56
60–64 15 8,33
65–69 6 3,33
TOTAL 180 100,0
3. Se stabileşte primul interval astfel încât să conţină cel mai mic scor (limita sa
inferioară să fie mai mică sau egală cu cel mai mic scor). Ultimul interval va
fi acela care conţine cel mai mare scor. Intervalele nu trebuie să se
suprapună.
Fiecare dintre aceste intervale conţine cinci scoruri2, inclusiv scorul 24, deci poate fi
ales. În exemplul nostru am ales intervalul 20–24. Ca atare, următorul interval este 25–
29 ş.a.m.d. până la ultimul interval, 65–69, care conţine cel mai mare scor. De notat că
intervalele din tabelul 24 par a nu fi reciproc exclusive. În realitate lucrurile nu stau aşa.
Dacă, după intervalul 20–24 ar fi urmat 24–28, 28–32 ş.a.m.d., am fi obţinut intervale
suprapuse două câte două. Scorul 24, de pildă, ar fi făcut parte atât din intervalul 20–24,
cât şi din intervalul 24–28. Intervalele de clasă din tabelul 2.6 sunt exhaustive (acoperă
toate scorurile din mulţimea iniţială de scoruri) şi reciproc exclusive (fiecare scor face
parte dintr-un singur interval).
Distribuţiile de frecvenţe pentru date de interval sau de raport pot conţine două
instrumente ajutătoare în prezentarea datelor: frecvenţe cumulate şi procente cumulate.
Frecvenţele cumulate prezintă numărul de cazuri dintr-un interval de clasă şi din toate
intervalele de clasă precedente, iar procentele cumulate prezintă procentul de cazuri
1
Vvezi capitolul 3, §§3.3.2.
2
Aparent, fiecare interval acoperă doar patru scoruri. Pentru a vă convinge că nu este aşa, număraţi-le!
2 PREZENTAREA DATELOR STATISTICE Pagina 8 din 16
dintr-un interval de clasă şi din toate intervalele precedente 3. Tabelul următor prezintă o
coloană de frecvenţe cumulate şi o coloană de procente cumulate pentru distribuţia de
frecvenţe din tabelul 2.6.
Intervale de clasă f fc % %c
20–24 1 1 0,56 0,56
25–29 2 3 1,11 1,67
30–34 7 10 3,89 5,56
35–39 18 28 10,0 15,56
40–44 22 50 12,22 27,78
45–49 42 92 23,33 51,11
50–54 30 122 16,67 67,78
55–59 37 159 20,56 88,34
60–64 15 174 8,33 96,67
65–69 6 180 3,33 100,0
TOTAL 180 100,0
limite reale sau exacte. Pentru determinarea acestor limite, se împarte la doi „distanţa”
aritmetică dintre intervalele de clasă stabilite iniţial, iar rezultatul astfel obţinut se scade
din fiecare limită inferioară stabilită şi se adună la fiecare limită superioară stabilită.
Tabelul 2.8 prezintă rezultatele aplicării aceste proceduri la intervalele de clasă stabilite
în tabelul 2.6. Întrucât „distanţa” aritmetică dintre intervalele de clasă din tabelul 2.4
este de o unitate, limitele reale se află scăzând 0,5 din fiecare limită inferioară şi
adunând 0,5 la fiecare limită superioară. În tabelul 2.8 este adăugată o coloană etichetată
centre de interval. Centrele de interval sunt punctele situate exact la mijlocul unui
interval şi se află împărţind la doi suma limitelor inferioară şi superioară ale
intervalului5. De notat că centrele de interval sunt aceleaşi, indiferent dacă folosim
limite stabilite sau limite reale.
5
Centrele de interval sunt utile în construirea histogramelor.
2 PREZENTAREA DATELOR STATISTICE Pagina 10 din 16
Nivel de şcolarizare f %
1 0 0
2 61 33,89
3 82 45,56
4 24 13,33
5 7 3,89
6 6 3,33
TOTAL 180 100,0
Diagrame circulare
Status marital f %
Celibatar 63 35,0
Căsătorit 90 50,0
Divorţat 27 15,0
TOTAL 180 100,0
Persoană care nu a fost niciodată căsătorită
Să construim o diagramă circulară pentru datele din acest tabel. Întrucât circumferinţa
unui cerc are 3600, vom aloca 1260 (35% din 3600) pentru prima categorie, 1800 (50%
din 3600) pentru cea de-a doua categorie şi 54 0 (15 % din 3600) pentru cea de-a treia
categorie. Obţinem următoarea diagramă circulară:
2 PREZENTAREA DATELOR STATISTICE Pagina 11 din 16
Divorţaţi
15%
Căsătoriţi
50%
Celibatari
35%
Diagrama din figura 2.1 evidenţiază vizual preponderenţa relativă a subiecţilor căsătoriţi
şi lipsa relativă a subiecţilor divorţaţi din eşantionul considerat.
50
40
Procent
30
20
10
0
Căsătoriţi Celibatari Divorţaţi
Status m arital
2 PREZENTAREA DATELOR STATISTICE Pagina 12 din 16
30
25
20
Frecvenţa
Bărbaţi
15
Femei
10
0
ian feb mar apr mai iun
Această diagramă arată că, în timp ce numărul de angajaţi care au apelat la serviciile
centrului de consiliere psihologică în perioada menţionată a fost în creştere, numărul de
apelanţi femei a crescut mai repede decât numărul de apelanţi bărbaţi. Aceeaşi
informaţie este prezentată printr-o diagramă cu linii în figura 2.4.
30
25
20
Frecvenţa
Bărbaţi
15
Femei
10
0
ian feb mar apr mai iun
2 PREZENTAREA DATELOR STATISTICE Pagina 13 din 16
45
40
35
30
Frecvenţa
25
20
15
10
5
0
19,5 24,5 29,5 34,5 39,5 44,5 49,5 54,5 59,5 64,5 69,5
Scoruri (limite reale)
4. Se etichetează axele.
4. Se etichetează axele.
45
40
35
30
Frecvenţa
25
20
15
10
5
0
22 27 32 37 42 47 52 57 62 67
Scoruri (centre de interval)
Ogive
6. Se etichetează axele.
100
90
80
Procente cumulate
70
60
50
40
30
20
10
0
19,5 24,5 29,5 34,5 39,5 44,5 49,5 54,5 59,5 64,5 69,5
Scoruri (limite reale)
După cum vom vedea în capitolul 3, o ogivă poate fi utilizată pentru a afla
diferite puncte de interes într-o distribuţie de frecvenţe.
În capitolul 11 vom folosi diagrame de împrăştiere, numite şi „diagrame ale
norilor de puncte” sau „scatergrame 6”, care sunt modalităţi de prezentare vizuală a
corelaţiei dintre două variabile măsurate la nivel de interval sau de raport.
6
De la substantivul din limba engleză „scatter”, care înseamnă împrăştiere.
2 PREZENTAREA DATELOR STATISTICE Pagina 16 din 16
GLOSAR
2 PREZENTAREA DATELOR STATISTICE Pagina 17 din 16
Centre de interval: puncte situate exact la Limite de clasă reale: limitele superioară şi
mijlocul unui interval de clasă. inferioară ale intervalelor de clasă,
Diagramă circulară: cerc împărţit într-un folosite atunci când distribuţia de
număr de sectoare egal cu numărul de frecvenţe respectivă este considerată ca
categorii ale variabilei de interes, fiint continuă.
mărimea fiecărui sector fiind Limite stabilite: limitele superioară şi
proporţională cu procentul de cazuri din inferioară ale intervalelor de clasă, aşa
categoria respectivă.. cum apar acestea în distribuţia de
Diagramă cu coloane: modalitate de frecvenţe iniţială.
prezentare vizuală a distribuţiei unei Ogivă: modalitate de prezentare vizuală a
variabile, în care categoriile sunt frecvenţelor cumulate sau a procentelor
reprezentate prin coloane cu baza egală, cumulate ale unei distribuţii de frecvenţe
înălţimea fiecărei coloane fiind pentru variabile de interval sau de raport.
proporţională cu procentul de cazuri din Procent: numărul de cazuri dintr-o
categoria respectivă. categorie a unei variabile împărţit la
Distribuţie de frecvenţe: dispunere a numărul de cazuri din toate categoriile
valorilor unei variabile, care arată câte variabilei respective, rezultatul fiind
cazuri sunt conţinute în fiecare categorie înmulţit cu 100.
a variabilei respective. Procent cumulat: procentul de cazuri
Frecvenţă cumulată: numărul de cazuri dintr-un interval de clasă şi din toate
dintr-un interval de clasă şi din toate intervalele precedente.
intervalele precedente. Proporţie: numărul de cazuri dintr-o
Histogramă: modalitate de prezentare categorie a unei variabile împărţit la
vizuală a distribuţiilor de frecvenţe numărul de cazuri din toate categoriile
pentru variabile de interval sau de raport, variabilei respective.
în care categoriile sunt reprezentate prin Raport: numărul de cazuri dintr-o categorie
coloane continue cu baza egală cu a unei variabile împărţit la numărul de
limitele reale ale inervalelor de clasă cazuri din altă categorie a variabilei
respective, înăţimea fiecărei coloane respective.
fiind proporţională cu procentul de Rată: numărul de cazuri reale (efective)
cazuri din interval. împărţit la numărul de cazuri posibile
Intervale de clasă: categorii utilizate în pentru variabila de interes pe o anumită
cazul distribuţiilor de frecvenţe pentru unitate de timp.
variabile de interval sau de raport.