Documente Academic
Documente Profesional
Documente Cultură
CURS 3
1
Principiile clasificării şi grupării
2
Sistematizarea datelor nenumerice
Clasificarea = împărţirea unităţilor în categoriile variabilei nenumerice
Prin numărarea unităţilor statistice ce se încadrează în fiecare clasă se stabileşte
frecvenţa clasei
Dacă variabila este măsurată pe scala nominală ordinea claselor o alege
cercetătorul.
Sistematizarea datelor privind muzeele, în anul 2007, în România, în funcţie de tipul acestora:
Numărul muzeelor (la sfârşitul anului) Ponderea muzeelor
Tipul muzeului *%
n
( i) ( n i )
Ştiinţele naturii 44 6,6
Istoria tehnicii şi ştiinţei 21 3,1
Istorie 117 17,5
Etnografie 115 17,2
Istoria culturii 152 22,8
Artă 149 22,3
Mixte 70 10,5
Total 668 100
Sursa: Anuarul Statistic al României, 2008.
3
Sistematizarea datelor nenumerice
Dacă datele se referă la variabile măsurate pe scala ordinală, clasele vor respecta
criteriul de ordine:
4
Reprezentarea grafică a seriilor de distribuţie de frecvenţe
160
140
120
100
80
60
40
20
0
Ştiinţele Istoria Istorie Etnografie Istoria Artă Mixte
naturii tehnicii şi culturii
ştiinţei
tipul de muzeu
5
Reprezentarea grafică a seriilor de distribuţie
de frecvenţe pentru variabile nenumerice
10% 7% 3%
18%
22%
17%
23%
Ştiinţele naturii Istoria tehnicii şi ştiinţei Istorie Etnografie Istoria culturii Artă Mixte
6
Sistematizarea datelor numerice
Gruparea reprezintă sistematizarea datelor după o variabilă numerică
A. Dacă variabila este discretă şi cu un număr redus de valori distincte (max. 10)
sistematizarea datelor se face prin gruparea pe variante, obţinându-se o serie de
distribuţie de frecvenţe pe variante.
Frecvenţa grupelor se stabileşte prin numărarea unităţilor care iau aceeaşi valoare.
Gruparea a 50 de manageri ai unor firme de IT, în funcţie de numărul de
deplasări în străinătate, în interes de serviciu, în luna mai 2007:
Număr deplasări Număr manageri
0 3
1 16
2 19
3 7
4 4
5 1
Total 50
O serie de distribuţie de frecvenţe pentru o variabilă discretă poate fi prezentată
şi sub următoarea formă:
x1 x2 ... xr
X :
n1 n2 ... n r .
7
Sistematizarea datelor numerice
Reprezentarea grafică a unei serii de distribuţie de frecvenţe alcătuită după o variabilă numerică
discretă cu număr redus de valori distincte este poligonul frecvenţelor:
20
19
18
17
16
15
14
nr. manageri
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5
Nr. deplasari
8
Sistematizarea datelor numerice
B. Dacă variabila numerică este discretă şi are un număr mare
de valori distincte sau este continuă sistematizarea
presupune gruparea pe intervale de variaţie
Se obţine o serie de distribuţie de frecvenţe pe intervale.
9
Alcătuirea intervalelor de variaţie
a. Determinarea numărului de intervale
10
Exemplu
Tabelul statistic ce se obţine prin gruparea datelor pe intervale de variaţie este:
11
Reprezentarea grafică a seriilor de distribuţie de
frecvenţe pe intervale
O serie de distribuţie de frecvenţe pe intervale de variaţie se reprezintă
grafic cu ajutorul histogramei şi a poligonului frecvenţelor.
Histograma se construieşte prin ridicarea unor dreptunghiuri, fiecare
dreptunghi fiind de lăţime egală cu mărimea intervalului de grupare şi de
înălţime egală cu frecvenţa intervalului
14 35
12 30
10 25
Frecvente
Frecvente
8 20
6 15
4 10
2 5
0 0
10 20 30 40 50 60 70 80 90 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
Intervale Intervale
12
Exemplu
distributia salariatilor in functie de vechimea in activitate
25
20
20
17
14
15
nr. slariati
10
10 8
6
5
5
0
2,5 7,5 12,5 17,5 22,5 27,5 32,5
nr.ani
13
Exemplu
poligonul frecventelor
25
20
15
nr. slariati
10
0
-2,5 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5
nr.ani
14
Distribuţia normală
15
Distribuţii asimetrice
16
Distribuţia în formă de J
17
Distribuţia în formă de U
Distribuţia în formă de U este o distribuţie cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă
minimă în jurul intervalului central
18
Seria de distribuţie de frecvenţe pe intervale
În cazul seriilor de distribuţie de frecvenţe pe intervale se mai determină:
1. Centrul de interval = valoarea situată la jumătatea distanţei dintre limitele intervalului şi este
considerat reprezentativ pentru datele din interiorul intervalului:
hi xi inf xi sup
xi xi inf sau xi , i 1, r .
2 2
2. Frecvenţa absolută cumulată crescător a unei grupe (Fci) = nr. unităţilor statistice care au valoarea
variabilei mai mică sau egală cu limita superioară a intervalului
i
Fci n
k 1
k .
*
3. Frecvenţa relativă cumulată crescător a unei grupe ( Fci ) = procentul unităţilor statistice care au
valoarea variabilei mai mică sau egală cu limita superioară a grupei:
i
Fci* n
k 1
*
k .
4. Frecvenţe absolute şi relative cumulate descrescător = nr. sau procentul unităţilor statistice care
au valoarea variabilei mai mare sau egală cu limita inferioară a intervalului
r r
Fdi n
k i
k , Fdi* n
k i
*
k .
19
Seria de distribuţie de frecvenţe pe intervale
Frecvenţele absolute, relative şi cumulate oferă o imagine de ansamblu asupra
tendinţei de distribuţie a valorilor în colectivitate, asupra normalităţii, simetriei ori
asimetriei repartiţiei de frecvenţe.
90
80
70
60
50 Fci
40 Fdi
30
20
10
0
0 5 10 15 20 25 30 35
21