Sunteți pe pagina 1din 9

Seminar 2-gruparea datelor statistice si reprezentari grafice

A.)Gruparea datelor statistice pe variante.

În acest caz, se va forma un număr de grupe egal cu numărul de variante. Prin


numărarea unităţilor incluse în fiecare grupă se obţine frecvenţa grupei (numită şi frecvenţă
absolută).

☺ Exemplul 1
Pentru 20 de familii din judetul Ilfov s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3,
2, 2, 0, 2, 1, 3, 1, 2, 4, 2.

a. Identificati conceptele de baza din statistica.

Populatia: totalitatea familiilor din judetul Ilfov

Esantionul: 20 de familie

Unitatea statistica : familia

Variabila: nr. copii

Varianta: nici un copil, un copil , etc.

b. Sa se grupeze ( construirea unui tabel de grupare) pe variante numarul de familii.

Număr de copii Număr de familii (ni-


(xi) frecxventa absoluta de aparitie)

0 /// 3
1 ///// 5
2 //////// 8
frec ab maxima
3 /// 3
4 / 1
Total 20
Observăm că variabila de grupare este numărul de copii, variabilă discretă cu puţine variante
(cinci variante), deci s-a realizat o grupare pe variante.

B). Gruparea pe intervale de variaţie.


Se poate efectua pe intervale de mărime egală sau diferită. În continuare vom trata
numai cazul grupării datelor statistice pe intervale egale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor paşi:
a) se determină amplitudinea absoluta a variaţiei caracteristicii, ca diferenţă între
valoarea maximă şi valoarea minimă a caracteristicii.
A=x max −x min
b) se stabileşte numărul de grupe. În acest caz pot exista două situaţii:
- numărul de grupe (r) este prestabilit,
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximativ normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relaţia lui Sturges:
r=1+3 , 322⋅lgn
unde n este numărul total de unităţi ale colectivităţii.
Utilizarea unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii
(putând apare, în acest caz şi grupe cu frecvenţe nule, iar gruparea ar trebui refăcută);
utilizarea, dimpotrivă, a unui număr prea mic de grupe ar putea să nu pună în evidenţă
principalele tipuri calitative ale populaţiei după variabila urmărită).
-se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii şi numărul de grupe:
A
h( K )=
r
Pentru uşurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval, de
aceea, dacă valoarea reieşită din calcul este fracţionară, cu mai multe zecimale, ea se poate
rotunji prin adaos la o valoare imediat superioară, aleasă în mod convenabil.
De exemplu: dacă h = 4,4225, se poate rotunji valoarea la h = 4,5 sau chiar la h = 5.
c) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
xmin  xmin+h
xmin+h  xmin+2h
.....................................................
xmin + (r — 1).h  xmin + r h

Limitele intervalelor vor avea acelaşi grad de precizie ca şi datele grupate (acelaşi
număr de zecimale), primul interval putând începe chiar de la valoarea minimă a
caracteristicii, sau de la o valoare uşor inferioară acesteia, aleasă în mod convenabil. Este bine
să nu existe suprapuneri de limite, astfel încât la efectuarea grupării să poată fi respectată
condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului
următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval şi limita inferioară a intervalului următor
există o diferenţă de o unitate întreagă sau zecimală, intervalele se numesc discontinue
sau discrete.
Rezultatele sistematizării pot fi redate cu ajutorul unui tabel asemănător celui din
exemplul următor:
Intervale de variaţie ale caracteristicii de grupare Număr de unităţi statistice (ni)
x inf sup
1 −x1
n1

x inf sup
2 −x2
n2
... ...
x inf
sup ni
i −xi
... ...
inf sup nr
x r −xr
r
Total n=∑ ni
i=1
inf sup
unde: x i , xi reprezintă limita inferioară, respectiv superioară, a intervalului de variaţie
„i”.
Vom considera doar cazul intervalelor egale şi continue.
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului
şi este considerat reprezentativ pentru datele din acel interval. Se determină cu una din
relaţiile:
xiinf + x sup
i hi
x i= x i=x inf
i +
2 sau 2 , unde hi este mărimea intervalului.

☺ Exemplul 2

Se cunosc următoarele date referitoare la transportul urban de pasageri, la lungimea străzilor


orăşeneşti şi la populaţia din regiunile Muntenia şi Oltenia într-un an calendaristic:
Tabelul 2.1
Pasageri
Gradul de Lungimea
Nr. Populaţia transportaţi
Judeţul urbanizare Nr. autobuze străzilor
crt. (mii persoane) cu autobuze
(%) orăşeneşti (km)
(mii)
Urban Rural
A 1 2 3 4 5 6 7
1. AG 321,607 349,839 47,9 21,7123 124 545
2. BR 255,532 129,534 66,4 12,931 118 374
3. BZ 207,178 296,273 41,2 15,7503 60 389
4. CL 130,593 199,960 39,5 1,402 35 270
5. DB 172,217 379,165 31,2 4,1199 45 392
6. GR 90,617 202,809 30,9 1,595 29 159
7. IF 30,361 246,173 11,0 ─ ─ 120
8. IL 125,743 178,204 41,4 1,851 85 318
9. PH 443,324 411,228 51,9 32,216 214 1233
10. TR 156,305 297,148 34,5 7,2364 49 359
11. DJ 383,048 358,777 51,6 33,29 204 577
12. GJ 168,474 226,483 42,7 9,7543 36 322
13. MH 156,276 164,408 48,7 8,1746 65 316
14. OT 202,328 303,969 40,0 5,644 141 505
15. VL 177,918 253,214 41,3 7,815 227 487
Sursa: Anuarul Statistic al României

Se cere:

a) Să se prelucreze datele prin sistematizare primară; să se efectueze o grupare simplă


a judeţelor după gradul de urbanizare, formându-se şase grupe egale.
b) Folosind gruparea simplă de la punctul anterior centralizaţi pentru restul
caracteristicilor statistice aferente domeniului datele.
Rezolvare:
Notaţii:
xi = populaţia urbană
yi = populaţia rurală
zi = gradul de urbanizare
Xi = pasageri transportaţi cu autobuze
Yi = numărul autobuzelor
Zi = lungimea străzilor orăşeneşti

a) Determinarea amplitudinii absolute a variaţiei


Az = zmax- zmin = 66,4- 11,0= 55,4 %
b) Determinarea mărimii intervalului de grupare
A 55 .4
K= z
r = 6 = 9,23=10%
Se trece apoi la formarea intervalelor de grupare formând 6 grupe de mărime egale
rezultând astfel distribuţia din Tabelul 2.2 si 2.3:

Varianta a I-a Distribuţia judeţelor după gradul de urbanizare


Tabelul 2.2
Gradul de urbanizare (%) Nr. judeţelor
[11-21) 1
[21-31) 1
[31-41) 4
[41-51) 6
[51-61) 2
[61-71) 1
Total 15
Notă: limita inferioară inclusă în interval
Varianta a II-a Distribuţia judeţelor după gradul de urbanizare
Tabelul 2.3
Gradul de urbanizare (%) Nr. judeţelor
(11-21] 1
(21-31] 1
(31-41] 4
(41-51] 6
(51-61] 2
(61-71] 1
Total 15
Notă: limita superioară inclusă în interval

Pe baza grupării putem aprecia ca judeţele se concentrează în grupele de mijloc (31-51%)


deci seria evoluează după curba lui Gauss-Laplace adică prezintă o tendinţă de normalitate.
Gruparea cu centralizare se prezintă astfel:
b) Distribuţia judeţelor după gradul de urbanizare cu valori centralizate după: numărul
populaţiei urbane, numărul populaţiei rurale, numărul de pasageri transportaţi cu autobuze,
numărul de autobuze şi lungimea străzilor orăşeneşti (vezi Tabelul 2.4)

Gruparea centralizată a judeţelorTabelul 2.4

Valori centralizate după:


Gradul de Lungimea
Nr. jud. Nr. pasageri
urbanizare a Pop. urbană Pop. rurală străzilor
(ni) transportaţi Nr. autobuze
judeţelor (%) (mii) (mii) orăşeneşti
cu autobuze (mii) (Yi)
(xi) (yi) (km)
(Xi)
(Zi)
0 1 2 3 4 5 6
[11-21) 1 30,361 246,173 ─ ─ 120
[21-31) 1 90,617 202,809 1,595 29 159
[31-41) 4 661,443 1180,242 18,402 270 1526
[41-51) 6 1157,196 1468,421 65,057 597 2377
[51-61) 2 826,372 770,005 65,506 418 1810
[61-71) 1 255,532 129,534 12,931 118 374

Total ∑ ni ∑ xi ∑ yi ∑ Xi ∑ Yi ∑ Zi
=15 =3021,521 =3997,184 =163,491 =1432 =6366

☺ Exemplul 3 (Excel)
Nivelul profitului anual (mii RON) pentru 50 de firme producătoare de mobilă este:

62 90 91 93 95
82 99 102 105 110
89 123 133 145 164
97 65 72 76 79
114 84 86 87 89
63 91 92 94 96
83 101 104 107 113
119 132 134 146 174
64 69 74 77 98
84 85 86 88 102
Să se sistematizeze datele pe 7 intervale egale de variaţie şi să se reprezinte grafic, folosind metodele
statistice implementate în Excel.

Rezolvare folosind EXCEL:


1. În celula A1 tastaţi textul „Profit“ şi începând de la celula A2 introduceţi datele.
2. În celula B1 tastaţi textul „Bin“. În celula B2 introduceţi limita superioară a primului interval: 78
(62+16=78), în B3 a celui de-al doilea interval: 94 (78+16=94) etc.

3. Apăsaţi Tools/Data Analysis şi Histogram.


4. Introduceţi Input Range (A1:A51) şi Bin Range (B1:B8). Selectaţi Labels.
5. Selectaţi Chart Output, New Workbook şi apăsaţi OK.
6. Se va obţine o histogramă cu spaţii între coloane. Pentru a obţine o histogramă cu coloanele lipite se
parcurg următorii paşi.
7. Se poziţionează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din stânga al
mouse-ului. Se va deschide o fereastră Format Data Series. În această fereastră se merge pe
Options şi la Gap width se trece 0. Se apasă OK.

Se obţin rezultatele:
Bin Frequency Histogram
78 9 20
18
Frequency

94 18 16
14
110 12 12
10
126 4 8
6
142 3 4
2
158 2 0
78 94 110 126 142 158 174 More
Bin
174 2

Din histogramă se poate observa că variabila studiată nu are o distribuţie normală.

Dacă se doreşte afişarea frecvenţelor relative cumulate se selectează la pasul 5 şi Cumulative


Percentage.
Pentru realizarea curbei cumulative a frecvenţelor se apasă Insert/Chart.
Se selectează Line iar la Data Range se introduc celulele corespunzătoare frecvenţelor cumulate.
La Series/Category (X) axis labels se introduc celulele corespunzătoare capetelor de interval (coloana
Bin). Se apasă Next/Next/FINISH.

Se obţine curba cumulativă a frecvenţelor relative:

Cumulative %
120.00%
100.00%
80.00%
60.00%
40.00%
20.00%
.00%
78 94 110 126 142 158 174
☺ Exemplul 4

În vederea exemplificării tehnicii de grupare pe variante şi pe intervale de variaţie, se cunosc


următoarele date referitoare la profilul liceului absolvit şi media la bacalaureat a 20 de
candidaţi înscrişi la facultatea de Comerţ în sesiunea de toamnă 2000 – 2001.
Tabelul 4.1
Nr Profilul Media
crt. liceului absolvit la Bacalaureat
1 A 8,63
2 T 9,00
3 E 8,00
4 T 9,61
5 E 8,37
6 E 8,59
7 T 9,72
8 T 9,48
9 A 8,61
10 A 8,90
11 T 9,25
12 T 8,8
13 T 9,1
14 T 9,45
15 T 8,72
16 P 8,92
17 A 8,75
18 P 8,95
19 T 9,18
20 P 8,95
E = economic; T = teoretic, P = pedagogic; A = altele

1. Sa se grupeze combinat candidaţii după profilul liceului absolvit şi media la bacalaureat


2. Sa se grupeze candidatii dupa media la BAC pe intervale neegale (formand 2-4 grupe)
3. Sa se determine toate categoriile de frecvente pentru gruparea pe intervale egale de variatie
a candidatilor dupa Media la BAC.
1. Combinând candidaţii după profilul liceului absolvit şi media la bacalaureat se obţine
următoarea grupare combinată.

Distribuţia candidaţilor după profilul liceului absolvit


şi media la bacalaureat
Tabelul 4.2
Subgrupe de candidaţi
Grupe de candidaţi după Număr după media la bacalaureat
profilul liceului absolvit candidaţi
8,0-8,3 8,3-8,6 8,6-8,9 8,9-9,2 9,2-9,5 9,5-9,8

A 4 – – • • • – –

T 10 – – •• • • • • • •
• •
P 3 – – – • – –
• •
E 3 • • • – – – –
Total 20 1 2 5 7 3 2

Notă: limita inferioară este inclusă în interval


2. Intervalele neegale de variaţie corespund grupelor mari de unităţi care se numesc tipuri
calitative. Acestea sunt în număr de 2-5 şi se formează astfel:
 se reunesc intervalele egale astfel încât distribuţia fenomenului (frecvenţele)
să aibă o repartiţie asimptotic normală. Aceasta presupune ca frecvenţa
maximă să se plaseze la centrul seriei.

x=
∑ xi = 8 , 63+ 9+.. ..+ 8 , 95 =178 , 98 =8 ,94
 n 20 20
Astfel se obţine următoarea grupare pe intervale neegale:
Tabelul 4.3
Grupe de candidaţi după media la Numărul
bacalaureat candidaţilor
grupa mică: [8,0-8,3) 1
grupa mijlocie: [8,3-9,2) 14
grupa mare: [9,2-9,8) 5
Total 20
Notă: limita inferioară inclusă în interval

(Pentru calculul indicatorilor statistici este obligatoriu să se închidă intervalele


deschise cu o mărime egală cu mărimea intervalului alăturat)

3. Se determina trei categorii de frecvente: absolute , relative, cumulate astfel:

Tabelul 4.4
Grupe de Frecvenţe cumulate
Număr Frecvenţe
candidaţi după (Fx)
candidaţi relative
media la
(ni) ni*
bacalaureat
0 1 2 3 4
8,0-8,3 1 1 20 5
8,3-8,6 2 3 19 10
8,6-8,9 5 8 17 25
8,9-9,2 7 15 12 35
9,2-9,5 3 18 5 15
9,5-9,8 2 20 2 10
Total 20 – – 100
n1 1
n1 =
¿
r
⋅100= ⋅100=
20
∑ ni
Notă: i =1 5 candidaţi
n2 2
n1 =
¿ ⋅100= ⋅100=
r 20
∑ ni
i =1 10 candidaţi ş.a.m.d.

S-ar putea să vă placă și