Sunteți pe pagina 1din 24

CURS STATISTICĂ - Unitatea de învăţare nr.

SISTEMATIZAREA, PREZENTAREA ŞI REPREZENTAREA


DATELOR STATISTICE

Cuprins:

1. Obiectivele Unităţii de învăţare.


2. Sistematizarea datelor statistice (gruparea/clasificarea).
2.1. Clasificarea datelor statistice.
2.2. Gruparea datelor statistice
3. Modalităţi de prezentare şi reprezentare a datelor statistice.
3.1. Serii statistice.
3.2. Tabele statistice.
3.3. Grafice statistice.
4. Răspunsuri la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unităţii de învăţare.
7. Bibliografia Unităţii de învăţare.

1. Obiectivele unităţii de învăţare

În urma parcurgerii acestei unităţi de învăţare studentul va înţelege:


- cum se poate face trecerea de la etapa de culegere a datelor la cea de
prelucrare propriuzisă a lor;
- cum se pot transpune seturile mari de date colectate dintr-o formă aleatoare,
neregulată, într-o formă ordonată, organizată;
- cum se efectuează sistematizarea seturilor largi de date statistice, după o
variabilă calitativă sau după o variabilă cantitativă;
- care sunt principalele tipuri de serii statistice;
- cum să alegem tipul cel mai potrivit de grafic necesar pentru reprezentarea
datelor statistice.

1
2. Sistematizarea datelor statistice (gruparea/clasificarea).

Am văzut că statistica operează cu volume mari de date. Dacă aceste date sunt
prezentate într-o formă aleatoare neregulată, este dificil, investigând vizual setul de date, să-l
caracterizăm prin trăsăturile sale esenţiale, prin valorile extreme, tendinţa centrală sau gradul
de dispersare. De aceea, putem întâi supune setul de date unor operaţii de prezentare
sistematică, de organizare, de ordonare a acestor date după unul sau mai multe criterii, într-
un cuvânt de sistematizare.

Sistematizarea datelor statistice cuprinde operaţiile de prezentare sistematică, de


organizare, de ordonare a acestor date după unul sau mai multe criterii.

Această operaţie face trecerea de la observarea statistică (în urma căreia s-au obţinut
datele necesare realizării obiectivelor investigaţiei statistice, verificate sub aspectul volumului
şi calităţii) şi prelucrarea propriuzisă.
Sistematizarea este parte a prelucrării primare a datelor statistice.
Sistematizarea datelor se realizează prin gruparea şi clasificarea datelor statistice.

Gruparea/clasificarea datelor statistice presupune împărţirea unităţilor populaţiei


statistice observate în grupe sau clase distincte omogene, după unul sau mai multe
criterii.

Atunci când criteriul (caracteristica) după care se realizează această operaţie este unul
numeric, cantitativ, ea se numeşte grupare, iar când operaţia se realizează după un criteriu
(caracteristic) calitativ, nenumeric, ea se numeşte clasificare.
La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să îndeplinim următoarele
condiţii:
a) omogenitate (în sensul că unităţile statistice care au aceeaşi valoare sau valori
apropiate, asemănătoare, ale caracteristicii după care se efectuează sistematizarea vor
fi incluse în aceeaşi clasă; în felul acesta, se doreşte ca variaţia valorilor caracteristicii
incluse în aceeaşi grupă/clasă să fie cât mai mică);
b) unicitate (în sensul că o unitate statistică trebuie inclusă într-o singură clasă sau grupă,
ea nu se poate regăsi simultan în două sau mai multe clase/grupe);
c) completitudine (în sensul că toate unităţile statistice să fie incluse în grupe/clase, să nu
fie exclusă vreo unitate din operaţia de sistematizare).

2
Sunt cazuri în care nu este posibilă îndeplinirea simultană a tuturor acestor condiţii (de
exemplu: dacă sunt unităţi la care s-au înregistrat valori extreme, aberante, ale caracteristicii
după care se face sistematizarea, este de dorit, uneori, să se evidenţieze separat aceste cazuri,
să se scoată în afara grupării aceste unităţi şi să se sistematizeze restul unităţilor, la care s-au
înregistrat valori mai apropiate ale variabilei).

2.1. Clasificarea datelor statistice.

Sistematizarea datelor efectuată după o variabilă ne-numerică se numeşte clasificare. Ea


presupune împărţirea unităţilor în clasele/categoriile variabilei nenumerice considerate.

Se construieşte un număr de clase egal cu numărul categoriilor existente, iar prin


numărarea unităţilor statistice incluse în fiecare clasă obţinem frecvenţa acelei clase (volumul
ei).
Unele clasificări au caracter oficial, altele au caracter neoficial.
Dacă datele sunt sistematizate după o variabilă categorială (nominală), ordinea
claselor este lăsată la îndemâna cercetătorului.

☺ Exemplul 1
Distribuţia absolvenţilor unei facultăţi economice după domeniul în care s-au angajat este:

Domeniu Număr de absolvenţi (ni)


Contabilitate 95
Marketing 72
Finanţe 55
Management economic 43
Altele sau fără loc de muncă 35
Total 300

Dacă datele se referă la variabile ordinale, clasele vor respecta criteriul de ordine:

☺ Exemplul 2
Distribuţia studenţilor unei grupe după calificativul obţinut la un proiect este:

Calificativ (xi) Număr de studenţi (ni)


Insuficient 3
Satisfăcător 4
Bine 15

3
Foarte bine 6
Excelent 2
Total 30

2.2. Gruparea datelor statistice.

Gruparea reprezintă sistematizarea datelor după o variabilă (caracteristică)


numerică.

În funcţie de tipul variabilei de grupare (discretă sau continuă) şi de plaja valorilor pe


care le poate caracteristica, gruparea se poate face:

- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);

- pe intervale de variaţie (atunci când sistematizăm datele după o variabilă


continuă, care are o plajă largă de valori.

A). Gruparea datelor statistice pe variante.

În acest caz, se va forma un număr de grupe egal cu numărul de variante. Prin


numărarea unităţilor incluse în fiecare grupă se obţine frecvenţa grupei (numită şi frecvenţă
absolută).

☺ Exemplul 3
Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0, 2, 1, 3,
1, 2, 4, 2. Să se realiezeze o sistematizare a datelor.

Număr de copii (xi) Număr de familii (ni)


0 3
1 5
2 8
3 3
4 1
Total 20
Observăm că variabila de grupare este numărul de copii, variabilă discretă cu puţine variante
(cinci variante), deci s-a realizat o grupare pe variante.

B). Gruparea pe intervale de variaţie.

4
Se poate efectua pe intervale de mărime egală sau diferită. În continuare vom trata
numai cazul grupării datelor statistice pe intervale egale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor paşi:
a) se determină amplitudinea variaţiei caracteristicii, ca diferenţă între valoarea
maximă şi valoarea minimă a caracteristicii.
A  x max  x min

b) se stabileşte numărul de grupe. În acest caz pot exista două situaţii:


- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii anterioare
asupra domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relaţia lui Sturges:
r  1  3,322  lg n

unde n este numărul total de unităţi ale colectivităţii.


Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 şi 10).
Utilizarea unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii
(putând apare, în acest caz şi grupe cu frecvenţe nule, iar gruparea ar trebui refăcută);
utilizarea, dimpotrivă, a unui număr prea mic de grupe ar putea să nu pună în evidenţă
principalele tipuri calitative ale populaţiei după variabila urmărită).
c) se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii şi numărul de grupe:
A
h
r

Pentru uşurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval, de


aceea, dacă valoarea reieşită din calcul este fracţionară, cu mai multe zecimale, ea se poate
rotunji prin adaos la o valoare imediat superioară, aleasă în mod convenabil.
De exemplu: dacă h = 4,4225, se poate rotunji valoarea la h = 4,5 sau chiar la h = 5.
d) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
xmin  xmin+h
xmin+h  xmin+2h
.....................................................
xmin + (r — 1).h  xmin + r h

5
Limitele intervalelor vor avea acelaşi grad de precizie ca şi datele grupate (acelaşi
număr de zecimale), primul interval putând începe chiar de la valoarea minimă a
caracteristicii, sau de la o valoare uşor inferioară acesteia, aleasă în mod convenabil. Este bine
să nu existe suprapuneri de limite, astfel încât la efectuarea grupării să poată fi respectată
condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului
următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval şi limita inferioară a intervalului următor
există o diferenţă de o unitate întreagă sau zecimală, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizării pot fi redate cu ajutorul unui tabel asemănător celui din
exemplul următor.

☺ Exemplul 4
În vederea analizei oportunităţii deschiderii unui magazin ce vinde aparatură
electrocasnică, un analist financiar este interesat în cunoaşterea nivelului vânzărilor zilnice ale
magazinelor de profil. Pentru 50 de astfel de magazine alese întâmplător, înregistrează
valoarea facturilor emise zilnic. Datele sunt următoarele (mii lei):

10,5 8,0 8,2 9.6 7,1


8,4 7,9 8,0 7,2 5,2
10,5 6,8 7,7 8,8 7,7
9,0 9,5 7,4 11,3 5,9
9,2 8,1 6,5 8,5 5,2
9,7 11,5 9,5 9,4 5,6
6,6 9,9 8,2 10,5 11,7
10,6 6,9 6,9 6,9 6,0
10,1 7,5 7,2 6,5 7,8
7,1 11,1 8,2 7,5 6,5
Să se sistematizeze datele, grupându-se pe intervale egale de variaţie
Rezolvare
Se notează cu X – caracteristica de grupare (valoarea facturilor emise zilnic). Se parcurg
următorii paşi:
• se calculează amplitudinea variaţiei caracteristicii (Ax): Ax = xmax - xmin =11,7–5,2=6,5 mii lei;
• se stabileşte numărul de grupe (r): r=1+3,32 ln =1+3,322lg 50 =6,647 (formula lui
Sturges);
• se stabileşte mărimea intervalului de grupare (h): h = Ax / r =6,5/71 mii lei;
• se stabilesc intervalele de variaţie şi se efectuează gruparea

6
Varianta I Varianta II
Intervale de variaţie a valorii Nr. Intervale de variaţie a valorii Nr.
facturilor emise zilnic (mii lei) magazine facturilor emise zilnic (mii lei) magazine
(ni) (ni)
5,0 – 6,0 4 5,0 – 6,0 5
6,0 – 7,0 9 6,0 – 7,0 8
7,0 – 8,0 11 7,0 – 8,0 13
8,0 – 9,0 9 8,0 – 9,0 8
9,0 – 10,0 8 9,0 – 10,0 7
10,0 – 11,0 5 10,0 – 11,0 5
11,0 - 12,0 4 11,0 - 12,0 4
Total 50 Total 50
Notă: limita inferioară inclusă în interval. Notă: limita superioară inclusă în interval.
Varianta III
Intervale de variaţie a valorii facturilor emise Nr. magazine
zilnic (mii lei) (ni)
5,0 – 5,9 4
6,0 – 6,9 9
7,0 – 7,9 11
8,0 – 8,9 9
9,0 – 9,9 8
10,0 – 10,9 5
11,0 – 11,9 4
Total 50
Notă: intervale discontinue.
Se recomandă utilizarea intervalelor continue (varianta I sau varianta II).

3. Modalităţi de prezentare şi reprezentare a datelor statistice.

Rezultatul sistematizării datelor prin grupare/clasificare se prezintă sub formă de:


- serii statistice;
- tabele statistice;
- grafice statistice.
3.1. Serii statistice.

Seria statistică reprezintă un mod organizat de prezentare a datelor, sub forma a două
şiruri: primul se referă la criteriul de sistematizare iar al doilea cuprinde datele numerice
sau frecvenţele de apariţie şi depinde de ordinea de apariţie din primul şir.

Seriile statistice se pot clasifica după următoarele criterii:


a) în funcţie de conţinutul variabilei după care se face sistematizarea, avem:
i. serii cronologice (se referă la o variabilă de timp);
ii. serii teritoriale (se referă la o variabilă de spaţiu);

7
iii. serii de distribuţie de frecvenţe (sau repartiţii de frecvenţe, care se referă la o
variabilă atributivă).

b) după natura variabilei, seriile de distribuţie pot fi.


i. distribuţii heterograde (după o variabilă cantitativă);
ii. distribuţii homograde (după o variabilă calitativă);

c) după numărul variantelor, distribuţiile pot fi:


i. distribuţii pe variante sau valori;
ii. distribuţii pe grupe de variante (în cazul distribuţiilor homograde) sau pe
intervale de valori (în cazul distribuţiilor heterograde).

d) în funcţie de numărul variabilelor după care se face sistematizarea, întâlnim:


i. distribuţii de frecvenţe unidimensionale (când sistematizarea datelor s-a
efectuat după o singură variabilă);
ii. distribuţii de frecvenţe bidimensionale (când sistematizarea datelor s-a efectuat
în funcţie de două variabile);
iii. distribuţii multidimensionale (când sistematizarea datelor s-a efectuat în
funcţie de trei sau mai multe variabile);

Serii de distribuţie de frecvenţe (repartiţii de frecvenţe)


A. Serii de distribuţie de frecvenţe unidimensionale

Seria de distribuţie de frecvenţe unidimensională reprezintă o serie în care primul şir


cuprinde variantele/valorile sau intervalele de variaţie ale unei variabile, iar al doilea şir
– frecvenţele de apariţie ale variantelor sau volumul grupelor.

A1. Distribuţii heterograde (după o variabilă numerică).


Se pot reprezenta sub forma:
- pentru o caracteristică discretă (repartiţii de frecvenţe pe variante/valori):
 x1 x2 ... xi ... xr 
X :
n ,
 1 n2 ... ni ... nr 

unde ni ( i  1, r ) sunt frecvenţele de apariţie ale variantei xi.

- pentru o caracteristică continuă (repartiţie de frecvenţe pe intervale de valori):

8
 x inf  X  x sup x 2inf  X  x 2sup ... xiinf  X  xisup ... x rinf  X  x rsup 
X : 1 1 
 n1 n2 ... ni ... nr 
 

sau
 x1 x2 ... xi ... xr 

X : 
 n1 n2 ... ni ... nr 

unde xi , i  1, r sunt centrele intervelor de variaţie.


Serii de repartiţie de frecvenţe pe intervale de variaţie
Se prezintă sub forma:
Intervale de variaţie ale caracteristicii de grupare Număr de unităţi statistice (ni)
x1inf  x1sup n1
x 2inf  x 2sup n2
... ...
xiinf  xisup ni
... ...
x rinf  x rsup nr
r
Total n   ni
i 1

unde: xiinf , xisup reprezintă limita inferioară, respectiv superioară, a intervalului de variaţie „i”.
Vom considera doar cazul intervalelor egale şi continue.
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului
şi este considerat reprezentativ pentru datele din acel interval. Se determină cu una din
relaţiile:
xiinf  xisup hi
xi  sau xi  xiinf  , unde hi este mărimea intervalului.
2 2
Frecvenţa absolută a grupei (ni) este egală cu numărul de unităţi statistice care au
valoarea caracteristicii mai mare (sau egală) cu limita inferioară a intervalului şi mai mică
(sau egală) cu limita superioară a acesteia. Suma frecvenţelor absolute este notată cu n şi

r
reprezintă numărul total de unităţi sau volumul eşantionului. n   ni
i 1

Frecvenţa relativă a unei grupe ( ni* ) reprezintă ponderea unităţilor statistice în


volumul total al colectivităţii care au valoarea caracteristicii cuprinsă între limita inferioară şi
cea superioară a grupei respective. Se determină ca raport între frecvenţa absolută a grupei şi
volumul eşantionului (eventual înmulţit cu 100).

9
ni ni
ni*  r

n şi se exprimă în coeficienţi,
 ni
i 1

sau
ni ni
ni*%  r
 100   100
n şi se exprimă în procente.
 ni
i 1

Suma frecvenţelor relative este 1 sau 100, după cum sunt exprimate în coeficienţi sau
în procente.
r r
 ni*  1 sau  ni*%  100
i 1 i 1

Frecvenţele cumulate.
Sunt de două tipuri: cumulate crescător şi cumulate descrescător.
Frecvenţa absolută cumulată crescător a unei grupe este egală cu numărul unităţilor
care au valoarea variabilei mai mică (sau egală) cu limita superioară a grupei (mai exact între
sup
x1inf şi xi ).
i
Fci   nk
k 1

Frecvenţa absolută cumulată crescător a ultimei grupe este egală cu volumul colectivităţii (cu
n).
Frecvenţa absolută cumulată descrescător a unei grupe este egală cu numărul
unităţilor pentru care valoarea caracteristicii este mai mare (sau egală) cu limita inferioară a

grupei (mai exact între xiinf şi x rsup ):


r
Fd i   nk
k i

Frecvenţa absolută cumulată descrescător a primei grupe este egală cu numărul total de unităţi
statistice (cu n):
Asemănător se determină şi frecvenţele relative cumulate crescător şi descrescător,
conform relaţiilor:
i r
Fci*   nk* , Fd i*   nk*
k 1 k i

Frecvenţele absolute, relative şi cumulate oferă o imagine de ansamblu asupra tendinţei de


distribuţie a valorilor în colectivitate, asupra normalităţii, simetriei ori asimetriei repartiţiei de
frecvenţe.

10
☺ Exemplu 5
Pentrul datele din exemplul 4 (varianta I) s-au determinat: frecvenţele absolute, frecvenţele relative,
centrele de interval şi frecvenţele absolute cumulate:

Intervale de Ponderea Frecvenţe absolute cumulate


variaţie a valorii Nr. magazine magazinelor Centre de
facturilor emise (ni) interval (xi) Crescător Descrescător
zilnic (mii lei) ( ni*% )
[5,0 – 6,0) 4 8 5,5 4 50
[6,0 – 7,0) 9 18 6,5 13 46
[7,0 – 8,0) 11 22 7,5 24 37
[8,0 – 9,0) 9 18 8,5 33 26
[9,0 – 10,0) 8 16 9,5 41 17
[10,0 – 11,0) 5 10 10,5 46 9
[11,0 – 12,0) 4 8 11,5 50 4
Total 50 100 - - -

Serii de repartiţie de frecvenţe pe variante (discrete)


Se prezintă astfel:
Variantele/valorile caracteristicii de grupare (xi) Număr de unităţi statistice (ni)
x1 n1
x2 n2
... ...
xi ni
... ...
xr nr
r
Total n   ni
i 1

unde: ni reprezintă numărul unităţilor care prezintă valoarea xi a caracteristicii de grupare (se
mai numesc frecvenţe absolute);
Prin însumarea frecvenţelor grupelor (ni) se obţine volumul total al colectivităţii (n).
Şi pentru această serie se determină toate tipurile de frecvenţe prezentate anterior.

☺ Exemplul 6
Pentrul situaţia din exemplul 3 s-au determinat: frecvenţele absolute, frecvenţele relative, şi
frecvenţele absolute cumulate:

Număr de copii Număr de Frecvenţe relative Frecvenţe absolute cumulate


(xi) familii (ni) ( ni* ) Crescător Descrescător
0 3 0,15 3 20
1 5 0,25 8 17
2 8 0,40 16 12
3 3 0,15 19 4
4 1 0,05 20 1
Total 20 1,00 - -

11
A2. Distribuţii homograde (după o variabilă nenumerică).
Şi pentru distribuţiile homograde, în care sistematizarea datelor este realizată după o
variabilă calitativă, se pot calcula frecvenţe absolute şi relative (vezi exemplul 1).
Dacă sistematizarea s-a efectuat după o variabilă ordinală, se pot calcula şi frecvenţe
cumulate.

☺ Exemplul 7
Pentrul clasificarea din exemplul 2 s-au determinat: frecvenţele absolute, frecvenţele relative, şi
frecvenţele absolute cumulate:

Calificativ Număr de Frecvenţe relative Frecvenţe absolute cumulate


(xi) studenţi (ni) ( ni* ) Crescător Descrescător
Insuficient 3 0,10 3 30
Satisfăcător 4 0,13 7 27
Bine 15 0,50 22 23
Foarte bine 6 0,20 28 8
Excelent 2 0,07 30 2
Total 30 1,00 - -

B. Serii de distribuţie de frecvenţe bidimensionale.

Forma generală a unei distribuţii de frecvenţe bidimensionale, în care s-au luat în


considerare două variabile statistice X şi Y este prezentată în tabelul următor.

Distribuţia de frecvenţe bidimensională


Variante sau centre de Variante sau centre de interval pt. variabila
Total
interval pt. variabila X Y
unităţi
y1 y2 ... yj ... yp
x1 n11 n12 ... n1j ... n1p n1.
x2 n21 n22 ... n2j ... n2p n2.
... ... ... ... ... ... ... ...
xi ni1 ni2 ... nij ... nip ni.
... ... ... ... ... ... ... ...
xr nr1 nr2 ... nrj ... nrp nr.
Total unităţi n.1 n.2 ... n.j ... n.p n..

12
Tabelul de mai sus reprezintă un tabel de corelaţie, în care avem:
xi, i  1, r este varianta sau centrul de interval pentru grupa „i”, formată după valorile
variabilei X;
yj, j  1, p este varianta sau centrul de interval al grupei „j”, formată după valorile variabilei
Y;
nij, i  1, r ; j  1, p reprezintă numărul unităţilor statistice la care întâlnim simultan valoarea
xi a caracteristicii X şi valoarea yj a caracteristicii Y;
p
ni.   nij este numărul de unităţi statistice care au valoarea xi a caracteristicii X, indiferent
j 1

de valoarea caracteristicii Y;
r
n. j   nij este numărul de unităţi statistice care au valoarea yj a caracteristicii Y, indiferent
i 1

de valoarea caracteristicii X;
r p r p
n..  n    nij   ni .   n. j este volumul total al colectivităţii.
i 1 j 1 i 1 j 1

☺ Exersaţi în … Excel
Nivelul profitului anual (mii RON) pentru 50 de firme producătoare de mobilă este:

62 90 91 93 95
82 99 102 105 110
89 123 133 145 164
97 65 72 76 79
114 84 86 87 89
63 91 92 94 96
83 101 104 107 113
119 132 134 146 174
64 69 74 77 98
84 85 86 88 102
Să se sistematizeze datele pe 7 intervale egale de variaţie şi să se reprezinte grafic, folosind metodele
statistice implementate în Excel.

Rezolvare folosind EXCEL:


1. În celula A1 tastaţi textul „Profit“ şi începând de la celula A2 introduceţi datele.
2. În celula B1 tastaţi textul „Bin“. În celula B2 introduceţi limita superioară a primului interval: 78
(62+16=78), în B3 a celui de-al doilea interval: 94 (78+16=94) etc.
3. Apăsaţi Tools/Data Analysis şi Histogram.
4. Introduceţi Input Range (A1:A51) şi Bin Range (B1:B8). Selectaţi Labels.
5. Selectaţi Chart Output, New Workbook şi apăsaţi OK.
6. Se va obţine o histogramă cu spaţii între coloane. Pentru a obţine o histogramă cu coloanele lipite se
parcurg următorii paşi.

13
7. Se poziţionează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din stânga al
mouse-ului. Se va deschide o fereastră Format Data Series. În această fereastră se merge pe
Options şi la Gap width se trece 0. Se apasă OK.

Se obţin rezultatele:
Bin Frequency
Histogram
78 9
20
94 18
110 12 15
126 4

Frequency
142 3 10
158 2
5

0
78 94 110 126 142 158 174 More
Bin
174 2

Din histogramă se poate observa că variabila studiată nu are o distribuţie normală.

Dacă se doreşte afişarea frecvenţelor relative cumulate se selectează la pasul 5 şi Cumulative


Percentage.
Pentru realizarea curbei cumulative a frecvenţelor se apasă Insert/Chart.
Se selectează Line iar la Data Range se introduc celulele corespunzătoare frecvenţelor cumulate.
La Series/Category (X) axis labels se introduc celulele corespunzătoare capetelor de interval (coloana
Bin). Se apasă Next/Next/FINISH.

Se obţine curba cumulativă a frecvenţelor relative:

Cumulative %
120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
,00%
78 94 110 126 142 158 174

Testul de autoevaluare nr. 1.

1. Frecvenţa absolută cumulată crescător a unei grupe reprezintă:


a) ponderea unităţilor care se încadrează în grupa respectivă;
b) ponderea unităţilor care au valoarea caracteristică mai mică sau eventual egală cu limita
superioară a grupei;
c) numărul unităţilor care au valoarea caracteristicii mai mică sau egală cu limita
inferioară a grupei;

14
d) numărul unităţilor care au valoarea caracteristicii mai mică sau egală cu limita
superioară a grupei;
e) numărul unităţilor care au valoarea caracteristicii mai mare sau egală cu limita
inferioară a grupei.

2. Se cunosc datele următoare:


Număr de piese realizate zilnic (bucăţi) Muncitori (%)
10 5
15 20
17 45
20 15
22 15
Tabelul prezintă:
a) o distribuţie heterogradă de frecvenţe absolute;
b) o distribuţie homogradă de frecvenţe absolute;
c) o distribuţie heterogradă de frecvenţe relative, pe variante;
d) o distribuţie homogradă de frecvenţe relative;
e) nici una dintre variantele de mai sus.

3. Frecvenţa relativă cumulată crescător a ultimei grupe este egală cu:


a) numărul unităţilor statistice din grupa respectivă;
b) ponderea unităţilor statistice din grupa respectivă în total colectivitate;
c) 100%;
d) numărul total de unităţi statistice din colectivitate;
e) 1,00.

3.2. Tabele statistice.

Aşa cum am arătat, alături de grafice, şi tabelele statistice joacă un rol important în
prezentarea dateor, căci ele pot releva anumite aspecte pe care graficele nu le pot pune în
valoare. În unele situaţii, este mai importantă prezentarea valorilor numerice ale datelor, decât
o vizualizare grafică a acestora. În felul acesta, tabelele reprezintă un instrument
complementar graficelor, de prezentare rapidă şi eficientă a datelor, dar şi de sistematizare a
acestora.

Tabelul statistic cuprinde una sau mai multe serii statistice, ai căror termeni sunt înscrişi
într-o reţea de linii şi coloane.

15
Pentru ca un tabel statistic să fie corect elaborat şi să-şi atingă scopul, trebuie să
conţină un set de elemente obligatorii sau opţionale şi să respecte unele reguli:
- titlul tabelului este un element obligatoriu plasat înaintea tabelului, care descrie clar şi
concis conţinutul datelor pe care le cuprinde;
- macheta tabelului este o reţea de linii ce alcătuiesc rubricile tabelului;
- subiectul tabelului este format din populaţia la care se referă datele înscrise în tabel;
- predicatul tabelului este format din sistemul de indicatori redaţi în tabel;
- rubricile tabelului sunt spaţiile create la întretăierea liniilor orizontale cu cele verticale,
în care sunt înscrise datele;
- datele statistice înscrise în tabel pot fi sub formă numerică sau textuală;
- unitatea de măsură trebuie precizată pentru fiecare din indicatorii înscrişi în tabel; dacă
toţi sunt exprimaţi în aceeaşi unitate de măsură, atunci aceasta se poate trece deasupra
tabelului;
- sursa datelor;
- numărul tabelului – este necesar mai ales atunci când se folosesc mai multe tabele,
pentru identificarea lor;
- note explicative, metodologice

3.3. Grafice statistice.

Alegerea tipului de grafic depinde de tipologia datelor pe care vrem să le reprezentăm.


Astfel, putem utiliza:
- grafice într-un sistem de coordonate;
- grafice cu ajutorul unor figuri geometrice;
- grafice cu ajutorul hărţior sau al altor figuri naturale sau simbolice.
Pentru ca un grafic să-şi atingă scopul pentru care a fost proiectat, el trebuie să fie
corect întocmit, să respecte anumite reguli generale, să cuprindă o serie de elemente
obligatorii sau opţionale şi anume:
 titlul graficului;
 sistemul de coordonate;
 scara de reprezentare;
 reţeaua graficului;
 legenda;

16
 note explicative, sursa datelor etc.

Tipuri de reprezentări grafice utilizate în cazul seriilor de distribuţie de frecvenţe

1. Histograma:
Histograma conţine o succesiune de dreptunghiuri, cu bazele corespunzătoare lungimii
in-tervalelor şi înălţimile egale cu numărul de observaţii din fiecare interval (sau cu ponderea
lor). Dacă intervalele au mărime egală, atunci şi coloanele vor avea lăţime egală.
Permite vizualizarea distribuţiei de frecvenţe absolute sau relative, după o variabilă
numerică continuă (pe intervale).

2. Poligonul frecvenţelor:
Poligonul frecvenţelor este şi el utilizat pentru reprezentarea grafică a distribuţiilor de
frecvenţe absolute sau relative, atunci când sistematizarea datelor s-a făcut după o
caracteristică numerică continuă sau discontinuă. Pentru construirea lui, din fiecare valoare a
caracteristicii sau din fiecare centru de interval se ridică câte o perpendiculară şi se marchează
pe ea punctul aflat la o distanţă egală cu frecvenţa variantei sau intervalului respectiv. Unind
toate punctele astfel găsite rezultă un poligon numit „poligonul frecvenţelor”.
Poligonul frecvenţelor se poate suprapune peste histogramă în cadrul aceluiaşi grafic,
sau se poate trasa într-un grafic separat.

3. Curbele frecvenţelor cumulate:


Curbele frecvenţelor cumulate (ogivele), numite şi „curbele cumulative ale
frecvenţelor”, reprezintă o a treia modalitate de reprezentare grafică a distribuţiilor de
frecvenţe pe intervale de variaţie sau pe variante. Ele se trasează atât pentru distribuţii de
frecvenţe absolute, cât şi pentru distribuţii de frecvenţe relative.
În cazul distribuţiilor de frecvenţe după o variabilă continuă:
- reprezentarea grafică a frecvenţelor cumulate crescător: pe axa Ox se reprezintă
limitele superioare ale intervalelor, iar pe axa Oy – frecvenţele cumulate crescător;
prin unirea punctelor astfel obţinute se trasează o curbă ascendentă.
- reprezentarea grafică a frecvenţelor cumulate descrescător: pe axa Ox se reprezintă
limitele inferioare ale intervalelor, iar pe axa Oy – frecvenţele cumulate descrescător;
prin unirea punctelor astfel obţinute se trasează o curbă descendentă.

17
În cazul distribuţiilor de frecvenţe după o variabilă discretă reprezentarea grafică a
frecvenţelor cumulate crescător va avea, de această dată, aspectul unei scări, pentru că nici o
unitate statistică nu poate avea valoarea caracteristicii situată între variantele stabilite

☺ Exemplul 8
Pentru distribuţia de frecvenţe din exemplul 4, obţinută după o variabilă continuă,
histograma, poligonul frecvenţelor şi curbele frecvenţelor cumulate se prezintă astfel:

12 12

10 10
Nr. magazine

8
8

Nr. magazine (ni)


6
6
4
4
2
2
0
5,0-6,0 6,0-7,0 7,0-8,0 8,0-9,0 9,0- 10,0- 11,0- 0
10,0 11,0 12,0 3 4 5 6 7 8 9 10 11 12 13

mii RON Valoarea facturilor (m ii lei)

Distribuţia magazinelor după valoarea facturilor


Histograma Poligonul frecvenţelor

Din graficele realizate reiese că distribuţia magazinelor după valoarea facturilor emise
este o distribuţie cu tendinţă de normalitate.

Curbele cumulative ale frecventelor


60

50

40
frecvente cumulate

30

20

10

0
5.0 6.0 7.0 8.0 9.0 10.0 11.0 12.0
mii RON

frecvente cumulate crescator frecvente cumulate descrescator

☺ Exemplul 9
Pentru distribuţia de frecvenţe din exemplul 3, obţinută după o variabilă discretă,
poligonul frecvenţelor şi graficul frecvenţelor cumulate crescător se prezintă astfel:

18
25
10
20
8

Frecvente cumulate
6 15
nr. familii

4 10

2 5

0 0
0 1 2 3 4 5 0 1 2 3 4 5
nr. copii Nr. copii

a) Poligonul frecvenţelor b)Frecvenţe cumulate crescător

4. Graficul (diagrama) prin coloane sau benzi (bare)


Este folosit pentru reprezentarea distribuţiilor de frecvenţe absolute sau relative, în
care sistematizarea s-a făcut după o variabilă categorială, calitativă, măsurată pe scală
nominală. Graficul se trasează în sistemul de axe ortogonale Ox şi Oy, pe Ox se reprezintă
categoriile variabilei calitative, iar pe Oy frecvenţele (absolute sau relative) sau nivelul
indicatorului. Aşadar, graficul constă dintr-o succesiune de coloane de lăţime egală, câte o
coloană pentru fiecare categorie/variantă a variabilei nominale, egal distanţate între ele (la
distanţe, de regulă, mai mici decât grosimea coloanelor) şi cu înălţimea proporţională cu
frecvenţele sau nivelul indicatorului corespunzător categoriei respective. Dacă dreptunghiurile
sunt răsturnate cu 90% (şi au baza situată pe axa verticală) atunci reprezentarea grafică este o
diagramă prin benzi, cu axele inversate faţă de diagrama prin coloane.

☺ Exemplul 10
Pentru distribuţia de frecvenţe din exemplul 1, obţinută după o variabilă calitativă,
diagrama prin coloane şi cea prin benzi se prezintă astfel:

19
Distributia absolventilor dupa domeniul de
ocupare Altele

100 Manag.

80

Domeniu
Finanţe
60
Persoane

40 Market.
20
Contab.
0
Contabilitate Marketing Finanţe Management Altele
ec. 0 20 40 60 80 100

Domeniul Persoane

a) Diagrama prin coloane b)Diagrama prin benzi

5. Diagrama de structură.

Diagrama de structură este folosită pentru a reprezenta grafic structura unei


colectivităţi, sistematizate după valorile unei variabile cantitative sau calitative. Graficul arată,
aşadar, modul în care întregul se subdivide în părţi componente. De obicei, diagrama se
trasează cu ajutorul cercului, a cărui arie reprezintă întregul; acesta se împarte în mai multe
bucăţi („felii”), unghiul la centru corespunzător acestei părţi de cerc este proporţional cu
raportul dintre frecvenţa absolută şi volumul total al colectivităţii (adică cu frecvenţa relativă)
a acelei clase/grupe.

☺ Exemplul 11
Pentru distribuţiile de frecvenţe din exemplele 1 şi 4, diagrama de structură se prezintă
astfel:

20
Structura magazinelor dupa valoarea facturilor
Structura absolvenţilor după domeniul de ocupare emise zilnic

5,0 – 6,0
11,0 – 12,0 8%
6,0 – 7,0
12% 8%
18%

32% 10,0 – 11,0


10%
14% Contab.
Market.
Finanţe
Manag. 9,0 – 10,0 7,0 – 8,0
Altele 16% 22%

18%

8,0 – 9,0
24% 18%

Testul de autoevaluare nr. 2.

1. Subiectul unui tabel statistic reprezintă:


a) reţeaua de linii ce alcătuiesc rubricile tabelului;
b) colectivitatea la care se referă datele;
c) sistemul de indicatori cuprinşi în tabel;
d) datele numerice sau denumirile textuale care se completează în rubricile tabelului;
e) nici una dintre variantele de mai sus.

2. Presupunem că o firmă ce produce trei produse similare, doreşte să compare, prin


intermediul reprezentărilor grafice, ponderea vânzărilor pe produse în totalul vânzărilor, în doi
ani consecutivi. Reprezentarea grafică va fi:
a) histograma frecvenţelor relative;
b) diagrama de structură
c) cronograma
d) corelograma
e) diagrama prin suprafeţe

3. Care dintre următoarele reprezentări grafice sunt incorecte şi de ce?

21
4. Răspunsuri la testele de autoevaluare

Răspunsuri la testul de autoevaluare nr. 1


1. d)
2. c)
3. c), e)

Răspunsuri la testul de autoevaluare nr. 2


1. b)
2. b). Se construieşte câte o diagramă de structură pentru fiecare an
3.)
a) este incorect, deoarece pe axa Ox sunt reprezentat variantele unei variabile calitative, şi de
aceea coloanele ar trebui să aibă lăţimi egale;
b) este incorect, deoarece coloanele ar trebui să fie disparate, puţin distante unele de altele,
pentru a nu da senzaţia de continuitate pe axa Ox.
c) este corect;

22
d) este incorect, deoarece axa Oy îşi are originea în 10, nu în 0, aşa cum este cazul scalei de
raport;
e) este incorect, deoarece scările de reprezentare nu au fost alese echilibrat pe cele 2 axe,
(graficul este prea extins pe orizontală, ceea ce duce la falsa aplatizare, alternare a variaţiei
fenomenului);
f) este incorect deoarece pe axa Oy trebuie figurată o întrerupere de scară (între 0 şi 10).
Aşadar, incorecte sunt graficele a), b), d), e), f).

5. Teme de control

1. Se cunoaşte durata sejurului într-o staţiune montană (zile) pentru 30 de turişti:


12 4 16 13 5 8
9 9 11 3 12 6
10 8 11 7 10 20
15 12 9 16 18 12
6 11 10 7 6 14
a) Să se grupeze datele pe 6 intervale egale şi să se reprezinte grafic rezultatele
sistematizării;
b) Pentru distribuţia obţinută la punctul anterior, să se calculeze frecvenţele relative;
c) Să se reprezinte grafic structura colectivităţii de turişti după durata sejurului.

2. Pentru 200 de agenţi economici se cunosc datele:


Grupe de agenţi economici după numărul Sub 10 10-20 20-30 30-40 40-50 50-60
salariaţilor (pers.)
Ponderea agenţilor economici (%) 7 8 12 62 6 5
a) Să se reprezinte grafic structura agenţilor economici în funcţie de numărul salariaţilor ;
b) Să se reprezinte grafic distribuţia de frecvenţe absolute ;
c) Să se calculeze frecvenţele absolute cumulate şi să se reprezinte grafic.

3. La o societate comercială se analizează contractelor după valoarea acestora, astfel:


Intervale de variaţie a valorii contractelor 150- 250- 350- 450- 550- 650-
(mii lei) 250 350 450 550 650 750
Număr de contracte 25 50 18 9 5 3
a) Să se reprezinte grafic distribuţia de frecvenţe relative;
b) Să se calculeze frecvenţele absolute cumulate şi să se reprezinte grafic;
c) Să se calculeze centrele intervalelor de variaţie.

23
6. Rezumatul Unităţii de învăţare

În acest capitol am învăţat să supunem setul de date unor operaţii de prezentare sistematică,
de organizare, de ordonare după unul sau mai multe criterii, într-un cuvânt de sistematizare.
Includem aici operaţiile de grpare/clasificare.
Gruparea / clasificarea datelor statistice presupune împărţirea unităţilor populaţiei statistice
observate în grupe sau clase distincte omogene, după unul sau mai multe criterii. Dacă efectuăm
sistematizarea datelor după o variabilă nenumerică, spunem că efectuăm o clasificare, iar dacă
sistematizăm datele după o variabilă numerică, spunem că realizăm o grupare.
Clasificarea datelor se poate face:
- pe variante (dacă sunt puţine variante)
- pe grupe de variante (în cazul existenţei mai multor variante).
Gruparea după o variabilă numerică se poate face:
- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
- pe intervale de variaţie (atunci când sistematizăm datele după o variabilă continuă,
care are o plajă largă de valori). Intervalele de variaţie pot fi egale sau neegale.
Modalităţile de prezentare şi reprezentare a datelor statistice sunt:
- seriile statistice.
- tabelele statistice
- graficele statistice.

7. Bibliografia Unităţii de învăţare

1. Anderson D., Sweeney D.,Williams T., Statistics for Business and Economics, Thomson
South Western, 2008
2. Ghiţă S. – “Statistică”, Editura Meteor Press, Bucureşti, 2006.
3. Isaic-Maniu Al., Mitruţ C., Voineagu V., Statistică, Editura Universitară, Bucureşti, 2003;
4. Ţiţan, E.- Statistică. Teorie şi aplicaţii în sectorul terţiar, Ed. Meteor Press, Bucureşti,
5. Voineagu V., Ţiţan E., Ghiţă S., Boboc C., Todose D. – Statistică. Baze teoretice şi
aplicaţii, Editura Economică, Bucureşti, 2007;

24

S-ar putea să vă placă și