Sunteți pe pagina 1din 29

CAPITOLUL 2

CAPITOLUL 2

SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE

Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o
manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea,
astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale
fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.

Termeni cheie

cartodiagramă frecvenţă redusă


cartogramă frecvenţă relativă
clasificare funcţie de repartiţie
corelogramă grafic statistic
cronogramă grupare
curbă cumulativă a frecvenţelor histogramă
diagramă de structură poligon al frecvenţelor
diagramă prin coloane serie cronologică
distribuţie de probabilitate serie de distribuţie de frecvenţe
distribuţie heterogradă serie statistică
distribuţie homogradă serie teritorială
distribuţie teoretică sistematizare
frecvenţă absolută tabel statistic
frecvenţă cumulată
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

2.1. INTRODUCERE

După ce datele statistice au fost colectate din surse de date publicate,


din observări totale sau din observări parţiale – ele trebuie organizate, în
scopul de a avea o formă care să permită prelucrarea lor statistică diversă.
Cum observarea parţială – în mod special eşantionarea probabilistă –
salvează timp, resurse de muncă şi resurse băneşti, vom trata îndeosebi
problema sistematizării datelor provenite din eşantioane. Cu toate acestea,
trebuie să înţelegem că, indiferent dacă lucrăm cu date referitoare la
colectivităţi parţiale ori la colectivităţi totale, atunci când seturile de date
conţin în jur de 30 de observaţii sau peste acest număr (date de masă), cel
mai bun mod de a le examina este să le sistematizăm şi apoi să le prezentăm
în tabele şi grafice. Putem atunci, să extragem cele mai importante trăsături,
prin analiza seriilor şi graficelor statistice.

2.2. GRUPAREA ŞI CLASIFICAREA DATELOR STATISTICE

După cum am văzut, în etapa de observare statistică se culeg date


uni, bi sau multivariate, adică pentru fiecare unitate statistică se culeg date
privitoare la o singură caracteristică sau la mai multe caracteristici
considerate.

2.2.1. Principiile grupării/clasificării

Sistematizarea datelor se realizează prin gruparea şi clasificarea


datelor statistice, adică prin împărţirea lor în grupe/clase omogene, după
unul sau mai multe criterii de grupare/clasificare.
O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se
asemene cât mai mult între ele din punctul de vedere al criteriului utilizat,
adică dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici,
date de prezenţa factorilor aleatori, întâmplători.
CAPITOLUL 2

Criteriul de grupare/clasificare reprezintă variabila (caracteristica)


statistică în funcţie de care sistematizăm datele. După cum avem de-a face
cu un singur criteriu sau mai multe criterii de grupare/clasificare, vom vorbi
de grupări/clasificări simple sau combinate.

Dacă sistematizarea datelor se face după o variabilă nenumerică,


procesul se numeşte clasificare.

Gruparea reprezintă sistematizarea datelor după o variabilă


(caracteristică) numerică. În funcţie de tipul acesteia, gruparea se poate face
după o variabilă discretă sau continuă.

2.2.2. Gruparea pe intervale de variaţie

Intervalul de variaţie reprezintă un şir de valori ale variabilei


studiate, delimitat de intervalele vecine prin limita inferioară şi limita
superioară. Intervalele de variaţie pot fi de mărime egală sau neegală.

• Pentru gruparea pe intervale de variaţie se recomandă utilizarea


unui număr moderat de grupe. Deseori, un număr de 4 până la 10 grupe
este arbitrar recomandat, dar felul datelor poate necesita un alt număr de
grupe.
Pentru alegerea numărului de intervale de grupare (r) se poate utiliza
şi relaţia lui Sturges (în ipoteza repartiţiei aproximativ normale a unităţilor
după variabila studiată):
r = 1 + 3,322 log10 n (2.1.)
unde n reprezintă numărul total de unităţi din colectivitate (volumul colec-
tivităţii).
• Pentru sistematizarea datelor pe intervale de variaţie se recomandă
utilizarea intervalelor de mărime egală, cu excepţia cazurilor în care
analiza datelor, descoperirea unor tipuri calitative în colectivitate, necesită
folosirea unor intervale de mărime neegală.
• Mărimea intervalului (h) se recomandă a se rotunji la o valoare
convenabilă.
• Punctul de plecare în alcătuirea intervalelor de grupare se alege,
convenabil, 0 sau un număr întreg puţin mai mic decât valoarea minimă din
setul de date.
STATISTICĂ ECONOMICĂ

• Limitele intervalelor de grupare trebuie stabilite cu acurateţe,


respectând precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt
de această manieră).
• Limitele intervalelor de grupare se stabilesc exact, fără
ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată fi
încadrată într-o singură clasă.

Aşadar, pentru sistematizarea datelor pe intervale egale de grupare se


prezintă următorii paşi:
1. Se stabileşte amplitudinea variaţiei caracteristicii:
A x = x max − x min (2.2.)
2. Se stabileşte numărul de grupe, r, în care vor fi sistematizate
datele
3. Se calculează mărimea aproximativă a intervalelor de grupare:
A x − x min
h ≈ = max (2.3.)
r r
4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o
valoare puţin mai mică):
xmin  xmin+h
xmin+h  xmin+2h
.....................................................
xmin + (r — 1)h  xmin + r ⋅ h

Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele prin


numărarea unităţilor care se încadrează în fiecare grupă. Dacă există grupe
cu frecvenţă nulă, ori multe grupe cu o singură observaţie, poate fi necesară
revizuirea mărimii intervalelor sau a numărului de intervale.

2.3. SERII STATISTICE

Rezultatul sistematizării datelor prin grupare/clasificare se constituie


sub forma seriilor statistice.

DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor refe-


ritoare la manifestările unui fenomen colectiv sub forma a două şiruri de
CAPITOLUL 2

date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea
frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.

2.3.1. Serii de distribuţie de frecvenţe pentru o variabilă


atributivă

A. Vom începe, acum, cu rezultatul sistematizării pe intervale de


grupare, pentru o variabilă numerică continuă, pentru care se obţine o serie
de distribuţie (repartiţie) de frecvenţe pe intervale, sub forma (Tabelul
2.1).

Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r
Total n = ∑ ni
i =1

OBSERVAŢII:
• dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4)
unde ∆ este o unitate de discretizare
• dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5)
atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă;
• mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , i = i,r (2.6)
dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, i = i,r (2.7)
sau
hi = xisup – x(i–1)sup, i = 2,r (2.8)
indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.
STATISTICĂ ECONOMICĂ

• pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni


unităţi dintr-o grupă au valoarea variabilei egală cu centrul de interval (xi).
h
x i = x i inf + i (2.9)
2
sau, dacă intervalele sunt cu variaţie continuă:
x i inf + x i sup
xi = (2.10)
2

Pe lângă frecvenţa absolută (ni) care indică numărul total de unităţi


statistice care au valoarea variabilei situată într-un interval (xiinf – xisup), se
poate calcula şi frecvenţa relativă a grupei, care indică proporţia din nu-
mărul total de unităţi, care se încadrează în grupă:
n n
n *i = r i = i (2.11)
n
∑ ni
i =1
unde n reprezintă volumul total al colectivităţii. Exprimată în procente,
frecvenţa relativă a grupei i este:
n n
n *i% = r i 100 = i 100 (2.12)
n
∑ ni
i =1
Dacă utilizăm frecvenţele relative, obţinem o serie de distribuţie
(repartiţie) de frecvenţe relative (Tabelul 2.2)

Tabelul 2.2.
Serie de distribuţie de frecvenţe relative
Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup n 1*
x2inf – x2sup
. n *2
. .
. .
xi inf – xi sup n *i
.
.
.
.
xrinf – xrsup *
nr
r
Total 1,00 = ∑ n *i
i =1
CAPITOLUL 2

Frecvenţele absolute cumulate (Fci) reprezintă numărul unităţilor


statistice care au valoarea variabilei mai mică (sau, eventual, egală) cu
limita superioară a grupei (deci, au valoarea variabilei mai mare decât x1inf şi
mai mică decât xisup).
i
Fci = ∑ n k (2.13)
k =1
Similar cu frecvenţele cumulate crescător, se pot calcula şi frecvenţe
cumulate descrescător:
r
Fdi = ∑ n k (2.14)
k =i
r
Fdi* = ∑ n *k (2.15)
k =i

EXEMPLUL 2.1 În urma sistematizării datelor cu privire la salariul


net încasat de o colectivitate de muncitori, s-a obţinut următoarea serie de
repartiţie (Tabelul 2.3):

Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Număr de Frecvenţe Frecvenţe
Salariul net Frecvenţe
salariaţi absolute relative
(mii lei) relative n *i cumulate (Fci)
(ni) cumulate ( Fci* )
1,4 – 1,6 5 0,10 5 0,10
1,6 – 1,8 8 0,16 13 0,26
1,8 – 2,0 4 0,08 17 0,34
2,0 – 2,2 17 0,34 34 0,68
2,2 – 2,4 8 0,16 42 0,84
2,4 – 2,6 3 0,06 45 0,90
2,6 – 2,8 2 0,04 47 0,94
2,8 – 3,0 2 0,04 49 0,98
3,0 – 3,2 1 0,02 50 1,00
Total 50 1,00 — —

Dacă intervalele sunt neegale, pentru asigurarea comparabilităţii


datelor se pot calcula frecvenţe reduse la un interval etalon (standard).
Frecvenţa redusă (corectată) a unui interval ( n icor ) se calculează prin
raportarea frecvenţei absolute la un factor de corecţie (l) ce reprezintă
numărul intervalelor etalon ce încap într-un interval de grupare:
STATISTICĂ ECONOMICĂ

hi
l= (2.16)
h et
ni
n icor = (2.17)
l
unde hi reprezintă mărimea intervalului i, i = 1, r
het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare).

B. În cazul în care variabila de grupare este discretă şi gruparea se


efectuează pe variante, seria de distribuţie de frecvenţe este discretă sau
pe variante.

EXEMPLUL 2.2: Un exemplu de distribuţie de frecvenţe după o va-


riabilă discretă este distribuţia divorţurilor din România în anul 2000 după
numărul de copii minori rămaşi prin desfacerea căsătoriei (Tabelul 2.4),
pentru care s-au calculat şi frecvenţele relative (col.2) şi frecvenţele cumu-
late (col. 3 şi col. 4):

Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori
rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de Număr de Frecvenţe Frecvenţe Frecvenţe
copii minori divorţuri *
relative ( n i ) absolute relative
(ni) cumulate cumulate
(Fci) ( Fci* )
0 1 2 3 4
0 18.614 0,465 18.614 0,465
1 14.518 0,363 33.132 0,828
2 5.351 0,134 38.483 0,962
3 1.062 0,027 39.545 0,989
4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000
Total 39.985 1,000 — —

Seriile de distribuţie de frecvenţe alcătuite după o variabilă


cantitativă (numerică), adică cele descrise de paragrafele A şi B, poartă
numele de distribuţii heterograde.
CAPITOLUL 2

C. O distincţie aparte trebuie făcută pentru seriile de distribuţie de


frecvenţe alcătuite după o variabilă calitativă (nenumerică) ce poartă
numele de distribuţii homograde.

EXEMPLUL 2.3: O distribuţie homogradă, după o variabilă nenume-


rică măsurată pe o scală nominală este distribuţia contractelor de asigurare
pe viaţă în România, în anul 1999, pe principalele companii (vezi Tabelul
2.5, unde se prezintă ca o distribuţie de frecvenţe relative):

Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe
principalele companii
Procent din numărul total de
Compania
contracte încheiate (%)
Nederlanden 45,70
ASIROM S.A. 27,41
SARA MERKUR 12,16
UNITA 8,30
AIG Life 1,93
Garanta 1,35
Omniasig 0,96
METROPOL S.A. 0,92
Interamerican 0,57
ARDAF 0,25
Altele 0,45
Total 100,0

D. Seriile statistice de distribuţie de frecvenţe bidimensionale


sunt cele formate prin considerarea concomitentă a două variabile (X şi Y).
Forma unei astfel de serii de distribuţie bidimensională este (Tabelul 2.6)
STATISTICĂ ECONOMICĂ

Tabelul 2.6
Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru Y
y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
Total n.1 n.2 .... n.j ... n.m n..

În acest tabel trebuie să remarcăm că:


m
n i⋅ = ∑ n ij (2.18)
j=1
r
n ⋅ j = ∑ n ij (2.19)
i =1
r m r m
n.. = ∑ n i. = ∑ n. j = ∑ ∑ n ij (2.20)
i =1 j=1 i =1 j=1

O situaţie aparte o întâlnim în cazul variabilelor alternative, când


datele se pot prezenta într-un tabel de asociere de forma (Tabelul 2.7):

Tabelul 2.7
Tabel de asociere
Clasele lui X Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22

2.3.2. Serii cronologice

Seriile cronologice reprezintă seriile statistice ce se obţin prin


sistematizarea datelor după o variabilă de timp. O serie cronologică este
CAPITOLUL 2

alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot
fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa
de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte
de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade),
seria cronologică se numeşte de flux (de intervale). O serie cronologică se
notează:
1 2 ... t ... n  t 
  sau  , t = 1, n.
 y1 y 2 ... y t ... y n  y t 
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea
pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).

Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Vânzările
Anul
(mii exemplare)
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2001 143,0

2.3.3. Serii teritoriale

Dacă variabila pentru care se sistematizează datele este o variabilă


de spaţiu (teritorială), adică elementul ce diferenţiază manifestările
fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul
este o serie teritorială (de spaţiu).
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.5: Rata şomajului în anul 1997 pentru 11 ţări din


Europa a fost (Tabelul 2.9):
Tabelul 2.9
Rata şomajului
Ţara Rata şomajului (%)
Austria 7,1
Belgia 13,2
Bulgaria 13,7
Elveţia 5,2
Franţa 12,4
Germania 12,5
Italia 12,3
Olanda 5,5
România 10,4
Spania 20,8
Ungaria 10,4

2.4. PREZENTAREA DATELOR ÎN TABELE STATISTICE

Tabelul statistic constituie o modalitate de prezentare a datelor


statistice şi este format dintr-o reţea de linii paralele, orizontale şi verticale
în care sunt încadrate datele statistice. Alături de funcţia de prezentare a
rezultatelor prelucrării primare şi secundare a datelor statistice, tabelele
statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor.
Tabelele statistice conţin una sau mai multe serii statistice.

Tabelul statistic trebuie să fie elaborat după anumite reguli privind


elementele de conţinut şi de formă.

În funcţie de rolul lor în analiza şi prelucrarea datelor statistice,


tabelele statistice pot fi: simple (descriptive); de prelucrare; pe grupe
(obţinute în urma sistematizării datelor); combinate; de asociere.
CAPITOLUL 2

2.5. METODE GRAFICE DE DESCRIERE A DATELOR STATISTICE

Reprezentarea grafică este o metodă de descriere a datelor prin


intermediul figurilor geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin
diferite mijloace plastice de prezentare scoate în evidenţă ceea ce este
caracteristic şi esenţial în evoluţia fenomenelor, în schimbările structurale,
în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi
natură sau calitativ diferite1.
• Cel mai adesea, graficele statistice sunt reprezentate într-un sistem
de coordonate rectangulare (ortogonale), adică în raport şi proporţional
cu două axe perpendiculare, dar se pot întâlni şi grafice reprezentate într-un
sistem de coordonate polare.
y

yi M
M
r

α
o xi x o x
a) b)

Fig. 2.1 - Reprezentare în coordonate: a) rectangulare b) polare

• Reţeaua graficului este alcătuită dintr-un sistem de linii verticale


şi orizontale sau de cercuri concentrice care ajută la construirea graficului.
• Scara de reprezentare stabileşte corespondenţa dintre o unitate de
măsură aleasă pe grafic şi unitatea relativă la X (sau Y). Scările de repre-
zentare pot fi aritmetice, logaritmice sau semilogaritmice.
• Legenda graficului are rolul de a explica diversele simboluri,
haşuri, culori folosite pentru a facilita înţelegerea reprezentării construite.

1
D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
STATISTICĂ ECONOMICĂ

• În afara acestor elemente specifice reprezentărilor grafice, trebuie


să subliniem necesitatea prezenţei unor elemente comune şi tabelelor
statistice: titlul, sursa datelor, numerotarea, note explicative etc.

Pentru a reprezenta corect proporţiile şi rapoartele care se


înregistrează între datele statistice prin intermediul graficelor, utilizăm
figuri geometrice, hărţi, diagrame figurale etc.
Principalele tipuri de grafice vor fi prezentate, în continuare, în
funcţie de felul seriilor statistice în care au fost sistematizate datele.

2.5.1. Histograma şi poligonul frecvenţelor

Pentru o serie de distribuţie de frecvenţe după o variabilă numerică


continuă (pe intervale), reprezentările grafice care ne permit să vizualizăm
distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.
EXEMPLUL 2.6: Pentru seria de repartiţie de frecvenţe absolute pre-
zentată în tabelul 2.3, histograma este (fig. 2.2.):
y
40
35
30 Scara de reprezentare
Frecvenþe

25 Ox: 0,7 cm = 0,2 mil. lei


20 Oy: 0,5 cm = 2 persoane
15
10
5
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)

Fig. 2.2 - Histograma frecvenţelor absolute pentru salariul net al muncitorilor

O altă posibilitate de reprezentare grafică a distribuţiei de frecvenţe


pentru o caracteristică numerică de tip continuu este poligonul frecvenţelor.
EXEMPLUL 2.7: Pe baza datelor din tabelul 2.3, putem construi poli-
gonul frecvenţelor absolute, astfel (fig. 2.3 şi fig. 2.4.):
Fig. 2.3 - Poligonul frecvenţelor absolute pentru salariul net al muncitorilor
y
40
35
30
Frecvenþe

25
20
15
10 Scara de reprezentare
5 Ox: 0,8 cm = 0,2 mil. lei
0 Oy: 0,5 cm = 2 persoane

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
CAPITOLUL 2

y
40
35
30
Frecvenþe

25
20
15
10 Scara de reprezentare
5
Ox: 0,8 cm = 0,2 mil. lei
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x Oy: 0,5 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.4 - Histograma şi poligonul frecvenţelor absolute


pentru salariul net al muncitorilor

Trebuie să remarcăm că histograma şi poligonul frecvenţelor se pot


construi şi pe baza frecvenţelor relative.

EXEMPLUL 2.8: Pe baza datelor din tabelul 2.3, utilizând frecvenţele


relative, histograma şi poligonul frecvenţelor relative este (fig. 2.5.):

y
Frecvenþe relative (%)

40
35
30
25
20
15
10
5 Scara de reprezentare
0 Ox: 0,8 cm = 0,2 mil. lei

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Oy: 0,6 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.5 - Histograma şi poligonul frecvenţelor relative pentru salariul net al


muncitorilor
STATISTICĂ ECONOMICĂ

Când intervalele devin suficient de mici, iar numărul de cazuri


rămâne finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă
netedă (fig. 2.6.)

14

12

10
Frecvente

0
10 20 30 40 50 60 70 80 90
Intervale

a) set mic de date

35

30

25
Frecvente

20

15

10

0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46

Intervale

b) Set foarte mare de date


Fig. 2.6 - Efectul volumului colectivităţii asupra aspectului poligonului
frecvenţelor

Iată, deci, că histograma şi poligonul frecvenţelor oferă o primă


imagine asupra normalităţii sau tendinţei de normalitate, ori, din contră,
asupra asimetriei profunde a unei serii de distribuţie de frecvenţe. O
distribuţie normală, perfect simetrică (în forma clopotului lui Gauss-
Laplace) (vezi fig. nr. 2.7.a) este foarte rar întâlnită în practică; cu toate
CAPITOLUL 2

acestea ea este o distribuţie teoretică la care se face adeseori apel în analiza


statistică. În cele mai multe cazuri, distribuţiile de frecvenţe empirice au
tendinţă de normalitate, dar un anumit grad de asimetrie (fig.2.7b şi
fig.2.7.c). Există şi distribuţii profund asimetrice, în care frecvenţa maximă
se întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele să
descrească spre zero. Aceste distribuţii se numesc în formă de J (fig.2.7d şi
fig.2.7e). De asemenea, se pot întâlni distribuţii în formă de U, cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă minimă în
jurul intervalului central — din mijlocul distribuţiei (fig.2.7f). Este firesc,
aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a
tendinţei de distribuţie a valorilor în colectivitatea cercetată.

y y y

o x o x o x

a) distribuţie normală, b) distribuţie cu tendinţă de b) distribuţie cu tendinţă de


perfect simetrică normalitate, asimetrică normalitate, asimetrică

y y y

o x o x o x
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U

Fig. 2.7 - Forme ale distribuţiilor de frecvenţe

O serie de distribuţie de frecvenţe alcătuită după o variabilă


numerică discretă se reprezintă grafic prin poligonul frecvenţelor.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.9: Distribuţia elevilor dintr-o clasă după nota obţinută


la o lucrare de control este cea prezentată în Tabelul 2.10. Reprezentarea
grafică a distribuţiei se prezintă în graficul din fig. 2.8.

Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control
Nota (xi) Număr de elevi (ni)
2 1
3 2
4 2
5 6
6 7
8 15
9 5
10 2
Total 40

16

14

12
10
Frecvente

8
6

2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota

Fig. 2.8 - Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de


control

2.5.2. Curba frecvenţelor cumulative (ogiva)

O altă modalitate de descriere a datelor cantitative continue,


construită de această dată pe baza frecvenţelor cumulative este curba
frecvenţelor cumulative (ogiva).
CAPITOLUL 2

Să subliniem mai întâi că frecvenţele cumulate sunt interpretate în


relaţie cu limitele exacte ale intervalelor de grupare.

EXEMPLUL 2.10: Pe baza datelor obţinute în tabelul 2.4. se poate


construi grafic curba frecvenţelor cumulate crescător (fig. 2.9.)

60

50
Frecvente cumulate

40

30

20

10

0
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)

Fig. 2.9 - Curba frecvenţelor cumulate crescător, pentru salariul net al


muncitorilor

Suprapus peste curba frecvenţelor cumulate crescător, ori într-un


grafic separat, se poate reprezenta curba frecvenţelor cumulate
descrescător. De asemenea, ogiva se poate reprezenta şi pe baza
frecvenţelor relative cumulate.

EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).
STATISTICĂ ECONOMICĂ

1,2

1
Frecvente relative cumulate

0,8

0,6

0,4

0,2

0
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (m il. lei)

Fig. 2.10 - Curba frecvenţelor relative cumulate crescător


pentru salariul net al muncitorilor

Reprezentarea grafică a frecvenţelor cumulate crescător pentru o


variabilă discretă, prin intermediul graficului frecvenţelor cumulate, va
avea, de această dată, aspectul unei scări, pentru că nici o unitate statistică
nu poate avea valoarea caracteristicii situată între variantele stabilite.
EXEMPLUL 2.12: Pe baza distribuţiei din tabelul 2.10 se poate deter-
mina distribuţia de frecvenţe absolute cumulate crescător (Tabelul 2.11) şi
reprezenta grafic în fig. 2.11.
CAPITOLUL 2

Tabelul 2.11
Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control
Nota (xi) Frecvenţe absolute cumulate
crescător (Fci)
2 1
3 3
4 5
5 11
6 18
8 33
9 38
10 40

Frecvenþe cumulate (Y)


40

35

30

25

20

15

10

o 1 2 3 4 5 6 7 8 9 10 x (nota)

Fig. 2.11 - Graficul frecvenţelor cumulate crescător pentru distribuţia elevilor


după nota la lucrarea de control

2.5.3. Diagrama prin coloane şi diagrama prin benzi

Alte modalităţi uzuale de a reprezenta grafic o serie de distribuţie


de frecvenţe absolute sau relative, pentru o variabilă calitativă
(categorială) sunt diagrama prin coloane şi diagrama prin benzi.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.13: Pe baza datelor din tabelul 2.5, care reprezintă o


distribuţie de frecvenţe relative după o variabilă calitativă, reprezentarea
grafică este prin diagrama prin coloane (fig. 2.12) sau diagrama prin benzi
(fig. 2.13).

50
45.7
45
Frecvenţe relative (%)

40

35

30 27.41

25

20

15 12.16
10 8.3

5 1.93 1.35 0.96 0.92 0.57 0.25 0.45


0
l
n

fe

ta

le
A

ig

AF
A

po

am
de

IT

te
as
O

Li

an

ro

D
SA

N
IR

Al
n

er
ni
G

ar

AR
et
la

t
AS

m
AI

In
er

M
O
ed
N

Compania

Fig. 2.12 - Diagramă prin coloane

Nederl. 45.7
ASIROM 27.41
SARA 12.16
UNITA 2.3
Companie

AIG Life 1.93


Garanta 1.35
Omniasig 0.96
Metropol 0.92
Interam. 0.57
ARDAF 0.25
Altele 0.45

0 10 20 30 40 50
Frecvenţe relative (%)

Fig. 2.13 - Diagramă prin benzi


CAPITOLUL 2

2.5.4. Diagrama de structură

O altă modalitate de a prezenta grafic datele pe care le avem la dis-


poziţie cu privire la o serie de distribuţie de frecvenţe (vizual homogradă)
este diagrama de structură.

EXEMPLUL 2.14: Pe baza datelor din Tabelul 2.5., diagrama de


structură se prezintă astfel (fig. 2.14):

Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Lif e
UNITA
SARA
ASIROM
Nederl.
a.
STATISTICĂ ECONOMICĂ

Nederl.
ASIROM
SARA
100 UNITA
80 AIG Life
Garanta
60
% Omniasig
40
Metropol
20 Interam.

0 ARDAF

b. Altele

Nederl.
100
A SIROM
90
80 SA RA
70 UNITA
60 A IG Lif e
% 50 Garanta
40 Omnias ig
30 Metropol
20 Interam.
10
A RDA F
0
c. A ltele

Nederl.
ASIROM
SARA
100% UNITA
80% AIG Life

60% Garanta
% Omniasig
40%
Metropol
20%
Interam.
0% ARDAF
d. Altele

Fig. 2.14 - Diagrama de structură a contractelor de asigurări pe companii


de asigurare, în România, 1999: a. prin cerc; b. prin cilindru; c. prin
dreptunghi; d. prin paralelipiped
CAPITOLUL 2

2.5.5. Diagrama de împrăştiere (corelograma)

În cazul datelor bivariate, sistematizate într-o serie de distribuţie de


frecvenţe bidimensională, reprezentarea grafică uzuală în sistemul de coor-
donate rectangulare este diagrama de împrăştiere (despre care vom vorbi
mai pe larg într-un capitol următor) (fig. 2.15)

Cantitãþi vândute
din produsul X
(mii bucãþi) 250
**
**
200 ***
***
150 * * ***
* ***
100 * * **
***
* *** *
50 **
***
***
10
20 30 40 50 60 Cheltuieli cu
reclama (mld. lei)

Fig. 2.15 - Diagramă de împrăştiere

2.5.6. Cronograma

O serie cronologică se reprezintă grafic prin intermediul


cronogramei sau historiogramei. În sistemul de coordonate rectangulare,
pe axa absciselor se marchează unităţile de timp (t) — momente sau intervale
— iar pe axa ordonatelor valorile variabilei (yt).
Reprezentarea grafică a seriilor cronologice este prezentată mai pe
larg în capitolul 6.
EXEMPLUL 2.15: Pe baza datelor din tabelul 2.8, reprezentarea grafică
prin intermediul cronogramei (prin segmente de linie sau coloane) este (fig.
2.16)
Numarul de exemplare vandute Numarul de exemplare vandute
(mii exemplare)
(mii exemplare)
ia
nu
ar

0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ie

90.00
100.00
110.00
120.00
130.00
140.00
150.00

fe 20
br 01
ua
rie
20
m 01
ar
tie
20
ap 01
ril
ie
20
01
m
ai
20
iu 01
ni
e2
00
iu 1
lie

a)

b)
au 200
gu 1
se st

Lunile
pt
em 200
b 1

luni
oc rie 2
to 00
m 1
br
no ie
ie 20
m 01
br
de ie
ce 20
m
STATISTICĂ ECONOMICĂ

01
br
ie
ia 20
nu 01
ar
ie
fe 20
br 02
ua
rie
20
01

Fig. 2.16 - Cronogramă trasată prin a) linii; b) coloane


CAPITOLUL 2

2.5.7. Diagrama polară

În cazul în care seria cronologică prezintă variaţii sezoniere, pentru


reprezentarea grafică a evoluţiei unui fenomen putem folosi diagrama
polară (radială), construită în sistemul de coordonate polare. Acest tip de
diagramă se va prezenta mai pe larg în capitolul 6.

EXEMPLUL 2.16: Temperatura medie lunară a aerului la Bucureşti -


Filaret în anul 1996 se reprezintă grafic în fig. 2.17.

Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.

Sept. Mai

Aug. Iun.
Iul.

Temperatura medie lunara a aerului la Bucuresti-Filaret în


anul 1996

Fig. 2.17 – Diagramă polară

2.5.8. Diagrama prin suprafeţe

O serie teritorială se poate reprezenta grafic prin diagrame prin


coloane, benzi ori diagramă prin suprafeţe. În diagrama prin suprafeţe se
construiesc, de obicei, pătrate sau cercuri, cu suprafeţele proporţionale cu
valorile reprezentate.

În cazul fenomenelor complexe, care se descompun în produsul a


trei factori se poate folosi diagrama de volum trasată prin paralelipipedul
dreptunghic. Cei trei factori se vor reprezenta pe lungimea, lăţimea şi
înălţimea paralelipipedului, iar nivelul fenomenului complex prin volumul
acestuia.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.17: Populaţia globului pe continente în anul 1998 se


prezintă astfel (mil. locuitori, Tabelul 2.12):
Tabelul 2.12
Continent Populaţie (mil. loc.)
Africa 778
America de Nord 472
America de Sud 332
Asia 3590
Europa 729

Reprezentarea grafică este redată în fig. 2.18.

Legendă:

Africa

America de Nord

America de Sud

Asia

Europa

Fig. 2.18 - Diagramă de suprafaţă

2.5.9. Alte tipuri de reprezentări grafice

Dacă aceste diagrame pot fi construite şi pentru alte serii statistice


(de exemplu: serii de distribuţii de frecvenţe homograde), o modalitate
specifică de reprezentare grafică a seriilor teritoriale este cartograma sau
cartodiagrama, în care pe o hartă se construiesc diagrame (în cazul
cartodiagramei), se haşurează sau se colorează diferit unităţile teritoriale (în
cazul cartogramei), în funcţie de nivelul înregistrat al variabilei.
Să notăm că există şi alte reprezentări grafice (diagrama Venn,
diagrama Chernoff) a căror acurateţe în construcţie este facilitată de
utilizarea pachetelor informatice specializate.
CAPITOLUL 2

Întrebări recapitulative

1. Ce este sistematizarea datelor statistice?


2. Care sunt principiile după care se efectuează gruparea/clasificarea
datelor statistice?
3. Ce reprezintă clasificarea datelor statistice?
4. Cum se efectuează gruparea pe intervale de variaţie?
5. Definiţi conceptul de serie statistică.
6. Ce reprezintă frecvenţa relativă şi cum se calculează?
7. Arătaţi semnificaţia şi modul de obţinere a frecvenţelor cumulate,
absolute şi relative. Exemplificaţi.
8. Definiţi conceptele de serie heterogradă şi serie homogradă.
9. Seria statistică de distribuţie de frecvenţe bidimensională —
definiţie, formă de prezentare.
10. Ce reprezintă şi cum se construieşte tabelul de asociere?
11. Ce reprezintă seria cronologică?
12. Ce reprezintă seria teritorială?
13. Enumeraţi regulile de construire a tabelelor statistice.
14. Ce reprezintă graficul statistic?
15. Care sunt principalele reguli de construire a graficelor statistice?
16. Cum se reprezintă grafic o serie de distribuţii de frecvenţe?
17. Cum se construieşte ogiva?
18. Cum se reprezintă grafic o serie de distribuţii de frecvenţe pe
intervale neegale?
19. Cum se utilizează diagrama prin benzi şi diagrama prin coloane?
20. Cum se construieşte diagrama de structură?
21. Cum se utilizează diagrama prin suprafeţe?
22. Cum se construieşte corelograma?
23. Cum se reprezintă grafic seriile cronologice?
24. Cum se reprezintă grafic seriile teritoriale?