Sunteți pe pagina 1din 39

24

20

16

12

CAPITOLUL 3 8

0
<170 170-190 190-210 210-230 230-250 250-270 270-290 290-310 310 si peste

TEHNICI DE SISTEMATIZARE ŞI

DESCRIERE GRAFICĂ A DATELOR

STATISTICE

3.1 Gruparea şi clasificarea datelor

3.2 Prezentarea datelor în tabele, serii şi grafice

3.3 Prezentarea datelor pentru variabile atributive

3.4 Prezentarea datelor pentru variabile de timp

3.5 Prezentarea datelor pentru variabile de spaţiu


Emilia Ţiţan

3.1 GRUPAREA ŞI CLASIFICAREA DATELOR


După ce datele statistice au fost colectate din surse de date
publicate, din observări totale sau din observări parţiale – ele trebuie
organizate, în scopul de a avea o formă care să permită prelucrarea
lor statistică diversă. Cum observarea parţială – în mod special
eşantionarea probabilistă – salvează timp, resurse de muncă şi
resurse băneşti, vom trata îndeosebi problema sistematizării datelor
provenite din eşantioane. Cu toate acestea, trebuie să înţelegem că,
indiferent dacă lucrăm cu date referitoare la colectivităţi parţiale ori
la colectivităţi totale, atunci când seturile de date conţin în jur de 30
de observaţii sau peste acest număr (date de masă), cel mai bun mod
de a le examina este să le sistematizăm şi apoi să le prezentăm în
tabele şi grafice. Putem, atunci, să extragem cele mai importante
trăsături, prin analiza seriilor şi graficelor statistice.
După cum am văzut, în etapa de observare statistică se
culeg date uni-, bi- sau multivariate, adică pentru fiecare unitate
statistică se culeg date privitoare la o singură caracteristică sau la
mai multe caracteristici considerate.

3.1.1 Principiile grupării şi clasificării


Sistematizarea datelor constitu- Sistematizarea datelor se realizează prin gruparea şi
ie o metodă eficientă pentru a clasificarea datelor statistice, adică prin împărţirea lor în
căpăta o imagine generală asu-
pra distribuţiei, concetrării / îm-
grupe/clase omogene, după unul sau mai multe criterii de
prăştierii valorilor. grupare/clasificare.
O grupă/clasă este omogenă dacă unităţile din interiorul ei
tind să se asemene cât mai mult între ele din punctul de vedere al
criteriului utilizat, adică dacă între unităţile din aceeaşi
grupă/clasă există variaţii cât mai mici, date de prezenţa
factorilor aleatori, întâmplători.
Criteriul de grupare/clasificare reprezintă variabila
(caracteristica) statistică în funcţie de care sistematizăm datele.
După cum avem de-a face cu un singur criteriu sau mai multe
criterii de grupare/clasificare, vom vorbi de grupări/clasificări
simple sau combinate.
Grupele/clasele trebuie să fie
Gruparea/clasificarea datelor trebuie să se facă aşadar după
exhaustive şi mutual exclusive. principiile: omogenităţii (principiu explicat mai sus), unicităţii
(o unitate statistică trebuie să se încadreze într-o singură
grupă/clasă după un criteriu) şi universalităţii (toate unităţile
statistice trebuie să se încadreze în grupele/clasele alcătuite după
criteriul considerat).

3.1.2 Gruparea datelor statistice


Gruparea reprezintă sistematizarea datelor după o
variabilă (caracteristică) numerică. În funcţie de tipul
42
Tehnici de sistematizare şi descriere grafică a datelor statistice

acesteia, gruparea se poate face după o variabilă discretă sau


continuă. Atunci când lucrăm cu o variabilă discretă şi când
plaja valorilor pe care le poate lua caracteristica nu este foarte Gruparea datelor se poate face:
mare, sistematizarea datelor se face prin gruparea pe – pe variante;
variante. Frecvenţa grupelor se stabileşte prin numărarea – pe intervale de variaţie.
unităţilor care se încadrează în fiecare variantă.
De cele mai multe ori, însă, când studiem o variabilă
numerică pentru un fenomen social-economic, aceasta are o
plajă largă de valori, şi atunci, chiar dacă este discretă,
intervalul de discretizare este atât de mic încât putem să o
tratăm ca pe o variabilă continuă. Vorbim atunci, în
sistematizarea datelor, de gruparea pe intervale de variaţie.
Intervalul de variaţie reprezintă un şir de valori ale
variabilei studiate, delimitat de intervalele vecine prin limita
inferioară şi limita superioară. Intervalele de variaţie pot fi
de mărime egală sau neegală.
Nu există o metodă unică, sau un set de reguli fixe
pentru sistematizarea datelor prin gruparea pe intervale de
variaţie, însă pot fi făcute câteva sugestii pe care să le
considerăm atunci când facem o astfel de grupare pe intervale
de variaţie. Să nu pierdem din vedere, însă, obiectivul final al
grupării, acela de a prezenta într-o versiune condensată
datele, de a le organiza într-o manieră care să permită
descrierea formelor, trăsăturilor esenţiale ale fenomenului
studiat.
Alegerea numărului de grupe
Pentru gruparea pe intervale de variaţie se recomandă
utilizarea unui număr moderat de grupe. Deseori, un Sugestie:
număr de 5 până la 10 grupe este arbitrar recomandat, dar • în general se recomandă
felul datelor poate necesita un alt număr de grupe. ca numărul grupelor să fie cu-
prins între 5 şi 15.
Numărul intervalelor de grupare este, în primul rând,
dependent de numărul observaţiilor (al unităţilor statistice) pe
care dorim să le sistematizăm. Un număr mare de date
necesită un număr mai mare de intervale de grupare. Ca un
principiu general, o distribuţie de frecvenţe trebuie să
cuprindă cel puţin 5 intervale de grupare, dar nu mai mult de
15. Dacă nu sunt suficiente grupe, sau dacă sunt prea multe,
nu vom putea obţine informaţii suplimentare din analiza
datelor sistematizate sau chiar vom pierde informaţii.

Gruparea întreprinzătorilor privaţi activi din economia Exemplu


naţională, în anul 2000, după numărul salariaţilor, pe o
singură grupă de mărime (0-9 angajaţi), se prezintă astfel
(tabelul nr. 3.1):

43
Emilia Ţiţan

Tabelul nr. 3.1


Întreprinzători privaţi activi din economia naţională
Clase de mărime, după
Întreprinzători privaţi
numărul de salariaţi
0 1
0-9 394868
TOTAL 394868

Dintr-un asemenea tabel de sistematizare a datelor nu se


obţine nici o informaţie adiţională, faţă de ceea ce deja ştim privind
datele brute sau ordonate. Un efect similar obţinem şi în cazul
celeilalte extreme, dacă grupăm datele pe foarte multe intervale de
grupare. Datele vor fi atunci prea puţin concentrate şi sistematizate.

Pentru alegerea numărului de intervale de grupare (r) se


poate utiliza şi relaţia lui Sturges (în ipoteza repartiţiei
aproximativ normale a unităţilor după variabila studiată):
Relaţia lui Sturges: r  1  3,322 log10 n , (3.1.)
unde n reprezintă numărul total de unităţi din colectivitate
(volumul colectivităţii).
Stabilirea mărimii intervalului de grupare
Pentru sistematizarea datelor pe intervale de variaţie se
recomandă utilizarea intervalelor de mărime egală, cu
Sugestii: excepţia cazurilor în care analiza datelor, descoperirea unor
• în general se utilizează in- tipuri calitative în colectivitate necesită folosirea unor intervale
tervale de mărime egală;
• dacă este rezonabil, se
de mărime neegală.
recomandă ca mărimea interva- Mărimea intervalului (h) se recomandă a se rotunji la o
lelor să fie multiplu de 5. valoare convenabilă. Să notăm aici că prin sistematizarea datelor
pe intervale de grupare se pierde ceva din exactitatea informaţiei,
dar câştigăm pe linia condensării datelor şi descoperirii caracterelor
lor esenţiale. În calculele viitoare, însă, va trebui să ataşăm fiecărei
unităţi statistice o valoare concretă şi această valoare va fi, sub
anumite presupuneri, centrul intervalului de grupare (asupra acestei
probleme vom reveni). Pentru uşurinţa calculelor este, deci,
preferabil să se rotunjească mărimea intervalului de grupare.
Alcătuirea intervalelor de grupare
Punctul de plecare în alcătuirea intervalelor de grupare se
alege, convenabil, 0 sau un număr întreg puţin mai mic decât
valoarea minimă din setul de date.
Limitele intervalelor reprezintă Limitele intervalelor de grupare trebuie stabilite cu
valorile extreme cuprinse în fie- acurateţe, respectând precizia datelor (cu acelaşi număr de
care grupă. zecimale, dacă valorile sunt de această manieră).
Există cazuri când pentru primul interval nu se poate stabili
limita inferioară, sau pentru ultimul nu se poate stabili limita
44
Tehnici de sistematizare şi descriere grafică a datelor statistice

superioară (de pildă, cazul în care în setul de date există valori


extreme). În această situaţie, în prelucrarea ulterioară a datelor
limita inferioară a primului interval se stabileşte scăzând din Limitele intervalelor trebuie să
limita superioară mărimea intervalului vecin. La fel, limita supe- aibă acurateţea datelor anali-
rioară a ultimului interval se stabileşte adăugând la limita zate (de exemplu, cu două ze-
cimale, cu trei zecimale etc.).
inferioară mărimea intervalului vecin.
Limitele intervalelor de grupare se stabilesc exact, fără
ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată
fi încadrată într-o singură clasă.
Aşadar, pentru sistematizarea datelor pe intervale egale de
grupare se prezintă următorii paşi:
1. Se stabileşte amplitudinea variaţiei caracteristicii:
A x  x max  x min
(3.2.)
2. Se stabileşte numărul de grupe, r, în care vor fi
sistematizate datele
3. Se calculează mărimea aproximativă a intervalelor de
grupare:
A x  x min
h   max (3.3.)
r r
4. Se stabilesc intervalele de grupare pornind de la xmin (sau Sugestie:
de la o valoare puţin mai mică): • punctul de plecare (limita
inferioară a primului interval) se
xmin  xmin+h alege, convenabil, zero sau un
xmin+h  xmin+2h număr întreg apropiat de valoa-
..................................................... rea minimă din setul de date.
xmin + (r — 1)h  xmin + r  h
Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele
prin numărarea unităţilor care se încadrează în fiecare grupă.
Dacă există grupe cu frecvenţă nulă, ori multe grupe cu o
singură observaţie, poate fi necesară revizuirea mărimii inter-
valelor sau a numărului de intervale.

O agenţie imobiliară are următoarele preţuri de vânzare Exemplu


pentru 50 apartamente de 3 camere, din Bucureşti (mil. lei):
210, 120, 180, 170, 355, 190, 230, 190, 180, 160, 195, 205, 240,
290, 360, 210, 205, 140, 195, 205, 214, 230, 240, 320, 300, 310,
190, 200, 240, 280, 300, 290, 365, 310, 270, 260, 255, 280, 150,
190, 240, 230, 275, 265, 195, 125, 315, 265, 220, 240.
Pentru sistematizarea datelor, se calculează amplitudinea
variaţiei:
Ax=xmax-xmin=365-120=245(mil. lei)
Vom alege apoi numărul de grupe (r) în funcţie de volumul
datelor
r=5.

Mărimea intervalului de grupe (h) este:


45
Emilia Ţiţan

A x 245
h =  50 (mil. lei)
r 5
Intervalele de grupare vor fi: 120 până la (dar nu egal cu)
170 (mil. lei), 170 până la 220 (mil. lei), 220 până la 270 (mil.
lei), 270 până la 320 (mil. lei), 320 până la 370 (mil. lei).
Stabilirea frecvenţelor se va face prin numărarea obser-
vaţiilor care se încadrează în fiecare interval (tabelul nr. 3.2).

Tabelul nr. 3.2


Gruparea datelor pe intervale de variaţie
Preţ de vânzare Repartizarea
Colectivitatea statistică o repre- (mil. lei) observaţiilor pe Frecvenţe
zintă cele 50 de apartamente,
unitatea statistică este un apar-
grupe
0 1 2
tament, iar caracteristica statis-
tică este preţul de vânzare (mil. [120-170) llll 4
lei), variabilă numerică, de tip [170-220) lllllllllllllllll 17
continuu, măsurată pe o scală [220-270) lllllllllllll 13
de raport.
[270-320) lllllllllll 11
[320-370) lllll 5
TOTAL – 50

3.1.3 Clasificarea datelor statistice


Dacă sistematizarea datelor se face după o variabilă ne-
numerică, procesul se numeşte clasificare. Aşadar, clasificarea
presupune împărţirea unităţilor în clasele/categoriile variabilei
nenumerice considerate. Prin numărarea unităţilor statistice ce se
încadrează în fiecare clasă, se stabileşte frecvenţa clasei (cate-
goriei). Uneori, clasificările folosite în studierea fenomenelor
economico-sociale au caracter oficial sau natural.
Dacă datele se referă la variabile ordinale, clasele vor
respecta criteriul de ordine.

Exemplu Sistematizarea datelor privind structurile de primire


turistică în anul 2000 în România, pe categorii de confort, a dus
la următoarele rezultate (tabelul nr. 3.3):

Tabelul nr. 3.3


Structurile de primire turistică cu funcţiuni de
cazare turistică, pe categorii de confort, în anul 2000
Categorii de confort Număr de unităţi (n I)
0 1
Neclasificate 619
1 stea 1059
2 stele 1068
3 stele 284
46
Tehnici de sistematizare şi descriere grafică a datelor statistice

Categorii de confort Număr de unităţi (n I) Tabelul nr. 3.3 (continuare)


0 1
4 stele 85
5 stele 6
TOTAL 3121
Sursa: Anuarul Statistic al României, 2001, pg. 512.

Dacă datele sunt categoriale (variabilă nominală), ordinea


claselor este lăsată la îndemâna cercetătorului.

Clasificarea unităţilor de cazare turistică, pe structuri de Exemplu


primire turistică, în România, în anul 2000 este (tabelul nr. 3.4):

Tabelul nr. 3.4


Structurile de primire turistică având
funcţiuni de cazare turistică, în anul 2000
Clasificarea unităţilor de cazare
Structuri de primire turistică Număr de unităţi turistică pe tipuri de structuri de
primire turistică are caracter
oficial.
0 1
Hoteluri şi moteluri 943
Hoteluri pentru tineret 1
Hosteluri 2
Hanuri turistice 23
Cabane turistice 161
Campinguri şi unităţi tip căsuţă 140
Vile turistice şi bungalouri 1066
Tabere de elevi şi preşcolari 172
Pensiuni turistice 361
Pensiuni agroturistice 240
Altele 12
TOTAL 3121
Sursa: Anuarul Statistic al României, 2001, pg. 514.

3.2 PREZENTAREA DATELOR ÎN TABELE,


SERII ŞI GRAFICE

3.2.1 Tabelul statistic


Tabelul statistic constituie o modalitate de prezentare a Tabelul statistic prezintă datele
datelor statistice şi este format dintr-o reţea de linii paralele, într-o manieră uşor de vizuali-
zat, de interpretat şi de analizat.
orizontale şi verticale în care sunt încadrate datele statistice.
Alături de funcţia de prezentare a rezultatelor prelucrării primare
47
Emilia Ţiţan

şi secundare a datelor statistice, tabelele statistice au şi funcţia


de sistematizare a datelor în vederea prelucrării lor. Tabelele
statistice conţin una sau mai multe serii statistice.
Coloanele tabelului se numero- Tabelul statistic trebuie să fie elaborat după anumite reguli
tează distinct. privind elementele de conţinut şi de formă:
- macheta tabelului, formată din reţeaua de linii ce
alcătuiesc rubricile tabelului;
- subiectul tabelului, care prezintă colectivitatea (totală
sau parţială) la care se referă datele;
- predicatul tabelului, care cuprinde sistemul de indicatori
primari şi derivaţi;
- datele numerice şi denumirile textuale cu care se com-
pletează rubricile tabelului;
- titlul tabelului, care prezintă, sintetic, conţinutul tabelului;
- sursa datelor şi numărul tabelului (necesar pentru iden-
tificarea lui);
- notele explicative şi observaţiile necesare pentru înţele-
gerea tabelului.
În funcţie de rolul lor în analiza şi prelucrarea datelor
statistice, tabelele statistice pot fi: simple (descriptive); de
prelucrare; pe grupe (obţinute în urma sistematizării datelor);
combinate; de asociere; de corelaţie.

3.2.2 Seria statistică


Seria statistică se mai numeşte Rezultatul sistematizării datelor prin grupare/clasificare se
şi repartiţie statistică. constituie sub forma seriilor statistice.
Seria statistică este prezentarea ordonată a datelor referi-
toare la manifestările unui fenomen colectiv sub forma a două
şiruri de date: unul priveşte variabila şi modul cum a fost
sistematizată, iar al doilea frecvenţa de apariţie sau nivelul unei
variabile în raport cu primul şir.
Serii statistice: Seriile statistice pot fi unidimensionale, dacă se obţin prin
– de repartiţie de frecvenţe; sistematizarea datelor univariate, bi- sau multidimensionale,
– cronologice (de timp);
– teritoriale (spaţiale). dacă se obţin prin sistematizarea datelor bi- sau multivariate.
De asemenea, seriile statistice pot fi: de distribuţie de
frecvenţe (obţinute prin sistematizarea datelor pentru variabile
atributive), serii cronologice (pentru variabile de timp), serii
teritoriale (pentru variabile de spaţiu).

3.2.3 Graficul statistic


Caracterele manifestărilor fenomenelor colective, trăsă-
turile lor esenţiale, aşa cum reies în urma sistematizării datelor
statistice sub formă de serii, pot fi scoase în relief prin repre-
zentări grafice. Astfel, datele sistematizate în tabele statistice se
pot prezenta, printr-o imagine vizuală sugestivă, de ansamblu,
48
Tehnici de sistematizare şi descriere grafică a datelor statistice

sub forma graficelor. Aşadar, reprezentarea grafică este o me-


todă de descriere a datelor prin intermediul figurilor geometrice
a figurilor naturale ori a figurilor simbolice.
Graficul este o imagine spaţială, cu caracter convenţional,
care, prin diferite mijloace plastice, de prezentare scoate în
evidenţă ceea ce este caracteristic şi esenţial în evoluţia
fenomenelor, în schimbările structurale, în ceea ce priveşte
proporţiile şi corelaţiile cu alte fenomene de aceeaşi natură sau
calitativ diferite1.
Cea mai comună aplicaţie a graficelor este să prezinte Un grafic trebuie să fie concis şi
eficient şi să comunice informaţiile statistice (tipic sub forma să transmită clar privitorului in-
datelor numerice). Mai mult, tehnicile grafice oferă, de aseme- formaţiile conţinute.
nea, instrumente analitice puternice pentru analiza (explorarea)
datelor şi pentru verificarea ipotezelor.
În cercetarea statistică este necesară o rigoare în construcţia
graficelor, tocmai pentru ca acestea să transmită corect, concis şi
clar informaţiile către cititor. Se poate vorbi, chiar, despre o
excelenţă grafică, atinsă atunci când sunt îndeplinite câteva
condiţii.
Astfel, graficele trebuie să prezinte concis şi coerent seturi
largi de date. Ele au fost create tocmai pentru a rezuma, într-o
singură imagine, caracteristici importante ale datelor de masă.
Dacă una sau două cifre pot fi prezentate într-o propoziţie, în
schimb, seturi mari de date se rezumă în tabele şi în grafice.
O a doua condiţie pe care trebuie să o îndeplinească Excelenţa grafică se atinge da-
graficele este aceea de a transmite într-o manieră uşor de înţeles că:
• graficul prezintă concis şi
ideile şi conceptele prin care statisticianul înlocuieşte o sută sau coerent largi seturi de date;
o mie de cuvinte care, altfel, ar fi necesare. • ideea sau conceptul pe
De asemenea, graficul trebuie să permită cititorului şi chiar care statisticianul doreşte să le
să încurajeze efectuarea de comparaţii între două sau mai multe transmită sunt clar înţelese;
• graficul încurajează privi-
fenomene ori variabile. Cel mai adesea, graficele sunt bine torul să analizeze ori să compa-
utilizate când descriu legături între două sau mai multe variabile re variabile statistice;
sau când explică cum şi de ce apar anumite rezultate. • se pune accentul pe fon-
Modul în care se prezintă un grafic trebuie să determine dul, pe conţinutul graficului;
• datele nu sunt distorsio-
privitorul să studieze fondul, substanţa datelor şi nu forma nate.
reprezentării. Forma graficului trebuie să ajute la înţelegerea
fenomenului, iar dacă aceasta înlocuieşte substanţa, reprezen-
tarea nu îşi mai îndeplineşte funcţia.
În sfârşit, dar nu în ultimul rând, graficul nu trebuie să
distorsioneze realitatea. El trebuie să spună adevărul, iar un
cititor avizat va desluşi dintr-o singură privire dacă datele sunt
prezentate corect ori tendenţios şi distorsionat.
Pentru a putea integra corect graficul în procesul cercetării
statistice, aspectele reprezentării trebuie controlate ţinând cont

1 D. Haşigan, I. Marinescu, Grafice şi elemente de calcul grafic, Ed. Ştiinţifică,

Bucureşti, 1968.
49
Emilia Ţiţan

de anumite elemente de bază: axele de coordonate, reţeaua


graficului, scara de reprezentare, legenda graficului.
În sistemul de coordonate rec-
Cel mai adesea, graficele statistice sunt reprezentate într-un
tangulare, un punct din plan se sistem de coordonate rectangulare (ortogonale), adică în
reprezintă în raport cu punctul raport şi proporţional cu două axe perpendiculare, dar se pot
de intersecţie al celor două axe: întâlni şi grafice reprezentate într-un sistem de coordonate
axa absciselor şi axa ordonate-
lor.
polare. Un punct M este localizat în sistemul de coordonate
rectangulare prin coordonatele sale de pe axa absciselor (xi) şi
de pe axa ordonatelor (yi) (figura nr. 3.1).

Figura nr. 3.1 Reprezentare în coordonate:


a) rectangulare; b) polare

Un punct M reprezentat în sistemul de axe polare este


localizat prin distanţa OM (r) şi unghiul α. Coordonatele polare
sunt folosite în special pentru seriile cronologice.
Reţeaua graficului este alcătuită dintr-un sistem de linii
verticale şi orizontale sau de cercuri concentrice care ajută la
construirea graficului.
Scara logaritmică stabileşte pro- Scara de reprezentare stabileşte corespondenţa dintre o
porţionalitatea dintre logaritmii unitate de măsură aleasă pe grafic şi unitatea relativă la X (sau
numerelor şi lungimea axelor. Y). Scările de reprezentare pot fi aritmetice, logaritmice sau
semilogaritmice.
Legenda graficului are rolul de a explica diversele
simboluri, haşuri, culori folosite pentru a facilita înţelegerea
reprezentării construite.
În afara acestor elemente specifice reprezentărilor grafice,
trebuie să subliniem necesitatea prezenţei unor elemente comune
şi a tabelelor statistice: titlul, sursa datelor, numerotarea, note
explicative etc.
Pentru a reprezenta corect proporţiile şi rapoartele care se
înregistrează între datele statistice prin intermediul graficelor,
utilizăm figuri geometrice, hărţi, diagrame figurale etc.
Principalele tipuri de grafice vor fi prezentate, în
continuare, în funcţie de felul seriilor statistice în care au fost
sistematizate datele.

50
Tehnici de sistematizare şi descriere grafică a datelor statistice

3.3 PREZENTAREA DATELOR PENTRU


VARIABILE ATRIBUTIVE

3.3.1 Serii de distribuţie de frecvenţe


Vom începe, acum, cu rezultatul sistematizării pe intervale
de grupare, pentru o variabilă numerică continuă, pentru care se
obţine o serie de distribuţie (repartiţie) de frecvenţe pe
intervale, sub formă de tabel (tabelul nr. 3.5).

Tabelul nr. 3.5


Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a Numărul de unităţi statistice
variabilei (X) (frecvenţe)
0 1
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r

TOTAL n  ni
i 1

Observaţii:
Exemple de intervale de gru-
- dacă intervalele sunt cu variaţie discontinuă, atunci: pare cu variaţie discontinuă:
x(i+1)inf = xisup + , (3.4) ... ...
unde  este o unitate de discretizare; [5 – 9]
[10 – 14]
[0,0 – 0,9]
[1,0 – 1,9]
- dacă intervalele sunt cu variaţie continuă, adică: [15 – 19] [2,0 – 2,9]
x(i+1)inf = xisup, (3.5) ... ...
atunci trebuie stabilit în ce interval se cuprinde valoarea de Exemple de intervale de grupa-
graniţă. Putem preciza: limita inferioară cuprinsă în interval sau re cu variaţie continuă:
limita superioară cuprinsă în interval; • limita inferioară cuprinsă
- mărimea intervalului de grupare se calculează: în interval
... ...
hi = xisup – xiinf , i  i, r , (3.6) [5 – 10) [0,0 – 0,10)
[10 – 15) [1,0 – 2,0)
dacă intervalele sunt cu variaţie continuă, sau: [15 – 20) [2,0 – 3,0)
hi = x(i+1)inf – xi inf, i  i, r (3.7) ... ...

sau: • limita superioară cuprinsă


hi = xisup – x(i–1)sup, i  2, r , (3.8) în interval
... ...
indiferent dacă intervalele sunt cu variaţie continuă sau (4 – 9] (-0,1 – 0,9]
(9 – 14] (0,9 – 1,9]
discontinuă; (14 – 19] (1,9 – 2,9]
- pentru prelucrarea ulterioară a datelor se consideră că ... ...
fiecare din cele n i unităţi dintr-o grupă au valoarea variabilei
51
Emilia Ţiţan

egală cu centrul de interval (xi). Această aproximare se face în


ipoteza unei repartiţii normale a valorilor în interiorul fiecărui
interval de variaţie:
Pentru grupele: Centrul de interval reprezintă valoarea situată la jumătatea
[5 – 10), [10 – 15], [15 – 20], distanţei dintre limitele intervalului şi este considerat reprezentativ
centrele de interval sunt 7,5;
12,5 şi, respectiv, 17,5. pentru datele din interiorul intervalului.
h
x i  x i inf  i (3.9)
2
sau
x i inf  x i sup
xi  , (3.10)
2
dacă intervalele sunt cu variaţie continuă.
Pe lângă frecvenţa absolută (n i), care indică numărul total
de unităţi statistice cu valoarea variabilei situată într-un interval
(xiinf – xisup), se poate calcula şi frecvenţa relativă a grupei,
care indică proporţia din numărul total de unităţi, care se
încadrează în grupă:
n n
n *i  r i  i , (3.11)
i 1
n
i
n
Frecvenţa relativă exprimată
procentual arată ponderea uni- unde n reprezintă volumul total al colectivităţii. Exprimată
tăţilor dintr-o grupă, în totalul în procente, frecvenţa relativă a grupei i este:
colectivităţii. n n
n *i%  r i 100  i 100 . (3.12)
 n
i 1
n
i

Dacă utilizăm frecvenţele relative, obţinem o serie de dis-


tribuţie (repartiţie) de frecvenţe relative (tabelul nr. 3.6).

Tabelul nr. 3.6


Serie de distribuţie de frecvenţe relative
Intervale de variaţie a Frecvenţe relative
variabilei
0 1
X1inf – x1sup n 1*
x2inf – x2sup
n *2
.
. .
. .
xi inf – xi sup n *i
. .
. .
xrinf – xrsup n *r
r

TOTAL 1,00   n *i
i 1

52
Tehnici de sistematizare şi descriere grafică a datelor statistice

O altă cale utilă pentru sistematizarea datelor este prezentarea


acestora în serii de frecvenţe cumulate.
Frecvenţa absolută cumulată crescător a unei grupe (Fci) Frecvenţa absolută cumulată
reprezintă numărul unităţilor statistice care au valoarea variabilei crescător a ultimei grupe este
mai mică decât (sau, eventual, egală cu) limita superioară a egală cu volumul total al co-
lectivităţii.
grupei (deci, au valoarea variabilei mai mare decât x1inf şi mai
mică decât xisup).
i
Fci   n k . (3.13)
k 1

Frecvenţa relativă cumulată crescător a unei grupe ( Fci* ) Frecvenţa relativă cumulată
reprezintă procentul unităţilor statistice care au valoarea variabilei crescător a ultimei grupe este
egală cu 1 (sau 100%, în ex-
mai mică decât (sau, cel mult, egală cu) limita superioară a grupei: primare procentuală).
i
Fci*   nk* . (3.14)
k 1

Similar cu frecvenţele cumulate crescător, se pot calcula şi


frecvenţe cumulate descrescător:
r
Fdi   nk ; (3.15)
k i
r
Fdi*   nk* . (3.16)
k i

Frecvenţele absolute, relative şi cumulate oferă o imagine de


ansamblu asupra tendinţei de distribuţie a valorilor în colectivitate,
asupra normalităţii, simetriei ori asimetriei repartiţiei de frecvenţe.

În urma sistematizării datelor cu privire la capacitatea de Exemplu


cazare existentă într-un număr de 75 de hoteluri de categoria
2 stele, în anul 2001, s-a obţinut următoarea serie de repartiţie
(tabelul nr. 3.7):
Tabelul nr. 3.7
Distribuţia hotelurilor după capacitatea de cazare
Număr Frecvenţe Frecvenţe Frecvenţe
Capacitate de de absolute relative
relative
cazare (locuri) hoteluri cumulate cumulate
n *i (%) *
(nI) (Fci) ( Fci ) (%)
0 1 2 3 4
Mai mică de 170 5 6.7 5 6.7
190-210 9 12.0 14 18.7
210-230 12 16.0 26 34.7
230-250 18 24.0 44 58.7
250-270 22 29.3 66 88
270-290 4 5.3 70 93.3
290-310 2 2.7 72 96.0
310 şi peste 2 2.7 74 98.7
1 1.3 75 100
TOTAL 75 100 — —

53
Emilia Ţiţan

De exemplu, Dacă intervalele sunt neegale, pentru asigurarea compara-


Frecvenţe bilităţii datelor se pot calcula frecvenţe reduse la un interval
Intervale

h l n icor
etalon (standard). Frecvenţa redusă (corectată) a unui interval
( n icor ) se calculează prin raportarea frecvenţei absolute la un factor
de corecţie (l) ce reprezintă numărul intervalelor etalon ce încap
[2– 4) 10 2 1 10
[4 – 8) 40 4 2 20 într-un interval de grupare:
[8 – 16) 20 8 4 5 h
l i (3.17)
het = 2 h et
ni
n icor , (3.18)
l
unde: hi reprezintă mărimea intervalului i, i  1, r
het reprezintă mărimea intervalului etalon (de regulă
mărimea celui mai mic interval de grupare).
În cazul în care variabila de grupare este discretă şi
gruparea se efectuează pe variante, seria de distribuţie de
frecvenţe este discretă sau pe variante.
Şi în acest caz se pot calcula, pe lângă frecvenţele absolute
ce reprezintă numărul de unităţi statistice (ni) care au valoarea
variabilei egală cu varianta xi, frecvenţe relative şi frecvenţe
cumulate.

Exemplu Un exemplu de distribuţie de frecvenţe după o variabilă


discretă este distribuţia unităţilor de primire turistică, cu func-
ţiuni de cazare turistică, pe categorii de confort, în România, în
anul 2000 (tabelul nr. 3.8)

Tabelul nr. 3.8


Distribuţia unităţilor de primire
turistică pe categorii de confort
Frecvenţe
Frecvenţe
Categorii relative
Număr de % din absolute
de confort cumulate
unităţi (nI) total cumulate
(nr, stele) crescător
crescător
(%)
0 1 2 3 4
0 619 19,9 619 19,9
1 1059 33,9 1678 53,8
2 1068 34,2 2746 88,0
3 284 9,1 3030 97,1
4 85 2,7 3115 99,8
5 6 0,2 3121 100
TOTAL 3121 100 - -

Seriile de distribuţie de frecvenţe alcătuite după o variabilă


cantitativă (numerică), adică cele descrise de paragrafele A şi B,
poartă numele de distribuţii heterograde. Ele se pot simboliza:
54
Tehnici de sistematizare şi descriere grafică a datelor statistice

— repartiţia de frecvenţe a unei variabile discrete:


Valorile variabilei se prezintă
 x 1 x2 ... x r 
X :   ; în ordinea mărimii (uzual, în
 n 1 n 2 ... n r  ordine crescătoare).

— repartiţia de frecvenţe a unei variabile continue:


 x 1inf  X  x 1sup x 2inf  X  x 2 sup ... xrinf  X  x r sup 
X :  

 n1 n2 ... nr 
sau
 x1 x 2 ... xr 
X :  ,
 n1 n 2 ... n r 
unde x1, x2, ..., xr reprezintă centrele intervalelor de
grupare.
O distincţie aparte trebuie făcută pentru seriile de
distribuţie de frecvenţe alcătuite după o variabilă calitativă
(nenumerică) ce poartă numele de distribuţii homograde.
Pentru aceste distribuţii de frecvenţe se calculează (pe lângă
frecvenţele absolute) şi frecvenţele relative, care arată proporţia
unităţilor statistice dintr-o categorie în totalul colectivităţii.
Uzual, aceste distribuţii se prezintă în ordinea descrescătoare a
frecvenţelor şi doar uneori, în cazul variabilelor calitative măsu-
rate pe o scală ordinală, are sens să calculăm frecvenţele cumu-
late. În acest caz, al variabilelor ordinale, eventualele numere
ataşate categoriilor (variantelor) sunt tratate ca ranguri (numere
de ordine).

O distribuţie homogradă, după o variabilă nenumerică, Exemplu


măsurată pe o scală nominală, este distribuţia unităţilor de
cazare turistică, pe tipuri de structuri, în anul 2000 (tabelul
nr. 3.4), pentru care putem calcula frecvenţe absolute, relative şi
cumulate (tabelul nr. 3.9).

Tabelul nr. 3.9


Distribuţia unităţilor de primire turistică, având funcţiuni
de cazare turistică, tipuri de structuri, în anul 2000
Frecvenţe
Structuri de primire Număr de Frecvenţe
% în total relative
turistică unităţi cumulate
cumulate
0 1 2 3 4
Hoteluri şi moteluri 943 30,215 943 30,215
Hoteluri pentru tineret 1 0,032 944 30,247
Hosteluri 2 0,064 946 30,311
Hanuri turistice 23 0,737 969 31,048
Cabane turistice 161 5,159 1130 36,206
Campinguri şi unităţi
140 4,486 1270 40,692
tip căsuţă
55
Emilia Ţiţan

Tabelul nr 3.9 (continuare) Frecvenţe


Structuri de primire Număr de Frecvenţe
% în total relative
turistică unităţi cumulate
cumulate
0 1 2 3 4
Vile turistice şi
1066 34,156 2336 74,848
bungalouri
Tabere de elevi şi
172 5,511 2508 80,359
preşcolari
Pensiuni turistice 361 11,567 2869 91,926
Pensiuni agroturistice 240 7,690 3109 99,616
Altele 12 0,384 3121 100,000
TOTAL 3121 100 - -

3.3.2 Histograma şi poligonul frecvenţelor


Pentru o serie de distribuţie de frecvenţe după o variabilă
numerică continuă (pe intervale), reprezentările grafice care ne
permit să vizualizăm distribuţia de frecvenţe sunt histograma şi
poligonul frecvenţelor.
Histograma se construieşte ri- Datele cantitative se pot reprezenta grafic utilizând
dicând dreptunghiuri, cu baze- histograma frecvenţelor absolute sau relative, construită într-un
le corespunzătoare lungimii in-
tervalelor şi înălţimile egale cu
sistem de coordonate rectangulare. Grupele de măsurători —
numărul de observaţii din fie- intervalele — se reprezintă pe axa orizontală (a absciselor).
care interval. Intervalele sunt construite astfel încât sunt continue şi de lăţime
egală (pentru grupe de mărime egală), iar punctele de limită ale
claselor sunt fixate astfel încât nici o valoare să nu cadă pe
graniţa dintre grupe. Pe axa verticală (a ordonatelor) se
marchează frecvenţele de apariţie ale valorilor în grupele
alcătuite după variaţia caracteristicii studiate. Histograma se
construieşte prin ridicarea unor dreptunghiuri, fiecare dreptunghi
fiind de lăţime egală cu mărimea intervalului de grupare şi de
înălţime egală cu numărul măsurătorilor ce se încadrează în
intervalul respectiv. Informaţia oferită de histogramă ne dă o
primă imagine asupra distribuţiei valorilor variabilei studiate în
colectivitate. Deşi valorile individuale nu pot fi văzute în
histogramă, suntem capabili să vedem numărul valorilor dintr-o
anumită grupă, citind înălţimea dreptunghiului pe axa ordonate-
lor. De asemenea, putem mai uşor să vizualizăm numărul inter-
valelor de grupare în histogramă, ceea ce ne dă posibilitatea unui
control mai mare asupra calităţii descrierii grafice. Ca o regulă
generală, pentru o imagine grafică corectă, este indicat ca în
utilizarea sistemului de coordonate rectangulare, lungimea axei
ordonatelor (OY) să fie de aproximativ trei pătrimi din lungimea
axei absciselor (OX).
Să mai notăm că, în cazul în care valoarea minimă
reprezentată pe una din axe este mult prea depărtată de punctul
56
Tehnici de sistematizare şi descriere grafică a datelor statistice

de origine a axelor (0), comparativ cu amplitudinea variaţiei, se


poate face o întrerupere de scară.

Pentru seria de repartiţie de frecvenţe absolute prezentată Exemplu


în tabelul nr. 3.7, histograma este (figura nr. 3.2):

2
4

2
0

1
6

1
2
Numardehoteluri

0
<
170 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
103
10sip
este

Capacitatedecazare

Figura nr. 3.2 Distribuţia hotelurilor


după capacitatea de cazare

O altă posibilitate de reprezentare grafică a distribuţiei de


frecvenţe pentru o caracteristică numerică de tip continuu este
poligonul frecvenţelor. Poligonul frecvenţelor se poate construi Poligonul frecvenţelor.
suprapus peste histogramă sau într-o reprezentare grafică
independentă. Pentru construirea poligonului frecvenţelor se
ridică din centrul fiecărui interval (xi) o linie punctată până în
dreptul frecvenţei unde se marchează un punct. Unind apoi
aceste puncte prin linii drepte, obţinem o linie frântă. Dar un
poligon trebuie închis şi, atunci, închiderea se face, uzual, astfel:
se construieşte pe axa absciselor câte un interval înaintea
primului şi după ultimul, de mărime egală cu acestea şi pe
mijlocul lor se marchează punctul (firesc, deoarece frecvenţa
este nulă pe aceste intervale). Închiderea poligonului se face în
aceste puncte. Mai mult, prin închiderea poligonului în acest
mod, aria totală de sub histogramă este egală cu aria poligonului.

Pe baza datelor din tabelul nr. 3.7, putem construi poli- Exemplu
gonul frecvenţelor absolute, astfel (figurile nr. 3.3 şi 3.4):

57
Emilia Ţiţan

2
4

2
0

1
6

Numarhoteluri
1
2

0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este

C
apa
cita
ted
ecazare

Figura nr. 3.3 Distribuţia hotelurilor


după capacitatea de cazare
2
4

2
0

1
6

1
2
Numarhoteluri

0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este

C
apacitateadecazare

Figura nr. 3.4 Histograma şi poligonul


frecvenţelor absolute pentru distribuţia
hotelurilor după capacitatea de cazare

Trebuie să remarcăm că histograma şi poligonul frecvenţelor


se pot construi şi pe baza frecvenţelor relative. În acest caz,
În cazul grupării pe intervale înălţimea unui dreptunghi din histogramă este egală cu proporţia
de variaţie neegale, suprafeţe- măsurătorilor care se încadrează în grupa respectivă. Pe axa
le dreptunghiurilor sunt propor-
ordonatelor vom avea, aşadar, frecvenţe relative, iar imaginea
ţionale cu frecvenţele grupelor.
grafică este similară cu cea pe baza frecvenţelor absolute; se
schimbă doar scara de reprezentare pe axa OY.

Exemplu Pe baza datelor din tabelul nr. 3.7, utilizând frecvenţele


relative, histograma şi poligonul frecvenţelor relative este
(figura nr. 3.5):

58
Tehnici de sistematizare şi descriere grafică a datelor statistice
3
2

2
8

2
4

2
0

1
6
Frecventerelative

1
2

0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este

C
apac
itatedec
azare

Figura nr. 3.5 Histograma şi poligonul


frecvenţelor relative pentru distribuţia
hotelurilor după capacitatea de cazare
O serie de distribuţie de frecvenţe alcătuită după o variabilă
numerică discretă se reprezintă grafic prin poligonul frecvenţelor.

Distribuţia prezentată în tabelul nr. 3.8 poate fi prezentată Exemplu


grafic prin poligonul frecvenţelor, astfel (figura nr. 3.6)
1200

1000

800
Numar de unitati

600

400

200

0
0 1 2 3 4 5
Capacitatea de confort (numar stele)

Figura nr. 3.6 Distribuţia unităţilor


de cazare turistică, pe categorii de
confort, în România, în anul 2000

Analizând histograma şi poligonul frecvenţelor, se pot obţine


două informaţii importante. Întâi, să observăm aria totală de sub
histogramă şi să observăm proporţia din aria totală care cade pe un
interval particular de pe axa absciselor. Vom vedea că această
proporţie este egală cu frecvenţa relativă a valorilor care se înca-
59
Emilia Ţiţan

drează în interval. Proporţionalitatea dintre arii şi frecvenţe relative


ne permite să stabilim o corespondenţă între histogramele de frec-
venţe relative şi distribuţiile de probabilitate.
În al doilea rând, ne putem imagina cum arată o histogramă
şi un poligon de frecvenţe pentru un set foarte mare de date (să
spunem, o populaţie generală foarte numeroasă). Dacă numărul
de cazuri într-un set de date creşte, putem obţine o mai bună
descriere a datelor micşorând mărimea intervalelor. Când
intervalele devin suficient de mici, iar numărul de cazuri rămâne
finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă
netedă (figura nr. 3.7):

14

12

10
Frecvente

0
Când observaţiile sunt nume- 10 20 30 40 50 60 70 80 90
roase, iar mărimea intervale-
Intervale
lor este suficient de mică, poli-
gonul frecvenţelor tinde către o
curbă continuă, numită curbă a) set mic de date
de repartiţie, sau curbă a frec-
venţelor.
35

30

25
Frecvente

20

15

10

0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46

Intervale

b) set foarte mare de date


Figura nr. 3.7 Efectul volumului colectivităţii
asupra aspectului poligonului frecvenţelor

Iată, deci, că histograma şi poligonul frecvenţelor oferă o


primă imagine asupra normalităţii sau tendinţei de normalitate, ori,
din contră, asupra asimetriei profunde a unei serii de distribuţie de
frecvenţe. O distribuţie normală, perfect simetrică (în forma
60
Tehnici de sistematizare şi descriere grafică a datelor statistice

clopotului lui Gauss-Laplace) (vezi figura nr. 3.8 a) este foarte rar
întâlnită în practică; cu toate acestea ea este o distribuţie teoretică la
care se face adeseori apel în analiza statistică. În cele mai multe
cazuri, distribuţiile de frecvenţe empirice au tendinţă de normalitate,
dar un anumit grad de asimetrie (figura nr. 3.8 b şi figura nr. 3.8 c).
Există şi distribuţii profund asimetrice, în care frecvenţa maximă se
întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele
să descrească spre zero. Aceste distribuţii se numesc în formă de J
(figura nr. 3.8 d şi figura 3.8 e). De asemenea, se pot întâlni
distribuţii în formă de U, cu frecvenţe maxime în ambele intervale
extreme de variaţie şi cu frecvenţă minimă în jurul intervalului
central — din mijlocul distribuţiei (figura nr. 3.8 f). Este firesc, aşa-
dar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a
tendinţei de distribuţie a valorilor în colectivitatea cercetată.

c) distribuţie cu O histogramă este simetrică


b) distribuţie cu dacă, atunci când trasăm o li-
a) distribuţie tendinţă de
tendinţă de nie verticală prin centrul histo-
normală, perfect normalitate,
normalitate, gramei, cele două părţi delimi-
simetrică asimetrică şi
asimetrică tate au forme identice.
bimodală

d) distribuţie în e) distribuţie în f) distribuţie


formă de J formă de J simetrică în
formă de U
Figura nr. 3.8 Forme ale
distribuţiilor de frecvenţe

Să mai notăm că în cazul în care intervalele sunt de mărime


neegală, lăţimile dreptunghiurilor histogramei vor fi şi ele O distribuţie bi- sau multimo-
dală are două sau mai multe
inegale şi, ca urmare, pentru a respecta proporţionalitatea dintre vârfuri.
arii şi frecvenţe (relative sau absolute) va trebui să lucrăm cu
frecvenţele corectate (reduse pe interval).
Distribuţiile profund asimetrice şi transformarea datelor
O distribuţie profund asimetrică nu este normală sau cu
tendinţă de normalitate, deoarece valorile sunt mai intens grupate
61
Emilia Ţiţan

înspre un capăt al distribuţiei. În afaceri, deseori întâlnim distribuţii


profund asimetrice în seturi de date care reprezintă niveluri ale unor
variabile, precum vânzări, active etc. şi care iau valori pozitive.
Acest lucru se întâmplă deoarece datele nu pot lua valori mai mici
decât zero (plaja de valori este limitată la unul dintre capete), în
schimb nu sunt limitate la o valoare superioară. Rezultatul este acela
că, în apropiere de zero, există o mulţime de valori concentrate care
35 devin, sistematic, din ce în ce mai puţine pe măsură ce ne deplasăm
30
spre dreapta histogramei.
Un exemplu de distribuţie profund asimetrică este distribuţia
25
Numar state

20

15
statelor Europei după numărul populaţiei, în anul 2000 (Anuarul
Statistic al României, pagina 824). Asimetria reflectă faptul că cele
10

0
0-10 10-20 20-30 30-40 40-50 50-60 60-70 70 si peste
mai multe state au un număr mic (sau relativ redus) al populaţiei şi
doar câteva state au populaţia numeroasă.
Populatie (mil. locuitori)

Distribuţia statelor Europei du- Una dintre problemele pe care le ridică o distribuţie profund
pă numărul locuitorilor. asimetrică este aceea că cele mai multe dintre metodele statistice pe
care le vom studia necesită cel puţin o distribuţie cu tendinţă de
normalitate. Când aceste metode sunt utilizate pentru distribuţii
profund asimetrice, rezultatele pot fi deformate sau chiar complet
greşite. Chiar şi atunci când rezultatele sunt (metodologic) corecte,
deseori nu sunt eficiente, în principal datorită faptului că nu se
utilizează deplin informaţiile conţinute de setul de date respectiv.
Transformarea datelor prin lo- O soluţie pentru această problemă a asimetriei este utilizarea
garitmare. transformării datelor, pentru a înlocui distribuţiile asimetrice cu
unele cu tendinţă de normalitate. Transformarea înseamnă înlocu-
irea fiecărei valori cu un număr diferit (de pildă logaritmul) pentru a
facilita analiza statistică. Cea mai utilizată transformare, în afaceri şi
economie, este logaritmarea datelor, care poate fi folosită doar
pentru valori pozitive (dacă datele includ valori negative sau zero,
această tehnică nu poate fi folosită). Prin logaritmare, scala se
lărgeşte lângă valoarea zero, permiţând răspândirea valorilor mici,
care erau aglomerate în primele intervale. De asemenea, valorile
mari, prin logaritmare, se condensează şi se apropie. În interpretarea
ulterioară a datelor va trebui însă să ţinem seama de aceste
transformări.

3.3.3 Graficul frecvenţelor cumulate


O altă modalitate de descriere a datelor cantitative continue,
construită de această dată pe baza frecvenţelor cumulative, este
poligonul frecvenţelor cumulate. Poligonul frecvenţelor ilustrează
grafic frecvenţele marcate în relaţie cu centrele de interval.
Prezentarea grafică a distribuţiei frecvenţelor (absolute sau relative)
cumulate este, de asemenea, folositoare.
Să subliniem mai întâi că frecvenţele cumulate sunt
interpretate în relaţie cu limitele exacte ale intervalelor de grupare.
Pentru a construi poligonul frecvenţelor cumulate, vom marca
62
Tehnici de sistematizare şi descriere grafică a datelor statistice

frecvenţele cumulate crescător (Fci) în limitele superioare exacte


asociate intervalelor. Când construim poligonul începem graficul
marcând valoarea zero în exact limita inferioară a primului interval.
Apoi vom marca fiecare frecvenţă cumulată crescător la limita Când numărul observaţiilor este
superioară a intervalului. Acest procedeu este diferit de modalitatea foarte mare, poligonul frecven-
de construire a poligonului frecvenţelor, în care marcăm frecvenţele ţelor cumulate tinde către o
curbă, numită curba frecven-
la mijloacele intervalelor. O dată ce toate punctele au fost marcate ţelor cumulate, curba integrală
pe grafic, ele sunt unite succesiv, utilizând segmente de linie dreaptă a frecvenţelor sau ogivă.
(reflectă presupunerea făcută, că valorile sunt uniform distribuite în
interiorul intervalelor). Şi în cazul poligonului frecvenţelor cumu-
late, când intervalele devin suficient de mici, aspectul graficului este
acela al unei curbe (de aceea, punctele se unesc, deseori, printr-o
curbă).

Pe baza datelor obţinute în tabelul nr. 3.7 se poate construi Exemplu


graficul frecvenţelor cumulate crescător (figura nr. 3.9)

8
0

6
0
Frecventecumulate

4
0

2
0

0
130 1
50 1
70 1
90 2
10 2
30 2
50 2
70 2
90 3
10 3
30

C
ap
ac
ita
ted
eca
zare

Figura nr. 3.9 Graficul frecvenţelor


cumulate crescător, pentru distribuţia
hotelurilor după capacitatea de cazare
Pentru un număr mare de intervale, graficul apare ca o
curbă în formă de S (ogivă). Aria de sub porţiunea de curbă care
este abruptă identifică intervale cu multe cazuri. Ariile în care
curba tinde să fie relativ plată identifică intervale cu câteva
observaţii. În cazul frecvenţelor absolute cumulate crescător,
ultimul punct de pe curbă este întotdeauna egal cu numărul
unităţilor de la care s-au cules observaţiile (adică egal cu 50, în
exemplul nostru numeric).
Suprapus peste curba frecvenţelor cumulate crescător, ori Proiecţia pe axa ordonatelor a
într-un grafic separat, se poate reprezenta curba frecvenţelor punctului de intersecţie pentru
cele două curbe ale frecvenţe-
cumulate descrescător. De asemenea, ogiva se poate reprezenta lor cumulate (crescător şi des-
şi pe baza frecvenţelor relative cumulate. Fiecare punct crescător) delimitează o jumă-
reflectă, în acest caz, proporţia cumulată a măsurătorilor mai tate din numărul total al obser-
mici sau egale cu limita superioară a intervalului (pentru frec- vaţiilor.
63
Emilia Ţiţan

venţele relative cumulate crescător). Ultimul punct din grafic este


întotdeauna egal cu 1,0 (sau 100%), suma frecvenţelor relative.
Curba frecvenţelor cumulate crescător nu este niciodată
descrescătoare, iar curba frecvenţelor cumulate descrescător nu
este niciodată crescătoare.
Pentru o variabilă discretă, gra- Reprezentarea grafică a frecvenţelor cumulate crescător pentru
ficul frecvenţelor cumulate are o variabilă discretă, prin intermediul graficului frecvenţelor
aspectul unei scări.
cumulate, va avea, de această dată, aspectul unei scări, pentru că
nici o unitate statistică nu poate avea valoarea caracteristicii situată
între variantele stabilite. Porţiunile din această scară cu „trepte” mai
înalte identifică variante cu frecvenţe mari, în timp ce „treptele” mai
scurte identifică variante cu puţine cazuri.

Exemplu Pe baza distribuţiei din tabelul nr. 3.8 se poate construi


graficul frecvenţelor cumulate (figura nr. 3.10)

3000

2400
Frecvente cumulate

1800

1200

600

0
0 1 2 3 4 5
Categorii de confort (numar stele)

Figura nr. 3.10 Graficul frecvenţelor


cumulate crescător pentru distribuţia
unităţilor de cazare pe categorii de confort

3.3.4 Diagrama prin coloane şi prin benzi


O modalitate uzuală de a reprezenta grafic o serie de
distribuţie de frecvenţe absolute sau relative, pentru o variabilă
Sugestii: calitativă (categorială) este diagrama prin coloane.
• Toate dreptunghiurile tre- Pentru a construi acest tip de grafic în sistemul de coordonate
buie să aibă aceeaşi lăţime;
• Axele diagramei trebuie rectangulare, frecvenţele absolute (sau frecvenţele relative) sunt
să fie clar explicate; reprezentate prin coloane — dreptunghiuri — de lăţime egală, câte o
• Orice „cheie“ de interpre- coloană pentru fiecare categorie (clasă). Înălţimea coloanelor pentru
tare trebuie inclusă în diagramă
sau imediat sub diagramă.
o clasă este proporţională cu frecvenţa clasei (sau frecvenţa
relativă). Uzual, coloanele sunt situate într-o poziţie verticală, cu
baza coloanei pe axa orizontală a graficului. Coloanele sunt
distanţate între ele şi se recomandă ca distanţa dintre coloane să nu
fie egală cu lăţimea coloanei, ci mai mică (de pildă, distanţa dintre
64
Tehnici de sistematizare şi descriere grafică a datelor statistice

coloane poate fi egală cu jumătate din lăţimea lor). Dacă dreptun-


ghiurile sunt răsturnate cu 90% (şi au baza situată pe axa verticală)
atunci reprezentarea grafică este o diagramă prin benzi.

Pe baza datelor din tabelul nr. 3.9, ce prezintă clasificarea Exemplu


unităţilor de cazare turistică, pe structuri de primire turistică, în
România în anul 2000, putem construi diagrama prin coloane
(figura nr. 3.11) şi diagrama prin benzi (figura nr. 3.12):
1200

1
066

1000 9
43
În general, dreptunghiurile se
800
construiesc vertical (coloane)
pentru o variabilă numerică.
600
Numardeunitati

400 3
61

2
40

200 1
61 1
72
1
40

2
3 1
2
1 2
0
Hot
el
uri
neret
i
t Hanuri
uri
t st
ce
i Cam
pi
nguri Tabereel
evi Pensi
uni
agrot
uri
st
H
ot
el
uri
si
mot
el
uri H
ost
el
uri Cabanet
uri
st
ce
i Vesi
l
i bungal
ouri Pensiuni
uri
t st
ce
i Ael
t
le

S
tru
ctu
ri d
eprim
iretu
ristic
a

Figura nr. 3.11 Distribuţia unităţilor de


cazare turistică, pe structuri de primire
turistică, în România, în anul 2000

A
el
t
le 12

P
ensi
uni
agrot
uri
st 240

P
ensi
uni
uri
t st
ce
i 361

T
abereel
evi 172

V
esi
l
i bungal
ouri 1066

C
ampi
nguri 140
În general, dreptunghiurile se
construiesc orizontal (benzi)
pentru o variabilă categorială.
C
abaneu
tri
st
ce
i 161
Structurideprimireturistica

H
anuri
uri
t st
ce
i 23

H
osturi 2
el

H
ot
el
uri
neret
i
t 1

H
ot
el
uri
si
mot
el
uri 943

0 200 400 600 800 1000 1200

Nu
m ar d
eun
itati

Figura nr. 3.12 Distribuţia unităţilor de cazare


turistică, pe structuri de primire turistică, în
România,în anul 2000 (diagramă prin benzi)

Evident, variabila fiind calitativă nu vom avea o scară pe


axa pe care se reprezintă variantele.

65
Emilia Ţiţan

Uzual, variantele sunt prezentate pe grafic în ordinea des-


crescătoare a frecvenţelor. Nu putem însă, aici, să construim un
poligon al frecvenţelor şi nici să vorbim despre normalitatea ori
asimetria distribuţiei. Pentru creşterea expresivităţii graficului,
deasupra dreptunghiurilor (pentru diagrama prin coloane) sau în
dreapta lor (pentru diagrama prin benzi), se pot trece valo-rile
înregistrate.

3.3.5 Diagrama de structură

O altă modalitate de a prezenta grafic datele pe care le


avem la dispoziţie cu privire la o serie de distribuţie de frecvenţe
Diagrama de structură are două este diagrama de structură, prin care se reprezintă structura
avantaje evidente: unei colectivităţi. Uzual, un cerc complet reprezintă volumul
• are o estetică plăcută;
• arată clar că totalul cate-
total al colectivităţii (sau 100%, suma frecvenţelor relative).
goriilor (feliilor) este de 100%. Suprafaţa delimitată de cerc este partiţionată într-un număr de
felii, câte o „felie” pentru fiecare categorie (grupă, interval,
clasă). Mărimea „feliei” este proporţională cu frecvenţa relativă
a categoriei. Spre exemplu, dacă frecvenţa relativă a grupei este
10%, cum unghiul la centru al întregului cerc este 360%, felia
corespunzătoare grupei va fi 0,1 x 360˚ = 36˚.
Diagramele de structură se pot reprezenta şi pe alte
suprafeţe ori corpuri geometrice simple (dreptunghi, pătrat etc.),
construirea acestora fiind facilitată de utilizarea pachetelor de
programe informatice specializate. Să mai notăm că într-o
diagramă de structură, avem, de cele mai multe ori, nevoie de
legendă pentru a explica modul în care am colorat sau haşurat
„feliile” din grafic.

Exemplu Pe baza datelor din tabelele nr. 3.8 şi 3.9., diagramele de


structură se prezintă astfel (figurile nr. 3.13 şi 3.14):
5 stele
0.19%
3 stele 4 stele Neclasificate
9.10% 2.72% 19.83%

2 stele
34.22%

1 stea
33.93%

Figura nr. 3.13 Structura unităţilor


de cazare turistică, pe categorii de
confort, în România, în anul 2000
66
Tehnici de sistematizare şi descriere grafică a datelor statistice

Pensiuni
Pensiuni agroturistice Altele
turistice 7.69% 0.48% Hoteluri si În general, dacă ne interesează
11.57% moteluri valorile absolute folosim diagra-
T abere elevi
30.21% me prin benzi sau coloane, iar
5.51% dacă ne interesează ponderile
Hanuri folosim diagrame de structură.
turistice Un grafic combinat poate afişa
0.74% – pe diagrama de structură –
Vile si valorile absolute, în locul pro-
bungalouri Campinguri Cabane centelor.
34.16% 4.49% turistice
5.16%

Figura nr. 3.14 Structura unităţilor de


cazare turistică, pe structuri de primire
turistică, în România, în anul 2000

3.3.6 Serii statistice bidimensionale


Dacă până acum am studiat seriile de distribuţie de
frecvenţe unidimensionale, care se pot obţine prin sistematizarea
datelor în funcţie de o singură caracteristică (variabilă), să
analizăm în continuare seriile statistice de distribuţie de
frecvenţe bidimensionale, adică cele formate prin considerarea
concomitentă a două variabile (X şi Y). Variabilele X şi Y pot fi
numerice sau nenumerice. Forma unei astfel de serii de
distribuţie bidimensională este (tabelul nr. 3.10)

Tabelul nr. 3.10


Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru
Y y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
0 1 2
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
TOTAL n.1 n.2 .... n.j ... n.m n..

67
Emilia Ţiţan

În acest tabel trebuie să remarcăm că:


• xi, i  1, r reprezintă valorile, variantele sau centrele de
interval stabilite prin sistematizarea datelor după variabila X.
• yj, j  1, m reprezintă valorile, variantele sau centrele
intervalelor de grupare stabilite prin sistematizarea datelor după
Coloana 0 şi coloana 2 din ta- variabila Y;
belul nr. 3.10 prezintă repartiţia
de frecvenţe pentru variabila X.
• nij reprezintă numărul unităţilor statistice care se
încadrează concomitent în grupa xi, după variabila X şi yj, după
variabila Y;
• ni. reprezintă numărul unităţilor statistice care se
încadrează în grupa xi, după variabila X, indiferent de nivelul
înregistrat pentru variabila Y. Aşadar:
m
n i   n ij
j1

• n.j reprezintă numărul unităţilor statistice care se


încadrează în grupa yj, după variabila Y, indiferent de nivelul
înregistrat pentru variabila X:
r
n  j   n ij
i 1

• n.. reprezintă volumul total al colectivităţii (n):


r m r m
n..   n i.   n. j   n ij
i 1 j1 i 1 j1

Observăm că, prin sistematizarea datelor în funcţie de două


variabile statistice, distingem:
x i , y j 
• o distribuţie bidimensională  , i  1, r, j  1, m ;
 n ij 
x i 
• două distribuţii marginale, una după X :  , i  1, r şi
n i 
 y j 
una după Y :   , j  1, m ;
n. j 
• r + m distribuţii condiţionate şi anume:
Avem tot atâtea distribuţii condi- — pentru fiecare X = xi, o distribuţie după Y:
ţionate, câte grupe s-au alcătuit  y j 
pentru cele două variabile studi-  , j  1, m;
ate. n ij 
— pentru fiecare Y = yj, o distribuţie după X :
x i 
 , i  1, r
n ij 
Exemplu Distribuţia întreprinderilor active din economia naţională,
după tipul activităţii şi numărul salariaţilor, în anul 2000, în
România, a fost (tabelul nr. 3.11).
68
Tehnici de sistematizare şi descriere grafică a datelor statistice

Tabelul nr. 3.11


Distribuţia întreprinderilor active, după
tipul activităţii şi numărul salariaţilor
Număr salariaţi
Tipuri de
50- 250 şi TOTAL
întreprindere 0-9 10-49
249 peste
0 1 2 3 4 5
Întreprinderi Se poate construi şi o distribuţie
8458 1831 693 109 11091 bidimensională de frecvenţe re-
agricole
lative.
Întreprinderi
din industrie,
construcţii, 285271 24769 6553 2143 318736
comerţ şi alte
servicii
Întreprinderi
financiare şi 601 164 78 55 898
de asigurări
TOTAL 294330 26764 7324 2307 330725
Sursa: Anuarul Statistic al României, 2001, pg. 343.

O situaţie aparte o întâlnim în cazul variabilelor alternative, Tabelul de asociere se constru-


când datele se pot prezenta într-un tabel de asociere de forma ieşte pentru variabile alternati-
(tabelul nr. 3.12): ve.

Tabelul nr. 3.12


Tabel de asociere
Clasele lui Clasele lui Y
TOTAL
X Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
TOTAL n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22

Distribuţia salariaţilor din ramura comerţ-turism, pe Exemplu


activităţi şi pe sexe, în România, în anul 2000 a fost (tabelul
nr. 3.13):

Tabelul nr. 3.13


Distribuţia salariaţilor din
comerţ-turism, pe activităţi şi pe sexe
Sex
Activităţi TOTAL
Masculin Feminin
0 1 2 3
Comerţ 255 327 582
Hoteluri şi
28 54 82
restaurante
TOTAL 283 381 664
Sursa: Anuarul Statistic al României, 2001, pg. 106.

69
Emilia Ţiţan

3.3.7 Diagrama de împrăştiere (corelograma)


Tehnica grafică folosită pentru În cazul datelor bivariate, sistematizate într-o serie de
descrierea relaţiei dintre două distribuţie de frecvenţe bidimensională, reprezentarea grafică
variabile cantitative este diagra-
ma de împrăştiere.
uzuală în sistemul de coordonate rectangulare este diagrama de
împrăştiere (figura nr. 3.15).
Diagrama de împrăştiere se mai numeşte şi corelogramă
sau graficul norului de puncte. Pentru că datele sunt în acest
caz bivariate, fiecare unitate statistică este reprezentată printr-un
punct de coordonate xi şi yi.

3
800

3
400

3
000

2
600
Incasari(mil.lei)

2
200

1
800

1
400

1
000
10 1
2 1
4 1
6 1
8 2
0 2
2 2
4 2
6

C
he
ltu
ie
li d
epro
mov
are(m
il. le
i)

Figura nr. 3.15 Diagramă de împrăştiere

Datele bivariate pot avea diferite structuri: unele sunt uşor


de analizat şi interpretat, altele sunt mai dificil de studiat. Prin
Dacă ne concentrăm atenţia reprezentarea grafică utilizând diagrama de împrăştiere, se pot
doar asupra legăturii dintre cele obţine informaţii adiţionale dincolo de câţiva indicatori statistici
două variabile şi nu asupra rela-
ţiei de la cauză la efect, atunci
convenţionali. Graficul poate arăta existenţa unei legături liniare,
alegerea poziţiei variabilelor pe a unor legături neliniare sau lipsa legăturii dintre variabile. Mai
axe este arbitrară. mult, pe baza graficului, vor fi identificate probleme (precum
variabilitatea inegală a variabilelor, prezenţa valorilor extreme)
care pot afecta rezultatul şi interpretarea indicatorilor de
corelaţie şi regresie.
Diagrama de împrăştiere indică, în sistemul de coordonate
rectangulare, fiecare unitate statistică (fiecare caz individual)
printr-un punct. Variabila studiată drept factor cauzal, de influ-
enţă (X) este reprezentată pe axa orizontală (a absciselor). Varia-
bila de răspuns, care poate fi influenţată (Y) defineşte axa verti-
cală (a ordonatelor). Forma de distribuire a punctelor pe grafic
(adică norul de puncte) ne dă informaţii privind:
- existenţa legăturii dintre variabile: cu cât punctele de
pe grafic sunt mai grupate în jurul unei diagonale (figura nr.
3.16,a), cu atât legătura dintre variabile este mai puternică.
70
Tehnici de sistematizare şi descriere grafică a datelor statistice

a) b) c)
Figura nr. 3.16
a) existenţa şi b) c) inexistenţa
legăturii statistice între variabile
Dacă punctele de pe grafic sunt distribuite în mod uniform
pe întregul plan delimitat de axe (figura nr. 3.16, b), ori dacă ele
se grupează în jurul unei linii paralele cu una dintre axe (figura
nr. 3.16, c), acest lucru indică inexistenţa legăturii statistice. De Deşi punctele nu se situează
exact pe o linie sau pe o cur-
remarcat că prin schimbarea scalelor de reprezentare pe una din bă, ne putem imagina o astfel
axe, un nor de puncte împrăştiat în tot graficul (figura nr. 3.16, b) de reprezentare, care să apro-
poate părea ca fiind mai grupat în jurul unei linii (figura nr. 3.16, c). ximeze relaţia dintre cele două
Dar, atâta vreme cât nu există nici o pantă, graficul indică lipsa variabile.
legăturii statistice.
Aspectul de „nor de puncte” este determinat de faptul că
legăturile sunt de tip statistic şi nu de tip funcţional.
- sensul legăturii dintre variabile: dacă punctele de pe
grafic sunt grupate în jurul diagonalei principale (figura nr. 3.17, a)
legătura se apreciază a fi directă, iar dacă punctele se grupează
în jurul diagonalei secundare (figura nr. 3.17, b) astfel încât pe
măsură ce cresc valorile lui X, valorile lui Y descresc (şi vice-
versa), atunci legătura este inversă.

a) b)
Figura nr. 3.17
a) legătură directă şi b) legătură inversă

- forma legăturii dintre variabile: legătura dintre variabile nu


este de tip liniar dacă diagrama arată puncte adunate în jurul unei
curbe (figura nr. 3.18) mai degrabă decât al unei linii drepte. Dese-
ori se va putea utiliza o transformare, pentru liniarizarea variabile-
71
Emilia Ţiţan

lor, ceea ce simplifică analiza, pentru ca apoi rezultatele să fie


transformate înapoi la datele originale.

Figura nr. 3.18


Legătura statistică neliniară

În capitolele următoare vom vedea cum alte particularităţi


ale legăturilor dintre variabile pot fi puse în evidenţă prin analiza
diagramei de împrăştiere.

3.4 PREZENTAREA DATELOR PENTRU


VARIABILE DE TIMP
După cum am văzut variabilele statistice pot fi clasificate,
după conţinutul lor, în variabile de timp, de spaţiu sau atributive.

3.4.1 Serii cronologice


Seriile cronologice reprezintă seriile statistice ce se obţin
prin sistematizarea datelor după o variabilă de timp. O serie
O serie cronologică se mai nu- cronologică este alcătuită din două şiruri de date: unul cu privire
meşte serie statistică dinamică la unităţile de timp, care pot fi momente sau intervale de timp,
sau serie statistică de timp. iar cel de-al doilea cu privire la frecvenţa de apariţie sau nivelul
unui fenomen, înregistrat în aceste unităţi de timp.
O serie cronologică se notează:
1 2 ... t ... n  t 
  sau  , t  1, n.
 1 2
y y ... y t
... y n y t 
Dacă unităţile de timp sunt momente, atunci seria
cronologică se numeşte de stoc (de momente).

Exemplu Populaţia României, la 1 iulie, în perioada 1990-2000 a


fost (tabelul nr. 3.14):

Tabelul nr. 3.14


Populaţia României la 1 iulie
Data Numărul locuitorilor
0 1
1 iulie 1990 23206720
72
Tehnici de sistematizare şi descriere grafică a datelor statistice

Data Numărul locuitorilor Tabelul nr. 3.14 (continuare)


0 1
1 iulie 1991 23 185 084
1 iulie 1992 22 788 969
1 iulie 1993 22 755 260
1 iulie 1994 22 730 622
1 iulie 1995 22 680 951
1 iulie 1996 22 607 620
1 iulie 1997 22 545 925
1 iulie 1998 22 502 803
1 iulie 1999 22 458 022
1 iulie 2000 22 435 205
Sursa: Anuarul Statistic al României, 2001, pg. 50

Dacă unităţile de timp sunt intervale (perioade), seria cro-


nologică se numeşte de flux (de intervale).

O serie cronologică de flux pentru care intervalul este anul Exemplu


calendaristic, este cea referitoare la numărul emigranţilor în
perioada 1995-2000, variabilă de interes pentru multe dintre
activităţile sectorului terţiar (tabelul nr. 3.15):

Tabelul nr. 3.15


Evoluţia emigranţilor, în perioada 1995-2000
Anul Emigranţi
0 1
1995 25675
1996 21526
1997 19945
1998 17536
1999 12596
2000 14753
Sursa: Anuarul Statistic al României, 2001, pg. 86

Unitatea de timp este în mod frecvent, anul, dar poate fi şi


semestrul, trimestrul, luna etc.

Evoluţia vânzărilor cotidianului naţional Libertatea pentru Exemplu


perioada ianuarie 2001 – februarie 2002 (tabelul nr. 3.16).

Tabelul nr. 3.16


Evoluţia vânzărilor cotidianului naţional „Libertatea“
Perioada Vânzările (mii exemplare)
0 1
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
73
Emilia Ţiţan

Tabelul nr. 3.16 (continuare) Perioada Vânzările (mii exemplare)


0 1
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2002 143,0
Sursa: Colecţia ziarului „Libertatea“, 2002

3.4.2 Cronograma
Diagramă prin linii sau prin co- O serie cronologică se reprezintă grafic prin intermediul
loane? Alegerea depinde de cronogramei sau historiogramei. În sistemul de coordonate
doi factori: obiectivul graficului
şi numărul de termeni ai seriei.
rectangulare, pe axa absciselor se marchează unităţile de timp (t) —
momente sau intervale —, iar pe axa ordonatelor valorile variabilei
(yt). Dacă este vorba de o serie de momente (de stoc), se va ridica o
linie din dreptul momentului până la nivelul variabilei, unde vom
Dacă obiectivul se focalizează marca un punct, iar dacă este o serie de flux, linia se va ridica din
pe determinarea trendului, se centrul intervalului de timp până în dreptul nivelului variabilei.
recomandă folosirea diagramei Unind punctele marcate obţinem cronograma, care prezintă evoluţia
prin linii.
fenomenului (variabilei) analizat, în timp. Pentru serii cronologice
de intervale se pot ridica şi coloane (dreptunghiuri), având lăţimea
egală cu mărimea intervalului de timp şi înălţimea proporţională cu
nivelul variabilei.

Exemplu Pe baza datelor din tabelul nr. 3.16, reprezentarea grafică


prin intermediul cronogramei (prin segmente de linie sau coloa-
ne) este (figura nr. 3.19).
1
55

1
45

Dacă seria cronologică are un 1


35

număr mare de termeni, se re-


comandă, de asemenea, folo- 1
25

sirea diagramei prin linii.


Vinzari(miexemplare)

1
15

1
05

9
5
ia
nua
rie200
1 m artie
200
1 m
ai2
001 iulie
2001 septem
brie20
01n oie
mbrie20
01 ianu
arie
2002
fe
bruarie
20 01 ap
rilie
200
1 iu n
ie2
00 1 a
ugu
st2
00 1 o c
tombrie
2 0
01d e
cembrie
200
1 febru
arie
200
2

P
erio
ada

a)
74
Tehnici de sistematizare şi descriere grafică a datelor statistice

150

Dacă obiectivul graficului este


de a reliefa nivelurile fenome-
130
nului, se recomandă folosirea
diagramei prin coloane.
Vinzari(miexemplare)

110

90
februari
e2001aprie2001
i
l uni
i e2001 august
2001 oct om
bri
e2001 decembri
e2001februari
e2002
inuari
a e2001 m art
e2001
i m
ai2001 ul
ie2001
i sept
embri
e2001noi
embri
e2001 ianuari
e2002

P
erio
ada

b)
Figura nr. 3.19 Cronogramă
trasată prin a) linii; b) coloane

3.4.3 Diagrama polară


În cazul în care seria cronologică prezintă variaţii sezoniere,
pentru reprezentarea grafică a evoluţiei unui fenomen putem
folosi diagrama polară (radială), construită în sistemul de
coordonate polare.

Temperatura medie lunară a aerului la Bucureşti - Filaret Exemplu


în anul 1996 se reprezintă grafic în figura nr. 3.20.

Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.

Sept. Mai

Aug. Iun.
Iul.

Temperatura medie lunara a aerului la Bucuresti-Filaret în


anul 1996

Figura nr. 3.20 Diagramă polară

75
Emilia Ţiţan

3.5 PREZENTAREA DATELOR PENTRU


VARIABILE DE SPAŢIU

3.5.1 Serii teritoriale


Seria statistică spaţială se Dacă variabila pentru care se sistematizează datele este o
construieşte, uzual, pentru pre- variabilă de spaţiu (teritorială), adică elementul ce diferenţiază
zentarea variaţiei unei carac- manifestările fenomenului analizat este locul unde acestea s-au
teristici pe judeţe, regiuni de
dezvoltare, ţări, continente.
produs, atunci rezultatul este o serie teritorială (de spaţiu).
Timpul (momentul sau perioada) este, în acest caz, o constată ce
trebuie precizată. O serie de spaţiu se simbolizează:
A B ... i .... U
  .
y A y B ... y i ... yU 
Cum variabila de spaţiu este, în mod cert, o variabilă
nominală, o regulă privind ordonarea variantelor este greu de oferit.
Uzual, datele în serie se înscriu după ordinea alfabetică a unităţilor
de spaţiu sau în mod descrescător, după nivelul fenomenului
analizat ori frecvenţe.

Exemplu Populaţia ocupată în ramura hoteluri şi restaurante, pe


regiuni, la sfârşitul anului 2000, a fost (tabelul nr. 3.17):

Tabelul nr. 3.17


Populaţia ocupată în hoteluri şi restaurante
Regiunea Populaţia ocupată (mii pers.)
0 1
Nord-Est 9,7
Sud-Est 12,1
Sud 9,8
Sud-Vest 9,2
Vest 11,2
Nord-Vest 12,1
Centru 14,0
Bucureşti 14,7
TOTAL 92,8
Sursa: Anuarul Statistic al României, 2001

3.5.2 Reprezentarea grafică a seriilor teritoriale


O serie teritorială se poate reprezenta grafic prin diagrame
prin coloane, benzi, diagramă de structură, cartogramă, carto-
diagramă ori diagramă prin suprafeţe.
Exemplu Reprezentarea grafică a datelor din tabelul nr. 3.17 privind
populaţia ocupată în ramura hoteluri şi restaurante, pe regiuni,
poate fi făcută, în funcţie de scopul analizei astfel (figura nr. 3.21):
76
Tehnici de sistematizare şi descriere grafică a datelor statistice

15.
5

1
4.7

14.
5
1
4

13.
5

12.
5
1
2.1 1
2.1
Populatieocupata(mipers.)

11.
5 1
1.2

10.
5

9
.7 9
.8

9.
5 9
.2

8.
5
N
ord-E
st S
ud-E
st S
ud S
ud-V
est V
est N
ord-V
est C
ent
ru B
ucurest
i

Re
giu
nea

a)

B
ucurest
i 1
4.7

C
ent
ru 1
4

N
ord-V
est 1
2.1

V
est 1
1.2
Regiunea

Sud-V
est 9
.2

Sud 9
.8

S
ud-E
st 1
2.1

N
ord-E
st 9
.7

8.
5 9.
5 10.
5 11.
5 12.
5 13.
5 14.
5 15.
5

P
opu
latieo
cup
ata(mii p
ers.)

b)

No
rd-Es
t, 1
0.5%
Bu
cure
sti, 1
5.8%

Su
d-Es
t, 1
3.0%

Ce
ntru
,15
.1%

Su
d,1
0.6%

No
rd-Ve
st, 1
3.0%
Su
d-Ve
st, 9
.9%

Ve
st, 1
2.1%

c)
Figura nr. 3.21 Populaţia ocupată în
ramura hoteluri şi restaurante, pe regiuni
a) diagramă prin coloane; b) diagramă
prin benzi; c) diagrame prin structură

77
Emilia Ţiţan

În diagrama prin suprafeţe se construiesc, de obicei, pătrate


sau cercuri, cu suprafeţele proporţionale cu valorile reprezentate.
Diagrama prin suprafeţe se Diagramele prin suprafeţe se pot trasa cu ajutorul figurilor
construieşte, uzual, cu ajuto- geometrice unidimensionale (care depind de o singură dimensiune —
rul pătratelor sau cercurilor. cerc, pătrat etc.), al figurilor geometrice bidimensionale — drept-
unghi, de exemplu), tridimensionale (paralelipiped dreptunghic) etc.
Figurile geometrice unidimensionale se folosesc atunci
când reprezentăm grafic fenomene independente, care nu depind
unele de altele. În acest caz, se pune problema determinării
dimensiunii (laturii pătratului, sau razei cercului) necesare în
trasarea figurii geometrice.
Diagramele prin suprafaţă se folosesc, de regulă, pentru
reprezentarea datelor centralizate, la nivel de colectivitate totală,
grupe sau subgrupe ale colectivităţii totale.
Trasarea diagramelor de suprafaţă prin figuri geometrice
bidimensionale (dreptunghiul) se foloseşte şi în cazul când avem
de reprezentat o caracteristică complexă ce se descompune în
produsul a doi factori. Cei doi factori se vor reprezenta pe
laturile dreptunghiului, iar caracteristica complexă prin suprafaţa
acestuia.
În cazul fenomenelor complexe, care se descompun în
produsul a trei factori se poate folosi diagrama de volum trasată
prin paralelipipedul dreptunghic. Cei trei factori se vor
reprezenta pe lungimea, lăţimea şi înălţimea paralelipipedului,
iar nivelul fenomenului complex prin volumul acestuia.

Exemplu Populaţia globului pe continente în anul 2000 se prezintă


astfel (mil. locuitori, Tabelul nr. 3.18):

Tabelul nr. 3.18


Populaţia pe continente
Continent Populaţie (mil. loc.)
Africa 784
America de Nord 482
America de Sud 346
Asia 3684
Europa 729
Sursa: Anuarul Statistic al României, 2001, pg. 824

Pentru construirea diagramei prin suprafeţe se va


reprezenta, în primul rând, un pătrat a cărui arie reprezintă
populaţia continentului America de Sud (cu cel mai scăzut
număr de locuitori. Apoi, suprafeţele celorlalte pătrate (AI)
trebuie să fie proporţionale cu volumul populaţiei (NI), ceea ce
înseamnă că pentru toate celelalte continente vom avea:
Ai/AAmerica de Sud=Ni/NAmerica de Sud, astfel:
78
Tehnici de sistematizare şi descriere grafică a datelor statistice

- pentru America de Nord AAmerica de Nord / AAmerica de Sud =


= 482/346 = 1,39 şi atunci latura pătratului trebuie să fie În cazul în care se folosesc,
de 1,39 =1,18 ori mai mare decât latura primului pă- pentru reprezentare, cercuri,
razele cercurilor vor fi propor-
trat. ţionale cu rădăcinile pătrate
- pentru Europa AEuropa/AAmerica de Sud=729/346=2.107 şi ale valorilor.
atunci latura pătratului trebuie să fie de 2.107 =1,45
ori mai mare decât latura primului pătrat.
- pentru Africa AAfrica/AAmerica de Sud=784/346=2.266 şi
atunci latura pătratului trebuie să fie de 2.266 =1,50
ori mai mare decât latura primului pătrat.
- pentru Asia AAsia/AAmerica de Sud=3684/346=10.647 şi
atunci latura pătratului trebuie să fie de 10.647 =3,26
ori mai mare decât latura primului pătrat.
Pătratele se pot construi separat sau suprapuse, caz în care
graficul necesită folosirea haşurilor diferite pentru fiecare con-
tinent şi, evident, o legendă.

Legendă:

Africa

America de Nord

America de Sud

Asia

Europa
Figura nr. 3.22 Populaţia globului
pe continente, în anul 2000

79

S-ar putea să vă placă și