Documente Academic
Documente Profesional
Documente Cultură
20
16
12
CAPITOLUL 3 8
0
<170 170-190 190-210 210-230 230-250 250-270 270-290 290-310 310 si peste
TEHNICI DE SISTEMATIZARE ŞI
STATISTICE
43
Emilia Ţiţan
A x 245
h = 50 (mil. lei)
r 5
Intervalele de grupare vor fi: 120 până la (dar nu egal cu)
170 (mil. lei), 170 până la 220 (mil. lei), 220 până la 270 (mil.
lei), 270 până la 320 (mil. lei), 320 până la 370 (mil. lei).
Stabilirea frecvenţelor se va face prin numărarea obser-
vaţiilor care se încadrează în fiecare interval (tabelul nr. 3.2).
Bucureşti, 1968.
49
Emilia Ţiţan
50
Tehnici de sistematizare şi descriere grafică a datelor statistice
TOTAL n ni
i 1
Observaţii:
Exemple de intervale de gru-
- dacă intervalele sunt cu variaţie discontinuă, atunci: pare cu variaţie discontinuă:
x(i+1)inf = xisup + , (3.4) ... ...
unde este o unitate de discretizare; [5 – 9]
[10 – 14]
[0,0 – 0,9]
[1,0 – 1,9]
- dacă intervalele sunt cu variaţie continuă, adică: [15 – 19] [2,0 – 2,9]
x(i+1)inf = xisup, (3.5) ... ...
atunci trebuie stabilit în ce interval se cuprinde valoarea de Exemple de intervale de grupa-
graniţă. Putem preciza: limita inferioară cuprinsă în interval sau re cu variaţie continuă:
limita superioară cuprinsă în interval; • limita inferioară cuprinsă
- mărimea intervalului de grupare se calculează: în interval
... ...
hi = xisup – xiinf , i i, r , (3.6) [5 – 10) [0,0 – 0,10)
[10 – 15) [1,0 – 2,0)
dacă intervalele sunt cu variaţie continuă, sau: [15 – 20) [2,0 – 3,0)
hi = x(i+1)inf – xi inf, i i, r (3.7) ... ...
TOTAL 1,00 n *i
i 1
52
Tehnici de sistematizare şi descriere grafică a datelor statistice
Frecvenţa relativă cumulată crescător a unei grupe ( Fci* ) Frecvenţa relativă cumulată
reprezintă procentul unităţilor statistice care au valoarea variabilei crescător a ultimei grupe este
egală cu 1 (sau 100%, în ex-
mai mică decât (sau, cel mult, egală cu) limita superioară a grupei: primare procentuală).
i
Fci* nk* . (3.14)
k 1
53
Emilia Ţiţan
h l n icor
etalon (standard). Frecvenţa redusă (corectată) a unui interval
( n icor ) se calculează prin raportarea frecvenţei absolute la un factor
de corecţie (l) ce reprezintă numărul intervalelor etalon ce încap
[2– 4) 10 2 1 10
[4 – 8) 40 4 2 20 într-un interval de grupare:
[8 – 16) 20 8 4 5 h
l i (3.17)
het = 2 h et
ni
n icor , (3.18)
l
unde: hi reprezintă mărimea intervalului i, i 1, r
het reprezintă mărimea intervalului etalon (de regulă
mărimea celui mai mic interval de grupare).
În cazul în care variabila de grupare este discretă şi
gruparea se efectuează pe variante, seria de distribuţie de
frecvenţe este discretă sau pe variante.
Şi în acest caz se pot calcula, pe lângă frecvenţele absolute
ce reprezintă numărul de unităţi statistice (ni) care au valoarea
variabilei egală cu varianta xi, frecvenţe relative şi frecvenţe
cumulate.
2
4
2
0
1
6
1
2
Numardehoteluri
0
<
170 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
103
10sip
este
Capacitatedecazare
Pe baza datelor din tabelul nr. 3.7, putem construi poli- Exemplu
gonul frecvenţelor absolute, astfel (figurile nr. 3.3 şi 3.4):
57
Emilia Ţiţan
2
4
2
0
1
6
Numarhoteluri
1
2
0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este
C
apa
cita
ted
ecazare
2
0
1
6
1
2
Numarhoteluri
0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este
C
apacitateadecazare
58
Tehnici de sistematizare şi descriere grafică a datelor statistice
3
2
2
8
2
4
2
0
1
6
Frecventerelative
1
2
0
<
17
0 1
70-1
90 1
90-2
10 2
10-2
30 2
30-2
50 2
50-2
70 2
70-2
90 2
90-3
10 3
10si p
este
C
apac
itatedec
azare
1000
800
Numar de unitati
600
400
200
0
0 1 2 3 4 5
Capacitatea de confort (numar stele)
14
12
10
Frecvente
0
Când observaţiile sunt nume- 10 20 30 40 50 60 70 80 90
roase, iar mărimea intervale-
Intervale
lor este suficient de mică, poli-
gonul frecvenţelor tinde către o
curbă continuă, numită curbă a) set mic de date
de repartiţie, sau curbă a frec-
venţelor.
35
30
25
Frecvente
20
15
10
0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46
Intervale
clopotului lui Gauss-Laplace) (vezi figura nr. 3.8 a) este foarte rar
întâlnită în practică; cu toate acestea ea este o distribuţie teoretică la
care se face adeseori apel în analiza statistică. În cele mai multe
cazuri, distribuţiile de frecvenţe empirice au tendinţă de normalitate,
dar un anumit grad de asimetrie (figura nr. 3.8 b şi figura nr. 3.8 c).
Există şi distribuţii profund asimetrice, în care frecvenţa maximă se
întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele
să descrească spre zero. Aceste distribuţii se numesc în formă de J
(figura nr. 3.8 d şi figura 3.8 e). De asemenea, se pot întâlni
distribuţii în formă de U, cu frecvenţe maxime în ambele intervale
extreme de variaţie şi cu frecvenţă minimă în jurul intervalului
central — din mijlocul distribuţiei (figura nr. 3.8 f). Este firesc, aşa-
dar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a
tendinţei de distribuţie a valorilor în colectivitatea cercetată.
20
15
statelor Europei după numărul populaţiei, în anul 2000 (Anuarul
Statistic al României, pagina 824). Asimetria reflectă faptul că cele
10
0
0-10 10-20 20-30 30-40 40-50 50-60 60-70 70 si peste
mai multe state au un număr mic (sau relativ redus) al populaţiei şi
doar câteva state au populaţia numeroasă.
Populatie (mil. locuitori)
Distribuţia statelor Europei du- Una dintre problemele pe care le ridică o distribuţie profund
pă numărul locuitorilor. asimetrică este aceea că cele mai multe dintre metodele statistice pe
care le vom studia necesită cel puţin o distribuţie cu tendinţă de
normalitate. Când aceste metode sunt utilizate pentru distribuţii
profund asimetrice, rezultatele pot fi deformate sau chiar complet
greşite. Chiar şi atunci când rezultatele sunt (metodologic) corecte,
deseori nu sunt eficiente, în principal datorită faptului că nu se
utilizează deplin informaţiile conţinute de setul de date respectiv.
Transformarea datelor prin lo- O soluţie pentru această problemă a asimetriei este utilizarea
garitmare. transformării datelor, pentru a înlocui distribuţiile asimetrice cu
unele cu tendinţă de normalitate. Transformarea înseamnă înlocu-
irea fiecărei valori cu un număr diferit (de pildă logaritmul) pentru a
facilita analiza statistică. Cea mai utilizată transformare, în afaceri şi
economie, este logaritmarea datelor, care poate fi folosită doar
pentru valori pozitive (dacă datele includ valori negative sau zero,
această tehnică nu poate fi folosită). Prin logaritmare, scala se
lărgeşte lângă valoarea zero, permiţând răspândirea valorilor mici,
care erau aglomerate în primele intervale. De asemenea, valorile
mari, prin logaritmare, se condensează şi se apropie. În interpretarea
ulterioară a datelor va trebui însă să ţinem seama de aceste
transformări.
8
0
6
0
Frecventecumulate
4
0
2
0
0
130 1
50 1
70 1
90 2
10 2
30 2
50 2
70 2
90 3
10 3
30
C
ap
ac
ita
ted
eca
zare
3000
2400
Frecvente cumulate
1800
1200
600
0
0 1 2 3 4 5
Categorii de confort (numar stele)
1
066
1000 9
43
În general, dreptunghiurile se
800
construiesc vertical (coloane)
pentru o variabilă numerică.
600
Numardeunitati
400 3
61
2
40
200 1
61 1
72
1
40
2
3 1
2
1 2
0
Hot
el
uri
neret
i
t Hanuri
uri
t st
ce
i Cam
pi
nguri Tabereel
evi Pensi
uni
agrot
uri
st
H
ot
el
uri
si
mot
el
uri H
ost
el
uri Cabanet
uri
st
ce
i Vesi
l
i bungal
ouri Pensiuni
uri
t st
ce
i Ael
t
le
S
tru
ctu
ri d
eprim
iretu
ristic
a
A
el
t
le 12
P
ensi
uni
agrot
uri
st 240
P
ensi
uni
uri
t st
ce
i 361
T
abereel
evi 172
V
esi
l
i bungal
ouri 1066
C
ampi
nguri 140
În general, dreptunghiurile se
construiesc orizontal (benzi)
pentru o variabilă categorială.
C
abaneu
tri
st
ce
i 161
Structurideprimireturistica
H
anuri
uri
t st
ce
i 23
H
osturi 2
el
H
ot
el
uri
neret
i
t 1
H
ot
el
uri
si
mot
el
uri 943
Nu
m ar d
eun
itati
65
Emilia Ţiţan
2 stele
34.22%
1 stea
33.93%
Pensiuni
Pensiuni agroturistice Altele
turistice 7.69% 0.48% Hoteluri si În general, dacă ne interesează
11.57% moteluri valorile absolute folosim diagra-
T abere elevi
30.21% me prin benzi sau coloane, iar
5.51% dacă ne interesează ponderile
Hanuri folosim diagrame de structură.
turistice Un grafic combinat poate afişa
0.74% – pe diagrama de structură –
Vile si valorile absolute, în locul pro-
bungalouri Campinguri Cabane centelor.
34.16% 4.49% turistice
5.16%
67
Emilia Ţiţan
69
Emilia Ţiţan
3
800
3
400
3
000
2
600
Incasari(mil.lei)
2
200
1
800
1
400
1
000
10 1
2 1
4 1
6 1
8 2
0 2
2 2
4 2
6
C
he
ltu
ie
li d
epro
mov
are(m
il. le
i)
a) b) c)
Figura nr. 3.16
a) existenţa şi b) c) inexistenţa
legăturii statistice între variabile
Dacă punctele de pe grafic sunt distribuite în mod uniform
pe întregul plan delimitat de axe (figura nr. 3.16, b), ori dacă ele
se grupează în jurul unei linii paralele cu una dintre axe (figura
nr. 3.16, c), acest lucru indică inexistenţa legăturii statistice. De Deşi punctele nu se situează
exact pe o linie sau pe o cur-
remarcat că prin schimbarea scalelor de reprezentare pe una din bă, ne putem imagina o astfel
axe, un nor de puncte împrăştiat în tot graficul (figura nr. 3.16, b) de reprezentare, care să apro-
poate părea ca fiind mai grupat în jurul unei linii (figura nr. 3.16, c). ximeze relaţia dintre cele două
Dar, atâta vreme cât nu există nici o pantă, graficul indică lipsa variabile.
legăturii statistice.
Aspectul de „nor de puncte” este determinat de faptul că
legăturile sunt de tip statistic şi nu de tip funcţional.
- sensul legăturii dintre variabile: dacă punctele de pe
grafic sunt grupate în jurul diagonalei principale (figura nr. 3.17, a)
legătura se apreciază a fi directă, iar dacă punctele se grupează
în jurul diagonalei secundare (figura nr. 3.17, b) astfel încât pe
măsură ce cresc valorile lui X, valorile lui Y descresc (şi vice-
versa), atunci legătura este inversă.
a) b)
Figura nr. 3.17
a) legătură directă şi b) legătură inversă
3.4.2 Cronograma
Diagramă prin linii sau prin co- O serie cronologică se reprezintă grafic prin intermediul
loane? Alegerea depinde de cronogramei sau historiogramei. În sistemul de coordonate
doi factori: obiectivul graficului
şi numărul de termeni ai seriei.
rectangulare, pe axa absciselor se marchează unităţile de timp (t) —
momente sau intervale —, iar pe axa ordonatelor valorile variabilei
(yt). Dacă este vorba de o serie de momente (de stoc), se va ridica o
linie din dreptul momentului până la nivelul variabilei, unde vom
Dacă obiectivul se focalizează marca un punct, iar dacă este o serie de flux, linia se va ridica din
pe determinarea trendului, se centrul intervalului de timp până în dreptul nivelului variabilei.
recomandă folosirea diagramei Unind punctele marcate obţinem cronograma, care prezintă evoluţia
prin linii.
fenomenului (variabilei) analizat, în timp. Pentru serii cronologice
de intervale se pot ridica şi coloane (dreptunghiuri), având lăţimea
egală cu mărimea intervalului de timp şi înălţimea proporţională cu
nivelul variabilei.
1
45
1
15
1
05
9
5
ia
nua
rie200
1 m artie
200
1 m
ai2
001 iulie
2001 septem
brie20
01n oie
mbrie20
01 ianu
arie
2002
fe
bruarie
20 01 ap
rilie
200
1 iu n
ie2
00 1 a
ugu
st2
00 1 o c
tombrie
2 0
01d e
cembrie
200
1 febru
arie
200
2
P
erio
ada
a)
74
Tehnici de sistematizare şi descriere grafică a datelor statistice
150
110
90
februari
e2001aprie2001
i
l uni
i e2001 august
2001 oct om
bri
e2001 decembri
e2001februari
e2002
inuari
a e2001 m art
e2001
i m
ai2001 ul
ie2001
i sept
embri
e2001noi
embri
e2001 ianuari
e2002
P
erio
ada
b)
Figura nr. 3.19 Cronogramă
trasată prin a) linii; b) coloane
Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.
Sept. Mai
Aug. Iun.
Iul.
75
Emilia Ţiţan
15.
5
1
4.7
14.
5
1
4
13.
5
12.
5
1
2.1 1
2.1
Populatieocupata(mipers.)
11.
5 1
1.2
10.
5
9
.7 9
.8
9.
5 9
.2
8.
5
N
ord-E
st S
ud-E
st S
ud S
ud-V
est V
est N
ord-V
est C
ent
ru B
ucurest
i
Re
giu
nea
a)
B
ucurest
i 1
4.7
C
ent
ru 1
4
N
ord-V
est 1
2.1
V
est 1
1.2
Regiunea
Sud-V
est 9
.2
Sud 9
.8
S
ud-E
st 1
2.1
N
ord-E
st 9
.7
8.
5 9.
5 10.
5 11.
5 12.
5 13.
5 14.
5 15.
5
P
opu
latieo
cup
ata(mii p
ers.)
b)
No
rd-Es
t, 1
0.5%
Bu
cure
sti, 1
5.8%
Su
d-Es
t, 1
3.0%
Ce
ntru
,15
.1%
Su
d,1
0.6%
No
rd-Ve
st, 1
3.0%
Su
d-Ve
st, 9
.9%
Ve
st, 1
2.1%
c)
Figura nr. 3.21 Populaţia ocupată în
ramura hoteluri şi restaurante, pe regiuni
a) diagramă prin coloane; b) diagramă
prin benzi; c) diagrame prin structură
77
Emilia Ţiţan
Legendă:
Africa
America de Nord
America de Sud
Asia
Europa
Figura nr. 3.22 Populaţia globului
pe continente, în anul 2000
79