CAPITOLUL 2
SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE
Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o
manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea,
astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale
fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.
Termeni cheie
Noţiuni teoretice
2.1. INTRODUCERE
date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea
frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.
Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r
Total n = ∑ ni
i =1
OBSERVAŢII:
• dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4)
unde ∆ este o unitate de discretizare
• dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5)
atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă;
• mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , i = i,r (2.6)
dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, i = i,r (2.7)
sau
hi = xisup – x(i–1)sup, i = 2,r (2.8)
indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.
STATISTICĂ ECONOMICĂ
Tabelul 2.2.
Serie de distribuţie de frecvenţe relative
Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup n 1*
x2inf – x2sup
. n *2
. .
. .
xi inf – xi sup n *i
.
.
.
.
xrinf – xrsup *
nr
r
Total 1,00 = ∑ n *i
i =1
CAPITOLUL 2
Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Număr de Frecvenţe Frecvenţe
Salariul net Frecvenţe
salariaţi absolute relative
(mii lei) relative n *i cumulate (Fci)
(ni) cumulate ( Fci* )
1,4 – 1,6 5 0,10 5 0,10
1,6 – 1,8 8 0,16 13 0,26
1,8 – 2,0 4 0,08 17 0,34
2,0 – 2,2 17 0,34 34 0,68
2,2 – 2,4 8 0,16 42 0,84
2,4 – 2,6 3 0,06 45 0,90
2,6 – 2,8 2 0,04 47 0,94
2,8 – 3,0 2 0,04 49 0,98
3,0 – 3,2 1 0,02 50 1,00
Total 50 1,00 — —
hi
l= (2.16)
h et
ni
n icor = (2.17)
l
unde hi reprezintă mărimea intervalului i, i = 1, r
het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare).
Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori
rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de Număr de Frecvenţe Frecvenţe Frecvenţe
copii minori divorţuri *
relative ( n i ) absolute relative
(ni) cumulate cumulate
(Fci) ( Fci* )
0 1 2 3 4
0 18.614 0,465 18.614 0,465
1 14.518 0,363 33.132 0,828
2 5.351 0,134 38.483 0,962
3 1.062 0,027 39.545 0,989
4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000
Total 39.985 1,000 — —
Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe
principalele companii
Procent din numărul total de
Compania
contracte încheiate (%)
Nederlanden 45,70
ASIROM S.A. 27,41
SARA MERKUR 12,16
UNITA 8,30
AIG Life 1,93
Garanta 1,35
Omniasig 0,96
METROPOL S.A. 0,92
Interamerican 0,57
ARDAF 0,25
Altele 0,45
Total 100,0
Tabelul 2.6
Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru Y
y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
Total n.1 n.2 .... n.j ... n.m n..
Tabelul 2.7
Tabel de asociere
Clasele lui X Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22
alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot
fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa
de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte
de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade),
seria cronologică se numeşte de flux (de intervale). O serie cronologică se
notează:
1 2 ... t ... n t
sau , t = 1, n.
y1 y 2 ... y t ... y n y t
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea
pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).
Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Vânzările
Anul
(mii exemplare)
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2001 143,0
yi M
M
r
α
o xi x o x
a) b)
1
D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
STATISTICĂ ECONOMICĂ
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
25
20
15
10 Scara de reprezentare
5 Ox: 0,8 cm = 0,2 mil. lei
0 Oy: 0,5 cm = 2 persoane
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
CAPITOLUL 2
y
40
35
30
Frecvenþe
25
20
15
10 Scara de reprezentare
5
Ox: 0,8 cm = 0,2 mil. lei
0
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x Oy: 0,5 cm = 2 persoane
Salariul (mil. lei)
y
Frecvenþe relative (%)
40
35
30
25
20
15
10
5 Scara de reprezentare
0 Ox: 0,8 cm = 0,2 mil. lei
≈
1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Oy: 0,6 cm = 2 persoane
Salariul (mil. lei)
14
12
10
Frecvente
0
10 20 30 40 50 60 70 80 90
Intervale
35
30
25
Frecvente
20
15
10
0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46
Intervale
y y y
o x o x o x
y y y
o x o x o x
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U
Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control
Nota (xi) Număr de elevi (ni)
2 1
3 2
4 2
5 6
6 7
8 15
9 5
10 2
Total 40
16
14
12
10
Frecvente
8
6
2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota
60
50
Frecvente cumulate
40
30
20
10
≈
0
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)
EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).
STATISTICĂ ECONOMICĂ
1,2
1
Frecvente relative cumulate
0,8
0,6
0,4
0,2
0
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (m il. lei)
Tabelul 2.11
Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control
Nota (xi) Frecvenţe absolute cumulate
crescător (Fci)
2 1
3 3
4 5
5 11
6 18
8 33
9 38
10 40
35
30
25
20
15
10
o 1 2 3 4 5 6 7 8 9 10 x (nota)
50
45.7
45
Frecvenţe relative (%)
40
35
30 27.41
25
20
15 12.16
10 8.3
fe
ta
le
A
ig
AF
A
po
am
de
IT
te
as
O
Li
an
ro
D
SA
N
IR
Al
n
er
ni
G
ar
AR
et
la
t
AS
m
AI
In
er
M
O
ed
N
Compania
Nederl. 45.7
ASIROM 27.41
SARA 12.16
UNITA 2.3
Companie
0 10 20 30 40 50
Frecvenţe relative (%)
Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Lif e
UNITA
SARA
ASIROM
Nederl.
a.
STATISTICĂ ECONOMICĂ
Nederl.
ASIROM
SARA
100 UNITA
80 AIG Life
Garanta
60
% Omniasig
40
Metropol
20 Interam.
0 ARDAF
b. Altele
Nederl.
100
A SIROM
90
80 SA RA
70 UNITA
60 A IG Lif e
% 50 Garanta
40 Omnias ig
30 Metropol
20 Interam.
10
A RDA F
0
c. A ltele
Nederl.
ASIROM
SARA
100% UNITA
80% AIG Life
60% Garanta
% Omniasig
40%
Metropol
20%
Interam.
0% ARDAF
d. Altele
Cantitãþi vândute
din produsul X
(mii bucãþi) 250
**
**
200 ***
***
150 * * ***
* ***
100 * * **
***
* *** *
50 **
***
***
10
20 30 40 50 60 Cheltuieli cu
reclama (mld. lei)
2.5.6. Cronograma
0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ie
90.00
100.00
110.00
120.00
130.00
140.00
150.00
fe 20
br 01
ua
rie
20
m 01
ar
tie
20
ap 01
ril
ie
20
01
m
ai
20
iu 01
ni
e2
00
iu 1
lie
a)
b)
au 200
gu 1
se st
Lunile
pt
em 200
b 1
luni
oc rie 2
to 00
m 1
br
no ie
ie 20
m 01
br
de ie
ce 20
m
STATISTICĂ ECONOMICĂ
01
br
ie
ia 20
nu 01
ar
ie
fe 20
br 02
ua
rie
20
01
Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.
Sept. Mai
Aug. Iun.
Iul.
Legendă:
Africa
America de Nord
America de Sud
Asia
Europa
Întrebări recapitulative