Documente Academic
Documente Profesional
Documente Cultură
4
SISTEMATIZAREA, PREZENTAREA I REPREZENTAREA
DATELOR STATISTICE
Cuprins:
1. Obiectivele Unitii de nvare.
2. Sistematizarea datelor statistice (gruparea/clasificarea).
2.1. Clasificarea datelor statistice.
2.2. Gruparea datelor statistice
3. Modaliti de prezentare i reprezentare a datelor statistice.
3.1. Serii statistice.
3.2. Tabele statistice.
3.3. Grafice statistice.
4. Rspunsuri la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unitii de nvare.
7. Bibliografia Unitii de nvare.
cum se pot transpune seturile mari de date colectate dintr-o form aleatoare,
neregulat, ntr-o form ordonat, organizat;
cum s alegem tipul cel mai potrivit de grafic necesar pentru reprezentarea
datelor statistice.
Sunt cazuri n care nu este posibil ndeplinirea simultan a tuturor acestor condiii (de
exemplu: dac sunt uniti la care s-au nregistrat valori extreme, aberante, ale caracteristicii
dup care se face sistematizarea, este de dorit, uneori, s se evidenieze separat aceste cazuri,
s se scoat n afara gruprii aceste uniti i s se sistematizeze restul unitilor, la care s-au
nregistrat valori mai apropiate ale variabilei).
2.1. Clasificarea datelor statistice.
Sistematizarea datelor efectuat dup o variabil ne-numeric se numete clasificare. Ea
presupune mprirea unitilor n clasele/categoriile variabilei nenumerice considerate.
Exemplul 1
Distribuia absolvenilor unei faculti economice dup domeniul n care s-au angajat este:
Domeniu
Contabilitate
Marketing
Finane
Management economic
Altele sau fr loc de munc
Total
95
72
55
43
35
300
Dac datele se refer la variabile ordinale, clasele vor respecta criteriul de ordine:
Exemplul 2
Distribuia studenilor unei grupe dup calificativul obinut la un proiect este :
Calificativ (xi)
Insuficient
Satisfctor
Bine
3
4
15
3
Foarte bine
Excelent
Total
6
2
30
pe variante (atunci cnd grupm datele dup o variabil discret sau cnd plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
Exemplul 3
Pentru 20 de familii s-a nregistrat numrul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0, 2, 1, 3,
1, 2, 4, 2. S se realiezeze o sistematizare a datelor.
Numr de copii (xi)
0
1
2
3
4
Total
3
5
8
3
1
20
Observm c variabila de grupare este numrul de copii, variabil discret cu puine variante
(cinci variante), deci s-a realizat o grupare pe variante.
Se poate efectua pe intervale de mrime egal sau diferit. n continuare vom trata
numai cazul gruprii datelor statistice pe intervale egale de variaie.
Pentru realizarea gruprii pe intervale egale de variaie se recomand parcurgerea
urmtorilor pai:
a) se determin amplitudinea variaiei caracteristicii, ca diferen ntre valoarea
maxim i valoarea minim a caracteristicii.
A x max x min
numrul de grupe (r) este prestabilit, pe baza experienei cptate din studii anterioare
asupra domeniului de interes.
numrul de grupe (r) nu este prestabilit; n acest caz, dac unitile se repartizeaz
aproximati normal dup caracteristica studiat, se poate utiliza pentru determinarea
numrul de grupe relaia lui Sturges:
r 1 3,322 lg n
A
r
Limitele intervalelor vor avea acelai grad de precizie ca i datele grupate (acelai
numr de zecimale), primul interval putnd ncepe chiar de la valoarea minim a
caracteristicii, sau de la o valoare uor inferioar acesteia, aleas n mod convenabil. Este bine
s nu existe suprapuneri de limite, astfel nct la efectuarea gruprii s poat fi respectat
condiia de unicitate.
-
Dac ntre limita superioar a unui interval i limita inferioar a intervalului urmtor
exist o diferen de o unitate ntreag sau zecimal, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizrii pot fi redate cu ajutorul unui tabel asemntor celui din
exemplul urmtor.
Exemplul 4
n vederea analizei oportunitii deschiderii unui magazin ce vinde aparatur
electrocasnic, un analist financiar este interesat n cunoaterea nivelului vnzrilor zilnice ale
magazinelor de profil. Pentru 50 de astfel de magazine alese ntmpltor, nregistreaz
valoarea facturilor emise zilnic. Datele sunt urmtoarele (mii lei):
10,5
8,4
10,5
9,0
9,2
9,7
6,6
10,6
10,1
7,1
8,0
7,9
6,8
9,5
8,1
11,5
9,9
6,9
7,5
11,1
8,2
8,0
7,7
7,4
6,5
9,5
8,2
6,9
7,2
8,2
9.6
7,2
8,8
11,3
8,5
9,4
10,5
6,9
6,5
7,5
7,1
5,2
7,7
5,9
5,2
5,6
11,7
6,0
7,8
6,5
Varianta I
Intervale de variaie a valorii
facturilor emise zilnic (mii lei)
5,0 6,0
6,0 7,0
7,0 8,0
8,0 9,0
9,0 10,0
10,0 11,0
11,0 - 12,0
Total
Not: limita inferioar inclus n interval.
Varianta II
Nr.
magazine
(ni)
4
9
11
9
8
5
4
50
Nr.
magazine
(ni)
5,0 6,0
5
6,0 7,0
8
7,0 8,0
13
8,0 9,0
8
9,0 10,0
7
10,0 11,0
5
11,0 - 12,0
4
Total
50
Not: limita superioar inclus n interval.
Varianta III
Intervale de variaie a valorii facturilor emise
zilnic (mii lei)
5,0 5,9
6,0 6,9
7,0 7,9
8,0 8,9
9,0 9,9
10,0 10,9
11,0 11,9
Total
Nr. magazine
(ni)
4
9
11
9
8
5
4
50
serii statistice;
tabele statistice;
grafice statistice.
x1 x2 . . xi . . xr
X :
n1 n2 . . ni . . nr
unde ni ( i
-
X:
1, r
n
1
n 2 . . ni . . n r
sau
x1 x2 . . xi . . xr
X :
n1 n2 . . ni . . nr
unde xi ,
i 1, r
x1sup
x 2sup
xiinf
...
xisup
...
ni
x rinf
...
x rsup
...
nr
r
n ni
Total
i 1
unde: xiinf , xisup reprezint limita inferioar, respectiv superioar, a intervalului de variaie i.
Vom considera doar cazul intervalelor egale i continue.
Centrul intervalului este determinat ca medie aritmetic simpl a limitelor intervalului
i este considerat reprezentativ pentru datele din acel interval. Se determin cu una din
relaiile:
xi
xiinf xisup
2
sau
xi xiinf
hi
, unde hi este mrimea intervalului.
2
Frecvena absolut a grupei (ni) este egal cu numrul de uniti statistice care au
valoarea caracteristicii mai mare (sau egal) cu limita inferioar a intervalului i mai mic
(sau egal) cu limita superioar a acesteia. Suma frecvenelor absolute este notat cu n i
r
ni
r
ni
ni
n i se exprim n coeficieni,
i 1
sau
ni*%
ni
r
ni
100
ni
100
n
i se exprim n procente.
i 1
Suma frecvenelor relative este 1 sau 100, dup cum sunt exprimate n coeficieni sau
n procente.
r
ni* 1
i 1
sau
ni*% 100
i 1
Frecvenele cumulate.
Sunt de dou tipuri: cumulate cresctor i cumulate descresctor.
Frecvena absolut cumulat cresctor a unei grupe este egal cu numrul unitilor
care au valoarea variabilei mai mic (sau egal) cu limita superioar a grupei (mai exact ntre
sup
x1inf i xi ).
10
Fci
nk
k 1
Frecvena absolut cumulat cresctor a ultimei grupe este egal cu volumul colectivitii (cu
n).
Frecvena absolut cumulat descresctor a unei grupe este egal cu numrul
unitilor pentru care valoarea caracteristicii este mai mare (sau egal) cu limita inferioar a
grupei (mai exact ntre xiinf i x rsup ):
Fd i
nk
k i
Frecvena absolut cumulat descresctor a primei grupe este egal cu numrul total de uniti
statistice (cu n):
Asemntor se determin i frecvenele relative cumulate cresctor i descresctor,
conform relaiilor:
Fci*
nk*
k 1
Fd i*
nk*
k i
Exemplu 5
Pentrul datele din exemplul 4 (varianta I) s-au determinat: frecvenele absolute,
frecvenele relative, centrele de interval i frecvenele absolute cumulate:
Frecvene absolute cumulate
Intervale de
variaie a valorii
facturilor emise
zilnic (mii lei)
Nr. magazine
(ni)
Ponderea
magazinelor
( ni*% )
Centre de
interval (xi)
Cresctor
Descresctor
[5,0 6,0)
[6,0 7,0)
[7,0 8,0)
[8,0 9,0)
[9,0 10,0)
[10,0 11,0)
[11,0 12,0)
Total
4
9
11
9
8
5
4
50
8
18
22
18
16
10
8
100
5,5
6,5
7,5
8,5
9,5
10,5
11,5
-
4
13
24
33
41
46
50
-
50
46
37
26
17
9
4
-
11
x1
x2
...
xi
...
xr
n1
n2
...
ni
...
nr
Total
n ni
i 1
unde: ni reprezint numrul unitilor care prezint valoarea xi a caracteristicii de grupare (se
mai numesc frecvene absolute);
Prin nsumarea frecvenelor grupelor (ni) se obine volumul total al colectivitii (n).
i pentru aceast serie se determin toate tipurile de frecvene prezentate anterior.
Exemplul 6
Pentrul situaia din exemplul 3 s-au determinat: frecvenele absolute, frecvenele relative,
i frecvenele absolute cumulate:
Numr de copii
(xi)
0
1
2
3
4
Total
Numr de
familii (ni)
3
5
8
3
1
20
Frecvene relative
( ni* )
0,15
0,25
0,40
0,15
0,05
1,00
Exemplul 7
Pentrul clasificarea din exemplul 2 s-au determinat: frecvenele absolute, frecvenele
relative, i frecvenele absolute cumulate:
Calificativ
(xi)
Insuficient
Satisfctor
Numr de
studeni (ni)
3
4
Frecvene relative
( ni* )
0,10
0,13
12
Bine
Foarte bine
Excelent
Total
15
6
2
30
0,50
0,20
0,07
1,00
22
28
30
-
23
8
2
-
Total
uniti
n1.
n2.
...
ni.
...
nr.
n..
este varianta sau centrul de interval pentru grupa i, format dup valorile
i 1, r
variabilei X;
yj,
este varianta sau centrul de interval al grupei j, format dup valorile variabilei
j 1, p
Y;
nij,
i 1, r
j 1, p
de valoarea caracteristicii Y;
r
de valoarea caracteristicii X;
n.. n
i 1
j 1
13
Exersai n Excel
Nivelul profitului anual (mii RON) pentru 50 de firme productoare de mobil este:
62
82
89
97
114
63
83
119
64
84
S se sistematizeze datele
90
99
123
65
84
91
101
132
69
85
pe 7 intervale egale
91
93
95
102
105
110
133
145
164
72
76
79
86
87
89
92
94
96
104
107
113
134
146
174
74
77
98
86
88
102
de variaie i s se reprezinte grafic, folosind metodele
Histogram
20
Frequency
Se obin rezultatele:
Bin
Frequency
78
9
94
18
110
12
126
4
142
3
158
2
15
10
5
0
78
174
94
110
126
142
158
174 More
Bin
14
Se selecteaz Line iar la Data Range se introduc celulele corespunztoare frecvenelor cumulate.
La Series/Category (X) axis labels se introduc celulele corespunztoare capetelor de interval (coloana
Bin). Se apas Next/Next/FINISH.
Se obine curba cumulativ a frecvenelor relative:
Cumulative %
120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
,00%
78
94
110
126
142
158
174
Muncitori (%)
5
20
45
15
15
Tabelul prezint:
a)
b)
c)
d)
e)
titlul tabelului este un element obligatoriu plasat naintea tabelului, care descrie clar i
concis coninutul datelor pe care le cuprinde;
subiectul tabelului este format din populaia la care se refer datele nscrise n tabel;
rubricile tabelului sunt spaiile create la ntretierea liniilor orizontale cu cele verticale,
n care sunt nscrise datele;
datele statistice nscrise n tabel pot fi sub form numeric sau textual;
unitatea de msur trebuie precizat pentru fiecare din indicatorii nscrii n tabel; dac
toi sunt exprimai n aceeai unitate de msur, atunci aceasta se poate trece deasupra
tabelului;
sursa datelor;
16
numrul tabelului este necesar mai ales atunci cnd se folosesc mai multe tabele,
pentru identificarea lor;
titlul graficului;
sistemul de coordonate;
scara de reprezentare;
reeaua graficului;
legenda;
note explicative, sursa datelor etc.
Tipuri de reprezentri grafice utilizate n cazul seriilor de distribuie de frecvene
1. Histograma:
Histograma conine o succesiune de dreptunghiuri, cu bazele corespunztoare lungimii
in-tervalelor i nlimile egale cu numrul de observaii din fiecare interval (sau cu ponderea
lor). Dac intervalele au mrime egal, atunci i coloanele vor avea lime egal.
Permite vizualizarea distribuiei de frecvene absolute sau relative, dup o variabil
numeric continu (pe intervale).
2. Poligonul frecvenelor:
Poligonul frecvenelor este i el utilizat pentru reprezentarea grafic a distribuiilor de
frecvene absolute sau relative, atunci cnd sistematizarea datelor s-a fcut dup o
caracteristic numeric continu sau discontinu. Pentru construirea lui, din fiecare valoare a
17
caracteristicii sau din fiecare centru de interval se ridic cte o perpendicular i se marcheaz
pe ea punctul aflat la o distan egal cu frecvena variantei sau intervalului respectiv. Unind
toate punctele astfel gsite rezult un poligon numit poligonul frecvenelor.
Poligonul frecvenelor se poate suprapune peste histogram n cadrul aceluiai grafic,
sau se poate trasa ntr-un grafic separat.
3. Curbele frecvenelor cumulate:
Curbele frecvenelor cumulate (ogivele), numite i curbele cumulative ale
frecvenelor, reprezint o a treia modalitate de reprezentare grafic a distribuiilor de
frecvene pe intervale de variaie sau pe variante. Ele se traseaz att pentru distribuii de
frecvene absolute, ct i pentru distribuii de frecvene relative.
n cazul distribuiilor de frecvene dup o variabil continu:
-
Exemplul 8
Pentru distribuia de frecvene din exemplul 4, obinut dup o variabil continu,
histograma, poligonul frecvenelor i curbele frecvenelor cumulate se prezint astfel:
12
Nr. magazine
10
8
6
4
2
0
5,0-6,0 6,0-7,0 7,0-8,0 8,0-9,0
9,010,0
10,011,0
11,012,0
mii RON
Poligonul frecvenelor
18
Din graficele realizate reiese c distribuia magazinelor dup valoarea facturilor emise
este o distribuie cu tendin de normalitate.
Exemplul 9
Pentru distribuia de frecvene din exemplul 3, obinut dup o variabil discret,
poligonul frecvenelor i graficul frecvenelor cumulate cresctor se prezint astfel:
a) Poligonul frecvenelor
19
indicatorului. Aadar, graficul const dintr-o succesiune de coloane de lime egal, cte o
coloan pentru fiecare categorie/variant a variabilei nominale, egal distanate ntre ele (la
distane, de regul, mai mici dect grosimea coloanelor) i cu nlimea proporional cu
frecvenele sau nivelul indicatorului corespunztor categoriei respective. Dac dreptunghiurile
sunt rsturnate cu 90% (i au baza situat pe axa vertical) atunci reprezentarea grafic este o
diagram prin benzi, cu axele inversate fa de diagrama prin coloane.
Exemplul 10
Pentru distribuia de frecvene din exemplul 1, obinut dup o variabil calitativ,
diagrama prin coloane i cea prin benzi se prezint astfel:
5. Diagrama de structur.
Diagrama de structur este folosit pentru a reprezenta grafic structura unei
colectiviti, sistematizate dup valorile unei variabile cantitative sau calitative. Graficul arat,
aadar, modul n care ntregul se subdivide n pri componente. De obicei, diagrama se
traseaz cu ajutorul cercului, a crui arie reprezint ntregul; acesta se mparte n mai multe
buci (felii), unghiul la centru corespunztor acestei pri de cerc este proporional cu
raportul dintre frecvena absolut i volumul total al colectivitii (adic cu frecvena relativ)
a acelei clase/grupe.
Exemplul 11
20
21
22
d) este incorect, deoarece axa Oy i are originea n 10, nu n 0, aa cum este cazul scalei de
raport;
e) este incorect, deoarece scrile de reprezentare nu au fost alese echilibrat pe cele 2 axe,
(graficul este prea extins pe orizontal, ceea ce duce la falsa aplatizare, alternare a variaiei
fenomenului);
f) este incorect deoarece pe axa Oy trebuie figurat o ntrerupere de scar (ntre 0 i 10).
Aadar, incorecte sunt graficele a), b), d), e), f).
5. Teme de control
1. Se cunoate durata sejurului ntr-o staiune montan (zile) pentru 30 de turiti:
12
9
10
15
6
4
9
8
12
11
16
11
11
9
10
13
3
7
16
7
5
12
10
18
6
8
6
20
12
14
Sub 10
10-20
20-30
30-40
40-50
50-60
12
62
150250
25
250350
50
350450
18
450550
9
23
550650
5
650750
3
24