Documente Academic
Documente Profesional
Documente Cultură
Cuprins:
1
2. Sistematizarea datelor statistice (gruparea/clasificarea).
Am vzut c statistica opereaz cu volume mari de date. Dac aceste date sunt
prezentate ntr-o form aleatoare neregulat, este dificil, investignd vizual setul de date, s-l
caracterizm prin trsturile sale eseniale, prin valorile extreme, tendina central sau gradul
de dispersare. De aceea, putem nti supune setul de date unor operaii de prezentare
sistematic, de organizare, de ordonare a acestor date dup unul sau mai multe criterii, ntr-
un cuvnt de sistematizare.
Aceast operaie face trecerea de la observarea statistic (n urma creia s-au obinut
datele necesare realizrii obiectivelor investigaiei statistice, verificate sub aspectul volumului
i calitii) i prelucrarea propriuzis.
Sistematizarea este parte a prelucrrii primare a datelor statistice.
Sistematizarea datelor se realizeaz prin gruparea i clasificarea datelor statistice.
Atunci cnd criteriul (caracteristica) dup care se realizeaz aceast operaie este unul
numeric, cantitativ, ea se numete grupare, iar cnd operaia se realizeaz dup un criteriu
(caracteristic) calitativ, nenumeric, ea se numete clasificare.
La realizarea unei grupri/clasificri, trebuie, pe ct posibil, s ndeplinim urmtoarele
condiii:
a) omogenitate (n sensul c unitile statistice care au aceeai valoare sau valori
apropiate, asemntoare, ale caracteristicii dup care se efectueaz sistematizarea vor
fi incluse n aceeai clas; n felul acesta, se dorete ca variaia valorilor caracteristicii
incluse n aceeai grup/clas s fie ct mai mic);
b) unicitate (n sensul c o unitate statistic trebuie inclus ntr-o singur clas sau grup,
ea nu se poate regsi simultan n dou sau mai multe clase/grupe);
c) completitudine (n sensul c toate unitile statistice s fie incluse n grupe/clase, s nu
fie exclus vreo unitate din operaia de sistematizare).
2
Sunt cazuri n care nu este posibil ndeplinirea simultan a tuturor acestor condiii (de
exemplu: dac sunt uniti la care s-au nregistrat valori extreme, aberante, ale caracteristicii
dup care se face sistematizarea, este de dorit, uneori, s se evidenieze separat aceste cazuri,
s se scoat n afara gruprii aceste uniti i s se sistematizeze restul unitilor, la care s-au
nregistrat valori mai apropiate ale variabilei).
Exemplul 1
Distribuia absolvenilor unei faculti economice dup domeniul n care s-au angajat este:
Dac datele se refer la variabile ordinale, clasele vor respecta criteriul de ordine:
Exemplul 2
Distribuia studenilor unei grupe dup calificativul obinut la un proiect este:
3
Foarte bine 6
Excelent 2
Total 30
- pe variante (atunci cnd grupm datele dup o variabil discret sau cnd plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
Exemplul 3
Pentru 20 de familii s-a nregistrat numrul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0, 2, 1, 3,
1, 2, 4, 2. S se realiezeze o sistematizare a datelor.
4
Se poate efectua pe intervale de mrime egal sau diferit. n continuare vom trata
numai cazul gruprii datelor statistice pe intervale egale de variaie.
Pentru realizarea gruprii pe intervale egale de variaie se recomand parcurgerea
urmtorilor pai:
a) se determin amplitudinea variaiei caracteristicii, ca diferen ntre valoarea
maxim i valoarea minim a caracteristicii.
A = x max x min
b) se stabilete numrul de grupe. n acest caz pot exista dou situaii:
- numrul de grupe (r) este prestabilit, pe baza experienei cptate din studii anterioare
asupra domeniului de interes.
- numrul de grupe (r) nu este prestabilit; n acest caz, dac unitile se repartizeaz
aproximati normal dup caracteristica studiat, se poate utiliza pentru determinarea
numrul de grupe relaia lui Sturges:
r = 1 + 3,322 lg n
unde n este numrul total de uniti ale colectivitii.
Este recomandat a se folosi un numr potrivit de grupe (de regul ntre 4 i 10).
Utilizarea unui numr prea mare de grupe ar duce la frmiarea excesiv a colectivitii
(putnd apare, n acest caz i grupe cu frecvene nule, iar gruparea ar trebui refcut);
utilizarea, dimpotriv, a unui numr prea mic de grupe ar putea s nu pun n eviden
principalele tipuri calitative ale populaiei dup variabila urmrit).
c) se determin mrimea intervalului de grupare (h), ca raport ntre amplitudinea
caracteristicii i numrul de grupe:
A
h=
r
Pentru uurarea calculelor, se recomand a se folosi mrimi rotunjite de interval, de
aceea, dac valoarea reieit din calcul este fracionar, cu mai multe zecimale, ea se poate
rotunji prin adaos la o valoare imediat superioar, aleas n mod convenabil.
De exemplu: dac h = 4,4225, se poate rotunji valoarea la h = 4,5 sau chiar la h = 5.
d) se formeaz intervalele de grupare, prin precizarea limitelor exacte ale acestora.
xmin xmin+h
xmin+h xmin+2h
.....................................................
xmin + (r 1).h xmin + r h
5
Limitele intervalelor vor avea acelai grad de precizie ca i datele grupate (acelai
numr de zecimale), primul interval putnd ncepe chiar de la valoarea minim a
caracteristicii, sau de la o valoare uor inferioar acesteia, aleas n mod convenabil. Este bine
s nu existe suprapuneri de limite, astfel nct la efectuarea gruprii s poat fi respectat
condiia de unicitate.
- Dac limita superioar a unui interval coincide cu limita inferioar a intervalului
urmtor, intervalele se numesc continue;
- Dac ntre limita superioar a unui interval i limita inferioar a intervalului urmtor
exist o diferen de o unitate ntreag sau zecimal, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizrii pot fi redate cu ajutorul unui tabel asemntor celui din
exemplul urmtor.
Exemplul 4
n vederea analizei oportunitii deschiderii unui magazin ce vinde aparatur
electrocasnic, un analist financiar este interesat n cunoaterea nivelului vnzrilor zilnice ale
magazinelor de profil. Pentru 50 de astfel de magazine alese ntmpltor, nregistreaz
valoarea facturilor emise zilnic. Datele sunt urmtoarele (mii lei):
6
Varianta I Varianta II
Intervale de variaie a valorii Nr. Intervale de variaie a valorii Nr.
facturilor emise zilnic (mii lei) magazine facturilor emise zilnic (mii lei) magazine
(ni) (ni)
5,0 6,0 4 5,0 6,0 5
6,0 7,0 9 6,0 7,0 8
7,0 8,0 11 7,0 8,0 13
8,0 9,0 9 8,0 9,0 8
9,0 10,0 8 9,0 10,0 7
10,0 11,0 5 10,0 11,0 5
11,0 - 12,0 4 11,0 - 12,0 4
Total 50 Total 50
Not: limita inferioar inclus n interval. Not: limita superioar inclus n interval.
Varianta III
Intervale de variaie a valorii facturilor emise Nr. magazine
zilnic (mii lei) (ni)
5,0 5,9 4
6,0 6,9 9
7,0 7,9 11
8,0 8,9 9
9,0 9,9 8
10,0 10,9 5
11,0 11,9 4
Total 50
Not: intervale discontinue.
Se recomand utilizarea intervalelor continue (varianta I sau varianta II).
Seria statistic reprezint un mod organizat de prezentare a datelor, sub forma a dou
iruri: primul se refer la criteriul de sistematizare iar al doilea cuprinde datele numerice
sau frecvenele de apariie i depinde de ordinea de apariie din primul ir.
7
iii. serii de distribuie de frecvene (sau repartiii de frecvene, care se refer la o
variabil atributiv).
8
- pentru o caracteristic continu (repartiie de frecvene pe intervale de valori):
x inf < X < x sup x2inf < X < x2sup ... xiinf < X < xisup ... xrinf < X < xrsup
X : 1 1
n1 n2 ... ni ... nr
sau
x1 x2 ... xi ... x r
X :
n1 n2 ... ni ... nr
x 2inf x 2sup n2
... ...
xiinf xisup ni
... ...
x rinf x rsup nr
r
Total n = ni
i =1
unde: xiinf , xisup reprezint limita inferioar, respectiv superioar, a intervalului de variaie i.
Vom considera doar cazul intervalelor egale i continue.
Centrul intervalului este determinat ca medie aritmetic simpl a limitelor intervalului
i este considerat reprezentativ pentru datele din acel interval. Se determin cu una din
relaiile:
xiinf + xisup hi
xi = sau xi = xiinf + , unde hi este mrimea intervalului.
2 2
Frecvena absolut a grupei (ni) este egal cu numrul de uniti statistice care au
valoarea caracteristicii mai mare (sau egal) cu limita inferioar a intervalului i mai mic
(sau egal) cu limita superioar a acesteia. Suma frecvenelor absolute este notat cu n i
r
reprezint numrul total de uniti sau volumul eantionului. n = ni
i =1
9
cea superioar a grupei respective. Se determin ca raport ntre frecvena absolut a grupei i
volumul eantionului (eventual nmulit cu 100).
ni ni
ni* = r
= i se exprim n coeficieni,
n
ni
i =1
sau
ni ni
ni*% = r
100 = 100 i se exprim n procente.
n
ni
i =1
Suma frecvenelor relative este 1 sau 100, dup cum sunt exprimate n coeficieni sau
n procente.
r r
ni* = 1 sau ni*% = 100
i =1 i =1
Frecvenele cumulate.
Sunt de dou tipuri: cumulate cresctor i cumulate descresctor.
Frecvena absolut cumulat cresctor a unei grupe este egal cu numrul unitilor
care au valoarea variabilei mai mic (sau egal) cu limita superioar a grupei (mai exact ntre
x1inf i xisup ).
i
Fci = nk
k =1
Frecvena absolut cumulat cresctor a ultimei grupe este egal cu volumul colectivitii (cu
n).
Frecvena absolut cumulat descresctor a unei grupe este egal cu numrul
unitilor pentru care valoarea caracteristicii este mai mare (sau egal) cu limita inferioar a
Frecvena absolut cumulat descresctor a primei grupe este egal cu numrul total de uniti
statistice (cu n):
Asemntor se determin i frecvenele relative cumulate cresctor i descresctor,
conform relaiilor:
10
i r
Fci* = nk* , Fd i* = nk*
k =1 k =i
Exemplu 5
Pentrul datele din exemplul 4 (varianta I) s-au determinat: frecvenele absolute,
frecvenele relative, centrele de interval i frecvenele absolute cumulate:
unde: ni reprezint numrul unitilor care prezint valoarea xi a caracteristicii de grupare (se
mai numesc frecvene absolute);
Prin nsumarea frecvenelor grupelor (ni) se obine volumul total al colectivitii (n).
i pentru aceast serie se determin toate tipurile de frecvene prezentate anterior.
Exemplul 6
11
Pentrul situaia din exemplul 3 s-au determinat: frecvenele absolute, frecvenele relative,
i frecvenele absolute cumulate:
Exemplul 7
Pentrul clasificarea din exemplul 2 s-au determinat: frecvenele absolute, frecvenele
relative, i frecvenele absolute cumulate:
12
Distribuia de frecvene bidimensional
Variante sau centre de Variante sau centre de interval pt. variabila Y Total
interval pt. variabila X y1 y2 ... yj ... yp uniti
x1 n11 n12 ... n1j ... n1p n1.
x2 n21 n22 ... n2j ... n2p n2.
... ... ... ... ... ... ... ...
xi ni1 ni2 ... nij ... nip ni.
... ... ... ... ... ... ... ...
xr nr1 nr2 ... nrj ... nrp nr.
Total uniti n.1 n.2 ... n.j ... n.p n..
de valoarea caracteristicii Y;
r
n. j = nij este numrul de uniti statistice care au valoarea yj a caracteristicii Y, indiferent
i =1
de valoarea caracteristicii X;
r p r p
n.. = n = nij = ni. = n. j este volumul total al colectivitii.
i =1 j =1 i =1 j =1
Exersai n Excel
Nivelul profitului anual (mii RON) pentru 50 de firme productoare de mobil este:
62 90 91 93 95
82 99 102 105 110
89 123 133 145 164
97 65 72 76 79
114 84 86 87 89
63 91 92 94 96
83 101 104 107 113
119 132 134 146 174
64 69 74 77 98
84 85 86 88 102
13
S se sistematizeze datele pe 7 intervale egale de variaie i s se reprezinte grafic, folosind metodele
statistice implementate n Excel.
Se obin rezultatele:
Bin Frequency
Histogram
78 9 20
94 18 15
Frequency
110 12
10
126 4
5
142 3
158 2 0
78 94 110 126 142 158 174 More
Bin
174 2
Cumulative %
120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
,00%
78 94 110 126 142 158 174
14
Testul de autoevaluare nr. 1.
15
3.2. Tabele statistice.
Tabelul statistic cuprinde una sau mai multe serii statistice, ai cror termeni sunt nscrii
ntr-o reea de linii i coloane.
Pentru ca un tabel statistic s fie corect elaborat i s-i ating scopul, trebuie s
conin un set de elemente obligatorii sau opionale i s respecte unele reguli:
- titlul tabelului este un element obligatoriu plasat naintea tabelului, care descrie clar i
concis coninutul datelor pe care le cuprinde;
- macheta tabelului este o reea de linii ce alctuiesc rubricile tabelului;
- subiectul tabelului este format din populaia la care se refer datele nscrise n tabel;
- predicatul tabelului este format din sistemul de indicatori redai n tabel;
- rubricile tabelului sunt spaiile create la ntretierea liniilor orizontale cu cele verticale,
n care sunt nscrise datele;
- datele statistice nscrise n tabel pot fi sub form numeric sau textual;
- unitatea de msur trebuie precizat pentru fiecare din indicatorii nscrii n tabel; dac
toi sunt exprimai n aceeai unitate de msur, atunci aceasta se poate trece deasupra
tabelului;
- sursa datelor;
- numrul tabelului este necesar mai ales atunci cnd se folosesc mai multe tabele,
pentru identificarea lor;
- note explicative, metodologice
16
- grafice cu ajutorul hrior sau al altor figuri naturale sau simbolice.
Pentru ca un grafic s-i ating scopul pentru care a fost proiectat, el trebuie s fie
corect ntocmit, s respecte anumite reguli generale, s cuprind o serie de elemente
obligatorii sau opionale i anume:
titlul graficului;
sistemul de coordonate;
scara de reprezentare;
reeaua graficului;
legenda;
note explicative, sursa datelor etc.
1. Histograma:
Histograma conine o succesiune de dreptunghiuri, cu bazele corespunztoare lungimii
in-tervalelor i nlimile egale cu numrul de observaii din fiecare interval (sau cu ponderea
lor). Dac intervalele au mrime egal, atunci i coloanele vor avea lime egal.
Permite vizualizarea distribuiei de frecvene absolute sau relative, dup o variabil
numeric continu (pe intervale).
2. Poligonul frecvenelor:
Poligonul frecvenelor este i el utilizat pentru reprezentarea grafic a distribuiilor de
frecvene absolute sau relative, atunci cnd sistematizarea datelor s-a fcut dup o
caracteristic numeric continu sau discontinu. Pentru construirea lui, din fiecare valoare a
caracteristicii sau din fiecare centru de interval se ridic cte o perpendicular i se marcheaz
pe ea punctul aflat la o distan egal cu frecvena variantei sau intervalului respectiv. Unind
toate punctele astfel gsite rezult un poligon numit poligonul frecvenelor.
Poligonul frecvenelor se poate suprapune peste histogram n cadrul aceluiai grafic,
sau se poate trasa ntr-un grafic separat.
17
frecvene pe intervale de variaie sau pe variante. Ele se traseaz att pentru distribuii de
frecvene absolute, ct i pentru distribuii de frecvene relative.
n cazul distribuiilor de frecvene dup o variabil continu:
- reprezentarea grafic a frecvenelor cumulate cresctor: pe axa Ox se reprezint
limitele superioare ale intervalelor, iar pe axa Oy frecvenele cumulate cresctor;
prin unirea punctelor astfel obinute se traseaz o curb ascendent.
- reprezentarea grafic a frecvenelor cumulate descresctor: pe axa Ox se reprezint
limitele inferioare ale intervalelor, iar pe axa Oy frecvenele cumulate descresctor;
prin unirea punctelor astfel obinute se traseaz o curb descendent.
n cazul distribuiilor de frecvene dup o variabil discret reprezentarea grafic a
frecvenelor cumulate cresctor va avea, de aceast dat, aspectul unei scri, pentru c nici o
unitate statistic nu poate avea valoarea caracteristicii situat ntre variantele stabilite
Exemplul 8
Pentru distribuia de frecvene din exemplul 4, obinut dup o variabil continu,
histograma, poligonul frecvenelor i curbele frecvenelor cumulate se prezint astfel:
12 12
10 10
Nr. magazine
8
Nr. magazine (ni)
6
6
4
4
2
2
0
5,0-6,0 6,0-7,0 7,0-8,0 8,0-9,0 9,0- 10,0- 11,0- 0
3 4 5 6 7 8 9 10 11 12 13
10,0 11,0 12,0
Valoarea facturilor (mii lei)
mii RON
Din graficele realizate reiese c distribuia magazinelor dup valoarea facturilor emise
este o distribuie cu tendin de normalitate.
18
Curbele cumulative ale frecventelor
60
50
fre c v e n te c u m u la te
40
30
20
10
0
5.0 6.0 7.0 8.0 9.0 10.0 11.0 12.0
mii RON
Exemplul 9
Pentru distribuia de frecvene din exemplul 3, obinut dup o variabil discret,
poligonul frecvenelor i graficul frecvenelor cumulate cresctor se prezint astfel:
25
10
20
Frecvente cumulate
8
n r. fam ilii
6 15
4 10
2 5
0 0
0 1 2 3 4 5 0 1 2 3 4 5
nr. copii Nr. copii
19
sunt rsturnate cu 90% (i au baza situat pe axa vertical) atunci reprezentarea grafic este o
diagram prin benzi, cu axele inversate fa de diagrama prin coloane.
Exemplul 10
Pentru distribuia de frecvene din exemplul 1, obinut dup o variabil calitativ,
diagrama prin coloane i cea prin benzi se prezint astfel:
100 Manag.
D o m e n iu
80
Finane
P e rs o a n e
60
40 Market.
20
Contab.
0
Contabilitate Marketing Finane Management Altele
ec. 0 20 40 60 80 100
Domeniul Persoane
5. Diagrama de structur.
Exemplul 11
Pentru distribuiile de frecvene din exemplele 1 i 4, diagrama de structur se prezint
astfel:
20
Structura magazinelor dupa valoarea facturilor
Structura absolvenilor dup domeniul de ocupare emise zilnic
5,0 6,0
11,0 12,0 8%
6,0 7,0
12% 8%
18%
18%
8,0 9,0
24% 18%
21
Vnzri Vnzri Vnzri
(mil) (mil) (mil)
30 30 30
20 20 20
10 10 10
14 13
13 12
12 11
11 10
10 0
ian. feb. mar. apr. mai Ani ian. feb. mar. apr. mai Ani ian. feb. mar. apr. mai Ani
d) e) f)
22
d) este incorect, deoarece axa Oy i are originea n 10, nu n 0, aa cum este cazul scalei de
raport;
e) este incorect, deoarece scrile de reprezentare nu au fost alese echilibrat pe cele 2 axe,
(graficul este prea extins pe orizontal, ceea ce duce la falsa aplatizare, alternare a variaiei
fenomenului);
f) este incorect deoarece pe axa Oy trebuie figurat o ntrerupere de scar (ntre 0 i 10).
Aadar, incorecte sunt graficele a), b), d), e), f).
5. Teme de control
23
6. Rezumatul Unitii de nvare
n acest capitol am nvat s supunem setul de date unor operaii de prezentare sistematic,
de organizare, de ordonare dup unul sau mai multe criterii, ntr-un cuvnt de sistematizare.
Includem aici operaiile de grpare/clasificare.
Gruparea / clasificarea datelor statistice presupune mprirea unitilor populaiei statistice
observate n grupe sau clase distincte omogene, dup unul sau mai multe criterii. Dac efectum
sistematizarea datelor dup o variabil nenumeric, spunem c efectum o clasificare, iar dac
sistematizm datele dup o variabil numeric, spunem c realizm o grupare.
Clasificarea datelor se poate face:
- pe variante (dac sunt puine variante)
- pe grupe de variante (n cazul existenei mai multor variante).
Gruparea dup o variabil numeric se poate face:
- pe variante (atunci cnd grupm datele dup o variabil discret sau cnd plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
- pe intervale de variaie (atunci cnd sistematizm datele dup o variabil continu,
care are o plaj larg de valori). Intervalele de variaie pot fi egale sau neegale.
Modalitile de prezentare i reprezentare a datelor statistice sunt:
- seriile statistice.
- tabelele statistice
- graficele statistice.
1. Anderson D., Sweeney D.,Williams T., Statistics for Business and Economics, Thomson
South Western, 2008
2. Ghi S. Statistic, Editura Meteor Press, Bucureti, 2006.
3. Isaic-Maniu Al., Mitru C., Voineagu V., Statistic, Editura Universitar, Bucureti, 2003;
4. ian, E.- Statistic. Teorie i aplicaii n sectorul teriar, Ed. Meteor Press, Bucureti,
5. Voineagu V., ian E., Ghi S., Boboc C., Todose D. Statistic. Baze teoretice i
aplicaii, Editura Economic, Bucureti, 2007;
24