Sunteți pe pagina 1din 37

Capitolul 3.

Sistematizarea, gruparea și
prezentarea datelor statistice.
3.1. Sistematizarea datelor statistice
(gruparea/clasificarea).
3.2. Modalități de prezentare și reprezentare a
datelor statistice.
3.2.1. Serii statistice.
3.2.2. Tabele statistice.
3.2.3. Grafice statistice.
PRELUCRAREA DATELOR STATISTICE
(A doua etapă a cercetării statistice)
1. Centralizarea si sistematizarea datelor culese;
2. Calculul sistemului de indicatori statistici de caracterizare numerică a
fenomenelor și proceselor studiate;
3. Prezentarea rezultatelor prelucrării sub formă de serii, tabele și grafice.

Prelucrarea statistică are două obiective:


1. Prelucrarea primară sau sistematizarea datelor primare, care se realizează cu
ajutorul metodei grupării statistice și a metodei centralizării datelor. Rezultatul
fiind obținerea indicatorilor primari (totalizatori).
2. Prelucrarea de bază, care se realizează prin calculul indicatorilor derivați
(indicatori medii, ai variației, și asimetriei, indicatori relativi, etc.).
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).

Materialul statistic obținut în etapa de culegere a datelor, după


verificarea și eliminarea eventualelor erori de înregistrare este supus
prelucrării statistice.
Sistematizarea datelor statistice presupune ordonarea acestora în funcție de
omogenitatea lor.
Sistematizarea datelor se realizează prin gruparea și clasificarea datelor
statistice, prin împărțirea lor în grupe/slase omogene, după unul sau mai multe
criterii de grupare/clasificare.
Condiții în realizarea unei grupări/clasificări:
1.Completitudinea se referă la cerinţa ca toate unităţile statistice să fie incluse în clasele
formate în urma clasificării;
2.Omogenitatea reprezintă condiţia de a include într-o clasă numai elemente de acelaşi tip;
3.Unicitatea clasificării impune ca fiecare element să aparţină unei singure clase;
CENTRALIZAREA DATELOR STATISTICE

SCOP: - obținerea de INDICATORI TOTALIZATORI ABSOLUȚI (cu conținut


concret și formă concretă de exprimare )

SIMPLĂ – informații privind:


.volumul unităților ce compun colectivitatea;
.valoarea totalizată a caracteristicilor
cuprinse în observare.

CENTRALIZAREA

PE GRUPE – gruparea datelor și calculul indicatorilor


parțiali, pe grupe și, pe baza lor, indicatori
sintetici pe întreaga colectivitate
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
GRUPAREA STATISTICA

--- separarea unităţilor colectivităţii în subansambluri


omogene, după o caracteristică de grupare
-Variabile calitative  clasificate pe variante
-Variabile cantitative
 grupate pe variante (când sunt puţine valori distincte)
 grupate pe intervale de variaţie egale (A moderat,
variaţie uniformă)
 grupate pe intervale de variaţie neegale (A mare,
variaţie neuniformă).
Amplitudinea variației:
A=Xmax – Xmin
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
CLASIFICAREA PE VARIANTE

Sistematizarea datelor efectuată după o variabilă calitativă este


numită clasificare.
Se prezintă în două variante:
1. caracteristică exprimată prin cuvinte: gruparea producţiei pe
ramuri economice (industrie, agricultură), gruparea
salariaţilor unei unităţi economice pe categorii de personal
(manageri, specialiști, lucrători), gruparea investițiilor la
întreprinderi pe forme de proprietate (publică, privată,
străină, a întreprinderilor mixte) etc.
2. caracteristică exprimată numeric: gruparea societăţilor
comerciale după venitul din vânzări, gruparea familiilor după
numărul de copii etc.
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
CLASIFICAREA PE VARIANTE

Exemplu 1. Distribuţia studenților facultăţii Științe Economice specialitatea Finanțe


și Bănci după gen este :
Sex(xi) Numărul de studenți (ni)

Feminin  

Masculin  

Exemplul 2. Distribuţia studenţilor unei grupe după calificativul obţinut la un


proiect este:
Calificativ(xi) Număr de student(ni)

Insuficient 3

Satisfăcător 4

Bine 15
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
CLASIFICAREA PE VARIANTE
Exemplul 3 . Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0,
1, 2, 1, 3, 2, 2, 0, 2, 1, 3,1, 2, 4, 2. Să se realiezeze o sistematizare a datelor.

Număr de copii (xi) Număr de copii (xi)

0 3

1 5

2 8

3 3

4 1

Total 20
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
GRUPAREA PE INTERVALE EGALE DE VARIAȚIE

1. Amplitudinea variaţiei: A=Xmax-Xmin


2. Nr. de grupe k:
a. Ales după mărimea colectivităţii, scopul analizei; în
general: 5-20 grupe
b. Calculat (formula Sturges): k=1+3.322 lg n,
unde n=volumul colectivităţii.
2. Mărimea unui interval de grupare:
h = A/k (rotunjire în plus !).
3. Definirea intervalelor (pornind de la Xmin şi adunând repetat h
până se ajunge la Xmax):
xmin - xmin+h ; xmin+h - xmin+2h ; xmin+2h – xmin+3h etc.
4. Numărarea unităţilor care aparţin fiecărui interval (frecvenţe
absolute).
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
GRUPAREA PE INTERVALE EGALE DE VARIAȚIE

Ex. Gruparea salariaţilor unei firme după vârstă


Vârsta: 22, 25, 29, 30, 30, 31, 32, 34, 45, 61. k=4
1.Amplitudinea variației
Grupe după Număr de
A=61-22=39 vârstă* persoane
2.Nr. grupe ales (ani) (frecvenţă
k=4 absolută)
3.Mărimea intervalului de 22-32 6
grupare
32-42 2
h=A/k=9.75≈10
42-52 1
4.Intervalele de variație
(col.1) și frecvențele 52-62 1
absolute (col.2) Total 10
*Limita inferioară inclusă în interval
3.1. Sistematizarea datelor statistice (gruparea/clasificarea).
GRUPAREA PE INTERVALE NEEGALE DE VARIAȚIE

Gruparea pe intervale neegale de variaţie: când A este


mare şi variaţia neuniformă.
Ex. Firme de construcţii pe clase de mărime, după nr.de
salariaţi, în 2016
Clasa de mărime Nr de firme

(persoane)

0-9 24799

10-49 4211

50-249 1194

250 şi peste 168

Total 30372

Sursa: Anuarul statistic al R. Moldova, 2016


GRUPAREA STATISTICA

Definiție: împărțirea unităților colectivității în clase


omogene, după variația uneia sau mai multor
caracteristici.

Serveste pentru cunoasterea:


a) Structurii colectivitatii si a modificarilor intervenite in
timp
b) Interdependentelor si legaturilor dintre fenomene
c) Tendintelor de variatie in timp si in spatiu
I. Dupa numarul caracteristicilor folosite:
- grupari simple ( o singura caracteristica )
- grupari combinate ( cel putin doua caracteristici )
II. Dupa continutul caracteristicii:
- grupari cronologice ( caracteristica de timp )
- grupari teritoriale ( caracteristica de spatiu )
- grupari atributive ( ex. varsta, profesia, starea civila, etc. )
- pe variante-nr.redus de caracteristici-( gruparea
locuintelor dupa nr. de camere )
- pe intervale de grupare, egale sau diferite
III. Dupa forma de exprimare a caracteristicilor atributive:
- exprimate in cuvinte (grupari calitative)
- exprimate numeric (grupari cantitative)
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Serii statistice.

SERII STATISTICE - şiruri de date ordonate rezultate din grupare.


1.1. Serii cronologice (de timp) : prezintă valorile unei caracteristici în
unităţi de timp succesive.
Exemplu. Producţia lunară a unui bun în
20Luna
11 Mar Apr Mai Jun Jul Aug Sept ...

Producţia (mii Euro) 35 51 60 59 62 63 63 ...

1.2.Serii teritoriale: prezintă variaţia în spaţiu a valorilor unei caracteristici


statistice.
Exemplu. Vânzarea automobilelor pe regiuni în 2019
Regiunea Nord Sud Est Vest Total

Nr. automobile 860 750 300 90 2000


3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Serii statistice.

Serii (distribuţii) de frecvenţe


- rezultă din gruparea datelor în funcţie de o variabilă:
-cantitativă (ex.distribuţia salariaţilor după venit) sau
-calitativă (ex. distribuţia salariaţilor după profesie).
- sunt formate din două şiruri corelate:
1. variantele/ intervalele de variaţie
2. frecvenţele (absolute/relative).
Frecvenţele absolute ni = numărul de observaţii incluse
într-un interval de variaţie.
Frecvenţele relative ni* = ponderea frecvenţelor absolute
corespunzătoare grupelor în total (în suma tuturor
frecvenţelor).
ni
ni 
*

 ni
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Serii statistice.

Distribuţii de frecvenţe absolute şi relative.


Exemplu: distribuţia muncitorilor după salariu
Salariu
765-810 810-855 855-900 900-945 945-990 Total
(EURO)
Număr de
7 14 7 5 3 40
muncitori (ni)

Ponderea
17,5 35,0 17,5 12,5 7,5 100
muncitorilor (n*i%)

Frecvențele absolute: 1. Cumulate crescător;


2. Cumulate descrescător
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Tabele statistice.

Toate seriile statice sunt prezentate în tabele.


Elemente:
titlul general, titlurile interne, unităţile de măsură a
datelor, sursa datelor, note explicative.
Tipuri:
– Tabele simple – pentru date grupate după o singură
variabilă
– Tabele bidimensionale (cu dublă intrare) - pentru date
grupate după două variabile simultan.
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Tabele statistice.

Distribuţia salariaţilor după vechimea în muncă şi salariu

Vechimea Salariu (euro) Total


în muncă după
(ani) 720-765 765-810 810-855 855-900 900-945 945-990 vechim
e

2-8 4 2 - - - - 6

8-14 - 2 3 - - 5

14-20 - 3 5 - - - 8

20-26 - - 5 5 4 - 14

26-32 - - 1 1 1 1 4

32-38 - - - 1 - 2 3

Total după
4 7 14 7 5 3 40
salariu
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Evidenţiază într-o formă sugestivă


distribuţia valorilor, tendiţele de evoluţie,
legăturile dintre variabile sau structura
colectivităţii.
Elemente: titlul, coordonatele (X şi Y), scara
de reprezentare, legenda, sursa datelor,
note explicative.
Fiecare punct al graficului este definit în
funcţie de coordonatele sale.
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Pictograma foloseşte simboluri pentru a reprezenta informaţia


statistică.
1. Variante: a) simboluri multiplicate
b) simboluri proportionale
2. Sugestive, uşor de înţeles, dar cu nivel mai redus de precizie
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Grafice prin coloane = valorile variabilei sunt reprezentate


grafic prin coloane cu baze egale şi înălţimea proporţională cu
mărimea variabilei.
Coloane simple – una pentru fiecare grupă
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Coloane multiple (grupate) –compară variabile diferite


pentru aceleaşi grupe.
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Coloane de structură - compară structura grupelor


3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.1. Grafice statistice.

Benzi: Simple
Grupate
De structură
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.
Piramida vârstelor
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.

Cercuri de structură
sectoarele cercului reprezintă proporţiile grupelor
colectivităţii
Etape:
1.Se calculează frecvenţa relativă a fiecărei
grupe.
2.Se înmulţesc frecvenţele cu 360 pentru a
obţine dimensiunile sectoarelor în grade.
3.Se delimitează sectoarele cercului şi se
colorează/haşurează diferit.
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.
Student response to the poll
'Should the college adopt student uniforms?’
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.

Grafice pentru distribuţii de frecvenţe


Histograma
- fiecare grupă e reprezentată printr-o coloană cu
suprafaţa proporţională cu frecvenţa absolută a
grupei respective
-atunci când caracteristica reprezentată grafic are
variaţie continuă, coloanele sunt lipite
-când variaţia e discretă, există spaţii între coloane
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.

Ex. Distribuția muncitorilor după producţia zilnică (histogramă)


3.2. Modalități de prezentare și reprezentare a datelor statistice.

3.2.3. Grafice statistice.


Poligonul frecvenţelor se obţine unind vârfurile coloanelor histogramei.
Ex. Distributia muncitorilor după producţia zilnică (histogramă şi poligonul
frecvenţelor)
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.
Curbele frecvenţelor cumulate (crescător/ descrescător)

 Frecvenţa cumulată crescător a unei grupe este numărul de unităţi


statistice cu valori sub limita superioară a intervalului de variaţie.
-> pentru reprezentarea grafică se folosesc limitele
superioare ale intervalelor de grupare.

Frecvenţa cumulată descrescător a unei grupe este numărul de unităţi


statistice cu valori peste limita inferioară a intervalului de variaţie.
-> pentru reprezentarea grafică se folosesc limitele
inferioare ale intervalelor de grupare.
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.

Productia (buc) Număr de muncitori Frecvenţe cumulate


(ni)
Crescător Descrescător

0 1 3 4
sub 120 10 10 200

120-140 18 28 190

140-160 23 51 172

160-180 38 89 149

180-200 51 140 111

200-220 40 180 60

220-240 15 195 20

240 şi peste 5 200 5

Total 200 - -
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.
Ex. Curbele frecvenţelor cumulate

225
200
175
nr. m unc ito r i

150
125
100
75
50
25
0
100 120 140 160 180 200 220 240 260
producţia (buc.)
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.

Selectarea tipului de grafic:


– cerc sau coloană de structură pentru descrierea
componentelor colectivităţii (structura)
– coloane/ benzi pentru compararea unor variabile
diferite pentru aceleaşi grupe, pt serii de timp şi
teritoriale
– cronograma pentru serii de timp
– corelogramă pentru evidenţierea legăturii dintre două
variabile
– histogramă, poligonul frecvenţelor şi curbele
frecvenţelor cumulate pentru distribuţii de frecvenţe
3.2. Modalități de prezentare și reprezentare a datelor statistice.
3.2.3. Grafice statistice.
SERII STATISTICE

SERII STATISTICE: - corespondenta intre


variantele (valorile) caracteristicii de grupare si frecventele de aparitie ale
acestora, sau variatia unei alte caracteristici cu care se coreleaza.
de intervale
T 1. serii statistice de timp (cronologice, dinamice)
I de momente
P 2. serii statistice de spatiu
U
R pe variante
I 3. de distributie egale
pe intervale de grupare
neegale
INDICATORII RELATIVI
∑∆i/i-1 = ∆1/0 + ∆2/1 + ……+ ∆i/i-1 + …… +∆n/n-1 = ∆n/0