Sunteți pe pagina 1din 20

Tema: Prelucrarea statistică a datelor

1. Noţiuni generale despre prelucrarea statistică


2. Centralizarea datelor statistice şi tipurile ei
3. Clasificarea şi gruparea datelor statistice. Tipuri de clasificări şi grupări statistice
4. Serii statistice
5. Tabele statistice
6. Reprezentări grafice
1. Noţiuni generale despre prelucrarea statistică
Datele statistice colectate sunt, de regulă, variate şi de volum mare, de aceea ele trebuie organizate
(sistematizate, centralizate, clasificate sau grupate) în scopul de a avea o formă care să permită prelucrarea
lor statistică ulterioară diversă.
Prin prelucrarea datelor observate se asigură trecerea de la datele individuale la date şi informaţii care
permit caracterizarea întregii colectivităţi cercetate.
Numai în urma prelucrării statistice pot fi evidenţiate trăsăturile şi tendinţele esenţiale din evoluţia
fenomenelor şi proceselor economico-sociale. Prin prelucrare statistică se elimină ceea ce este întâmplător
şi neesenţial în producerea şi manifestarea acestor fenomene studiate.
În sens larg, prelucrarea datelor unei observări statistice cuprinde:
 centralizarea, clasificarea şi gruparea datelor statistice;
 calcularea sistemului de indicatori statistici cu care se caracterizează colectivitatea cercetată;
 prezentarea rezultatelor prelucrării sub formă de serii, tabele şi grafice statistice.

1
2. Centralizarea datelor statistice şi tipurile ei

Centralizarea datelor, în sensul cel mai larg, constă în strângerea la locul prelucrării a tuturor
informaţiilor (formularelor) şi în determinarea indicatorilor totalizatori pentru toate caracteristicile
însumabile direct.
Indicatorii totalizatori obţinuţi în urma centralizării au un conţinut concret şi o formă concretă de
exprimare, motiv pentru care sunt denumiţi şi indicatori absoluţi. Ei constituie baza informaţională a
cunoaşterii statistice.
Centralizarea datelor statistice poate fi simplă şi pe grupe.
Centralizarea simplă înseamnă agregarea valorilor individuale ale caracteristicilor pentru toate
unităţile colectivităţii care permit însumarea din punctul de vedere al conţinutului.
În urma centralizării simple se obţin informaţii privind volumul unităţilor (simple sau complexe) care
compun colectivitatea statistică şi valoarea totalizată a caracteristicilor care au fost cuprinse în programul
observării.
Centralizarea pe grupe presupune o prealabilă grupare a datelor şi calcularea indicatorilor totalizatori
parţiali, pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori generali, pe întreaga colectivitate. Deci,
centralizarea pe grupe include centralizarea simplă.
De exemplu, populaţia înregistrată la recensământul din 2014 a fost grupată pe raioane şi s-a calculat
numărul total al populaţiei din fiecare cele 32 raioane, inclusiv din municipiul Chişinău, Bender şi din
Găgăuzia. Centralizând totalul populaţiei din toate aceste localităţi se obţine numărul populaţiei în
ansamblul pe Republică.
Centralizarea pe grupe permite cunoaşterea şi caracterizarea structurii colectivităţii statistice, a
mutaţiilor structurale intervenite în timp, a corelaţiilor dintre părţile componente ale colectivităţii.

3. Clasificarea şi gruparea datelor statistice. Tipuri de clasificări şi grupări statistice

Clasificarea şi gruparea datelor statistice sunt operaţii care permit ordonarea materialului statistic,
prin restrângerea volumului mare de date iniţiale și repartizarea unităţilor colectivităţii cu trăsături comune
în clase/grupe omogene.
Prin clasificare şi grupare, datele observării sunt sistematizate în funcţie de variaţia uneia sau mai
multor caracteristici.
TIPURI DE CLASIFICĂRI:
1. CLASIFICAREA NATURALĂ sau CLASIFICAREA CONVENŢIONALĂ
Clasificarea naturală – se recurge la un criteriu obiectiv, care pune în evidenţă caracteristicile
esenţiale ale obiectului din domeniul de clasificat. (Ex. clasificarea elementelor chimice după masa lor
atomică);

2
Clasificarea convenţională (sau artificială) – se recurge la un criteriu ales în mod artificial a cărei
utilitate rezultă din ordonarea pragmatică a domeniului în funcţie de nevoi. (Ex. clasificarea cărţilor într-o
bibliotecă).
2. CLASIFICAREA CARDINALĂ sau CLASIFICAREA ORDINALĂ
Clasificarea cardinală – elementele sunt împărţite cantitativ în clase, fără a se urmări o relaţie
calitativă între ele. (Ex. împărţirea cetăţenilor unei ţări în funcţie de partidul pe care l-au votat.)
Clasificarea ordinală – obiectele repartizate într-o clasă nu numai că sunt măsurate, dar sunt totodată
ordonate de la superior la inferior (se stabileşte un raport ierarhic). (Ex. gruparea unor sportivi în funcţie de
performanţele lor).
3. CLASIFICAREA DIHOTOMICĂ sau CLASIFICAREA POLITOMICĂ
Clasificarea dihotomică – elementele domeniului clasificării sunt împărţite numai în două clase.
Ex. Subdivizarea domeniului statisticii în două arii: statistica descriptivă şi statistica inferenţială.
Clasificarea politomică – elementele domeniului clasificării sunt distribuite în mai mult de două
clase.
Ex. Clasificarea statisticii pe domenii şi activităţi: statistica poulaţiei, statistica forţei de muncă,
statistica nivelului de trai al populaţiei, statistica comerţului exterior, statistica balanţei de plăţi externe,
statistica turismului etc.
4. CLASIFICAREA STRUCTURALĂ sau CLASIFICAREA ISTORICĂ
Clasificarea structurală – nu ia în considerare geneza (originea) elementelor domeniului/universului
clasificării. (Ex. clasificarea elementelor chimice).
Clasificarea istorică – elementele sunt clasificate în funcţie de momentul apariţiei lor (intervine
factorul istoric). (Ex. elementele chimice sunt ordonate în funcţie de momentul apariţiei lor de la Big Bang
(marea explozie)).
Deci, în cadrul operaţiei de clasificare se disting:
 obiectele (unităţile) de clasificat;
 criteriul (criteriile) după care se efectuează clasificarea;
 clasele rezultate din operaţii de clasificare.
Statistica naţională utilizează un sistem standardizat de clasificări şi nomenclatoare economico-sociale.
Acesta cuprinde:
 clasificarea activităţilor din economia naţională: agricultură, industrie, construcţii, comerţ , transport
etc.;
 clasificarea unitară a produselor şi serviciilor;
 clasificarea ocupaţiilor: profesii, funcţii, meserii;
 clasificarea mijloacelor fixe;
 nomenclatorul unitar al indicatorilor economico-sociali;

3
 sistemul informatic registru al unităţilor administrativ-teritoriale etc.

Gruparea statistică este metodă de bază a prelucrării statistice, prin care se realizează sistematizarea
datelor individuale a fenomenelor de masă, în grupe omogene, după variaţia uneia sau a mai multor
caracteristici numerice.
Noţiunile de bază utilizate în gruparea statistică:
1. caracteristica de grupare,
2. variaţie,
3. amplitudinea variaţiei,
4. grupa omogenă,
5. intervalul de variaţie.
Caracteristica de grupare este acea însuşire (proprietate) în funcţie de care unităţile statistice se
separă pe grupe omogene.
Variaţia reprezintă proprietatea caracteristicilor statistice de a înregistra mai multe valori
(numerice) sau mai multe forme de manifestare (în cazul caracteristicilor calitative).

4
Amplitudinea variaţiei reprezintă câmpul de împrăştiere a tuturor valorilor individuale ale unei
caracteristici în cadrul unei observări statistice. Ea se determină ca diferenţă dintre valoarea maximală şi
minimală a caracteristicii.
Grupa omogenă înseamnă, din punct de vedere statistic, clasă de unităţi la care variaţia este minimă.
Intervalul de variaţie reprezintă un grup omogen de valori despărţite de restul colectivităţii statistice prin
cele două limite ale intervalului: limită inferioară şi limită superioară.
Se desting următoarele intervale de variaţie:
 intervale de variaţie egale şi neegale;
 intervale de variaţie închise şi deschise;
 intervale cu variaţie continuă şi discretă.
Demersul unei grupări statistice a colectivităţii după o variabilă numerică:

1. Se stabileşte amplitudinea de variaţie (A):


A  xmax  xmin
2. Se stabileşte lungimea sau mărimea intervalului de variaţie (h) în două variante:

A
h
a) când numărul de grupe (r) se cunoaşte: r
Atunci când câtul împărţirii nu este un număr întreg se rotunjeşte în plus (se rotungeşte până la maximum
pentru a avea un număr înterg) pentru a nu rămâne valori în afara ultimului interval de grupare.
b) când numărul de grupe (r) nu se cunoaşte se utilizează formula propusă de H.A.Sturges:

unde: n – numărul total de unităţi în colectivitatea analizată


3. Se formează intervalele de variaţie, pornind de la valoarea
minimă a caracteristicii (fiind limita inferioară) la care se adaugă mărimea intervalului de variaţie,
obţinându-se limita superioară a primului interval.

Criteriile de claificare a grupărilor statistice :


1. În funcţie de numărul caracteristicilor utilizate, grupările pot fi:
 grupări simple, cele ce sunt realizate după o singură caracteristică de grupare.
 grupări combinate, ce vizează simultan două sau mai multe caracteristici de grupare.
Gruparea se realizează etapizat: se alege o primă caracteristică după care se efectuează gruparea
unităţilor colectivităţii şi fiecare grupă astfel obţinută se împarte la rândul ei în subgrupe după variaţia celei
de a doua caracteristici, apoi se repetă procedeul pentru cea de a treia caracteristică de grupare ş.a.m.d.
5
Gruparea combinată după două caracteristici de grupare:

2. În funcţie de conţinutul caracteristicii de grupare, se desting:


 grupări cronologice, ce se referă la variaţia în timp a fenomenului analizat. În funcţie de scopul
analizei, mărimea unităţii de timp utilizate în grupare diferă: zi, lună, trimestru, semestru, an etc.
 grupări teritoriale, ce oglindesc variaţia în spaţiu a unităţilor colectivităţii. De regulă, aceste grupări
corespund unităţilor teritorial-administrative (oraşe, raioane, judeţe, zone geografice, ţări, grupe de
ţări etc).
 grupari după o caracteristică atributivă
3. În funcţie de modul de exprimare a caracteristicilor atributive, se desting:
 Grupări după caracteristici atributive exprimate prin cuvinte (numite clasificări statistice)

6
 Grupări după caracteristici atributive exprimate numeric (numite grupări cantitative)
4. În funcţie de numărul valorilor sau variantelor caracteristicii de grupare, se desting:
 grupări pe variante, ce sunt aplicate în cazurile în care numărul valorilor numerice înregistrate
pentru caracteristica de grupare este redus, fiecare valoare înregistrată va şi constitui o grupă
distinctă (de exemplu, gruparea familiilor din municipiul Chişinău după numărul persoanelor).
Gruparea după o caracteristică calitativă este întotdeauna o grupare pe variante.
 grupări pe intervale, se folosesc în cazurile în care gradul de variaţie al caracteristicii este mare,
deci când gruparea pe variante conduce la obţinerea unui număr prea mare de grupe (de exemplu,
gruparea salariaţilor după mărimea veniturilor).

4. Serii statistice
Seria statistică este prezentarea paralelă a două şiruri de date, între care există o corespondenţă.
Primul şir arată variaţia caracteristicii de grupare, exprimată prin: valori, variante, intervale de variaţie. Al
doilea şir reflectă frecvenţele de apariţie a acestor valorilor, variante sau intervale de variaţie, pe de altă
parte al doilea şir poate prezenta şi valorile unei alte caracteristici cu care se află în raport de
interdependenţă.
Prezentarea generală a seriei statistice cu o singură caracteristică:

Seriile statistice pot fi formate din mărimi absolute sau mărimi derivate.
Clasificarea seriilor statistice:
1. În funcţie de posibilitatea de caracterizare a fenomenelor (sau în funcţie de numărul caracteristicilor
studiate), se desting:
 serii statistice independente (unidimensionale)
 serii statistice interdependente (bidimensionale sau multidimensionale)
2. În funcţie de conţinutul caracteristicilor de grupare, se desting:
 Serii descriptive (enumerative) se prezintă ca liste ce cuprind unităţile statistice şi valorile
corespunzătoare acestora (de exemplu: prezentarea listei candidaţilor admişi inclusiv facultatea,
media de liceu, media examenelor la BAC şi şcoala absolvită; prezentarea listei profesorilor
catedrei şi a numărului de lucrări publicate etc.)
 Serii de timp (cronologice sau dinamice) reprezintă un şir sistematizat de valori numerice ale unei
caracteristici statistice realizate în momente sau intervale de timp succesive, astfel reflectând
evoluţia acesteia.
Prezentarea generală a seriilor cronologice:

7
 Serii de spaţiu (teritoriale) prezintă repartiţia unităţilor colectivităţii după caracteristici teritorial-
administrative.

 Serii de repartiţii sau de distribuţii prezintă repartiţia unităţilor colectivităţii după caracteristici
numerice (cantitative). Astfel pot fi serii de repartiţii de frecvenţe pe variante sau pe intervale de
variaţie.

8
5. Tabele statistice
Tabelul statistic reprezintă una dintre cele mai adecvate modalităţi de prezentare ordonată a datelor
statistice rezultate dintr-o observare sau prelucrare statistică.
Tabelul statistic este format dintr-o reţea de linii paralele orizontale şi verticale în care sunt încadrate
datele statistice (exprimate prin cuvinte sau numere).
Tabelul statistic este elaborat cu dublu scop:
 pentru sistematizarea datelor în vederea prelucrării şi obţinerii indicatorilor sintetici;
 pentru prezentarea rezultatelor prelucrării primare şi derivate.
Elementele constructive şi obligatorii ale unui tabel statisic sunt:
 numerotarea tabelului;
 titlul tabelului;

9
 macheta tabelului, care cuprinde totalitatea liniilor orizontale şi verticale a căror intersecţie conduce
la formarea rubricilor, în care se înscriu datele numerice sau denumirile textuale pentru subiectul şi
predicatul tabelului;
 subiectul tabelului se înscrie în capetele rândurilor şi îl poate reprezinta colectivitatea şi părţile sale
componente;
 predicatul tabelului se înscrie în capetele coloanelor şi îl poate reprezenta sistemul de caracteristici
statistice;
 conţinutul tabelului reprezintă totalitatea informaţiilor trecute în rubrici (toate rubricile se
completează, iar când acestea nu se cunosc, se completează prin trei puncte (…), iar când nu există
date pentru elementele cuprinse în tabel, rubricile se completează printr-o linie orizontală (-));
 unitatea de măsură se înscrie distinct pentru fiecare caracteristică în coloana respectivă. Dacă este
comună tuturor datelor se trece deasupra tabelului, în dreapta;
 sursa datelor indică provenienţa exactă a datelor şi
se trece imediat sub tabel;
 notă explicativă este utilizată atunci când este necesar să se clarifice unele abordări metodologice
sau noţiuni mai puţin cunoscute. Ea se plasează fie imediat sub sursa datelor, fie în subsolul paginii
pe care se află tabelul.
Tabelul statistic cuprinde elemnte de conţinut (subiectul şi predicatul tabelului) şi elemente de formă
(restul elementelor constructive ale tabelului statistic).
Clasificarea tabelelor statistice:
 tabele descriptive sunt utilizate pentru înregistrarea şi prezentarea datelor primare, obţinute la etapa
culegerii datelor.
Ex: Notele obţinute de către studenţii anului întâi la o lucrare de control

 tabele simple sunt întocmite pe baza rezultatelor centralizării simple a datelor statistice şi prezintă
repartiţia unei colectivităţi după o singură caracteristică. Ele prezintă indicatori statistici ordonaţi din
punct de vedere cronologic, teritorial sau organizatoric.
Ex: Distribuţia studenţilor după nota obţinută la o lucrare de control

10
 tabele pe grupe prezintă rezultatele unei grupări simple, unde colectivitatea este prezentată pe grupe
după o singură caracteristică.

 tabele combinate reflectă o grupare a datelor după cel puţin două caracteristici.
Ex: Situaţia şomerilor înregistraţi, pe categorii de personal şi sex, la sfârşitul lunii ianuarie 2014

11
 tabele cu dublă intrare este o variantă a tabelelor combinate care prezintă variaţia simultană a
colectivităţii după două caracteristici: una cauzală (factor de influenţă) şi cealaltă rezultativă
(dependentă). Acest tabel este util pentru analiza legăturilor dintre variabile – numindu-se şi tabel
de corelaţie.
Ex: Distribuţia elevilor unei şcoli generale după vârstă şi înălţime

 tabele de asociere sunt utilizate penrtu a prezenta şi caracteriza legătura dintre două variabile
alternative.
Ex: Populaţia masculină şi feminină pe medii la 1 iulie 2017

6. Reprezentări grafice
12
Reprezentările grafice – constituie o modalitate extrem de expresivă pentru prezentarea datelor
statistice prin intermediul figurilor geometrice sau figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin diferite mijloace plastice de
reprezentare scoate în evidenţă a tot ceea ce este caracteristic şi esenţial în nivelul şi evoluţia fenomenelor,
în schimbările structurale, în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi natură
sau calitativ diferite.
Principiul de bază al unei reprezentări grafice a unei serii statistice îl constituie proporţionalitatea.
Elementele constitutive ale unui grafic statistic sunt:
 numerotarea graficului;
 titlul graficului;
 sistemul axelor de coordonate;
 reţeaua graficului (este formată din sistemul de linii paralele (verticale şi orizontale) care ghidează
amplasarea pe grafic a mărimilor reprezentate, dacă se utilizează sistemul de coordonate
rectangulare. În cazul folosirii coordonatelor polare, reţeaua este formată din cercuri concentrice
trasate explicit sau subânţelese);
 scara de reprezentare;
 legenda graficului;
 sursa datelor;
 notele explicative.
Tipuri de grafice:
1. Grafice (sau diagrame) prin coloane - permit o vizualizare rapidă a diferenţelor de mărime dintre
indicatori sau a evoluţiei lor în timp. Mărimile indicatorilor prezentaţi sunt reflectate prin coloane cu baze
egale şi înălţimea proporţională cu nivelul indicatorilor. Coloanele pot fi simple (cu distanţe egale între ele),
grupate, stratificate (cu subdiviziuni) şi orientate în dublu sens (pozitiv, negativ). Deasupra fiecărei coloane
se trece mărimea reprezentată.
Grafice (diagrame) prin coloane simple:

Grafice (diagrame) prin coloane grupate:

13
Grafice (diagrame) prin coloane stratificate:

Grafice (diagrame) prin coloane orientate în dublu sens:

2. Grafice prin benzi - sunt asemănătoare celor precedente, cu diferenţa că nivelul indicatorilor este
reprezentat prin benzi orizontale de lăţime egală şi de lungime proporţională cu mărimea acestora. Benzile
sunt egal distanţate.

14
Aceste grafice sunt folosite când termenii seriei exprimă lungimi, sau pentru indicatorii
eterogeni cu variaţii foarte mari.

15
3. Graficele (sau diagrame) prin figuri geometrice sunt utilizate pentru a reda fie mărimea (diagramele de
volum sau de suprafaţă), fie structura colectivităţii (diagramele de structură).
Figurile geometrice pot fi:
- de suprafaţă (cerc, pătrat, dreptunghi, triunghi etc.)
- de volum (cilinndrul, con, piramida, paralepipedul etc.) denumite stereograme.
Astfel, pot fi construite grafice de suprafaţă (suprafaţa figurilor geometrice este proporţională cu mărimea
caracteristicii) şi grafice (sau diagrame) de structură (utilizate pentru evidenţierea structurii colectivităţii şi
a modificărilor structurale).
Grafice (diagrame) de suprafață:

Grafice (diagrame) de structură:

16
Diagrama de structură inelară:

17
4. Diagramele seriilor cronologice:
1. Diagrame prin coloane (vezi exemple de mai sus)
2. Cronograme

3. Diagrame radiale
(sau polare)

6. Diagramele seriilor de repartiţie de frecvenţe:


a) Pentru serii de repartiţii de frecvenţe unidimensionale pe intervale:
 Histograma:
18
 Poligonul frecvenţelor absolute şi relative:

 Curbele frecvenţelor absolute cumulative:

19
b) Pentru serii de repartiţii de frecvenţe bidimensionale (corelograma /graficul de corelaţie / diagrama
norului de puncte):

20

S-ar putea să vă placă și