Sunteți pe pagina 1din 6

Capitolul 3.

Sistematizarea,gruparea și prezentarea datelor


statistice.
1.1. Sistematizarea datelor statistice(gruparea /clasificarea).
1.2. Modalități de prezentare și reprezentare a datelor statistice.
1.2.1. Serii statistice.
1.2.2. Tabele statistice.
1.2.3. Grafice statistice.

Sistematizarea datelor statistice și prezentarea lor.


După ce datele statistice au fost colectate din surse de date publicate, din observări totale
sau din observări parţiale – ele trebuie organizate, în scopul de a avea o formă care să permită
prelucrarea lor statistică diversă.
Sistematizarea datelor se realizează prin gruparea şi clasificarea datelor statistice, adică
prin împărţirea lor în grupe/clase omogene, după unul sau mai multe criterii de
grupare/clasificare.
Sistematizarea datelor statistice presupune ordonarea acestora în funcție de omogenitatea
lor. Rezultatul sistematizării se prezintă într-o formă specială, prin serii, tabele și grafice.
Această operaţie face trecerea de la observarea statistică (în urma căreia s-au obţinut datele
necesare realizării obiectivelor investigaţiei statistice, verificate sub aspectul volumului şi
calităţii) şi prelucrarea propriu zisă.
O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se asemene cât mai mult
între ele din punctul de vedere al criteriului utilizat, adică dacă între unităţile din aceeaşi
grupă/clasă există variaţii cât mai mici, date de prezenţa factorilor aleatori, întâmplători.
Gruparea/clasificarea datelor statistice presupune împărţirea unităţilor populaţiei statistice
observate în grupe sau clase distincte omogene, după unul sau mai multe criterii.
Atunci când criteriul (caracteristica) după care se realizează această operaţie este unul
numeric, cantitativ, ea se numeşte grupare, iar când operaţia se realizează după un criteriu
(caracteristic) calitativ, nenumeric, ea se numeşte clasificare.
La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să îndeplinim următoarele
condiţii:
a) omogenitate (în sensul că unităţile statistice care au aceeaşi valoare sau valori
apropiate, asemănătoare, ale caracteristicii după care se efectuează sistematizarea vor fi incluse
în aceeaşi clasă; în felul acesta, se doreşte ca variaţia valorilor caracteristicii incluse în aceeaşi
grupă/clasă să fie cât mai mică);
b) unicitate (în sensul că o unitate statistică trebuie inclusă într-o singură clasă sau grupă,
ea nu se poate regăsi simultan în două sau mai multe clase/grupe);
c) completitudine (în sensul că toate unităţile statistice să fie incluse în grupe/clase, să nu
fie exclusă vreo unitate din operaţia de sistematizare).
Clasificarea datelor statistice
Sistematizarea datelor efectuată după o variabilă nenumerică se numeste clasificare. Ea
presupune împărţirea unităţilor în clasele/categoriile variabilei nenumerice considerate.
Se construiește un număr de clase egal cu numărul categoriilor existente, iar prin
numărarea unităţilor statistice incluse în fiecare clasă obţinem frecvenţa acelei clase (volumulei).
Unele clasificări au caracter oficial, altele au caracter neoficial.
Dacă datele sunt sistematizate după o variabilă categorială (nominală), ordinea claselor
este lasata la indemina cercetatorului.
Exemplu 1.
Distribuţia studenților facultăţii Științe Economice specialitatea Bussines și administrare
după sex este :
Sex(xi) Numărul de studenți (ni)
Feminin
Masculin
Exemplul 2. Distribuţia studenţilor unei grupe după calificativul obţinut la un proiect
este:
Calificativ(xi) Număr de student(ni)
Insuficient 3
Satisfăcător 4
Bine 15

Gruparea datelor statistice pe intervale de variație.


Gruparea reprezintă sistematizarea datelor după o variabilă (caracteristică) numerică.
Intervalul de variaţie reprezintă un şir de valori ale variabilei studiate, delimitat de
intervalele vecine prin limita inferioară şi limita superioară. Intervalele de variaţie pot fi de
mărime egală sau neegală.
În funcţie de tipul variabilei de grupare (discretă sau continuă) si de plaja valorilor pe
care le poate caracteristica, gruparea se poate face:
- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
- pe intervale de variaţie (atunci când sistematizăm datele după o variabilă continuă, care are o
plajă largă de valori.
A). Gruparea datelor statistice pe variante.
În acest caz, se va forma un număr de grupe egal cu numărul de variante. Prin numărarea
unităţilor incluse în fiecare grupă se obţine frecvenţa grupei (numită si frecvenţă absolută).
Exemplul 3
Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0, 2, 1, 3,1, 2,
4, 2. Să se realiezeze o sistematizare a datelor.
Număr de copii (xi) Număr de copii (xi)
0 3
1 5
2 8
3 3
4 1
Total 20
Observăm că variabila de grupare este numărul de copii, variabilă discretă cu puţine variante
(cinci variante), deci s-a realizat o grupare pe variante.
B). Gruparea pe intervale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor pasi:
a) se determină amplitudinea variaţiei caracteristicii, ca diferenţă între valoarea
maximă si valoarea minimă a caracteristicii.
A = xmax - xmin
b) se stabileste numărul de grupe. În acest caz pot exista două situaţii:
- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii anterioare asupra
domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relaţia lui Sturges:
r = 1+ 3,322* lg n
unde n este numărul total de unităţi ale colectivităţii.
Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 si 10).Utilizarea
unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii (putând apare, în
acest caz si grupe cu frecvenţe nule, iar gruparea ar trebui refăcută); utilizarea, dimpotrivă, a
unui număr prea mic de grupe ar putea să nu pună în evidenţă principalele tipuri calitative ale
populaţiei după variabila urmărită).
c) se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii si numărul de grupe:
h =A/r
Pentru usurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval, de aceea, dacă
valoarea reiesită din calcul este fracţionară, cu mai multe zecimale, ea se poate rotunji prin adaos
la o valoare imediat superioară, aleasă în mod convenabil
d) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
Limitele intervalelor vor avea acelasi grad de precizie ca si datele grupate (acelasi număr
de zecimale), primul interval putând începe chiar de la valoarea minimă acaracteristicii, sau de la
o valoare usor inferioară acesteia, aleasă în mod convenabil. Este bine să nu existe suprapuneri
de limite, astfel încât la efectuarea grupării să poată fi respectată condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului următor,
intervalele se numesc continue;
- Dacă între limita superioară a unui interval si limita inferioară a intervalului următor există o
diferenţă de o unitate întreagă sau zecimală, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizării pot fi redate cu ajutorul unui tabel asemănător celui din
exemplul următor.

Exemplul 4

Pentru un esanation de 50 de angajati s-au inregistrat datele privind castigul salarial


nominal brut realizat in luna ianuarie 2013

Grupare acestor date pe variante conduce la prea multe grupe deoarece numarul valorilor
distincte este mare. Comprimare datelor individuale presupune gruparea pe intervale de variatie.

 numarul de grupe (r) poate fi egal cu 7 deoarece  , deci marimea intervalului (h)
este:

 mii. lei

Aplicarea formulei lui H. D. Sturges conduce la

 mii. lei
Intervalele de grupare si numarul muncitorilor (frecventa abspoluta) corespunzator
fiecarei grupe se prezinta in tabelul 

1.2. Modalități de prezentare și reprezentare a datelor


statistice.
Serii statistice
Rezultatul sistematizării datelor prin grupare/clasificare se constituie sub forma seriilor
statistice.
DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor referitoare la
manifestările unui fenomen colectiv sub forma a două şiruri de date: unul priveşte variabila şi
modul cum a fost sistematizată, iar al doilea frecvenţa de apariţie sau nivelul unei variabile în
raport cu primul şir.
Seriile statistice se pot clasifica după următoarele criterii:
a) în funcţie de conţinutul variabilei după care se face sistematizarea, avem:
i. serii cronologice (se referă la o variabilă de timp);
ii. serii teritoriale (se referă la o variabilă de spaţiu);
iii. serii de distribuţie de frecvenţe (sau repartiţii de frecvenţe, care se referă la o variabilă
atributivă).
Serii de repartiţie de frecvenţe pe intervale de variaţie
Intervale de variaţie ale caracteristicii de grupare Număr de unităţi statistice (ni)
x 1
inf
x1sup
n1
inf
x2 –x2sup n2
… …
xi -xisup
inf
ni
… …
Total n = Ʃni
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului
si este considerat reprezentativ pentru datele din acel interval. Se determină cu una din relaţiile:

Xi = (xiinf+xisup )/2
Frecvenţa absolută a grupei (ni) este egală cu numărul de unităţi statistice care au
valoarea caracteristicii mai mare (sau egală) cu limita inferioară a intervalului si mai mica (sau
egală) cu limita superioară a acesteia. Suma frecvenţelor absolute este notată cu n si reprezintă
numărul total de unităţi sau volumul esantionului.
Frecvenţa relativă a unei grupe ( *ni ) reprezintă ponderea unităţilor statistice în
volumul total al colectivităţii care au valoarea caracteristicii cuprinsă între limita inferioară sicea
superioară a grupei respective. Se determină ca raport între frecvenţa absolută a grupei si
volumul esantionului (eventual înmulţit cu 100).
Frecvenţele cumulate.
Sunt de două tipuri: cumulate crescător si cumulate descrescător.
Frecvenţa absolută cumulată crescător a unei grupe este egală cu numărul unităţilor
care au valoarea variabilei mai mică (sau egală) cu limita superioară a grupei (mai exact între xiinf
și xisup
Frecvenţa absolută cumulată descrescător a unei grupe este egală cu numărul
unităţilor pentru care valoarea caracteristicii este mai mare (sau egală) cu limita inferioară a
grupei.

Tabelul statistic
Tabelul statistic constituie o modalitate de prezentare a datelor statistice şi este format
dintr-o reţea de linii paralele, orizontale şi verticale în care sunt încadrate datele statistice.
Alături de funcţia de prezentare a rezultatelor prelucrării primare şi secundare a datelor statistice,
tabelele statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor. Tabelele
statistice conţin una sau mai multe serii statistice
Tabelul statistic trebuie să fie elaborat după anumite reguli privind elementele de conţinut
şi de formă.
Elementele obligatorii de conţinut şi de formă ale tabelelor pe care le regăsim într-un
tabel :
1. Titlul tabelului precizează caracteristica sau caracteristicile principale la care se referă
datele prezentate;
2. Subiectul este reprezentat de colectivitatea statistică supusă analizei şi se înscrie în
capetele rândurilor;
3. Predicatul este format din sistemul de caracteristici pentru care s-a făcut centralizarea
datelor. Acestea se înscriu în capetele coloanelor.
4. Unitatea de măsură se înscrie distinct pentru fiecare caracteristică în coloana respectivă.
Dacă este comună tuturor datelor se trece deasupra tabelului, în dreapta.
5. Sursa de date se înscrie la sfârșitul tabelului.
6. Notele explicative sunt utilizate atunci când este necesar să se clarifice unele abordări
metodologice sau noţiuni mai puţin cunoscute. Atunci
7. Când nu se cunosc anumite date, în locul lor se înscrie semnul „…”, iar dacă valoarea
respectivă nu poate exista, rubrica conţine semnul „ - ” .

În funcţie de rolul lor în analiza şi prelucrarea datelor statistice, tabelele statistice pot fi:
simple (descriptive); de prelucrare; pe grupe (obţinute în urma sistematizării datelor); combinate;
de asociere.

Graficile statistice
Reprezentarea grafică este o metodă de descriere a datelor prin intermediul figurilor
geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin diferite mijloace
plastice de prezentare scoate în evidenţă ceea ce este caracteristic şi esenţial în evoluţia
fenomenelor, în schimbările structurale, în ceea ce priveşte proporţiile şi corelaţiile cu alte
fenomene de aceeaşi natură sau calitativ diferite.
Graficul permite evidenţierea:
0 1. variaţiei valorilor observate;
1 2. densităţii de repartiţie a frecvenţelor;
2 3. raporturilor de mărime;
3 4. interdependenţelor dintre indicatori.
Elementele care definesc un grafic sunt: titlul, reţeaua graficului, axe-le de coordonate, scara de
reprezentare, notele explicative (sursa datelor, legenda simbolurilor utilizate).
Titlul graficului coincide frecvent cu titlul tabelului pe care îl reprezin-tă. Trebuie să
satisfacă aceleaşi condiţii: claritate, identificare concisă a fe-nomenului reprezentat şi localizarea
acestuia în timp şi spaţiu.
Reţeaua graficului este formată din sistemul de linii paralele (verticale şi orizontale) care
ghidează amplasarea pe grafic a mărimilor reprezentate. Pe axa absciselor (OX) se trec variantele
sau intervalele de variaţie ale ca-racteristicii independente, momentele sau intervalele de timp. Pe
axa ordo-natelor (OY), apar valorile caracteristicii dependente sau frecvenţele.
Scara de reprezentare se alege în funcţie de numărul indicatorilor de reprezentat şi ordinul
lor de mărime, astfel încât imaginea graficului să fie clară şi sugestivă. Scările de reprezentare
pot fi rectilinii sau curbilinii, în funcţie de tipul graficului. Scara aritmetică (uniformă) presupune
distanţe egale între diviziuni.
Legenda graficului prezintă semnificaţia semnelor utilizate: simboluri, prescurtări, haşuri.
Se plasează în dreapta graficului.
Sursa datelor explică izvorul datelor folosite în grafic. Se trece sub grafic, de obicei cu
semnul „*”.
4 În practica statistică se folosesc diferite tipuri de grafice pentru a evidenţia raporturile de
mărime dintre indicatori.
5

S-ar putea să vă placă și