Sunteți pe pagina 1din 6

Capitolul 3. Sistematizarea,gruparea și prezentarea datelor statistice.

1.1. Sistematizarea datelor statistice(gruparea /clasificarea).


1.2. Modalități de prezentare și reprezentare a datelor statistice.
1.2.1. Serii statistice.
1.2.2. Tabele statistice.
1.2.3. Grafice statistice.

Sistematizarea datelor statistice și prezentarea lor.


După ce datele statistice au fost colectate din surse de date publicate, din
observări totale sau din observări parţiale – ele trebuie organizate, în scopul de a
avea o formă care să permită prelucrarea lor statistică diversă.

Sistematizarea datelor se realizează prin gruparea şi clasificarea datelor


statistice, adică prin împărţirea lor în grupe/clase omogene, după unul sau mai
multe criterii de grupare/clasificare.

Această operaţie face trecerea de la observarea statistică (în urma căreia s-au
obţinut datele necesare realizării obiectivelor investigaţiei statistice, verificate sub
aspectul volumului şi calităţii) şi prelucrarea propriu zisă.

O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se


asemene cât mai mult între ele din punctul de vedere al criteriului utilizat, adică
dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici, date de
prezenţa factorilor aleatori, întâmplători.

Gruparea/clasificarea datelor statistice presupune împărţirea unităţilor


populaţiei statistice observate în grupe sau clase distincte omogene, după unul sau
mai multe criterii.

Atunci când criteriul (caracteristica) după care se realizează această operaţie


este unul numeric, cantitativ, ea se numeşte grupare, iar când operaţia se
realizează după un criteriu (caracteristic) calitativ, nenumeric, ea se numeşte
clasificare.

La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să îndeplinim


următoarele condiţii:

a) omogenitate (în sensul că unităţile statistice care au aceeaşi valoare sau


valori apropiate, asemănătoare, ale caracteristicii după care se efectuează
sistematizarea vor fi incluse în aceeaşi clasă; în felul acesta, se doreşte ca variaţia
valorilor caracteristicii incluse în aceeaşi grupă/clasă să fie cât mai mică);

b) unicitate (în sensul că o unitate statistică trebuie inclusă într-o singură


clasă sau grupă, ea nu se poate regăsi simultan în două sau mai multe
clase/grupe);

c) completitudine (în sensul că toate unităţile statistice să fie incluse în


grupe/clase, să nu fie exclusă vreo unitate din operaţia de sistematizare).

Clasificarea datelor statistice

Sistematizarea datelor efectuată după o variabilă ne-numerică se numeste


clasificare. Ea presupune împărţirea unităţilor în clasele/categoriile variabilei
nenumerice considerate.

Se construiește un număr de clase egal cu numărul categoriilor existente, iar


prin numărarea unităţilor statistice incluse în fiecare clasă obţinem frecvenţa acelei
clase (volumulei).
Unele clasificări au caracter oficial, altele au caracter neoficial.
Dacă datele sunt sistematizate după o variabilă categorială (nominală),
ordinea claselor este lasata la indemina cercetatorului.

Exemplu 1.

Distribuţia studenților facultăţii Științe Economice specialitatea Bussines și


administrare după sex este :

Sex(xi) Numărul de studenți (ni)


Feminin
Masculin
Exemplul 2. Distribuţia studenţilor unei grupe după calificativul obţinut la
un proiect este:

Calificativ(xi) Număr de student(ni)


Insuficient 3
Satisfăcător 4
Bine 15

Gruparea datelor statistice pe intervale de variație.


Gruparea reprezintă sistematizarea datelor după o variabilă (caracteristică)
numerică.

Intervalul de variaţie reprezintă un şir de valori ale variabilei studiate,


delimitat de intervalele vecine prin limita inferioară şi limita superioară. Intervalele
de variaţie pot fi de mărime egală sau neegală.

În funcţie de tipul variabilei de grupare (discretă sau continuă) si de plaja


valorilor pe care le poate caracteristica, gruparea se poate face:
- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
- pe intervale de variaţie (atunci când sistematizăm datele după o variabilă
continuă, care are o plajă largă de valori.
A). Gruparea datelor statistice pe variante.
În acest caz, se va forma un număr de grupe egal cu numărul de variante.
Prin numărarea unităţilor incluse în fiecare grupă se obţine frecvenţa grupei
(numită si frecvenţă absolută).
Exemplul 3
Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2,
0, 2, 1, 3,1, 2, 4, 2. Să se realiezeze o sistematizare a datelor.
Număr de copii (xi) Număr de copii (xi)
0 3
1 5
2 8
3 3
4 1
Total 20

Observăm că variabila de grupare este numărul de copii, variabilă discretă cu


puţine variante (cinci variante), deci s-a realizat o grupare pe variante.
B). Gruparea pe intervale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă
parcurgerea următorilor pasi:
a) se determină amplitudinea variaţiei caracteristicii, ca diferenţă între valoarea
maximă si valoarea minimă a caracteristicii.
A = xmax - xmin
b) se stabileste numărul de grupe. În acest caz pot exista două situaţii:
- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii
anterioare asupra domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relaţia lui Sturges:
r = 1+ 3,322* lg n
unde n este numărul total de unităţi ale colectivităţii.
Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 si
10).Utilizarea unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a
colectivităţii (putând apare, în acest caz si grupe cu frecvenţe nule, iar gruparea ar
trebui refăcută); utilizarea, dimpotrivă, a unui număr prea mic de grupe ar putea să
nu pună în evidenţă principalele tipuri calitative ale populaţiei după variabila
urmărită).
c) se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii si numărul de grupe:
h =A/r
Pentru usurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval,
de aceea, dacă valoarea reiesită din calcul este fracţionară, cu mai multe zecimale,
ea se poate rotunji prin adaos la o valoare imediat superioară, aleasă în mod
convenabil
d) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
Limitele intervalelor vor avea acelasi grad de precizie ca si datele grupate
(acelasi număr de zecimale), primul interval putând începe chiar de la valoarea
minimă acaracteristicii, sau de la o valoare usor inferioară acesteia, aleasă în mod
convenabil. Este bine să nu existe suprapuneri de limite, astfel încât la efectuarea
grupării să poată fi respectată condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului
următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval si limita inferioară a intervalului
următor există o diferenţă de o unitate întreagă sau zecimală, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizării pot fi redate cu ajutorul unui tabel asemănător
celui din exemplul următor.

Exemplul 4

Pentru un esanation de 50 de angajati s-au inregistrat datele privind castigul


salarial nominal brut realizat in luna ianuarie 2013

Grupare acestor date pe variante conduce la prea multe grupe deoarece


numarul valorilor distincte este mare. Comprimare datelor individuale presupune
gruparea pe intervale de variatie.

 numarul de grupe (r) poate fi egal cu 7 deoarece  , deci marimea


intervalului (h) este:
 mii. lei

Aplicarea formulei lui H. D. Sturges conduce la

 mii. lei

Intervalele de grupare si numarul muncitorilor (frecventa abspoluta)


corespunzator fiecarei grupe se prezinta in tabelul 

1.3. Modalități de prezentare și reprezentare a datelor


statistice.
Serii statistice
Rezultatul sistematizării datelor prin grupare/clasificare se constituie sub
forma seriilor statistice.
DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor referitoare
la manifestările unui fenomen colectiv sub forma a două şiruri de date: unul
priveşte variabila şi modul cum a fost sistematizată, iar al doilea frecvenţa de
apariţie sau nivelul unei variabile în raport cu primul şir.
Seriile statistice se pot clasifica după următoarele criterii:
a) în funcţie de conţinutul variabilei după care se face sistematizarea, avem:
i. serii cronologice (se referă la o variabilă de timp);
ii. serii teritoriale (se referă la o variabilă de spaţiu);
iii. serii de distribuţie de frecvenţe (sau repartiţii de frecvenţe, care se referă la o
variabilă atributivă).
Serii de repartiţie de frecvenţe pe intervale de variaţie
Intervale de variaţie ale caracteristicii de grupare Număr de unităţi statistice (ni)
x 1
inf
x1sup
n1
inf
x2 –x2sup n2
… …
xi -xisup
inf
ni
… …
Total n = Ʃni
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor
intervalului si este considerat reprezentativ pentru datele din acel interval. Se
determină cu una din relaţiile:

Xi = (xiinf+xisup )/2
Frecvenţa absolută a grupei (ni) este egală cu numărul de unităţi statistice
care au valoarea caracteristicii mai mare (sau egală) cu limita inferioară a
intervalului si mai mica (sau egală) cu limita superioară a acesteia. Suma
frecvenţelor absolute este notată cu n si reprezintă numărul total de unităţi sau
volumul esantionului.
Frecvenţa relativă a unei grupe ( *ni ) reprezintă ponderea unităţilor
statistice în volumul total al colectivităţii care au valoarea caracteristicii cuprinsă
între limita inferioară sicea superioară a grupei respective. Se determină ca raport
între frecvenţa absolută a grupei si volumul esantionului (eventual înmulţit cu
100).
Frecvenţele cumulate.
Sunt de două tipuri: cumulate crescător si cumulate descrescător.
Frecvenţa absolută cumulată crescător a unei grupe este egală cu numărul
unităţilor care au valoarea variabilei mai mică (sau egală) cu limita superioară a
grupei (mai exact între xiinf și xisup
Frecvenţa absolută cumulată descrescător a unei grupe este egală cu numărul
unităţilor pentru care valoarea caracteristicii este mai mare (sau egală) cu limita
inferioară a grupei.
EXEMPLU5 DE CONTINUAT EXEMPLUL DE PRECEDENT.

Tabelul statistic constituie o modalitate de prezentare a datelor statistice şi


este format dintr-o reţea de linii paralele, orizontale şi verticale în care sunt
încadrate datele statistice. Alături de funcţia de prezentare a rezultatelor prelucrării
primare şi secundare a datelor statistice, tabelele statistice au şi funcţia
sistematizare a datelor în vederea prelucrării lor. Tabelele statistice conţin una sau
mai multe serii statistice
Tabelul statistic trebuie să fie elaborat după anumite reguli privind
elementele de conţinut şi de formă.
În funcţie de rolul lor în analiza şi prelucrarea datelor statistice, tabelele
statistice pot fi: simple (descriptive); de prelucrare; pe grupe (obţinute în urma
sistematizării datelor); combinate; de asociere.
Reprezentarea grafică este o metodă de descriere a datelor prin intermediul
figurilor geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin diferite
mijloace plastice de prezentare scoate în evidenţă ceea ce este caracteristic şi
esenţial în evoluţia fenomenelor, în schimbările structurale, în ceea ce priveşte
proporţiile şi corelaţiile cu alte fenomene de aceeaşi natură sau calitativ diferite1 .