Sunteți pe pagina 1din 6

SISTEMATIZAREA DATELOR

Sistematizarea este un proces de repartizare (distribuire) a unităţilor statistice dintr-o


colectivitate/eşantion, pe grupe/clase omogene, după variaţia unei variabile sau a mai multor variabile,
având la bază un criteriu stabilit (= o variabilă după care se face gruparea).

SISTEMATIZARE = REPARTIZARE = DISTRIBUIRE = GRUPARE

SISTEMATIZAREA
(Gruparea)
1.1.Grupare simplă (după o singură variabilă)
1. După numărul variabilelor
1.2. Grupare combinată
(după 2/mai multe variabile)

2.1. Grupare variabile calitative

2.1.1. Grupare variabile calitative NOMINALE

2. După scala de măsurare 2.1.2. Grupare variabile calitative ORDINALE

2.2. Grupare variabile cantitative

2.2.1. Grupare pe variante

2.2.2. Grupare pe intervale de variație


2.1. Grupare variabile calitative

2.1.1. Gruparea variabilelor calitative nominale


Caracteristici esenţiale:
 se formează un număr de clase egal cu numărul de variante (grupe) câte are variabila studiată;
 volumul clasei, denumit frecvență absolută, este reprezentat de numărul unităților incluse prin
numărare

Exemplu:
Dintr-o grupă de studenți sunt selectați aleator, pentru studiu, 10 studenți după mediul de
proveniență (MPv): R-rural, U-urban.

Nr crt studenți 1 2 3 4 5 6 7 8 9 10
Mediul de proveniență
R U R R U R R R U U
(MPv)

Gruparea:
Nr. studenți Pondere studenți
Distribuție după ni ni* (%)
Mediul de proveniență (MPv)
= frecvențe absolute = = frecvențe relative =
R 6 (6 : 10) 100  60
U 4 (4 : 10) 100  40
Total 2 2

n
i 1
i  10 n
i 1
*
i  100

Reprezentare grafică:
2.1.2. Gruparea variabilelor calitative ordinale

Caracteristică esenţială:
 este asemănătoare cu gruparea variabilelor calitative nominale numai că este necesar ca clasele
să respecte un criteriu

Exemplu: Se cunosc datele privind opinia fiecărui consumator după calitatea unui produs, iar ca
urmare a sistematizării, rezultatele se prezintă astfel:

Opinia Nr Frecvenţe absolute Frecvenţe relative


privind Consumatori cumulate cumulate
calitatea ni ni* (%)
crescător descrescător (frecvenţe crescător descrescător
unui produs (frecvenţe * *
FCCi FCdi relative) F CCi FCdi
absolute)
Foarte
11 11 39  11  50 22 22 22  78  100
mulțumit
Mulțumit 18 18  11  29 18  21  39 36 36  22  58 36  42  78
Așa și așa 12 12  29  41 12  9  21 24 24  58  82 24  18  42
Nemulțumit 6 6  41  47 63 9 12 12  82  94 12  6  18
Foarte
3 3  47  50 3 6 6  94  100 6
nemulțumit
Total 5 5

i 1
ni  50 --- --- n
i 1
*
i  100 --- ---
2.1. Grupare variabile calitative

2.2.1. Gruparea pe variante


Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor discrete, cu număr redus de variante
 se recomandă alcătuirea a cel mult 10 grupe

Exemplu: Se cunosc datele privind notele de promovare ale fiecărui student dintr-un eșantion
format din 30 studenți ai unei grupe. Ca urmare a sistematizării datelor, s-au obținut rezultatele:

Frecvenţe absolute ni* (%) Frecvenţe relative


Note de Nr cumulate cumulate
promovare studenţi (frecvenţe
crescător descrescător relative) crescător descrescător
xi ni * *
FCCi FCdi FCCi FCdi
5 13 13 30 43 43 100
6 10 23 17 33 76 57
7 2 25 7 7 83 24
8 2 27 5 7 90 17
9 3 30 3 10 100 10
5 5
Total 
i 1
ni  30 --- --- n
i 1
*
i  100 --- ---

Eşantionul: cei 30 studenţi


Unitatea statistică: studentul
Variabila ( xi ): nota de promovare a studenţilor
Frecvenţe absolute ( ni ) – numărul studenţilor care corespund fiecărei grupe (i)
2.2.2. Gruparea pe intervale de variație
Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor continue, cu număr mare de variante;
 este facilă în ceea ce priveşte identificarea principalelor trăsături ale setului de date;
 are un mare dezavantaj în sensul că se pierde din exactitatea informaţiei )valoarea mediei
simple nu coincide cu cea a mediei ponderate);
 intervalele de grupare pot fi egale sau neegale, continue sau discontinue.
 rezultatul grupării este o distribuţie de frecvenţe, pe intervale de variaţie;
 se recomandă formarea unui număr moderat de intervale de variaţie, cuprins între 5 şi 10.

Exemplu:
Vânzarea de bilete realizată de 20 agenţii de turism dintr-o regiune, înregistrată pentru fiecare
dintre acestea pe parcursul unei luni calendaristice din perioada de extrasezon, se prezintă astfel: 20,
24, 26, 25, 23, 24, 25, 28, 28, 30, 26, 28, 28, 25, 24, 27, 25, 25, 20, 26.
Gruparea agenţiilor de turism după numărul biletelor vândute pe șase grupe de mărime egală
presupune parcurgerea mai multor etape și se prezintă astfel:
a. – se determină amplitudinea absolută a variaţiei (Ax):
Ax  xmax  xmin  30  20  10 bilete ,
unde xmax – numărul maxim de bilete vândute ;
xmin – numărul minim de bilete vândute
b.– se stabileşte mărimea intervalului de grupare (kx), aplicând relaţia lui Sturgers sau în raport cu
cerința: „se vor forma șase grupe de mărime egală”

Ax 10
 Relația lui Sturgers: k x    1,88  2 bilete
1  3,322 lg n 1  3,322 lg 20
Ax 10
 Cerința: se vor forma șase grupe de mărime egală: k x    1,88  2 , unde r = 6 = numărul de
r 6
grupe ce trebuiesc formate

c – se formează intervalele de grupare pornind de la valoarea minimă (xmin) la care se adaugă mărimea
intervalului de grupare (kx), după cum se prezintă în următorul tabel:
Tabel 1 – Distribuţia agenţiilor de turism pe grupe
după numărul biletelor vândute
Grupe de agenţii de Număr agenţii de
turism după vânzare turism
(nr. bilete – x -) (fi)
20 – 22 2
22 – 24 1
24 – 26 8
26 – 28 4
28 – 30 4
30 – 32 1
Total 20
Notă: Limita inferioară inclusă în interval

Histograma Poligonul frecvențelor

S-ar putea să vă placă și