Sunteți pe pagina 1din 7

S1.

2_SISTEMATIZAREA DATELOR

Sistematizarea este un proces de repartizare (distribuire) a unităţilor statistice dintr-o


colectivitate/eşantion, pe grupe/clase omogene, după variaţia unei variabile sau a mai multor variabile,
având la bază un criteriu stabilit (= o variabilă după care se face gruparea).

SISTEMATIZARE = REPARTIZARE = DISTRIBUIRE = GRUPARE

SISTEMATIZAREA
(Gruparea)
Grupare simplă (după o singură variabilă)
După numărul variabilelor
1.2. Grupare combinată
(după 2/mai multe variabile)

2.1. Grupare variabile calitative

2.1.1. Grupare variabile calitative NOMINALE

2. După scala de măsurare 2.1.2. Grupare variabile calitative ORDINALE

2.2. Grupare variabile cantitative

2.2.1. Grupare pe variante

2.2.2. Grupare pe intervale de variație


2.1. Grupare variabile calitative

2.1.1. Gruparea variabilelor calitative nominale

Caracteristici esenţiale:
 se formează un număr de clase egal cu numărul de variante (grupe) câte are variabila studiată;
 volumul clasei, denumit frecvență absolută, este reprezentat de numărul unităților incluse prin
numărare
Exemplu:
Dintr-o grupă de studenți sunt selectați aleator, pentru studiu, 10 studenți după mediul de
proveniență (MPv): R-rural, U-urban.
Tabel 1 – Distribuția studenților după modul de proveniență
Nr crt studenți 1 2 3 4 5 6 7 8 9 10
Mediul de proveniență
R U R R U R R R U U
(MPv)
Sursa: Grupa 308 – an universitar 2018-2019

Gruparea s-a realizat astfel:

Tabel 2 – Distribuția grupată și structura studenților după mediul de proveniență


Nr. studenți Pondere studenți
Distribuție după ni n¿i (%)
Mediul de proveniență (MPv)
= frecvențe absolute = = frecvențe relative =
R 6 (6 :10)⋅100=60
U 4 (4 :10 )⋅100=40
2 2
Total
∑ n i=10 ∑ n ¿i =100
i =1 i =1
Sursa: Elaborat de autori

Reprezentare grafică:

Sursa: Elaborate de autori pe baza datelor grupate preluate de la grupa 308 – an universitar 2018-2019
2.1.2. Gruparea variabilelor calitative ordinale

Caracteristică esenţială:
 este asemănătoare cu gruparea variabilelor calitative nominale numai că este necesar ca clasele
să respecte un criteriu

Exemplu: Se cunosc datele privind opinia fiecărui consumator după calitatea unui produs, iar ca
urmare a sistematizării, rezultatele se prezintă astfel:

Opinia Nr Frecvenţe absolute Frecvenţe relative


privind Consumator cumulate cumulate
calitatea i n¿i (%)
unui produs ni crescător descrescător (frecvenţe
crescător descrescător
¿ ¿
(frecvenţe FCCi FCdi relative) FCCi FCdi
absolute)
Foarte 39+11=50 22+78=100
11 11 22 22
mulțumit
Mulțumit 18 18+11=29 18+21=39 36 36+22=58 36+ 42=78
Așa și așa 12 12+29=41 12+9=21 24 24+58=82 24+18=42
Nemulțumi 6+ 41=47 6+3=9 12+82=94 12+6=18
6 12
t
Foarte 3+47=50 6+94=100
3 3 6 6
nemulțumit
5 5
Total
∑ n i=50 --- --- ∑ n ¿i =100 --- ---
i=1 i=1
2.1. Grupare variabile calitative

2.2.1. Gruparea pe variante

Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor discrete, cu număr redus de variante
 se recomandă alcătuirea a cel mult 10 grupe

Exemplu: Se cunosc datele privind notele de promovare ale fiecărui student dintr-un eșantion
format din 30 studenți ai unei grupe. Ca urmare a sistematizării datelor, s-au obținut rezultatele:

¿
Frecvenţe absolute ni (%) Frecvenţe relative
Note de Nr cumulate cumulate
promovare studenţi (frecvenţe
crescător descrescăto crescător descrescător
xi ni FCdi
relative) ¿
FCdi
FCCi r F¿CCi
5 13 13 30 43 43 100
6 10 23 17 33 76 57
7 2 25 7 7 83 24
8 2 27 5 7 90 17
9 3 30 3 10 100 10
5 5
Total ∑ n i=30 --- --- ∑ n ¿i =100 --- ---
i=1 i=1

Eşantionul: cei 30 studenţi


Unitatea statistică: studentul
Variabila (
x i ): nota de promovare a studenţilor (cantitativă, discontinuă)
n
Frecvenţe absolute ( i ) – numărul studenţilor care corespund fiecărei grupe (i)
Poligonul frecvențelor
2.2.2. Gruparea pe intervale de variație
Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor continue, cu număr mare de variante;
 este facilă în ceea ce priveşte identificarea principalelor trăsături ale setului de date;
 are un mare dezavantaj în sensul că se pierde din exactitatea informaţiei )valoarea mediei
simple nu coincide cu cea a mediei ponderate);
 intervalele de grupare pot fi egale sau neegale, continue sau discontinue.
 rezultatul grupării este o distribuţie de frecvenţe, pe intervale de variaţie;
 se recomandă formarea unui număr moderat de intervale de variaţie, cuprins între 5 şi 10.

Exemplu:
Vânzarea de bilete realizată de 20 agenţii de turism dintr-o regiune, înregistrată pentru fiecare
dintre acestea pe parcursul unei luni calendaristice din perioada de extrasezon, se prezintă astfel: 20,
24, 26, 25, 23, 24, 25, 28, 28, 30, 26, 28, 28, 25, 24, 27, 25, 25, 20, 26.
Gruparea agenţiilor de turism după numărul biletelor vândute pe șase grupe de mărime egală
presupune parcurgerea mai multor etape și se prezintă astfel:
a. – se determină amplitudinea absolută a variaţiei (Ax):
A x=x max − x min =30−20=10 bilete ,
unde xmax – numărul maxim de bilete vândute ;
xmin – numărul minim de bilete vândute
b.– se stabileşte mărimea intervalului de grupare (kx), aplicând relaţia lui Sturgers sau în raport cu
cerința: „se vor forma șase grupe de mărime egală”

Ax 10
k x= = =1 , 88≃2
 Relația lui Sturgers: 1+3, 322 lg n 1+3 ,322 lg 20 bilete
A x 10
k x= = =1 , 88≃2
 Cerința: se vor forma șase grupe de mărime egală: r 6 , unde r = 6 = numărul
de grupe ce trebuiesc formate

c – se formează intervalele de grupare pornind de la valoarea minimă (x min) la care se adaugă mărimea
intervalului de grupare (kx), după cum se prezintă în următorul tabel:

Tabel 1 – Distribuţia agenţiilor de turism pe grupe


după numărul biletelor vândute
Grupe de agenţii de Număr agenţii de
turism după vânzare turism
(nr. bilete – x -) (fi)
20 – 22 2
22 – 24 1
24 – 26 8
26 – 28 4
28 – 30 4
30 – 32 1
Total 20
Notă: Limita inferioară inclusă în interval

Histograma Poligonul frecvențelor

S-ar putea să vă placă și