Sunteți pe pagina 1din 12

Seminar_2

SISTEMATIZAREA DATELOR

Sistematizarea este un proces de repartizare (distribuire) a unităţilor statistice dintr-o


colectivitate/eşantion, pe grupe/clase omogene, după variaţia unei variabile sau a mai multor
variabile, având la bază un criteriu stabilit (= o variabilă după care se face gruparea).

SISTEMATIZARE = REPARTIZARE = DISTRIBUIRE = GRUPARE

SISTEMATIZAREA
(Gruparea) 1.1. Grupare variabile calitative

1.1.1. Grupare variabile calitative NOMINALE

1. După scala de măsurare 1.1.2. Grupare variabile calitative ORDINALE

1.2. Grupare variabile cantitative

1.2.1. Grupare pe variante

1.2.2. Grupare pe intervale de variație

Grupare simplă (după o singură


După numărul variabilelor variabilă)
2.2 Grupare combinată
(după 2/mai multe variabile)

1
1. După scala de măsurare

1.1. Grupare variabile calitative

1.1.1. Gruparea variabilelor calitative nominale

Caracteristici esenţiale:
 se formează un număr de clase egal cu numărul de variante (grupe) câte are variabila studiată;
 volumul clasei, denumit frecvență absolută, este reprezentat de numărul unităților incluse prin numărare
Exemplu:
Dintr-o grupă de studenți sunt selectați aleator, pentru studiu, 10 studenți după mediul de proveniență
(MPv): R-rural, U-urban. Să se realizeze o grupare simplă (după o variabilă) a studenților după mediul de
proveniență și stabiliți structura acestora; reprezentați grafic distribuția și structura studenților după mediul de
proveniență.
Tabel 1 – Distribuția studenților după mediul de proveniență
Nr crt studenți 1 2 3 4 5 6 7 8 9 10
Mediul de proveniență
R U R R U R R R U U
(MPv)
Sursa: Grupa 308 – an universitar 2019-2020

Colectivitatea
Eșantion
Unitate statistică
Variabila
Frecvențe absolute ( )
Frecvența relativă=pondere

GRUPARE
Tabel 2 – Distribuția grupată și structura studenților după mediul de proveniență
Nr. studenți Structura studenți (pondere)
Distribuție după
(%)
Mediul de proveniență (MPv)
= frecvențe absolute = = frecvențe relative =
R
U
Total

Sursa: Elaborat de autori

2
Gruparea se poate realiza prin utilizarea funcției COUNTIF (range, criteria)=(n 1, n2, …, nr)

Determinarea structurii studenților:

Observație!!!
Funcția COUNTIF poate apare sub forma:
COUNTIF (range, criteria) SAU COUNTIF (range; criteria)

REPREZENTARE GRAFICĂ:
Frecvențe absolute: Frecvențe relative:
Diagrama prin coloane/bare Diagrama de structură (Pie)

Sursa: Elaborate de autori pe baza datelor grupate preluate de la grupa 308 – an universitar 2018-2019

INTERPRETARE:
Frecvențe absolute: ..................................................................................................................
Frecvențe relative: .....................................................................................................................

3
1.1.2. Gruparea variabilelor calitative ordinale

Caracteristică esenţială:
 este asemănătoare cu gruparea variabilelor calitative nominale numai că este necesar ca clasele să
respecte un criteriu
Exemplu:
Dintr-o grupă de studenți sunt selectați aleator, pentru studiu, 10 studenți după calificativele obținute la
un concurs: FB-foarte bine, B-bine, S-suficient, I-insuficient. Realizați o grupare simplă după calificativele
obținute de studenți, stabiliți structura acestora și cumulați crescător, descrescător ambele tipuri de frecvențe
determinate; reprezentați grafic distribuția și structura studenților după calificativele obținute.

Tabel 3 – Distribuția studenților după calificative


Nr crt studenți 1 2 3 4 5 6 7 8 9 10
CALIFICATIVE B B FB I B I S B S S
Sursa: Rezultate concurs

Colectivitate
Eșantion
Unitate statistică
Variabila
Frecvențe absolute ( )
Frecvențe relative

GRUPAREA
Tabel 4 – Distribuția, structura studenților și cumulul crescător, descrescător după calificative
Nr studenți Frecvenţe relative
Frecvenţe absolute cumulate
(%) cumulate
Calificative crescător descrescător
(frecvenţe crescător descrescător (frecvenţe
absolute) relative)
FB
B
S
I
Total
--- --- --- ---

INTERPRETARE:
Frecvențe absolute: ..................................................................................................................................
Frecvențe relative: .................................................................................................................................

Observație!!!
În general, dacă nu există o anumită cerință, se interpretează valorile maxime și minime

4
REPREZENTARE GRAFICĂ:
Frecvențe absolute: Frecvențe relative:
Diagrama prin coloane/bare Diagrama de structură (Pie)

Sursa: Elaborate de autori pe baza datelor grupate

5
2.2. Grupare variabile cantitative
2.2.1. Gruparea pe variante

Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor discrete, cu număr redus de variante
 se recomandă alcătuirea a cel mult 10 grupe

Exemplu: Se cunosc datele privind notele de promovare ale fiecărui student dintr-un eșantion format din 30
studenți ai unei grupe. Ca urmare a sistematizării datelor, s-au obținut rezultatele:
Nr.crt Note Nr.crt Note Nr.crt Note Nr.crt Note Nr.crt Note Nr.crt Note
1 8 6 6 11 6 16 6 21 6 26 6
2 6 7 5 12 5 17 8 22 7 27 5
3 6 8 9 13 9 18 5 23 5 28 9
4 5 9 6 14 6 19 5 24 5 29 5
5 5 10 5 15 5 20 7 25 5 30 6

(%) Frecvenţe relative


Note de Nr Frecvenţe absolute cumulate
(frecvenţe cumulate
promovare studenţi
crescător descrescător relative) crescător descrescător

5
6
7
8
9

Total --- --- --- ---

Eşantionul: ............................
Unitatea statistică: .........................
Variabila ( ): ........................... (modul de exprimare......................, natura variației...........................)
Frecvenţe absolute ( ) – numărul studenţilor care corespunde fiecărei variante (i)
Reprezentare grafică=Scatter (punctele se unesc)
Poligonul frecvențelor

2.2.2. Gruparea pe intervale de variație


6
Caracteristici esenţiale:
 se aplică, în principal, în cazul variabilelor continue, cu număr mare de variante;
 este facilă în ceea ce priveşte identificarea principalelor trăsături ale setului de date;
 are un mare dezavantaj în sensul că se pierde din exactitatea informaţiei )valoarea mediei simple nu
coincide cu cea a mediei ponderate);
 intervalele de grupare pot fi egale sau neegale, continue sau discontinue.
 rezultatul grupării este o distribuţie de frecvenţe, pe intervale de variaţie;
 se recomandă formarea unui număr moderat de intervale de variaţie, cuprins între 5 şi 10.

Exemplu:
Vânzarea de bilete realizată de 20 agenţii de turism dintr-o regiune, înregistrată pentru fiecare dintre
acestea pe parcursul unei luni calendaristice din perioada de extrasezon, se prezintă astfel: 20, 24, 26, 25, 23,
24, 25, 28, 28, 30, 26, 28, 28, 25, 24, 27, 25, 25, 20, 26.
Gruparea agenţiilor de turism după numărul biletelor vândute pe șase grupe de mărime egală presupune
parcurgerea mai multor etape și se prezintă astfel:
a. – se determină amplitudinea absolută a variaţiei (Ax):
Ax = xmax – xmin =..............................................
unde xmax – numărul maxim de bilete vândute ;
xmin – numărul minim de bilete vândute
b.– se stabileşte mărimea intervalului de grupare (kx), aplicând relaţia lui Sturgers sau în raport cu cerința: „se
vor forma șase grupe de mărime egală”

 Relația lui Sturgers: bilete

 Cerința: se vor forma șase grupe de mărime egală: , unde r = 6 = numărul de

grupe ce trebuiesc formate


c – se formează intervalele de grupare pornind de la valoarea minimă (x min) la care se adaugă mărimea
intervalului de grupare (kx), după cum se prezintă în următorul tabel:

Tabel 1 – Distribuţia agenţiilor de turism pe grupe


după numărul biletelor vândute
Grupe de agenţii de Număr agenţii de
turism după vânzare turism
(nr. bilete – x -) (fi)
20 – 22
22 – 24
24 – 26
26 – 28
28 – 30
30 – 32
Total 20
Notă: Limita inferioară inclusă în interval

Rezolvare – etape în Excel

7
8
Construire grafic = HISTOGRAMĂ în Excel:
Se stabilesc limitele:
Limita min Limita max (Bin)
18 20
20 22
22 24
24 26
26 28
28 30
30 32
În MENIU se selectează: DATA – Data Analisys --Histogram

Construire grafic = POLIGONUL FRECVENȚELOR în Excel:


9
Intervale variație a nr. Nr. mediu bilete
Nr. Agenții Nr. Agenții
biletelor vândute vândute pe interval
[20 - 22) 2 21 2
[22 - 24) 1 23 1
[24 - 26) 8 25 8
[26 - 28) 4 27 4
[28 - 30) 4 29 4
[30 - 32) 1 31 1
În meniu se selcetează INSERT --- SCATTER (cu punctele unite)

10
2. După numărul variabilelor

În vederea configurării ofertei turistice pentru sezonul următor, o agenţie turistică dispune
realizarea unui studiu pe 30 dintre clienţii săi, selectaţi aleator. În cadrul unui chestionar, aceştia
au răspuns – printre altele – la următoarele două întrebări:
a. Care este, de regulă, durata unui sejur turistic estival?
b. Care este destinaţia turistică preferată?
Răspunsurile celor 30 de clienţi sunt redate în următorul tabel:

Cod Durata Destinaţia Cod Durata Destinaţia


client sejurului (zile) turistică client sejurului (zile) turistică
1 9 Munte 16 8 Litoral
2 4 Munte 17 12 Munte
3 12 Litoral 18 20 Litoral
4 8 Litoral 19 14 Litoral
5 11 Litoral 20 12 Litoral
6 3 Munte 21 15 Litoral
7 13 Litoral 22 10 Litoral
8 16 Litoral 23 6 Munte
9 7 Litoral 24 11 Litoral
10 7 Munte 25 16 Litoral
11 18 Litoral 26 9 Munte
12 12 Litoral 27 11 Litoral
13 5 Munte 28 10 Munte
14 10 Litoral 29 6 Munte
15 6 Munte 30 9 Munte

11
2.1. Grupare simplă

Variabilă calitativă
Distribuție după Nr. clienți
Destinația turistică
Litoral
Munte
Total

Variabilă cantitativă
Grupare simplă pe variante Grupare simplă pe intervale de
variație
Durata sejurului Nr clienți

3 1
4 1
5 1
6 3
7 2 Grupe intervale după Număr clienți
8 2 durata sejurului (ni)
3–7
9 3 7 – 11
10 3 11 – 15
11 3 15 – 19
19 – 23
12 4 Total
13 1 Notă: Limita inferioară inclusă în interval
14 1
15 1
16 2
18 1
20 1

2.2. Grupare combinată


Grupe după Subgrupe după Durata sejurului
destinația Total
3–7 7 – 11 11 – 15 15 – 19 19 – 23
turistică
Litoral - 5 8 4 1 18
Munte 6 5 1 - - 12
Total 6 10 9 4 1 30
Notă: Limita inferioară inclusă în interval

12

S-ar putea să vă placă și