Sunteți pe pagina 1din 33

STATISTICĂ ÎN COMERŢ,

TURISM, SERVICII
CURS 2

Sistematizarea datelor statistice. Prezentarea


şi reprezentarea datelor.

1
Principiile clasificării şi grupării

 Sistematizarea datelor se realizează prin clasificare (variabile


nenumerice) şi grupare (variabile numerice)
 Sistematizarea presupune împărţirea datelor în grupe omogene,
după unul sau mai multe criterii.
 Criteriul de grupare este dat de variabila statistică
 Grupările sunt simple sau combinate în funcţie de numărul
criteriilor utilizate
 Gruparea datelor trebuie să se facă după principiile:
➢ omogenităţii
➢ unicităţii
➢ universalităţii

 Rezultatul grupării datelor îl reprezintă seria de distribuţie de


frecvenţe.

2
Sistematizarea datelor calitative
nominale
 Dacă sistematizarea se face după o variabilă nenumerică vorbim de clasificarea
datelor
 Clasificarea presupune împărţirea unităţilor în categoriile variabilei nenumerice
considerate.
 Se pot determina următoarele tipuri de frecvenţe:

 frecvenţe absolute (obţinute prin numărarea unităţilor statistice ce se încadrează


r

în fiecare clasă), notate ni , i = 1, r ; n = n


i =1
i . (r = nr. de clase, n = vol. eşantion)
*
 frecvenţe relative ( ni ), care indică proporţia din numărul total de unităţi, care
ni ni r

n
ni ni ni*% = 100 =
ni* = = 100 *
=1
se încadrează în fiecare clasă: ; sau r
n ;
n
r i
n
n
i i i =1
i =1 i =1

 Ordinea claselor este aleasă de către cercetător.

3
Sistematizarea datelor calitative
nominale

1. O mare agenţie de turism isi pregateste oferta turistica interna pentru vara anului 2013, pe care doreste sa
o lanseze la un targ de turism. Pentru aceasta, sunt selectati aleatoriu 30 dintre clientii agentiei si sunt
rugati sa precizeze care este destinatia turistica preferata pentru petrecerea concediilor. Variantele de
raspuns considerate sunt: pe litoral (L), la munte (M), la tratament (T) si in pelerinaj (P). Raspunsurile
clientilor au fost
Clientul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Destinatia L T T L M L P M L T L T M L M
Clientul 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Destinatia P P L L M M L M L M L L T L M
Sistematizaţi datele disponibile şi prezentaţi grafic informaţiile sistematizate.

4
1. Se creeaza baza de date in
Excel.

Rezolvare Excel

2. Se sorteaza ascendent cele 30 de linii (selectate in prealabil) dupa coloana „Destinatie turistica”.

5
Rezolvare în
3. Se afiseaza rezultatul ordonarii si se selecteaza cele doua
coloane cu date:

Excel

6
Rezolvare în EXCEL
4. Se determina subtotaluri pe fiecare grup de linii dupa „Destinatia turistica” (respectiv, la fiecare
schimbare a valorii din campul „Destinatie turistica” se numara celulele cu valoarea anterioara a campului
cu functia COUNT).

7
5. Se afiseaza rezultatul numararii valorilor pe grupuri dupa „Destinatia turistica”:

Rezolvare în
Excel

8
Sistematizarea datelor calitative nominale

Rezultatele clasificarii sunt:

Ponderea
Destinatia Nr. clienţi clienţilor
turistica Count (ni) Percentage(%
)
Litoral (L) 13 43,33
Munte (M) 9 30,00
Tratament (T) 5 16,67
Pelerinaj (P) 3 10,00
Total 30 100,00

Reprezentarea grafică:
• se utilizează diagrama prin coloane/benzi pentru
reprezentarea frecvenţelor absolute;
• se utilizează diagrama de structură pentru reprezentarea
grafică a structurii populaţiei observate;

9
Diagrama prin benzi/bare Diagrama de structura

Pelerinaj (P)
Destinatia turistica

10%

Tratament (T) 17%


43%

Munte (M)

Litoral (L)
30%
0 2 4 6 8 10 12 14
Nr. clienti
Litoral (L) Munte (M) Tratament (T) Pelerinaj (P)

Utilizarea functiei COUNTIF:

Utilizăm functia COUNTIF (range, criteria)=(n1, n2, …, nr)

si la fel pentru celelalte variante.


10
Sistematizarea datelor calitative
ordinale
 Dacă sistematizarea se face după o variabilă nenumerică vorbim de clasificarea
datelor
 Clasificarea presupune împărţirea unităţilor în categoriile variabilei nenumerice
considerate.
 Se pot determina următoarele tipuri de frecvenţe:

 frecvenţe absolute (obţinute prin numărarea unităţilor statistice ce se încadrează


r

în fiecare clasă), notate ni , i = 1, r ; n =  n . (r = nr. de clase, n = vol. eşantion)


i =1
i

*
 frecvenţe relative ( ni ), care indică proporţia din numărul total de unităţi, care
ni ni r

n
ni n ni*% = 100 =
ni* = = i 100 *
=1
se încadrează în fiecare clasă: ; sau r
n ;
n
r i
n
n
i i i =1
i =1 i =1
 frecvenţe cumulate crescător sau descrescător, absolute sau relative.
 Dacă datele se referă la variabile măsurate pe scala ordinală, clasele vor respecta
criteriul de ordine.
11
Sistematizarea datelor calitative ordinale

Sistematizarea datelor privind opinia a 50 de vizitatori la


un târg de turism asupra site-ului www.turistinfo.ro:

Care este părerea dv. despre site-ul www.turistinfo.ro?


Părere Număr persoane
(frecvenţe absolute)

Excelentă 11
Foarte bună 18
Bună 12
Satisfăcătoare 6
Nesatisfăcătoare 3
TOTAL 50

12
Diagrama prin
coloane (bare)

13
Diagrama de structura
(de tip pie-chart)

Care este părerea


dv. privind site-ul
www.turistinfo.ro?

14
Sistematizarea datelor numerice

 Gruparea reprezintă sistematizarea datelor după o


variabilă numerică (discretă sau continuă).
A. Dacă variabila este discretă şi cu un număr redus de
valori distincte (max. 10) sistematizarea datelor se face
prin gruparea pe variante, obţinându-se o serie de
distribuţie de frecvenţe pe variante.
 Frecvenţa grupelor se stabileşte prin numărarea
unităţilor care iau aceeaşi valoare.
 Se pot determina următoarele tipuri de frecvenţe:
◼ Frecvenţe absolute
◼ Frecvenţe relative
◼ Frecvenţe cumulate (absolute sau relative) 15
Sistematizarea datelor numerice
Gruparea a 50 de manageri ai unor firme de IT, în funcţie de numărul de
deplasări în străinătate, în interes de serviciu, în luna mai 2015, se prezintă
astfel:

Număr deplasări (xi) Număr manageri (ni)


0 3
1 16
2 19
3 7
4 4
5 1
Total 50

16
Sistematizarea datelor numerice
Reprezentarea grafică a unei serii de distribuţie de frecvenţe alcătuită după o variabilă numerică
discretă cu număr redus de valori distincte este poligonul frecvenţelor:

20
19
18
17
16
15
14
nr. manageri

13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5

Nr. deplasari

Distribuţia managerilor în funcţie de numărul de deplasări (poligonul frecvenţelor)

17
Sistematizarea datelor numerice
B. Dacă variabila numerică este discretă şi are un număr
mare de valori distincte sau este continuă sistematizarea
presupune gruparea pe intervale de variaţie
 Se obţine o serie de distribuţie de frecvenţe pe intervale.
 Intervalul de variaţie reprezintă un şir de valori ale variabilei
studiate delimitat prin limita inferioară şi limita superioară.
 Intervalele de variaţie pot fi de mărime egală sau neegală.
 Pentru gruparea pe intervale de variaţie se recomandă
utilizarea unui număr moderat de grupe (5-10 grupe).
 Numărul intervalelor depinde de numărul unităţilor statistice.

 Un număr mare de date necesită un număr mai mare de intervale de


grupare. Ca un principiu general, o distribuţie de frecvenţe trebuie să
cuprindă cel puţin 5 intervale de grupare, dar nu mai mult de 15.

18
Alcătuirea intervalelor de variaţie
A. Determinarea numărului de intervale
Pentru alegerea numărului de intervale (r) se poate utiliza şi relaţia:
r = 1+ 3,322 log10 n ,
unde n reprezintă volumul colectivităţii.
B. Stabilirea mărimii intervalului (h) de variaţie
- se recomandă utilizarea intervalelor de mărime egală
A xmax − xmin
h =
r r
- mărimea intervalului se recomandă a se rotunji la o valoare convenabilă.

Prin sistematizarea datelor pe intervale de grupare se pierde din exactitatea informaţiei,


dar se câştigă pe linia condensării datelor şi descoperirii trăsăturilor esenţiale.

În prelucrările ulterioare, când trebuie să ataşăm fiecărei unităţi statistice o valoare


concretă şi această valoare va fi, sub anumite presupuneri, centrul intervalului de grupare.

19
Alcătuirea intervalelor de variaţie
C. Sabilirea intervalelor

Punctul de plecare în alcătuirea intervalelor de grupare se alege, convenabil, 0


sau un număr întreg mai mic sau egal decât xmin.

Limitele intervalelor de grupare trebuie stabilite cu acurateţe, respectând


precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt de această
manieră).

Se stabilesc intervalele de grupare pornind de la xmin (sau de la o valoare puţin


mai mică):
xmin ⎯ xmin+h
xmin+h ⎯ xmin+2h
.....................................................
xmin + (r — 1)h ⎯ xmin + r  h

Frecvenţa fiecărui interval ni (numită frecvenţă absolută) se obţine prin


numărarea unităţilor care se încadrează în fiecare grupă
Dacă există grupe cu frecvenţă nulă, ori multe grupe cu o singură observaţie,
poate fi necesară revizuirea mărimii intervalelor sau a numărului de intervale.

20
Gruparea dupa o variabila numerica
Intervale Frecvenţe
0-20 5
Câte ore aţi navigat pe Intervale Frecvenţe 20-40 10
pe site-uri turistice 10-35 10 40-60 9
în trimestrul trecut? 35-60 10 60-80 8
60-85 12 80-100 5

40 70 40 30 85-110 5 100-120 2

80 130 90 80 110-135 3 120-140 1

20 60 50 40 12

100 20 50 50 10

70 70 50 40
8

60 90 70 110
6

40 20 70 90
4

50 50 80 60
2

40 40 60 50 0

50 120 100 50
20.0 40.0 60.0 80.0 100.0 120.0 140.0

NR.ORE 21
Seria de distribuţie de frecvenţe pe intervale
În cazul seriilor de distribuţie de frecvenţe pe intervale se mai determină:
1. Centrul de interval = valoarea situată la jumătatea distanţei dintre limitele intervalului şi este
considerat reprezentativ pentru datele din interiorul intervalului:
hi xi inf + xi sup
xi = xi inf + sau xi = , i = 1, r .
2 2
2. Frecvenţa absolută cumulată crescător a unei grupe (Fci) = numărul unităţilor statistice care au
valoarea variabilei mai mică sau egală cu limita superioară a intervalului
i
Fci = n
k =1
k .
*
3. Frecvenţa relativă cumulată crescător a unei grupe ( Fci ) = procentul unităţilor statistice care au
valoarea variabilei mai mică sau egală cu limita superioară a grupei:
i
Fci* = n
k =1
*
k .
4. Frecvenţe absolute şi relative cumulate descrescător = numărul sau procentul unităţilor
statistice care au valoarea variabilei mai mare sau egală cu limita inferioară a intervalului

r r
Fdi = n
k =i
k , Fdi* = n
k =i
*
k .

22
Seria de distribuţie de frecvenţe pe intervale

Frecvenţele absolute, relative şi cumulate oferă o imagine de ansamblu asupra


tendinţei de distribuţie a valorilor în colectivitate, asupra normalităţii, simetriei ori
asimetriei repartiţiei de frecvenţe.

Intervale de variaţie Număr persoane


a timpului de navigare pe site-uri turistice
(ore)
ni
[20-40) 4
40-60 16
60-80 9
80-100 6
100-120 3
[120-140) 2
Total 40

23
Rezolvare Excel: functia
COUNTIFS
COUNTIFS(criteria_range1, criteria1, [criteria_range2, criteria2]…)

=countifs(A2:A41;">0";A2:A41;"<=20")

=countifs(A2:A41;">20";A2:A41;"<=40")

=countifs(A2:A41;">40";A2:A41;"<=60")

=countifs(A2:A41;">60";A2:A41;"<=80")

=countifs(A2:A41;">80";A2:A41;"<=100")

=countifs(A2:A41;">100";A2:A41;"<=120")

=countifs(A2:A41;">120";A2:A41;"<=140")

24
Rezolvare in Excel
Histogram

12 120,00%
10 100,00%
Frequency 8 80,00%
6 60,00%
4 40,00%
2 20,00%
0 0,00%
20 40 60 80 100 120 140 More

Bin (limita maxima)

Frequency Cumulative %
Poligonul frecvenţelor
12

10

8
Nr. persoane

0
0 20 40 60 80 100 120 140 160
Nr. ore navigare Internet
27
Curbele frecvenţelor cumulate

45
40
Frecvente cumulate

35
30
25 Fci
20 Fdi
15
10
5
0
0 20 40 60 80 100 120 140 160
Nr.ore navigare

28
Reprezentarea grafică a seriilor de distribuţie de
frecvenţe pe intervale
 Reprezentarea grafică:
◼ se utilizează histograma şi poligonul frecvenţelor pentru reprezentarea
distribuţiei variabilei (frecvenţe absolute sau relative)
◼ se utilizează diagrama de structură pentru reprezentarea structurii
populaţiei observate (frecvenţele relative)

14 35

12 30

10 25
Frecvente

Frecvente
8 20

6 15

4 10

2 5

0 0
10 20 30 40 50 60 70 80 90 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
Intervale Intervale

set mic de date set mare de date


29
Distribuţia normală

 Distribuţia normală, perfect simetrică, în forma clopotului lui


Gauss-Laplace este foarte rar întâlnită în practică, fiind de fapt
o distribuţie teoretică de referinţă în analiza statistică.

30
Distribuţii asimetrice

 În cele mai multe cazuri, distribuţiile de frecvenţe empirice au


tendinţă de normalitate, dar un anumit grad de asimetrie

31
Distribuţia în formă de J

 Distribuţia în formă de J este o distribuţie profund asimetrică,


în care frecvenţa maximă se întâlneşte în primul ori în ultimul
interval, pentru ca apoi frecvenţele să descrească spre zero

32
Distribuţia în formă de U
 Distribuţia în formă de U este o distribuţie cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă
minimă în jurul intervalului central

 Este firesc, aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale


grafică, a tendinţei de distribuţie a valorilor în colectivitatea cercetată.

33

S-ar putea să vă placă și