Documente Academic
Documente Profesional
Documente Cultură
TURISM, SERVICII
CURS 2
1
Principiile clasificării şi grupării
2
Sistematizarea datelor calitative
nominale
Dacă sistematizarea se face după o variabilă nenumerică vorbim de clasificarea
datelor
Clasificarea presupune împărţirea unităţilor în categoriile variabilei nenumerice
considerate.
Se pot determina următoarele tipuri de frecvenţe:
n
ni ni ni*% = 100 =
ni* = = 100 *
=1
se încadrează în fiecare clasă: ; sau r
n ;
n
r i
n
n
i i i =1
i =1 i =1
3
Sistematizarea datelor calitative
nominale
1. O mare agenţie de turism isi pregateste oferta turistica interna pentru vara anului 2013, pe care doreste sa
o lanseze la un targ de turism. Pentru aceasta, sunt selectati aleatoriu 30 dintre clientii agentiei si sunt
rugati sa precizeze care este destinatia turistica preferata pentru petrecerea concediilor. Variantele de
raspuns considerate sunt: pe litoral (L), la munte (M), la tratament (T) si in pelerinaj (P). Raspunsurile
clientilor au fost
Clientul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Destinatia L T T L M L P M L T L T M L M
Clientul 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Destinatia P P L L M M L M L M L L T L M
Sistematizaţi datele disponibile şi prezentaţi grafic informaţiile sistematizate.
4
1. Se creeaza baza de date in
Excel.
Rezolvare Excel
2. Se sorteaza ascendent cele 30 de linii (selectate in prealabil) dupa coloana „Destinatie turistica”.
5
Rezolvare în
3. Se afiseaza rezultatul ordonarii si se selecteaza cele doua
coloane cu date:
Excel
6
Rezolvare în EXCEL
4. Se determina subtotaluri pe fiecare grup de linii dupa „Destinatia turistica” (respectiv, la fiecare
schimbare a valorii din campul „Destinatie turistica” se numara celulele cu valoarea anterioara a campului
cu functia COUNT).
7
5. Se afiseaza rezultatul numararii valorilor pe grupuri dupa „Destinatia turistica”:
Rezolvare în
Excel
8
Sistematizarea datelor calitative nominale
Ponderea
Destinatia Nr. clienţi clienţilor
turistica Count (ni) Percentage(%
)
Litoral (L) 13 43,33
Munte (M) 9 30,00
Tratament (T) 5 16,67
Pelerinaj (P) 3 10,00
Total 30 100,00
Reprezentarea grafică:
• se utilizează diagrama prin coloane/benzi pentru
reprezentarea frecvenţelor absolute;
• se utilizează diagrama de structură pentru reprezentarea
grafică a structurii populaţiei observate;
9
Diagrama prin benzi/bare Diagrama de structura
Pelerinaj (P)
Destinatia turistica
10%
Munte (M)
Litoral (L)
30%
0 2 4 6 8 10 12 14
Nr. clienti
Litoral (L) Munte (M) Tratament (T) Pelerinaj (P)
*
frecvenţe relative ( ni ), care indică proporţia din numărul total de unităţi, care
ni ni r
n
ni n ni*% = 100 =
ni* = = i 100 *
=1
se încadrează în fiecare clasă: ; sau r
n ;
n
r i
n
n
i i i =1
i =1 i =1
frecvenţe cumulate crescător sau descrescător, absolute sau relative.
Dacă datele se referă la variabile măsurate pe scala ordinală, clasele vor respecta
criteriul de ordine.
11
Sistematizarea datelor calitative ordinale
Excelentă 11
Foarte bună 18
Bună 12
Satisfăcătoare 6
Nesatisfăcătoare 3
TOTAL 50
12
Diagrama prin
coloane (bare)
13
Diagrama de structura
(de tip pie-chart)
14
Sistematizarea datelor numerice
16
Sistematizarea datelor numerice
Reprezentarea grafică a unei serii de distribuţie de frecvenţe alcătuită după o variabilă numerică
discretă cu număr redus de valori distincte este poligonul frecvenţelor:
20
19
18
17
16
15
14
nr. manageri
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5
Nr. deplasari
17
Sistematizarea datelor numerice
B. Dacă variabila numerică este discretă şi are un număr
mare de valori distincte sau este continuă sistematizarea
presupune gruparea pe intervale de variaţie
Se obţine o serie de distribuţie de frecvenţe pe intervale.
Intervalul de variaţie reprezintă un şir de valori ale variabilei
studiate delimitat prin limita inferioară şi limita superioară.
Intervalele de variaţie pot fi de mărime egală sau neegală.
Pentru gruparea pe intervale de variaţie se recomandă
utilizarea unui număr moderat de grupe (5-10 grupe).
Numărul intervalelor depinde de numărul unităţilor statistice.
18
Alcătuirea intervalelor de variaţie
A. Determinarea numărului de intervale
Pentru alegerea numărului de intervale (r) se poate utiliza şi relaţia:
r = 1+ 3,322 log10 n ,
unde n reprezintă volumul colectivităţii.
B. Stabilirea mărimii intervalului (h) de variaţie
- se recomandă utilizarea intervalelor de mărime egală
A xmax − xmin
h =
r r
- mărimea intervalului se recomandă a se rotunji la o valoare convenabilă.
19
Alcătuirea intervalelor de variaţie
C. Sabilirea intervalelor
20
Gruparea dupa o variabila numerica
Intervale Frecvenţe
0-20 5
Câte ore aţi navigat pe Intervale Frecvenţe 20-40 10
pe site-uri turistice 10-35 10 40-60 9
în trimestrul trecut? 35-60 10 60-80 8
60-85 12 80-100 5
40 70 40 30 85-110 5 100-120 2
20 60 50 40 12
100 20 50 50 10
70 70 50 40
8
60 90 70 110
6
40 20 70 90
4
50 50 80 60
2
40 40 60 50 0
50 120 100 50
20.0 40.0 60.0 80.0 100.0 120.0 140.0
NR.ORE 21
Seria de distribuţie de frecvenţe pe intervale
În cazul seriilor de distribuţie de frecvenţe pe intervale se mai determină:
1. Centrul de interval = valoarea situată la jumătatea distanţei dintre limitele intervalului şi este
considerat reprezentativ pentru datele din interiorul intervalului:
hi xi inf + xi sup
xi = xi inf + sau xi = , i = 1, r .
2 2
2. Frecvenţa absolută cumulată crescător a unei grupe (Fci) = numărul unităţilor statistice care au
valoarea variabilei mai mică sau egală cu limita superioară a intervalului
i
Fci = n
k =1
k .
*
3. Frecvenţa relativă cumulată crescător a unei grupe ( Fci ) = procentul unităţilor statistice care au
valoarea variabilei mai mică sau egală cu limita superioară a grupei:
i
Fci* = n
k =1
*
k .
4. Frecvenţe absolute şi relative cumulate descrescător = numărul sau procentul unităţilor
statistice care au valoarea variabilei mai mare sau egală cu limita inferioară a intervalului
r r
Fdi = n
k =i
k , Fdi* = n
k =i
*
k .
22
Seria de distribuţie de frecvenţe pe intervale
23
Rezolvare Excel: functia
COUNTIFS
COUNTIFS(criteria_range1, criteria1, [criteria_range2, criteria2]…)
=countifs(A2:A41;">0";A2:A41;"<=20")
=countifs(A2:A41;">20";A2:A41;"<=40")
=countifs(A2:A41;">40";A2:A41;"<=60")
=countifs(A2:A41;">60";A2:A41;"<=80")
=countifs(A2:A41;">80";A2:A41;"<=100")
=countifs(A2:A41;">100";A2:A41;"<=120")
=countifs(A2:A41;">120";A2:A41;"<=140")
24
Rezolvare in Excel
Histogram
12 120,00%
10 100,00%
Frequency 8 80,00%
6 60,00%
4 40,00%
2 20,00%
0 0,00%
20 40 60 80 100 120 140 More
Frequency Cumulative %
Poligonul frecvenţelor
12
10
8
Nr. persoane
0
0 20 40 60 80 100 120 140 160
Nr. ore navigare Internet
27
Curbele frecvenţelor cumulate
45
40
Frecvente cumulate
35
30
25 Fci
20 Fdi
15
10
5
0
0 20 40 60 80 100 120 140 160
Nr.ore navigare
28
Reprezentarea grafică a seriilor de distribuţie de
frecvenţe pe intervale
Reprezentarea grafică:
◼ se utilizează histograma şi poligonul frecvenţelor pentru reprezentarea
distribuţiei variabilei (frecvenţe absolute sau relative)
◼ se utilizează diagrama de structură pentru reprezentarea structurii
populaţiei observate (frecvenţele relative)
14 35
12 30
10 25
Frecvente
Frecvente
8 20
6 15
4 10
2 5
0 0
10 20 30 40 50 60 70 80 90 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
Intervale Intervale
30
Distribuţii asimetrice
31
Distribuţia în formă de J
32
Distribuţia în formă de U
Distribuţia în formă de U este o distribuţie cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă
minimă în jurul intervalului central
33