Documente Academic
Documente Profesional
Documente Cultură
ISBN
DANIELA DUMBRVEANU
STATISTICA
APLICAT N
TURISM
EDITURA UNIVERSITAR
3
Bucureti, 2006
Capitolul 1
CUANTIFICAREA CA METOD DE STUDIU,
CERCETARE I CUNOATERE
A REALITII SOCIO GEOGRAFICE
1.1. Introducere
Geografia1 n mod asemntor altor discipline de
studiu sau tiine presupune un volum vast de informaie
cu care opereaz, de ordin cantitativ sau calitativ n funcie
de natura elementelor componente, a proceselor sau
fenomenelor dintr-un mediu anume. n marea majoritate a
cazurilor,
elementele
componente
ale
unui
mediu
evoluie
dezvoltare
necesit
condiii
de
cunoatere
tiinific
general,
complexe
se
realizeaz
pe
baza
elementelor
semnificative
din
categoriilor,
regularitilor,
legitilor.
(Isaic-Maniu
colab;
2003).
Astfel
n acelai
timp
cu elemente
individuale
cu
mpreun
manifestarea
fenomenelor,
de
statistic
posed
general
Funcia
descriptiv.
Cantitatea
de
15
limbaj
geografic
statistica
inductiv
sau
eantionarea
presupune
obligatoriu
analizei
statistice
este
dat
19
prognoze
probabile.
Astfel
predicia
unui
anumit
23
Statistics in Geography, a
Simple statistics; a
Colectivitile statistice
autorului
reprezint...
un
M.
arc,
ansamblu
Colectivitatea
de
fenomene
aceluiai
autor
colectivitile
se
de
vedere
al
tipologiei
sale
omogenitatea
dat
de
nsuirea
elementelor
timp
pentru
colectivitile
ale
cror
teritorial
reprezint
nsuirea
Iar
funcie
de
gradul
de
cuprindere
sau
Unitile statistice.
nemijlocit
observrii
statistice
observaia.
i
Ele
nregistrrii
sunt
supuse
nsuirile
lor
28
fi
spre
exemplu
persoana
cazul
autor
denumete
totalitatea
unitilor
unitii
respective.
Volumul
colectivitilor
se
unitilor
care
aparin
prin
colectivitilor respective.
c)
30
definiie
mai
sus
structur
algebric
specific
SA
proveniena,
obinerea
treapta
de
prin
msurtoare
sau
observaie
direct,
Terminologia
geografic
utilizeaz
marea
modul
de
exprimare
natura
lor,
sau
variabilele
cantitative
punct
de
vedere
pur
teoretic
statistic
37
fiind
natura
preponderent
proceselor
38
sau
variabilele
atributive
ori
reprezint
nomenclator
stabilit
diferite
astfel
nct
rubrici
ale
acestea
unui
s
fie
punct
de
vedere
pur
teoretic
statistic
40
41
Anexa 1.1.
Tabelul 1
Numrul de vizitatori n staiunile
balneoclimaterice romneti n perioada
1985 - 2000
Destinaiile de vacan ale unui eantion de
100 de studeni ai Facultii de Geografie,
Bucureti
Reprezentarea Spaniei ca destinaie turistic
ntr-un eantion de 10 brouri diferite
Comportamentul spaial al turitilor din
staiunea Poiana Braov n perioada 6 - 21
decembrie 2002
Contribuia turismului la PNB-ul arii n
perioada 1970 2000
Ghidul Lonely Planet pentru Europa de
Est
Percepia cetenilor britanici asupra
Romniei ca destinaie turistic
Ilustrate ale staiunii Mamaia din perioada
1970 2000
Preul unui pachet de vacan de 2 sptmni n Grecia la 10 agenii turistice diferite
Cantitatea de precipitaii din judeul Braov
din anii 1980 - 2000
Preul ceramicii artizanale din pieele
bucuretene
Pre cazare la Hotelurile din Judeul
Mehedini
Mesaje coninute de materialele
promoionale turistice ale Ungariei
42
secundar
primar
primar
primar
secundar
secundar
secundar
primar
primar
secundar
primar
prim.+ sec.
secundar
Exerciiul 1
Privii cifrele de mai jos n relaie cu ceea ce exprim ele.
Sunt asemntoare sau difer? Prin ce?
Cele mai
recente
destinaii
turistice:
Exprimai gradat
nivelul de
satisfacie al celei
mai recente
vacane, unde:
Numrul de
vizitatori la
muzeul
memorial Liviu
Rebreanu n
ultimii 5 ani:
1 = Croaia
2 = Ungaria
3 = SUA
4 = Maramure
5 = Egipt
1 = excelent
2 = bine
3 = satisfctor
4 = nesatisfctor
5 = ru
125.000
138. 258
132.289
120.610
125.000
Da / Nu
Diferena
1............................................................................................
Diferena
2............................................................................................
Diferena
3............................................................................................
43
Tabelul 2
Durata medie a sejurului pentru vizitatorii
oraului Sighioara
Densitatea schiorilor de pe prtia... din
Poiana Braov
Modul de prezentare al Franei ca destinaie
turistic de ctre Rough Guide
Mesaje coninute de materialele
promoionale turistice ale Ungariei
Numrul de vizitatori la Muzeul Militar
Central din Bucureti
Impresiile de cltorie ale vizitatorilor
Indiei n ghidurile de cltorie din secolul
XIX
Strategiile de dezvoltare turistic prevzute
de Ministerul turismului pentru patrimoniul
istoric
Poluarea vizual din Parcul Natural Porile
de Fier
Observaii asupra comportamentului
vizitatorilor Muzeului ranului Romn
Proporia vizitatorilor americani din
hotelurile oraului Manchester
44
cantitativ
cantitativ
calitativ
calitativ
cantitativ
calitativ
calitativ
calitativ
calitativ
cantitativ
Exerciiul 2
Observai cifrele de mai jos. Exprim o caracteristic
cantitativ sau una calitativ?
Destinaii de vacan Forme de
turism
Organizaii
turistice statutare
din Marea
Britanie
1 = Austria
2 = Tenerife
3 = Poiana Braov
4 = Grecia
1 = ETB
2 = WTB
3 = STB
4 = NITB
5 = BTA
1 = odihn
2 = tranzit
3 = afaceri
4 = conferine
Exerciiul 3
Determinai destinaia preferat de vacan a unui eantion
de populaie utiliznd ntrebarea: Unde v-ai petrecut o
parte din vacana de iarn?, i rspunsurile urmtoare:
1 = la munte
2 = la mare
3 = acas cu familia
4 = la bunici
5 = n strintate
6 = n vizit la rude sau prieteni
7 = alte situaii
Ce fel de variabile reprezint cifrele variantelor de
rspuns?
45
Exerciiul 4
Ce fel de variabile reprezint cifrele variantelor de
rspuns?
Indicai nivelul de
satisfacie atins n timpul
ultimei vacane de iarn
5 = excelent
4 = bine
3 = n regul
2 = nesatisfctor
1 = plictisitor; ru
5 = foarte de acord
4 = de acord
3 = fr opinie
2 = nu sunt de acord
1 = total mpotriv
46
Capitolul 2
PROCESUL DE GRUPARE A INFORMAIEI
GEOGRAFICE DE ORDIN STATISTIC
2.1. Gruparea informaiei geografice statistice
concept teoretic
Primul pas n utilizarea informaiei geografice de
ordin statistic n care se regsete i informaia strict
turistic, dup colectare este
sistematizare
sau
clasificare
acela de grupare,
a
evenimentelor
de
ordona,
ierarhiza
sistematiza
47
considerat
principiul
raional
al
orcrei
geografice
statistice
obinute
prin
eseiale,
comune
tuturor
unitilor
colectivitilor,
coninutul
indicatorilor
ce
informaiei
presupune
alegerea
unui
de
grupare
statistic
informaiei
Gruparea
unitilor
statistice
(respectiv
50
51
Salariai
Valori
absolute %
1
0,7
4
2,9
6
4,5
15
10,2
24
16,9
%
1,9 1,9
5,2 15,9
10,7
18,9
14,3
30 50
>50
TOTAL
38
46
143
27,2
34,1
100,0
53
54
de
timp,
unitile
colectivitii
se
se
i=
1, k
este
= xi xi 1
xi 1 + xi
2
ni
a xi
x max x min
1 + 3,322 log N
n care:
d
59
x max x min
k
k=
60
cnd
limita
superioar
face
parte
din
Numrul unitilor
0-5
5-10
10-15
15-20
20-25
Total
16
61
Tabelul 2.3.
Caracteristica
Numrul unitilor
0
5
10
15
20
25
Total
16
62
Caracteristica
Numrul unitilor
0,1-5,0
5,1-10,0
10,1-15,0
15,1-20,0
20,1-25,0
Total
16
informaiilor
suplimentare
cu
privire
la
63
Capitolul 3
INFORMAIA GEOGRAFIC
DE ORDIN STATISTIC PREZENTARE
I REPREZENTARE GRAFIC
3.1. Seriile de repartiie - terminologie,
importan i tipologie
Datele geografice de ordin statistic iniiale, obinute
n urma observrii fenomenelor i proceselor colective, se
prezint sub form brut ca o mas neordonat de date.
nainte ca acestea s fie supuse prelucrrii, analizei
ulterioare i generalizrilor, ele trebuie s fie ordonate,
grupate i sistematizate, astfel nct s permit obinerea
unei imagini clare asupra colectivitii la care se refer i
s se preteze la calcule algebrice ulterioare.
Ca rezultat al gruprii i centralizrii datele statistice
se sistematizeaz cu ajutorul unor tabele, sub forma a dou
iruri paralele de date, dintre care unul reprezint
variantele
sau
intervalele
de
vatiaie
ale
unei
64
65
frecvenelor
absolute
ale
nivelurilor
refer seria
n
i =1
egal cu unitatea:
k
f
i =1
f
i =1
66
100 = 100
=1
sau
ni
unde
fi =
n
i =1
100 =
ni
i =1
fi
100
i
i
67
distribuii
teoretice
la
demonstraia
privind
statistice,
sistematizate
cu
ajutorul
68
N(x k ) =
n
i =1
F(x
)=
f
i =1
distribuia
populaiei
dup
caracteristici
frecvene
transformate,
prin
mprirea
ni =
ni
xi
'
fi =
fi
xi
'
1 916 936
2 042 068
60 64
65 69
1 232 053
1 029 195
71
25 29
30 34
1 255 780
1 546 138
70 74
75 79
558 656
475 007
35 39
40 44
1 713 144
1 527 519
80 84
85 i peste
303 819
143 582
Total
22 810 035
73
Numrul
municipiilor
i oraelor
Sub 2000
2000 4999
5000 - 9999
10000 19999
20000 - 49999
50000- 99999
100000 - 199999
200000 - 999999
1000000 i peste
Total
1
10
54
86
61
23
13
11
1
260
Numrul populaiei
Persoane
%
1 969
37 848
414 173
1 183 395
1 910 006
1 723 713
1 827 016
3 226 154
2 067 545
12 391 819
*
0,3
3,3
9,6
15,4
13,9
14,8
26,0
16,7
100,0
* sub 0,1 %
Sursa: Anuarul statistic al Romniei 1993, CNS, Bucureti, p.91.
intervalelor. n general, se poate aprecia c oraele dintrun anumit interval au trsturi i roluri specifice n viaa
economico-social din zon.
Astfel, oraele mici sunt fie centre industriale,
comerciale sau agro-industriale nou nfiinate, fie centre
urbane mai vechi cu importan turistic restrns. Oraele
mari municipiile concentreaz n ele o important
activitate economico-social i cultural, i sunt nuclee
puternice de urbanizare pentru zonele din care fac parte.
3.2.1. Seriile unidimensionale de repartiie
i reprezentarea lor grafic
Pentru a uura analiza i generalizarea rezultatelor,
seriile statistice pot fi reprezentate grafic prin intermediul
punctelor, liniilor, suprafeelor i a altor forme geometrice,
prin figuri naturale i simbolice, precum i cu ajutorul
hrilor. Aceast metod intuitiv, flexibil i foarte util
pentru lmurirea, interpretarea i analiza fenomenelor i
proceselor social-economice, poart denumirea de metoda
reprezentrii grafice a informaiilor statistice inclusiv
geografice.
75
76
Nord
Vest
2
Est
1
0
50
100
Est
40
Vest
Nord
20
0
1
distribuiei.
suprafeele
Deoarece
coloanelor
sunt
este alegerea
78
invers
intervalele
prea
mici
frmieaz
60
Vest
40
Nord
20
0
1
80
grafice
construite
cu
ajutorul
suprafeelor
suprafaa
ptratului
volumul
colectivitii
const n
de unde
R=
5%
27%
11%
1 5%
20%
22%
83
cele
reprezentarea
grafic
distrubuiilor
85
xoy
se
construiete
reea
format
din
86
Variabila B
15
10
5
0
0
10
15
20
Variabila A
Figura 3.7b
25
20
15
10
0
0
10
12
14
bidimensionale
constituie
piramida
88
89
X: (x 1 , x 2 ,.....,x i ,.......,x n )
Y: (y 1 , y 2 ,.....,y i ,.......,y n )
Z: (z 1 ,z 2 ,.....,z i ,.......z n )
Aceste iruri de date pot fi eventual ordonate
cresctor sau descresctor, dup variantele uneia dintre
cele trei variabile.
Ca i n cazul distribuiilor bidimensionale, cnd
numrul unitilor statistice n este suficient de mare, se
recomand sistematizarea datelor iniiale sub forma unei
distribuii de frecven a celor trei variabile pe variante sau
pe grupe de variante ale caracteristicilor. Se obine, astfel,
un tabel statistic cu tripl intrare care cuprinde frecvenele
n ijk
=1,2,...., p; j = 1,2,..., q;
(i
k = 1,2,...., r) i frecvenele
marginale n . jk , n i.k , n . j . i n .k . .
timp
care
au
loc
dezvoltarea
aceea,
schemele
teoretice
ale
calculului
populaiei
obinut
cu
ocazia
diferitelor
animalelor
domestice,
obinut
pe
baza
recensmintelor etc.
Din aceast serie dinamic se poate constata c
populaia globului a nregistrat n era noastr un proces de
cretere continu, mai lent la nceput, apoi din ce n ce mai
accelerat pn n prezent.
Seriile de momente se caracterizeaz prin faptul c
indicatorii lor succesivi nu se pot nsuma, o asemenea
operaie nu ar avea un coninut real. Astfel, ar fi lipsit de
coninut i n discordan
cu realitatea
nsumarea
producia
industrial,
producia
agricol,
cstoriilor,
numrul
divorurilor,
numrul
seriile
de
intervale
se
obin
prin
94
variantele
caracteristicii
cercetate,
seriile
Numrul populaiei
10 000 000
11 168 000
12 898 000
(recensmnt)
12 419 000
14 280 129
(recensmnt)
16 126 063
(recensamnt)
95
25 ianuarie
21 februarie
15 martie
20 iunie
5 ianuarie
1 iulie
3 decembrie
1 iulie
1 iulie
7 ianuarie
1 iulie
1 iulie
1 ianuarie
15 872 624
17 489 450
19 103 163
20 000 000
21 559 910
22 201 387
23 000 000
23 206 720
23 185 084
22 810 035
22 755 260
22 730 622
22 656 145
(recensmnt)
(recensmnt)
(recensmnt)
(recensmnt)
(recensmnt)
96
calitative
care
se
produc
cadrul
teritoriul
sau
spaiul
(comuna,
judeul,
ara,
salariailor,
principalilor
indicatori
ai
98
spaial
fenomenelor
se
poate
economistul
nu
este
geograf
subzonele
individualitate
unui
proprie:
anumit
teritoriu
caracteristicile
au
geografice
104
Capitolul 4
ANALIZA RELAIILOR DINTRE
PROCESELE I FENOMENELE SOCIALE
4.1. Introducere
Statistica folosindu-se de metodele proprii de
cercetare, contribuie alturi de celelalte tiine la
descoperirea legilor, legitilor i regularitilor care se
manifest n interiorul i ntre fenomenele colective. De
altfel, problema fundamental a oricrei cunoateri
tiinifice, a oricrei tiine este descoperirea legilor care
acioneaz asupra fenomenelor care fac obiectul lor de
studiu.
Fenomenele i procesele din natur i societate iau
natere i se dezvolt sub influena aciunii unui mare
numr de factori principali i secundari, eseniali i
neeseniali, cuantificabili i necuantificabili sau cuantificabili cu aproximaie.
n aceast seciune vom depi aceast prim faz
descriptiv de studiere a legturilor dintre fenomene,
introducnd elemente noi de msurare mai precis a lor.
105
nu
este
aplicabil
fenomenelor
sociale
economice.
Fenomenul social-economice le este caracteristic
faptul c asupra lor acioneaz, alturi de cauze
determinate pentru legtura sau dependena cercetat,
numeroi ali factori nu luai n calcul, accidentali, a cror
aciune poate influena dezvoltarea lor. Acest fapt
determin existena unor legturi de forme i tipuri variate
ntre fenomene cu grade diferite de complexitate. Natura
106
exercit o anumit
109
ele.
Deci,
corelaia
este
intermediar
ntre
direcia
legturii,
forma
legturii
intensitatea ei.
a)
Dup
numrul
caracteristicilor
corelate,
solului,
msurile
agrotehnice,
condiiile
X 1 , X 2 , X 3 ,..... X n , iar
are
sens
contrar
variaiei
caracteristicii
statistice
elementare
de
studiere
Aceast
metod
ofer
posibilitatea
115
116
Capitolul 5
REZUMATUL I DESCRIEREA
INDICATORILOR CARACTERISTICILOR
STATISTICE UTILIZATE
N GEOGRAFIA UMAN
Aceasta
presupune
aplicarea
principiului
5.1.Indicatorii de poziie
Iindicatorii de poziie reprezint indicatorii ce redau
printr-o singur valoare numeric nivelul general al
valorilor seriei sau ordinul de mrime al acestor valori. De
exemplu variabila ce reprezint distribuia familiilor care
au optat pentru o destinaie n strintate dintr-o anumit
ar dup venitul lor lunar, exprimat n euro. Un indicator
de poziie va fi o valoare, s zicem veuro, care va reda
nivelul de ansamblu al ctigului familiilor respective.
118
valoarea
k i k i 1
( k i k i 1 ) + ( k i k i +1 )
Mo = 27,75 ani.
Subliniem nc o dat artificialitatea acestei valori,
nu att datorit ipotezelor folosite, ct faptului c
semnificia valorii modale este aceea de valoare tipic,
cea mai frecvent. Or, este limpede c n cazurile reale,
cnd valorile, orict de multe ar fi, sunt totui discrete, nu
se poate vorbi de o valoare modal, valoare la care se
ajunge doar n domeniul matematicii, n cazul variabilelor
aleatorii continue, printr-un proces de trecere la limit.
Ceea ce se poate eventual spune, invocnd valoarea
calculat cu formula de mai sus, este, interpretnd datele
exemplului nostru, c cele mai multe situaii de turiti cu
diagnostic, n 1985, sunt ale persoanelor aflate n jurul
vrstei de 27,75 ani.
n concluzie modul este un indicator de poziie
expresiv pentru caracteristicile calitative nominale sau
eventual ordinale i mai puin pentru cele intervale
indiferent de natura acestora din urm.
5.1.2. Mediana
Prezentarea valorii mediane, notat Me, ca indicator
al poziiei necesit o introducere n care se va defini
121
122
k i xi + k i +1 xi +1
k i + k i +1
Frecvene
Vrsta
Frecvene
cumulate
15-19 ani
253
Sub 15 ani
20-24 ani
2.269
Sub 20ani
253
25-29 ani
4.411
Sub 25 ani
2.522
30-34 ani
2.655
Sub 30 ani
6.933
35-39 ani
2.516
Sub 35 ani
9.588
40-44 ani
1.857
Sub 40 ani
12.104
45-49 ani
1.133
Sub 45 ani
13.961
50-54 ani
541
Sub 50 ani
15.094
55-59 ani
361
Sub 55 ani
15.635
60 i peste
344
Sub 60 ani
15.996
Total
16.340
Total
16.340
124
x=
1237,5 5
= 2,46
2516
126
127
x
=
i =1
n
Proprieti mai importante ale mediei sunt urmtoarele:
Media
aritmetic
rmne
neschimbat
dac
128
indicatorii din
zis
independent,
se
va
reduce
131
132
Pentru
rafinarea
procedurilorde
construcie
care se
134
S(a) =
(x
i =1
a) 2
n
Pentru o caracteristic dat, mrimea S(a) este n
funcie de valorile lui a. Aa cum abaterea medie atinge
minimul pentru cazul cnd valoarea de reper este mediana,
tot aa, se poate arta ( vezi, de exemplu, Yule i Kendall,
1969, p.147) c cea mai mic abatere medie ptratic este
cea fa de medie. Aceast form particular a abaterii
medii ptratice poart denumirea de abatere standard. Ea
se noteaz cu litera mic greceasc sigma
, i se obine
cu formula:
n
(x
i =1
x) 2
135
dou
distribuii
(ale
veniturilor
din
rile
respective).
Valoarea indicatorilor de dispersie este dependent
i de nivelul general al valorilor variabilei, exprimat, s
zicem, de valoarea medie. Pentru dou variabile de aceeai
natur, evaluate n aceleeai uniti de msur, abaterea
standard va fi, mai mare pentru cea cu media mai mare.
Pentru relevan se poate apela la un exemplu
contrastant, s presupunem c ne intereseaz greutatea
136
x
x
139
Anexa 2
Exerciiul 1: Determinai destinaia de vacan a unui
eantion de 17 studeni ai facultii dumneavoastr
utiliznd urmtoare ntrebare cu variante de rspuns:
Unde v-ai petrecut o parte din vacana de iarn?
1 = la munte
2 = la mare
3 = acas cu familia
4 = la bunici
5 = n strintate
6 = n vizit la rude sau prieteni
7 = alte situaii
Exemplu rspunsuri obinute la nivelul fiecrui student:
Rspunsuri: S1 =3, S2 =1, S3 = 3,S4 = 2, S5 = 1, S6 = 3, S7 =
3, S8 = 4, S9 = 3, S10 = 5, S11 = 3, S12 = 3, S13 = 6, S14 = 3,
S15 = 6, S16 = 3, S17 = 3
140
= 35
= 35
abaterii
standard
prin
aplicarea
formulei
142
Anul
1986
1987
1988
1989
Nv
2
2.8
3.5
5.1
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
6
5.5
5
5
5.3
5.7
4.9
4.5
4.5
4.5
4.5
Stadiul 1
Se calculeaz media aritmetic a irului de date
x
= 4,59
143
Stadiul 2
Se calculeaz diferena Nv -
Diferena Nv - x , ( x = 4.59)
-2.59
-1.79
-1.09
0.51
1.41
0.91
0.41
0.41
0.71
1.11
0.31
-0.09
-0.09
-0.09
-0.09
Nv - x
-2.59
-1.79
-1.09
5.1
6
5.5
5
5
5.3
5.7
4.9
4.5
4.5
4.5
4.5
0.51
1.41
0.91
0.41
0.41
0.71
1.11
0.31
-0.09
-0.09
-0.09
-0.09
0.26
1.988
0.828
0.168
0.168
0.504
1.232
0.096
0.008
0.008
0.008
0.008
Stadiul 4
Se calculeaz suma tuturor diferenelor ptrate
(Nv -
)2 = 16,372
Stadiul 5
Suma obinut se divide la numrul total de valori
existente n irul de date (15)
16,372 : 15 = 1, 0914
Stadiul 6
145
Acesta
= 1,044
146
147
Capitolul 6
STATISTICA INFERENIAL
INTRODUCERE
6.1. Introducerea termenilor de populaie
i eantion
n introducerea acestui capitol este poate util s fie
trecute n revist de data aceast n mod simplificat
elementele eseniale studiate teoretic n primul capitol
dar cu care ncepnd din acest punct se trece la aplicaii.
Folosit n sensul obinuit, noiunea de populaie
este foate adesea asociat cu aspectele demografice:
populaia unei ri, populaia unui ora etc. n statistic,
sensul dat noiunii de populaie este mai puin restrictiv:
se numete populaie mulimea indivizilor care au n
comun cel puin o caracteristic.
Urmeaz apoi noiunea de individ trebuie i ea
neleas intr-un sens larg. Nu este vorba neaprat despre
indivizi umani, ci i despre grupuri de persoane (familie,
grupuri
148
vzut,
de
asemenea,
aplicarea
metodei
termen
reunete
metodele
legate
de
151
154
Scor la test
Efectiv
30
31
32
33
34
35
36
37
38
39
40
0
1
2
3
5
8
5
3
2
1
0
155
Definiie
Orice distribuie care urmeaz legea normal poate fi
transformat n distribuie normal centrat i redus. n
acest scop, fiecare dintre valorile x ale distribuiei se
transform ntr-o valoare normal centrat i redus
(notat z) cu formula urmtoare:
z=
x mediadistributiei
abatereas tan dardadistributiei
z1= 1,87
31 35
z2= 1,87
32 35
z3= 1,87
33 35
z4= 1,87
34 35
z5= 1,87
z6= 1,87
= 2,13
z7= 1,87
= 1,60
z8= 1,87
= 1,06
z9= 1,87
= 0,53
z10= 1,87
40 35
z11= 1,87
35 35
= 2,6
36 35
37 35
38 35
=0
= 0,53
= 1,06
=1,60
39 35
= 2,13
= 2,6
157
158
14 11,5
= 0,78
3,2
De la descriere la inferen
Principiul general
Am vzut c legea normal centrat i redus
permite evaluarea frecvenelor de apariie a anumitor
valori ntr-un eantion al unei populaii date. Aceast lege
permite deci descrierea distributiei eantionului n funcie
de medie i de abaterea standard.
Foloasele ei merg ns mai departe. Plecnd de la
cunotiinele asupra eantionului (media, abaterea standard
i mrimea lui), putem estima mai mult sau mai puin
precis, parametri ce caracterizeaz populaia din care s-a
extras acest eantion. Plecnd de la anumii parametri ai
eantionului, ncercm extrapolarea lor la o populaie.
Trecem astfel de la procedur descriptiv la una
inferenial.
Se pune deci ntrebarea urmtoare: putem deduce
media i abaterea standard a unei populatii pornind de la
160
.
161
163
Aplicaie
S revenim la problema noastr. Am vazut c, dac
distribuia valorilor prelevate ntr-un eantion urmeaz o
lege normal, atunci: Media eantionului = Media
populaiei i
Eroarea de eantionare =
Abatereas tan dardaesantionului
.
n
x Mediadistributiei
Abatereas tan dardadistributiei
care, aici,
devine:
Mediaesantionului
Abatereas
tan dardaesantionului
z=
n
)
n
i
Media eantionului + (1,96
Abatereas tan dardaesantionului
)
n
Aplicaie
Gradul de satisfacie al unui grup de 280 de copii de
aceeai vrst aflai ntr-o tabr a fost examinat cu
ajutorul unei scale cu scoruri. Media scorurilor observate
a fost de 108, cu o abatere standard de 14,6. Dorim s
estimm, la pragurile de 0.05 i 0.01, media populaiei din
care s-a extras acest eantion.
In tabelul legii normale centrate i reduse se observ
c, la pragul 0.05, z = 1,96. Se poate calcula acuma
165
1,96
) =106,28;
280
1,96
) =109,71
280
inferioar
108 ( 2,56
limita
108 + ( 2,56
1,96
) = 105,76
280
superioar
1,96
) = 110,23
280
posibile
ale
eantioanelor
extrase
dintr-o
168
10
) = 93,2 ;
25
10
) = 102,8 .
25
169
nu
este
suficient
pentru
explicarea
(adic
nu
trebuie
existe
172
neparametrice
nu
impun
condiii
de
173
Capitolul 7
TESTELE N ANALIZA STATISTIC
APLICAT
Analiza statistic presupune aplicarea unor metode de
calcul datelor sau irurilor de date statistice n vederea:
testrii anumitor caliti, caracteristici ale acestora
stabilirii existenei unei relaii ntre acestea
determinarea tipului de relaii dintre acestea
determinarea semnificaiei relaiei dintre date
Aminteam la sfritul capitolului precedent faptul c n
statisic exist dou categorii de teste:
parametrice i
174
7.1. Corelaia
7.1.1. Introducere
Definiii.
Corelaia... reprezint un test utilizat pentru
exprimarea gradului de asociere sau a intensitii unei
relaii existente ntre dou valori sau mai multe
variabile(Goodall 1987)
175
(variaz
mpreun).
Adic
indic
dac
176
Variabila B
Fig. 7.1.
18
16
14
12
10
8
6
4
2
0
0
10
15
20
Variabila A
Rspuns corect: nu !
Dar n figura de mai jos?
Fig. 7.2.
25
20
15
10
0
0
178
10
12
14
25
20
15
10
5
0
0
10
15
180
Variabila B
16
14
12
10
8
6
4
2
0
0
10
15
20
Variabila A
Variabila B
20
15
10
5
0
0
10
15
20
VariabilaA
rs = 1 -
(d )
2
n3 n
Studiu de caz
Rmania, perioada 1991 - 2000
Variabila 1: PNB (per cap loc.)
Variabila 2: Numr vizitatori strini
An
PNB(US$)
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
Numr vizitatori
strini
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
183
Aparent
ele
co-variez,
avnd
tendin
184
Stadiul 2
Observnd datele i distribuia acestora situaia este
aparent i neclar. n acest caz, se formuleaz o ipotez.
aceasta de regul se bazeaz pe observaia efectuat. se
numete ipotez iniial i se noteaz cu H i. n cazul de
fa o ipotez Hi , evident. ar putea fi : Exist o relaie
ntre PNB i numrul de vizitatori strini n Romnia
n perioada 1991 2000
Conform conveniei statistice n rigoare aceast
ipotez se exprim ntotdeauna negativ. Adic invers
dect pare s fie situaia. .
Aceasta ipotez se numete ipoteza nul i se noteaz
cu HO. i dac aparent exist o relaie ntre cele dou,
ipoteza nul se va exprima:
185
Stadiul 3
Se construiete un tabel cu 6 coloane n care se nscriu
mai nti datele exsitente, utilizndu-se primele 2 coloane
(1 i 2)
Variabila 1
Variabila 2
(PNB)
(vizitatori)
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
186
Stadiul 4
Se acord rang de mrime valorilor variabilei 1 (i.e.
cea mai mare valoare =1, urmtoarea = 2 etc). nscriei
rangul fiecrei valori n coloana 3.
Stadiul 5
n mod similar acordai rang de mrime valorilor
variabilei 2. nscriei rangul fiecrei valori n coloana 4.
Tabelul va arta acum aa!
Variabila 1
Variabila 2
Rang
Rang
(PNB)
(numr
Varia-
Varia-
vizitatori)
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
5,264,000
bila 1
8
10
9
7
5
6
4
1
3
2
bila 2
5
1
3
2
4
8
9
10
7
6
1243
859
1159
1323
1564
1563
1565
1872
1585
1645
187
Stadiul 6
Se calculeaz diferena dintre ranguri (rang 1 rang
2). Adic din coloana 3 se scade coloana 4. Diferena de
rang se noteaz cu d i se nscrie n coloana 5.
Variabi
Variabila 2
Rang
Rang
la 1
(numr
Varia-
Variabila
(PNB)
1243
859
1159
1323
1564
1563
1565
1872
1585
vizitatori)
5,359,000
6,401,000
5,786,000
5,898,000
5,445,000
5,205,000
5,149,000
4,831,000
5,224,000
bila 1
8
10
9
7
5
6
4
1
3
5
1
3
2
4
8
9
10
7
2
3
9
6
5
1
-2
-5
-9
-6
1645
5,264,000
-4
Stadiul 7
Se ridic la ptrat d (diferena de rang). Aceasta se
noteaz cu d2 i se nscrie n coloana 6.
Variabila
Variabila 2
1 (PNB)
(numr
1243
188
vizitatori)
5,359,000
Rang
Rang
d2
Variabila Variabila 2
1
8
859
1159
6,401,000
5,786,000
10
9
1
3
9
6
81
36
1323
1564
1563
5,898,000
5,445,000
5,205,000
7
5
6
2
4
8
5
1
-
25
1
4
2
-
25
10
5
-
81
16
16
1565
1872
5,149,000
4,831,000
4
1
1585
5,224,000
9
-
1645
5,264,000
4
4
Stadiul 8:
Se calculeaz d2 adic suma tuturor valorilor d2.
d2 = 294
189
Stadiul 9:
Utilizai datele obinute n formula urmtoare:
rs = 1 -
(d )
2
n3 n
unde
rs = este coeficientul de corelaie)
n = numrul de perechi ale variabilelor 1i 2 (sau A
i B)
6 294
1000 10
1764
=1
990
= 1 1,78 = 0,78
=1
analizeaz
semnificaia
coeficientului
de
p = 0.01
Cu ct
191
95%
(p = 0.05)
99%
(p= 0.01)
1.000
0.886
0.786
0.738
0.683
0.648
0.591
0.544
0.506
1.000
0.929
0.881
0.833
0.794
0.777
0.715
0.665
p = 0,01
193
Stadiul 11
Cel mai important lucru din punct de vedere al
tiinelor sociale i deci i al turismului este interpretarea
i analiza rezultatelor. Ce nseamn
valoarea lui rs i
faptul c am acceptat Hi ?
n final oricine poate calcula un coeficient de
corelaie. Important este cum este interpretat rezultatul i
ce nseamn el!
Pn aici s-a stabilit (ce-i drept, tiinific) faptul c
exist o relaie. Care este, ns natura relaiei dintre PNB i
numrul vizitatorilor strini din Romnia n perioada
1991-2000?
De ce numrul turitilor strini pare s scad n timp
ce al PNB-ului s creasc?
Ce putem spune despre contribuia turismului la
PNB-ul Romniei?
194
Stadiul 12:
Se scriu intepretrile. Aici este locul i momentul n
care se folosete coeficientul de corelaie, pentru
interpretarea rezultatelor
De regul se folosete formula:
Exist o puternic corelaie negativ ntre PNB
inumrul de vizitatori strini n Romnia n perioada
1991 2000 (rs = -0.78,
p = 0.05).
Acest fapt se
datoreaz
195
7.2.1. Introducere
Pentru a pune ntreaga tem ntr-un context clar i
logic este necesar n acest moment o trecere n revist a
teoriei funciilor statisticii.
Din punctul de vedere al tiinelor sociale (inclusiv a
turismului i ) statistica devine util prin cele 4 funcii de
baz ale sale:
funcia descriptiv
funcia deductiv
funcia semnificaiei
funcia prognozrii
196
eantionarea
presupune
obligatoriu
datele
selective,
eantioanele,
includ
analizei
statistice
este
dat
populaiei
statistice.
Aceste
valori
mrimea
200
se
testa
diferenele
presupuse,
(incluse,
diferite.
Comportamentul
decizional
asupra
mai bine
cunoscute:
Testul T, un test parametric
Testul U sau Mann Whitney, un test
neparametric
Testul Wilcoxen sau testul perechilor legate
de
asemenea
un
test
neparametric
sau
neparametric
7.2.4. Testul Usau Mann Whitney
Fiind un test de semnificaie statistic va presupune
automat
compararea
dou
eantioane
de
date,
U = nanb +
na ( na + 1)
ra
2
Condiii de aplicare:
a) Date ordinale sau intervale
b) 2 seturi de date necesar a fi comparate ( nu este
necesar un numr egal de perechi de variabile)
c) Minimum 4 valori din fiecare set de variabil
d) IPOTEZE, Ho - ca punct de pornire, n replic
pentru
Hi.
Ipoteza
nul
(H0)
presupune
este acela de a
unei
diferene
semnificative,
203
Turiti romni
cazai la
Bile
Herculane
1991
1992
72211
42968
64537
56566
1993
1994
72352
113242
39182
40989
1995
1996
1997
95085
96631
66268
46227
47271
48885
1998
1999
75441
100606
32293
31515
2000
110286
Stadiul 1:
n funcie de tipul de date pe care le deinem se
calculeaz media aritmetic sau mediana.
205
care
presupune
semnificative. Astfel:
206
existena
unei
diferene
Variabla B
(Turiti romni
cazai la Bile
cazai la Drobeta
Herculane)
Turnu Severin)
72211
42968
72352
113242
95085
96631
66268
75441
100606
110286
64537
56566
39182
40989
46227
47271
48885
32293
31515
207
Stadiul 4:
Acordai ranguri de importan tuturor valorilor, n
ordine
cresctoare.
Pentru
acordarea
rangului
de
12
Variabla B
(Turiti romni cazai
la Drobeta Turnu
Severin)
64537
42968
72352
5
13
56566
39182
9
3
113242
95085
19
15
40989
46227
4
6
96631
66268
75441
16
11
14
47271
48885
32293
7
8
2
100606
17
31515
208
ra
rb
10
110286
18
ra
1
2
3,5
5,5
11
12
VB
45
50
58
62
69
70
rb
3,5
5,5
7
8
9
10
Stadiul 5:
Se calculeaz separat suma ranguilor variabilei A,
notat cu ra.
ra =
140
209
Stadiul 6:
n mod similar se calculeaz suma rangilor variabilei
B, notat cu rb.
rb = 50
Stadiul 7:
Formula pentru testul U este:
U = nanb +
unde:
na ( na + 1)
ra
2
10 11
140
2
= 90 + 55 140 = 5
Stadiul 8:
Variabila B:
210
U = nanb +
nb ( nb + 1)
rb
2
U = (10 9 ) +
10 11
50
2
= 90 + 55 50 = 95
Stadiul 9:
Dintre cele dou valori U se alege prin convenie
valoarea cea mai mic. n cazul studiului de caz de mai
sus, este vorba despre Ua = 5
Stadiul 10:
Se decide nivelul gradului de confiden la care
dorim s avem rezultatul. De regul n tiinele sociale se
lucreaz cu cel puin 95% adic p = 0.05
Stadiul 11:
Se face apel la tabelele consacrate cu valori critice
ale gradului de confiden pentru testul U n vederea
stabilirii acestora la p = 0.05 (95%)
211
nb
na
1
2
3
4
5
6
7
8
9
10
11
12
0
0
0
0
1
0
1
1
2
2
3
3
4
10
11
12
0
1
2
3
4
4
5
6
7
0
1
2
3
5
6
7
8
9
11
1
2
3
5
6
8
10
11
13
14
1
3
5
6
8
10
12
14
16
18
0
2
4
6
8
10
13
15
17
19
22
0
2
4
7
10
12
15
17
20
23
26
0
3
5
8
11
14
17
20
23
26
29
0
3
6
9
13
16
19
23
26
30
33
1
4
7
11
14
18
22
26
29
33
37
212
Stadiul 12:
Dac valoarea de test U aleas (cea mai mic dintre
cele dou calculate) este mai mic sau egal cu valoarea
critic a gradului de confiden stabilit, p = 0,05 atrage
dup sine RESPINGEREA ipotezei nule.
n acest caz valoarea critic este 20 iar valoarea de
test U = 5.
Ipoteza nul = nu exist o diferen semnificativ
ntre numrul turitilor cazai la Bile Herculane i cei
cazai la Dr.Tr. Severin n perioada 1991 2000; se
respinge.
Se accept ipoteza iniial, conform creia exist o
diferen semnificativ ntre numrul turitilor cazai la
Bile Herculane i cei cazai la Dr.Tr. Severin n perioada
1991 2000
Stadiul 13:
Iportant!
214
215
datele aceleiai
2000
Austria
63,000
66,000
Belgia
18,000
19,000
Danemarca
9,000
10,000
216
2000
2001
Ianuarie
25
20
Februarie
30
29
Martie
50
48
sau
b)
217
dintre
variabile
este
foarte
imoprtant.
Mod de calcul
Studiu de caz: serii de date privind gradul de
ocupare (%) al hotelurilor din Bile Herculane i Drobeta
Turnu Severin n perioada 1991-2000
Bile Herculane
1991
1992
1993
1994
218
36
31
38
41
Drobeta Turnu
Severin
45
30
24
38
1995
1996
1997
1998
1999
2000
43
35
29
37
41
45
32
32
54
49
44
43
219
Stadiul 1:
Se formuleaz ipoteza nul (Ho) asupra seriilor de
date n concordan cu o ipotez iniial (.H i). (Ho
ntotdeauna exprim negativul/inversul ipotezei iniiale
Hi):
Ex. Nu exist o diferen semnificativ n gradul de
ocupare al hotelurilor din Bile Herculane i Drobeta
Turnu Severin n perioada 1991-2000
Stadiul 2:
Se construiete un tabel cu 6 coloane. n coloanele 1
i respectiv 2 se introduc seriile de date (denumite pentru
convenien variabile: A=Bile Herculane
B=Drobeta Turnu Severin)
B
(Turnu
(Herculane)
36
31
38
41
220
Severin)
45
30
24
38
i respectiv
43
35
29
37
41
45
32
32
54
49
44
43
Stadiul 3
Se calculeaz diferena aritmetic dintre A i B (AB). Rezultatul obinut amplaseaz n coloana 3 ignornd
semnul (+;-)
A
A-B
36
45
31
38
30
24
1
14
41
43
38
32
3
11
35
29
32
54
3
25
37
41
49
44
12
3
45
43
Stadiul 4
221
(A B)
Rang de
(A-B)
36
31
45
30
9
1
6
1
38
41
43
24
38
32
14
3
11
9
4
7
222
35
29
32
54
3
25
4
10
37
41
49
44
12
3
8
4
45
43
Stadiul 6
Se
compar
pe
rnd
valorile
din
perechile
A-B
Rang de A>B
36
31
38
41
43
35
29
37
45
30
24
38
32
32
54
49
9
1
14
3
11
3
25
12
A-B
6
1
9
4
7
4
10
8
B>A
6
1
9
4
7
4
10
8
223
41
45
44
43
3
2
4
2
4
2
Stadiul 7
Se calculeazi suma rangurilor pe fiecare coloan n
parte (A>B i B>A din coloanele 5 i 6).
A
A-B
Rank
36
31
38
41
43
35
29
37
41
45
45
30
24
38
32
32
54
49
44
43
9
1
14
3
11
3
25
12
3
2
of A-B
6
1
9
4
7
4
10
8
4
2
A>B
B>A
6
1
9
4
7
4
10
8
4
2
224
T = 27
Stadiul 9
Se decide cu ce grad de confiden se lucreaz (95%
sau 99%) pentru stabilirea semnificaiei rezultatului.
Se continu fcnd apel la tabelele consacrate, ale
valorilor critice pentru testul Wilcoxen. n cazul n care a
fost redus numrul de perechi n timpul calcului el se
reduce i la interpretare. Exempl daca au fosrt eliminate 2
perechi din calcul la interpretare n loc de 10 perechi se va
urmri valoarea critic pentru 8 perechi.
Nr perechi A i B
6
7
8
9
10
11
12
13
14
15
16
P=0.05
0
2
4
6
8
11
14
17
21
25
30
P=0.01
0
2
3
5
7
10
13
16
20
225
17
18
19
20
35
23
40
28
46
32
52
38
Dac valoarea obinut pentru T este mai mic dect
Stadiul 9
Interpretarea rezultatului obinut:
n studiul de caz de mai sus s-a demonstrat
statistic faptul c nu exist o diferen, semnificativ, n
gradul de ocupare al hotelurilor din Bile Herculane i
Drobeta Turnu Severin n perioada .... (n ciuda faptului c
aparent exista o diferen valoric).
De ce?
226
Stadiul 10
Analiza i exprimarea rezultatului final:
Dac ar fi existat o diferen semnificativ analiza ar
fi fost exprimat ncepndu-se cu formularea:
Exist o diferen (relaie) semnificativ ntre
gradul de ocupare din Bile Herculane i Drobeta
Turnu Severin; T = 2,
p = 0.01.
Aceasta se
datoreaz......
n cazul nostru nu exist o diferen semnificativ
ntre cele dou pentru T = 2, p = 0.01. Aceast realitate
se datoreaz faptului c n calcul este luat gadul de
ocupare i dei cele dou locaii sunt diferite ca destinaie
turistic, caracterizndu-se prin tipuri dierite de turism ele
se afl n aceeai zon turistic, la distan relativ mica
una de cealalt. Factorul care ns determin inexisten
diferenei semnificative este raportul numr locuri cazare
destinaie turistic.
227
228
diferenei
la
nivelul
datelor
selective
general
fost
vorba
despre
date
situaia
invers:
se
compar/testeaz
229
Testul de contingen
Ce este contingena?
Contingena
Contingena msoar gradul de relaionare sau
intensitatea legturii dintre dou elemente, fenomene,
procese,n
final
dintre
variabile/seturi
de
date
selective/eantioane.
Cu alte cuvinte fiind vorba de date independente,
contingena msoar modul n care un aspect, o variabil,
un set de date influeneaz sau este influenat de un altul/a.
Astfel n limbajul de specialitate apar formulri de
genul: unele variabile sunt contingente cu altele sau dein
un contingent asupra altora.
EX:
Clasa
social
are
contingent
asupra
230
Reamintim ce exprim corelaia i aume o covariaie. Aceasta indic pur i simplu faptul c o variabil
prezint
anumit
tendin
sau
are
un
anumit
mai
cunoscut
test
pentru
variabile independente.
sau intervale.
231
elemente.
Mod de aplicare
clasific
datele
utilizate
n:
232
Studiu de caz
Date provenite de la Comisia Naional pentru
Statistic privind numrul vizitatorilor strini n Romnia
pentru anii 1985 i respectiv 1995, n funcie de motivaia
vizitei.
233
234
1995
Total
2498
2274
4772
2607
5105
2838
5112
5445
10217
Stadiul 3
Se examineaz valorile observate. n cazul n care
exist valori egale cu 0 ntregul test devine invalid!
Stadiul 4
Se calculeaz valorile PRESUPUSE. (adic valorile
ATEPTATE sau presupuse de test n cazul n care nu ar
exista nici o relaie ntre cele 2 variabile)
n
calculul
valorilor
presupuse
se
pornete
236
1985
Vizite
1995
Total
O
2498
P
2384.4
O
2274
P
2387.6
4772
2607
2720.6
2838
2724.4
5445
pentru
vacan
Vizite
pentru
alte
motive
5105
Total
5112
10217
Stadiul 5
Se examineaz valorile presupuse. n cazul n care
exist valori mai mici dect 5, testul devine invalid i se
abandoneaz.
Stadiul 6
Se calculeaz X2 dup formula:
2
(O P)
=
Se calculeaz diferena (O P)
Se ridic la ptrat fiecare rezultat
Acesta se mparte la valoarea presupus respectiv
Se calculeaz suma tuturor rezultatelor obinute
1985
O
P
1995
O
P
Tota
Vizite pentru
249
2384.
5.
227
2387.
5.
l
477
vacan
Vizite pentru
8
260
4
2720.
4
4.
4
283
6
2724.
4
4.
2
544
alte motive
Total
7
510
8
511
5
102
17
Stadiul 7
Se calculeaz gradul de libertate (gf), revenindu-se
la stadiul 2 (tabelul de contingen), ignornd totalurile.
238
239
Stadiul 9
Se face apel la tabelul valorilor critice al gradului de
confiden pentru testul X2.
95%
99%
99.9%
(p=0.05)
(p=0.01)
(p=0.001)
libertate
1
3.84
6.64
10.83
5.99
9.21
13.82
7.82
11.34
16.27
9.49
13.28
18.46
11.07
15.09
20.52
12.59
16.81
22.46
14.07
18.48
24.32
15.51
20.09
26.12
Grad de
Stadiul 10
240
Dac valoarea
241
242
BIBLIOGRAFIE
244
245
246
247
248
249
250
251
252
253
254
255
CUPRINS
Capitolul 1........................................................................5
Cuantificarea ca metod de studiu, cercetare
i cunoatere a realitii socio geografice........................5
1.1. Introducere........................................................5
1.2. Funciile statistice...........................................14
1.3. Noiuni statistice fundamentale cu
semnificaie n geografia uman......................22
Capitolul 2......................................................................45
Procesul de grupare a informaiei geografice
de ordin statistic..............................................................45
2.1. Gruparea informaiei geografice
statistice concept teoretic..............................46
2.2. Tipurile de grupri ale informaiei
geografice statisice...........................................50
2.3. Intervalele utilizate n grupare........................56
Capitolul 3......................................................................63
Informaia geografic de ordin statistic
prezentare i reprezentare grafic..................................63
256
258
259