Sunteți pe pagina 1din 34

STATISTICĂ ÎN COMERŢ, TURISM,

SERVICII

Utilizarea sondajului statistic în


analiza fenomenelor din comerţ,
turism, servicii

CURS 6 – 29.03.2021
1
Sondajul statistic.
Necesitate; avantaje şi dezavantaje

⚫ Este o metodă de cercetare statistică parţială, de regulă special


organizată, care înlocuieşte o observare totală, de mare
amploare, mai dificil de organizat şi mare consumatoare de
resurse.
⚫ Avantajele sondajului:
– Economie de resurse;
– Obţinerea în timp operativ a unor informaţii necesare şi suficiente;
– Permite înregistrarea mai multor variabile;
– Utilizarea unor echipe de specialişti în toate etapele cercetării statistice –
reducerea erorilor
– Controlul calităţii producţiei
⚫ Dezavantaj: rezultatele obţinute în urma aplicării sondajului nu
reflectă cu certitudine situaţia reală din populaţia totală, ci pot fi
însoţite de o serie de erori.

2
Terminologie

⚫ Parametrul statistic este un indicator statistic ce


caracterizează o distribuţie statistică la nivelul
populaţiei totale (cu valoare necunoscută).
⚫ Estimatorul este un indicator statistic obţinut pe
baza datelor dintr-un eşantion, şi care este utilizat
pentru aproximarea unui parametru necunoscut la
nivelul unei populaţii statistice.
⚫ Eşantionul statistic o submulţime a unităţilor
statistice dintr-o populaţie.

3
Terminologie
N

• Media populaţiei investigate x i


= i =1
n
N
• Media de eşantion (de selecţie) – estimator x i
x= i =1
pentru media populaţiei investigate n
N

• Dispersia populaţiei investigate  (x i − )


2

2 = i =1

• Dispersia de eşantion (de selecţie) – estimator pentru


dispersia populaţiei investigate  (x − x )
n
2
i
s2 = i =1
n −1

4
Terminologie

Notații utilizate în sondajul aleator simplu, pentru o


variabilă non-alternativă
Indicator Populația totală Eșantion
Volumul N n
Media µ

Dispersia σ2 s2
Abaterea standard σ s

5
Delimitări conceptuale

• Sondajele probabiliste (aleatoare)


-sunt definite prin aceea că alocă fiecărei unităţi din populaţia totală o
probabilitate egală şi nenulă de a aparţine eşantionului
-au avantajul că permit studierea şi calcularea preciziei estimatorilor şi au un
caracter ştiinţific riguros

•Anchetele sau sondajele nealeatoare (dirijate)


- se bazează mai mult pe considerente subiective, deci sunt discutabile
şi în consecinţă sunt mai puţin riguroase
- nu utilizează probabilităţi în extragerea unităţilor şi ca urmare precizia
estimatorilor nu poate fi determinată
- utilizarea lor este justificată mai mult din cauza unor constrângeri bugetare
sau atunci când sondajele aleatoare nu pot fi aplicate
6
Principalele tipuri de sondaje
probabiliste (aleatoare)

• Sondajul aleator simplu (SAS) – din populaţia statistică


studiată se extrage un eşantion de dimensiunea dorită utilizând o
metodă aleatoare.
• Sondajul aleator stratificat (SS) – populaţia statistică este
împărţită în prealabil (utilizând diverse criterii) în mai multe straturi.
Din fiecare strat se extrage un eşantion. Reuniunea acestor
eşantioane formează eşantionul final

• Sondajul aleator de tip cluster – populaţia statistică studiată este


împărţită în serii/ grupe/ clustere (de exemplu: o populaţie de
studenţi este împărţită în grupe). Se extrage apoi, în mod aleator, un
anumit număr de grupe/ clustere astfel create. Toate unităţile
statistice din grupele selectate formează eşantionul ce va fi ulterior
7
investigat.
Modalităţi de eşantionare.
Eşantionarea simplă aleatoare

⚫ Exemplu:
– populaţia este de volum 20
– extragerea unui eşantion aleator de volum 5
– se generează aleator 5 numere între 1 şi 20: 14, 2, 6, 9, 18
– eşantionul va fi format din unităţile 2, 6, 9, 14, 18 din populaţia generală 8
Modalităţi de eşantionare
Eşantionarea prin stratificare

⚫ presupune împărţirea Populaţia totală


populaţiei în r grupe după un
1 2 3 4
anumit criteriu (o Eşantionul
caracteristică), de efective 1 2 3 4
N1,..., Nr şi selecţia aleatoare 2 5
5 6 7
din fiecare strat a n1,..., nr
7 3
unităţi. 1 2 3 4 5
⚫ are o reprezentativitate 1
6 7 8 9
superioară celei obţinute prin
tehnica simplă aleatoare 20%
4 1
= = 20%
20 5
⚫ presupune existenţa unor 7 40%
= 35%
informaţii suplimentare 20
9 40%
= 45%
referitoare la populaţie 20

9
Modalităţi de eşantionare
Eşantionarea de tip cluster

⚫ Exemplu: anchetă asupra cuantumului cheltuielilor cu întreţinerea şi


utilităţile într-un cartier al unui oras. Se aleg aleatoriu mai multe blocuri
din cartierul respectiv. Toate apartamentele din blocurile selectate vor
face parte din eşantion.

10
Modalităţi de eşantionare
Eşantionarea multistadială

⚫ alegerea în primul stadiu a unui eşantion probabilistic


de grupuri
⚫ în stadiul al doilea din fiecare grup selectat se alege
aleator un eşantion de indivizi
1
2 ⚫ mai puţin reprezentativă decât eşantionarea simplă
3
4
aleatoare de acelaşi volum
5
6
⚫ costurile sunt mult mai mici
7
8
9 2 2
10 6 6
11 9 9
12 14 14
13 18 18
14
15
16
17
18
19 11
20
Modalităţi de eşantionare
Eşantionarea pe cote

⚫ procedură de eşantionare Populaţia totală


nealeatoare
⚫ când se cunoaşte distribuţia Eşantionul
populaţiei după anumite
caracteristici, selecţia se va
face astfel încât eşantionul să
aibă aceeaşi distribuţie
procentuală cu populaţia totală
⚫ cu toate că nu este aleatoare 4 1 20%
= = 20%
este foarte utilizată în practică, 20 5
7 40%
= 35%
datorită costurilor reduse şi 20
9 40%
= 45%
reprezentativităţii destul de 20

ridicate a eşantionului
12
Procedee de extragere aleatoare a
eşantionului

Tipuri de selecţie: Număr eşantioane:


- cu revenire (vezi tragerea loto “Noroc”) Nn
- fără revenire (vezi tragerea loto 6 din 49) C Nn

Metode de selecţie:
– procedeul loteriei
– tabele cu numere aleatoare
– mecanică sau sistematică
– utilizând produse software
de specialitate
13
Despre erorile ce apar în cazul
cercetărilor statistice

• Erorile de eşantionare
- sistematice – apar în urma încălcării regulilor teoretice ale sondajelor
- întâmplătoare – specifice cercetărilor prin sondaj
• Erorile de observare (de înregistrare)
- erori datorate dificultăţilor de vocabular (limbaj prea savant, folosirea
unor cuvinte cu sens incert etc.)
- erori datorate neînţelegerii corecte a întrebărilor (de exemplu: diferenţa
între venit total şi venit salarial)
- erori datorate solicitării memoriei
- erori datorate lipsei sincerităţii în furnizarea informaţiilor
- erori cauzate de anchetatori.

• Erorile datorate non-răspunsurilor 14


Distribuția de eșantionare

15
Cum se formează o distribuție
de eșantionare

A B D
⚫ Fie o populație … C

⚫ De volum N=4
⚫ Variabila statistică (X)
este vârsta
⚫ Valorile lui X:
18, 20, 22, 24 (ani)

15
Cum se formează o distribuție de
eșantionare
Indicatori statistici ai distribuției variabilei în Populația totală:

μ=
 X i P(x)
N
.25
18 + 20 + 22 + 24
= = 21
4

 (X − μ) 2 0
18 20 22 24 x
σ= i
= 2.236
N A B C D
Distribuție uniformă

16
Cum se formează o distribuție de
eșantionare
Acum considerăm toate eșantioanele posibile
de volumn = 2

1st 2nd Observation


Obs 18 20 22 24 16 Medii ale
18 18,18 18,20 18,22 18,24 eșantioanelor
20 20,18 20,20 20,22 20,24 1st 2nd Observation
22 22,18 22,20 22,22 22,24 Obs 18 20 22 24
24 24,18 24,20 24,22 24,24 18 18 19 20 21
20 19 20 21 22
16 eșantioane posibile 22 20 21 22 23
(eșantionare repetată)
24 21 22 23 24
17
Cum se formează o distribuție de
eșantionare
Distribuția de eșantionare a tuturor
mediilor de selecție

16 medii de selecție Distribuția


mediilor de
1st 2nd Observation _ selecție
Obs 18 20 22 24 P(X)
.3
18 18 19 20 21
.2
20 19 20 21 22
22 20 21 22 23 .1

0 _
24 21 22 23 24 18 19 20 21 22 23 24 X
18
Nu mai este uniformă
Cum se formează o distribuție de
eșantionare
Indicatori statistici ai distribuției de eșantionare:

(X) =  (X ) =
i
 X i
=
18 + 19 + 21 +  + 24
= 21 = μ
N 16

σX =
 ( X i − μ)2

N
(18 - 21)2 + (19 - 21)2 +  + (24 - 21)2
= = 1.58
16
19
Compararea distribuției Populației
cu distribuția de eșantionare
Populația Distribuția mediilor de selecție
N=4 n=2
μ = 21 σ = 2.236 μ X = 21 σ X = 1.58
_
P(X) P(X)
.3 .3

.2 .2
.1 .1
0 X 0
18 19 20 21 22 23 24
_
18 20 22 24 X
A B C D
20
Indicatori ai distribuţiei de
eşantionare

⚫ Media distribuţiei de eşantionare: media tuturor


eşantioanelor posibile – este egală cu media
populaţiei totale.
( )
 Xi = μ
⚫ Dispersia distribuţiei de eşantionare: este dispersia
mediilor eşantioanelor în jurul mediei populaţiei
totale şi este de n ori mai mică decât dispersia
populaţiei totale:

22
Indicatori ai distribuţiei de
eşantionare
⚫ Abaterea standard a distribuţiei de eşantionare:

este abaterea standard a mediilor eşantioanelor în jurul


mediei populaţiei totale (Eroarea standard a mediei):

σ s
σX = 
n n

⚫ Arată cu cât se abat în medie media de selecţie Xi în


jurul mediei generale (μ)
⚫ Este direct proporţională cu variaţia din eşantion şi
invers proporţională cu volumul acestuia. 23
Teorema limită centrală

⚫ Dacă dintr-o populaţie totală de volum N, de medie μ şi


abatere standard σ, se extrag aleator eşantioane de
volum n, atunci, indiferent de forma populaţiei totale,
distribuţia de eşantionare a mediilor de selecţie X este
normală, dacă n este suficient de mare (n>30):

μX = μ σ s
şi
σX = 
n n
24
Proprietăţile distribuţiei de
eşantionare

μx = μ Distribuţia
populaţiei totale

μ x
Distribuţia de
eşantionare (are
aceeaşi medie, dar
dispersie mai mică)
μx
x
25
Teorema Limită Centrală
n↑ Distribuţia de
Pe măsură eşantionare
ce volumul devine aproape
eşantionului normală,
creşte … indiferent de
forma populaţiei
totale

x
26
I. Estimarea mediei unei variabile non-alternative
a) Sondajul aleator simplu cu revenire
(repetat)

1. Eroarea medie de 𝜎2 𝑠2
𝜎𝑥 = ≈ = 𝑠/ 𝑛
reprezentativitate 𝑛 𝑛

2. Eroarea limită sau


maxim admisibilă
3. Intervalul de
încredere.
Stabilirea volumului 2 z 2s2
4.
x =
s
z  n= 2
eşantionului n x
27
b) Sondajul aleator simplu fără
revenire (nerepetat)

1. Eroarea medie de 𝜎2 𝑛 𝑠2 𝑛 𝑠 𝑛
𝜎𝑥 = ⋅ 1− ≈ ⋅ 1− = ∗ 1−
𝑛 𝑁 𝑛 𝑁 𝑛 𝑁
reprezentativitate
2. Eroarea limită sau
maxim admisibilă
3. Intervalul de
încredere.
 
2 2 2
Stabilirea volumului  = s n z s
4. 1 −   z  n = 2 2
 
x z s
eşantionului n N + 2 x
N
28
Terminologie

Notații utilizate în sondajul aleator simplu, pentru o variabilă alternativă

Indicator Populația totală Eșantion

Volumul N n

Media p

Dispersia σalt2 salt2 = f· (1-f)

Abaterea standard σalt

29
II. Estimarea mediei unei variabile
alternative

1. s 2
Eroarea medie de  = alt = f (1 − f ) Sondaj repetat
f
reprezentativitate n n
2
salt  n f (1 − f )  n  Sondaj
f = 1 −  = 1 − 
n  N n  N  nerepetat
Eroarea limită sau
f = f z
2.
maxim admisibilă
3. Intervalul de
încredere.
Stabilirea volumului n = z f (1 − f )
2 z 2 f (1 − f )
4. n= 2
eşantionului 2f z f (1 − f ) 2 30
+f
N
31
Metoda de eşantionare:
Eşantionare aleatoare
simplă
Rezultatul: eşantion
format din aproximativ
10% din unităţile
populaţiei totale (în număr
de 200)

32
Exemplul 1

Directorul unui hotel doreşte să estimeze durata medie a


sejurului turiştilor cazaţi în hotel. În acest scop el selectează aleator
repetat datele din registrul hotelului, pentru un număr de 100 de
turişti, pentru care calculează durata medie a sejurului de 4,8 zile cu
o abatere medie pătratică de 2,7 zile.
a) Să se estimeze durata medie a sejurului unui turist din hotel,
pentru o probabilitate de garantare a rezultatelor de 95%
(z=1,96);
b) Idem a) pentru o probabilitate de garantare a rezultatelor de
99,73% (z=3); comparaţi rezultatele.
c) Câţi turişti ar trebui incluşi în eşantion, dacă dorim să
obţinem o eroare limită cu 20% mai mică decât în cazul a).
33
Exemplul 2

⚫ Presupunem că din 100 de turişti selectaţi


aleator şi intervievaţi şi care au beneficiat de
serviciile unei agenţii turistice, 30 au o opinie
favorabilă despre un nou pachet turistic într-o
staţiune montană. Să se estimeze cu o
probabilitate de 90%, intervalul de încredere
pentru proporţia opiniilor favorabile din
colectivitatea totală a turiştilor.

34

S-ar putea să vă placă și