Sunteți pe pagina 1din 31

CURS 2- Analiza de piață prin sondaj

Consultanță pentru elaborarea


strategiilor de afaceri

Lector univ.dr. Mihail BUȘU


mihail.busu@ase.ro
1
Forma de evaluare

 Proiect 40%
 Activitate seminar 10%
 Examen 50%

2
Sondajul statistic- noțiuni generale
 Observarea statistică se poate realiza, după
amploarea sa, prin două forme:
 a) prin înregistrarea caracteristicilor urmărite asupra
tuturor unităţilor elementare din cadrul populaţiei
statistice considerate.

 Această formă de observare se numeşte


observare exhaustivă, cea mai cunoscută
formă de astfel de observare fiind
recensământul populaţiei;

3
Sondajul statistic- noțiuni generale
 b) prin înregistrarea caracteristicilor urmărite numai
pentru o parte a populaţiei totale, această formă de
înregistrare purtând numele de observare parţială.

 Anchetele şi sondajele statistice sunt astfel de


observări parţiale.

4
Sondajul statistic - avantaje
 1) Costul – Costul de obţinere a datelor
statistice prin sondaj este mult inferior
costurilor pe care le implică o observare
exhaustivă.

 Astfel, pe baza unui eşantion relativ mic, care implică


cheltuieli relative reduse, se pot obţine date ce
caracterizează suficient de bine populaţia de
referinţă.

5
Sondajul statistic- noțiuni generale
 2) Rapiditatea – Rapiditatea observărilor
parţiale, deci şi a sondajului statistic, este unul
dintre argumentele importante pentru care
acest gen de analize este foarte des întâlnit în
practică.

 Întrucât eşantioanele analizate sunt mult mai mici


decât populaţia de referinţă, timpul alocat pregătirii
observării, culegerii şi prelucrării datelor este mult
redus.

6
Sondajul statistic- noțiuni generale
 3) Exactitatea – Cu toate că, aşa cum menţionam
mai sus, rezultatele obţinute prin sondaj sunt
supuse riscului de a fi eronate, practica statistică a
arătat că orice fel de observare (totală sau parţială)
a unei populaţii implică erori.

 Mai mult, întrucât sondajul presupune o organizare


riguroasă, o colectare a datelor realizată de către operatori
specializaţi dar şi o verificare în teren a activităţii
operatorilor, mulţi practicieni consideră că datele obţinute
prin sondaj sunt mai precise decât cele dobândite în urma
recensămintelor.

7
Sondajul statistic- noțiuni generale
 4) Cerinţele speciale – În anumite domenii,
observările exhaustive nu pot fi utilizate,
observarea parţială fiind singura opţiune
disponibilă.

 De exemplu, analiza calităţii unui lot de produse poate


implica distrugerea produselor analizate, fapt pentru care
analiza prin sondaj este modalitatea preferată.

8
Sondajul statistic- limite
 Cercetarea prin sondaj are însă şi limite, date în
general de apariţia erorilor de eşantionare şi a
dificultăţilor legate de extragerea eşantionului din
populaţia de referinţă.

 1) Erori de eşantionare şi de observare – În acest


context, conceptul de eroare desemnează abaterea
care se constată între rezultatul furnizat de
observarea parţială şi valoarea reală a unei
caracteristici pentru populaţia studiată.

9
Sondajul statistic- limite
 Sondajele generează două tipuri de erori:

 A) Eroarea de eşantionare, datorată observării


numai a unei părţi din populaţie, această eroare
fiind invers proporţională cu mărimea eşantionului.

 Acest gen de eroare este determinat şi de:


 gradul de variaţie a caracteristicilor studiate
 planul de eşantionare utilizat
 metodele de estimare a parametrilor
 caracteristicile populaţiei de referinţă
10
Sondajul statistic- limite
 Sondajele generează două tipuri de erori:

 B) Erorile de observare, care apar atât in obsevările


parţiale, cât şi în cele exhaustive.
 Aceste erori sunt generate în multe cazuri de maniera în
care au fost formulate întrebările.

 2) Dificultăţi in construirea eşantionului – Principala problemă


în desemnarea eşantionului vine din dificultatea localizării
populaţiei de referinţă şi a înţelegerii modului în care aceasta
este structurată.

11
Inferenta statistică
 Metoda sondajului cuprinde două etape:
 etapa descriptivă, în care se culeg date şi se calculează
indicatorii ce caracterizează eşantionul analizat;
 etapa inferenţială, în care rezultatele obţinute pentru
eşantion se extind, în termeni probabilistici, la populaţia
statistică.
 Selecţia statistică = operaţia de extragere a unei părţi dintr-o
populaţie statistică numită eşantion
 Notăm volumul populaţiei statistice cu N şi volumul
eşantionului cu n, 1  n  N

12
Inferenta statistica

13
Inferenta statistica

 Inferenţa statistică este procesul prin care formulăm


concluzii despre populaţia statistică, pe baza indicatorilor
calculaţi în eşantion

 Există două modalităţi principale pentru realizarea inferenţei:


-- estimaţia punctuală sau pe interval de încredere

- testarea de ipoteze statistice.

 Estimaţia înseamnă determinarea valorii aproximative a


parametrului din populaţia statistică folosind eşantionul
statistic

14
Inferenta statistica
 Estimaţia asupra mediei, pe interval de încredere, presupune:
1. calculul indicatorilor de sondaj
2. extinderea rezultatelor sondajului asupra populaţiei statistice

1. Calculul indicatorilor de sondaj presupune determinarea:


- mediei de sondaj
- dispersiei de sondaj
- erorii medii de reprezentativitate
- erorii maxime admise

2. Extinderea rezultatelor selecţiei asupra populaţiei statistice


presupune determinarea unui interval de încredere — pe baza
estimatorului punctual — pentru media populaţiei statistice.

15
Inferenta statistica
Calculul erorilor pentru selecţia aleatoare simplă repetată

1. Eroarea standard (eroarea medie de reprezentativitate)


- Pentru o variabilă cantitativă, nealternativă, pentru estimarea parametrului

media populaţiei statistice (  ) este necesar să calculăm media de sondaj ( x ) .


- Media mediilor de selecţie este egală cu media populaţiei 
- Dispersia mediilor de selecţie este de n ori mai mică decât dispersia
variabilei considerate în populaţia statistică şi, de regulă, aproximată pe baza
dispersiei eşantionului:

s2
x
sx 
2

n
16
Inferenta statistica
Eroarea medie de reprezentativitate (abaterea standard a mediei de
sondaj) se determină pe baza datelor din eşantion ca:
s2x sx
sx  
n n

Deoarece am extras un eşantion de volum n dintr-o populaţie


statistică de N unităţi, nu putem fi siguri 100% în privinţa valorii
adevărate a mediei populaţiei.
Cu toate acestea, dacă eşantionul este de volum mare (n > 30), pe
baza teoremei limită centrală, putem construi un interval de încredere,
cu o probabilitate de 100(1-)% de garantare a rezultatelor, pentru
parametrul media populaţiei statistice.

17
Inferenta statistica

2. Eroarea maximă admisă


Pentru probabilitatea cu care garantăm rezultatele 100(1-)%, eroarea maximă
admisibilă este:
sx
 x  z / 2  sx  z /2 
n
unde z / 2 este argumentul functiei Gauss-Laplace si depinde de probabilitatea de
garantare a rezultatelor (valorile lui z sunt tabelate pentru diverse niveluri de
semnificatie)

Aceasta înseamnă că în 100(1-)% din cazuri, media de sondaj ( x ) se abate de


la media colectivităţii generale (  ) cu mai puţin sau cel mult z/2 ori eroarea medie
de reprezentativitate s x .

18
Inferenta statistica
Intervalul de încredere pentru media 

s
x  z / 2
n
care va conţine adevărata valoare a mediei din populaţia statistică
(  ), în 100(1-)% din cazuri.
Cea mai folosită probabilitate de garantare a rezultatelor este de 95%,
adică: z0,025=1.96
▪ Se cere găsirea unui echilibru între mărimea intervalului de
încredere (un interval mai mic înseamnă o precizie crescută) şi
probabilitatea de cuprindere a parametrului din populaţie (o
probabilitate crescută de garantare a rezultatelor poate fi preferată).
19
Inferenta statistica

Interval de încredere pentru 1-=0,999

Interval de încredere pentru 1-=0,99

Interval de încredere pentru 1-=0,95

Interval de încredere pentru 1-=0,90

Mărimea relativă a intervalului de încredere pentru un eşantion de volum


mare

▪ Se observă că, pe măsură ce nivelul de încredere


(probabilitatea cu care garantăm rezultatele creşte), intervalul
de încredere devine mai mare pentru a acoperi această cerinţă,
iar exactitatea estimaţiei scade.

20
Inferenta statistica

▪ Extinderea rezultatelor sondajului la întreaga colectivitate statistică se va


face pentru media caracteristicii numerice analizată – pe baza erorii limită
admisibilă şi a intervalului de încredere:
x  x   x  x .
▪ Deseori suntem interesaţi să estimăm pe baza sondajului nu doar nivelul
mediu al caracteristicii, ci şi nivelul total al caracteristicii în colectivitatea
generală (exemplu: estimarea pe interval de încredere a fondului de salarizare,
a producţiei totale obţinute etc.).
▪ Intervalul de încredere pentru nivelul total al caracteristicii este:
N

N ( x   x )   xi  N ( x   x ) .
i 1

21
Inferenta statistica
Exemplu

Directorul unui hotel doreşte să cunoască durata medie a sejurului turiştilor cazaţi
în hotel. În acest scop el selectează aleator date din registrul hotelului, pentru un
număr de 80 de turişti şi calculează durata medie a sejurului x  4,8 zile, cu o abatere
standard s x  2,7 zile .
Pentru o probabilitate de garantare a rezultatelor de 95%, să se determine durata
medie a sejurului pentru turiştii cazaţi în hotel.

22
Inferenta statistica
Exemplu
Directorul unui hotel doreşte să cunoască durata medie a sejurului turiştilor cazaţi
în hotel. În acest scop el selectează aleator date din registrul hotelului, pentru un
număr de 80 de turişti şi calculează durata medie a sejurului x  4,8 zile, cu o abatere
standard s x  2,7 zile . Pentru o probabilitate de garantare a rezultatelor de 95%,
durata medie a sejurului pentru turiştii cazaţi în hotel se determină astfel:
x  4,8 zile, s x  2,7 zile, n  80, z  / 2  z 0.0 25 1,96
sx 2,7
sx    0,30 zile
n 8,94 (eroarea standard a mediei)
 x  z  / 2  s x  1,96  0,30  0,59 zile
x  x    x  x
4,8  0,59    4,8  0,59
4,21    5,39 zile
23
ALEGEREA VOLUMULUI EŞANTIONULUI

Volumul eşantionului pentru sondaj aleator simplu repetat


 Precizia estimaţiei şi probabilitatea cu care se garantează rezultatele unei
estimaţii pe interval de încredere sunt mărimi invers proporţionale, astfel încât
aceste deziderate trebuie puse într-o relaţie de echilibru în funcţie de scopul
cercetării statistice.
 Deseori, problema se priveşte dintr-un unghi diferit, astfel încât trebuie să
determinăm volumul eşantionului necesar pentru precizia şi probabilitatea cerută
de cercetare.
 Pentru determinarea volumului eşantionului, ne concentrăm atenţia asupra a trei
factori:
 nivelul de încredere dorit;
 eroarea limită admisă;
 omogenitatea datelor, măsurată prin abaterea standard.

24
ALEGEREA VOLUMULUI EŞANTIONULUI

 Precizia cerută, asociată cu mărimea intervalului de încredere pentru media


populaţiei (  ) poate fi exprimată:

- pe baza erorii limite maxime (  x )

- prin precizarea lungimii totale a intervalului de încredere, L=2  x .


 volumul necesar al eşantionului se determină rezolvând una din următoarele
ecuaţii în n:

sx sx L
z / 2   x z / 2  
n sau n 2 .

25
ALEGEREA VOLUMULUI EŞANTIONULUI –
1. Populaţie necunoscută

 Volumul eşantionului este:

 = eroarea maxima admisă


 n = volumul eşantionului
 = dispersia =p(1-p)
 zα/2 = indicatorul Laplace

26
ALEGEREA VOLUMULUI EŞANTIONULUI –
2. Populaţie cunoscută

 Volumul eşantionului este:

 N = volumul populaţiei
 n = volumul esantionului
 p=0.5
 zα/2 = indicatorul Laplace

27
ALEGEREA VOLUMULUI EŞANTIONULUI
Exemplu
Vacanţa de iarnă este perioada cea mai importantă pentru activitatea de schi,
deoarece mulţi copii, studenţi şi adulţi sunt dispuşi să-şi petreacă un timp
considerabil la munte, practicând acest sport. Pentru a-şi dimensiona activitatea,
managerul unei staţii de telecabine doreşte să estimeze timpul mediu de
aşteptare la staţie pentru clienţi, de la sosire până la servire.
Dintr-o cercetare anterioară, el ştie că timpul de aşteptare are o distribuţie
aproximativ normală, cu o abatere medie pătratică s x =18 min.

Câţi clienţi trebuie să selecteze pentru a estima timpul mediu de aşteptare,


cu o probabilitate de 95%, pe un interval de încredere cu o lungime de 10
minute (  5 minute)?

28
ALEGEREA VOLUMULUI EŞANTIONULUI
Exemplu
Vacanţa de iarnă este perioada cea mai importantă pentru activitatea de schi,
deoarece mulţi copii, studenţi şi adulţi sunt dispuşi să-şi petreacă un timp
considerabil la munte, practicând acest sport. Pentru a-şi dimensiona activitatea,
managerul unei staţii de telecabine doreşte să estimeze timpul mediu de
aşteptare la staţie pentru clienţi, de la sosire până la servire. Dintr-o cercetare
anterioară, el ştie că timpul de aşteptare are o distribuţie aproximativ normală,
cu o abatere medie pătratică s x =18 min. Câţi clienţi trebuie să selecteze
pentru a estima timpul mediu de aşteptare, cu o probabilitate de 95%, pe un
interval de încredere cu o lungime de 10 minute (  5 minute)?
s x  18 min ., z / 2  z 0.025  1,96,  x  L / 2  10 / 2  5 min .
z 2 s 2 1,96 2  324
n 2   49,78  50
x 25 turişti.

29
Probleme propuse
1. Decanul Facultății de management din cadrul SNSPA dorește să cunoasă
gradul de cunoaștere a studenților în ceea ce privește Statistica.
În acest scop el selectează aleator date din catalog, pentru un număr de 100
de studenți şi calculează media notelor obținute la examen x  7,8, cu o abatere
standard sx  0, 49 .
Pentru o probabilitate de garantare a rezultatelor de 90%, să se determine o
estimare a mediei notelor obținute de către studenți.

2. Directorul RATB dorește să estimeze timpul de așteptare în stația unui


autobuz. Dintr-o cercetare anterioară, el ştie că timpul de aşteptare are o
distribuţie aproximativ normală, cu o medie de x  6,8 min și o abatere medie
pătratică sx  1, 21 .
Câți călători trebuie să fie selectați pentru a estima timpul mediu de aşteptare,
cu o probabilitate de 84%, pe un interval de încredere cu o lungime de 0,2 minute
(+/- 3 minute)?

30
Q/A

31

S-ar putea să vă placă și