Documente Academic
Documente Profesional
Documente Cultură
Cuprins:
1. Importanţa sondajului.
2. Avantajele şi dezavantajele utilizării sondajului.
3. Tipuri de sondaj.
4. Principii de bază ale inferenţei statistice. Eşantionarea.
5. Procedee de eşantionare.
6. Erori întâlnite în sondaj.
7. Conceptele estimaţiei. Construcţia intervalelor de încredere.
8. Test de autoevaluare. Determinarea indicatorilor de sondaj in cazul unei selecţii nerepetate.
9. Rezultatele testului de autoevaluare.
10. Teme de autocontrol.
11. Rezumatul unităţii de învăţare.
12. Bibliografia unităţii de învăţare.
1. Importanţa sondajului
1
cererea potenţială de cursuri din altă localitate sau altă regiune şi cum ar putea să decidă
extinderea reţelei sale ?
Răspunsul la acest tip de întrebări poate fi găsit prin aplicarea unei tehnici de cercetare
şi studiu al pieţei denumită sondaj.
Sondajul reprezintă o cercetare parţială, al cărei scop este de estimare a
caracteristicilor populaţiei generale pe baza rezultatelor obţinute de la un eşantion riguros
prelevat. Acestă metodă de investigaţie statistică parţială se bazează pe principiile teoriei
probabilităţilor, statisticii matematice şi legii numerelor mari. Teoria sondajului are ca obiect
principal elaborarea metodelor ştiinţifice de modelare a problemelor legate de culegerea şi
analiza datelor., reprezentativitate, preferând informaţii sintetice în locul detaliilor ce pot
descrie situaţii netipice.
Sondajul se utilizeaza frecvent pentru luarea deciziilor in mediul economic si social
nefiind doar un concept promovat de statisticieni. Scopul sondajului este sa ofere suficiente
informatii despre esantion astfel incat sa permita inferenta cu un nivel de incredere acceptat.
Mijlocul prin care realizeaza scopul este selectia unei parti reprezentative din populatia mama
(“normally representative”), parte denumita ESANTION.
2
Principalele avantaje ale utilizarii sondajului sunt costul redus, timp mai mic decat in
cazul efectuarii unui recensamant si obtinerea unei acurateti scorite a rezultatelor. Alte
avantaje sunt:
Posibilitatea aplicării sondajului şi în cazul efectuării de teste distructive.
Utilizarea în situaţii în care natura populaţiei nu permite enumerarea unităţilor
statistice: mulţimea consumatorilor vs. mulţimea clienţilor permanenţi.
Dezavantajul principal este posibilitatea obţinerii de date nereprezentative, datele
statistice culese prin sondaj inducând în mod inevitabil erori. Un alt dezavantaj al acestei
metode îl constituie imposibilitatea de a urmări fenomenele în dinamică, sondajul surprinde
static caracteristicile unităţilor observate, ceea ce poate fi corectat prin organizarea de
observări selective periodice, cu periodicitate constantă.
3. Tipuri de sondaje
3
SONDAJUL STRATIFICAT
Eşantionul aleator stratificat este obţinut prin separarea populaţiei pe straturi, grupe, ce
se exclud reciproc, doar după această operaţiune se extrage un eşantion aleator din fiecare
strat.
Criterii de separe a populaţiei pe straturi, variabile independente sunt de exemplu:
Gen
Varsta
Ocupatie
Venitul gospodariei
Religie
Numar de copii sub 18 ani din gospodarie
Locatia
Brand-ul
SONDAJUL CLUSTER
4
Seturile formate din aceleaşi categorii formează evenimente. Posibilitatea ca firmele să fie
solvabile deci să obţină profit zero sau pozitiv, reprezintă un eveniment.
În teoria sondajului rezultatele unui număr mare de experimente sunt datele primare.
În anumite cazuri putem presupune că fiecare rezultat este independent de cel precedent, aşa
cum un număr al zarului este independent de celelalte aruncări. În condiţiile în care
cunoaştem mecanismul de probabilitate, putem calcula probabilitatea de apariţie a fiecărui
rezultat. Teoria sondajului se preocupă cu aplicarea teoriei probabiltăţilor pentru seturi de date
primare.
Dacă în urma unei cercetări se înregistrează doar informaţii parţiale, este posibil ca
datele înregistrate să fie utilizate pentru obţinerea intervalelor de încredere cu o anumită
probabilitate dacă setul de date respectă condiţiile de reprezentativitate pentru populaţia din
care a fost extras.
Pentru a se putea estima corect parametrii colectivităţii de selecţie pe baza rezultatelor
prelucrării datelor de sondaj, estimaţie garantată cu o anumită probabilitate, este necesar ca
eşantionul pe baza căruia se culeg datele primare să fie reprezentativ.
Un eşantion este reprezentativ dacă structura sa reproduce cât mai exact structura
populaţiei de referinţă din care a fost prelevat.
Pentru asigurarea reprezentativităţii eşantionului este necesar să se respecte anumite
reguli dintre amintim:
a. includerea unităţilor în eşantion să se realizeze în manieră cât mai obiectivă, toate
unităţile trebuie să aibe acceaşi şansă de a participa la formarea eşantionului -
extragerea unităţilor să se realizeze conform principiilor hazardului cu o probabilitate
egală şi diferită de zero.
b. mărimea eşantionului să fie suficientă pentru a reda caracteristicile esenţiale ale
populaţiei generale
c. includerea fiecărei unităţi în eşantion trebuie să se facă independent de cuprinderea
altor unităţi
Determinarea gradului de reprezentativitate a populaţiei studiate la un moment dat
ridică probleme deosebit de dificile în calea evaluării cercetărilor, aceasta deoarece, de cele
mai multe ori, nu pot fi cunoscute în prealabil caracteristicile relevante ale populaţiei ce
urmează a fi cercetată şi se procedează la estimări mai mult sau mai puţin corecte; se ajunge la
identificarea acestor caracteristici numai în urma studiului, când de fapt nu se mai poate
interveni pentru alegerea “populaţiei adecvate”.
5
Cu excepţia cazurilor, rare dealtfel, în care ne pot ajuta evidenţele, numai efectuarea
unor înregistrări prealabile cercetării propriu-zise ne permite să ne fixăm, în cunoştinţă de
cauză, la o anumită populaţie relevantă pentru tema şi obiectivele cercetării.
Studiile statistice exhaustive prealabile, deşi necesare, sunt puţin practicate totuşi
datorită împovărării costurilor de cercetare, a creşterii timpului afectat şi a muncii depuse.
Determinarea cu maximă precizie a caracteristicilor economice, de piaţă, politice şi de altă
natură ale colectivităţii studiate, ca şi dispunerea ei spaţială se înscriu drept cerinţe
elementare, obligatorii pentru o cercetare concretă.
5. Procedee de eşantionare
Eşantionare aleatoare
6
Eşantionarea aleatoare se realizează după planuri de sondaje simple (pentru sondaje
în populaţii omogene putându-se aplica şi pentru populaţii neomogene, după planuri de sondaj
în mai multe etape (stratificarea, sondajul multistadial, multifazic, de serii, secvenţial).
Această metodă de eşantionare este indicată a se folosi în cazul în care unităţile din populaţie
sunt de dimensiuni mici şi nu există diferenţe semnificative între mărimea unităţilor
populaţiei.
7
procedeu de eşantionare este mult mai ieftin decât cele probabilistice şi se poate aplica dacă
eşantioanele sunt atât de mici încât inferenţele efectuate pe baza lor nu ar reprezenta decât o
simplă ipoteză ce nu ar putea fi testată, indiferent de metoda de prelevare utilizată.
8
ansamblul caracteristicilor reţinute pentru a asigura identitatea între eşantion şi populaţia de
referinţă. Stabilirea variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei
de referinţă.
Pentru alegerea criteriilor de cotă, de structurare este recomandabil să se ţină seama de
următoarele îndrumări : definirea varibilelor pe baza întrebărilor cuprinse în eşantion,
folosirea ca variabile de control doar acelea pentru care se poate defini o distribuţie statistică
pentru populatia de referinţă, limitarea numărului de criterii de cotă, ce trebuie să fie
independente, fără să cuprindă conotaţii psihologice şi formate din unităţi statistice cu un grad
cât mai mare de omogenitate. Dacă se respectă aceste condiţii se poate obţine un eşantion
sensibil apropiat de un eşantion extras pe baza procedeelor aleatoare.
De exemplu, într-un sondaj statistic organizat la nivelul Municipiului Bucureşti, cu
scopul identificării preferinţelor cursanţilor pentru calculatoarelor personale şi produse
program, pentru identificarea segmentelor ţintă pe diferite tipuri şi categorii de cursanţi pot fi
alese ca variabile de control categoria - socio profesională, vârsta, gradul de educaţie,
structura populaţiei după aceste variabile de segmentare fiind publicate în urma ultimului
recensământ.
Această metodă este de departe cea mai utilizată metodă în studiile de piaţă, deoarece
necesită un buget redus de cheltuieli, fiind mai puţin costisitoare decât orice metodă de
eşantionare aleatoare, proiectarea nu este laborioasă, rezultatele se obţin operativ, într-un timp
scurt şi de fapt este singura metodă posibilă dacă nu există bază de sondaj.
9
Deşi metodele prezentate mai sus nu respectă principiile eşantionarii aleatoare, sunt
folosite destul de des în sondajele de piaţă, fiind efectuate de specialişti în domeniul
marketing-ului, ce contribuie prin cunoştinţele şi experienţa acumulată la atenuarea
dezavantajelor acestor metode de eşantionare.
În practică, se pot combina metodele de eşantionare aleatoare cu cele dirijate,
obţinându-se o combinaţie de avantaje şi atenuarea dezavantajelor fiecăreia. Un exemplu îl
constituie selecţia stratificată. În selecţia stratificată se împarte întreaga populaţie în straturi
(grupe) după criterii de stratificare corespunzătoare scopului sondajului, şi se alege din fiecare
strat cate un subeşantion folosind procedeul aleator de selecţie.
Eşantionarea stratificată se recomandă a se utiliza în studiul fenomenelor economico-
sociale de masă şi în mod special în studierea fenomenelor de piaţă, caracterizate printr-un
grad mare de eterogenitate. Pentru a creşte gradul de omogenitate populaţia de referinţă se
împarte mai întâi pe grupe omogene. Aplicând în continuare selecţia aleatoare în fiecare
grupă, subeşantionul obţinut va fi omogen. Erorile de sondaj rezultate vor fi mai mici decât în
cazul extragerii eşantionului din populaţia totală neîmpărţită pe clase omogene.
Orice măsurare statistică conţine erori. O posibilă clasificare a erorilor, din mulţimea
posibilităţilor de grupare şi clasificare existente poate fi: erori sistematice, grosolane şi
aleatoare Erorile sistematice sunt determinate de acţiunea unor factori ale căror cauze de
apariţie pot fi stabilite, iar apoi eliminate. Apariţia erorilor grosolane este legată de încălcarea
condiţiilor de efectuare a experimentului sau a observaţiei. În teoria erorilor se dau criterii de
depistare a erorilor grosolane. Obiectul teoriei erorilor îl constituie numai erorile aleatoare,
care sunt determinate de acţiunea unor factori greu de depistat, din care cauză efectul acţiunii
lor este inevitabil. Erorile de sondaj mai sunt clasificate în erori de înregistrare, comune
tuturor tipurilor de observare, şi erori de reprezentativitate, specifice sondajului. Erorile de
reprezentativitate sunt la rândul lor: sistematice şi întâmplătoare.
Din punctul de vedere al posibilităţii controlului erorilor, în literatura americană de
studiu al pieţei, erorile mai sunt clasificate în două mari grupe:
1. Erori ce pot fi previzionate: acestea sunt controlabile şi au drept cauze măsurările
statistice ale datelor continue şi rotunjirile efectuate pentru a obţine rezultate discrete conform
conţinutului caracteristicii statistice, deci ele sunt probabile - sau de sondaj şi de calcul -
10
ambele tipuri putând fi estimate şi efectele lor controlate. Prin operaţiunea matematică de
rotunjire a valorilor înregistrate se induc erori ce se amplifică dacă rotunjirea continuă în faza
de analiză.
Drept urmare putem afirma că datele sunt rotunjite din următoarele motive:
Dacă caracteristica observată este continuă în anumite cazuri este necesară rotunjirea
pentru a putea exprima magnitudinea datei (de obicei se păstrează doar două zecimale)
Pentru caracteristicle discrete rotunjirea are drept scop respectarea caracterului întreg
al acestora.
2. Erori ce nu pot fi previzionate: acestea sunt necontrolabile şi se datorează:
înregistrărilor incomplete sau incorecte, definirii ambigue a caracteristiclor sau unităţilor
statistice ce sunt studiate.
Identificam doua tipuri de erori de sondaj din punctul de vedere al utilizarii tehnicilor
de esantionare:
Principalele cauze ale erorilor sistematice sunt alegerea deliberată a unor date
considerate în mod greşit ca fiind reprezentative, alegerea la “întâmplare” ce diferă esenţial de
alegerea după principiile probabilistice, dorinţa voită a cercetătorului de a demonstra o
anumită concluzie, substituirea unei unităţi de cercetare cu altă unitate, în mod voit şi
cuprinderea incompletă în sondaj a unităţilor de cercetare.
Spre deosebire, erorile aleatoare de selecţie apar din procesul de sondaj. Aceste erori
se produc chiar dacă se respectă principiile probabilistice, deoarece eşantionul nu reproduce
perfect distribuţia populaţiei generale. Dacă sondajul este probabilistic, aceste erori pot fi
calculate cu anticipaţie. Estimarea parametrilor din populaţia generală se va efectua pe baza
11
indicatorilor de sondaj, corectaţi cu o eroare de reprezentativitate ce se găseşte într-un anumit
interval probabilistic. Aceste analize de perspectivă şi aceste proiecţii ale rezultatelor
sondajului asupra populaţiei de referinţă, fac din metoda sondajului un puternic instrument în
procesul luării deciziilor în mediul economico-de piaţă.
Dacă z este:
12
Astfel încât, rescriind obţinem:
unde nivelul de semnificaţie este 1-α este de regulă 5 % pentru o probabilitate de garantare a
rezultatelor de 95%.
Argumentul funcţiei Laplace pentru diverse niveluri de încredere sunt prezentate în tabelul de
mai jos:
Niveluride
Niveluri de
incredere
incredere aa a/22
a/ z
0.90
0.90 0.10
0.10 0.05
0.05 1.645
1.645
0.95
0.95 0.05
0.05 0.025
0.025 1.96
1.96
0.98
0.98 0.02
0.02 0.01
0.01 2.33
2.33
0.99
0.99 0.01
0.01 0.005
0.005 2.575
2.575
.
Unde
n = volumul eşantionului
13
σ = dispersia variabilei în populaţia mama din care a fost extras eşantionul.
adică:
Se aplică datelor nominale şi frecvenţelor relative. Estimatorul folosit pentru inferenţă este
indicatorul de sondaj, p, proporţia calculată pentru eşantion.
14
În anumite condiţii, proporţia în eşantion este normal distribuită cu media m = π
(proporţia din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este π, valoarea
z va fi:
Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o
precizie antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p w w , adica
În acest caz, dispersia din populaţie nu este cunoscută, fiind π (1 - π). Pentru
caracteristica alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca
un produs între limitele intervalului de încredere şi volumul întregului fenomen, adică:
N (w w ) . In acest caz volumul esantionului va fi:
15
1.2 Volumul eşantionului poate să scadă, ceea ce determină creşterea cheltuielilor de
înregistrare şi creşterea erorii limită
1.3 Volumul eşantionului poate să crească, determinând scăderea erorii limită şi a costului de
înregistrare
1.4 Volumul eşantionului poate să se modifice, determinând o mişcare în acelaşi sens a
costului de înregistrare şi în sens contrar a erorii limită
2. Un eşantion de volum normal corespunde:
a) repartiţiei Gauss-Laplace
b) repartiţiei Student
c) repartiţiei binomiale
d) Repartiţiei t
e) altei repartiţii, precizaţi care anume ...
3. Nu constituie un avantaj al sondajului:
a) operativitatea
b) costul diminuat comparativ cu cel al unei cercetări totale
c) complexitatea informaţiilor culese
d) erorile de înregistrare reduse
e) prezentarea prin sondaj a unei situaţii existente la un moment dat, fără a evidenţia
dinamica fenomenului
4. În ce domeniu se pot folosi doar cercetările selective şi nu cele totale:
a) cunoaşterea veniturilor populaţiei
b) controlul calităţii produselor prin metode distructive
c) cunoaşterea preferinţelor clienţilor
d) cunoaşterea structurii populaţiei unui oraş
e) cunoaşterea structurii efectivelor de animale
5. Raportul dintre eroarea limită şi eroarea medie de selecţie, într-un sondaj repetat, în care
rezultatele sunt garantate cu o probabilitate de 95%, este:
a) supraunitar
b) subunitar
c) negativ
d) pozitiv
16
e) mărimile nu se pot compara
6. Erorile probabile de sondaj sunt în raport cu erorile de înregistrare:
a) mai mici cu cât volumul eşantionului creşte
b) constante, indiferent de volumul eşantionului
c) întotdeauna egale
d) din ce în ce mai mici pe măsură ce volumul eşantionului scade
e) ocupă întotdeauna ponderea cea mai mare din totalul erorilor
7. Se cunosc datele despre distribuţia a 50 de candidaţi admişi la o facultate din Bucureşti după media la
examenul de admitere (candidaţii au fost aleşi din listele de admitere) aleatoriu si nerepetat:
Grupe de candidaţi după media la examenul
Număr candidaţi
de admitere
7,75-8,07 5
8,07-8,39 12
8,39-8,71 11
8,71-9,03 9
9,03-9,35 4
9,35-9,67 9
Total 50
Se cere:
1) Să se verifice reprezentativitatea eşantionului candidaţilor după media la
examenul de admitere ştiind că media la admitere pe total colectivitate ( 0 = 8,02).
2) Să se calculeze eroarea medie probabilă de selecţie.
3) Eroarea maximă admisă dacă rezultatele se garantează cu o probabilitate de
95,45% pentru care z = 2 ştiind că volumul colectivităţii totale a fost de 655 candidaţi.
4) Să se estimeze limitele între care se va încadra media la admitere a tuturor
candidaţilor.
5) Să se determine noul volum de selecţii care va fi necesar, dacă eroarea limită
admisă se reduce de 1,5 ori, iar probabilitatea cu care se garantează rezultatele rămâne
neschimbată (respectiv
z = 2).
6) Să se determine dacă argumentul funcţiei Gauss Laplace va rămâne
neschimbat prin micşorarea erorii limită admisă de la punctul anterior.
1.1 C
1.2 C
1.3 B
1.4 A
2. a
3. e
4. b
17
5. a
6. a
7. Rezolvare:
Notaţii:
N = volumul colectivităţii generale
n = volumul eşantionului
0 = media colectivităţii generale
= 8,69 puncte/candidat
Deoarece dc/0 +5% se consideră că eşantionul este reprezentativ. Din punct de vedere
al semnului coeficientul e pozitiv deci putem afirma că media eşantionului este mai mare
decât media tuturor candidaţilor cu 0,06 puncte.
18
= 0,069 puncte/candidat.
Dacă eroarea limită admisă se micşorează de 1,5 ori, atunci volumul eşantionului va
trebui să crească cu (105 – 50 = 55 candidaţi).
Se observă că volumul noului eşantion în cazul selecţiei aleatoare simple fără revenire
este mai mic decât volumul noului eşantion în cazul selecţiei aleatoare simple cu revenire
deoarece însăşi procedeul de formare a eşantionului conduce la erori mai mici decât procedeul
selecţiei aleatoare cu revenire.
1. O şarjă de 100 de bucăţi este supusă controlului de calitate, prin testarea unui eşantion de
10% din totalul şarjei. Şarja este respinsă dacă se găsesc mai mult de două produse
defecte. Pe termen lung, procentul de şarje respinse va fi:
a) 10%
b) 5%
c) 2%
19
d) nu se poate preciza
e) răspunsurile anterioare sunt false, varianta corectă este ...
Se cere:
a. Să se determine valoarea medie a depozitelor bancare şi să se stabilească dacă
distribuţia clienţilor pe grupe după depozitele bancare este omogenă;
b. Dacă eşantionul celor 35 clienţi este extras dintr-o colectivitate de 100, estimaţi
limitele între care se încadrează valoarea totală a depozitelor bancare pentru
colectivitatea generală, dacă rezultatele se garantează cu o probabilitate de 95% (z=1,96);
c. În condiţiile în care s-a derulat un sondaj simplu aleator, estimaţi limitele între care se
încadrează ponderea clienţilor cu depozite bancare mai mici de 10 unit. monetare de la
nivelul colectivităţii, dacă rezultatele se garantează cu o probabilitate de 95,45% (z=2).
20
6. Referitor la valoarea vânzărilor unui produs se cunosc datele rezultate din înregistrarea a
10% din valoarea vânzărilor pentru acest produs la cinci magazine: 3100 u.m., 8200 u.m.,
1600 u.m., 5400 u.m., 2900 u.m. Eroarea limită garantată cu o probabilitate de 0,95 este:
a) 3000
b) 3300
c) 3230
d) 3320
e) nu se poate calcula
21
Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o precizie
antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p w w , adica
In acest caz, dispersia din populatie nu este cunoscuta, fiind π (1 - π). Pentru caracteristica
alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca un produs între
limitele intervalului de încredere şi volumul întregului fenomen, adică: N (w w ) . In acest caz
volumul
1. Bădiţă, M., Cristache S. E., Şerban, D., Teste grilă de statistică , ed. Amalteea, , 81 pg.,
Bucureşti, 1998.
2. Cristache, S.E., Şerban, D., Lucrări aplicative de Statistică şi Econometrie, Ed. ASE,
Bucureşti, 2007, 433 pg.
3. Isaic Maniu, Al., Voineagu, V., Mitruţ, C., Baron, T., Ţiţan, E., Matache S., Şerban D.,
Voineagu, M., Statistică teoretică. Studii de caz şi aplicaţii, Ed. Economică, 255 pg.,
Bucureşti, 1998.
4. Şerban, D., „Statistica pentru studii de marketing si administrarea afacerilor”, ed. ASE,
2004.
22