Documente Academic
Documente Profesional
Documente Cultură
1. Importanţa sondajului
1
Mijlocul prin care realizeaza scopul este selectia unei parti reprezentative din populatia mama
(“normally representative”), parte denumita ESANTION.
3. Tipuri de sondaje
2
Exista mai multe criterii de clasificarea sondajelor. După procedeul de selecţie,
aleatoare sau nealeatoare, eşantioanele sunt:
- Eşantioane bazate pe judecata cercetătorului – orice eşantion care este format pe baza
experienţei şi expertizei cercetătorului, ca de exemplu sondajul pe cote.
- Eşantioane aleatoare - realizate după scheme probabilistice.
Tipurile de sondaje aleatoare sunt:
Eşantionul aleator stratificat este obţinut prin separarea populaţiei pe straturi, grupe, ce
se exclud reciproc, doar după această operaţiune se extrage un eşantion aleator din fiecare
strat.
Criterii de separe a populaţiei pe straturi, variabile independente sunt de exemplu:
Gen
Varsta
Ocupatie
Venitul gospodariei
Religie
Numar de copii sub 18 ani din gospodarie
Locatia
Brand-ul
3
SONDAJUL CLUSTER
4
Un eşantion este reprezentativ dacă structura sa reproduce cât mai exact structura
populaţiei de referinţă din care a fost prelevat.
Pentru asigurarea reprezentativităţii eşantionului este necesar să se respecte anumite
reguli dintre care amintim:
a. includerea unităţilor în eşantion să se realizeze în manieră cât mai obiectivă, toate
unităţile trebuie să aibe acceaşi şansă de a participa la formarea eşantionului -
extragerea unităţilor să se realizeze conform principiilor hazardului cu o probabilitate
egală şi diferită de zero.
b. mărimea eşantionului să fie suficientă pentru a reda caracteristicile esenţiale ale
populaţiei generale
c. includerea fiecărei unităţi în eşantion trebuie să se facă independent de cuprinderea
altor unităţi
Determinarea gradului de reprezentativitate a populaţiei studiate la un moment dat
ridică probleme deosebit de dificile în calea evaluării cercetărilor, aceasta deoarece, de cele
mai multe ori, nu pot fi cunoscute în prealabil caracteristicile relevante ale populaţiei ce
urmează a fi cercetată şi se procedează la estimări mai mult sau mai puţin corecte; se ajunge la
identificarea acestor caracteristici numai în urma studiului, când de fapt nu se mai poate
interveni pentru alegerea “populaţiei adecvate”.
Cu excepţia cazurilor, rare dealtfel, în care ne pot ajuta evidenţele, numai efectuarea
unor înregistrări prealabile cercetării propriu-zise ne permite să ne fixăm, în cunoştinţă de
cauză, la o anumită populaţie relevantă pentru tema şi obiectivele cercetării.
Studiile statistice exhaustive prealabile, deşi necesare, sunt puţin practicate totuşi
datorită împovărării costurilor de cercetare, a creşterii timpului afectat şi a muncii depuse.
Determinarea cu maximă precizie a caracteristicilor economice, de piaţă, politice şi de altă
natură ale colectivităţii studiate, ca şi dispunerea ei spaţială se înscriu drept cerinţe
elementare, obligatorii pentru o cercetare concretă.
5. Procedee de eşantionare
5
studiat (care este unitatea de sondaj?); ii) CÂTE unităţi va cuprinde eşantionul (volumul
eşantionului desigur influenţează siguranţa rezultatelor, dar, dacă este bine ales, şi un eşantion
de sub 1% din populaţia totală poate furniza rezultate cu o probabilitate ridicată); iii) care sunt
CRITERIILE de alegere a unităţilor în eşantion (care este procedeul de eşantionare folosit?).
Eşantionare aleatoare
6
numărul judeţelor tării şi cu n numărul judeţelor cuprinse în eşantion, sum(Xi) estimează
numărul firmelor la nivel naţional. Judeţele, indiferent de mărimea lor au avut şanse egale de
a participa la eşantion. Dar, numărul firmelor depinde în mod evident de populaţia judeţului şi
deci estimatorul poate fi afectat de o eroare semnificativă.
Pornind de la ipoteza existenţei unei legături directe, pozitive între populaţia unui
judeţ şi numărul de firme comerciale, se poate acorda judeţelor mai mari o şansă mai mare de
a face parte din eşantion. Probabilitatea ce i se va atribui fiecărui judeţ va fi proporţională cu
populaţia sa. Procedeul de extracţie va fi nerepetat. Estimatorul devine: (P/n)*sum(Xi/pi),
unde P este populaţia întregii ţări, pi populaţia judeţului i din eşantion.
Din procedee de extracţie cu probabilităţi egale amintim procedee absolut aleatoare
,procedeul loteriei şi al tabelului cu numere întamplatoare şi procedeul mecanic, eşantionare
sistematică.
7
Se presupune că eşantionul este reprezentativ dacă el redă structura populaţiei generale
studiate.
Metoda se bazează pe o alegere raţională a unităţilor din eşantion. Prin modul de
constituire a eşantionului apare ca o metodă mixtă, combinând metodele probabilistice cu cele
nealeatoare de eşantionare. Asimilarea cu metodele probabilistice se face în măsura în care
putem defini ca probabilităţi frecvenţele relative definite în cadrul populaţiei. Putem face
această echivalenţă dacă volumul populaţiei de referinţă este suficient de mare pentru a da
posibilitatea aplicării legii numerelor mari.
De aceea, se poate afirma că sondajul pe cote apare ca un sondaj stratificat, selecţia în
cadrul grupelor fiind conştienţa şi nu este aleatoare. Caracterul voluntar al metodei constituie
principalul său dezavantaj, operatorul putând influenţa în mod voit sau nu rezultatele
sondajului. Asemănarea dintre eşantionarea stratificată aleatoare şi cea pe cote constă în
stratificarea iniţială a populaţiei de referinţă pe straturi omogene.
Diferenţa dintre stratificarea aleatoare şi eşantionarea pe cote constă în procedeul de
selecţie al unităţilor din fiecare strat, selecţia în cazul eşantionarii pe cote fiind lăsată pe
seama operatorilor. Deci metoda se bazează pe definirea caracteristicilor de structurare a
populaţiei de referinţă. Astfel pentru fiecare caracteristică, structura eşantionului trebuie să fie
identică cu cea a populaţiei din care este prelevat. Se definesc variabilele de control , că
ansamblul caracteristicilor reţinute pentru a asigura identitatea între eşantion şi populaţia de
referinţă. Stabilirea variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei
de referinţă.
Pentru alegerea criteriilor de cotă, de structurare este recomandabil să se ţină seama de
următoarele îndrumări : definirea varibilelor pe baza întrebărilor cuprinse în eşantion,
folosirea ca variabile de control doar acelea pentru care se poate defini o distribuţie statistică
pentru populatia de referinţă, limitarea numărului de criterii de cotă, ce trebuie să fie
independente, fără să cuprindă conotaţii psihologice şi formate din unităţi statistice cu un grad
cât mai mare de omogenitate. Dacă se respectă aceste condiţii se poate obţine un eşantion
sensibil apropiat de un eşantion extras pe baza procedeelor aleatoare.
De exemplu, într-un sondaj statistic organizat la nivelul Municipiului Bucureşti, cu
scopul identificării preferinţelor cursanţilor pentru calculatoarelor personale şi produse
program, pentru identificarea segmentelor ţintă pe diferite tipuri şi categorii de cursanţi pot fi
alese ca variabile de control categoria - socio profesională, vârsta, gradul de educaţie,
structura populaţiei după aceste variabile de segmentare fiind publicate în urma ultimului
recensământ.
8
Această metodă este de departe cea mai utilizată metodă în studiile de piaţă, deoarece
necesită un buget redus de cheltuieli, fiind mai puţin costisitoare decât orice metodă de
eşantionare aleatoare, proiectarea nu este laborioasă, rezultatele se obţin operativ, într-un timp
scurt şi de fapt este singura metodă posibilă dacă nu există bază de sondaj.
9
6. Erori întâlnite în sondaj
Orice măsurare statistică conţine erori. O posibilă clasificare a erorilor, din mulţimea
posibilităţilor de grupare şi clasificare existente poate fi: erori sistematice, grosolane şi
aleatoare Erorile sistematice sunt determinate de acţiunea unor factori ale căror cauze de
apariţie pot fi stabilite, iar apoi eliminate. Apariţia erorilor grosolane este legată de încălcarea
condiţiilor de efectuare a experimentului sau a observaţiei. În teoria erorilor se dau criterii de
depistare a erorilor grosolane. Obiectul teoriei erorilor îl constituie numai erorile aleatoare,
care sunt determinate de acţiunea unor factori greu de depistat, din care cauză efectul acţiunii
lor este inevitabil. Erorile de sondaj mai sunt clasificate în erori de înregistrare, comune
tuturor tipurilor de observare, şi erori de reprezentativitate, specifice sondajului. Erorile de
reprezentativitate sunt la rândul lor: sistematice şi întâmplătoare.
Din punctul de vedere al posibilităţii controlului erorilor, în literatura americană de
studiu al pieţei, erorile mai sunt clasificate în două mari grupe:
1. Erori ce pot fi previzionate: acestea sunt controlabile şi au drept cauze măsurările
statistice ale datelor continue şi rotunjirile efectuate pentru a obţine rezultate discrete conform
conţinutului caracteristicii statistice, deci ele sunt probabile - sau de sondaj şi de calcul -
ambele tipuri putând fi estimate şi efectele lor controlate. Prin operaţiunea matematică de
rotunjire a valorilor înregistrate se induc erori ce se amplifică dacă rotunjirea continuă în faza
de analiză.
Drept urmare putem afirma că datele sunt rotunjite din următoarele motive:
Dacă caracteristica observată este continuă în anumite cazuri este necesară rotunjirea
pentru a putea exprima magnitudinea datei (de obicei se păstrează doar două zecimale)
Pentru caracteristicle discrete rotunjirea are drept scop respectarea caracterului întreg
al acestora.
2. Erori ce nu pot fi previzionate: acestea sunt necontrolabile şi se datorează:
înregistrărilor incomplete sau incorecte, definirii ambigue a caracteristiclor sau unităţilor
statistice ce sunt studiate.
Identificam doua tipuri de erori de sondaj din punctul de vedere al utilizarii tehnicilor
de esantionare:
10
Apar cu o anumita probabilitate
Principalele cauze ale erorilor sistematice sunt alegerea deliberată a unor date
considerate în mod greşit ca fiind reprezentative, alegerea la “întâmplare” ce diferă esenţial de
alegerea după principiile probabilistice, dorinţa voită a cercetătorului de a demonstra o
anumită concluzie, substituirea unei unităţi de cercetare cu altă unitate, în mod voit şi
cuprinderea incompletă în sondaj a unităţilor de cercetare.
Spre deosebire, erorile aleatoare de selecţie apar din procesul de sondaj. Aceste erori
se produc chiar dacă se respectă principiile probabilistice, deoarece eşantionul nu reproduce
perfect distribuţia populaţiei generale. Dacă sondajul este probabilistic, aceste erori pot fi
calculate cu anticipaţie. Estimarea parametrilor din populaţia generală se va efectua pe baza
indicatorilor de sondaj, corectaţi cu o eroare de reprezentativitate ce se găseşte într-un anumit
interval probabilistic. Aceste analize de perspectivă şi aceste proiecţii ale rezultatelor
sondajului asupra populaţiei de referinţă, fac din metoda sondajului un puternic instrument în
procesul luării deciziilor în mediul economico-de piaţă.
11
Estimarea punctuala caracterizeaza parametrul populatiei prin estimarea unei singure
valori sau a unui PUNCT.
Intervalul de estimare denumit şi intervalul de încredere realizează inferenţa
despre populaţie prin estimarea valorii parametrului într-un interval determinat pentru un
anumit nivel de incredere (probabilitate)
Conceptul estimării punctuale trebuie lărgit cu cel al estimării unui interval de variaţie
pentru parametrul populaţiei totale, garantat cu o anumită probabilitate. Într-o viziune mai
largă, dacă parametrul ar fi fost un vector, prin estimarea intervalului s-ar stabili regiunea
critică a acestuia. Un exemplu îl constituie intervalele de încredere.
În cazul unui eşantion de volum n, extras dintr-o populaţie normal distribuită cu media
necunoscută şi deviaţia standard cunoscută, probabilitatea 1 – α este probabilitatea ca media
de sondaj să varieze cu o mărime denumită eroare limită, ±z α/2 .σ √n, utilizată pentru a estima
intervalul de variaţie a mediei, şi zα/2este parametrul corespunzător punctului procentual α/2 al
distribuţiei normale standard.
x
Dacă z este: Z
n
unde nivelul de semnificaţie este 1-α este de regulă 5 % pentru o probabilitate de garantare a
rezultatelor de 95%.
Argumentul funcţiei Laplace pentru diverse niveluri de încredere sunt prezentate în tabelul de
mai jos:
Niveluride
Niveluri de
incredere
incredere aa a/22
a/ za/2
0.90
0.90 0.10
0.10 0.05
0.05 1.645
1.645
0.95
0.95 0.05
0.05 0.025
0.025 1.96
1.96
0.98
0.98 0.02
0.02 0.01
0.01 2.33
2.33
0.99
0.99 0.01
0.01 0.005
0.005 2.575
2.575
.
12
Construcţia intervalelor de încredere pentru media aritmetică
Unde
n = volumul eşantionului
σ = dispersia variabilei în populaţia mama din care a fost extras eşantionul.
13
adică:
x e
Dimensiunea eşantionului – sondaj simplu aleator, s cunoscut, procedeul de selecţie cu
bila revenită este:
za 2
2
n
e
Se aplică datelor nominale şi frecvenţelor relative. Estimatorul folosit pentru inferenţă este
indicatorul de sondaj, p, proporţia calculată pentru eşantion.
x
p unde
n
x numarul _ cazurilor _ de _ succes.
n volumul _ esantionului.
În anumite condiţii, proporţia în eşantion este normal distribuită cu media m = π
(proporţia din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este π, valoarea
z va fi:
Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o
precizie antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p w w , adica
14
În acest caz, dispersia din populaţie nu este cunoscută, fiind π (1 - π). Pentru
caracteristica alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca
un produs între limitele intervalului de încredere şi volumul întregului fenomen, adică:
N (w w ) . In acest caz volumul esantionului va fi:
2
z p(1 p)
n a /2
e
n
e
In acest caz, dispersia din populatie nu este cunoscuta, fiind π (1 - π). Pentru caracteristica
alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca un produs între
limitele intervalului de încredere şi volumul întregului fenomen, adică: N (w w ) . In acest caz
volumul
2
z p(1 p)
n a /2
e
16