Sunteți pe pagina 1din 24

3 Procedee de eşantionare aplicate

în cercetarea pieţei şi administrarea


eficientă a afacerilor

3.1 Eşantionare aleatoare

Eşantionul este un segment al populaţiei studiate, ales să o reprezinte


în ansamblu. Reprezentativitatea acestuia asigură corectitudinea estimărilor
efectuate baza calculului indicatorilor de sondaj şi a inferenţei statistice
realizate.
Atunci când alege eşantionul cercetătorul trebuie să răspundă la mai
multe categorii de întrebări:
i) CINE urmează să fie studiat (care este unitatea de sondaj?);
ii) CÂTE unităţi va cuprinde eşantionul (volumul eşantionului
desigur influenţează siguranţa rezultatelor, dar, dacă este bine
ales, şi un eşantion de sub 1% din populaţia totală poate furniza
rezultate cu o probabilitate ridicată);
iii) care sunt CRITERIILE de alegere a unităţilor în eşantion (care
este procedeul de eşantionare folosit?).
Folosind eşantionarea aleatoare, probabilistică, fiecare unitate
componentă a populaţiei studiate are o anumită probabilitate, pentru a fi
inclusă în eşantion, putându-se astfel estima eroarea de eşantionare. Atunci
când procedeele aleatoare sunt prea costisitoare sau durează prea mult,
Statistică pentru studii de marketing şi administrarea afacerilor

studiile de piaţă apelează şi la eşantionare neprobabilistică sau mixtă, caz în


care nu pot fi estimate erorile de eşantionare.
Pentru a respecta caracterul aleator al formării eşantionului,
procedeul de eşantionare nu trebuie să fie influenţat de analist. Un eşantion
este aleator dacă toate unităţile extrase din colectivitatea generală au avut
aceeaşi şansă (probabilitate egală şi diferită de zero) de a participa la
eşantion. Rezultatele unui astfel de sondaj pot fi interpretate probabilistic.
Eşantionarea aleatoare se realizează după planuri de sondaje simple
(pentru sondaje în populaţii omogene, dar putându-se aplica şi pentru
populaţii neomogene), după planuri de sondaj în mai multe etape
(stratificarea, sondajul multistadial, multifazic, de serii, secvenţial). Această
metodă de eşantionare este indicat a se folosi în cazul în care unităţile din
populaţie sunt de dimensiuni mici şi nu există diferenţe semnificative între
mărimea unităţilor populaţiei.
În practica de piaţă economică această condiţie este rar îndeplinită în
totalitate,. De aceea, se recomandă aplicarea de metode de eşantionare cu
probabilităţi inegale, în ipoteza că unităţile au şanse diferite de a face parte
din eşantion. Pentru aplicarea acestei metode este necesară cunoaşterea unor
date auxiliare despre populaţie. În unele cazuri, eşantionarea cu probabilităţi
inegale poate fi mai avantajoasă decât cea cu probabilităţi egale.
De exemplu, dacă estimăm numărul angajaţilor dintr-o regiune, cu
scopul de a planifica cifra de şcolarizare la o firmă de instruire, vom folosi
datele dintr-un eşantion de judeţe, extrase aleator, pentru care se cunoaşte
populaţia fiecarui judeţ (în urma ultimului recensământ).
Dacă notăm cu Xi numărul firmelor din judeţul i cuprins în eşantion,
cu N numărul judeţelor ţării şi cu n numărul judeţelor cuprinse în eşantion,
sum(Xi) estimează numărul firmelor la nivel naţional. Judeţele, indiferent de
mărimea lor, au avut şanse egale de a participa la eşantion. Dar numărul
firmelor depinde în mod evident de populaţia judeţului şi deci estimatorul
poate fi afectat de o eroare semnificativă.
Statistică pentru studii de marketing şi administrarea afacerilor

Pornind de la ipoteza existenţei unei legături directe, pozitive între


populaţia unui judeţ şi numărul de firme comerciale, se poate acorda
judeţelor mai mari o şansă mai mare de a face parte din eşantion.
Probabilitatea ce i se va atribui fiecărui judeţ va fi proporţională cu
populaţia sa. Procedeul de extracţie va fi nerepetat. Estimatorul devine:
(P/n).sum(Xi/pi), unde P este populaţia întregii ţări şi pi populaţia judeţului i
din eşantion.
Din procedee de extracţie cu probabilităţi egale amintim procedee
absolut aleatoare, procedeul loteriei şi al tabelului cu numere întâmplătoare
şi procedeul mecanic sau de eşantionare sistematică.

3.2 Eşantionare dirijată şi mixtă

Eşantionarea dirijată apare în cadrul sondajului efectuat de un expert


sau un observator - bun cunoscător al caracteristicilor populaţiei din care se
va extrage eşantionul, care va include în eşantion, în mod conştient, unităţile
alese după părerea sa subiectivă. Acest procedeu de eşantionare este mult
mai ieftin decât cele probabilistice şi se poate aplica dacă eşantioanele sunt
atât de mici, încât inferenţele efectuate pe baza lor nu ar reprezenta decât o
simplă ipoteză ce nu ar putea fi testată, indiferent de metoda de prelevare
utilizată.
Datele disponibile pot prezenta un grad ridicat de nesiguranţă, ceea
ce va face ca opinia unui expert să ducă la obţinerea de rezultate mai bune.
Selecţia dirijată nu permite stabilirea gradului de precizie a unei estimaţii
făcute pe baza ei, precizia depinzând direct de numeroase circumstanţe. În
practică se aplică aceasta metodă de eşantionare datorită imposibilităţii
respectării condiţiilor de efectuare a unei eşantionări aleatoare (baza de
sondaj completă şi fără omisiuni, cunoaşterea unor informaţii suplimentare
despre unităţile cuprinse în eşantion).
Statistică pentru studii de marketing şi administrarea afacerilor

Cea mai utilizată metodă de eşantionare dirijată în cercetările de


piaţă şi anchetele de piaţă este cea pe cote. În acest caz se cunoaşte structura
populaţiei studiate după sex, vârstă, categorie socio-profesională, din studii
demografice anterioare. În cadrul fiecărei grupe se cuprinde un număr de
persoane alese de către operator. Acestuia i se comunică doar caracteristicile
persoanelor ce trebuie intervievate, numărul lor pe fiecare grupă în parte şi
structura populaţiei studiate. Se presupune că eşantionul este reprezentativ
dacă el redă structura populaţiei generale studiate.
Metoda se bazează pe o alegere raţională a unităţilor din eşantion.
Prin modul de constituire a eşantionului apare ca o metodă mixtă,
combinând metodele probabilistice cu cele nealeatoare de eşantionare.
Asimilarea cu metodele probabilistice se face în măsura în care
putem defini ca probabilităţi frecvenţele relative, definite în cadrul
populaţiei. Putem face această echivalenţă dacă volumul populaţiei de
referinţă este suficient de mare pentru a da posibilitatea aplicării legii
numerelor mari.
De aceea, se poate afirma că sondajul pe cote apare ca un sondaj
stratificat, selecţia în cadrul grupelor fiind conştienţa nu este aleatoare.
Caracterul voluntar al metodei constituie principalul său dezavantaj,
operatorul putând influenţa în mod voit sau nu rezultatele sondajului.
Asemănarea dintre eşantionarea stratificată aleatoare şi cea pe cote constă în
stratificarea iniţială a populaţiei de referinţă pe straturi omogene.
Diferenţa dintre stratificarea aleatoare şi eşantionarea pe cote constă
în procedeul de selecţie al unităţilor din fiecare strat, selecţia în cazul
eşantionarii pe cote fiind lăsată pe seama operatorilor.
Deci metoda se bazează pe definirea caracteristicilor de structurare a
populaţiei de referinţă. Astfel, pentru fiecare caracteristică, structura
eşantionului trebuie să fie identică cu cea a populaţiei din care este prelevat.
Se definesc variabilele de control ca ansamblul caracteristicilor reţinute
pentru a asigura identitatea între eşantion şi populaţia de referinţă. Stabilirea
Statistică pentru studii de marketing şi administrarea afacerilor

variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei


de referinţă.
Pentru alegerea criteriilor de cotă, de structurare este recomandabil
să se ţină seama de următoarele îndrumări: definirea variabilelor pe baza
întrebărilor cuprinse în eşantion, folosirea ca variabile de control doar a
acelora pentru care se poate defini o distribuţie statistică pentru populaţia de
referinţă, limitarea numărului de criterii de cotă – ce trebuie să fie
independente, fără să cuprindă conotaţii psihologice şi formate din unităţi
statistice cu un grad cât mai mare de omogenitate. Dacă se respectă aceste
condiţii se poate obţine un eşantion sensibil apropiat de un eşantion extras
pe baza procedeelor aleatoare.
Un eşantion obţinut prin procedeul cotelor, reprezentativ la nivel
naţional, format din consumatori, trebuie structurat după criteriile: mediul
de provenienţă, marimea oraşului, sex, venit etc.
Într-un alt exemplu, într-un sondaj statistic organizat la nivelul
Municipiului Bucureşti, cu scopul identificării preferinţelor cursanţilor unui
curs de informatică, pentru calculatoare personale şi produse program,
organizat în scopul identificării segmentelor ţintă pe diferite tipuri şi
categorii de cursanţi, pot fi alese ca variabile de control categoria
socio-profesională, vârsta, gradul de educaţie, structura populaţiei – aceste
variabile de segmentare fiind publicate în urma ultimului recensământ.
De asemenea, în cadrul unui sondaj efectuat cu scopul identificării
oportunităţilor pe piaţa serviciilor de consultanţă în resurse umane am ales
drept variabile de control pentru o populaţie formată din agenţi economici
din Bucureşti: forma dominantă de proprietate şi provenienţa capitalului,
date preluate de la INS.
Această metodă este de departe cea mai utilizată în studiile de piaţă,
deoarece necesită un buget redus de cheltuieli, fiind mai puţin costisitoare
decât orice metodă de eşantionare aleatoare, proiectarea nu este laborioasă,
rezultatele se obţin operativ, într-un timp scurt şi, de fapt, este singura
metodă posibilă dacă nu există bază de sondaj.
Statistică pentru studii de marketing şi administrarea afacerilor

O altă metodă de formare dirijată a eşantionului este metoda


voluntariatului, extrem de utilizată în trecut în cercetările medicale şi
psihologice. A început să fie din ce în ce mai des folosită în studiile de
marketing. Includerea în eşantion se realizează pe baza opţiunii voluntare a
persoanelor de a participa la eşantion.
Anchetele desfăşurate pe baza metodei voluntariatului se aplică
studiului opiniilor ascultătorilor radioului, cititorilor ziarelor, „navigatorilor”
pe internet. Metoda constă în publicarea chestionarului în presă ori afişarea
sa într-o pagină de Web, însoţită de rugămintea de a răspunde. Deşi aceste
anchete furnizează un volum mare de date, se pune problema posibilităţii
extrapolării rezultatelor, imposibil de realizat datorită necunoaşterii
reprezentativităţii eşantionului celor ce au răspuns.
O a treia metodă de eşantionare dirijată este metoda de eşantionare
bazată pe accesibilitate, cercetătorul alegând acei membrii ai populaţiei de
la care se pot obţine cel mai uşor informaţiile.
Metoda itinerariilor este, de asemenea, o metodă de eşantionare
dirijată care se poate aplica în regiunile cu densitatea populaţiei mare.
Această metodă poate fi combinată cu metodă de eşantionare pe cote, ceea
ce presupune că operatorul trebuie să formeze grupele urmând un itinerar
prestabilit. În cazul unui refuz, operatorul va trece la următorul punct
prestabilit de pe traseu.
Principiul de bază al metodei unităţilor tipice constă în faptul că
diferite caracteristici ale unităţilor statistice sunt corelate, ceea ce permite
gruparea populaţiei în subansambluri omogene, iar variabila de control
reprezintă aceste subansambluri prin media sa, denumită unitate tip.
Deşi metodele prezentate mai sus nu respectă principiile eşantionării
aleatoare, sunt folosite destul de des în sondajele de piaţă, fiind efectuate de
specialişti în domeniul marketing-ului, ce contribuie prin cunoştinţele lor şi
experienţa acumulată la atenuarea dezavantajelor acestor metode de
eşantionare.
Statistică pentru studii de marketing şi administrarea afacerilor

În practică, se pot combina metodele de eşantionare aleatoare cu cele


dirijate, obţinându-se o combinaţie de avantaje şi atenuarea dezavantajelor
fiecăreia. Un exemplu îl constituie selecţia stratificată, în care se împarte
întreaga populaţie în straturi (grupe) după criterii de stratificare
corespunzătoare scopului sondajului şi se alege din fiecare strat câte un
subeşantion folosind procedeul aleator de selecţie.
Eşantionarea stratificată se recomandă a se utiliza în studiul
fenomenelor economico-sociale de masă şi, în mod special, în studierea
fenomenelor de piaţă, caracterizate printr-un grad mare de eterogenitate.
Pentru a creşte gradul de omogenitate, populaţia de referinţă se împarte mai
întâi pe grupe omogene. Aplicând în continuare selecţia aleatoare în fiecare
grupă, subeşantionul obţinut va fi omogen. Erorile de sondaj rezultate vor fi
mai mici decât în cazul extragerii eşantionului din populaţia totală,
neîmpărţită pe clase omogene.

3.3 Determinarea mărimii eşantionului

Determinarea volumului eşantionului este pasul esenţial ce trebuie


parcurs înainte de culegerea datelor. Volumul eşantionului este desemnat
prin numărul unităţilor statistice simple sau complexe ce vor fi prelevate din
populaţia de referinţă, de la care se vor înregistra datele de intrare pentru
analiză.
Deci, analistul trebuie să decidă, în funcţie de mai mulţi factori, care
este numărul optim de unităţi statistice ce trebuie cuprinse în sondaj pentru
ca eşantionul să fie reprezentativ şi rezultatele sale să se poată extinde
asupra populaţiei de referinţă cu respectarea principiilor inferenţei statistice.
În consecinţă, se pune problema determinării dimensiunii optime a
eşantionului care să asigure îndeplinirea obiectivelor sondajului. Eşantionul
ideal trebuie să fie în concordanţă cu eşantionul practic, ce poate fi construit
astfel încât să se poată atinge obiectivele studiului.
Statistică pentru studii de marketing şi administrarea afacerilor

Un alt element care trebuie foarte clar precizat şi utilizat este


reprezentat de modalitatea de determinare a volumului eşantionului. Contrar
simţului comun, nu este importantă ponderea eşantionului în colectivitatea
totală (care intră doar ca element de corecţie), cât mărimea absolută a lui.
Fixarea apriorică a proporţiei de sondaj, raportul dintre volumul
eşantionului şi volumul populaţiei totale, poate conduce fie la
supra-dimensionare, fie la subdimensionare.
O raţie de sondaj de zeci de procente se dovedeşte nesemnificativă în
condiţiile unui volum relativ redus al colectivităţii totale, după cum o
pondere chiar mai mică de 1% este suficientă la colectivităţi mari şi foarte
mari.
Volumul optim de eşantionare depinde de obţinerea volumului
minim care să asigure o reprezentativitate adecvată a eşantionului, ce este
dat de factori de influenţă situaţi în afara mărimii colectivităţii totale şi care
se referă la structura colectivităţii.
Expresiile de definiţie a mărimii eşantionului sunt:

n = t2.σ2 / e2 pentru caracteristici continue (3.1)


şi
n = t2.P.(100 - P) / e2 pentru caracteristici alternative (3.2)

unde,
t: valoarea teoretică corespunzătoare probabilităţii cu care se
lucrează (de regulă, P = 95%, iar t = 1,96);
σ: abaterea medie pătratică a distribuţiei caracteristicii care stă la
baza elaborării eşantionului (σ2 = dispersia sau varianţa V);
P: procentul în care populaţia cercetată posedă caracteristica de
eşantionare;
e: eroarea limită de reprezentativitate admisă.
Statistică pentru studii de marketing şi administrarea afacerilor

Datorită faptului că nu se studiază întreaga colectivitate, estimarea


valorilor obţinute (medii, procente) la nivelul eşantionului pentru întreaga
colectivitate se face cu o anumită eroare. Valoarea reală se află cuprinsă în
limitele determinate de mărimea obţinută la nivelul eşantionului ± e.
În determinarea volumului eşantionului se acceptă aprioric o anumită
eroare cuprinsă între 1% (foarte rar practicată, dealtfel, deoarece necesită
eşantioane foarte mari) şi 5% (prag de eroare aproape general acceptat de
către experţii în marketing).
În continuare, algoritmul de lucru este „simplu”. La o anumită
valoare a lui σ sau P şi o valoare impusă a lui e rezultă în mod automat o
anumită valoare a lui n. Dificultatea cea mai mare constă însă tocmai în
obţinerea informaţiilor referitoare la distribuţia caracteristicilor de
eşantionare, respectiv valorile σ sau P. La valorile σ = 0,5 m sau P = 50% şi
e = 1% rezultă un eşantion de 9600 persoane necesar pentru a fi studiat, ori,
de multe ori, colectivitatea totală este mică.
Volumul cerut pentru eşantion scade vertiginos, dacă ne reducem
dorinţa de rigurozitate şi acceptăm valori mai mari ale lui e, ceea ce se şi
face de regulă. Pentru un nivel al erorii e = 2%, 3%, 4% sau 5% (menţinând
constant σ sau P) volumul eşantionului se reduce şi el la: 2400, 1060, 600 şi,
respectiv, 384 persoane. Dacă se modifică valorile σ sau P vor rezulta
mărimi diferite pentru n.
În evaluarea gradului de reprezentativitate a cercetărilor intervin şi
alte elemente, care se referă la aplicarea corectă a tuturor cerinţelor de
întocmire a eşantionului, a corecţiilor cerute de schema de eşantionare, de
dispersia spaţială a populaţiei, de selectarea subiecţilor şi de cercetarea
efectivă a acestora.
Putem preciza o serie de principii ce trebuie respectate pentru
evaluare: aplicarea eşantionării la colectivităţile de populaţie reclamă
asigurarea unui număr minim de persoane (n) care să permită un grad
acceptabil de reprezentativitate; mărimea colectivităţii totale intervine doar
ca element de corecţie, factorul de corecţie fiind (N – n)/(N – 1), cu care se
Statistică pentru studii de marketing şi administrarea afacerilor

micşorează valoarea n a volumului eşantionului, deja obţinută. Valoarea


raportului se apropie de unu în cazul în care N este un număr mare.
Atunci când studiem colectivităţi relativ mici (sub 500 persoane) nu
se pot determina eşantioane reprezentative după regulile numerelor mari şi
ar trebui să se ia în considerare cerinţele suplimentare ale eşantioanelor
mici. Când suntem în imposibilitatea de a construi eşantioane reprezentative
este preferabil să studiem loturi omogene sau neomogene de populaţie, dar
care nu ne permit să generalizăm rezultatele la ansamblul colectivităţii, de
unde rezultă implicit avantajele cercetării selective, riguros realizate.
O atenţie cu totul deosebită trebuie acordată modului în care se face
uz de o metodă mai rapidă de determinare a mărimii eşantionului, care
pleacă de la volumul colectivităţii totale (N) fără a mai lua în considerare
caracteristicile populaţiei, expresia Taro Jamane:

N = N / (1+N.e2) (3.3)

Efectuarea unor calcule simple ne indică şi de această dată că, de


fapt, volumul eşantionului obţinut nu reflectă variaţiile mărimii colectivităţii
totale. Se constituie anumite praguri peste care n (volumul eşantionului) nu
mai creşte oricât de mult ar creşte N.
Aşa, de exemplu, la e = 5% pragul respectiv este 399. La valori mai
mici ale erorii limită admise pragul eşantionului se fixează, evident, la valori
mai mari, dar întotdeauna în jurul valorii indicate de expresia de definiţie a
mărimii eşantionului în care P = 50% (când furnizează cea mai mare mărime
a eşantionului), iar t = 1,96 corespunde unei probabilităţi de 95%.
După cum se observă, metoda Jamane poate conduce la eşantioane
subdimensionate (când se doreşte o siguranţă mai mare, deci o probabilitate
de peste 95%, sau când populaţia este eterogenă în raport cu caracteristicile
de bază) şi la eşantioane supradimensionate (în cazul în care populaţia este
relativ omogenă). Şi de această dată dorinţa de a lucra cu erori mici de
reprezentativitate conduce la eşantioane foarte mari (tabelul 3.1).
Statistică pentru studii de marketing şi administrarea afacerilor

Calculul expus îndreptăţeşte, pe de o parte, afirmaţia potrivit căreia


mărimea eşantionului nu depinde în mod absolut de mărimea colectivităţii
totale (în condiţiile în care eroarea de reprezentativitate rămâne constantă,
variaţiile mărimii colectivităţii totale nu pot fi reflectate în mărimea
eşantionului), iar, pe de altă parte, impune o anumită circumspecţie în
utilizarea metodei „simplificate” pentru determinarea volumului
eşantionului.

Mărimile simulate ale eşantionului calculat prin expresia


Taro Jamane pentru anumite valori ale lui N şi e
Tabel 3.1
Mărimea Mărimea eşantionului pentru diverse erori limită admise
colectivităţii
e = 5% e = 3% e = 1%
totale (N)
500 222 345 476
1000 285 526 909
5000 370 909 3333
10000 384 1000 5000
100000 398 1099 9090
1000000 399 1109 9900
10000000 399 1110 9990

Stabilirea volumului eşantionului se face pe bază unui compromis


între opţiunea pentru eşantioane de volum mare, care să asigure un grad
mare de reprezentativitate şi un grad mare de încredere pentru parametrii
estimaţi ai populaţiei de referinţă, şi optiunea pentru eşantioane de volum
mic, ce implică costuri reduse. Dimensiunea minimă a eşantionului trebuie
să asigure o reprezentativitate acceptabilă în procesul inferenţei statistice,
care să nu ducă la distorsiuni.
Mărimea eşantionului depinde de numeroşi factori controlabili şi
necontrolabili pentru cercetător: gradul de exactitate cu care se doreşte să se
estimeze caracteristicile populaţiei de referinţă, mărimea erorilor de sondaj,
legea numerelor mari şi, nu în ultimul rând, bugetul disponibil, perioada de
timp avută la dispoziţie şi resursele de personal de care dispune.
Statistică pentru studii de marketing şi administrarea afacerilor

Gradul preciziei cerute de beneficiarul rezultatelor este principalul


factor ce determină marimea eşantionului. Încrederea ce poate fi atribuită
informaţiilor obţinute pe baza unui eşantion depinde direct de mărimea
eşantionului, şi nu de fracţia de selecţie.
În stabilirea dimensiunii eşantionului, dacă se stabileşte aprioric un
prag de semnificatie ∝, se impune ca abaterile dintre media populaţiei de
referinţă, dacă se cunosc, şi mediile eşantioanelor ce se pot genera să
respecte inegalitatea.
Gradul de variabilitate al oricărei populaţii este un alt factor de
influenţă ce poate fi sau nu cunoscut. Dacă variabilitatea este cunoscută din
cercetări anterioare sau dintr-o cercetare organizată în mod special, volumul
eşantionului rezultă imediat din calcule. Dacă dispersia eşantionului sau a
populaţiei de referinţă nu este cunoscută în cazul cel mai nefavorabil), se ia
în calcul dispersia maximă. Calculul ei presupune stabilirea mărimii maxime
a dispersiei pentru caracteristici cantitative:

( x min − x ) 2 + ( x max − x ) 2 σ 2max = f (1 − f ) = 0 ,5 (1 − 0 ,5 ) = 0 , 25


σ 2max = şi (3.4)
2

şi determinarea valorii de 0,25 – corespunzătoare frecvenţei maxime f, a


caracteristicii alternative.
În practică se operează cu eşantioane de volum redus (pentru care se
foloseşte la estimarea erorilor legea repartiţie Student) şi eşantioane de
volum normal (pentru care se foloseşte legea de repartiţie Laplace), în
funcţie de gradul de omogenitate al colectivităţii. Evident, conform legii
numerelor mari cu cât creşte volumul eşantionului (nu fracţia de selecţie), cu
atât precizia rezultatelor este mai mare. Mărimea eşantionului se decide şi în
funcţie de rezultatele ce vor fi analizate, ţinându-se seama de necesitatea
obţinerii preciziei nu doar pe total eşantion, ci şi pe subgrupe.
Un alt factor de influenţă este faptul că sondajul, în general,
urmăreşte rezultatele privitoare la mai multe caracteristici. Un eşantion
Statistică pentru studii de marketing şi administrarea afacerilor

suficient de mare pentru estimarea intervalului de încredere pentru o


caracteristică poate să fie insuficient pentru o altă caracteristică.
Problemele se complică în cazul sondajelor stratificate, caz în care
trebuie estimată mărimea eşantionului pe fiecare strat şi apoi, prin însumare,
va rezulta eşantionul pe total populaţie. În cazul sondajului multistadial
trebuie facută o estimare a variantelor în interiorul şi între unităţile din
primul stadiu. Toate aceste dificultăţi de natură tehnică pot fi evitate printr-o
documentare prealabilă corespunzătoare.
Mărimea eşantionului va mai fi decisă şi în funcţie de restricţiile de
resurse şi bugetul disponibil, de cerinţele beneficiarului şi de posibilitatea
previzionării dispersiei variabilelor înregistrate.

3.4 Probleme privind prognoza volumului de eşantionare.


Dispersii marginale

Fenomenele din domeniul studiului pieţei sunt, în general, fenomene


dinamice, ceea ce determină valori diferite în timp ale variabilelor ce le
caracterizează. Sondajul prezintă o situaţie statică, de aceea se recomandă
organizarea de sondaje periodice cu acelaşi set de variabile înregistrate.
Măsurând valorile unor variabile ce caracterizează un fenomen în
momente diferite de timp putem determina variaţii statistice nu doar între
valorile individuale înregistrate, ci şi între valorile medii calculate la
momente de timp diferite, pastrându-se sau nu aceeaşi amplitudine a
variaţiei.
Pentru proiectarea volumului unui nou eşantion în sondaje periodice
este necesară conoaşterea tendinţei de evoluţie a dispersiei şi posibilitatea
previzionării dispersiei şi abaterii standard. De aici apare ca necesară
elaborarea de serii de timp de dispersii şi de modificări absolute şi/sau
relative ale acesteia, ca de exemplu, serii cronologice de indici ai dispersiei
Statistică pentru studii de marketing şi administrarea afacerilor

sau de sporuri ale dispersiei unei variabile înregistrate în sondaje efectuate


la momente de timp diferite.
Posibilitatea previzionării dispersiei cu ajutorul indicatorilor
marginali ar adăuga o nouă restricţie în estimarea volumului noului
eşantion, alături de restricţiile de costuri.
Cea mai frecventă metodă de sondaj utilizată în studiile sociale şi
economice este sondajul stratificat. De aceea, această formă de sondaj poate
fi utilizată şi pentru studiul fenomenelor în dinamică, pe baza datelor
înregistrate în sondaje realizate în perioade diferite, în vederea elaborării de
serii cronologice care să permită, prin aplicarea de tehnici complexe de
sondaj, efectuarea de prognoze optime.
În scopul previzionării gradului de variaţie, a dispersiei şi a abaterii
tip, în urma realizării de sondaje periodice se pot construi serii cronologice
cu periodicitate constantă sau variabilă, de niveluri atinse de indicatori
micro sau macroeconomici, de medii şi măsuri ale variaţiei atinse de valorile
individuale ale distribuţiei marginale şi chiar de indicatori marginali care
exprimă modificarea mediilor şi a dispersiilor.
Cunoaştem că rezultatele unui sondaj stratificat conduc la verificarea
regulei de adunare a dispersiilor, conform căreia dispersia totală înregistrată
de variaţia valorilor individuale ale distribuţiei marginale este suma
dispersiilor parţiale, deci:

σ 2total = σ 2 + σ 2y / x , (3.5)

unde,
σ 2total = dispersia totală, determinată de toţi factorii de influenţă ai
variaţiei unei variabile;
σ2 = media dispersiilor înregistrată în interiorul straturilor,
determinată de factorii neînregistraţi;
Statistică pentru studii de marketing şi administrarea afacerilor

σ 2y / x = dispersia dintre straturi, determinată de factorul de formare a


straturilor, ce arată în ce măsură discriminează sau nu criteriul de stratificare
variabila studiată.
Dacă simplificăm fiecare termen al ecuaţiei de mai sus cu dispersia
totală, calculând deci structura dispersiei totale, obţinem raportul de
determinaţie şi raportul de nedeterminaţie, după formula:

σ 2 σ y/ x
2

1= 2 + 2 , (3.6)
σ total σ total

unde,
σ2
= raport de nondeterminaţie ce exprimă procentual partea din
σtotal
2

variaţia totală datorată factorilor aleatori neînregistraţi;


σ y2/ x
= raport de determinaţie ce exprimă procentual partea din
σtotal
2

variaţia totală a variabilei dependente explicată de factorul de grupare, de


discrimare, de variabila independentă.
Dacă înregistrăm două niveluri ale dispersiei pentru două sondaje
succesive se poate calcula modificarea absolută a dispersiei totale ce se va
distribui între modificarea absolută a dispersiei dintre straturi şi a mediei
dispersiilor din interiorul straturilor, astfel:

∆σ 2total = ∆σ 2 + ∆σ 2y / x (3.7)

Acest spor al dispersiei totale poate fi pozitiv sau negativ şi se poate


distribui egal sau diferit pe cele două componente. Pentru a măsura modul
de distribuţie şi a determina contribuţia factorului de stratificare la variaţia
Statistică pentru studii de marketing şi administrarea afacerilor

dispersiei totale, calculăm structura ecuaţiei modificărilor absolute ale


dispersiilor împăţind ecuaţia modificărilor absolute, cu modificarea absolută
a dispersiei totale, astfel:

∆σ 2 ∆σ 2y / x
1= + , (3.8)
∆σ total
2
∆σ 2total

În ecuaţia de mai sus se propune că indicatorii marginali obţinuţi să


se noteze, numească şi intrepreteze, astfel:

∆σ 2
a. σ 2 mg = = dispersie medie marginală, ce arată cu cât se
∆σ 2total
va modifica media dispersiilor din interiorul straturilor dacă dispersia
totală suferă o modificare cu o unitate sau cu cât trebuie să se modifice
media dispersiilor din interiorul straturilor pentru a obţine o modificare cu
o unitate a dispersiei totale; poate lua valori între – 1 şi 1.

∆σ 2y / x
b. σ 2
= = dispersie marginală dintre straturi, ce arată cu
∆σ 2total
y / xmg

cât se va modifica nivelul dispersiei dintre straturi la o modificare unitară a


dispersiei totale sau cu cât trebuie modificată dispersia dintre straturi
pentru a obţine o modificare unitară a dispersiei totale; poate lua valori
între -1 şi 1.

Există posibilitatea identificării unei funcţii matematice de trend pe


termen lung, atât a dispersiilor marginale, cât şi a raportului acestora cu
evoluţia în domeniu; fapt ce va trebui aprofundat. Între cele trei tipuri de
dispersii există o relaţie directă sau inversă, deci creşterea dispersiei totale
va determina creşteri/descreşteri în proporţii egale sau diferite ale
dispersiilor parţiale, şi invers.
Statistică pentru studii de marketing şi administrarea afacerilor

Desigur dispersiile de eşantion sunt corectate cu numărul gradelor de


libertate corespunzătoare, dar pentru simplificarea modului de scriere a
formulelor nu am mai introdus şi aceste notaţii.
Dispersia totală se corectează cu n - 1 grade de libertate, dispersia
dintre starturi se corectează cu numărul de straturi -1, deci r - 1, iar media
disersiilor din interiorul starturilor cu volumul eşantionului – numărul de
straturi, deci n - r.
Construind serii cronologice de dispersii marginale ce vor fi supuse
analizei statistice de previziune putem estima, cu o anumită probabilitate,
nivelul mediei dispersiei din interiorul straturilor şi al dispersiei totale,
niveluri necesare programării unui nou volum de eşantionare. Dacă seriile
construite sunt nestaţionare vor trebui diferenţiate pentru a se transforma în
evoluţii staţionare.
În final, trebuie precizat că modificările absolute ale dispersiilor
corectate pot fi calculate cu bază mobilă sau cu bază fixă. Sporurile cu bază
fixă apar în cazul în care am realizat într-o cercetare anterioară o probă
martor sau un eşantion programat în care se ajunge la o distribuţie martor ce
coincide cu structura distribuţiei totale şi a cărei reprezentativitate este
validată statistic.
Necesitatea utilizării indicatorilor marginali ai variaţiei valorilor
individuale ale unei variabile cantitative de sondaj este legată, mai ales, de
calculele de prognoză care sunt necesare pentru determinarea volumului
unui nou eşantion.
Metoda se poate aplica înspecial în situaţia sondajului stratificat, caz
în care, pentru estimarea intervalului de încredere, se foloseşte media
dispersiilor din interiorul straturilor şi necesită, pentru o mai bună
fundamentare teoretică, testarea riguroasă în activitatea practică.
Statistics for Marketing and Business Administration

3.5 Summary. Sampling methods applied in Marketing


and Business Administration studies

Random Sampling

The sample is a segment of the statistical population chosen to


represent it as a whole. Its representativity ensures the accuracy of the
estimation made on the basis of calculating the research indicators and the
inferential statistics.
When it chooses the sample, the researcher must answer to different
categories of questions:
ƒ WHO is to be studied (which is the research unit?)?
ƒ HOW MANY units will the sample include (the sample size
influences the results' accuracy, but if it is well chosen, even
a sample of under 1 per cent of the total population may give
results with a high probability)
ƒ WHICH are the CRITERIAS for choosing the sampling units
(which is the sampling method used?)
Using random, probabilistic sampling, each unit of the population
has a certain probability to be included in the sample, making possible the
estimation of sampling error. In case the random methods are too expensive
or take too long, the market studies use non-probabilistic or mix sampling.
In this case the sampling errors cannot be estimated.
The random sample is made up of simple research plans
(for researches of homogenous population and also applicable for
non-homogenous population) or of multi-stage research plans
(ranking, multi-stage research, multi-phase research, serial research,
sequential research).
The sampling method is indicated to be used in the case where the
units of population are of small size and there are no significant differences
between the sizes of the units' population. For example, if we estimate the
Statistics for Marketing an Business Administration

number of employees in an area, with the purpose of planning the training


figure at a training firm, we will use data from districts' samples, randomly
chosen, for which the population of each district is known (as a result of the
last census).
If we denote by Xi the number of firms from district і comprised in
the sample, by N the number of the country's districts and by n the number
of the districts comprised in the sample, sum(Xi) is estimating the number of
firms at national level. The districts, no matter their size, had equal chances
to be a part of the sample. But, the number of firms depends obviously on
the district's population. Thus, the estimator can be afected by a significant
error.
Starting from the hypothesis of the existence of a direct, positive
relation between the population of a district and the number of the
commercial firms, larger districts can be granted a higher chance to be part
of the sample. The probability which is assigned to which district will be
well-balanced with its population. The method of extraction will not be
repeated. The estimator becomes: (P/n).sum(Xi/pi), where P is the
population of the whole country, pi is the population of district і from the
sample.

Conducted and mix sampling

Conducted sampling appears in the research achieved by an expert or


an observer who is a good expert of the population's characteristics, from
which the sample will be chosen, and who will consciously include in the
sample units chosen in a subjective way. This sampling procedure is much
cheaper than the probabilistic ones and can be applied if the samples are so
small that the inferences made with the their help would represent only a
simple hypothesis that could not be tested, despite the processing method
used.
Statistics for Marketing and Business Administration

The most used method of conducted sample in the market research


and market inquire is the quotas sampling. In this case the structure of the
population is known according to sex, age, socio-vocational category, due to
some previous demographic studies. In every group it is included a number
of persons chosen by the operator. The operator is told only the
characteristics of the persons that must be interviewed, their number for
every group and the structure of the studied population. It is presumed that
the sampling is representative if it gives the structure of the total studied
population.
Another method of forming the conducted sampling is the volunteers
method, which was often used in the past in medical and psychological
researches. It started to be used more and more in the marketing research.
The enclosure in the sample is made based on the voluntary option of the
person to participate in the sample.
The itinerary method is also a conducted sample, which can be
applied in areas with a high density of population. This type may be
combined with the sampling method based on quota, which supposes that
the operator must form the groups following a pre-established itinerary. In
case of refusal, the operator will pass to the next pre-established point of the
itinerary.
The basic principle of the typical units method consists in the fact
that different characteristics of the statistical units are correlated, which
allows grouping the population in homogenous subtypes, and the control
variable represents these subtypes through its average, called type unit.
Although the methods presented above do not respect the principle
of random sampling, they are often used in the market research, being
achieved by specialists in marketing, who contribute with their knowledge
and with their accumulated experience to decrease the disadvantages of
these sampling methods.
Statistics for Marketing an Business Administration

Determining the size of the sample

Determining the size of the sample is the essential step that must be
taken before gathering the data. The size of the sample is designated by the
number of simple and complex number of units, which will be obtained
from the reference population, from which the entering data will be recorded
for the analysis.
So, the analysts must decide, according to many factors, which is the
optimal number of statistical units that must be included in the survey so
that the sample will be representative and its results will extend over the
reference population, respecting the principles of statistical inference.
The optimal size of the sample depends on obtaining the minimum
size which will ensure the representativity of the sample, size which is given
by the influencing factors situated outside the total collectivity's size, which
refer to the structure of the collectivity.
The expressions to define the sample size are:

n = t2.σ2 / e2, for continous variables

and

n = t2.P.(100 - P) / e2, for alternative variables

where:
t: theoretical value corresponding to the probability with which it is
working (generally P=95%, and t=1.96);
square average deviation of the characteristic's distribution, which is
the base for the sample's elaboration (σ2 the dispersion or variance V);
P: the percentage in which the studied population posses the
sampling characteristics;
e: the allowed representativity error.
Statistics for Marketing and Business Administration

A special attention must be given to the way of using a faster method


of determining the sample size, which starts with the total collectivity size
(N) without taking into consideration the characteristic of the population,
the Taro Jamane expression:

N = N / (1+N.e2)

Also this time, some simple computation indicates, that the size of
the obtained sample does not reflect the variations of the total collectivity
size. Certain levels are constituted, over which n (the sample size) will not
rise, no matter the rise of N. For example, for e=5%, the level is 399.
The computation given as example confirms, on one hand, the
affirmation according to which the sample size does not depend entirely on
the total collectivity size given the condition in which the representatvity
error remains constant, the variations of the total collectivity size cannot be
reflected in the sample size), and on the other hand, imposes a certain
wariness in using the "simplified" method for determining the sample size.
The simulated measures of the sample computed with the Taro
Jamane expression for certain values of N and e.
The sample size depends on various controllable and uncontrollable
factors for the researcher: the accuracy level with which it is wished to
estimate the characteristics of the reference population, the size of the
sampling errors, the law of large numbers, and last but not least, the
available budget, the available period of time and the available personnel
resources.
Statistics for Marketing an Business Administration

Computation choices for the ample size


Table 3.1

The total The sample size for various allowed limit errors
collectivity size e = 5% e = 3% e = 1%
(N)

500 222 345 476


1000 285 526 909
5000 370 909 3333
10000 384 1000 5000
100000 398 1099 9090
1000000 399 1109 9900
10000000 399 1110 9990

If the dispersion of the sample or of the reference population is not


known, the most unfavorable case may be considered, by taking into
consideration the maximum dispersion. Its computation supposes the
establishment of the maximum size of the dispersion for quantitative
characteristics.

( xmin − x ) 2 + ( xmax − x ) 2
σ 2
max =
2

and

σ 2m ax = f ( 1 − f ) = 0 .5 ( 1 − 0 .5 ) = 0 .25

The determination of the value is 0.25- corresponding to the


maximum frequency f, to the alternative characteristic.
In practical activity we often operate with reduced size samples
(for which the Student repartition law is used for errors estimating) and the
normal size samples (for which Laplace repartition law is used to estimate
errors), depending on the homogeneity level of the collectivity. According
Statistics for Marketing and Business Administration

to the law of large numbers, the more the sample size is increasing (not the
selection fraction), the more the accuracy of the results is higher. The
sample size is decided also according to the results, which will be finalized,
keeping in mind the necessity of the accuracy not only over the entire
sample, but also over subgroups.

S-ar putea să vă placă și