Sunteți pe pagina 1din 24

3

3.1 Eantionare aleatoare



Eantionul este un segment al populaiei studiate, ales s o reprezinte
n ansamblu. Reprezentativitatea acestuia asigur corectitudinea estimrilor
efectuate baza calculului indicatorilor de sondaj i a inferenei statistice
realizate.
Atunci cnd alege eantionul cercettorul trebuie s rspund la mai
multe categorii de ntrebri:
i) CINE urmeaz s fie studiat (care este unitatea de sondaj?);
ii) CTE uniti va cuprinde eantionul (volumul eantionului
desigur influeneaz sigurana rezultatelor, dar, dac este bine
ales, i un eantion de sub 1% din populaia total poate furniza
rezultate cu o probabilitate ridicat);
iii) care sunt CRITERIILE de alegere a unitilor n eantion (care
este procedeul de eantionare folosit?).
Folosind eantionarea aleatoare, probabilistic, fiecare unitate
component a populaiei studiate are o anumit probabilitate, pentru a fi
inclus n eantion, putndu-se astfel estima eroarea de eantionare. Atunci
cnd procedeele aleatoare sunt prea costisitoare sau dureaz prea mult,
Procedee de eantionare aplicate
n cercetarea pieei i administrarea
eficient a afacerilor
Statistic pentru studii de marketing i administrarea afacerilor
studiile de pia apeleaz i la eantionare neprobabilistic sau mixt, caz n
care nu pot fi estimate erorile de eantionare.
Pentru a respecta caracterul aleator al formrii eantionului,
procedeul de eantionare nu trebuie s fie influenat de analist. Un eantion
este aleator dac toate unitile extrase din colectivitatea general au avut
aceeai ans (probabilitate egal i diferit de zero) de a participa la
eantion. Rezultatele unui astfel de sondaj pot fi interpretate probabilistic.
Eantionarea aleatoare se realizeaz dup planuri de sondaje simple
(pentru sondaje n populaii omogene, dar putndu-se aplica i pentru
populaii neomogene), dup planuri de sondaj n mai multe etape
(stratificarea, sondajul multistadial, multifazic, de serii, secvenial). Aceast
metod de eantionare este indicat a se folosi n cazul n care unitile din
populaie sunt de dimensiuni mici i nu exist diferene semnificative ntre
mrimea unitilor populaiei.
n practica de pia economic aceast condiie este rar ndeplinit n
totalitate,. De aceea, se recomand aplicarea de metode de eantionare cu
probabiliti inegale, n ipoteza c unitile au anse diferite de a face parte
din eantion. Pentru aplicarea acestei metode este necesar cunoaterea unor
date auxiliare despre populaie. n unele cazuri, eantionarea cu probabiliti
inegale poate fi mai avantajoas dect cea cu probabiliti egale.
De exemplu, dac estimm numrul angajailor dintr-o regiune, cu
scopul de a planifica cifra de colarizare la o firm de instruire, vom folosi
datele dintr-un eantion de judee, extrase aleator, pentru care se cunoate
populaia fiecarui jude (n urma ultimului recensmnt).
Dac notm cu X
i
numrul firmelor din judeul i cuprins n eantion,
cu N numrul judeelor rii i cu n numrul judeelor cuprinse n eantion,
sum(X
i
) estimeaz numrul firmelor la nivel naional. Judeele, indiferent de
mrimea lor, au avut anse egale de a participa la eantion. Dar numrul
firmelor depinde n mod evident de populaia judeului i deci estimatorul
poate fi afectat de o eroare semnificativ.
Statistic pentru studii de marketing i administrarea afacerilor
Pornind de la ipoteza existenei unei legturi directe, pozitive ntre
populaia unui jude i numrul de firme comerciale, se poate acorda
judeelor mai mari o ans mai mare de a face parte din eantion.
Probabilitatea ce i se va atribui fiecrui jude va fi proporional cu
populaia sa. Procedeul de extracie va fi nerepetat. Estimatorul devine:
(P/n)
.
sum(X
i
/pi), unde P este populaia ntregii ri i p
i
populaia judeului i
din eantion.
Din procedee de extracie cu probabiliti egale amintim procedee
absolut aleatoare, procedeul loteriei i al tabelului cu numere ntmpltoare
i procedeul mecanic sau de eantionare sistematic.



3.2 Eantionare dirijat i mixt

Eantionarea dirijat apare n cadrul sondajului efectuat de un expert
sau un observator - bun cunosctor al caracteristicilor populaiei din care se
va extrage eantionul, care va include n eantion, n mod contient, unitile
alese dup prerea sa subiectiv. Acest procedeu de eantionare este mult
mai ieftin dect cele probabilistice i se poate aplica dac eantioanele sunt
att de mici, nct inferenele efectuate pe baza lor nu ar reprezenta dect o
simpl ipotez ce nu ar putea fi testat, indiferent de metoda de prelevare
utilizat.
Datele disponibile pot prezenta un grad ridicat de nesiguran, ceea
ce va face ca opinia unui expert s duc la obinerea de rezultate mai bune.
Selecia dirijat nu permite stabilirea gradului de precizie a unei estimaii
fcute pe baza ei, precizia depinznd direct de numeroase circumstane. n
practic se aplic aceasta metod de eantionare datorit imposibilitii
respectrii condiiilor de efectuare a unei eantionri aleatoare (baza de
sondaj complet i fr omisiuni, cunoaterea unor informaii suplimentare
despre unitile cuprinse n eantion).
Statistic pentru studii de marketing i administrarea afacerilor
Cea mai utilizat metod de eantionare dirijat n cercetrile de
pia i anchetele de pia este cea pe cote. n acest caz se cunoate structura
populaiei studiate dup sex, vrst, categorie socio-profesional, din studii
demografice anterioare. n cadrul fiecrei grupe se cuprinde un numr de
persoane alese de ctre operator. Acestuia i se comunic doar caracteristicile
persoanelor ce trebuie intervievate, numrul lor pe fiecare grup n parte i
structura populaiei studiate. Se presupune c eantionul este reprezentativ
dac el red structura populaiei generale studiate.
Metoda se bazeaz pe o alegere raional a unitilor din eantion.
Prin modul de constituire a eantionului apare ca o metod mixt,
combinnd metodele probabilistice cu cele nealeatoare de eantionare.
Asimilarea cu metodele probabilistice se face n msura n care
putem defini ca probabiliti frecvenele relative, definite n cadrul
populaiei. Putem face aceast echivalen dac volumul populaiei de
referin este suficient de mare pentru a da posibilitatea aplicrii legii
numerelor mari.
De aceea, se poate afirma c sondajul pe cote apare ca un sondaj
stratificat, selecia n cadrul grupelor fiind contiena nu este aleatoare.
Caracterul voluntar al metodei constituie principalul su dezavantaj,
operatorul putnd influena n mod voit sau nu rezultatele sondajului.
Asemnarea dintre eantionarea stratificat aleatoare i cea pe cote const n
stratificarea iniial a populaiei de referin pe straturi omogene.
Diferena dintre stratificarea aleatoare i eantionarea pe cote const
n procedeul de selecie al unitilor din fiecare strat, selecia n cazul
eantionarii pe cote fiind lsat pe seama operatorilor.
Deci metoda se bazeaz pe definirea caracteristicilor de structurare a
populaiei de referin. Astfel, pentru fiecare caracteristic, structura
eantionului trebuie s fie identic cu cea a populaiei din care este prelevat.
Se definesc variabilele de control ca ansamblul caracteristicilor reinute
pentru a asigura identitatea ntre eantion i populaia de referin. Stabilirea
Statistic pentru studii de marketing i administrarea afacerilor
variabilelor de control are n vedere obiectivul studiului i tipul populaiei
de referin.
Pentru alegerea criteriilor de cot, de structurare este recomandabil
s se in seama de urmtoarele ndrumri: definirea variabilelor pe baza
ntrebrilor cuprinse n eantion, folosirea ca variabile de control doar a
acelora pentru care se poate defini o distribuie statistic pentru populaia de
referin, limitarea numrului de criterii de cot ce trebuie s fie
independente, fr s cuprind conotaii psihologice i formate din uniti
statistice cu un grad ct mai mare de omogenitate. Dac se respect aceste
condiii se poate obine un eantion sensibil apropiat de un eantion extras
pe baza procedeelor aleatoare.
Un eantion obinut prin procedeul cotelor, reprezentativ la nivel
naional, format din consumatori, trebuie structurat dup criteriile: mediul
de provenien, marimea oraului, sex, venit etc.
ntr-un alt exemplu, ntr-un sondaj statistic organizat la nivelul
Municipiului Bucureti, cu scopul identificrii preferinelor cursanilor unui
curs de informatic, pentru calculatoare personale i produse program,
organizat n scopul identificrii segmentelor int pe diferite tipuri i
categorii de cursani, pot fi alese ca variabile de control categoria
socio-profesional, vrsta, gradul de educaie, structura populaiei aceste
variabile de segmentare fiind publicate n urma ultimului recensmnt.
De asemenea, n cadrul unui sondaj efectuat cu scopul identificrii
oportunitilor pe piaa serviciilor de consultan n resurse umane am ales
drept variabile de control pentru o populaie format din ageni economici
din Bucureti: forma dominant de proprietate i proveniena capitalului,
date preluate de la INS.
Aceast metod este de departe cea mai utilizat n studiile de pia,
deoarece necesit un buget redus de cheltuieli, fiind mai puin costisitoare
dect orice metod de eantionare aleatoare, proiectarea nu este laborioas,
rezultatele se obin operativ, ntr-un timp scurt i, de fapt, este singura
metod posibil dac nu exist baz de sondaj.
Statistic pentru studii de marketing i administrarea afacerilor
O alt metod de formare dirijat a eantionului este metoda
voluntariatului, extrem de utilizat n trecut n cercetrile medicale i
psihologice. A nceput s fie din ce n ce mai des folosit n studiile de
marketing. Includerea n eantion se realizeaz pe baza opiunii voluntare a
persoanelor de a participa la eantion.
Anchetele desfurate pe baza metodei voluntariatului se aplic
studiului opiniilor asculttorilor radioului, cititorilor ziarelor, navigatorilor
pe internet. Metoda const n publicarea chestionarului n pres ori afiarea
sa ntr-o pagin de Web, nsoit de rugmintea de a rspunde. Dei aceste
anchete furnizeaz un volum mare de date, se pune problema posibilitii
extrapolrii rezultatelor, imposibil de realizat datorit necunoaterii
reprezentativitii eantionului celor ce au rspuns.
O a treia metod de eantionare dirijat este metoda de eantionare
bazat pe accesibilitate, cercettorul alegnd acei membrii ai populaiei de
la care se pot obine cel mai uor informaiile.
Metoda itinerariilor este, de asemenea, o metod de eantionare
dirijat care se poate aplica n regiunile cu densitatea populaiei mare.
Aceast metod poate fi combinat cu metod de eantionare pe cote, ceea
ce presupune c operatorul trebuie s formeze grupele urmnd un itinerar
prestabilit. n cazul unui refuz, operatorul va trece la urmtorul punct
prestabilit de pe traseu.
Principiul de baz al metodei unitilor tipice const n faptul c
diferite caracteristici ale unitilor statistice sunt corelate, ceea ce permite
gruparea populaiei n subansambluri omogene, iar variabila de control
reprezint aceste subansambluri prin media sa, denumit unitate tip.
Dei metodele prezentate mai sus nu respect principiile eantionrii
aleatoare, sunt folosite destul de des n sondajele de pia, fiind efectuate de
specialiti n domeniul marketing-ului, ce contribuie prin cunotinele lor i
experiena acumulat la atenuarea dezavantajelor acestor metode de
eantionare.
Statistic pentru studii de marketing i administrarea afacerilor
n practic, se pot combina metodele de eantionare aleatoare cu cele
dirijate, obinndu-se o combinaie de avantaje i atenuarea dezavantajelor
fiecreia. Un exemplu l constituie selecia stratificat, n care se mparte
ntreaga populaie n straturi (grupe) dup criterii de stratificare
corespunztoare scopului sondajului i se alege din fiecare strat cte un
subeantion folosind procedeul aleator de selecie.
Eantionarea stratificat se recomand a se utiliza n studiul
fenomenelor economico-sociale de mas i, n mod special, n studierea
fenomenelor de pia, caracterizate printr-un grad mare de eterogenitate.
Pentru a crete gradul de omogenitate, populaia de referin se mparte mai
nti pe grupe omogene. Aplicnd n continuare selecia aleatoare n fiecare
grup, subeantionul obinut va fi omogen. Erorile de sondaj rezultate vor fi
mai mici dect n cazul extragerii eantionului din populaia total,
nemprit pe clase omogene.



3.3 Determinarea mrimii eantionului

Determinarea volumului eantionului este pasul esenial ce trebuie
parcurs nainte de culegerea datelor. Volumul eantionului este desemnat
prin numrul unitilor statistice simple sau complexe ce vor fi prelevate din
populaia de referin, de la care se vor nregistra datele de intrare pentru
analiz.
Deci, analistul trebuie s decid, n funcie de mai muli factori, care
este numrul optim de uniti statistice ce trebuie cuprinse n sondaj pentru
ca eantionul s fie reprezentativ i rezultatele sale s se poat extinde
asupra populaiei de referin cu respectarea principiilor inferenei statistice.
n consecin, se pune problema determinrii dimensiunii optime a
eantionului care s asigure ndeplinirea obiectivelor sondajului. Eantionul
ideal trebuie s fie n concordan cu eantionul practic, ce poate fi construit
astfel nct s se poat atinge obiectivele studiului.
Statistic pentru studii de marketing i administrarea afacerilor
Un alt element care trebuie foarte clar precizat i utilizat este
reprezentat de modalitatea de determinare a volumului eantionului. Contrar
simului comun, nu este important ponderea eantionului n colectivitatea
total (care intr doar ca element de corecie), ct mrimea absolut a lui.
Fixarea aprioric a proporiei de sondaj, raportul dintre volumul
eantionului i volumul populaiei totale, poate conduce fie la
supra-dimensionare, fie la subdimensionare.
O raie de sondaj de zeci de procente se dovedete nesemnificativ n
condiiile unui volum relativ redus al colectivitii totale, dup cum o
pondere chiar mai mic de 1% este suficient la colectiviti mari i foarte
mari.
Volumul optim de eantionare depinde de obinerea volumului
minim care s asigure o reprezentativitate adecvat a eantionului, ce este
dat de factori de influen situai n afara mrimii colectivitii totale i care
se refer la structura colectivitii.
Expresiile de definiie a mrimii eantionului sunt:

n = t
2.

2
/ e
2
pentru caracteristici continue (3.1)
i
n = t
2.
P
.
(100 - P) / e
2
pentru caracteristici alternative (3.2)

unde,
t: valoarea teoretic corespunztoare probabilitii cu care se
lucreaz (de regul, P = 95%, iar t = 1,96);
: abaterea medie ptratic a distribuiei caracteristicii care st la
baza elaborrii eantionului (
2
= dispersia sau variana V);
P: procentul n care populaia cercetat posed caracteristica de
eantionare;
e: eroarea limit de reprezentativitate admis.

Statistic pentru studii de marketing i administrarea afacerilor
Datorit faptului c nu se studiaz ntreaga colectivitate, estimarea
valorilor obinute (medii, procente) la nivelul eantionului pentru ntreaga
colectivitate se face cu o anumit eroare. Valoarea real se afl cuprins n
limitele determinate de mrimea obinut la nivelul eantionului e.
n determinarea volumului eantionului se accept aprioric o anumit
eroare cuprins ntre 1% (foarte rar practicat, dealtfel, deoarece necesit
eantioane foarte mari) i 5% (prag de eroare aproape general acceptat de
ctre experii n marketing).
n continuare, algoritmul de lucru este simplu. La o anumit
valoare a lui sau P i o valoare impus a lui e rezult n mod automat o
anumit valoare a lui n. Dificultatea cea mai mare const ns tocmai n
obinerea informaiilor referitoare la distribuia caracteristicilor de
eantionare, respectiv valorile sau P. La valorile = 0,5 m sau P = 50% i
e = 1% rezult un eantion de 9600 persoane necesar pentru a fi studiat, ori,
de multe ori, colectivitatea total este mic.
Volumul cerut pentru eantion scade vertiginos, dac ne reducem
dorina de rigurozitate i acceptm valori mai mari ale lui e, ceea ce se i
face de regul. Pentru un nivel al erorii e = 2%, 3%, 4% sau 5% (meninnd
constant sau P) volumul eantionului se reduce i el la: 2400, 1060, 600 i,
respectiv, 384 persoane. Dac se modific valorile sau P vor rezulta
mrimi diferite pentru n.
n evaluarea gradului de reprezentativitate a cercetrilor intervin i
alte elemente, care se refer la aplicarea corect a tuturor cerinelor de
ntocmire a eantionului, a coreciilor cerute de schema de eantionare, de
dispersia spaial a populaiei, de selectarea subiecilor i de cercetarea
efectiv a acestora.
Putem preciza o serie de principii ce trebuie respectate pentru
evaluare: aplicarea eantionrii la colectivitile de populaie reclam
asigurarea unui numr minim de persoane (n) care s permit un grad
acceptabil de reprezentativitate; mrimea colectivitii totale intervine doar
ca element de corecie, factorul de corecie fiind (N n)/(N 1), cu care se
Statistic pentru studii de marketing i administrarea afacerilor
micoreaz valoarea n a volumului eantionului, deja obinut. Valoarea
raportului se apropie de unu n cazul n care N este un numr mare.
Atunci cnd studiem colectiviti relativ mici (sub 500 persoane) nu
se pot determina eantioane reprezentative dup regulile numerelor mari i
ar trebui s se ia n considerare cerinele suplimentare ale eantioanelor
mici. Cnd suntem n imposibilitatea de a construi eantioane reprezentative
este preferabil s studiem loturi omogene sau neomogene de populaie, dar
care nu ne permit s generalizm rezultatele la ansamblul colectivitii, de
unde rezult implicit avantajele cercetrii selective, riguros realizate.
O atenie cu totul deosebit trebuie acordat modului n care se face
uz de o metod mai rapid de determinare a mrimii eantionului, care
pleac de la volumul colectivitii totale (N) fr a mai lua n considerare
caracteristicile populaiei, expresia Taro Jamane:

N = N / (1+N
.
e
2
) (3.3)

Efectuarea unor calcule simple ne indic i de aceast dat c, de
fapt, volumul eantionului obinut nu reflect variaiile mrimii colectivitii
totale. Se constituie anumite praguri peste care n (volumul eantionului) nu
mai crete orict de mult ar crete N.
Aa, de exemplu, la e = 5% pragul respectiv este 399. La valori mai
mici ale erorii limit admise pragul eantionului se fixeaz, evident, la valori
mai mari, dar ntotdeauna n jurul valorii indicate de expresia de definiie a
mrimii eantionului n care P = 50% (cnd furnizeaz cea mai mare mrime
a eantionului), iar t = 1,96 corespunde unei probabiliti de 95%.
Dup cum se observ, metoda Jamane poate conduce la eantioane
subdimensionate (cnd se dorete o siguran mai mare, deci o probabilitate
de peste 95%, sau cnd populaia este eterogen n raport cu caracteristicile
de baz) i la eantioane supradimensionate (n cazul n care populaia este
relativ omogen). i de aceast dat dorina de a lucra cu erori mici de
reprezentativitate conduce la eantioane foarte mari (tabelul 3.1).
Statistic pentru studii de marketing i administrarea afacerilor
Calculul expus ndreptete, pe de o parte, afirmaia potrivit creia
mrimea eantionului nu depinde n mod absolut de mrimea colectivitii
totale (n condiiile n care eroarea de reprezentativitate rmne constant,
variaiile mrimii colectivitii totale nu pot fi reflectate n mrimea
eantionului), iar, pe de alt parte, impune o anumit circumspecie n
utilizarea metodei simplificate pentru determinarea volumului
eantionului.

Mrimile simulate ale eantionului calculat prin expresia
Taro Jamane pentru anumite valori ale lui N i e
Tabel 3.1
Mrimea eantionului pentru diverse erori limit admise Mrimea
colectivitii
totale (N)
e = 5% e = 3% e = 1%
500
1000
5000
10000
100000
1000000
10000000
222
285
370
384
398
399
399
345
526
909
1000
1099
1109
1110
476
909
3333
5000
9090
9900
9990

Stabilirea volumului eantionului se face pe baz unui compromis
ntre opiunea pentru eantioane de volum mare, care s asigure un grad
mare de reprezentativitate i un grad mare de ncredere pentru parametrii
estimai ai populaiei de referin, i optiunea pentru eantioane de volum
mic, ce implic costuri reduse. Dimensiunea minim a eantionului trebuie
s asigure o reprezentativitate acceptabil n procesul inferenei statistice,
care s nu duc la distorsiuni.
Mrimea eantionului depinde de numeroi factori controlabili i
necontrolabili pentru cercettor: gradul de exactitate cu care se dorete s se
estimeze caracteristicile populaiei de referin, mrimea erorilor de sondaj,
legea numerelor mari i, nu n ultimul rnd, bugetul disponibil, perioada de
timp avut la dispoziie i resursele de personal de care dispune.
Statistic pentru studii de marketing i administrarea afacerilor
Gradul preciziei cerute de beneficiarul rezultatelor este principalul
factor ce determin marimea eantionului. ncrederea ce poate fi atribuit
informaiilor obinute pe baza unui eantion depinde direct de mrimea
eantionului, i nu de fracia de selecie.
n stabilirea dimensiunii eantionului, dac se stabilete aprioric un
prag de semnificatie , se impune ca abaterile dintre media populaiei de
referin, dac se cunosc, i mediile eantioanelor ce se pot genera s
respecte inegalitatea.
Gradul de variabilitate al oricrei populaii este un alt factor de
influen ce poate fi sau nu cunoscut. Dac variabilitatea este cunoscut din
cercetri anterioare sau dintr-o cercetare organizat n mod special, volumul
eantionului rezult imediat din calcule. Dac dispersia eantionului sau a
populaiei de referin nu este cunoscut n cazul cel mai nefavorabil), se ia
n calcul dispersia maxim. Calculul ei presupune stabilirea mrimii maxime
a dispersiei pentru caracteristici cantitative:

2
) x x ( ) x x (
2
max
2
min 2
max
+
= i
25 , 0 ) 5 , 0 1 ( 5 , 0 ) f 1 ( f
2
max
= = =
(3.4)

i determinarea valorii de 0,25 corespunztoare frecvenei maxime f, a
caracteristicii alternative.
n practic se opereaz cu eantioane de volum redus (pentru care se
folosete la estimarea erorilor legea repartiie Student) i eantioane de
volum normal (pentru care se folosete legea de repartiie Laplace), n
funcie de gradul de omogenitate al colectivitii. Evident, conform legii
numerelor mari cu ct crete volumul eantionului (nu fracia de selecie), cu
att precizia rezultatelor este mai mare. Mrimea eantionului se decide i n
funcie de rezultatele ce vor fi analizate, inndu-se seama de necesitatea
obinerii preciziei nu doar pe total eantion, ci i pe subgrupe.
Un alt factor de influen este faptul c sondajul, n general,
urmrete rezultatele privitoare la mai multe caracteristici. Un eantion
Statistic pentru studii de marketing i administrarea afacerilor
suficient de mare pentru estimarea intervalului de ncredere pentru o
caracteristic poate s fie insuficient pentru o alt caracteristic.
Problemele se complic n cazul sondajelor stratificate, caz n care
trebuie estimat mrimea eantionului pe fiecare strat i apoi, prin nsumare,
va rezulta eantionul pe total populaie. n cazul sondajului multistadial
trebuie facut o estimare a variantelor n interiorul i ntre unitile din
primul stadiu. Toate aceste dificulti de natur tehnic pot fi evitate printr-o
documentare prealabil corespunztoare.
Mrimea eantionului va mai fi decis i n funcie de restriciile de
resurse i bugetul disponibil, de cerinele beneficiarului i de posibilitatea
previzionrii dispersiei variabilelor nregistrate.



3.4 Probleme privind prognoza volumului de eantionare.
Dispersii marginale

Fenomenele din domeniul studiului pieei sunt, n general, fenomene
dinamice, ceea ce determin valori diferite n timp ale variabilelor ce le
caracterizeaz. Sondajul prezint o situaie static, de aceea se recomand
organizarea de sondaje periodice cu acelai set de variabile nregistrate.
Msurnd valorile unor variabile ce caracterizeaz un fenomen n
momente diferite de timp putem determina variaii statistice nu doar ntre
valorile individuale nregistrate, ci i ntre valorile medii calculate la
momente de timp diferite, pastrndu-se sau nu aceeai amplitudine a
variaiei.
Pentru proiectarea volumului unui nou eantion n sondaje periodice
este necesar conoaterea tendinei de evoluie a dispersiei i posibilitatea
previzionrii dispersiei i abaterii standard. De aici apare ca necesar
elaborarea de serii de timp de dispersii i de modificri absolute i/sau
relative ale acesteia, ca de exemplu, serii cronologice de indici ai dispersiei
Statistic pentru studii de marketing i administrarea afacerilor
sau de sporuri ale dispersiei unei variabile nregistrate n sondaje efectuate
la momente de timp diferite.
Posibilitatea previzionrii dispersiei cu ajutorul indicatorilor
marginali ar aduga o nou restricie n estimarea volumului noului
eantion, alturi de restriciile de costuri.
Cea mai frecvent metod de sondaj utilizat n studiile sociale i
economice este sondajul stratificat. De aceea, aceast form de sondaj poate
fi utilizat i pentru studiul fenomenelor n dinamic, pe baza datelor
nregistrate n sondaje realizate n perioade diferite, n vederea elaborrii de
serii cronologice care s permit, prin aplicarea de tehnici complexe de
sondaj, efectuarea de prognoze optime.
n scopul previzionrii gradului de variaie, a dispersiei i a abaterii
tip, n urma realizrii de sondaje periodice se pot construi serii cronologice
cu periodicitate constant sau variabil, de niveluri atinse de indicatori
micro sau macroeconomici, de medii i msuri ale variaiei atinse de valorile
individuale ale distribuiei marginale i chiar de indicatori marginali care
exprim modificarea mediilor i a dispersiilor.
Cunoatem c rezultatele unui sondaj stratificat conduc la verificarea
regulei de adunare a dispersiilor, conform creia dispersia total nregistrat
de variaia valorilor individuale ale distribuiei marginale este suma
dispersiilor pariale, deci:


total y x
2 2 2
= +
/
, (3.5)

unde,

total
2
= dispersia total, determinat de toi factorii de influen ai
variaiei unei variabile;

2
= media dispersiilor nregistrat n interiorul straturilor,
determinat de factorii nenregistrai;
Statistic pentru studii de marketing i administrarea afacerilor

y x /
2
= dispersia dintre straturi, determinat de factorul de formare a
straturilor, ce arat n ce msur discrimineaz sau nu criteriul de stratificare
variabila studiat.
Dac simplificm fiecare termen al ecuaiei de mai sus cu dispersia
total, calculnd deci structura dispersiei totale, obinem raportul de
determinaie i raportul de nedeterminaie, dup formula:

1
2
2
2
2
= +

total
y x
total
/
, (3.6)

unde,
2
2
total

= raport de nondeterminaie ce exprim procentual partea din


variaia total datorat factorilor aleatori nenregistrai;
2
2
/
total
x y

= raport de determinaie ce exprim procentual partea din


variaia total a variabilei dependente explicat de factorul de grupare, de
discrimare, de variabila independent.
Dac nregistrm dou niveluri ale dispersiei pentru dou sondaje
succesive se poate calcula modificarea absolut a dispersiei totale ce se va
distribui ntre modificarea absolut a dispersiei dintre straturi i a mediei
dispersiilor din interiorul straturilor, astfel:


total y x
2 2 2
= +
/
(3.7)

Acest spor al dispersiei totale poate fi pozitiv sau negativ i se poate
distribui egal sau diferit pe cele dou componente. Pentru a msura modul
de distribuie i a determina contribuia factorului de stratificare la variaia
Statistic pentru studii de marketing i administrarea afacerilor
dispersiei totale, calculm structura ecuaiei modificrilor absolute ale
dispersiilor mpind ecuaia modificrilor absolute, cu modificarea absolut
a dispersiei totale, astfel:

1
2
2
2
2
= +

total
y x
total
/
, (3.8)

n ecuaia de mai sus se propune c indicatorii marginali obinui s
se noteze, numeasc i intrepreteze, astfel:

a.
2
mg =

2
2
total
= dispersie medie marginal, ce arat cu ct se
va modifica media dispersiilor din interiorul straturilor dac dispersia
total sufer o modificare cu o unitate sau cu ct trebuie s se modifice
media dispersiilor din interiorul straturilor pentru a obine o modificare cu
o unitate a dispersiei totale; poate lua valori ntre 1 i 1.

b.
y xmg /
2
=

y x
total
/
2
2
= dispersie marginal dintre straturi, ce arat cu
ct se va modifica nivelul dispersiei dintre straturi la o modificare unitar a
dispersiei totale sau cu ct trebuie modificat dispersia dintre straturi
pentru a obine o modificare unitar a dispersiei totale; poate lua valori
ntre -1 i 1.

Exist posibilitatea identificrii unei funcii matematice de trend pe
termen lung, att a dispersiilor marginale, ct i a raportului acestora cu
evoluia n domeniu; fapt ce va trebui aprofundat. ntre cele trei tipuri de
dispersii exist o relaie direct sau invers, deci creterea dispersiei totale
va determina creteri/descreteri n proporii egale sau diferite ale
dispersiilor pariale, i invers.
Statistic pentru studii de marketing i administrarea afacerilor
Desigur dispersiile de eantion sunt corectate cu numrul gradelor de
libertate corespunztoare, dar pentru simplificarea modului de scriere a
formulelor nu am mai introdus i aceste notaii.
Dispersia total se corecteaz cu n - 1 grade de libertate, dispersia
dintre starturi se corecteaz cu numrul de straturi -1, deci r - 1, iar media
disersiilor din interiorul starturilor cu volumul eantionului numrul de
straturi, deci n - r.
Construind serii cronologice de dispersii marginale ce vor fi supuse
analizei statistice de previziune putem estima, cu o anumit probabilitate,
nivelul mediei dispersiei din interiorul straturilor i al dispersiei totale,
niveluri necesare programrii unui nou volum de eantionare. Dac seriile
construite sunt nestaionare vor trebui difereniate pentru a se transforma n
evoluii staionare.
n final, trebuie precizat c modificrile absolute ale dispersiilor
corectate pot fi calculate cu baz mobil sau cu baz fix. Sporurile cu baz
fix apar n cazul n care am realizat ntr-o cercetare anterioar o prob
martor sau un eantion programat n care se ajunge la o distribuie martor ce
coincide cu structura distribuiei totale i a crei reprezentativitate este
validat statistic.
Necesitatea utilizrii indicatorilor marginali ai variaiei valorilor
individuale ale unei variabile cantitative de sondaj este legat, mai ales, de
calculele de prognoz care sunt necesare pentru determinarea volumului
unui nou eantion.
Metoda se poate aplica nspecial n situaia sondajului stratificat, caz
n care, pentru estimarea intervalului de ncredere, se folosete media
dispersiilor din interiorul straturilor i necesit, pentru o mai bun
fundamentare teoretic, testarea riguroas n activitatea practic.
Statistics for Marketing and Business Administration
3.5 Summary. Sampling methods applied in Marketing
and Business Administration studies


Random Sampling

The sample is a segment of the statistical population chosen to
represent it as a whole. Its representativity ensures the accuracy of the
estimation made on the basis of calculating the research indicators and the
inferential statistics.
When it chooses the sample, the researcher must answer to different
categories of questions:
WHO is to be studied (which is the research unit?)?
HOW MANY units will the sample include (the sample size
influences the results' accuracy, but if it is well chosen, even
a sample of under 1 per cent of the total population may give
results with a high probability)
WHICH are the CRITERIAS for choosing the sampling units
(which is the sampling method used?)
Using random, probabilistic sampling, each unit of the population
has a certain probability to be included in the sample, making possible the
estimation of sampling error. In case the random methods are too expensive
or take too long, the market studies use non-probabilistic or mix sampling.
In this case the sampling errors cannot be estimated.
The random sample is made up of simple research plans
(for researches of homogenous population and also applicable for
non-homogenous population) or of multi-stage research plans
(ranking, multi-stage research, multi-phase research, serial research,
sequential research).
The sampling method is indicated to be used in the case where the
units of population are of small size and there are no significant differences
between the sizes of the units' population. For example, if we estimate the
Statistics for Marketing an Business Administration
number of employees in an area, with the purpose of planning the training
figure at a training firm, we will use data from districts' samples, randomly
chosen, for which the population of each district is known (as a result of the
last census).
If we denote by X
i
the number of firms from district comprised in
the sample, by N the number of the country's districts and by n the number
of the districts comprised in the sample, sum(X
i
) is estimating the number of
firms at national level. The districts, no matter their size, had equal chances
to be a part of the sample. But, the number of firms depends obviously on
the district's population. Thus, the estimator can be afected by a significant
error.
Starting from the hypothesis of the existence of a direct, positive
relation between the population of a district and the number of the
commercial firms, larger districts can be granted a higher chance to be part
of the sample. The probability which is assigned to which district will be
well-balanced with its population. The method of extraction will not be
repeated. The estimator becomes: (P/n)
.
sum(X
i
/pi), where P is the
population of the whole country, p
i
is

the population of district from the
sample.


Conducted and mix sampling

Conducted sampling appears in the research achieved by an expert or
an observer who is a good expert of the population's characteristics, from
which the sample will be chosen, and who will consciously include in the
sample units chosen in a subjective way. This sampling procedure is much
cheaper than the probabilistic ones and can be applied if the samples are so
small that the inferences made with the their help would represent only a
simple hypothesis that could not be tested, despite the processing method
used.
Statistics for Marketing and Business Administration
The most used method of conducted sample in the market research
and market inquire is the quotas sampling. In this case the structure of the
population is known according to sex, age, socio-vocational category, due to
some previous demographic studies. In every group it is included a number
of persons chosen by the operator. The operator is told only the
characteristics of the persons that must be interviewed, their number for
every group and the structure of the studied population. It is presumed that
the sampling is representative if it gives the structure of the total studied
population.
Another method of forming the conducted sampling is the volunteers
method, which was often used in the past in medical and psychological
researches. It started to be used more and more in the marketing research.
The enclosure in the sample is made based on the voluntary option of the
person to participate in the sample.
The itinerary method is also a conducted sample, which can be
applied in areas with a high density of population. This type may be
combined with the sampling method based on quota, which supposes that
the operator must form the groups following a pre-established itinerary. In
case of refusal, the operator will pass to the next pre-established point of the
itinerary.
The basic principle of the typical units method consists in the fact
that different characteristics of the statistical units are correlated, which
allows grouping the population in homogenous subtypes, and the control
variable represents these subtypes through its average, called type unit.
Although the methods presented above do not respect the principle
of random sampling, they are often used in the market research, being
achieved by specialists in marketing, who contribute with their knowledge
and with their accumulated experience to decrease the disadvantages of
these sampling methods.


Statistics for Marketing an Business Administration
Determining the size of the sample

Determining the size of the sample is the essential step that must be
taken before gathering the data. The size of the sample is designated by the
number of simple and complex number of units, which will be obtained
from the reference population, from which the entering data will be recorded
for the analysis.
So, the analysts must decide, according to many factors, which is the
optimal number of statistical units that must be included in the survey so
that the sample will be representative and its results will extend over the
reference population, respecting the principles of statistical inference.
The optimal size of the sample depends on obtaining the minimum
size which will ensure the representativity of the sample, size which is given
by the influencing factors situated outside the total collectivity's size, which
refer to the structure of the collectivity.
The expressions to define the sample size are:

n =t
2.

2
/ e
2
, for continous variables

and

n =t
2.
P
.
(100 - P) / e
2
, for alternative variables

where:
t: theoretical value corresponding to the probability with which it is
working (generally P=95%, and t=1.96);
square average deviation of the characteristic's distribution, which is
the base for the sample's elaboration (
2
the dispersion or variance V);
P: the percentage in which the studied population posses the
sampling characteristics;
e: the allowed representativity error.
Statistics for Marketing and Business Administration
A special attention must be given to the way of using a faster method
of determining the sample size, which starts with the total collectivity size
(N) without taking into consideration the characteristic of the population,
the Taro J amane expression:

N =N / (1+N
.
e
2
)

Also this time, some simple computation indicates, that the size of
the obtained sample does not reflect the variations of the total collectivity
size. Certain levels are constituted, over which n (the sample size) will not
rise, no matter the rise of N. For example, for e=5%, the level is 399.
The computation given as example confirms, on one hand, the
affirmation according to which the sample size does not depend entirely on
the total collectivity size given the condition in which the representatvity
error remains constant, the variations of the total collectivity size cannot be
reflected in the sample size), and on the other hand, imposes a certain
wariness in using the "simplified" method for determining the sample size.
The simulated measures of the sample computed with the Taro
J amane expression for certain values of N and e.
The sample size depends on various controllable and uncontrollable
factors for the researcher: the accuracy level with which it is wished to
estimate the characteristics of the reference population, the size of the
sampling errors, the law of large numbers, and last but not least, the
available budget, the available period of time and the available personnel
resources.





Statistics for Marketing an Business Administration
Computation choices for the ample size
Table 3.1
The total
collectivity size
(N)
The sample size for various allowed limit errors
e = 5% e = 3% e = 1%

500
1000
5000
10000
100000
1000000
10000000
222 345 476
285 526 909
370 909 3333
384 1000 5000
398 1099 9090
399 1109 9900
399 1110 9990

If the dispersion of the sample or of the reference population is not
known, the most unfavorable case may be considered, by taking into
consideration the maximum dispersion. Its computation supposes the
establishment of the maximum size of the dispersion for quantitative
characteristics.

max
min max
( ) ( )
2
2 2
2
=
+ x x x x


and

max
( ) . ( . ) .
2
1 05 1 05 0 25 = = = f f


The determination of the value is 0.25- corresponding to the
maximum frequency f, to the alternative characteristic.
In practical activity we often operate with reduced size samples
(for which the Student repartition law is used for errors estimating) and the
normal size samples (for which Laplace repartition law is used to estimate
errors), depending on the homogeneity level of the collectivity. According
Statistics for Marketing and Business Administration
to the law of large numbers, the more the sample size is increasing (not the
selection fraction), the more the accuracy of the results is higher. The
sample size is decided also according to the results, which will be finalized,
keeping in mind the necessity of the accuracy not only over the entire
sample, but also over subgroups.

S-ar putea să vă placă și