Sunteți pe pagina 1din 12

4

SONDAJUL STATISTIC METOD DE

CERCETARE N GESTIUNEA AFACERILOR

4.1. Noiuni introductive


Avnd caracter complex, demersul statistic nu se limiteaz doar la aspectele descriptive
i exploratorii, implicate de sistematizarea, reprezentarea i prelucrarea sumar a datelor de
observare; el presupune deopotriv o latur inferenial, bazat pe raionamente specifice,
generalizri i decizii. Rareori cercetarea statistic se desfoar exhaustiv; de aceea, de
obicei, concluziile se fundamenteaz pe observarea sistematic a unui numr relativ restrns
de uniti statistice, iar trecerea de la particular la general se asigur i se valideaz dup criterii
matematice, cu ajutorul metodelor de tip inductiv.
Sondajul statistic este o metod de cercetare parial care are ca obiectiv extinderea
proprietilor constatate n cazul particular al unui eantion la ntreaga populaie statistic i
confirmarea sau infirmarea ipotezelor formulate nainte sau dup o faz exploratorie. Orice
inferen statistic asupra populaiei este nsoit de o marj de incertitudine specificat n
termeni probabilistici.
n cadrul sondajului statistic se opereaz cu noiuni specifice:
Populaia (colectivitatea statistic general sau originar, baza de selecie)
totalitatea unitilor statistice supuse studiului; volumul su este notat cu N;
Eantionul (colectivitatea de sondaj sau de selecie, prob, mostr) format din
unitile statistice extrase din baza de selecie pentru a fi supuse studiului selectiv;
volumul su este notat cu n;
Parametrii (indicatori generali) indicatorii sintetici ai colectivitii generale care
pot fi calculai direct n cazul unei cercetri totale sau pot fi estimai cu ajutorul
indicatorilor de sondaj n cazul unei cercetri pariale:
o media general - x0 sau ;
o

dispersia general - 02 ;

o abaterea standard general - 0 .


Estimatorii (indicatori de selecie) indicatorii sintetici ai sondajului, calculai
pentru un eantion oarecare:
o media de selecie - x s ;
o

dispersia de selecie - s2 ;

abaterea standard de selecie - s .

Succesul unei cercetri prin sondaj depinde n mare msur de alegerea unui eantion
reprezentativ; principalele condiii pentru asigurarea reprezentativitii eantionului sunt:
colectivitatea general s fie ct mai omogen;
unitile din eantion s fie extrase la ntmplare (aleatoriu); fiecare unitate s aib anse
egale de apariie n eantion;
extragerea fiecrei uniti s fie independent (necondiionat de extragerea altei uniti);
1

eantionul s fie suficient de mare pentru ca n el s se regseasc trsturile populaiei


originare.
Teoria sondajului i propune s furnizeze un cadru metodologic adecvat pentru
colectarea informaiei statistice n condiii de selectivitate, deci n condiiile unei sfere de
cuprindere restrnse i unui efort moderat, concretizate ns cu maxim eficien.
n comparaie cu o observare exhaustiv, de tipul unui recensmnt, observarea parial
implicat de sondajul statistic are evidente avantaje, legate de costul sczut al obinerii i
prelucrrii datelor, de rapiditatea i operativitatea cu care sunt furnizate rezultatele, dar i de
exactitatea i calitatea predictiv, comparabil sau chiar superioar celei obinute prin cercetarea
total. Prin restrngerea cmpului observaiilor i sporul de competen datorat recurgerii la un
personal calificat, sondajul poate asigura un control mai riguros al procesului de colectare a
informaiilor i deci o mai bun acuratee a nregistrrilor. De altfel, o anumit marj de eroare
nsoete orice studiu statistic, exhaustiv sau parial. Principalele surse de erori ale unei cercetri
statistice prin sondaj sunt:
erorile de observare (de nregistrare), datorate unor cauze foarte variate rspunsuri
absente, eronate, incomplete, greit transmise sau codificate etc. care, dei inerente
oricrei cercetri statistice, afecteaz n mai mare msur o cercetare total dect un
sondaj;
erorile de eantionare (de reprezentativitate), proprii doar cercetrilor selective i datorate
extrapolrii rezultatelor de la o parte (eantionul) la ntreg (populaia n ansamblul su).
Un sondaj condus cu profesionalism poate fi mai fiabil dect un recensmnt masiv, cu
organizare rigid, greoaie, deoarece numrul sczut al erorilor de observare poate compensa
existena erorilor de eantionare. n plus, sondajul permite calculul cu anticipaie al mrimii erorii
de reprezentativitate i a gradului de siguran cu care se pot extinde rezultatele cercetrii
selective asupra ntregii colectiviti statistice (respectnd principiile enunate anterior).
Prgtirea i executarea unui sondaj presupune o serie de lucrri complexe, organizate
ntr-un plan de sondaj, care cuprinde:
obiectivele sondajului - explicitarea scopului urmrit i modalitile de utilizare a
rezultatelor;
o definirea clar a obiectivelor ce vor fi urmrite n cadrul cercetrii prin sondaj
o identificarea i delimitarea spaio-temporal a populaiei ce va fi supus studiului
o identificarea principalelor surse de date aferente populaiei de baz, posibil de
utilizat n cercetare
o stabilirea variabilelor (caracteristicilor) ce vor fi supuse observrii i a modalitii
de observare i nregistrare a acestora
o estimarea costurilor i stabilirea bugetului cercetrii
o stabilirea necesarului de personal i alctuirea echipei ce va realiza cercetarea
baza de sondaj mulimea unitilor statistice din care se face selecia; ea trebuie s fie
exhaustiv, iar elementele s poat fi univoc identificate; n plus, este necesar ca toate
unitile s beneficieze de o ans nenul, cunoscut a priori i controlabil de a fi
incluse n eantion;
eantionul - obiectul nemijlocit al cercetrii prin sondaj, necesar generalizrilor inductive
(inferenei statistice cu privire la populaie);
procedeul (schema) de extragere a eantionului poate fi aleator (probabilist) sau
empiric (nealeator); atunci cnd selecia elementelor se face n mod aleatoriu, se recurge
la dou scheme probabiliste de baz (capitolul 3): schema bilei revenite urna lui
Bernoulli cazn care extragerile constituie evenimente independente i echiprobabile i
schema bilei nerevenite, caz n care evenimentul ce se realizeaz la o extragere depinde
de fiecare dintre evenimentele anterioare;
forma de colectare a informaiilor prin interviu, prin completarea de chestionare, prin
telefon, prin coresponden etc.;
urmrirea modului de desfurare presupune asigurarea corectitudinii procedurale prin
supervizarea ntregului proces de ctre persoane care ofer garanii de probitate
profesional i moral;

perioada de colectare aleas astfel nct s conserve ansele naturale ale unitilor de
a fi incluse n eantion (trebuie neutralizat efectul variaiilor sezoniere, al factorilor
conjuncturali etc.);
perioada de referin permite specificarea exact a momentului (sau intervalului de
timp) la care se refer nregistrrile;
informaia colectat se alege n funcie de scopul urmrit, dar odat stabilit, trebuie
riguros specificat n formularele sau chestionarele ce se completeaz.
codificarea i prelucrarea primar a datelor se identific i se elimin datele eronate;
prelucrarea propriu-zis a datelor - calculul indicatorilor sintetici la nivelul eantionului i
estimarea parametrilor la nivelul populaiei de baz; ameliorarea estimatorilor obinui prin
utilizarea de date i informaii auxiliare;
analiza i interpretarea rezultatelor.
n raport cu cercetarea total, sondajul prezint o serie de avantaje:
este mult mai rapid i eficient, costurile (umane i financiare) generate de organizarea i
desfurarea acestui tip de cercetare fiind mai reduse;
erorile de nregistrare sunt mai puin numeroase, deoarece colectivitatea studiat este
mai redus iar personalul implicat n cecetare este mai bine calificat;
programul cecetrii este mai bogat, cuprinznd mai multe caracteristici statistice ale
colectivitii;
este singura posibilitate de cecetare statistic atunci cnd:
nregistrarea i cercetarea caracteristicilor duce la distrugerea unitilor statistice
(controlul distructiv al calitii produselor);
se evalueaz rezervele subterane (crbune, petrol, minereuri);
se estimeaz recolta n agricultur.
este foarte util pentru testarea programului unei cercetri totale dar i pentru verificarea
datelor culese printr-o observare total (microrecensmnt pilot)

Domeniile n care sondajul i gsete aplicabilitate sunt numeroase i variate:


o industrie - studiul calitii produselor, n cadrul procesului de fabricaie sau la
recepia loturilor de produse finite; analiza cauzelor fluctuaiei forei de munc;
o comer - la recepia calitativ a loturilor de produse livrate de ctre furnizori;
o agricultur estimarea recoltei probabile; studiul calitii produselor;
selecionarea soiurilor deplante;
o demografie evaluarea indicatorilor morbiditii, fertilitii, calitii vieii;
o marketing prospectarea pieei; testarea opiniei cumprtorilor; analiza
raporturilor cerere-ofert; urmrirea ciclului de via al unui produs pe pia;
o medicin analiza corelaiilor dintre diverse afeciuni i factorii generatori; studiul
evoluiei diferitelor boli i al eficacitii tratamentelor; starea de sntate a
populaiei;
o politic testarea opiniei populaiei n probleme economice, sociale, politice,
militare; campanii electorale.
Datorit rolului din ce n ce mai pregnant pe care l joac sondajele n elaborarea
strategiilor decizionale la nivel micro i macro economic, n ultimii ani s-au conturat noi concepte
privind constituirea unui tezaur comun de informaii statistice, care s poat fi exploatat n
aplicaii diverse, cu procedee diferite i potrivit unor finaliti variate; aceast direcie de cecetare
a condus la constituirea unor sisteme de eantionare cu utilizri multiple.
n ara noastr a fost creat n anul 1993 un eantion multifuncional de zone teritoriale
bine delimitate n teritoriu, EMZOT, folosit ca baz de eantionare pentru alte anchete complexe;
pe baza rezultatelor Recensmntului Populaiei i Locuinelor din 2002 aceast baz de sondaj
de tip master a fost actualizat n concordan cu necesitatea realizrii cercetrilor statistice prin
sondaj conform standardelor Uniunii Europene; eantionul a fost proiectat astfel nct s asigure
informaiile necesare constituirii eantioanelor pentru cercetrile prin sondaj n gospodriile
populaiei, realizate de ctre Institutul Naional de Statistic: Ancheta integrat n gospodrii
(AIG), Ancheta asupra forei de munc n gospodrii (AMIGO), Ancheta bugetelor de familie
(ABF), Ancheta european asupra veniturilor i condiiilor de via ale gospodriilor (EU-SILC):
3

4.2. Procedee de eantionare. Tipuri de sondaje


Procedeele de eantionare se mpart n dou mari clase:
Procedeele nealeatoare (empirice) au drept caracteristic alegerea raional a
unitilor din eantion, utiliznd anumite informaii cunoscute cu privire la populaie;
arbitrariul alegerii unitilor statistice din eantion are consecine negative asupra
reprezentativitii acestuia: modific ansele naturale ale unitilor de a fi alese n
eantion; nu permite estimarea probabilitilor de realizare ale evenimentelor respective;
nu asigur anse nenule de a fi incluse n eantion fiecrei uniti; nu permite estimarea
dispersiei i a calitii estimatorilor prin care se aproximeaz parametrii populaiei. Din
aceast clas fac parte urmtoarele metode de eantionare: metoda cotelor, metoda
itinerariilor, metoda unitilor tip etc.

Procedeele aleatoare (probabiliste) sunt proiectate pentru obinerea unui


eantion reprezentativ: este asigurat, pentru fiecare unitate, o probabilitate nenul de
extragere, care este cunoscut a priori; se poate calcula efectiv eroarea de eantionare
(care este mai mic dect n cazul eantionrii nealeatoare) i se poate aprecia calitatea
estimaiilor.
folosirea tabelelor cu numere ntmpltoare atunci cnd se cunoate n
detaliu componena i structura bazei de selecie.
procedeul tragerii la sori are la baz principiul urnei lui Bernoulli i se poate
realiza n dou variante:
- cu repetare (schema bilei revenite)
- fr repetare (schema bilei nerevenite.
n cadrul procedeului tragerii la sori n varianta cu repetare (schema bilei revenite),
extragerile constituie evenimente independente i echiprobabile; ansa fiecrei uniti din
populaie de a fi selectat n cadrul unei extrageri oarecare, din cele n extrageri succesive,
rmne constant i egal cu:
P=1/N.
Numrul total al eantioanelor de volum n posibil de generat prin acest procedeu este dat
de formula aranjamentelor cu repetiie:

ANn = N n .
La sfritul celor n extrageri ale unui eantion, probabilitatea ca o unitate s figureze cel
puin o dat n eantion este:
n

P = 1 1 .
N

n cadrul procedeului tragerii la sori n varianta fr repetare (schema bilei


nerevenite), unitile deja incluse n eantion nu mai particip la extragerile ulterioare; astfel,
ansele unei uniti oarecare de a fi inclus n eantion la o anumit extragere depind att de
evenimentul curent ct i de ntreaga succesiune de realizri care l-au precedat. Extragerile
consecutive nu sunt, n acest caz, independente, iar probabilitile corespunztoare se
calculeaz nu pe baza evenimentelor simple, ci pe baza conjunciilor de evenimente. Dac la
prima extragere, probabilitatea fiecrei uniti este:
P=1/N
la a doua extragere, probabilitatea este:
P=[1 / (N-1)] [1-1/N]=1/N.

Rezultatul, care ilustreaz lipsa independenei dintre extragerile succesive, se poate


generaliza, demonstrnd egalitatea anselor la fiecare extragere. Numrul total al eantioanelor
distincte fr repetiie de volum n, ce se pot forma prin acest procedeu este dat de formula:

C Nn =

N!
n! (N n )!

La sfritul celor n extrageri, probabilitatea ca o unitate s fie selectat n eantion este:

P=

n
N

Datorit faptului c o unitate statistic nu poate fi extras de mai multe ori n eantion,
prin folosirea acestui procedeu se obin erori mai mici dect n cazul anterior.
procedeul mecanic (sistematic)
Se utilizeaz n cazul n care populaia de baz este deja organizat (ordonat) dup un
anumit criteriu (de exemplu: studenii unei faculti ordonai dup numrul matricol, pomii dintr-o
livad plantai dup un anumit model).
Utilizarea acestui procedeu presupune extragerea aleatoare doar a primei uniti care va
fi inclus n eantion; restul unitilor ce vor forma eantionul se determin mecanic (sistematic)
cu ajutorul pasului de numrare:

k=

N
,
n

n - volumul eantionului; N volumul pbazei de selecie.

Se introduc ntr-o urn bilete (sau jetoane, cartonae, etc.) numerotate de la 1 la k, din
care se extrage unul singur. Numrul nscris pe biletul extras va indica numrul de ordine al
primei uniti statistice din eantion. Restul unitilor care intr n eantion se determin
adugnd pasul de numrare la numrul de ordine al ultimei uniti extrase din lotul de baz.
Datorit faptului c nu se realizeaz o extragere a eantionului complet ntmpltoare,
rezultatele acestui tip de sondaj sunt mai puin exacte dect n cazul utilizrii procedeului tragerii
la sori pe baza schemei bilei nerevenite.
Tipul sondajului este determinat de mai multe criterii:
procedeul (aleator) de eantionare folosit:
sondaj ntmpltor (aleator) repetat;
sondaj ntmpltor (aleator) nerepetat;
sondaj mecanic.
gradul de prelucrare a bazei de selecie naintea efecturii sondajului:
sondaj cu baza neprelucrat (simplu) cnd baza de selecie este omogen;
sondaj cu baza prelucrat (tipic, stratificat) cnd baza de selecie este eterogen.
numrul i tipul unitilor extrase de fiecare dat n eantion:
sondaj simplu (individual) cnd se extrage cte o singur unitate statistic simpl;
sondaj complex (de serii) cnd se extrag cte dou sau mai multe uniti simple sau
cte o unitate complex.

4.3. Sondajul aleator (ntmpltor) simplu


Obiectivul fundamental al cercetrii prin sondaj l constituie estimarea unor parametri ai
populaiei cu ajutorul unor statistici calculabile plecnd de la datele unui eantion; cele mai
simple cazuri sunt acelea n care parametrul desemneaz caracteristici numerice, precum media
sau dispersia populaiei. Exist dou modaliti de a estima un parametru (principiile de baz ale
celor dou metode au fost prezentate n capitolul 3):
5

cu ajutorul unei singure valori estimaie punctual;


cu ajutorul unui interval (regiune) de estimaie sau de ncredere.
Sondajul aleator simplu este fundamental, deoarece reprezint modelul teoretic de baz
pentru celelalte metode de sondaj. El vizeaz cel mai elementar nivel de reprezentare, acela al
unei populaii omogene i se caracterizeaz prin faptul c unitile populaiei au probabiliti
cunoscute a priori, egale i implicit nenule de a fi incluse n eantion, probabiliti care depind de
schema de extragere.

4.3.1. Sondajul simplu ntmpltor repetat


Sondajul ntmpltor repetat se organizeaz pentru populaii omogene (baza de selecie
neprelucrat), prin extragerea unitilor care vor compune eantionul pe rnd (cte o unitate
simpl), prin procedeul bilei revenite.
Principalii parametri ai populaiei ce trebuie estimai sunt media x0 i dispersia 02 .
Media de selecie x s , obinut prin sondaj simplu repetat, este un estimator absolut
corect al mediei populaiei x0 , adic este nedeplasat (fr distorsiune) i are dispersie
asimptotic nul.
Diferena (x s x 0 ) , ce caracterizeaz fiecare eantion de volum n, desemneaz eroarea
de reprezentativitate asociat acestuia i constituie element de definiie pentru dispersia
mediilor de selecie n raport cu media general:
m

x2 ( r2 ) =

(x
k =1

sk

x0 )

unde k = numrul mediilor de selecie (numrul

eantioanelor de volum n)
Abaterea standard a mediilor de selecie fa de media general are, n cazul sondajului
simplu repetat, expresia:

x ( r ) =
s

02
n

0
n

i se numete eroare medie de reprezentativitate, sau eroare standard a seleciei; ea


constituie o msur a fluctuaiei mediilor de selecie fa de valoarea real a parametrului
estimat. n cadrul acestei relaii se poate folosi dispersia general 02 , atunci cnd aceasta s-a
calculat cu ocazia unei cercetri totale anterioare (dispersia de selecie este cunoscut) sau se
poate folosi dispersia de selecie s2 . Deoarece dispersia de selecie este un estimator deplasat
(cu distorsiune) al dispersiei generale, un estimator nedeplasat al acesteia se calculeaz cu
ajutorul unui factor de corecie (absolut necesar n cazul eantioanelor de volum redus):

s2

n
n 1

n acest caz, eroarea medie de reprezentativitate se calculeaz astfel:

r =

s2
n 1

Media de selecie ( x s ) este un estimator nedeplasat al mediei generale ( x0 ); n


eantioanele de volum mare, distribuia sa se concentreaz n jurul parametrului estimat
conform regulii aproximrii normale (mediile de selecie genereaz o variabil aleatoare care are
ca distribuie asimptotic distribuia normal, indiferent de legea de distribuie a variabilei
teoretice X ce caracterizeaz populaia originar).
Chiar dac, n medie, variabila x s se apropie de x0 , coincidena real dintre o variabil
particular x s i media general x0 nu se produce dect prin excepie i nu poate fi garantat.
6

Pentru a realiza o estimare cu un grad de ncredere convenabil, este necesar s asociem


estimatorului x s un interval ce delimiteaz probabilistic zona de siguran, denumit interval de
ncredere:
x0 = x s eroarea de estimaie
Mrimea marjei de eroare depinde de:
amploarea fluctuaiilor lui x s ( r );
importana garaniilor pe care le oferim sau nivelul de ncredere cu care dorim ca
intervalul de estimare centrat n x s s ncadreze valoarea adevrat a lui x0 , altfel spus,
probabilitatea cu care intervalul de ncredere este acoperitor pentru parametru (z).
Eroarea limit admis se calculeaz ca produs ntre coeficientul z (valoarea
corespunztoare probabilitii ( z ) din tabelul funciei Gauss-Laplace) i eroarea medie de
reprezentativitate, exprimndu-se n aceeai unitate de msur cu caracteristica studiat:

x = z r = z
(z ) =

02
n

= z

s2
n 1

z2

dz
2 z

( z ) = P x s z 0 < x0 < x s + z 0
n
n

Not: valorile lui z i ( z ) se gsesc calculate n tabele speciale i, n funcie de condiiile de


precizie impuse sondajului statistic, se preiau valorile corespunztoare.
Dac eantioanele sunt de volum redus, distribuia mediilor de selecie este mai bine
aproximat de repartiia Student. Apelul la aceast repartiie se impune i mai acut atunci cnd n
calculul lui r s-a utilizat estimaia s a abaterii standard 0 . Statistica:

t=

X s x0

s / n

se compar cu valoarea teoretic asociat celor n-1 grade de libertate cu care s-a efectuat
calcului estimaiei nedeplasate a lui 0 . Aceast concluzie se bazeaz pe convergena n
distribuie a legii lui student ctre legea normal; pentru fiecare volum n al eantionului, deci
corespunztor fiecrui numr al gradelor de libertate, exist cte o distribuie t, avnd acelai
centru cu cea normal (de care se apropie asimptotic pe msur ce n ), dar prezentnd o
variabilitate mai mare.
Formula erorii limit admise prezentat mai sus este valabil n cazul n care 02 este
cunoscut sau n cazul n care acest parametru este necunoscut, dar volumul eantionului este
foarte mare ( n 100 ). n cazul n care dispersia general nu este cunoscut iar volumul
eantionului este sub 100 de uniti statistice, variabila standardizat a mediei de selecie
urmeaz o distribuie Student cu (n-1) grade de libertate:

X s x0

s / n

t n 1

Iar formula erorii limit admise devine:

x = t n 1; / 2

Eroarea limit admis este folosit pentru estimarea:


mediei generale

x0 = x s x = x s z

sau

x0 = x s t

Pe baza acestor relaii este posibil analiza factorilor ce influeneaz amplitudinea intervalului
de ncredere; abaterea standard ( 0 , respectiv s ) reflect caracteristicile de variabilitate
intrinseci ale fenomenului, fiind deci un factor de influen cu un nivel dat, nesupus controlului; n
schimb, volumul eantionului i argumentul (z sau t) constituie parametri importani: o mrire a lui
n produce diminuarea erorii medii de reprezentativitate i, implicit, reducerea intervalului de
ncredere, respectiv creterea preciziei, iar mrirea probabilitii de garantare a unui rezultat
conduce la limite mai largi ale intervalului de ncredere.
nivelului totalizator al variabilei X (atunci cnd acesta are semnificaie):
N

X 0 = xi = x 0 N = ( x s s ) N X 0 N ( x s x , x s + x )
i =1

Volumul necesar al eantionului pentru un nivel impus al erorii limit admise i o


valoare precizat a probabilitii ( z ) se determin pornind de la relaia de calcul a erorii limit
admise:

n=

z 2 02
2x

respectiv

n=

t 2 s2
2x

Rezultatele obinute n cazul sondajului simplu ntmpltor repetat se pot particulariza cu


uurin pentru variabila alternativ (binar). Dac notm cu p media populaiei, i cu w
media de selecie, atunci dispersia populaiei are urmtoarea expresie:

02 = p (1 p)
Iar estimatorul su nedeplasat, obinut din statistici de eantion, va fi definit prin:

sn2 1 = w(1 w)

n
n 1

Eroarea medie de reprezentativitate (eroarea standard a seleciei) se calculeaz


utiliznd fie abaterea standard a populaiei (dac este cunoscut sau volumul eantionului este
foarte mare), fie o estimaie nedeplasat a acesteia:

r =

0
n

p(1 p)
;
n

r =

s
n

w(1 w)
n 1

Fiind cunoscute eroarea standard a estimaiei i o probabilitate ce exprim gradul de


ncredere asociat estimaiei, se determin eroarea limit admis (calculat n raport cu
argumentele z sau t ale funciilor de probabilitate ce definesc distribuiile Gauss-Laplace sau
Student, dup cum volumul eantionului este mic sau mare):
x = z r (volum mare al eantionului);
x = t r (volum mic al eantionului)
Intervalul de ncredere acoperitor pentru media populaiei este:

p = w x
Iar intervalul de ncredere ce ncadreaz nivelul totalizator al variabilei alternative, relativ la
ntreaga populaie (care are ntotdeauna semnificaie), are forma:

X 0 N (w x , w + x )

Volumul minim al eantionului necesar pentru asigurarea unui anumit nivel al erorii
limit i unui grad specificat de ncredere se calculeaz astfel:

n=

z 2 p(1 p) t 2 w(1 w)

+1
2x
2x

Dezavantajele acestui tip de sondaj:


avnd la baz procedeul bilei revenite de eantionare, preia toate neajunsurile acestuia;
folosete dispersia total (suma dispersiilor factoriale), care este mare.
acest tip de sondaj se folosete mai rar, deoarece are rezultate mai slabe, concretizate n
erori de reprezentativitate mari i volum necesar al eantionului mai mare dect n cazul altor
tipuri de sondaj.

4.3.2. Sondajul simplu ntmpltor nerepetat


Se aplic n aceleai condiii ca i sondajul simplu repetat, numai c extragerea eantionului
se realizeaz prin procedeul bilei nerevenite.
Pe baza caracteristicilor eantionrii aleatoare prin procedeul bilei nerevenite, se poate uor
demonstra c, n acest caz, relaia de calcul a erorii medii de reprezentativitate este:

02 N n

n =

02

n
1 - atunci cnd volumul populaiei totale este foarte mare.
n N

n N 1

Factorul subunitar:

N n
n
1
N 1
N

se numete factor de exhaustivitate i arat c dispersia mediilor de selecie n sondajul


nerepetat este mai mic dect n sondajul repetat. Pornind de la aceast relaie, se deduc
relaiile de calcul ale celorlali indicatori ai sondajului simplu nerepetat:
eroarea limit admis i intervalul de ncredere pentru estimarea mediei generale:

x = z n

x0 = x s x = x s z n

volumul necesar al eantionului pentru nivele precizate ale erorii limit i gradului de
ncredere:

n=

z 2 02
z 2 02
2
x +
N

Particularizarea relaiilor de mai sus la cazul variabilei alternative, conduce la urmtoarele


rezultate:

p (1 p )
n
1
n
N

x = z n
p = w x = w z n X 0 = p N = N (w x )

n =

n=

z 2 p (1 p )
z 2 p (1 p )
2
x +
N

Atunci cnd dispersia 02 a populaiei este necunoscut, se pune problema


determinrii unui estimator nedeplasat al acesteia, adaptat condiiilor de eantionare ale
sondajului simplu nerepetat; acest estimator se calculeaz pe baza dispersiei de selecie, cu
ajutorul relaiei:

2
sn 1

(x
=

xs )
1
1
n
2
1 = s
1
n 1
n 1 N
N
2

Particulariznd, estimatorul nedeplasat al dispersiei pentru variabila alternativ, n


sondajul simplu nerepetat, se definete astfel:

sn2 1 = w(1 w)

1
n
1
n 1 N

Acest tip de sondaj are o serie de avantaje:


folosete procedeul bilei nerevenite, prelund toate aspectele pozitive ale acestui tip de
eantionare;
formulele indicatorilor sondajului sunt corectate cu un factor subunitar, ceea ce conduce
la o eroare standard a estimaiei i un volum necesar al eantionului mai mici dect n
cazul sondajului repetat:
acest tip de sondaj se folosete mai frecvent dect cel repetat.
Conform metodologiei prezentate, indicatorii sondajului simplu ntmpltor
(repetat i nerepetat) sunt prezentai n tabelul 4.1.
9

Tabelul 4.1
Tip sondaj
repetat

nerepetat

Indicatori
Eroarea medie de
reprezentativitate
Eroarea limit
admis
Volumul
eantionului

r =

02
n

x = z r = z
n=

n =
02
n

z 2 02
2x

02

n
1
n N

x = z n = z
n=

02

n
1
n N

z 2 02
z 2 02
2
x +
N

4.4. Sondajul tipic (stratificat)


Atunci cnd populaia originar este eterogen n raport cu fenomenul studiat, gradul
sporit de variabilitate poate influena negativ precizia estimaiilor; n acest caz este necesar
identificarea unui criteriu de grupare corelat cu variabila supus analizei, care s conduc la
structurarea colectivitii generale n clase omogene (cu variabilitate intern redus), numite i
straturi.
Pentru ca erorile de reprezentativitate s fie minime, structura eantionului (de volum n)
trebuie s fie identic cu cea a bazei de selecie (de volum N); acest lucru se poate realiza prin
asigurarea proporiilor identice dintre: eantioanele pariale (n1, ,nk) n raport cu eantionul
general (n) i straturile sau clasele omogene din baza de selecie (N1,Nk) n raport cu volumul
acesteia (N).

n
N
n1 N 1 n 2 N 2
=
; =
;... k = k
n
N n
N
n
N

unde k = numrul de straturi (clase omogene)

n determinarea eantioanelor pariale (n1,,nk), n practic se folosete frecvent fracia


de sondaj de nivel constant; n acest caz sondajul este de tip proporional (reprezentativ):

fs =

n
n1 = f s N 1 ; n 2 = f s N 2 ;...nk = f s N k
N

n cadrul acestui tip de sondaj se utilizeaz analiza dispersional: dispersia total =


media dispersiilor de grup sau strat (component intra clase) + dispersia dintre grupe sau
straturi (component inter clase):
02 = 2 + 2 - pentru baza de selecie

s2 = s2 + s2 - pentru eantion
n cadrul acestor relaii, 2 sau s2 reprezint variaia ntmpltoare, iar 2 sau s2
reprezint variaia sistematic.
Deoarece diferenele din interiorul straturilor sunt generate de factorii ntmpltori, n
sondajul tipic se utilizeaz dispersia care sintetizeaz aceast variaie ( 2 sau s2 ). Cu ct
straturile sunt mai omogene, cu att dispersiile lor interne sunt mai mici i, prin urmare, raportul
de corelaie inter-straturi se apropie mai mult de valoarea limit 1:

R2 =

2
2
=
1

02
02
10

Principalii indicatori ai sondajului stratificat proporional se calculeaz astfel:


eroarea medie de reprezentativitate:

n sondajul repetat:

r =

n sondajul nerepetat:

n =

2
n

2
n

1
N

eroarea limit admis:

n sondajul repetat:

x = z

n sondajul nerepetat:

x = z

2
n
n
2
1
n N

volumul eantionului:

n sondajul repetat:

n=

n sondajul nerepetat:

n=

z 2 2
2x
z 2 2
z 2 2
2
x +
N

Doarece n cazul acestui tip de sondaj se utilizeaz media dispersiilor de grup ( 2 sau
s2 ), care este ntotdeauna mai mic sau egal cu dispersia general ( 2 sau s2 ) cu ct
straturile sunt mai omogene, cu att dispersiile lor interne sunt mai mici i, implicit, media lor
rezultatele sale sunt superioare celor ale sondajului simplu ntmpltor; sondajul tipic nerepetat
are rezultate mai bune dect cel repetat.

4.5. Sondajul de serii


Atunci cnd populaia este eterogen i nu exist posibilitatea structurrii sale n clase
omogene sau atunci cnd populaia nu se compune din uniti simple, ci din uniti complexe,
extragerea de pachete sau serii compacte de uniti (uniti complexe) reprezint o tehnic
de eantionare cu utilitate practic deosebit.
Seriile pot fi:
de volume egale (cazul cel mai frecvent ntlnit n practic) sau de volume inegale;
mrimea lor poate fi cunoscut (cazul cel mai frecvent) sau necunoscut.
n cazul acestui tip de sondaj:
presupunem c cele N uniti simple ale populaiei originare sunt repartizate n R
submulimi, numite serii;
eantionul va fi format din r ( r < R ) serii, care vor fi explorate complet (se vor analiza
toate unitile simple componente);
spre deosebire de sondajul tipic, la baza construciilor seriilor nu st un criteriu structural
de omogenizare, de aceea seria preia, n principiu, caracteristicile de eterogenitate ale
populaiei; sursa de variaie nemaifiind perceput la nivelul unitii statistice primare, ci la
nivelul agregat al seriei, problema reprezentativitii se va pune n legtur cu seria
nsi; n acest caz eroarea standard a seleciei ( ) va fi definit exclusiv n funcie de
componenta inter-serii a dispersiei ( 2 ).
Sondajul de serii repetat este posibil, dar costisitor i ineficient (reinspectarea unei serii nu
aduce informaii suplimentare, de aceea este foarte rar folosit; cel mai frecvent se folosete
sondajul de serii nerepetat.
Principalii indicatori ai sondajului de serii nerepetat, pentru cazul seriilor de volume egale, se
calculeaz astfel:
11

eroarea medie de reprezentativitate:

n =

2 Rr

=
r R 1

s2 R r

r R 1

Unde dispersia mediilor de grup de la media general, dac este cunoscut, se determin
astfel:

(x
R

2 =

g =1

x0 )

Iar dac nu este cunoscut, se poate folosi estimatorul su nedeplasat:

(x
r

s2 =

g =1

xs )

r 1

1
R

unde g = numrul de serii

eroarea limit admis:

volumul eantionului (numrul de serii):

x = z n

R z 2 s2
R z2 2
r=
=
(R 1)2x + z 2 2 (R 1)2x + z 2 s2
Sondajul de serii nerepetat are rezultate mai bune dect sondajul simplu ntmpltor, avnd
erori de reprezentativitate mai mici i volum necesar al eantionului mai mic dect acesta

12