Sunteți pe pagina 1din 9

SONDAJUL STATISTIC

SONDAJUL STATISTIC
Sondajul sau selectia statistica este o metoda partiala de observare statistica, din
ce n ce mai larg utilizata n cercetarile statistice moderne. Sondajul se foloseste
pentru a nlocui o observare totala, de mare amploare, mai dificil de realizat,
care presupune angajarea unor cheltuieli ridicate de resurse materiale, financiare
si umane.
Avantajele cercetarii statistice prin sondaj, opusa unei cer-cetari statistice
totale, sunt incontestabile.
Principalul avantaj al metodei sondajului statistic consta n faptul ca aceasta
metoda este aplicabila n toate cazurile n care se urmareste realizarea unei
economii de resurse banesti, de munca si de timp (care, n ultima instanta,
nseamna tot economie de bani) pentru obtinerea unui volum de informatii
necesar si suficient, cu un grad de exactitate acceptabil. Este evident mai ieftin
sa fie cercetate 50 de unitati statistice n loc de 500 sau de 5000, chiar daca, pe
o unitate statistica cercetata, costul poate sa fie mai ridicat datorita cheltuielilor
suplimentare determinate, de pilda, de selectarea esantionului.
Un alt avantaj al utilizarii sondajului statistic este faptul ca programul cercetarii
poate sa fie mai amplu, iar informatiile detaliate pot fi culese doar de la unitatile
statistice selectate n esantion. Acest lucru permite o caracterizare mai profunda
a fenomenelor studiate prin metode statistice. De asemenea, n etapa de
culegere a datelor se poate folosi un personal de calificare superioara, ceea ce
poate determina reducerea erorilor de observare. Nu n ultimul rnd, trebuie
subliniat faptul ca sondajul statistic devine absolut necesar si imperativ atunci
cnd prin cercetarea statistica se distrug unitatile statistice supuse analizei, ca de
pilda n controlul statistic al calitatii productiei, la verificarea calitatilor
organoleptice ale produselor. Totodata, sondajul statistic poate fi utilizat pentru
verificarea programului unei observari totale si pentru verificarea si testarea unei
ipoteze statistice.
Desi avantajele esantionarii sunt evidente, n contrapartida exista ntotdeauna o
incertitudine referitoare la posibilitatea extrapolarii corecte a indicatorilor la
ntreaga populatie. Parasind terenul certitudinii si intrnd n cel al
probabilitatilor nu vom fi niciodata 100% siguri ca esantionul selectat oglindeste
perfect situatia din colectivitatea generala. Daca se respecta, nsa, anumite reguli
n privinta procedeului de selectie aleatoare si n privinta marimii esantionului,
se poate garanta, cu un anumit nivel prestabilit de confidenta, reprezentativitatea
esantionului. Folosirea selectiei aleatoare (esantionarea probabilista), n care
fiecare unitate statistica din colectivitatea generala are sansa calculabila si
diferita de zero sa fie selectionata n esantion, permite calcularea marimii erorii
si stabilirea prealabila a acestei marimi.
Datorita tuturor acestor avantaje, cercetarea statistica prin sondaj este utilizata n
domenii diverse: analiza macroeconomica, demografie, agricultura, comert,
anchete sociale etc.
Asa cum am aratat, exista doua categorii esentiale de sondaj: sondaj aleator
(probabilist) si sondaj nealeator. Pentru multe studii este posibila doar realizarea
1
unei esantionari nealeatoare (cum ar fi ancheta statistica care ofera informatii
orientative, esantionarea pe cote, observarea partii principale etc.). nsa, n
analiza statistica, singura cale pentru a putea folosi corect inferenta statistica, de
la esantion la colectivitatea generala, este sa utilizam un sondaj probabilist.
Sondajul aleator simplu
Un esantion probabilist este acela n care unitatile din esantion au fost alese pe
baza unor probabilitati cunoscute. Tipurile de esantionari probabiliste cel mai
des utilizate sunt: esantionarea aleatoare simpla, esantionarea stratificata si
esantio-narea n cuiburi (cluster).
n sondajul aleator simplu sansa de selectie n esantion a fiecarei unitati
statistice din colectivitatea generala trebuie sa fie egala. Acesta este un sondaj
cu un singur grad, n care unitatile sunt extrase din ntreaga populatie, care
constituie baza de sondaj. Pentru efectuarea unei selectii simple aleatoare
corecte, este esential sa eliminam elementele preferentiale ale alegerii umane
care ar putea duce la formarea arbitrara a esantionului.
Un esantion simplu aleator este asadar selectat astfel nct:
fiecare unitate statistica are o probabilitate egala de a fi aleasa n esantion si
unitatile sunt alese independent, fara legatura una cu cealalta.
Alcatuirea bazei de sondaj implica sistematizarea unitatilor statistice din
colectivitatea generala n liste, harti etc, astfel nct sa permita alegerea
ntmplatoare a unitatilor ce vor fi selectate n esantion. Baza de sondaj trebuie
sa fie completa, exacta, fara duble nregistrari si fara omisiuni, astfel nct
fiecare unitate sa aiba sansa calculabila, diferita de zero, de a fi cuprinsa n esan-
tion. Unitatile de esantionare pot fi simple sau complexe: orase, gospodarii,
persoane, firme, piese pentru controlul calitatii etc.
Independenta selectiei unitatilor, una fata de cealalta, este asigurata prin
amestecarea si ordonarea unitatilor n baza de sondaj dupa un criteriu ce nu are
legatura cu cercetarea statistica efectuata.
Sondajele pot fi repetate sau nerepetate, dupa cum exista posibilitatea revenirii
unei aceleasi unitati n cadrul aceluiasi esantion.
n prima situatie, a sondajului repetat (cu revenire), fiecare unitate statistica
extrasa din colectivitatea generala este reintrodusa n baza de sondaj, dupa ce a
fost citita si caracteristicile au fost nregistrate.
1. Necesitatea folosirii sondajului statistic n studiul fenomenelor social-
economice
Avantaje:
1. Cnd colectivitatea total este foarte mare, cercetarea ei exhaustiv necesit
un volum mare de cheltuieli materiale i umane, deci este avantajos s se
recurg la sondaj, care este mai operativ i mai ieftin;
2. Partea supus nregistrrii fiind mult mai mic dect cea total, erorile de
nregistrare sunt mai puin numeroase i mai uor de nlturat n faza de
verificare a datelor;
2
3. Cercetarea prin sondaj este singura posibil atunci cnd prin cercetarea
exhaustiv s-ar ajunge la distrugerea produselor (de exemplu, controlul
calitii unui produs);
4. Sondajul permite verificarea programului unei observri totale i a ipotezelor
statistice.
2. Noiuni specifice sondajului statistic
a. Sondajul statistic desemneaz o cercetare parial al crei scop este ca
pe baza rezultatelor obinute la un eantion riguros prelevat s se estimeze
parametrii populaiei totale, pe baza principiilor teoriei probabilitilor, statisticii
matematice i a legii numerelor mari.
Etape ale cercetrii prin sondaj:
Culegerea i prelucrarea datelor statistice de la unitile colectivitii generale
care au fost incluse n eantion i din care rezult indicatorii derivai, cum
sunt mrimile relative, medii i indicii = etapa descriptiv.
Indicatorii obinui din prelucrarea datelor din eantion se extind cu o
anumit probabilitate asupra ntregii colectiviti, n scopul caracterizrii
acesteia din punct de vedere statistic = etapa inferenial.
b. Colectivitatea de selecie (de sondaj, prob, mostr, eantion)
reprezint acea parte a colectivitii generale notat cu N de la care urmeaz s
se culeag datele n scopul generalizrii rezultatelor obinute din prelucrarea
acestora asupra ntregului ansamblu. Dac colectivitatea general este mprit
n r grupe, atunci

r
1 i
i
N N
. Volumul colectivitii de selecie se noteaz cu n,
iar dac avem mai multe eantioane,

r
1 i
i
n n
.
c. Planul cercetrii prin sondaj trebuie s cuprind:
Delimitarea n timp, spaiu i organizatoric a colectivitii generale;
Verificarea gradului de omogenitate a colectivitii generale;
Alegerea sau stabilirea bazei de sondaj. Baza de sondaj reprezint
sistematizarea unitilor statistice astfel nct s permit alegerea
ntmpltoare a unitilor statistice ce vor intra n eantion. Ea nu trebuie s
conin nregistrri duble i trebuie s fie complet pentru ca fiecare unitate
statistic s aibe o ans de a fi cuprins n eantion;
Alegerea i definirea unitii statistice folosite la eantionare: unitile de
eantionare pot fi simple (indivizi, piese) sau complexe (gospodrii, orae,
loturi de piese);
Alegerea tipului i procedeului de selecie;
Stabilirea periodicitii efecturii sondajului;
Stabilirea planului observrii;
Stabilirea planului de prelucrare a datelor de selecie din punct de vedere
metodologic i organizatoric;
3
Alegerea procedeelor de verificare a semnificaiei indicatorilor de selecie i
de extindere a rezultatelor seleciei asupra ntregului ansamblu.
d. Reprezentativitatea eantionului este ndeplinit n cazul n care
reproduce n structura sa aceeai structur pe care o prezint colectivitatea
general. Condiii:
Fiecare unitate din colectivitatea general trebuie s aibe aceeai ans de a
ptrunde n eantion;
Eantionul stabilit trebuie s fie suficient de mare ca s permit redarea
trsturilor eseniale i s poat surprinde ntreaga variaie a caracteristicilor
nregistrate n eantion, fapt care va permite obinerea unor indicatori cu un
grad mare de veridicitate;
Includerea fiecrei uniti n eantion trebuie s se fac independent de alte
uniti.
Eroarea de estimaie (estimatorul eantionului) reprezint valoarea
parametrului din colectivitatea general; n general, este necunoscut.
Un estimator este nedeplasat dac nu este n mod sistematic diferit dect
parametrul corespunztor din populaia general.
Notaii:
Media aritmetic:

'


e s a n t i o n p e n t r u x
g e n e r a l a a t e a c o l e c t i v i t p e n t r u
N
x
i


sau
i
i i
N
N x


n
x
x
i

sau
i
i i
n
n x
x

Dispersia:

'


e s a n t i o n p e n t r u s
g e n e r a l a a t e a c o l e c t i v i t p e n t r u
2
2
N
) x (
2
i 2

sau
i
i
2
i 2
N
N ) x (



1 n
n
x
x
1 n
) x x (
s
2
i 2
i 2
i 2

,
_

sau
1 n
n
n x
n x
1 n
n ) x x (
s
i
2
i
i i
i
2
i
i
i
2
i 2

,
_

Utiliznd divizorul (n-1) se obine un estimator nedeplasat al dispersiei


generale
2
. n cazul n care eantioanele sunt de volum mare, n>30, se poate
renuna la scderea lui 1 din numitorul dispersiei.
3. Procedee de selecie pentru constituirea eantionului
4
n teoria i practica statistic, la formarea eantionului se folosesc mai
multe procedee:
1. Sondaje aleatoare (ntmpltoare), care exclud orice intervenie subiectiv
n alegerea eantionului: sondajul simplu, sondajul tipic (stratificat), sondajul
de serii, sondajul secvenial i sondajul n trepte.
2. Sondaje dirijate (sau subiectiv organizate), pentru care alegerea unitilor
se face de ctre persoanele care culeg datele, ceea ce implic producerea unor
distorsiuni. n practic se folosete rar.
3. Sondaje mixte, le mbin pe precedentele. n acest caz, este necesar ca mai
nti s se mpart colectivitatea n grupe tipice dup o anumit caracteristic
i apoi s se extrag ntmpltor cte un eantion din fiecare grup. Operaia
de extragere a eantionului are n vedere mrimea acestuia, procedeul de
extragere i estimarea de calcul.
Fiecare din acestea se poate efectua n dou variante:
- repetat - cnd o unitate prelevat este restituit populaiei de origine i
deci are anse s mai reintre n eantion;
- nerepetat - cnd unitile nu sunt sau nu pot fi restituite n populaia
general.
Modelul teoretic al acestor dou variante de prelucrare se afl n urna lui
Bernoulli cu bil revenit i nerevenit. Prelevarea unitilor se efectueaz dup
diverse metode dintre care amintim:
1. Procedeul LOTERIE, este un procedeu aleator n care unitile,
perfect identificabile (seria imprimat pe produse sau componente, numrul
de marc al salariailor, numrul casei sau al apartamentului etc.) sunt
prelevate dup corespondentul nregistrat pe bileele amestecate i extrase
aleator dintr-o urn.
2. Procedeul tabelelor cu numere aleatoare. Unitile vor fi prelevate
din populaia N i se va alctui eantionul n, n ordinea aleatoare n care sunt
nregistrate numerele ntr-un tabel de acest tip, special alctuit. Aceste tabele
ofer serii de numere aleatoare rezultate n urm aplicrii unui procedeu de tip
loterie i consemnarea rezultatelor, fie se obin prin utilizarea calculatorului
electronic, folosind programele specifice pentru generarea numerelor
aleatoare.
3. Procedeul mecanic const n prelevarea unitilor la intervale de timp
sau numerice bine precizate, deci la un anumit pas de numrare aplicat bazei
de sondaj. De exemplu, dac eantionul n reprezint 10% din volumul populaiei
N, atunci se va preleva fiecare a 10-a unitate a populaiei. Deci pasul de
numrare este egal cu
n
N
k
. Pentru a mbunti caracterul aleator al
procesului de prelevare nu se va porni extracia cu unitatea numrului 001, ci cu
o unitate oarecare extras aleator, de exemplu din primele 20. S presupunem 7
i vom avea 7; 7+10=17; 17+10=27 .a.m.d.
4. Erorile cercetrii prin sondaj
5
1. Erori de nregistrare, care sunt comune tuturor tipurilor de observri i pot
fi nlturate n urma unui control atent.
2. Erori de reprezentativitate, care apar ca diferen sau abatere ntre
indicatorii derivai ce caracterizeaz colectivitatea de selecie i cei
corespunztori calculai pentru ntreaga colectivitate. Ei pot avea la baz
nclcarea principiilor alctuirii corecte a eantioanelor - erorile sistematice)
sau ali factori aleatori - erori ntmpltoare.
Msurarea erorii de reprezentativitate se poate efectua:
- absolut, ca dimensiune a deplasrii indicatorului (parametrului) de
sondaj
) x (
, de la mrimea adevrat a parametrului n populaia general (

), respectiv
x
;
- relativ, caz n care indicatorul eroare de eantionare se poate exprima
cu relaia:
% 5 100
x


O eroare relativ situat sub 5% permite a se aprecia c sondajul este
reprezentativ i ofer deci o imagine aproximativ "fidel" a realitii.
3. Eroarea medie de reprezentativitate (abaterea medie ptratic a mediei
de sondaj).
4. Eroarea limit maxim admisibil x

.
Estimaiile obinute pe baza datelor de sondaj constitue evaluri
aproximative ale adevratelor valori ale parametrilor necunoscui din populaia
general, deci rezultatele obinute printr-un sondaj sunt afectate de erori. Ce se
poate obine prin sondaj este nu valoarea adevrat a parametrului cutat ci un
interval de ncredere, care, cu o probabilitate fixat de ctre cercettor,
acoper valoarea adevrat dar necunoscut a parametrului din populaia
general. Acest interval poart numele de interval de estimaie sau interval de
ncredere.
Cele dou limite ale intervalului de ncredere
inf

i sup

, se calculeaz
pe baza datelor sondajului x
1
, x
2
, ...., x
i
, ...., x
n
, astfel nct cu o probabilitate P =
1 -

s se ndeplineasc relaia
< < 1 ) ( P
sup inf . Intervalul
) ; (
sup inf


reprezint intervalul de ncredere i definete precizia estimaiei. Probabilitatea
P = 1 -

caracterizeaz sigurana afirmaiilor i se numete nivel de ncredere.

este valoarea complementar a nivelului de ncredere, se numete nivel


sau prag de semnificaie i se fixeaz prin programul de cercetare. Cele mai
utilizate valori ale probabilitii de ncredere sunt 90%, 95%, 99%, 99,9%,
crora le corespund niveluri de semnificaie de 10%, 5%, 1%, 0,1%. Jumtatea
intervalului de ncredere se numete eroare limit admis i se noteaz
2
) ; (
sup inf

.
5. Sondajul aleator simplu
Este varianta aleatoare elementar de sondaj, celelalte tipuri putnd fi
nelese ca soluii obinute prin particularizarea unor elemente ale acestui tip de
6
sondaj. El se poate realiza, din punct de vedere al prelevrii unitilor, n una din
cele dou variante - repetat i nerepetat.
Indicatorii sondajului simplu repetat i nerepetat
Repetat Nerepetat
a) Eroarea medie de sondaj
Abaterea medie ptratic a mediei de
sondaj x

este egal cu
n
s
n
x


, adic dispersia de sondaj ntr-o
eantionare de volum n este de n
ori mai mic dect dispersia
2
a
colectivitii generale.
Abaterea medie ptratic a medie de
sondaj, ca msurtor al erorii medii de
reprezentativitate este:
N
n
1
n
s
1 N
n N
n
s
1 N
n N
n
x



n practic, pentru
2 , 0
N
n
<
, factorul
1 N
n N

sau
N
n
1
nu se mai ia n
consideraie.
Observaii:
1. Dup cum s-a observat, cnd abaterea medie ptratic prin populaia general
este necunoscut, ea a fost nlocuit cu s estimatorul ei stabilit pe baza unui
sondaj;
2. Dac eantionul n vederea estimrii abaterii mediei ptratice se efectueaz
pe baza unui numr redus de uniti n prob, atunci
1 n
) x x (
2
j



;
3. Un estimator al dispersiei este i valoarea maxim a indicatorului
2
) x x ( ) x x (
2
max
2
min 2
max
+
.
b) Eroarea limit (eroarea maxim admis sau probabil)
7
Repetat Nerepetat
Eroarea limit maxim admis definete sigurana (sau probabilitatea de
ncredere) estimrii mediei m prin variabila de sondaj x i se msoar
probabilist, astfel:
x
m x <
Mrimea x

caracterizeaz precizia estimaiei. Aprecierea satisfacerii


inegalitii nu se poate face dect ca o probabilitate de realizare:
( ) < 1 m x P
x
Probabilitatea
1
se alege de ctre cercettor n funcie de nivelul de
siguran urmrit n estimare, cele mai uzuale valori fiind 0,95; 0,99; 0,999.
Pentru valoarea uzual
001 , 0 ; 01 , 0 ; 05 , 0

Valorile variabilei Z sunt
Z
0,05
=1,96; Z
0,01
=2,33 respectiv Z
0,001
=3,09. Din tabelele Laplace se pot obine
mrimile Z i pentru alte praguri de semnificaie.
n
Z
x



N
n
1
n
Z
x



c) Determinarea volumului eantionului
La organizarea unei cercetri prin sondaj una din problemele de rezolvat
este dimensionarea lui raional. Este adevrat c mrimea volumului n al
sondajului - n virtutea legii numerelor mari - sporete precizia rezultatelor,
reduce eroarea medie probabil. innd seama de criterii de economicitate este
necesar ca acest volum s fie ct mai mic. Lund n considerare ambele aspecte,
se determin numrul minim de uniti de observat care s satisfac exigenele
de precizie i siguran formulate n raport cu cercetarea respectiv.
n teoria i practica sondajului se opereaz cu eantioane mari i
eantioane de volum redus, n funcie de gradul de omogenitate al
colectivitii generale. Interpretarea erorii de reprezentativitate se face n mod
diferit: pentru eantioanele de volum mare se folosete distribuia normal
Laplace, iar pentru cele de volum redus distribuia Student.
Calculul volumului eantionului se realizeaz pornind de la eroarea limit
maxim admis.
n
Z
x





2 2 2
x
2
2 2
x
Z n
n
Z
2
x
2
2
Z n


N
n
1
n
Z
x

,
_



,
_

N
n N
n
Z
N
n
1
n
Z
2 2
2
x
2
2 2
x




nN
n Z N Z
2 2 2 2
2
x


n Z N Z nN
2 2 2 2 2
x
N
Z
Z
n
Z N
N Z
n
2 2
2
x
2 2
2 2 2
x
2 2

d) Calculul intervalului de ncredere


Intervalul de ncredere desemneaz zona probabil n interiorul creia
se va plasa media populaiei generale.
Se pleac de la x
m x <
, ceea ce este echivalent cu
x x
x m x + < <
.
8
Repetat Nerepetat

,
_


+
,
_


n
Z x N m N
n
Z x N

,
_

,
_


N
n
1
n
Z x N m N
N
n
1
n
Z x N
9