Sunteți pe pagina 1din 107

1

ACADEMIA DE STUDII ECONOMICE DIN BUCURETI


FACULTATEA DE CIBERNETIC, STATISTIC I INFORMATIC
ECONOMIC


ILEANA GABRIELA NICULESCU-ARON


SONDAJE I ANCHETE

Suport de curs pentru nvmntul la distan






BUCURETI
2011
2


Copyright 2011, Ileana Gabriela Niculescu-Aron
Toate drepturile asupra acestei ediii sunt rezervate autorului





Editura ASE
Piaa Roman nr. 6, sector 1, Bucureti, Romnia
cod 010374
www.ase.ro
www.editura.ase.ro
editura@ase.ro














Refereni:

Prof. univ. dr. Constantin MITRU
Prof. univ. dr. Emilia IAN


















ISBN 978-606-505-457-8
3



CUPRINSUL CURSULUI



INTRODUCERE 5
Unitatea de nvare 1.
NOIUNI DE BAZ N TEORIA SONDAJELOR 6
1.1 Obiectivele unitii de nvare 6
1.2 Metode de observare utilizate n domeniul economico-social 6
1.3 Rolul Sondajului statistic n sistemul informaional statistic 7
1.4 Definirea conceptelor de baz utilizate n sondajele statistice. 8
1.5 Procedee de eantionare utilizate 9

Unitatea de nvare 2.
ORGANIZAREA SONDAJELOR STATISTICE 14
2.1 Obiectivele unitii de nvare 14
2.2 Etape preliminare n organizarea unui sondaj 14
2.3 Elaborarea chestionarului 18
2.4 Ancheta pilot 26
2.5 Extragerea eantionului 26
2.6 Culegerea i verificarea datelor 28

Unitatea de nvare 3.
ASPECTE PRACTICE N REALIZAREA UNUI SONDAJ STATISTIC 29
3.1. Obiectivele unitii de nvare 29
3.2. Problematica non-rspunsurilor 29
3.3. Tipuri de erori ntlnite n cercetarea selectiv 34
3.4. Verificarea reprezentativitii eationului 38
3.5. Aplicaii 39

Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE 47
4.1. Obiectivele unitii de nvare 47
4.2. Sondajul simplu aleator 47
4.2.1. Sondajul simplu aleator cu probabiliti egale 48
4.2.2. Sondajul de volum redus 54
4.3. Sondajul stratificat 55
4.4. Sondajul de serii 61
4.5. Aplicaii 69
4


Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE 87
5.1. Obiectivele unitii 87
5.2. Sondajul multistadial 87
5.3. Sondajul multifazic 90
5.4. Sondajul pe baz de eantioane fixe 91
5.5. Aplicaii 95

Unitatea de nvare 6
SONDAJE NEPROBABILISTICE 101
6.1. Obiectivele unitii de nvare 101
6.2. Tipuri de sondaje neprobabilistice 101
6.3. Sondajul pe cote 102

BIBLIOGRAFIE 107


5



INTRODUCERE


Cursul de SONDAJE I ANCHETE se adreseaz studenilor nscrii la programul de studiu
ID, organizat de facultatea Cibernetic, Statistic i Informatic Economic i face parte din
planul de nvmnt aferent anului III, semestrul 1.


Obiectivele principale ale acestui curs, concretizate n competenele dobndite dup
parcurgerea i asimilarea lui:
nsuirea tehnicilor de proiectare a anchetelor i sondajelor statistice;
Codificarea, culegerea i verificarea completitudinii datelor;
nsuirea tehnicilor de proiectare a sondajelor complexe;
Prelucrarea i analiza datelor obinute cu ajutorul metodelor statistice superioare.


Cursul SONDAJE SI ANCHETE este structurat pe ase uniti de nvare (capitole).
Pentru ca procesul de instruire s se desfoare ntr-un mod riguros, dar i atractiv, se vor
putea utiliza un set de resurse suplimentare indicate pe parcursul cursului.


Evaluarea cunotinelor se va realiza sub dou forme:
evaluare continu, pe baza a dou proiecte realizate n conformitate cu modelele prezentate
n resursele de pe platform;
evaluare final, realizat prin examenul susinut n perioada de sesiune.


Criteriile de evaluare constau n:
1. Punctajul obinut la cele dou proiecte menionate;
2. Gradul de implicare n discuiile tematice organizate prin opiunea Forum a platformei
electronice;
3. Punctajul obinut la examenul susinut in sesiune.


Ponderile asociate fiecrui criteriu precizat sunt urmtoarele:
- criteriul 1 (C1) Proiect 1: 1 punct
Proiect 2: 2 puncte.
- criteriul 2 (C2) 1 punct pentru grad de implicare de 100%;
- criteriul 3 (C3) 6 puncte pentru examenul susinut n sesiune.
6










1.1. Obiectivele unitii de nvare





1.2. Metode de observare utilizate n domeniul economico-social

Pentru satisfacerea nevoii de informaii n vederea analizrii fenomenelor i proceselor
din sfera social este necesar s se organizeze cercetri statistice. Cercetarea statistic se
realizeaz prin prelucrarea datelor preluate din alte forme de evideniere a fenomenelor
sociale sau prin prelucrarea datelor obinute prin observri statistice special organizate.
Observarea statistic se ocup de nregistrarea datelor individuale de mas, ceea ce
presupune soluionarea unor probleme metodologice i organizatorice complexe.

Dup studiul acestei uniti de nvare vei avea cunotine despre:
Importanta sondajului statistic in obinerea informaiilor n timp real
Conceptele de baz utilizate n cercetarea selectiv
Procedeele ce stau la baza formarii eantioanelor
Ce cuprinde aceast unitate de nvare?
1.1 Obiectivele unitii de nvare
1.2 Metode de observare utilizate n domeniul economico-social
1.3 Avantajele cercetrii selective
1.4 Definirea conceptelor de baz utilizate n sondajele statistice
1.5 Procedee de eantionare utilizate
Unitatea de nvare 1
NOIUNI DE BAZ N TEORIA
SONDAJELOR
7

Principalele metode de culegere a datelor

Recensmntul
cea mai veche forma de observare statistic
se culeg datele de la toate unitile colectivitii
cheltuieli mari caracter periodic
rezolvarea unor probleme delicate prin complexitatea lor:
scopul observrii
scopul culegerii datelor
timpul la care se refer datele
sfera de cuprindere
elaborarea de definiii, clasificri i nomenclatoare etc.
Rapoarte statistice
observri totale, permanente
datele statistice referitoare la diferitele fenomene i procese sociale se culeg pe
cale administrativ
Sondaje statistice
observri pariale
Ancheta statistic
nu presupune reprezentativitatea eantionului
se realizeaz pe baza chestionarului completat direct sau prin pot
Observarea prii principale (masivul principal sau panelul)
culegere a datelor numai de la cele mai semnificative (masivul principal)
uniti ale colectivitii
Panelul eantion cu caracter stabil
cercetarea se face longitudinal
Monografia
metod de observare aprofundat a fenomenelor i proceselor sociale


1.3 Avantajele cercetrii selective

Cele mai evidente avantaje ale cercetrii prin sondaj fa de observarea tuturor
elementelor populaiei apar n dou cazuri: cnd observarea implic distrugerea elementelor
observate (de exemplu controlul calitii produselor) i cnd cercetarea total implic cheltuieli
foarte mari.
1
Alte avantaje:

operativitate, economii de resurse (financiare i umane), calitate superioar a rezultatelor
pentru populaii totale foarte mari
erori de nregistrare mai mici i mai uor de nlturat pentru o populaie cercetat mai
mic dect cea total i folosind personal specializat calitate i fiabilitate a rezultatelor
net superioar celor obinute printr-o cercetare exhaustiv
caracterizarea mai aprofundat a fenomenelor studiate datorit posibilitii de a include
un numr mai mare de caracteristici dect n programul observrii totale


1
Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti p. 184.
8

Sondajul statistic poate fi folosit i la verificarea datelor culese printr-o observare total
de mare amploare precum i la prelucrarea datelor dintr-o cercetare exhaustiv ntr-o prim faz
selectiv i mai trziu total.
Sfera de cuprindere a informaiilor statistice este foarte larg incluznd toate fenomenele
cu caracter de mas. Totodat, informaia statistic este utilizat de ctre organele de conducere
la nivel micro i macroeconomic n exercitarea funciilor de previzionare, execuie i control.






1.4. Definirea conceptelor de baz utilizate in sondajele statistice.





Realizarea unui sondaj statistic presupune parcurgea a dou faze.


9








*
M(X) se mai noteaz i cu

**
m(x) se mai noteaz i cu


10

1.5. Procedee de eantionare utilizate

Pentru a se asigura reprezentativitatea eantionului este necesar s se respecte
urmtoarele principii:




n teoria i practica sondajului pentru formarea eantionului se folosesc mai multe
procedee i anume: eantionare aleatoare, eantionare dirijat i eantionare mixt.



11







12

Toate aceste procedee de eantioane se pot aplica direct populaiei totale sau pe grupe
ceea ce nseamn c se pot obine sondaje simple sau stratificate. La aplicarea procedeului de
selecie se pot folosi uniti simple numerotate de la 1 la N sau uniti complexe, denumite
serii numerotate de la 1 la R. n cel de-al doilea caz vom avea un sondaj de serii.





13









14


15








2.1. Obiective




2.2 Etape preliminare n organizarea unui sondaj

Sondajele statistice se bazeaz pe concepte, metode i procedee clar definite i se
aplic unei fraciuni mai mari sau mai mici din populaie. Calitatea rezultatelor depinde de
formularea corect a problemei, de selectarea unitilor din eantion, de precizia estimrii
parametrilor de interes. Efectuarea unui sondaj presupune un lan de lucrri complexe.
Dup studiul acestei uniti de nvare vei avea cunotine despre:
Stabilirea obiectivelor unui sondaj pornind de la scopul urmarit de
beneficiar
Alegerea variabilelor auxiliare necesare in stabilirea planului de sondaj
Formularea intrebarilor pornind de la obiectivele propuse
Ce cuprinde aceast unitate de nvare?
2.1 Obiectivele unitii de nvare
2.2 Etape preliminare n organizarea unui sondaj
2.3 Elaborarea chestionarului
2.4 Ancheta pilot
2.5 Extragerea eantionului
2.6 Culegerea i verificarea datelor
Unitatea de nvare 2
ORGANIZAREA SONDAJELOR
STATISTICE
16




Prima sarcin este formularea obiectivelor sondajului. n general cei care comand
sondajul vin doar cu o formulare vag a problemelor care i intereseaz i cu o imagine
neclar asupra modului cum vor utiliza rezultatele obinute. n dialogul beneficiar-statistician,
sociologului i revine rolul de a i ajuta pe acetia s stabileasc obiectivele. Aceste probleme
vor fi apoi analizate pentru a structura forma de prezentare a rezultatelor i pentru a evalua
resursele financiare i umane necesare.
Cnd vorbim despre populaie avem n vedere nelesul statistic al noiunii care denot
mulimea unitilor simple sau complexe pe care le are n vedere cercetarea efectuat.
Fiecare sondaj are problemele sale proprii legate de delimitarea populaiei n timp i n spaiu.




Este foarte important s stabilim dac populaia cercetat este sau nu omogen i care
este structura acesteia n vederea realizrii unei eventuale stratificri. Tot aici este important
s delimitm unitile din care este constituit populaia. Facem distincie ntre:

Unitate de observare unitatea despre care se culege informaia
Unitatea de eantionare unitatea de la care se culege informaia


Baza de sondaj orice sistematizare a unitilor astfel nct s permit selectarea lor
ntmpltoare n vederea formrii eantionului. Bazele de sondaj pot fi elaborate de ctre cel
care organizeaz selecia sau pot fi preluate din listele electorale, lista abonailor posturilor
telefonice, lista adreselor potale, registre ale populaiei, registrul statistic al agenilor
economici, fiierul bilanurilor contabile, baze de date, hri, etc.

17

Condiiile pe care trebuie s le ndeplineasc o baz de sondaj sunt:

s fie adecvat scopului urmrit i s cuprind ntreaga populaie care va fi supus
sondajului;
s nu conin nregistrri repetate;
s fie exact, evitndu-se includerea unor uniti care n-ar trebui s figureze din
diferite motive;
s fie ct mai actual posibil. Chiar dac n momentul ntocmirii ei a fost complet i
exact timpul a erodat-o.

n funcie de resursele financiare i umane disponibile, dar i n funcie de acurateea
dorit a rezultatelor, se trece la stabilirea metodei de colectare a informaiei, care se poate
realiza sub urmtoarele forme:









Variante utilizate n practic:

1. la domiciliul su, persoana intervievat completeaz chestionarul pe loc sau operatorul
poate veni dup un timp pentru a recupera chestionarul completat;
2. chestionarele se aplic simultan unui numr mai mare de indivizi cuprini ntr-o sal;
18

3. chestionarele sunt trimise prin pot, fax;
4. chestionarul este publicat n ziare sau reviste
5. chestionarele sunt completate prin intermediul internetului (interviul online).
inovaie bine-venit n lumea sondajelor
numr mare de respondeni posibili i arie larg de acoperire ntr-un timp
foarte scurt
chestionarele online pot fi dinamice i contingente, cu salturi i ramificaii n
funcie de rspunsurile primite
pot oferi respondenilor materiale vizuale
nu este nc foarte clar dac n cazul sondajelor online calitatea informaiilor
este mai bun sau nu dect n alte cazuri
se aseamn cu sondajele administrate neasistat prin faptul c ne putem atepta
la niveluri crescute de non-rspunsuri nu este prezent nici un intervievator
care s i ndemne pe respondeni s rspund. Dar exist de asemenea dovezi
cum c respondenii iau chestionarul mai n serios i consum mai mult
energie cognitiv pentru sondajele online dect pentru cele prin telefon.
Problema principal: cum s reueti s ai un sondaj la care a rspuns
eantionul dorit;

Sumarul considerentelor mai importante n alegerea metodei de culegere a datelor este
prezentat n Tabelul urmator. Costul este aproape ntotdeauna o problem critic i poate cntri
mai mult dect alte considerente, dar nici celelelte criterii prezentate nu trebuie neglijate.
Criterii
Metoda de culegere
Interviu
direct
Interviu prin
pot
Interviu prin
telefon
Interviu
online
Cost
Foarte
mare
Sczut pn
la moderat
Moderat pn la
ridicat
Sczut
pn la
moderat
Accesul la populaia int
Foarte
mare
Mare
Moderat (exist
gospodrii far
telefon)
Moderat
Durata colectrii datelor Moderat Mare Rapid Moderat
Infrastructura i personalul
necesar pentru administrare
Foarte
mare
Sczut pn
la moderat
Moderat Sczut
Nivelul de complexitate al
chestionarului
Ridicat Moderat Sczut Moderat
Lungimea maxim a
chestionarului
Lung Moderat Moderat Moderat
Rata de rspuns Moderat Sczut Sczut
Foarte
sczut
Capacitatea cognitiv necesar
a respondentului
Sczut Ridicat Moderat Ridicat
Folosirea funciilor multimedia Nu
Parial
(grafice
statice)
Nu Da
Numrul de non-rspunsuri
pariale
Sczut Moderat Sczut
Moderat -
ridicat
Control asupra ordinii
ntrebrilor la care se rspunde
Ridicat Sczut Ridicat
Ridicat
prin
utilizarea
funciilor
Abilitatea de a controla cine
rspunde
Ridicat Sczut Ridicat Sczut
19

2.3. Elaborarea chestionarului

Dup stabilirea caracteristicilor cantitative i calitative n concordan cu obiectivele
sondajului se ntocmete chestionarul. Acesta este o etap crucial n realizarea sondajului.
Un chestionar prost conceput este cauza eecului ntregului studiu.
Chestionarul este un fel de plas ce colecteaz informaiile cutate i permite ca
informaiile fr valoare s fie filtrate.
2




Elaborarea chestionarului necesit cunotine multidisciplinare, n sensul c necesit
mbinarea de informaii din mai multe discipline tiinifice (economie, statistic, matematic,
sociologie, psihologie, informatic).
3


Construirea unui chestionar este privit n mod corect ca o art imperfect. Nu exist
proceduri prestabilite care vor duce neaprat la un chestionar bun. Una dintre consecine
este c ar putea aprea erori cauzate de ambiguitatea ntrebrilor de 20 sau chiar 30 de puncte
procentuale. Din fericire, astfel de erori extreme pot fi reduse considerabil prin bunul sim i
experienele altor cercettori.


2.3.1. Principii n elaborarea chestionarului

Un chestionar bun este acela care ndeplinete obiectivele cercetrii (n figura 2.3.1 este
prezentat schema elaborrii unui astfel de instrument). Sondajele trebuie construite dup
specificul scopurilor cercetrii i reprezint mult mai mult dect o colecie de ntrebri
neambigue. Exist foarte multe constrngeri asupra numrului, ordinii i formei ntrebrilor n
funcie de metoda de culegere a informaiilor. Dorina i abilitatea respondenilor de a rspunde,
ct i formularea i ordinea ntrebrilor, influeneaz formatul final al chestionarului.

2
Isaic Maniu Al., 2001, Tecnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 193.
3
Isaic Maniu Al., op.cit. pg. 194
20


Figura 2.3.1. Schema elaborrii unui chestionar

Pai logici de urmat pentru a realiza un chestionar bun

Planificarea a ceea ce se dorete a fi msurat
Formularea ntrebrilor astfel nct s faciliteze obinerea informaiilor
Hotrrea asupra ordinii i formulrii ntrebrilor i a aranjrii n pagin a
chestionarului
Testarea chestionarului, utiliznd un eantion de volum mic, pentru a evita omisiunile
i ambiguitatea
Corectarea problemelor (i o nou pretestare, dac este necesar)

Principii generale pentru ntocmirea chestionarului

Lungimea chestionarului - trebuie evitat tendina mririi numrului de ntrebri.
Dac chestionarul este prea lung constituie o surs de oboseal si plictiseal att pentru
operator ct i pentru respondent. Acest lucru va determina creterea proporiei non-
rspunsurilor ce vor afecta reprezentativitatea eantionului. Pe de alt parte, un
chestionar prea scurt va lsa unele aspecte nelmurite n legtur cu obiectivele
propuse.
Evitarea acelor ntrebri la care respondenii s nu fie n msur s dea
rspunsuri utilizabile orice chestionar presupune existena unui dialog. Se impune
deci redactarea ntrebrilor intr-un limbaj adecvat populaiei creia ne adresm.
Succesiunea ntrebrilor ordinea ntrebrilor n chestionar poate influena
rspunsurile celor chestionai. n stabilirea ordinii ntrebrilor trebuie respectate
urmtoarele reguli (vezi figura 2.3.2):

succesiunea logic a ntrebrilor ce decurge din problematica abordat (organizarea
chestionarelor pe module) astfel nct s se poat rspunde cu uurin;
rspunsurile la o ntrebare s nu fie influenate de desfurarea anterioar a interviului.
ntrebrile de nceput trebuie s creasc interesul respondentului de a participa la
procesul intervievrii strnind curiozitatea astfel nct s justifice timpul i efortul
necesar participrii la interviu.
Natura exact a ntrebrilor de nceput depinde de metoda de intervievare
Interviul fa n fa sau prin telefon - scop: realizarea legturii operator respondent.
Tonul trebuie s fie prietenos i s prezinte interes i curiozitate din partea operatorului
(similar conversaiei dintre dou persoane care abia sau cunoscut).
21

Cererea de informaii demografice i economice la nceputul unui chestionar poate
sugera imaginea unui document oficial iar respondentul s nu fie motivat n a ncepe s
l completeze.
Restul chestionarului se orienteaz spre sarcinile corespunztoare studiului.
ntrebrile de la mijloc sunt concentrate pe informaiile necesare n conformitate cu
obiectivele fixate. Aici se pot plasa i ntrebrile de atitudine, preferine i opinii.
ntrebrile delicate ar trebui plasate la mijlocul sau la sfritul chestionarului, dup ce
s-a stabilit relaia i interesul. Nivelul de sociabilitate poate minimiza jena i rezistena
la rspuns



Figura 2.3.2. Succesiunea ntrebrilor ntr-un chestionar


Un chestionar bine ntocmit reprezint cheia succesului unui sondaj. Dac chestionarul
prezint deficiene, informaiile obinute pot fi incomplete, fcnd imposibil o analiz
complex. Nicio corectare posterioar nu poate remedia o astfel de situaie.
22



2.3.2. Tipuri de ntrebri utilizate


La aceste ntrebri respondentul este rugat s aleag o variant sau mai multe dintr-o
list, s realizeze o ierarhie sau s dea o valoare n catul variabilelor numerice


Avantaje
gama variat de rspunsuri ce poate fi obinut
lipsa influenei asupra ntrebrilor din cadrul categoriilor prespecificate
respondenii consider asta adesea drept libertate, dup cum se poate vedea din frecvena
surprinztoare cu care oamenii noteaz comentarii pe marginea sondajelor prin pot
atunci cnd consider c sentimentele lor nu sunt descrise corect de categoriile de rspuns.

Dezavantaje
variabilitatea n ceea ce privete claritatea i profunzimea rspunsurilor depinde ntr-o
mare msur de:
fluena respondentului ntr-o anumit situaie a interviului
dorina de a compune un rspuns scris ntr-un sondaj prin pot
abilitatea personal sau telefonic a intervievatorului de a nregistra verbatime repede
sau de a sumariza rapid

23





Tipul
ntrebrii
Avantaje Dezavantaje
nchise
- uurina completrii chestionarului
- precizarea coninutului ntrebrii
- necesit timp scurt pentru rspuns
- uniformitatea nelegerii ntrebrilor
i a nregistrrii rspunsurilor
- uurina codificrii i evitarea erorilor
n realizarea acesteia
- uureaz munca operatorilor
- rapiditatea i uurina prelucrrii
- permite compararea grupurilor
- faciliteaz efectuarea testelor de
semnificaie
- pierderea spontaneitii rspunsurilor
- limiteaz cmpul opiunilor celor
intervievai
- induce o ordine de preferin prin
ordinea nscrierii variantelor n
chestionar
- sporete artificial frecvena
rspunsurilor nu tiu/nu rspund
Deschise
- spontaneitatea rspunsurilor
- indic fidel nivelul cunotinelor
- subiectului asupra problemei
investigate
- indic elementele crora subiectul le
acord cea mai mare importan
- evit consecinele efectelor de format
specifice ntrebrilor nchise (prin
limitarea i ordonarea rspunsurilor)
- lungete timpul de completare a
chestionarului
- cer un efort suplimentar
respondentului
- rata de non-rspuns este mai mare
dect la ntrebrile nchise
- sunt foarte dificil de codificat i
analizat;nu ofer nici o informaie
respondenilor despre tipul de
rspuns ateptat de la ei

24


ntrebri factologice vizeaz situaii ce caracterizeaz subiecii
furnizeaz informaii ce ar putea fi obinute i prin metoda observaiei dac aceasta n-
ar presupune eforturi prea mari
n cazul ntrebrilor factologice de clasificare sau identificare, informaiile permit
identificarea caracteristicilor diferitelor grupuri de respondenti.
lsate de obicei la sfritul chestionarului
excepie: sondajul pe cote (ntrebrile factologice ce formeaz criteriile de cot
vor fi puse la nceputul chestionarului pentru a vedea dac persoana
corespunde sau nu criteriilor de formare a eantionului)
ntrebri de opinie sau atitudine vizeaz aspecte ce in de universul interior al
individului (prerile, ateptrile, evalurile, ataamentul fa de valori, explicaiile
fenomenelor din jur, comportament etc.)
ntrebrile de cunotine au un specific foarte clar i au ca scop caracterizarea
nivelului de cunotine al subiectului
pot fi utilizate i ca ntrebri de control, validnd sinceritatea si capabilitatea
subiectului
ntrebri filtru permit bifurcarea succesiunii ntrebrilor n chestionar printr-un salt
ctre o alt zon de continuitate n interviu.



2.3.3. Tipuri de scale utilizate si caracteristicile acestora
Scala Variabila Proprieti Operaii permise
nominal calitativ Echivalena ntre
treptele scalei
Frecvene absolute i relative, modul,
coeficient de asociere, testul _
2

ordinal calitativ Ierarhizare ntre
treptele scalei
n plus: cuartile, coeficienii de corelaie
a rangurilor
cardinal calitativ Msoar diferenele
dintre treptele scalei
n plus: medii de calcul, dispersii,
corelaia parametric, regresia, testele
parametrice
proporional cantitativ Punctul zero natural Toate operaiile
25


Scala binar cea mai simpl modalitate
Respondentul este solicitat s aleag ntre dou poziii diametral opuse: da sau nu; acord
sau dezacord; adevrat sau fals.

Difereniala semantic scal cu alegere multipl cu 5 sau 7 trepte
Respondentul trebuie s plaseze rspunsul ntr-una din boxele dintre dou atribute bipolare
extreme.

Scala lui Likert tot o scala cu alegere multipl cu 5 trepte
Respondentul este rugat sa-si plaseze atitudinea fa de un subiect ntre acord total, acord,
indiferent, dezacord i dezacord total.
O problem controversat cu privire la difereniala semantic i scala lui Likert este
dac s includem sau nu alternativele de mijloc n chestionare. Experiena a dovedit c
exist o tendin de cumulare a rspunsurilor ctre centrul scalei (de exemplu nici
acord nici dezacord) ceea ce din punct de din punct de vedere analizei reprezint lips
de informaie.

Scala tip rating
Respondentul trebuie s rspund la o ntrebare dnd note de la 0 la 10 (sau 100) .



26




2.4. Ancheta pilot

n comparaie cu multe alte tipuri de cercetare, cercetarea prin sondaj beneficiaz de
testarea n lumea real a chestionarelor i a tehnicilor de administrare a sondajului.
Ancheta pilot este o repetiie general a sondajului propriu-zis absolut necesar n
special n anchetele mari. Volumul i schema anchetei pilot reprezint o problem
dependent de timp, mijloace financiare i mai ales de aspectele ce se cer rezolvate.
4


Informaii ce pot fi furnizate de ancheta pilot:

Cheltuielile i durata probabil a anchetei.
Proporia anticipat de non-rspunsuri
Numrul posibil de refuzuri sau de necontactri poate fi estimat i se poate compara
eficacitatea diferitelor ci de reducere a acestora se poate opta pentru o anumit
metod de culegere a datelor, se pot exclude unele ntrebri sau se poate modifica
ordinea lor.
Gradul de variabilitate al populaiei i structura acesteia n cazul n care nu se cunosc
suficiente informaii necesare caracterizrii populaiei analizate n vederea stabilirii
planului de sondaj ce se poate aplica i calculrii volumului eantionului.
Pretestarea chestionarului cel mai important rol al anchetei pilot. Dup ce a fost
elaborat, chestionarul trebuie aplicat unui eantion de volum redus selectat aleator, de
persoane din populaia supus cercetrii. Astfel se pot detecta deficiene ale
chestionarului ce nu au fost observate, pot fi identificate probleme n zona
introductiv, n alegerea tipurilor de ntrebri, n formularea i succesiunea
ntrebrilor. Se au n vedere urmtoarele probleme:
simplitatea mnuirii chestionarului pe teren
eficacitatea punerii n pagin
claritatea ntrebrilor (un numr prea mare de rspunsuri nu tiu impune
reformularea ntrebrii respective)
accesibilitatea limbajului i claritatea exprimrii

4
Isaic Maniu Al.,2001, Tehnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 181.
27

sensibilitatea chestionarului, mai ales la ntrebrile ce testeaz atitudini. Este
posibil ca dup analiza rspunsurilor la ntrebrile deschise s se recurg la
nchiderea acestora.
analiza chestionarelor completate de prob poate arta dac operatorii au
neles corect instruciunile verificnd eficacitatea lor lor i a ndrumrii
operatorilor.
pretestarea este un pas important n procesul de design al chestionarului. Ea nu
trebuie ignorat.

2.5. Extragerea eantionului

n aceast etap se stabilete planul de sondaj, procedeul de extracie, mrimea
eantionului, estimatorii i precizia lor teoretic.
La organizarea unei cercetri prin sondaj una din problemele principale de rezolvat
este dimensionarea raional a eantionului. Pentru a stabili aceast mrime este necesar un
studiu amnunit al populaiei supuse cercetrii. Nu trebuie ns exagerat nsemntatea
stabilirii unei anumite mrimi a eantionului i nici nu trebuie s se cread c dac o stabilim
cu precizia necesar, reuita sondajului este asigurat.
5

Pentru a putea calcula volumul eantionului trebuie s cunoatem, chiar cu o
aproximaie, dispersia populaiei sau o estimaie a acesteia. n practic ntlnim urmtoarele
situaii:
Se preiau informaii despre gradul de variaie din cercetri anterioare (considernd c
variabilitatea caracteristicii nu s-a modificat semnificativ);
Se organizeaz o cercetare prealabil pentru estimarea dispersiei, a legii de repartiie;
se introduce n relaia de calcul valoarea maxim posibil a dispersiei. Determinarea ei
se face n dou situaii:

o cazul caracteristicilor cantitative:
2
2
max
2
min 2
max
) x (x ) x (x


=
o cazul caracteristicilor calitative (se consider p=0,5):
2
max
=p(1-p)=0,25

n cazul n care avem mai multe variabile auxiliare, o vom alege pe aceea al crei coeficient
de variaie este maxim. Astfel vom avea estimaii cu precizie i siguran n limita admis
pentru toate celelalte caracteristici.
Mrimea eantionului este determinat de:
Modul n care urmeaz s fie analizate rezultatele. Dac se are n vedere analiza pe
subgrupe se va calcula volumul eantionului astfel nct s se obin precizia dorit pe
fiecare subgrup.
Restricii de ordin financiar pornind de la costurile admisibile. Resursele financiare
sunt totdeauna limitate i de multe ori mrimea necesar a eantioanelor nu poate fi
realizat. Recurgem la ingeniozitatea i discernmntul n alegerea acelor subiectecare
pot fi abordate cu resursele disponibile.


5
Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti, p. 235.
28

Ca urmare a problemelor ce apar pe teren, n ncercarea diminurii efectelor acestora,
dup calcularea volumului eantionului teoretic, trebuie s determinm care este volumul
eantionului de pornire astfel nct n final s ajungem la numrul teoretic de uniti selectate.
Situaii posibile:
Imperfeciunea listei utilizate ca baz de sondaj determin existena unor uniti
non-valide (uniti care n-ar trebui s figureze pe list dac aceasta ar corespunde
perfect populaiei studiate). Trebuie estimat aceast proporie astfel nct s putem
determina ct mai precis volumul de pornire al eantionului.
Existena unitilor non-eligibile (de exemplu dac populaia de interes este format
din populaia n vrst de munc iar unitatea de selecie este gospodria, persoanele ce
nu ndeplinesc condiia de vrst sunt considerate non-eligibile).
Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Anticipnd rata
non-rspunsurilor nc din faza de proiectare a sondajului putem redimensionarea
eantionului.

Eantionul de pornire se calculeaz pe baza relaiei:
v e r
th p
P P P
n n
1 1 1
- - - =

n
p
= volumul eantionului de pornire
n
th
= volumul eantionului teoretic
P
r
=proporia de rspuns
P
e
=proporia de eligibilitate
P
v
=proporia de validitate


2.6. Culegerea i verificarea datelor

Odat cu recuperarea chestionarelor se trece la pregtirea acestora n vederea
prelucrrii statistice a datelor.
Verificarea chestionarelor este o operaie obligatorie deoarece, orict de buni ar fi
operatorii, greelile sunt inerente muncii omeneti. Aceast verificare const n urmrirea n
principal a trei aspecte: completitudinea, exactitatea i uniformitatea.

Exactitatea i uniformitatea datelor

Principala modalitate de verificare a exactitii: parcurgerea chestionarului n
ansamblul su ncercnd s se vad dac rspunsurile sunt coerente sau se contrazic.
Este foarte important de tiut dac operatorii sau subiecii au neles n acelai sens ntrebrile
din chestionar. Dac dup parcurgerea unui numr de chestionare observm astfel de deosebiri
de interpretare, rezultate obinute sunt inconsistente.
Aceste probleme pot fi evitate printr-o atent ntocmire a chestionarului, validarea
acestuia printr-o anchet pilot i o instruire riguroas a operatorilor.

2. Completitudinea datelor

Prin centralizrea datelor din chestionarele completate obinem o baz de date.
Golurile din aceast baz de date reprezint nonrspunsuri pariale. Dac lipsesc valorile unui
individ pentru toate ntrebrile din chestionar suntem n situaia unui nonrspuns total.
v e r
th p
P P P
n n
1 1 1
- - - =

29








3.1. Obiectivele unitii de nvare




3.2. Problematica non-rspunsurilor

n urma centralizrii datelor pentru chestionarele completate se va obine baza de date
sub forma tabelului indivizi variabile reprezentat n figura 3.2.1. Informaiile lips reprezint
non-rspunsurile pariale respectiv non-rspunsurile totale.
Nonrspunsurile reprezint o problem de care nici un investigator al colectivitilor
umane nu poate scpa. Dac numrul de non-rspunsuri este mare rezultatele sondajului vor fi
afectate de aceast situaie.

Dup studiul acestei uniti de nvare vei avea cunotine despre:
Importanta sondajului statistic n obinerea informaiilor n timp real
Conceptele de baz utilizate n cercetarea selectiv
Procedeele ce stau la baza formrii eantioanelor
Ce cuprinde aceast unitate de nvare?
3.1. Obiectivele unitii de nvare 3
3.2. Problematica non-rspunsurilor
3.3. Tipuri de erori ntlnite n cercetarea selectiv
3.4.Verificarea reprezentativitii eantionului
3.5. Aplicaii
Unitatea de nvare 3
ASPECTE PRACTICE N REALIZAREA
UNUI SONDAJ STATISTIC

30


Nr.
Chest.
ntrebarea
1 2 j p
1
2

i

n
pornire


Figura 3.2.1. Tabloul indivizi-variabile





Non-rspuns
parial
Non-rspuns
total
31




A.2.1. Imputaia deductiv se refer la acele situaii (rare n practic) n care se poate
stabili valoarea corect printr-o deducie logic. Este vorba de o modalitate determinist de a
corecta datele incorecte sau nevalidate. n acest caz y
ij
=y
ij.


A.2.2. Imputaia predictiv prin mediere global se realizeaz nlocuind non-rspunsul
de pe poziia (i,j) cu media rspunsurilor care au fost obinute la ntrebarea j. n acest caz
avem:
r y
r
i
ij
=
= =
1
j r, ij
y y'
unde r este numrul rspunsurilor valide la ntrebarea j.
Avantajul acestei metode este c nlocuirea valorii lips se face cu o valoare probabil
ceea ce i d un oarecare grad de stabilitate. Dac exist muli respondeni care nu au rspuns
la ntrebarea j vom folosi pentru toi aceeai imputaie. Dezavantaj: se produce o subevaluare
sever a dispersiei estimatorului pentru media sau totalul caracteristicii y
j
.
n cazul n care caracteristica este reprezentat pe o scal de intervale sau proporional
calcularea mediei aritmetice se va nlocui cu o medie de poziie (mediana n cazul unei
variabile ordinale sau modulul pentru variabilele nominale).
32


A.2.3. Imputaia predictiv prin mediere pe clase este similar imputaiei predictive
prin mediere global, cu deosebirea c nu se utilizeaz o singur imputaie, ci mai multe,
corespunztoare unor clase n care a fost mprit mulimea respondenilor. Astfel,
partiionm mulimea respondenilor r la ntrebarea j n q clase disjuncte. Identificm clasa
cruia i aparine individul i construim imputaia:
k y
k
i
ij
=
= =
1
rjt ij
y y'
unde t ia valorile 1,..,q iar k este numrul de respondeni din clasa respectiv.
Utilizarea acestui tip de imputaie reduce gradul de subestimare a dispersiei
estimatorului.
O variant a acestei metode este imputaia calculat ca medie a valorilor vecinilor
valorii lips. Aceast metod poate fi implementat automat i sub softwareurile statistice
specializate, avnd posibilitatea selectrii tipului de medie pe baza creia se va calcula
imputaia i a numrului de vecini ce vor forma baza de calcul.

A.2.4. Imputaia hot-deck. Este utilizat la scar larg deoarece, spre deosebire de
imputaia prin mediere global sau pe clase, evit subestimarea dispersiei estimatorului
6
.
Pentru aplicarea acestei metode se parcurg urmtoarele etape:
Etapa1: fiierul ce conine baza de date este n prealabil sortat dup caracteristicile
demografice, economice sau sociale pe baza crora se poate pune n eviden structura
eantionului.
Etapa 2: Un registru de lucru este iniializat cu valorile aferente cmpurilor cuprinse n
prima nregistrare a unei caracteristici dup care s-a realizat sortarea.
Etapa 3: Fiierul se parcurge nregistrare cu nregistrare si fiecare cmp este identificat i
verificat s nu conin valori lips.
Etapa 4: n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.

A.2.5. Imputaia cold-deck. Este o variaie a metodei hot-deck i const n nlocuirea
valorilor lips cu date provenite din alte surse dect sondajul curent cum ar fi sondaje
anterioare sau recensminte. Este necesar ca populaia sondajului din care se preiau valorile s
fie foarte asemntoare cu cea asupra cruia se realizeaz sondajul n prezent iar modul de
definire i de codificare a variabilelor supuse procesului de imputare s fie identic. Imputaia
cu care se va nlocui valoarea lips este selectat aleator din baza de date aferent sondajului
anterior.
Aceast metod prezint dezavantajul c imputaia utilizat nu provine din sondajul
curent motiv pentru care este mult mai rar utilizat.

A.2.6. Imputaia aleatoare. Const n alegerea aleatoare din mulimea respondenilor
sau dintr-o clas, a unui donator h din mulimea de r respondeni la ntrebarea j. n acest
caz avem:
hj ij
y y' =
Este o variant a imputaiei hot-deck iar principalul avantaj fa de aceasta este c prin
selecia aleatoare a imputaiei nu mai este necesar sortarea fiierului dup diferite
caracteristici.


6
Levy P.S., i Lemeshow S., 2000, Sampling of Populations, Third Edition Ed. J ohn Wiley&Sons New York p.
411.
33

A.2.7. Imputaia obiectiv. La baza acestei metode st generarea unei ecuaii de regresie
pe baza setului de date ce conin nregistrri complete ale variabilei ce urmeaz a fi supuse
procesului de imputare. Ecuaia poate avea urmtoarea form:
k k
x b x b x b b y + + + + = ......
2 2 1 1 0

unde y este variabila ce urmeaz a fi imputat pentru valorile date ale variabilelor x
i
, i=1,,k
corelate cu variabila y.
Imputaiile obinute n aceast manier sunt superioare celor provenite n urma aplicrii
metodelor prezentate anterior, deoarece ea se armonizeaz cu restul nregistrrilor individului
respectiv. Aplicarea acestei metode permite obinerea unui estimator nedeplasat al mediei i
nu subevalueaz dispersia acestuia
7
.




B.1. Reselecia pentru non-respondeni
- metod utilizat pentru tratarea non-rspunsurilor totale
- n funcie de restriciile de timp i de buget, se poate face o reselecie pentru
non-respondeni
- mprim n mod formal populaia de volum N n dou straturi: cel al respondenilor,
de volum N1, i cel al non-respondenilor, de volum N2. Privim situaia ca a unui
sondaj organizat n dou faze. (figura 3.2.2.).


Figura 3.2.2. Organizarea reseleciei pentru non-respondeni

- n prima faz se construiete eantionul E de volum n. Eantionul va conine n
1

respondeni ai subeantionului E1 i n2 non-respondeni ai subeantionului E2.
Variabila aleatoare w1=n1/n este un estimator nedeplasat al lui p1=N1/N (ponderea
respondenilor). Presupunem c parametrul de interes este media Y . Pe baza
subeantionului E
1
putem calcula un estimator asociat primei faze ca in figura 3.2.2.

7
Levy P.S., i Lemeshow S., 2000 , Sampling of Populations, Third Edition Ed. John Wiley&Sons New York p.
412.






Respondeni
N
1

Non-respondeni
N
2

Respondeni
n
1

Non-respondeni
n
2


Faza 1 Faza 2
m
34

- n a doua faz a sondajului formm un eantion E
2
de volum m prin selecie
aleatoare fr revenire din E
2
. Prin eforturile fcute de operatorul de sondaj i prin
eventuale recompensri eantionul va conine doar respondeni. Putem acum calcula
un estimator asociat celei de a doua faze (figura 3.2.2.)
- Estimatorul parametrului Y construit pe baza celor dou faze are forma:
2
2
1
1
y
n
n
y
n
n
y + =
- Metoda reseleciei pentru non-respondeni are avantajul c genereaz un estimator
nedeplasat al parametrului de interes
- Dezavantaj determin o cretere substanial a costului sondajului deoarece cerina
ca n a doua faz s se obin rspunsuri complete impune eforturi organizatorice i
financiare deosebite.

B.2. Metoda post-stratificrii i a calibrrii generalizate

- Utilizarea acestor metode necesit utilizarea unor informaii deteliate privind
repartiiile ncrucisate dup mai multe variabile auxiliare, o dotare tehnic superioar
i un soft specializat i sunt utilizate pentru tratarea non-rspunsurilor totale.


3.3. Tipuri de erori ntlnite n cercetarea selectiv



35







36



37




Figura 3.2.3 Formarea erorilor de acoperire


B.2.1. Erorile efective se pot calcula pentru caracteristicile la care s-au obinut date i dintr-o
observare total
- Considernd c media este indicatorul sintetic cel mai reprezentativ, eroarea efectiv de
sondaj se calculeaz ca diferen ntre media eantionului i media colectivitii totale
- La verificarea reprezentativitii eantionului se pornete de la compararea structurii pe
grupe a colectivitii de selecie cu cea a colectivitii generale, denumit i structur
programat. n cazul n care aceste structuri nu difer cu mai mult de 5% se accept
eantionul ca fiind reprezentativ.
- De cele mai multe ori n cercetarea concret nu se dispune de date cu privire la ntreaga
colectivitate pentru a putea verifica n ce msur media este sau nu reprezentativ. n
acest caz se pot efectua selecii succesive pentru a verifica gradul de stabilitate al mediei
i dispersiei, eroarea efectiv de reprezentativitate calculndu-se astfel:
100 respectiv i
%

= =
x
x x
d x x d
x x

unde x este media mediilor seleciilor.
Verificarea reprezentativitii eantionului se poate realiza comparnd distribuia
populaiei cu cea a eantionului cu ajutorul testelor statistice sau Kolmogorov-Smirnov.
B.2.2. Dei erorile de reprezentativitate ntmpltoare nu pot fi evitate, ele pot fi
calculate cu anticipaie dac sondajul este probabilistic, obinndu-se erorile probabile.
Estimaia parametrilor din populaia general se va putea face pe baza indicatorilor obinui
din prelucrarea datelor de sondaj cu o eroare medie de reprezentativitate care se gsete
ntr-un interval probabilistic. Fiecrui indicator derivat sau sintetic trebuie s i se ataeze i
BAZA DE SONDAJ
POPULAIA INT
Arie neacoperit
Arie acoperit de
baza de sondaj, dar
care nu face parte din
populaia int
38

eroarea sa de reprezentativitate pentru a putea fi generalizat la ntreaga populaie. Modul de
calcul al acestor erori depinde de tipul de sondaj utilizat.
Tocmai posibilitatea unor astfel de calcule i a analizelor respective face din metoda
sondajului un instrument viabil de cercetare.

3.4. Verificarea reprezentativitatii esantionului

nainte de a trece la analiza statistic i la interpretarea rezultatelor este important s
stabilim dac eantioanele sunt sau nu reprezentative pentru populaiile din care au fost
selectate. Dac diferenele dintre parametri cunoscui din populaie fa de valorile
estimatorilor obinui pe baza datelor din sondaj sunt semnificative atunci eantionul nu este
reprezentativ.

Pentru a vedea dac exist diferene semnificative fa de valoarea cunoscut din populaie a
ponderii fetelor fa de cea din n eantion se utilizeaz testul z (eantionul este de volum
normal) pentru compararea proporiei din eantion cu cea din populaie.
Ipotezele testului bilateral sunt: H
0
: x =
0
X i H
1
: = x
0
X .iar valoarea calculat a testului
este:
n
X x
z
c
2
0
o

=
Valoarea calculat luat n valoare absolut se compar cu cea teoretic de 1,96
corespunztoare nivelului de semnificaie ales (o=0,05) i, deoarece este mai mic dect
aceasta se accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
H
0
: w= p i H
1
: p w = .iar valoarea calculat a testului este:
( )
n
p p
p w
z
c


=
1

Pentru o probabilitate de garantare a rezultatelor de 95% cruia i corespunde un nivel de
semnificaie o=0,05 n cazul efecturii unui test bilateral valoarea teoretic este
2
1
o

z =1,96.
Ipotezele testului
2
sunt:
H
0
: f
t
= f
e
i H
1
: f
t
=f
e
unde f
t
reprezint frecvenele teoretice iar f
e
frecvenele empirice.
Frecvenele empirice sunt cele obinute n urma centralizrii datelor din sondaj iar cele
teoretice se calculeaz dup relaia:
n
N
F f
ti ti
= (
ti
F fiind frecvena corespunztoare a grupei
i din populaie).
Valoarea calculat a testului este:
( )

= _
k
1 i
ti
2
ti ei 2
c
f
f f
= Valoarea teoretic pentru un nivel de
semnificaie o=0,05 i numrul de grade de libertate df=k-1=5-1=4 este de 9,49. Deoarece
2
4 ; 05 , 0
2
= =
>
df c o
_ _ se respinge ipoteza nul putnd spune c cele dou distribuii nu concord
i, deci eantionul nu este reprezentativ.

1. Testul Kolmogorov este unul dintre cele mai rspndite teste de concordan a
repartiiilor empirice i teoretice pentru variabile aleatoare continue.
Pentru efectuarea testului este necesar alctuirea claselor i stabilirea frecvenelor absolute
empirice i teoretice (n funcie de repartiia testat). Ulterior se cumuleaz aceste frecvene
cresctor i prin raportarea lor la total se obin funciile de repartiie empirice (Fn(x)) i
teoretice (F(z)).
39

Se calculeaz pe clase diferena lor i se ia diferena maxim n valoare absolut. Pe baza ei se
obine statistica a testului Kolmogorov astfel: ) z ( F ) x ( Fn max n
c
= , unde n este
volumul eantionului.
Valoarea calculat
c
se compar cu valoarea teoretic

tabelat n funcie de nivelul de
semnificaie. Unui =0,05 i corespunde

=1,36. Dac <



repartiia empiric este n
concordan cu cea teoretic.
Testul Kolmogorov Smirnov este o extindere a testului Kolmogorov pentru cazul verificrii
concordanei a dou repartiii empirice. Notnd cele dou variabile aleatoare cu x i y se
calculeaz o valoare
c
dup relaia urmtoare: .
n n
n n
) y ( F ) x ( F max
2 1
2 1
c
+
=

;
unde F(x) i F(y) reprezint funciile repartiiilor empirice ale celor dou variabile.
Se compar apoi valoarea calculat cu cea teoretic. Dac
c
<

repartiiile sunt n
concordan.


3.5. Aplicaii

Aplicaie 1

n urma centralizrii rspunsurilor obinute dintr-un sondaj n rndul studenilor unei
universiti au rezultat datele prezentate n tabelul 3.5.1
Definirea variabilelor:
STRAT. Sondajul s-a realizat dup un plan stratificatastfel: 1 anul I, 2 anul II, 3 anul
III i 4 anulIV.
SEX. 1 feminin, 2 masculin.
MEDIE. Este variabil numeric i reprezint media obinut n sesiunea din iarn.
NRORE. Este variabil numeric i reprezint numrul de ore de studiu pe sptmn
n afara sesiunii.
ACORD. Este variabila obinut n urma centralizrii rspunsurilor la ntrebarea: n
ce msur suntei de acord cu modificrile survenite n nvmntul superior?.
Codurile reprezint: 1 dezacord total, 2 dezacord, 3 indiferent, 4 acord i 5 acord total.

Se cere:
1. S se nlocuiasc valorile lips ale variabilei NRORE folosind imputaia predictiv prin
mediere global, imputaia predictiv prin mediere pe clase i imputaia obiectiv.
2. S se nlocuiasc valorile lips ale variabilei ACORD folosind imputaia hot-deck.


Rezolvare

1. Notm cu y
ij
rspunsul pe care l d individului i din eantionul E la ntrebarea j (i=1,..,n,
j=1,... ,p). Concentrndu-ne asupra individul i din eantion constatm c vectorului (y
i1
,
...., y
ip
), format din rspunsurile la ntrebrile din chestionar, i lipsesc unele componente
(non-rspunsurile). Fiecare poziie de coordonate (i,j) trebuie tratat separat, prin crearea
unei valori y
ij
numit valoare atribuit sau imputaie.

40

Imputaia predictiv prin mediere global

Calculm media rspunsurilor obinute la ntrebarea j:
17 . 5
23
119
y y'
1
j r, ij
= = = =

=
r y
r
i
ij

unde r este numrul rspunsurilor valide la ntrebarea j.
Toate cele 7 valori lips se vor nlocui cu 5.17 (vezi tabelul 3.5.2 variabila NROREIG).
Avantajul acestei metode este c nlocuirea valorii lips se face cu o valoare probabil ceea ce
i d un oarecare grad de stabilitate. Dac exist muli respondeni care nu au rspuns la
ntrebarea j vom folosi pentru toi aceeai imputaie. Este clar c se produce o subevaluare
sever a dispersiei estimatorului pentru media sau totalul caracteristicii y
j
.

Tabel 3.5.1
Nr. STRAT SEX MEDIE NRORE ACORD
1 1 1 7 3 2
2 1 1 8.33 4 2
3 1 1 6.67 3 3
4 1 1 9.67 10 4
5 1 2 6.33 2
6 1 2 7.8 4 1
7 2 1 9.67 11 2
8 2 1 8 2
9 2 1 7.2 3
10 2 1 8.8 6 4
11 2 1 6.33 4 5
12 2 2 7 4 1
13 2 2 8.8 6
14 2 2 8.2 5 1
15 3 1 7.9 5 3
16 3 1 8.8 4
17 3 1 6.67
18 3 1 9.33 9 4
19 3 1 8.33 6 2
20 3 1 7.7 5
21 3 2 8.2 5 2
22 3 2 5.67
23 3 2 9.2 9 2
24 4 1 9.33 2
25 4 1 8.9 7 3
26 4 1 7.8 6
27 4 1 8.2 7 2
28 4 2 8.9
29 4 2 7.9 5 1
30 4 2 7.5 4 2

41

Imputaia predictiv prin mediere clase

Partiionm mulimea respondenilor r la ntrebarea j n 4 clase disjuncte, cate una pentru
fiecare strat. Identificm clasa cruia i aparine individul i construim
imputaia: k y
k
i
ij
=
= =
1
rjt ij
y y'
unde t ia valorile 1,..,4 iar k este numrul de respondeni din clasa respectiv,
Deoarece exist patru straturi se vor calcula 4 imputaii.
6 . 4
5
23
y y'
1
rj1 1ij
= = = =

=
k y
k
i
ij
57 . 4
7
32
y y'
1
rj2 2ij
= = = =

=
k y
k
i
ij

17 . 6
6
37
y y'
1
rj3 3ij
= = = =

=
k y
k
i
ij
4 . 5
5
27
y y'
1
rj4 42ij
= = = =

=
k y
k
i
ij

n tabelul 3.5.2 variabila NROREIC este obinut n urma aplicrii acestei metode. Utilizarea
acestui tip de imputaie reduce gradul de subestimare a dispersiei estimatorului.

Tabel 3.5.2
Nr. STRAT SEX MEDIE NRORE NROREIG NROREIC NROREIO
1 1 1 6 2 2 2 2
2 1 1 8.33 4 4 4 4
3 1 1 5.67 3 3 3 3
4 1 1 9.67 10 10 10 10
5 1 2 5.33 5.17 4.6 0.49
6 1 2 7.8 4 4 4 4
7 2 1 9.67 9 9 9 9
8 2 1 8 5.17 4.57 5.19
9 2 1 7.2 3 3 3 3
10 2 1 8.8 5 5 5 5
11 2 1 6.33 2 2 2 2
12 2 2 6.33 3 3 3 3
13 2 2 8.8 5 5 5 5
14 2 2 8.2 5 5 5 5
15 3 1 7.9 5 5 5 5
16 3 1 8.8 5.17 6.17 6.60
17 3 1 5.67 5.17 6.17 1.09
18 3 1 9.33 8 8 8 8
19 3 1 8.33 6 6 6 6
20 3 1 7.7 4 4 4 4
21 3 2 8.2 5 5 5 5
22 3 2 5.67 5.17 6.17 1.09
23 3 2 9.2 9 9 9 9
24 4 1 9.33 5.17 5.4 7.53
25 4 1 8.9 7 7 7 7
26 4 1 7.8 6 6 6 6
27 4 1 8.2 7 7 7 7
28 4 2 8.9 5.17 5.4 6.78
29 4 2 7.9 4 4 4 4
30 4 2 7.5 3 3 3 3

42

Imputaia obiectiv

Pentru setul de date ce nu conine valori lips pentru variabila NRORE se stabilete forma
ecuaiei de regresie ce are ca variabil independent MEDIA. n figura 3.5.1 este reprezentat
grafic legtura dintre MEDIE i NRORE.




Fig. 3.5.1 Nr. ore studiu n funcie de media obinut n sesiunea din iarn



Pe baza ecuaiei de regresie y = 1.761x - 8.8953 se determin imputaiile cu care se vor
nlocui non-rspunsurile variabilei NRORE (vezi tabelul 3.5.2 variabila NROREIO).
De exemplu pentru prima valoare lipsa a Variabilei NRORE, MEDIA este 5.33. Introducem
aceasta valuare in ecuaia de regresie i obinemvaloarea imputaiei obiective 0.49.

2. Imputaia hot-deck.

Pentru aplicarea acestei metode se parcurg urmtoarele etape:
Etapa1. Fiierul ce conine baza de date este n prealabil sortat dup caracteristicile
demografice, economice sau sociale pe baza crora se poate pune n eviden structura
eantionului. Deoarece n tabelul 3.1 datele sunt deja sortate dup STRAT i SEX se poate
trece la etapa urmtoare.
Etapa 2. Un registru de lucru este iniializat cu valorile aferente cmpurilor cuprinse n prima
nregistrare a unei caracteristici dup care s-a realizat sortarea. n tabelul 3.5.3 este prezentat
registrul de lucru constituit.
Tabel 3.5.3
STRAT SEX ACORD
1 1 2
1 2 2
2 1 2
2 2 1
3 1 3
3 2 2
4 1 2
4 2 1
43


Etapa 3. Fiierul (tabelul 3.5.1) se parcurge nregistrare cu nregistrare i fiecare cmp este
identificat i verificat s nu conin valori lips.
Etapa 4 . n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.
Rezultatul implementrii acestei metode este prezentat n tabelul 3.5.4.
De exemplu nregistrarea cu numarul 9 conine valoare lips pentru variabila ACORD.
nregistrarea face parte din STRAT 2 iar variabila SEX este 1-masculin. Valoarea
corespunztoare din registru este 2. nlocuim cu aceast valoare nonrspunsul parial.

Tabelul 3.5.4
Nr. STRAT SEX ACORD ACORDM
1 1 1 2 2
2 1 1 2 2
3 1 1 3 3
4 1 1 4 4
5 1 2 2 2
6 1 2 1 1
7 2 1 2 2
8 2 1 2 2
9 2 1 2
10 2 1 4 4
11 2 1 5 5
12 2 2 1 1
13 2 2 1
14 2 2 1 1
15 3 1 3 3
16 3 1 4 4
17 3 1 3
18 3 1 4 4
19 3 1 2 2
20 3 1
21 3 2 2 2
22 3 2 2
23 3 2 2 2
24 4 1 2 2
25 4 1 3 3
26 4 1 2
27 4 1 2 2
28 4 2 1
29 4 2 1 1
30 4 2 2 2

Aplicaie 2

S-a realizat un sondaj n rndul studenilor unei universiti partiulare pe un eantion de 90
persoane. n urma centralizrii datelor pentru variabilele auxiliare SEX i MEDIE (media
ultimei sesiuni) au rezultat urmtoarele informaii: ponderea fetelor n eantion este de 67%
iar nota medie 7.2 cu o dispersie de 1.42.
44

Se cere s se verifice reprezentativitatea eantionului stiind c ponderea fetelor n populaie
este 65% iar nota medie a studenilor este de 6.98 iar probabilitatea de garantare a rezultatelor
este de 95%.

Rezolvare

Pentru a vedea dac exist diferene semnificative fa de valoarea cunoscut din populaie a
ponderii fetelor fa de cea din n eantion se utilizeaz testul z (eantionul este de volum
normal) pentru compararea proporiei din eantion cu cea din populaie.
Ipotezele testului bilateral sunt: H
0
: w= p i H
1
: p w = .
Regiunea critic n cazul testului bilateral este dat de relaia: W:
( )
2
1
1
o

>


z
n p p
p w
iar
valoarea calculat a testului este:
( )
n
p p
p w
z
c


=
1
=0.398
Pentru o probabilitate de garantare a rezultatelor de 95% cruia i corespunde un nivel de
semnificaie o=0.05 n cazul efecturii unui test bilateral valoarea teoretic este
2
1
o

z =1,96.
Deoarece valoarea calculat a testului luat n modul este mai mic dect valoarea teoretic se
accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
Pornind de la variabila auxiliar MEDIA, pentru verificarea reprezentativitii se utilizeaz
testul z pentru compararea mediei unui eantion cu cea a populaiei.
Ipotezele testului bilateral sunt: H
0
: x =
0
X i H
1
: = x
0
X .
Regiunea critic n cazul testului bilateral este dat de relaia: W:
2
1 2
0
o
o

>

z
n
X x
iar valoarea
calculat a testului este:
n
X x
z
c
2
0
o

= =1.75
Valoarea calculat luat n valoare absolut se compar cu cea teoretic de 1.96
corespunztoare nivelului de semnificaie ales (o=0.05) i, deoarece este mai mic dect
aceasta se accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.

Problema 2

n rndul populaiei de 160000 persoane (cu vrsta peste 15 ani) dintr-o localitate s-a realizat
un sondaj pe un eantion de 800 persoane privind atitudinea fa de. n tabelul 3.5.5 este
prezentat structura eantionului i structura populaiei pe grupe de vrst.

Tabel 3.5.5
Grupe de vrst Structura populaiei (%) Structura eantionului (%)
15-24 16 19
25-34 20 23
35-44 24 20
45-54 21 17
peste 55 19 21
Total 100 100
45


Se cere:
1. S se verifice reprezentativitatea eantionului utiliznd testul _
2
pentru un nivel de
semnificaie o=0.05.
2. S se verifice reprezentativitatea eantionului utiliznd testul Kolmogorov-Smirnov pentru
un nivel de semnificaie o=0.05.

Rezolvare

1. Atunci cnd se cunoate forma distribuia variabilei n populaie pentru verificarea
reprezentativitii eantionului se poate utiliza unul din testele de concordan.

Tabelul 3.5.6
Grupe de
vrst
Structura
populaiei
(%)
Structura
eantionul
ui
(%)
Numr
salariai
n populaie
(
ti
F )
Numr
salariai
n eantion
(f
ei
)
f
ti

( )
ti
ti ei
f
f f
2


15-24 16 19 25600 152 128 4.50
25-34 20 23 32000 184 160 3.60
35-44 24 20 38400 160 192 5.33
45-54 21 17 33600 136 168 6.10
peste 55 19 21 30400 168 152 1.68
Total 100 100 160000 800 800 21.21

Ipotezele testului _
2
sunt:
H
0
: f
t
= f
e
i H
1
: f
t
=f
e
unde f
t
reprezint frecvenele teoretice iar f
e
frecvenele empirice.
Frecvenele empirice sunt cele obinute n urma centralizrii datelor din sondaj iar cele
teoretice se calculeaz dup relaia:
n
N
F f
ti ti
= (
ti
F fiind frecvena corespunztoare a grupei
i din populaie). Calculele necesare sunt sistematizate n tabelul 3.5.6.
Valoarea calculat a testului este:
( )

= _
k
1 i
ti
2
ti ei 2
c
f
f f
=21.21
Valoarea teoretic pentru un nivel de semnificaie o=0,05 i numrul de grade de libertate
df=k-1=5-1=4 este de 9.49. Deoarece
4 ; 05 , 0
2 2
= =
>
df
c
o
_ _ se respinge ipoteza nul putnd
spune c cele dou distribuii nu concord i, deci eantionul nu este reprezentativ.

2. Calculele necesare pentru efectuarea testului Kolmogorov sunt sistematizate n tabelul
3.5.7. Considerm variabilele x i y vrsta n totalul populaiei i respectiv n eantion.

Tabel 3.5.7
Grupe de
vrst
f
ei
f
ti
f
ei cumulat
f
ti cumulat

f*
ei cumulat
F(x)
f
*

ti cumulat
F(y)
d
i
15-24 152 128 152 128 0.19 0.16 0.03
25-34 184 160 336 288 0.42 0.36 0.06
35-44 160 192 496 480 0.62 0.6 0.02
45-54 136 168 632 648 0.79 0.81 0.02
peste 55 168 152 800 800 1 1 0
Total 800 800
46


n relaia de calcul a valorii teoretice
c
considerm n
1
volumul populaiei

N iar n
2
volumul
eantionului n. Relaia devine: .
n N
Nn
) y ( F ) x ( F max
c
+
=
n cazul n care volumul populaiei este mare n raport cu eantionul (n<0.05N)
c
se poate
calcula dup relaia: . n ) y ( F ) x ( F max
c
= =1.69.

=1,36. Deoarece
c
>

repartiia empiric nu este n concordan cu cea teoretic iar
eantionul nu este reprezentativ ceea ce va duce la obinerea unor estimatori deplasai.

47








4.1. Obiective



4.2. Sondajul simplu aleator

Sondajul simplu aleator este considerat o metod de baz n teoria sondajului. El se
poate realiza ntr-o populaie foarte omogen (coeficient de variaie sub 17%), unitile
cuprinse n eantion fiind selectate prin procedee aleatoare cu probabiliti nenule cunoscute.
Cu toate c este rareori folosit n practic el este foarte important pentru nelegerea
Dup studiul acestei uniti de nvare vei avea cunotine despre:
Alegerea unui plan de sondaj simplu n funcie de caracteristicile populaiei
Estimarea parametrilor de interes pe baza valorilor de sondaj n funcie de
planul de sondaj simplu utilizat
Ce cuprinde aceast unitate de nvare?
4.1. Obiectivele unitii de nvare 4
4.2. Sondajul simplu aleator
4.2.1. Sondajul simplu aleator cu probabiliti egale
4.2.2. Sondajul de volum redus
4.3. Sondajul stratificat
4.4. Sondajul de serii
4.5. Aplicaii
Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE
48

noiunilor fundamentale i nsuirea tehnicii sondajelor. Totodat sondajul simplu aleator
st la baza sondajelor complexe utilizate n practic.
Sondajul simplu aleator se poate efectua n dou variante: sondajul simplu aleator cu
probabiliti egale i sondaj simplu aleator cu probabiliti inegale.
Sondajul simplu aleator cu probabiliti egale este acel sondaj n care fiecare unitate
are aceeai probabilitate de a face parte din eantion iar probabilitile sunt independente.
Acest plan de sondaj este metoda de baz a sondajelor aleatoare din care decurg conceptele
fundamentale i formulele de calcul al erorilor specifice sondajului. Tehnica sondajului
simplu aleator este vizualizat n figura urmtoare:


Figura 4.2.1 Schema de realizare a sondajului simplu aleator

Exist dou tipuri de sondaj cu probabiliti egale: sondajul simplu aleator cu
probabiliti egale cu revenire cunoscut n literatura de specialitate ca plan de eantionare cu
probabiliti egale repetat (cu revenire) SAR i sondajul simplu aleator cu probabiliti
egale fr revenire cunoscut sub numele: plan de eantionare cu probabiliti egale nerepetat
(fr revenire)SAFR.

4.2.1. Sondajul simplu aleator cu probabiliti egale

Sondajul simplu aleator cu probabiliti egale cu revenire
Fie U populaia supus sondajului: U ={ U
i
| i=1,,N }
n cazul acestui tip de sondaj numrul tuturor eantioanelor posibile este egal cu N
n
,
iar probabilitatea fiecrei uniti din populaie de a intra n eantion la fiecare extragere este:
p
ik
=1/N unde i=1,,N iar k=1,,n.
Probabilitatea ca o unitate U
i
e U s figureze n eantion o notm cu
i
unde:
N
n
p
n
k
ik i
= =

=1


Populaie
Eantion
49

Calculul erorilor de sondaj n vederea estimrii parametrilor populaiei se bazeaz pe
principiile teoriei probabilitilor i ale statisticii matematice.
Pentru un volum de eantion n se pot obine N
n
eantioane extrase succesiv din aceeai
populaie fiecare avnd o medie de sondaj. n acest proces de formare a mediilor de sondaj
fiecare medie poate s aib diferite frecvene de apariie. Se confirm astfel c media de
sondaj
i
x este o variabil aleatoare creia i se poate stabili legea de distribuie. Respectnd
cerinele legii numerelor mari n teoria sondajului se demonstreaz c dac volumul
eantionului este suficient de mare media de sondaj urmeaz o distribuie normal a crei
medie este chiar media populaiei totale:
X ) x M(
i
= iar ( ) 0 X x
n
1 i
i
=

=

Dispersia mediilor de sondaj n jurul mediei din populaia total este egal cu raportul
dintre dispersia din populaia total i volumul eantioanelor de aceeai mrime n:
n

2
2
x
i
=

Mrimea abaterii medii ptratice a mediilor de sondaj de la media populaiei reprezint
eroarea medie de reprezentativitate i se calculeaz dup relaia:
n

i
x
=
Dac nu se cunoate valoarea dispersiei populaiei totale ea este estimat cu ajutorul
dispersiei de sondaj S
2
. n acest caz eroarea medie de reprezentativitate se calculeaz dup
relaia:
n
S

i
x
=
n practic ns nu procedm la extragerea tuturor eantioanelor posibile i ne
mulumim cu un singur eantion construit cu respectarea ct mai riguroas a unor anumite
condiii. n acest caz, media eantionului se poate abate mai mult sau mai puin de la media
populaiei, fapt ce determin necesitatea indicrii unui interval de ncredere despre care se
poate afirma cu o probabilitate sau siguran cunoscut c acoper valoarea mediei din
colectivitatea total. Limitele intervalului de ncredere, cea minim
iinf
i cea maxim
sup
se
calculeaz n funcie de datele de sondaj x
1
, x
2
, , x
n
astfel nct, cu un grad mare de
siguran, garantat de probabilitatea 1- pentru parametrul populaiei, se ndeplinete relaia:
( ) ( ) z X P o u u = = < < 1
sup inf

Intervalul ( )
sup inf
,u u reprezint intervalul de ncredere i definete precizia estimaiei.
Probabilitatea (1- ) caracterizeaz sigurana cu care se afirm c intervalul de ncredere
cuprinde valoarea parametrului populaiei. Cu ct intervalul ( )
sup inf
,u u este mai mic i
probabilitatea (1- ) mai mare cu att avem o estimaie mai precis cu privire la
valoarea parametrului. Intervalul ( )
sup inf
,u u este o mrime aleatoare, limitele sale fiind
50

dependente de datele fiecrei selecii, motiv pentru care, pentru o aceeai populaie, valorile
limitelor variaz de la o selecie la alta att ca mrime ct i ca poziie.
La construirea estimaiilor, un rol important, pe lng nivelul de siguran, l joac
mrimea intervalului de ncredere. Cele dou mrimi se afl ntr-o relaie de coresponden
bine determinat. Dac eroarea de sondaj se distribuie dup legea normal atunci erorile egale
n valoare absolut cu probabilitile de apariie i pentru acelai volum al eantionului
probabilistic ce alctuiesc intervale ( )
sup inf
,u u se pot separa n dou pri egale iar jumtatea
intervalului este eroarea limit admis.
Precizia estimaiei, probabilitatea de ncredere i intervalul de ncredere se discut pe
baza inegalitii lui Cebrev, prin care se demonstreaz c media de sondaj x pentru un
volum mare al eantionului converge n probabilitate ctre
0
X media populaiei, ceea ce
semnific faptul c x

este un estimator corect al mediei populaiei (nedeplasat, consistent i
eficient). Sigurana estimrii este dat de probabilitatea cu care este ndeplinit inegalitatea:
( ) mic de suficient 0, unde z > = < o | o X x .
Aceast probabilitate este dat dinainte i este foarte apropiat de unitate.
( ) ( ) z | o = < X x P sau ( ) ( ) z | o o = + < < x X x P (4. 1.1.)
Intervalul ( ) o o + x x , care acoper parametrul X cu o probabilitate ( ) z | se
numete interval de ncredere . n vederea stabilirii expresiei intervalului de ncredere pentru
media X trebuie definit variabila de sondaj
x
X x
z
o

= (
x
o este eroarea medie de
reprezentativitate). Din relaia 4.1.1 avem:
( ) ( )
|
|
.
|

\
|
=
|
|
.
|

\
|
<

<
< < = <
x x x x
X x
P
X x P X x P
o
o
|
o
o
o o
o
o o o
2


x x
x
z unde A = = = o o
o
o
z reprezint eroarea limit maxim admis.
Rezult c eroarea limit maxim admis este o mrime variabil ce depinde de
argumentul funciei de probabilitate (z) i de eroarea medie de reprezentativitate. Ea poate fi
redus fie prin mrirea volumului eantionului (valoare ce intr n calculul erorii medii de
reprezentativitate) fie prin modificarea probabilitii de garantare a rezultatelor.
n orice plan de cercetare prin sondaj, pentru a rspunde obiectivelor propuse sunt
necesare att caracteristici cantitative ct i calitative. n acest caz ne intereseaz dac o
unitate a eantionului posed sau nu o caracteristic. n aceast situaie calculul erorii medii de
reprezentativitate se realizeaz dup relaia:
n
w w
n
p p
w
) 1 ( ) 1 (
~

= o
(unde p este media caracteristicii binare n populaie iar w reprezint estimaia acesteia din
eantion).
51

n mod corespunztor, eroarea limit maxim admis se calculeaz astfel:
w w
o = A z

Dei determinarea volumului de eantion n realitate precede calculul erorilor necesare
estimaiilor nu putem aborda aceast tem fr cunoaterea acestor noiuni.
Dup studiul amnunit al populaiei supuse cercetrii se va alege cu mult grij
caracteristica n raport cu care se calculeaz volumul eantionului.
Pornind de la formula erorii limit maxim admis, pentru un eantion de volum mare
avem:
2
2 2
2
2 2

x x
x
S z z
n
n
z
A

~
A

= = A
o o

Dac abaterea medie ptratic a caracteristicii X
i
n populaia general presupus
normal distribuit nu este cunoscut, atunci se extrage n prealabil un eantion de volum redus
pe baza cruia se estimeaz cu ajutorul dispersiei de sondaj S
2
dispersia necunoscut.
n cazul n care volumul eantionului se calculeaz pornind de la o caracteristic
alternativ relaia de calcul a volumului eantionului este:
2
2 2
2
2 2
) 1 ( ) 1 (
w w
w w z p p z
n
A

~
A

=
unde p este proporia celor care posed caracteristica n populaia total. n cazul n
care nu se cunoate aceast valoare i nu se poate calcula variaia caracteristicii n populaia
total aceasta se estimeaz cu dispersia din eantion calculat cu ajutorul proporiei celor care
posed caracteristica n eantion (w).

Sondajul simplu aleator cu probabiliti egale fr revenire

Sondajul simplu aleator cu probabiliti egale fr revenire este acel sondaj n care o
unitate odat selecionat nu mai particip la o nou extragere.
Numrul tuturor eantioanelor posibile n acest caz este egal cu
n
N
C . Probabilitatea
fiecrei uniti de a intra n eantion crete de la o extragere la alta astfel:
N 1, i unde
) 1 (
1
;.....
1
1
;
1
2 1
=

=

= =
n N
p
N
p
N
p
in i i

Probabilitatea ca o unitate U
i
e U s figureze n eantion o notm cu
i
i este dat de
relaia:
N
n
k N N
k
N
n
n N N N
p
n
k
n
k
ik i
>

+ =

+ +

+ = =

= = 1 1
)) 1 ( (
1
) 1 (
1
....
1
1 1
tinde la limita spre
N
n
.
Pentru a aproxima dispersia mediilor de sondaj necesar calculrii erorii medii de
reprezentativitate se aplic un coeficient de corecie
1

N
n N
. Deoarece, de cele mai multe ori,
52

volumul populaiilor studiate este mare, nu sesizm diferene ntre a mpri la N-1 sau la N.
n acest context, pentru simplificarea calculului considerm coeficientul de corecie |
.
|

\
|

N
n
1 .
|
.
|

\
|
=
N
n
1
n

2
2
x
iar
|
.
|

\
|
~ |
.
|

\
|
=
N
n
N
n
1
n
S
1
n

2 2
x


Eroarea limit maxim admisa este:
|
.
|

\
|
~ |
.
|

\
|
= = A
N
n
z
N
n
z
x x
1
n
S
1
n

z
2 2
o


n cazul n care nu se cunoate dispersia populaiei totale o vom estima cu ajutorul
dispersiei de sondaj S
2
.
Dac variabila pe care dorim s o analizam este calitativ, eroarea medie de
reprezentativitate i eroarea limit se vor calcula dup relaiile:
|
.
|

\
|

~ |
.
|

\
|

=
N
n
n
w w
N
n
n
p p
w
1
) 1 (
1
) 1 (
o
|
.
|

\
|
~ |
.
|

\
|
= = A
N
n
z
N
n
z
w w
1
n
w) - w(1
1
n
p) - p(1
z o

Pentru determinarea volumului eantionului se pornete tot de la relaia de calcul a erorii
limit:
N
z
z
N
n
z
x
x x
2 2
2
2 2
2
0
1
n

z
o
o
o
+ A
|
.
|

\
|
= = A
n cazul n care variabila este calitativ vom avea :
N
w w z
w w z
N
p p z
p p z
n
w w
) 1 (
) 1 (
) 1 (
) 1 (
2
2
2
2
2
2

+ A

+ A

=
n situaia in care populaia total poate fi considerat infinit coeficientul de corecie a
sondajului fr revenire nu i mai gsete utilitatea. n cazul n care n<0,05N putem considera
populaia infinit, valoare 1 1 |
.
|

\
|

N
n
i practic diferenele intre aplicarea celor dou
formule de calcul a erorii de reprezentativitate fiind nesemnificative.

Estimarea parametrilor populaiei totale pe baza valorilor de sondaj

Operaia de extindere a rezultatelor obinute din sondaj (n condiii specificate de
incertitudine exprimate n termeni probabilistici) asupra ntregii populaii prin procedeul
numit inferen statistic se numete estimaie.
53

Sumarul relaiilor necesare determinrii intervalului de ncredere n cazul utilizrii
unui sondaj simplu aleator cu probabiliti egale:



Condiiile de
desfurare
Sondaj cu revenire Sondaj fr revenire

2
o cunoscut
2
o necunoscut
2
o cunoscut
2
o necunoscut
Populaie
infinit i
eantion de
volum normal
(n<0,05N), n>30
n
z x
2
o

n
S
z x
2

n
z x
2
o

n
S
z x
2


n
) w 1 ( w
z w


n
) w 1 ( w
z w


Populaie finit
i eantion de
volum normal
(n>0,05N), n>30
n
z x
2
o

n
S
z x
2

1 N
n N
n
z x
2

o

1 N
n N
n
S
z x
2




n
) w 1 ( w
z w


1 N
n N
n
) w 1 ( w
z w


54

4.2.2. Sondajul de volum redus

Sondajele realizate pe baza eantioanelor de volum redus i gsesc frecvent
aplicabilitatea n domeniul cercetrilor economico-sociale. Adeseori, n activitatea desfurat
managerii sunt nevoii s ia decizii pe baza unor date sumare oferite de eantioane mici.

Dac volumul eantionului este mai mic de 30 de uniti, se consider de volum redus,
iar premizele de mai sus nu mai sunt valabile fiind necesar o tehnic nou de abordare a
problemei.
n acest caz, distribuia mediilor eantioanelor posibile depinde de forma de distribuie
a populaiei. Cum de cele mai multe ori forma de distribuie a populaiei nu este cunoscut,
nici legea de distribuie a mediilor eantioanelor nu poate fi determinat. Teoria sondajului
demonstreaz c n cazul seleciei de volum mic probabilitatea de apariie a mediilor de
diferite mrimi se distribuie mai uniform. Cu alte cuvinte probabilitile de apariie a
mediilor nu descresc n aceeai msur ca n cazul eantioanelor de volum normal n
momentul n care acestea se apropie de valorile extreme, mediile eantioanelor posibile
distribuindu-se dup curba lui Student i nu dup curba normal.
Tabelul distribuiei Student prezint coeficientul funciei de probabilitate al apariiei
mediilor eantioanelor posibile, reprezentat de coeficientul funciei u(t).
Prin urmare, pentru estimarea mediei metodologia este asemntoare pentru
eantioanele de volum normal i cele de volum redus, singura diferen fiind utilizarea
valorilor repartiiei Student n funcie de numrul gradelor de libertate i probabilitatea de
garantare a rezultatelor. Relaiile sunt sistematizat astfel:

Condiiile de
desfurare
Sondaj cu revenire Sondaj fr revenire
Eantion de
volum redus
n<30
2
o cunoscut
2
o necunoscut
2
o cunoscut
2
o necunoscut
n
t x
2
o

1 n
S
t x
2


1 N
n N
n
t x
2

o

1 N
n N
1 n
S
t x
2


1 n
) w 1 ( w
t w


1 N
n N
1 n
) w 1 ( w
t w



55

4.3. Sondajul stratificat

Deoarece n practic de cele mai multe ori populaiile supuse cercetrii sunt
neomogene utilizarea unui sondaj simplu aleator este dificil i costisitoare. Pentru
diminuarea acestor neajunsuri i creterea preciziei estimaiilor se aplic metoda eantionrii
stratificate.
Aceast metod presupune mprirea populaiei n subpopulaii ct mai omogene
numite straturi. Straturile se delimiteaz fie artificial de ctre cei care organizeaz sondajul pe
baza unor criterii bine determinate, fie ele sunt deja constituite n populaie (an de studiu,
jude, sector, filial etc.). Pentru formarea eantionului se va realiza cte o selecie pentru
fiecare strat formndu-se cte un subeantion. Acestea vor fi obinute utilizndu-se unul din
procedeele de selecie nvate (cu probabiliti egale sau inegale, repetate sau nerepetate).
Metoda seleciei stratificate este reprezentat n figura urmtoare:


Figura 4.3.1 Scheme de realizare a sondajului stratificat


Acest tip de sondaj este frecvent utilizat deoarece combin simplitatea conceptual a
sondajului simplu aleator cu sigurana asigurrii ponderii necesare reprezentativitii
subgrupurilor. Totodat este o tehnic foarte convenabil atunci cnd dorim s obinem
estimaii separate pentru parametrii populaiei pe fiecare strat i ulterior pentru ntreaga
populaie sau s ne asigurm c eantionul respect structura populaiei dup criteriul de
stratificare.

Populaie
N
Eantion
n
S
T
R N
1
A
T

1

S
T
R N
2

A
T

2

S
T
R N
k

A
T

3

n
1
n
2
n
k

........................................
............................
..................
56


1. Stratificarea asigur un grad mai mare de reprezentativitate i de precizie a
rezultatelor. Straturile constituite dup o caracteristic oarecare vor prezenta un mai mare
grad de omogenitate dect cel al populaiei fiind caracterizate prin indicatori ai variaiei cu
valori mai mici i deci erori de reprezentativitate mai reduse
8

Pentru a nelege avantajul sondajului stratificat trebuie pornit de la variaia total a
populaiei dup o anumit caracteristic (msurat de dispersia
2
o ) compus din variaia din
interiorul straturilor (msurat de dispersia
2
o ) i variaia dintre straturi (msurat de
dispersia
2
o ):
2 2 2
o o o + = unde fiecare tip de variaie se calculeaz conform relaiilor:
N X X
N
j
j
=
=
1
2 2
) ( o ;

= =
=
k
i
i
k
i
i i
N N
1 1
2 2
o o ;

= =
=
k
i
i
k
i
i j
N N X X
1 1
2 2
) ( o

n cazul n care s-ar organiza un sondaj simplu aleator, dispersia care determin
mrimea erorii de reprezentativitate este dispersia total. Cum n general populaiile nu sunt
omogene aceasta va fi foarte mare determinnd o eroare medie de reprezentativitate mare.
Dac se organizeaz un sondaj stratificat numai dispersia din interiorul straturilor va
influena eroarea de reprezentativitate. Aceasta este sintetizat prin media dispersiilor pariale
i este msura influenei factorilor ntmpltori asupra variaiei caracteristicii. Mrimea
dispersiei dintre straturi, msur a factorului care constituie criteriul de stratificare asupra
variaiei variabilei nu influeneaz eroarea de reprezentativitate.
Deoarece ntotdeauna
2 2
o o < estimaiile obinute pe baza sondajului stratificat sunt
afectate de erori mai mici dect cele obinute pe baza unui sondaj simplu aleator.

2. Dac stratificarea se realizeaz pe criterii geografice culegerea datelor se poate face cu
specialiti locali, reducnd astfel costul. Mai mult, se pot analiza i interpreta datele iniial pe
fiecare strat i ulterior pe ntreaga populaie.

Problemele organizatorice care se pun n momentul organizrii unui sondaj stratificat
sunt:
A alegerea criteriului pe baza cruia se va face stratificarea;
B numrul de straturi ce se vor constitui;
C repartizarea eantionului pe subeantioane.


8
Porojan D., 1993, Statistica i teoria sondajului, Ed. ansa SRL, Bucureti, p. 253.
57



Sondaj stratificat simplu (neproporional)

Acest sondaj este caracterizat prin aceea c din fiecare grup se extrage un numr
de uniti pentru a forma eantionul fr a ine cont de greutatea specific a fiecrei
grupe n totalul populaiei. Determinarea valorilor de sondaj n vederea estimrii
parametrilor din populaia de sondaj se realizeaz pentru toate caracteristicile cantitative i
calitative cuprinse n planul sondajului.

58

Caracteristicile cantitative
Considerm o populaie C de volum N mprit n k straturi. Din fiecare strat se
selecteaz un eantion dup unul din procedeele cunoscute astfel:

unde k este numrul de straturi
N
1
, N
2
,.. N
k
, reprezint volumul straturilor n populaia total i N
k
=

=1 i
j
N
n
1
, n
2
,.. n
k
, reprezint volumul straturilor n eantion i n
k
i
=

=1
j
n
X
ij
nivelurile caracteristicii cantitative.
Valoarea medie a caracteristicii n populaia total este X i se calculeaz nsumnd
nivelurile caracteristicii conforma relaiei 4.3.1 sau ca medie a mediilor de strat (relaia 4.3.2).
N
x
X
k
i
j
N
j
ij
= =
=
1 1
(4.3.1)

=
=

=
k
i
i
k
i
i i
N
N X
X
1
1
(4.3.2)
Valoarea medie a caracteristicii calculat pe baza datelor din eantion se calculeaz
similar dup una din relaiile 4.3.3 sau 4.3.4:
n
x
x
k
i
n
j
ij
j

= =
=
1 1
(4.3.3)

=
=

=
k
i
i
k
i
i i
n
n x
x
1
1
(4.3.4) unde
i
n
j
i
ji
i
n
x
x
i

=
=
1
(4.3.5)
Deoarece media populaiei totale nu se cunoate aceasta poate fi estimat cu urmtorul
estimator calculat pe baza mediilor straturilor i a ponderilor din populaia total:

=
=

=
k
i
i
k
i
i i
N
N x
x
1
1 ~
(4.3.6)
n cazul sondajului simplu stratificat obinut prin aplicare procedeului de sondaj
aleator cu revenire, respectiv fr revenire, relaiile de calcul ale erorii de reprezentativitate
sunt:

= =

~ =
k
i i
i i
k
i i
i i
x
n
S
N
N
n N
N
1
2
2
2
1
2
2
2
~
1
o
o

(4.3.7)
C
1
(X
11
, X
21
,.., X
N11
) C
1
(x
11
, x
21
,.., x
n11
)
C
2
(X
12
, X
22
,.., X
N22
) C
1
(x
12
, x
22
,.., x
n22
)

C
k
(X
1k
, X
2k
,.., X
Nkk
) C
1
(x
1k
, x
2k
,.., x
nkk
)
59


= =
|
|
.
|

\
|

~
|
|
.
|

\
|
=
k
i
i
i
i
i i
k
i
i
i
i
i i
x
N
n
n
S
N
N
N
n
n
N
N
1
2
2
2
1
2
2
2
~ 1
1
1
o
o

(4.3.8)

Pentru simplificarea relaiilor de calcul n cazul n care subeantioanele sunt de volum
normal nu se justific mprirea la n
i
-1 fa de cea la n
i
. Totodat, dac volumul fiecrui strat
N
i
este suficient de mare numitorul coeficientului de corecie poate rmne N
i
n loc de N
i
-1.
Dac prezint interes i analiza pe fiecare strat n parte, se va calcula ntr-o prim etap
eroarea medie de reprezentativitate pe fiecare strat inndu-se cont de procedeul de selecie
utilizat n interiorul stratului astfel:
1
2 2

~ =
i
i
i
i
x
n
S
n
i
o
o

(selecia din interiorul stratului este cu revenire);
|
|
.
|

\
|

~
|
|
.
|

\
|
=
i
i
i
i
i
i
i
i
x
N
n
n
S
N
n
n
i
1
1
1
2 2
o
o (pentru selecia fr revenire).

Eroarea medie de reprezentativitate a mediei eantionului se va calcula pe baza erorilor
de reprezentativitate ale straturilor conform relaiei:

=
=
k
i
x
i
x
i
N
N
1
2
2
2
~ o o (4.3.9)

Dup cum se poate observa eroarea medie de reprezentativitate nu mai depinde de
dispersia total ci de media dispersiilor straturilor. Eroarea limit maxim admis va fi:
x x
z ~ ~ o = A


Sondaj stratificat proporional

Specificul acestui sondaj este c structura populaiei pe straturi n populaia total
se respect i regsete i n structura eantionului. El i gsete utilitatea n cazul n care
exist diferene mari ntre volumele subpopulaiilor straturilor.
Prin definiie se numete un sondaj stratificat proporional cel pentru care este
ndeplinit condiia:
N
n
N
n
N
n
N
n
N
n
N
n
k
i
i
k
i
i
k
k
i
i
= = = = =

=
=
1
1
2
2
1
1
.... .... (4.3.10)
Din aceasta deducem relaia de calcul pentru eantionul fiecrui strat:
i i
N
N
n
n =
60

Mrimile medii calculate pe baza datelor de sondaj utilizate pentru a estima mediile
din populaia total se vor calcula n funcie de tipul variabilei dup una din relaiile:

=
=

=
k
i
i
k
i
i i
n
n x
x
1
1 ~
(4.3.11)

=
=
=
k
i
i
k
i
i i
n
w n
w
1
1 ~
(4.3.12)
Eroarea medie de reprezentativitate n cazul sondajului proporional se calculeaz
asemntor sondajului stratificat simplu doar c de data aceasta putem utiliza drept ponderi
volumele eantioanelor astfel:
Selecie repetat:


= =

~ =
k
i
i
i i
k
i
i
i i
x
n
S
N
N
n
n
n
1
2
2
2
1
2
2
2
~
1
o
o (4.3.13)

= =
|
|
.
|

\
|

~
|
|
.
|

\
|
=
k
i
i
i
i
i i
k
i
i
i
i
i i
x
N
n
n
S
n
n
N
n
n
n
n
1
2
2
2
1
2
2
2
~ 1
1
1
o
o (4.3.14)

Sau pe baza erorilor de reprezentativitate ale straturilor conform relaiei:

=
=
k
i
x
i
x
i
n
n
1
2
2
2
~ o o (4.3.15)

Avantajele sondajului stratificat proporional fa de cel neproporional sunt:
1. se evit riscul de a subevalua n eantion straturile mai mari;
2. se mrete gradul de precizie al estimaiei fa de stratificarea neproporional.

Sondajul stratificat optim

n cazul n care exist diferene mari n ceea ce privete gradul de variaie al
straturilor se recomand utilizarea sondajului stratificat optim.
n acest caz stabilirea subeantioanelor se face innd cont att de proporia pe care o
ocup stratul n populaia total ct i de abaterea medie ptratic, indicator ce exprim
variaia caracteristicii n interiorul stratului.
Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se
utilizeaz relaia:

=
=

k
i
i i
k
i
i
k k
k
N
n
N
n
N
n
N
n
1
1
2 2
2
1 1
1
....
o
o o o
(4.3.16) sau n
N
N
n
k
i
i i
i i
i
=

=1
o
o
. (4.3.17)
Relaiile de calcul ale erorilor de reprezentativitate sunt aceleai ca i n cazul
sondajului neproporional.
61


Selecia din interiorul straturilor s-a realizat cu revenire
Sondaj stratificat
simplu
(neproporional)

= =

~ =
k
i i
i i
k
i i
i i
x
n
S
N
N
n N
N
1
2
2
2
1
2
2
2
~
1
o
o

=
=
k
i
x
i
x
i
N
N
1
2
2
2
~ o o

= =

=
k
i i
i i i
k
i i
i i i
w
n
w w
N
N
n
p p
N
N
1
2
2
1
2
2
1
) 1 ( ) 1 (
o

2
1
2
2
i
w
k
i
i
w
N
N
o o =

=

Sondaj stratificat
proporional i
Sondaj stratificat
optim

= =
~ = =
k
i i
i i
k
i i
i i
x
n
S
n
n
n n n
n
1
2
2
2 2
1
2
2
2
~
o o
o

=
=
k
i
x
i
x
i
n
n
1
2
2
2
~ o o
n n
w w
n
n
w
k
i i
i i i
w
2
1
2
2
1
) 1 ( o
o =

=

=

2
1
2
2
i
w
k
i
i
w
n
n
o o =

=

Selecia din interiorul straturilor s-a realizat fr revenire
Sondaj stratificat
simplu
(neproporional)

= =
|
|
.
|

\
|

~
|
|
.
|

\
|

=
k
i i
i i
i
i i
k
i i
i i
i
i i
x
N
n N
n
S
N
N
N
n N
n N
N
1
2
2
2
1
2
2
2
~
1 1 1
o
o

=
=
k
i
x
i
x
i
N
N
1
2
2
2
~ o o

= =

= o
k
1 i
i
i i
i
i i
2
2
i
k
1 i
i
i i
i
i i
2
2
i
w
1 N
n N
1 n
) w 1 ( w
N
N
1 N
n N
n
) p 1 ( p
N
N

2
1
2
2
i
w
k
i
i
w
N
N
o o =

=

Sondaj stratificat
proporional i
Sondaj stratificat
optim

= =
|
|
.
|

\
|

~
|
|
.
|

\
|

o
=
|
|
.
|

\
|

o
= o
k
1 i
i
i i
i
2
i
2
2
i
i
i i
2 k
1 i
i
i i
i
2
i
2
2
i
x
~
1 N
n N
n
S
n
n
1 N
n N
n 1 N
n N
n n
n

=
|
|
.
|

\
|

k
i i
i i
i
i i
N
n N
n n
n
1
2
2
2
1
o


4.4. Sondajul de serii

Sondajul de serii se poate considera cel mai utilizat sondaj probabilistic. El este
preferat sondajului simplu aleator chiar dac acesta este mai facil i mai cunoscut.
Sondajului de serii este foarte important deoarece st, alturi de sondajul stratificat, la
baza sondajelor complexe asupra forei de munc, reprezentative la nivel naional.
Eantionarea simpl aleatoare presupune existena unei baze complete de sondaj din
care urmeaz s se extrag individual fiecare unitate ce va forma eantionul. Acest lucru este
rareori disponibil i ar costa prea mult realizarea unor astfel de baze. n schimb, se pot
construi baze de sondaj compuse din grupuri de elemente numite serii. Aceste serii constituie
uniti complexe (ntreprinderi, secii de votare, blocuri de locuine, grupe de studeni,
gospodria) care de cele mai multe ori reprezint forme de organizare a populaiei.
62

Pentru a asigura reprezentativitatea eantionului este necesar ca acesta s reprezinte o
structur asemntoare cu cea a populaiei fiind constituit tot din uniti complexe. Odat
selectat o serie, unitile simple ce o compun vor fi cercetate n totalitate.


Figura nr. 4.4.1. Schema de realizare a sondajului de serii

Fiecare serie este constituit din uniti simple ce pot fi definite prin caracteristici
proprii ce prezint interes pentru ancheta realizat. Ea trebuie definit fr ambiguitate, fiind
utilizat ca unitate de eantionare. Mrimea seriilor poate fi cunoscut sau necunoscut iar
seriile pot fi de mrimi egale sau inegale.



Majoritatea populaiilor supuse cercetrii nu sunt omogene, variaia total a populaiei
fiind format din variaia din interiorul seriilor pe de o parte i de variaia dintre seriile ce o
compun pe de alt parte.
POPULAIE RSERII
EANTION r SERII
63

n cazul sondajului de serii eroarea medie de reprezentativitate depinde de
variaia dintre seriile ce formeaz populaia. ntr-o astfel de populaie compus din uniti
complexe caracterul omogen sau neomogen al acesteia se transmite i seriilor din care este
format.
Eroarea medie de sondaj depinde doar de variaia dintre seriile populaiei
deoarece, cealalt component a variaiei totale (media dispersiilor din interiorul seriilor), se
consider a fi reflectat n eantion.









64



Exemplu: selecie de serii sistematic cu probabiliti egale
Nr. serie Selecie


r =40
R =170
K =170/40=4,25
D =2
Seriile selecionate:
002
2+4,25=6,25 006
6,25+4,25=10,5 011
..
001
002 X
003
004
005
006 X
007
008
009
010
011 X


170



65

Exemplu:
Nr.
serie
Mrime
(nr. de
gospodrii)
Valoare
cumulat
Nr. de
eantionare
Selecie



r =40
R =170
K =17219/40=430,475
D =73
Nr. de eantionare:

73

73+430,475=503,475
503

503,475+430,475=933,96
934

933,96+430,475=1364,425
1364

001 120 120 73 X
002 105 225
003 132 357
004 96 453
005 110 563 503 X
006 102 665
007 165 830
008 98 928
009 115 1043 934 X
010 60 1103
011 104 1207
012 168 1375 1364 X


170 196 17219
Total 17219 -

De cte ori este posibil, n cazul n care diferena de talie justific acest lucru, este
recomandat ca selecia seriilor s se realizeze prin procedeul aleator PPM. Avantajul acestui
procedeu este creterea reprezentativitii eantionului i n consecin a preciziei estimaiilor.
Notm cu:
R = numrul de uniti complexe (serii) din populaie;
r = numrul de uniti complexe (serii) din eantion;
N = numrul de uniti simple (indivizi) din populaie;
n = numrul de uniti simple (indivizi) din eantion;

=
=
N
i
i
Y T
1
este totalul din populaie;

=
=
N
i
i
Y
R
T
1
1
este totalul mediu pe serie;

= =
= =
R
j
j
j
N
i
i
Y
N
N
Y
N
1 1
1
Y este nivelul mediu pe fiecare unitate simpl (individ)
unde
j
Y este nivelul mediu pe fiecare serie.

4.4.1. Estimatori i erori n cazul sondajului de serii de talie egal selectate dup
procedeul aleator cu probabiliti egale fr revenire
Avem N
1
=N
2
=.. N
R
=N
0
. Putem calcula volumul de uniti simple al populaiei i al
eantionului astfel: N=R N
0
iar n=r N
0
. Avem urmtoarele relaii de calcul:
66


Parametrul de interes, nivelul mediu pe fiecare unitate simpl

= = =
= = =
R
j
j
R
j
j
j
N
i
i
Y
R
Y
N
N
Y
N
1 1 1
1 1
Y (4.4.1)

Estimatorul parametrului de interes, media eantionului:

=
=
r
j
j
Y
r
1
1
Y

(4.4.2)
Dispersia estimatorului Y

:
( )
R
Y Y
Rr
r R
R
j
j
=

=
|
.
|

\
| 1
2
Y

V
(4.4.3)

Estimaia dispersiei estimatorului:
1

1
2

|
.
|

\
|

=
|
.
|

\
|

=
r
Y Y
Rr
r R
r
j
j
(4.4.4)
Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza
relaiei:
( )
r R
r R
r R
r R
R
Y Y
Rr
r R
R
j
j
2 2
1
2
Y

o o
o

~

=

=
(4.4.5)
Unde
2
o reprezint variaia dintre serii n populaie iar
2

o estimatorul acesteia
calculate conform relaiilor:
( )
R
Y Y
R
j
j
=

=
1
2
2
o (4.3.6) i
( )
1

1
2
2

=
r
Y Y
r
j
j
o (4.4.6)

Pornind de la regula de adunare a dispersiilor:
2 2 2
o o o + = , se calculeaz
coeficientul de determinaie (numit i raportul de corelaie inter-serii) notat cu
2
q .
2 2 2
2
2
2

total variatia
grupe dintre variatia
o q o
o
o
q = = = (4.4.7)
nlocuind
2
o din releia 4.3.8 n releia 4.3.5 obinem:
2
2

q
o
o
r R
r R
Y

= (4.4.8)

67

Dac s-ar fi organizat un sondaj simplu aleator fr revenire eroarea medie de
reprezentativitate s-ar fi calculat dup relaia:
r R
r R
N rN RN
rN RN
n N
n N
2
0 0
2
0
0 0
2
SAFR
1 o o o
o

=

= (4.4.9)
Comparnd relaiile 4.3.9 cu 4.3.10 observm c eroarea de reprezentativitate rezultat
n urma unei sondaj de serii va fi mai mic dect cea obinut n urma unui sondaj simplu
aleator fr revenire doar n situaia n care se respect relaia:
0
2
1

N
< q . (4.4.10)
n consecin putem spune c dac dorim ca eficiena sondajului de serii s fie ct mai
mare este necesar s mprim populaia n serii de dimensiuni mici iar coeficientul de
determinaie s fie ct mai mic posibil.
Extinderea rezultatelor se face pe baza intervalului de ncredere lund n considerare
probabilitatea cu care vrem s garantm rezultatele.
Y Y
Y Y Y


A + < < A (4.4.11)

4.4.2. Estimatori i erori n cazul sondajului de serii de talie diferit selectate dup
procedeul aleator cu probabiliti egale fr revenire
n cazul n care seriile sunt de dimensiuni diferite, se recomand utilizarea unui
procedeu de selecie cu probabiliti inegale. Aplicarea acestuia necesit ns informaii
suplimentare n baza de sondaj. Dac nu dispunem de astfel de informaii vom aplica un
procedeu de selecie nerepetat (ca i n cazul planului de sondaj prezentat n subcapitolul
anterior).Cu toate acestea, deoarece seriile au dimensiuni diferite, relaiile de calcul ale
estimatorilor i erorilor de reprezentativitate

Notm cu:
N
j
= numrul de uniti simple din seria j;
T
j
= totalul variabilei de interes pentru toate unitile seriei j;
N = mrimea medie a unei serii n populaie;
n = mrimea medie a unei serii n eantion.


Avem urmtoarele relaii de calcul:

Parametrul de interes, nivelul mediu pe fiecare unitate simpl, calculat doar ca
medie aritmetic ponderat:

= =
= =
R
j
j
j
N
i
i
Y
N
N
Y
N
1 1
1
Y (4.4.12)
68


Estimatorul parametrului de interes, media eantionului:

=
=
r
j
j
j
Y
N
N
1
Y

(4.4.13)
Dispersia estimatorului Y

:
r
N
R
r R
T
2
2
1
Y

V
o

=
|
.
|

\
|
(4.4.14)

Estimaia dispersiei estimatorului:
r
N
R
r R
T
2
2

1
Y

=
|
.
|

\
|
(4.4.15)
Unde
2
T
o reprezint dispersia totalurilor seriilor fa de totalul nregistrat pentru
nivelul mediu iar
2

T
o este estimatorul acesteia calculate pe baza datelor din eantion. Acestea
sunt calculate conform relaiilor:
( )
R
N Y T
R
j
j j
T

=

=
1
2
2
o

(4.4.16) i
1

1
2
2

|
.
|

\
|

=

=
r
N Y T
r
j
j j
T
o (4.4.17)

Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza
relaiei:
r
N
R
r R
T
Y
2
2

1 o
o

= (4.4.18)

Deoarece numrul mediu de uniti simple ce formeaz o serie N este de cele mai
multe ori necunoscut, vom utiliza estimatorul n . Pentru unitile ce au intrat n eantion.
Acest lucru va determina o subestimare a variaiei estimatorului. Se consider c, n acest caz
)

Y V este un bun estimator al )

(Y V dac numrul de serii ce formeaz eantionul este


suficient de mare (r20).

4.3.3. Estimatori i erori n cazul sondajului de serii de talie diferit selectate dup
procedeul aleator (cu revenire) cu probabiliti proporionale cu talia
De cte ori dispunem de informaii auxiliare privind mrimea unitilor complexe se
recomand s le utilizm pentru a calcula probabilitile de incluziune n eantion, aplicnd un
procedeu de selecie cu probabiliti inegale.
Probabilitatea ca o serie s intre n eantion la o extragere este:
N
N
A
j
j
= . Cu ct o
unitate complex (serie) va avea o dimensiune mai mare, probabilitatea de a intra n eantion
va crete.
69

Deoarece, pentru formarea eantionului sunt necesare r extrageri, probabilitatea total
unei serii de a intra n eantion va fi:
N
N
r A
j
Tj
= .
Avem urmtoarele relaii de calcul:
Parametrul de interes, nivelul mediu pe fiecare unitate simpl se calculeaz dup
aceeai relaie ca si n cazul sondajului precedent:

= =
= =
R
j
j
j
N
i
i
Y
N
N
Y
N
1 1
1
Y (4.4.19)

Estimatorul parametrului de interes, media eantionului:

=
=
r
j
j
j
Y
N
N
1
Y

(4.4.20)

Estimaia dispersiei estimatorului:

=
|
.
|

\
|

=
|
.
|

\
|
r
i
j
j
Y Y
N
N
r
r r
1
2

) 1 (
) 1 (
1
Y

(4.4.21)

Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza
relaiei:

=
|
.
|

\
|

=
r
i
j
j
Y
Y Y
N
N
r
r r
1
2

) 1 (
) 1 (
1
o (4.4.22)

4.5. Aplicaii

Aplicaie 1

n rndul celor 4000 de studeni ai unei faculti s-a realizat un sondaj simplu aleator pe un
eantion de 175 persoane.
La ntrebarea Cte ore studiai n medie pe sptmn (exceptnd sesiunea)? rspunsurile
centralizate se gsesc n tabelul 4.5.1.

Tabel 4.5.1
Intervale de
variaie (ore)*
0-2 2-6 6-12 12 h i peste Total
Nr. studeni 50 55 40 30 175

* limita inferioar este inclus n interval

70

Se cere:
1. S se estimeze pentru o probabilitate de 0.95 numrul mediu de ore studiate de un student
din facultate.
2. S se estimeze cu aceeai probabilitate ponderea studenilor care studiaz mai puin de 6
ore pe sptmn.

Rezolvare:

1. Calculm ct reprezint 5% din volumul populaiei.
0.05*N=0.05*4000=200
Deoarece n (175) <200 considerm c sondajul aleator a fost realizat ntr-o populaie infinit.
Dispersia variabilei numrul de ore studiate nu este cunoscut i va fi nlocuit cu dispersia
caracteristicii n eantion.

Tabel 4.5.2
Intervale de variaie (ore)* n
i
x
i
x
i
n
i


0-2 50 1 50 1337.18
2-6 55 4 220 259.33
6-12 40 9 360 320.03
12 i peste 30 15 450 2338.31
Total 175 1080 4254.86
*limita inferioar inclus n interval

Calculm estimatorul numrului mediu de ore studiate pe sptmn. Calculele necesare sunt
sistematizate n tabelul 4.5.2.
175
1080
n
n x
x
i
i i
= =

=6.17 ore
Calculm dispersia estimatorului.
175
4254.86
n
n ) x (x
S
i
i
2
i
2
=

=24.31
Calculul erorii de reprezentativitate (eroare standard).
= = =
175
24.31
n
2
S
x

0.37 ore
Calculul erorii limit
x x
z o = A =1.96*0.37 =0.73 ore
Intervalul de ncredere:
x x
x X x + < < 73 . 0 17 . 6 X 73 . 0 17 . 6 + < < 9 . 6 X 44 . 5 < < ore
i
2
i
n ) x (x
71

Numrul mediu de ore studiate de un student ntr-o sptmn este de cel puin 5.44 i cel
mult 6.9. Garantm acest rezultat cu o probabilitate de 0.95.

2. Estimatorul ponderii studenilor care studiaz mai puin de 6 ore pe sptmn se
calculeaz pe baza relaiei:
6 . 0
175
55 50
n
m
w =
+
= =
Calculul erorii de reprezentativitate (eroare standard).
=

= o
175
) 6 . 0 1 ( 6 . 0
n
) w 1 ( w
w
0.037
Calculul erorii limit
w w
z o = A =1.96*0.037=0.072
Intervalul de ncredere:
w w
w p w + < < 072 . 0 6 . 00 p 072 . 0 6 . 0 + < < 672 . 0 p 528 . 0 < <
Garantm cu 95% c cel puin 52.8% i cel mult 67.2% din studeni studiaz mai puin de 6
ore pe sptmn.

Aplicatie 2

n rndul celor 110 studeni ce locuiesc ntr-un cmin s-a realizat un studiu privind nivelul de
mulumire fa de condiiile existente, prelevndu-se un eantion de 25 persoane. Rspunsurile
la ntrebarea n ce msur suntei mulumii de urmtoarele condiii din cminul n care
locuii? sunt centralizate n tabelul 4.5.3.

Tabel 4.5.3
Condiiile privind Foarte mulumit mulumit aa i aa nemulumit Total
Curenia 8 10 5 2 25
Cldura 6 7 2 10 25
apa cald 10 9 4 2 25
apa rece 11 10 3 1 25

Se cere:
1. S se stimeze pentru o probabilitate de 95% ponderea studenilor care se consider
mulumii i foarte mulumii de condiiile din cmin.

Rezolvare

Eantionul prelevat este de volum redus. n acest caz distribuia mediilor eantioanelor posibile
depinde de forma de distribuie a populaiei. Cum de cele mai multe ori forma de distribuie a
populaiei nu este cunoscut, nici legea de distribuie a mediilor eantioanelor nu poate fi
determinat. Teoria sondajului demonstreaz c n cazul seleciei de volum mic probabilitatea
72

de apariie a mediilor de diferite mrimi se distribuie mai uniform. Cu alte cuvinte
probabilitile de apariie a mediilor nu descresc n aceeai msur ca n cazul eantioanelor de
volum normal n momentul n care acestea se apropie de valorile extreme, mediile eantioanelor
posibile distribuindu-se dup curba lui Student i nu dup curba normal.
Calculele necesare estimrii procentelor celor ce se consider n general mulumii de
condiiile existente sunt sistematizate n tabelul 4.5.4.
Tabel 4.5.4
Condiiile privind Foarte mulumit i mulumit W
i o
ei Aei
\
1i
\
2i
curenia 18 0.72 0.0809 0.1670 0.5530 0.8870
cldura 13 0.52 0.0901 0.1859 0.3341 0.7059
apa cald 19 0.76 0.0770 0.1589 0.6011 0.9189
apa rece 21 0.84 0.0661 0.1364 0.7036 0.9764

Estimatorul ponderii studenilor mulumii i foarte mulumii de condiia i se calculeaz pe
baza relaiei:
n
m
w
i
i
= unde m
i
reprezint numrul celor mulumii i foarte mulumii de condiia i.
Calculul erorii de reprezentativitate (eroare standard).
n cazul n care nu se cunoate dispersia caracteristicii n populaie aceasta este nlocuit n
relaia de calcul a erorii standard cu dispersia caracteristicii n eantion care se va mpri la
numrul de grade de libertate n-1.
1 N
n N
1 n
) w 1 ( w
i i
wi

= o
Calculul erorii limit n cazul sondajului de volum redu.
wi w
t
i
o = A unde t este valoarea corespunztoare nivelului de siguran ales i numrului de
grade de libertate df=n-1.
n cazul nostru df=25-1=24. Primul pas n determinarea valorii lui t este identificarea este
identificarea coloanei din tabela distribuiei Student. Deoarece probabilitatea de garantare a
rezultatelor este de 0.95 aria de interes este (1-0.95)/2=0,025. Pentru a construi intervalul de
ncredere cutm n tabelul repartiiei Student valoarea corespunztoare pentru df=24 i
nivelul de semnificaie ( =0,025 i obinem valoarea t=2,064.
Intervalul de ncredere pentru estimarea procentelor celor ce se consider n general mulumii
pentru fiecare condiie se determin calculnd limita inferioar a intervalului \
1i
i limita
superioar \
2i
dup relaiile:
wi i i 2 i w i i 1
w i w + = u = u
n ceea ce privete curenia 72% din cei intervievai se consider n general mulumii.
Garantm cu o probabilitate de 95% c 72% 16.7% din studenii ce locuiesc n cmin se
consider mulumii de curenie.
52% 18.59% din totalul studenilor sunt mulumii de cldur, 76% 15.89% sunt
mulumii de apa cald i 84% 13.64% de apa rece.
73

Aplicaie 3

n rndul celor 4000 de studeni ai unei faculti urmeaz s se realizeze un sondaj cu privire
la modul de petrecere a timpului liber, utilizndu-se un procedeu de selecie simplu aleator
fr revenire. Din surse administrative se cunosc informaiile din tabelul 4.5.5. Din cercetri
anterioare pe teme similare efectuate n mediul studenesc s-a constata c variabilele din
tabelul 1.10 sunt puternic corelate cu variabilele de interes ale studiului.

Tabel 4.5.5
ponderea
studenilor care
(%):
locuiesc n cmin au un loc de munc sunt bursieri
35 20 25

Se cere:
1. Alegei variabila pe baza creia se va calcula volumul eantionului.
2. tiind c unitile ce vor forma eantionul se vor selecta dup procedeul simplu aleator fr
revenire din lista studenilor furnizat de ctre secretariatul facultii, s se calculeze
volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%.
3. Tot din cercetri anterioare se cunoate c proporia de nonrspunsuri n acest tip de
populaii este de 5%. Pe de alt parte se apreciaz c 2% din studenii ce figureaz n baza
de date urmeaz s fie exmatriculai. Acetia se consider uniti non-eligibile. S se
calculeze n aceste condiii eantionul de pornire.

Rezolvare:

1. Pentru a asigura reprezentativitatea eantionului pentru toate variabilele de interes, volumul
eantionului se va calcula pornind de la acea variabil auxiliar pentru care coeficientul de
variaie are valoarea maxim. Calculele necesare sunt sistematizate n tabelul 4.5.6.

Tabel 4.5.6
ponderea studenilor care: % Media dispersia coeficient de variaie (%)
locuiesc n cmin 35 0.35 0.2275 73.38
au un loc de munc 20 0.2 0.16 50
sunt bursieri 25 0.25 0.1875 57.73

Media unei caracteristici calitative de tip alternativ se calculeaz dup relaia:
N
M
p= unde M reprezint numrul celor care ndeplinesc condiia n populaie iar N este
volumul populaiei.
74

Dispersia caracteristicii alternative se calculeaz astfel:
) p 1 ( p p
2
= o
Valoarea coeficientului de variaie este dat de relaia:
100
p)) - (1 , p max(
V
p
o
=
Din datele din tabelul 4.5.6 se observ c dup variabila locuiesc n cmin populaia
studenilor este cel mai puin omogen. Se recomand calcularea volumului eantionului
pornind de la aceast variabil.
2. Deoarece procedeul de selecie utilizat este simplu aleator fr revenire la calculul
volumului eantionului se folosete relaia:
781
4000
) 35 . 0 1 ( 35 . 0 96 . 1
03 . 0
) 35 . 0 1 ( 35 . 0 96 . 1
) 1 (
) 1 (
2
2
2
2
2
2
~

+

=

+ A

=
N
p p z
p p z
n
w
persoane

3. Dup determinarea volumului eantionului teoretic necesar trebuie s determinm care este
volumul eantionului de pornire astfel nct n final s ajungem la numrul teoretic de
uniti selectate.
Se pune problema s inem cont de imperfeciunea listei utilizate ca baz de sondaj.
Considerm uniti non-valide acele uniti care n-ar trebui s figureze pe list dac aceasta ar
corespunde perfect populaiei studiate. n practic, n ciuda eforturilor actualizrii bazelor de
date utilizate ca baze de sondaj, exist n mod curent un numr de uniti non-valide. Trebuie
estimat aceast proporie astfel nct s putem determina ct mai precis volumul de pornire al
eantionului.
n funcie de modul de definire a populaiei supuse studiului este posibil ca unele uniti s fie
considerate non-eligibile. De exemplu dac populaia de interes este format din totalitatea
persoanelor cu vrsta cuprins ntre 15 i 64 ani (populaia n vrst de munc) iar unitatea de
selecie este gospodria, persoanele ce nu ndeplinesc condiia de vrst sunt considerate non-
eligibile.
Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Din aceast cauz se
recomand anticiparea ratei non-rspunsurilor nc din faza de proiectare a sondajului pentru a
redimensiona eantionul.
Relaia de calcul a volumului eantionului de pornire este:
v e r
th p
P
1
P
1
P
1
n n - - - = unde:
n
p
= volumul eantionului de pornire; n
th
= volumul eantionului teoretic; P
r
=proporia de
rspuns; P
e
=proporia de eligibilitate; P
v
=proporia de validitate
839
98 . 0
1
1
1
95 . 0
1
781 n
p
= - - - = persoane.

75

Aplicaia 4

n rndul salariailor unei ntreprinderi se va realiza un sondaj stratificat . Organizatorii
sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare strat urmnd s
se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din evidena
personalului s-a calculat, pornind de la variabila vrsta n ani mplinii media i dispersia pe
fiecare strat. Rezultatele se gsesc n tabelul 4.5.7:

Tabel 4.5.7
sex numr salariai (pers.) vrsta medie (ani) Dispersia
masculin 535 48 36,4
feminin 365 39 45,8

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit
maxim admis de 3% din valoarea vrstei medii a tuturor angajailor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate.

Rezolvare

Calculele necesare sunt sistematizate n tabelul 4.5.8.
1. Vrsta medie a celor 900 de salariai se calculeaz ca medie aritmetic ponderata a vrstei
medii a salariailor din cele dou straturi dup relaia:
35 . 44
900
39915
N N X X
k
1 i
i
k
1 i
i i
= = =

= =
ani
Eroarea limit propus este:
33 . 1 42 0.02 X 0.03
x
= = = ani
Tabel 4.5.8
sex
N
i
(pers.)
i
X
(ani)
2
i
o
i i
X N
2
i
i
N o
i
i
N o
n
i


( )
i
2
i
N X X
M 535 48 36.4 25680 19474 3227.784 45 33813.34
F 365 39 45.8 14235 16717 2470.163 35 767.4125
Total 39915 36191 5697.947 34580.75

76

Volumul eationului n cazul sondajului stratificat se calculeaz dup relaia:
=

=
+
=
900
21 . 40 96 . 1
33 . 1
21 . 40 96 . 1
N
z

z
n
2
2
2
2 2
2
x
2 2
str
79.6~80 pers.
2. Repartizarea eantionului pe straturi se poate realiza n trei moduri i anume:
o neproporional obinndu-se un sondaj stratificat neproporional sau simplu;
o proporional respectndu-se ponderea fiecrui strat n total populaie obinndu-se
un sondaj stratificat proporional;
o innd cont att de proporia fiecrui strat n total ct si de gradul de variaie al
fiecrui strat obinndu-se un sondaj stratificat optim.
Deoarece, att volumul ct i dispersiile straturilor difer considerabil vom alege stratificarea
optim.

Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se utilizeaz
relaia:

=
=
o
=
o
= =
o
= =
o
=
o
k
1 i
i i
k
1 i
i
k k
k
i i
i
2 2
2
1 1
1
N
n
N
n
....
N
n
...
N
n
N
n

Pe baza acesteia deducem relaia de calcul pentru subeantionul ce urmeaz a fi extras din
fiecare strat n
N
N
n
k
1 i
i i
i i
i

o
o
=

=
.
~ = 80
947 . 5697
784 , 3227
n
1
45 persoane
~ = 80
947 . 5697
163 , 2470
n
2
35 persoane

3. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat , variaia de
care trebuie inut cont n momentul calculrii volumului eantionului este variaia total a
caracteristicii. Deoarece nu se cunosc valorile individuale ale variabilei vrsta pentru
toate cele N uniti din populaie nu putem calcula variaia total dup relaia:
N ) X (X
N
1 j
2
j
2

=
=
tim c
2 2 2
o o o + =
Vom calcula variaia total ca sum variaiilor inter i intra straturi.
77

= =

=
=
900
75 . 34580
N
N ) X X (

k
1 i
i
k
1 i
i
2
i
2
38.42
63 . 78 42 . 38 21 . 40
2
= + = o
144
900
78.63 1.96
1.33
78.63 1.96
N
z

z
n
2
2
2
2 2
2
x
2 2
SAFR
~

=
+
= persoane

Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de un sondaj
simplu aleator fr revenire de la 144 persoane la 80 persoane.


Aplicaia 5

n rndul studenilor facultii REI urmeaz s se realizeze un sondaj avnd drept obiectiv
principal analiza calitii procesului de nvmnt. Deoarece se urmrete evidenbierea
caracteristicilor fiecrui an de studi se e va utiliza un plan de sondaj stratificat. Informaiile
necesare aplicrii planului de sondaj au fost preluate de la secretariatul facultii i sunt
prezentate n tabelul 4.5.9.

Tabel 4.5.9
Anul de studii Numr studeni (pers) Ponderea studenilor fr restane (%)
An I 600 20
An II 575 63
An III 500 45
An IV 450 86
Total 2125


Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de
3%.
2. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul eantionului
calculat la punctul 2.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.

78

Rezolvare

Tabel 4.5.10
Anul
de studii
N
i
p
i

2
pi
o
2
p i
i
N o
i
p i
N o n
i
p
i
N
i

An I 600 0.2 0.16 96 240 137 120
An II 575 0.63 0.2331 134.0325 277.6125 159 362.25
An III 500 0.45 0.2475 123.75 248.7469 142 225
An IV 450 0.86 0.1204 54.18 156.1442 90 387
Total 2125 407.9625 922.5035 1094.25

Calculele necesare sunt prezentate n tabelul 4.5.10
1. Relaia de calcul a volumului eantionului n cazul aplicrii unei plan de sondaj stratificat
i utiliznd o variabil calitativ este:
N
z
z
n
p
w
p
str
2 2
2
2 2
o
o
+ A
= .
19 . 0
2125
9625 . 407
N
N

k
1 i
i
k
1 i
i
2
i p
2
p
= = =

=
=
unde dispersiile straturilor sunt ) p 1 ( p
i i
2
i p
=
~

=
2125
19 . 0 96 . 1
03 . 0
19 . 0 96 . 1
n
2
2
2
587 persoane

2. Calculul volummului eantionului pe fiecare strat se va realiz pentru un sondaj optim
deoarece exist diferene considerabile ntre straturi n ceea ce priveste volumul i
variaiile.

Pornim de la relaia:

=
o
=
o
= =
o
= =
o
=
o
k
1 i
pi i
pk k
k
pi i
i
2 p 2
2
1 p 1
1
N
n
N
n
....
N
n
...
N
n
N
n

n
N
N
n
k
1 i
pi i
pi i
i

o
o
=

=
.
~ = 528
5 . 922
240
n
1
137 persoane ~ = 528
5 . 922
6 . 277
n
2
159 persoane
~ = 528
5 . 922
7 . 248
n
3
159 persoane ~ = 528
5 . 922
156
n
4
159 persoane

79

3. Variaia total a caracteristicii calitative este dat de relaia: ) p 1 ( p
2
p
= o unde p
reprezint media caracteristicii calitative ce se calculeaz astfel:
2125
25 . 1094
N
N p
p
k
1 i
i
k
1 i
i i
= =

=
=
=0.5149 2498 . 0 ) 5149 . 0 1 ( 5149 . 0
2
p
= = o
639
2125
2498 . 0 1.96
0324 0.
2498 . 0 1.96
N
z

z
n
2
2
2
2
p
2
2
w
2 2
SAFR
~

=
+
= persoane
Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta rezultatele
cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o cretere a
volumului eantionului cu 111 persoane.

Aplicaia 6

n urma unui sondaj stratificat proporional dup mediul de reziden realizat n judeul
Bacu de ctre o societate ce produce buturi rcoritoare, s-au obinut datele centralizate n
tabelul 4.5.11.

Tabel 4.5.11
Mediul
Efectivul
populaiei
(mii pers.)
Eantion
(pers.)
Informaii obinute din eantion
Venitul
totalmediu/gosp
(mii lei)
Dispersia
venitului total
mediu/gosp.
Ponderea celor
care consum
sptmnal buturi
rcoritoare (%)
Urban 340 511 3.8 4.5 72
Rural 325 489 2.1 1.9 18
Total 665 1000

Se cere:
1. S se estimeze cu o probabilitate de 0.9545 venitul total mediu/gosp att pe fiecare strat ct
i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum sptmnal
buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.

Rezolvare

1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 4.5.12.
80


Tabel 4.5.12
Mediul
N
i
(mii pers.)
n
i

(pers.)
i
x mii lei
2
i
S .
i
x n
i

i x
o
i x
A Linf Lsup
Urban 340 511 3.8 4.5 1941.8 0.094 0.188 3.612 3.988
Rural 325 489 2.1 1.9 1026.9 0.062 0.125 1.975 2.225
Total 665 1000 2968.7

Estimarea venitului mediu/persoan n mediul urban

Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N
1
=0,05*340000=17000
Deoarece n
1
<0,05*N
1
considerm populaia infinit iar relaiile de calcul folosite pentru
calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire.
094 . 0
511
5 , 4
n
S
1
2
1
1 x
= = = o mii. Lei
188 . 0 094 . 0 2
n
S
z
1
2
1
1 x
= = = A mii Lei
Intervalul de ncredere:
1 x 1 1 1 x 1
x X x + < < 188 . 0 8 . 3 X 188 . 0 8 . 3
1
+ < < 988 . 3 X 612 . 3
1
< <
Garantm cu o probabilitate de 95.45% c venitul total mediu/gosp n mediul urban este de cel
puin 3.612 mii lei i cel mult 3.988 mii lei.


Estimarea venitului total mediu/gosp n mediul rural

Calculm ct reprezint 5% din volumul populaiei stratului 2.
0.05*N
2
=0.05*325000=16250
Deoarece n
2
<0.05*N
2
considerm populaia infinit iar relaiile de calcul folosite pentru
calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire.
062 . 0
489
9 . 1
n
S
2
2
2
2 x
= = = o mii lei
125 . 0 062 . 0 2
n
S
z
2
2
2
2 x
= = = A mii lei
Intervalul de ncredere:
2 x 2 2 2 x 2
x X x + < < 125 . 0 1 . 2 X 125 . 0 1 . 2
2
+ < < 225 . 2 X 975 . 1
2
< <
Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este de cel puin
1.975mii lei i cel mult 2.225 mii lei.
81

Estimarea venitului mediu/persoan pe total jude

Deoarece sondajul realizat este stratificat proporional estimatorul venitului mediu/peroan la
nivelul judeului se calculeaz astfel:
9687 . 2
1000
7 , 2968
n n x x
~
k
1 i
i
k
1 i
i i
= = =

= =
mii lei
Calcului erorii de reprezentativitate:
056821 . 0
n
n
k
1 i
2
x
2
2
i
x
~
i
= o = o

=
mii lei
113642 . 0 056821 . 0 2 z
x
~
x
~ = = o = A mii lei
Intervalul de ncredere:
x
~
x
~ x
~
X x
~
+ < < 1136 . 0 9687 . 2 X 1136 . 0 9687 . 2 + < < 0823 . 3 X 8551 . 2 < <
Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n judeul Bacu este de cel
puin 2.8551 mii lei i cel mult 3.0823mii lei.

2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 4.5.13

Tabelul 4.5.13
Mediul
N
i
(mii pers.)
n
i

(pers.)
w
i
2
i
S . w
i
n
i

wi
o
wi
A Linf Lsup
Urban 340 511 0.72 0.2016 367.92 0.020 0.040 0.680 0.760
Rural 325 489 0.18 0.1476 88.02 0.017 0.035 0.145 0.215
Total 665 1000 455.94

Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul urban

Estimatorul procentului celor care . consum sptmnal buturi rcoritoare n mediul urban
calculat pe baza datelor din eantion este de 72%. Pentru a estima procentul acestora n
mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Deoarece populaia este considerat infinit utilizm relaiile de calcul aferente calculul
sondajului simplu aleator cu revenire.
020 . 0
511
2016 . 0
n
S
1
2
1
1 w
= = = o
040 . 0 020 . 0 2
n
S
z
1
2
1
1 w
= = = A
Intervalul de ncredere:
w1 1 1 w1 1
w p w + < < 040 . 0 72 . 0 p 040 . 0 72 . 0
1
+ < < 76 . 0 p 680 . 0
1
< <
82

Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult 76%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
( ) ( )
w1 1 1 1 1 w1 1 1
w N p N w N + < < ( ) ( ) 040 . 0 72 . 0 N M 040 . 0 72 . 0 N
1 1 1
+ < <
258307 M 231293
1
< <
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293 persoane i cel
mult 258307 persoane consum sptmnal buturi rcoritoare.

Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un procent de
18% al celor care consum sptmnal buturi rcoritoare.
Calculm eroarea de reprezentativitate
017 . 0
489
1476 . 0
n
S
2
2
2
2 w
= = = o
035 . 0 017 . 0 2
n
S
z
2
2
2
2 w
= = = A
Intervalul de ncredere:
w2 2 2 w2 2
w p w + < < 035 . 0 18 . 0 p 035 . 0 18 . 0
2
+ < < 215 . 0 p 145 . 0
2
< <
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel mult 21.5%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
( ) ( )
w2 2 2 2 2 w2 2 2
w N p N w N + < < 69793 M 47207
2
< <
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane i cel
mult 69793 persoane consum sptmnal buturi rcoritoare.

Estimarea procentului celor care consum sptmnal buturi rcoritoare pe total jude

Deoarece sondajul realizat este stratificat proporional estimatorul unwi variabile calitative la
nivelul judeului se calculeaz astfel:
= = =

= =
1000
94 . 455
~
1 1
k
i
i
k
i
i i
n w n w 0.45594
Calcului erorii de reprezentativitate:
013236 . 0
1
2
2
2
~ = =

=
k
i
i
w
i
w
n
n
o o
026472 , 0 012236 , 0 2 z
w
~
w
~ = = o = A Intervalul de ncredere:
w
~
w
~ w
~
p w
~
+ < < 026472 . 0 45594 . 0 p 026472 . 0 45594 . 0 + < <
482412 . 0 p 429468 . 0 < <
83

Garantm cu o probabilitate de 95.45% c cel puin 42.9468% i cel mult 48.2412% din
judeul Bacu consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
( ) ( )
w
~
w
~ w
~
N p N w
~
N + < <
320804 M 285596 < <
Garantm cu o probabilitate de 95.45% c n judeul Bacu cel puin 285596 persoane i cel
mult 320804 persoane consum sptmnal buturi rcoritoare.

Aplicaia 7

Studenii unei faculti sunt mprii n 100 de grupe. Fiecare grup este format dintr-un numr
egal de studeni (16). S-a realizat un sondaj de serii, procedeul de selecie a grupelor fiind
simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt prezentate n tabelul 4.5.14

4.5.14
seria
Ponderea studenilor care doresc s
participe la cursul facultativ (%)
seria
Ponderea studenilor care doresc s
participe la cursul facultativ (%)
1 60 9 55
2 54 10 58
3 56 11 59
4 62 12 63
5 63 13 62
6 50 14 64
7 49 15 62
8 58 16 61

Se cere:
1. S se estimeze ponderea studenilor care doresc s participe la cursul facultativ cu o
probabilitate de 95%.
2. tiind c raportul de corelaie inter-serii este de 12% ce volum de eantion ar fi fost necesar
dac s-ar fi realizat un sondaj simplu aleator fr revenire?

Rezolvare
Tabelul 4.5.15
seria
j
w
( )
2
j
w

w seria
j
w
( )
2
j
w

w
1 0.6000 0.0002 9 0.5500 0.0012
2 0.5400 0.0020 10 0.5800 0.0000
3 0.5600 0.0006 11 0.5900 0.0000
4 0.6200 0.0012 12 0.6300 0.0020
5 0.6300 0.0020 13 0.6200 0.0012
6 0.5000 0.0072 14 0.6400 0.0030
7 0.4900 0.0090 15 0.6200 0.0012
8 0.5800 0.0000 16 0.6100 0.0006
Total 9.3600 0.0318
84

1. Calculele necesare sunt sistematizate n tabelul 4.5.15
Estimatorul n cazul unei variabile cantitative se calculeaz astfel:
585 . 0
16
36 . 9
w
r
1
w

r
1 j
j
= = =

=

Eroroarea de reprezenzentativitate este:
01055 . 0
16
0021 . 0
100
16 100
r

R
r R
r R
r R
2
p
2
p
w

=
o

~
o

= o unde
( )
0021 . 0
1 16
0318 . 0
1 r
w

r
1 i
2
j
2
p
=

= o

=

Eroarea limit corespunztoare probabilitii de 0,95 este:
01055 , 0 96 , 1 z
w

= o = A =0,0207
Intervalul de ncredere:
w

P w

A + < < A 0207 , 0 585 , 0 P 0207 , 0 585 , 0 + < < 6057 , 0 P 5643 , 0 < <
Garantm cu o probabilitate de 95% c cel puin 56,43% i cel mult 60,57% din studeni
doresc s participe la cursul facultativ.
2. n cazul sondajului de serii numrul de elemente simple ce au format eantionul a fost de
256. Relaia de calcul pentru sondajul simplu aleator fr revenire este:
922
1600 ) 585 , 0 1 ( 585 , 0 96 , 1 0207 , 0
) 585 , 0 1 ( 585 , 0 96 , 1
N S z
S z
n
2 2
2
2 2
w
2 2
=
+

=
+ A

=~ studeni
Deoarece variaia dintre serii este foarte mic (raportul de corelaie inter-serii fiind doar 0,87)
sondajul de serii se dovedete foarte eficient.
Aplicaia 8

O localitate este format din 415 gospodrii(serii). Numrul de elemente dintr-o serie
(membrii) este diferit i nu se cunoate nivelul mediu al acestuia pentru toate cele 415
gospodrii. Pentru a estima venitul mediu pe persoan se extrage n mod aleator un eantion
format din 25 de serii. Datele centralizate sunt prezentate n tabelul 4.5.16
Tabel 4.5.16
seria
Numrul.de
rezideni
venit total pe serie
(mil. lei)
seria
Numrul de
rezideni
venit total pe serie
(mil. lei)
1 8 32 14 10 30
2 12 42 15 9 32
3 4 19 16 3 12
4 5 22 17 6 25
5 6 27 18 5 18
6 6 26 19 5 21
7 7 27 20 4 17
8 5 21 21 6 22
9 8 30 22 8 30
10 3 15 23 7 25
11 2 10 24 3 14
12 6 26 25 8 29
13 5 20 Total 151 592
85

Se cere s se estimeze venitul mediu pe gospodrie i venitul mediu pe persoan cu o
probabilitate de 95%.

Rezolvare

Este vorba de un sondaj de serii de dimensiune diferit selectate dup un procedeu de selecie
cu probabiliti egale. Calculele sunt sistematizate n tabelul 4.5.17

Tabel 4.5.17
seria N
j
T
j
2
j j j
N Y

T
|
.
|

\
|
seria N
j
T
j
2
j j j
N Y

T
|
.
|

\
|

1 8 32 0.40419 14 10 30 84.7375
2 12 42 25.4657 15 9 32 10.7897
3 4 19 11.0083 16 3 12 0.05684
4 5 22 5.74729 17 6 25 2.181
5 6 27 12.0883 18 5 18 2.56848
6 6 26 6.13464 19 5 21 1.95259
7 7 27 0.19688 20 4 17 1.73681
8 5 21 1.95259 21 6 22 2.32007
9 8 30 1.86115 22 8 30 1.86115
10 3 15 10.4873 23 7 25 5.97171
11 2 10 4.66102 24 3 14 5.01048
12 6 26 6.13464 25 8 29 5.58962
13 5 20 0.15789
Total 151 592 211.07

Estimatorul mediei populaiei este:

= =
=
r
1 j
j
r
1 j
j j
N Y N Y

= lei mil. 4 9 . 3
151
595
1
1
= =

=
=
r
j
j
r
j
j
N
T

Deoarece nu se poate calcula mrimea medie seriilor din populaie N se va estima cu ajutorul
mrimii medii a seriilor din eantion n .
04 . 6
25
151
1
= = =

=
r N n
r
j
j

Estimarea dispersia totalurilor seriilor fa de totalul mediu este:
05 . 7
24
143 . 196
1

1
2
2
= =

|
.
|

\
|

=

=
r
N Y T
r
j
j j j
T
o
86

Eroarea medie de reprezentativitate este:
085 . 0
25
05 . 7
04 . 6
1
415
25 415

1
2
2
2

=
r
n
R
r R
T
Y
o
o

Eroarea limit maxim admis este:
lei mil. 1666 . 0 085 . 0 96 . 1

= = = A
Y Y
z o

Intervalul de ncredere pentru venitul mediu pe o persoan este:
107 . 4 3.774
0.1666 3.94 0.1666 - 3,94


< <
+ < < A + < < A
Y
Y Y Y Y
Y Y
garantm cu o probabilitate de 95% c venitul mediu pe o persoan n aceast localitate este
de cel puin 3.774 mil. Lei i cel mult 4.107 mil lei.

Intervalul de ncredere pentru estimarea venitului mediu pe o gospodrie:
107 . 24 22.793 107 . 4 6.04 774 . 3 6.04


< < < <
|
.
|

\
|
A + < <
|
.
|

\
|
A T T Y n Y n Y n
Y Y


Venitul mediu al unei gospodrii se ncadreaz n intervalul :(22.793; 24.107) mil lei.

87






5.1. Obiective




5.2. Sondajul multistadial

Planurile de sondaj prezentate pn acum sunt desfurate ntr-un singur stadiu n care
unitile simple sau complexe au fost selectate i au format eantionul. n cazul utilizrii unui
plan de sondaj multistadial eantionarea se realizeaz n mai multe etape numite stadii.


Principalul dezavantaj al sondajului multistadial este acelai ca i n cazul sondajului
de serii, aa numitul efect de serii. Indivizii aflai n vecintate tind s se asemene, avnd
Dup studiul acestei uniti de nvare vei avea cunotine despre:
Cum se organizeaz un sondaj complex n funcie de caracteristicile
populaiei i de informaiile auxiliare disponibile
Estimarea parametrilor n cazul sondajelor complexe
Ce cuprinde aceast unitate de nvare?
5.1. Obiectivele unitii 5
5.2. Sondajul multistadial
5.3. Sondajul multifazic
5.4. Sondajul pe baz de eantioane fixe
5.5. Aplicaii
Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE
88

multe trsturi comune ce i difereniaz de alte grupuri. Acest lucru determin o variaie mic
n interiorul unitilor primare i o variaie mare ntre acestea, deci o eroare de
reprezentativitate mare.
Un astfel de sondaj presupune extragerea n primul stadiu a unui numr de uniti
primare care nu vor fi cercetate n totalitate ci vor constitui o baz de sondaj pentru al doilea
stadiu cnd se vor selecta unitile secundare ce vor constitui baz de sondaj pentru urmtorul
stadiu. Fiecare stadiu i va aduce contribuia la calculul erorii de reprezentativitate, cea mai
mare contribuie avnd-o eroarea din primul stadiu. Din acest motiv se recomand ca
numrul de stadii s nu fie foarte mare.
Realizarea unui sondaj n mai multe stadii presupune existena unei grupri a
populaiei. Aceast grupare, de cele mai multe ori, nu trebuie realizat n mod special
deoarece unitile populaiilor sunt deja grupate dup criterii administrative, geografice,
sociale etc. De exemplu ntr-un sondaj realizat cu privire la starea de sntate a populaiei
eantionul din primul stadiu este format din zone teritoriale. n al doilea stadiu din zonele
teritoriale selectate se vor extrage localitile, iar n al treilea stadiu indivizii ce vor forma
eantionul i vor completa chestionarele. n aceast situaie nu este necesar o baz complet
de sondaj dect pentru localitile ce au fost selectate n al doilea stadiu.

Pentru exemplificare se va prezenta n continuare sondajul desfurat n dou stadii
(bistadial). Schema de realizare a acestuia este prezentat n figura 5.2.1.

Figura nr. 5.2.1 Schema de realizare a sondajului bistadial





US
STADIUL I
STADIUL II
UP
1 2 r
1 2 . R
89

Notm cu:
R = numrul de uniti primare din populaie;
r = numrul de uniti primare selectate n primul stadiu;
N
j
= numrul total de uniti simple (indivizi) din UP
j
;
n
j
= numrul de uniti simple (indivizi) extrase din UP
j
.


Numrul total de uniti simple:

=
=
R
j
j
N N
1
(5.2.1)
Totalul variabilei de interes pentru unitatea primar UP
j
;

=
=
j
N
i
ij j
y T
1
(5.2.2)
Totalul variabilei de interes pentru toate unitile primare:

= =
=
R
j
ij
N
i
y T
j
1 1
(5.2.3)
Estimatorul totalului variabilei studiate:
|
|
.
|

\
|
=

= =
j
n
i
ij
j
j
r
j
y
n
N
r
R
T
1 1

(5.2.4)
Estimatorul totalului mediu variabilei studiate pe o unitate primar:
|
|
.
|

\
|
=

= =
j
n
i
ij
j
j
r
j
y
n
N
r
T
1 1
1

(5.2.5)

n cazul n care unitile primare i secundare se selecteaz dup procedeul aleator fr
revenire cu probabiliti egale, variaia estimatorului totalului variabilei studiate este dat de
relaia:

(5.2.6)




n aceast relaie avem:
1.
2
1
o
,
2
1
o

variaia totalurilor unitilor primare fa de totalul mediu i estimatorul acesteia
calculate conform relaiilor:

=
=
R
j
j
T T
R
1
2 2
1
) (
1
o (5.2.7) i

=
r
j
j
T T
r
1
2 2
1
)

(
1
1
o (5.2.8)
2.
2
, 2i
o variaia din interiorul unitii primare UP
j
cu R j , 1 = i estimatorul acesteia
2
, 2

i
o
calculate conform relaiilor:

=
=
j
N
i
j ij
j
i
y y
N
1
2 2
, 2
) (
1
o (5.2.9) i

=
j
n
i
j ij
j
i
y y
n
1
2 2
, 2
)

(
1
1
o (5.2.10)


j
,j
r
j j
j
j
n

N
n
N
r
R
r

R
r
R ) T V(
2
2
1
2
2
1 2
1 1


=
|
|
.
|

\
|
+ |
.
|

\
|
=
variaia dintre UP variaia din interiorul UP
90

Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei
estimatorului valorii totale dup relaia:
j
,j
r
j j
j
j
T
n

N
n
N
r
R
r

R
r
R ) T ( V
2
2
1
2
2
1 2

1


=
|
|
.
|

\
|
+ |
.
|

\
|
= = o (5.2.11)
Pornind de la estimatorul totalului variabilei putem estima totalul mediu pe o unitate
primar i nivelul mediu al variabilei astfel:
N
T
R
T
T

= =
Primul termen al variaiei estimatorului are o contribuie substanial n determinarea
mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de sondaj trebuie
s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se recomand
stratificarea unitilor primare.

5.3. Sondajul n mai multe faze

Acest tip de sondaj nu trebuie confundat cu sondajul multistadial cnd, n fiecare
treapt se selecteaz unitile ce constituie baza de eantionare pentru urmtorul stadiu
urmnd s se culeag informaii de la unitile selectate n ultimul stadiu. Planul de sondaj
multifazic presupune selectarea unui eantion foarte mare n prima faz i culegerea
unor date privitoare la un numr redus de caracteristici. Eantionul din prima faz
servete ca baz de eantionare pentru urmtoarea faz. Programul de observare din a doua
faz va fi mai cuprinztor. n faza urmtoare se continu reducerea eantionului i lrgirea
programului de observare. Dintre autorii care au dezvoltat n studiile lor acest tip de
eantionare amintesc: Cochran (1977) i Scherrer (1983).


Figura 5.3.1. Schema de realizare a unui sondaj n dou faze




Acest plan de eantionare regrupeaz diferite planuri de eantionare pentru care
obinerea de date se realizeaz ntr-un numr fixat de etape (egal cu numrul de planuri de
sondaj aplicate) ealonate n timp. Ca efect, obinerea de informaii pe etape nu nseamn
Populaie de volum N

Selecia din
faza 1
Eantion de volum n
1
CHESTIONAR
Plan de observare
redus FAZA 1

Selecia din
faza 2
CHESTIONAR
Plan de observare
extins FAZA 2
Eantion de volum n
2
91

neaprat c acestea au rolul de a informa n scopul derulrii procesului de derulare a planului
de sondaj. Ele pot fi utilizate doar pentru analiza final.
S lum ca exemplu un sondaj privitor la cheltuielile familiilor realizat n dou faze.
Schema acestuia este prezentat n figura nr. 5.3.1. n prima faz pe un eantion mare se vor
culege date privitoare la cheltuielile efectuate pe principalele grupe de cheltuieli. Informaiile
obinute vor permite cunoaterea gradului de variabilitate al caracteristicilor i vor facilita
realizarea unui eantion reprezentativ n a doua faz. De data aceasta numrul caracteristicilor
cercetate va fi mult mai mare.


5.4. Sondajul pe baz de eantioane fixe

Esena acestei metode const n a obine informaii repetate de la acelai eantion
numit panel. Primul panel detaliat a fost realizat n Statele Unite de ctre Arthur Charles
Nielsen n anul 1929. La o diferen de 30 ani a fost creat primul panel din Frana tot de ctre
Nielsen.
n literatura de specialitate se consider c exist dou tipuri de sondaje pe baz de
eantioane fixe:
eantionul este permanent i subiectul cercetrii este identic sau foarte asemntor
(audiena emisiunilor TV);
eantionul este permanent i poate fi utilizat pentru cercetri cu subiecte diferite.

Cercetarea poate avea loc periodic sau se poate face la intervale neregulate de timp.
92

Sondajele repetate, asupra aceleiai probleme, la intervale regulate de timp, urmrind
s identifice unele tendine, periodiciti, sau alte elemente dinamice pentru parametrul de
interes se mai numesc i sondaje longitudinale.
9


Sondajele pe baza unui panel presupun iniial realizarea unui eantion reprezentativ
pentru populaia studiat. Acest eantion este de cele mai multe ori realizat dup un plan
multistadial cu stratificarea unitilor primare. Unitile care formeaz aceste eantioane
pot fi diverse: ntreprinderi, magazine, gospodrii, persoane. Eantionul astfel constituit
permite strngerea de informaii cu o anumit regularitate sau la intervale neprecizate de timp.
Pentru culegerea datelor se poate utiliza oricare din metodele cunoscute.



9
Dumitrescu M., 2000, Sondaje statistice i aplicaii, Ed. Tehnic, Bucureti, p. 110.
93

O soluie pentru nlturarea acestor dezavantaje o constituie rennoirea panelurilor
prin limitarea la un numr stabilit de participri la sondajele realizate dup care vor fi
nlocuii. nnoirea eantionului poate fi parial sau total.
Ca o conduit general, condiiile impuse de celelalte planuri de sondaj cu selecie
probabilistic sunt necesare i pentru construirea unui panel. De exemplu: definirea cu
exactitate a populaiei de referin, construirea unei baze de sondaj adecvate, stabilirea unui
plan de sondaj eficient, alegerea metodei de culegere a datelor, alegerea unor metode
pertinente de redresare a eantionului
10
.



Odat decise planul de eantionare i metoda de culegere a datelor se trece la selecia
eantionului. Se va contacta fiecare individ din cei ce au fost selecionai pentru a li se explica
ce presupune i ce importan are participarea la o astfel de cercetare. Ulterior este necesar
obinerea asigurrii unei colaborri de lung durat. Acest acord depinde de complexitatea
sarcinilor i de timpul cerut de rmnere n eantion.
n general rata de recrutare n panel este inferioar ratei de rspuns pentru o anchet
ad-hoc similar. Recrutarea unui panel este o chestiune foarte costisitoare. Asigurarea unui
nivel de colaborare ct mai ridicat posibil din partea panelitilor constituie miza major a
gestiunii unui panel. Continuitatea i coerena culegerii datelor depinde de relaia de
colaborare care se creeaz cu membrii panelului
11
Aceast relaie este fondat pe un contract
ce trebuie respectat. Pentru aceasta trebuie respectat termenul convenit i nu trebuie s se
solicite membrilor panelului sarcini care nu au fost stabilite n momentul recrutrii.


Eficiena unui panel trebuie verificat pe toat durata de via a acestuia. n principiu,
ideea de baz const n a aprecia dac s-au produs modificri semnificative n structura
eantionului sau dac modificrile survenite asupra caracteristicilor demo-economice
sunt semnificative. Pentru a verifica acest lucru se utilizeaz urmtoarele metode:

a) Metoda coeficientului de corelaie. Considerm cazul a dou sondaje succesive
asupra unui panel de dimensiune mare. Numrul de uniti cercetate rmne neschimbat. Fie
variabilele numerice de sondaj y
i1
i y
i2
(ce provin din cele dou sondaje succesive) de medii
1
y
n primul sondaj i
2
y n al doilea. Dispersia populaiei este cunoscut i nemodificat ntre cele
dou momente de timp. Variana diferenei dintre cele dou medii este dat de relaia:
( )
2 1 2 1
2 1
2
2 ) cov( 2 ) ( ) ( ) (
2 2 2 2
1 2 1 2 1 2 y y y y
r
n n
r
n n
y y y V y V y y V = + = + =
o o o o


10
Niculescu-Aron I. G., 2004, O privite general privind utilizarea panelurilor n studiul comportamentului
consumatorului, Revista de informatic social nr. 2/2004, www.ris.uvt.ro
11
Saporta G., 2003-2004, Enquetes et Sondages, http:// cedric.cnam.fr/~saporta
94

Dac panelul nu mai este eficient se poate considera c cele dou medii provin din
eantioane independente. n acest caz ntre y
i1
i y
i2
nu exist nici o legtur, coeficientul de
corelaie fiind nul iar variana diferenei dintre medii este: n y y V
2
1 2
2 ) ( o =
n funcie de valoarea coeficientului de corelaie pot exista urmtoarele situaii:
o < 0
2 1
y y
r legtur invers ntre valorile variabilei y
i
la cele dou momente de timp.
Uzura panelului este foarte mare i necesit rennoire total.
o > 9 , 0
2 1
y y
r legtur foarte puternic ntre valorile variabilei y
i
la cele dou momente de
timp. Panel eficient. Nu este necesar rennoirea acestuia;
o < < 9 , 0 2 , 0
2 1
y y
r Exist o legtur ntre valorile variabilei y
i
la cele dou momente de
timp dar nu foarte puternic rennoirea parial a panelului. n funcie de valoarea
coeficientului de corelaie se decide care este proporia de rennoire (k). Unii autori
consider c valoarea optim este de 50%.
o s s 2 , 0 0
2 1
y y
r Nu exist legtur ntre valorile variabilei y
i
la cele dou momente de
timp. Se poate spune c datele provin din eantioane independente rennoirea total a
panelului.

b) Utilizarea testului Student pentru observaii perechi. Variabilele cuprinse n
planul de sondaj pot fi variabile de interes definite n concordan cu obiectivele studiului i
variabile auxiliare sau de identificare utilizate n stabilirea planului de sondaj .
n cazul n care variabila pentru care s-a efectuat testul este o variabil auxiliar care s-
a utilizat n momentul proiectrii eantionului aceast diferen denot o deteriorare a
panelului i necesitatea rennoirii acestuia.
Dac ns variabila pentru care s-a efectuat testul este una din variabilele de interes
conform obiectivelor anchetei aceast diferen semnificativ va fi interpretat n contextul
analizei efectuate.

n anchetele periodice ce se realizeaz asupra forei de munc n Romnia conform
metodologiei EUROSTAT se utilizeaz un panel ce este rennoit permanent dup o schem
rotaional de forma 2-2-2. Aceasta are ca principiu de baz urmtoarea tehnic: o locuin
este cercetat dou trimestre consecutive, este scoas temporar din cercetare urmtoarele dou
trimestre, este reintrodus n cercetare urmtoarele dou trimestre apoi este scoas definitiv.
Conform schemei aplicate n fiecare trimestru se pstreaz n eantion 50% din locuinele
trimestrului anterior. 25% din locuinele cercetate cu dou trimestre n urm iar restul de 25%
sunt locuine absolut noi. Astfel se pstreaz i o acoperire de 50% a eantioanelor de la un
trimestru al unui an la acelai trimestru al anului precedent.



95

5.5. Aplicaii

Aplicaia 1

Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia de 18 ani
peste de 48000. Unitile primare sunt reprezentate de seciile de votare (27) i au fost
selectate dup un procedeu aleator cu probabiliti egale fr revenire. n tabelul 5.5.1. sunt
prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor din fiecare unitate
primar ce a fost selectat n eantion.

Tabelul 5.5.1
secia
nr. pers.
din secia i
nr. pers.
selectate din
secia i
venitul mediu
(mil lei)
dispersia dup
variabila venit
nr. pers. care
petrec la televizor
mai mult de 3 h/zi
1 2116 43 2.8 0.04 20
2 2430 43 2.5 0.0576 25
3 2268 43 2.6 0.16 24
4 2346 52 3.8 0.09 28
5 1750 42 4.2 0.25 31
6 2386 52 4.1 0.16 36
7 2180 46 3.7 0.1089 28
8 1534 45 3.5 0.01 29
9 1598 42 3.4 0.09 33
10 2391 52 2.7 0.04 36
11 1295 52 2.9 0.0484 30

Se cere:
1. S se estimeze venitul mediu din localitate pentru o probabilitate de 95%.
2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru aceeai
probabilitate.

Rezolvare

1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza calculelor
sistematizate n tabelul 5.5.2.

= = = =
= =
|
|
.
|

\
|
=
r
1 i
i
r
1 i
i i
n
1 j
ij
i
i
r
1 i
T

r
R
Y

N
r
R
y
n
N
r
R
T

i
= 4 . 73023
11
27
=179239.25 mil lei
Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei estimatorului
valorii totale dup relaia:
i
2
,i 2
r
1 i
i
i 2
i
2
1 2
T

N
n
1 N
r
R

r

R
r
1 R

=
|
|
.
|

\
|
+ |
.
|

\
|
= o
unde

= o
r
1 i
2
i
2
1
) T

(
1 r
1
= =
10
30397397
3039739.7

=
=
r
1 i
i
T

r
1
T

= =
11
4 , 73023
6638.5 mil. lei
96

Tabel 5.5.2
secia N
i
n
i

i
Y


2
,i 2

i
T


2
i
) T

(
|
|
.
|

\
|

i
i
N
n
1
i
2
,i 2
i
i 2
i
n

N
n
1 N
|
|
.
|

\
|

1 2116 43 2.8 0.04 5924.8 509354.714 0.98 4080.44
2 2430 43 2.5 0.0576 6075 317522.005 0.98 7769.85
3 2268 43 2.6 0.16 5896.8 550105.405 0.98 18776.93
4 2346 52 3.8 0.09 8914.8 5181583.08 0.98 9314.52
5 1750 42 4.2 0.25 7350 506245.186 0.98 17791.67
6 2386 52 4.1 0.16 9782.6 9885421.98 0.98 17135.15
7 2180 46 3.7 0.1089 8066 2037782.2 0.98 11013.39
8 1534 45 3.5 0.01 5369 1611607.17 0.97 507.58
9 1598 42 3.4 0.09 5433.2 1452726.18 0.97 5328.19
10 2391 52 2.7 0.04 6455.7 33412.5164 0.98 4301.96
11 1295 52 2.9 0.0484 3755.5 8311636.58 0.96 1498.25
Total 22294 512 73023.4 30397397 97517.92

Calculm primul termen al erorii de reprezentativitate indus de selecia din primul stadiu al
planului de sondaj.
Termen1=27
2
|
.
|

\
|

27
11
1
11
7 . 3039739
=119378868.2
Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a avut loc n al
doilea stadiu, n interiorul unitilor primare ce au format eantionul.
Termen2= 92 . 97517
11
27
=239362.8
Observm c primul termen al variaiei estimatorului are o contribuie substanial n
determinarea mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de
sondaj trebuie s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se
recomand stratificarea unitilor primare.

012 . 10937 8 . 239362 119378868

= + =
T
o
Intervalul de ncredere al totalului este:
T T
T T T

96 . 1

96 . 1

o o + s s
8 . 200675 7 . 157802 s sT mil. Lei
Venitul mediu estimat este:
734 . 3

= =
N
T
mil. lei
Intervalul de ncredere al venitului mediu este :
) * 96 . 1

(
1
) * 96 . 1

(
1

T T
T
N N
T
T
N
o o + s s
18 . 4 287 . 3 s s Y


Garantm cu o probabilitate de 95% c venitul mediu pe o persoan este de cel puin
3.287 mil. lei i cel mult 4.18 mil. lei.

97

2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate n tabelul
5.5.3.

Tabelul 5.5.3
secia N
i
ni

m
i

i
w
2
,i 2

i
T


2
i
) T

(
|
|
.
|

\
|

i
i
N
n
1
i
2
,i 2
i
i 2
i
n

N
n
1 N
|
|
.
|

\
|

1 2116 43 20 0.4651 0.2488 984.2 75228.67524 0.98 25378.59
2 2430 43 25 0.5814 0.2434 1412.8 23816.57237 0.98 32829.62
3 2268 43 24 0.5581 0.2466 1265.9 54.70016007 0.98 28942.27
4 2346 52 28 0.5385 0.2485 1263.2 22.7172322 0.98 25720.57
5 1750 42 31 0.7381 0.1933 1291.7 1102.383243 0.98 13757.28
6 2386 52 36 0.6923 0.2130 1651.8 154749.1181 0.98 22813.07
7 2180 46 28 0.6087 0.2382 1327.0 4691.155746 0.98 24088.40
8 1534 45 29 0.6444 0.2291 988.6 72838.84794 0.97 11630.56
9 1598 42 33 0.7857 0.1684 1255.6 8.369917026 0.97 9967.70
10 2391 52 36 0.6923 0.2130 1655.3 157484.5118 0.98 22909.85
11 1295 52 30 0.5769 0.2441 747.1 261477.9275 0.96 7555.70
Total 22294 512 13843.11 751474.9792 225593.60

Calculm estimatorul totalului variabilei studiate (numrul persoanelor care petrec la
televizor mai mult de 3 h/zi

= =
= =
r
1 i
i
r
1 i
i i
T

r
R
w N
r
R
T

= 11 . 13843
11
27
=33978.54 pers.
Eroarea medie de reprezentativitate se va calcula pe baza relaiei:
i
2
,i 2
r
1 i
i
i 2
i
2
1 2
T

N
n
1 N
r
R

r

R
r
1 R

=
|
|
.
|

\
|
+ |
.
|

\
|
= o
unde

= o
r
1 i
2
i
2
1
) T

(
1 r
1
= =
10
9792 . 751474
75147.49792

=
=
r
1 i
i
T

r
1
T

= =
11
11 , 13843
1258.465 pers.
Termen1=27
2
|
.
|

\
|

27
11
1
11
2 75147.4979
=2951247.191
Termen2= 225593.60
11
27
=553729.7456
Observm c i n acest caz primul termen al variaiei estimatorului are o contribuie
substanial n determinarea mrimii erorii de reprezentativitate. stadiu.
3 1872.15836 6 553729.745 1 2951247.19

= + =
T
o
Intervalul de ncredere al totalului este:
T T
T T T

96 . 1

96 . 1

o o + s s
37648 T 30309 s s persoane
Cel puin 30309 persoane i cel mult 37648 persoane petrec cel puin 3 ore pe zi la televizor.
98

Procentul mediu estimat este:
0.70789

= =
N
T

Intervalul de ncredere al procentului mediu este :
) * 96 . 1

(
1
) * 96 . 1

(
1

T T
T
N N
T
T
N
o o + s s
7843 . 0 6315 . 0 s s p
Se garanteaz cu o probabilitate de 95% c cel puin 63.15% i cel mult 78.43% din populaia
ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.

Aplicaia 2

n rndul societilor comerciale din domeniul de activitate Hoteluri i restaurante se
realizeaz o anchet periodic ce are la baz un eantion de tip panel. Pornind de la variabila
auxiliar numr salariai prezentat n tabelul 5.5.4 (pentru exemplificare s-au luat doar
primele 20 de societi comerciale din eantion) se va verifica eficiena panelului.

Se cere:

1. S se stabileasc gradul de uzur al panelului cu ajutorul metodei coeficientului de
corelaie.
2. S se verifice eficiena panelului cu ajutorul testului Student (=0.05) pentru date nrudite
(eantioane dependente).

Tabel 5.5.4
societate
comercial
Numr salariai (pers.)
societate
comercial
Numr salariai (pers.)
la momentul
realizrii
panelului
la momentul
verificrii
eficienei
panelului
la momentul
realizrii
panelului
la momentul
verificrii
eficienei
panelului
Y
i1
Y
i2

1 13 14 11 18 22
2 15 14 12 17 22
3 37 35 13 22 20
4 44 40 14 25 25
5 34 30 15 28 27
6 23 21 16 29 28
7 21 30 17 33 31
8 14 17 18 43 41
9 15 20 19 25 28
10 16 20 20 28 30


1. Calculm valoarea coeficientului de corelaie dup relaia:
( ) ( )
|
.
|

\
|

|
.
|

\
|

=


= = = =
= = =
n
i
n
i
i i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
y y
y y n y y n
y y y y n
r
1
2
1
2 2
2
1
2
1
1 1
2
1 1 1
2 1 2 1
2 1


99

Calculele necesare aflrii coeficientului de corelaie sunt prezentate n tabelul 5.5.5

Tabelul 5.5.5
societate
comercial
y
i1
y
i2
y
i1
y
i2
y
2
i1
y
2
i2

1 13 14 182 169 196
2 15 14 210 225 196
3 37 35 1295 1369 1225
4 44 40 1760 1936 1600
5 34 30 1020 1156 900
6 23 21 483 529 441
7 21 30 630 441 900
8 14 17 238 196 289
9 15 20 300 225 400
10 16 20 320 256 400
11 18 22 396 324 484
12 17 22 374 289 484
13 22 20 440 484 400
14 25 25 625 625 625
15 28 27 756 784 729
16 29 28 812 841 784
17 33 31 1023 1089 961
18 43 41 1763 1849 1681
19 25 28 700 625 784
20 28 30 840 784 900
total 500 515 14167 14196 14379

( ) ( )
9 . 0 9384 . 0
515 14379 20 500 14196 20
515 500 14167 20
2 2
2 1
> =


=
y y
r
n aceste condiii se consider panelul eficient i nu este necesar nnoirea acestuia.

2. Utilizarea testului Student pentru date nrudite pornind de la o variabil auxiliar
presupune:
H
0
:
2 1
y y = ; H
1
:
2 1
y y =
Considerm variabila
2 1 i i i
y y d = ce msoar diferenele individuale, pentru care calculm
media i abaterea medie ptratic (vezi tabelul 5.5.6).

75 . 0 75 . 25 25
2 1
= = = y y d
( ) 47737 . 3 19 / 75 . 229 1
1
2
= = =

=
n d d S
n
i
i d

Statistica testului este: 96455 . 0
2 1
=

= = n
S
y y
n
S
d
t
d d
c

Valoarea calculat a testului se compar cu cea teoretic corespunztoare nivelului de
semnificaie ales i n-1=19 grade de libertate. Valoarea teoretic ce corespunde nivelului de
semnificaie =0.05 i numrului de grade de libertate 19 este t=2.093 Deoarece valoarea
100

calculat este mai mic dect cea teoretic se accept ipoteza diferenei nule ceea ce
nseamn c nu exist diferene semnificative ntre cele dou medii, panelul fiind eficient

Tabelul 5.5.6
societate
comercial
y
i1
y
i2
d
i
( )
2
d d
i

1 13 14 -1 0.0625
2 15 14 1 3.0625
3 37 35 2 7.5625
4 44 40 4 22.5625
5 34 30 4 22.5625
6 23 21 2 7.5625
7 21 30 -9 68.0625
8 14 17 -3 5.0625
9 15 20 -5 18.0625
10 16 20 -4 10.5625
11 18 22 -4 10.5625
12 17 22 -5 18.0625
13 22 20 2 7.5625
14 25 25 0 0.5625
15 28 27 1 3.0625
16 29 28 1 3.0625
17 33 31 2 7.5625
18 43 41 2 7.5625
19 25 28 -3 5.0625
20 28 30 -2 1.5625
Total 25 25.75 -0.75 229.75

101







6.1. Obiective




6.2. Tipuri de sondaje neprobabilistice

Toate tipurile de sondaj prezentate pn n acest punct sunt probabilistice. Acestea
presupun existena unei baze de sondaj din care, cu probabiliti cunoscute, se extrage fiecare
unitate a eantionului a crui mrime a fost determinat n funcie de precizia estimaiei dorite
i de probabilitatea cu care dorim s garantm rezultatele.
Exist situaii, n special n sondajele de opinie sau n studii de pia, cnd se utilizeaz
metode neprobabilistice de eantionare.
Sondajele neprobabilistice sunt cele n care elementele ce formeaz eantionul au fost
alese n mod arbitrar, iar probabilitile fiecrei uniti de a intra n eantion sunt necunoscute.
Putem spune c aceste metode sunt netiinifice. Dintre acestea cele mai cunoscute sunt
sondajele efectuate pe baza urmtoarelor procedee de eantionare: eantionarea la ntmplare
(oarb), eantionarea pe baza metodei voluntariatului, eantionarea raional i eantionarea
pe cote.

Dup studiul acestei uniti de nvare vei avea cunotine despre:
Modul de construire a esantioanelor nealeatoare
Cum se realizeaza un sondaj pe cote
Ce cuprinde aceast unitate de nvare?
6.1. Obiectivele unitii de nvare 6
6.2. Tipuri de sondaje neprobabilistice
6.3. Sondajul pe cote
6.4. Aplicaii
Unitatea de nvare 6
SONDAJE NEPROBABILISTICE

102



6.3. Sondajul pe cote

Sondajul pe cote este cel mai utilizat sondaj neprobabilistic. n cazul acestui sondaj
deplasrile anchetatorilor vor fi limitate, spre locuri alese la ntmplare dar bine determinate.
Aceast metod conduce la economii de cutare i deplasare, adesea foarte importante. Scopul
pe care i-l propune metoda este ca eantionul construit s se apropie ct mai mult posibil de
un eantion obinut pe baza unei selecii aleatoare riguroase.

Principiul care st la baza metodei pornete de la ideea c un eantion reprezentativ
red structura populaiei studiate. Astfel, dac reproducem fidel anumite caracteristici ale
populaiei, eantionul, prin extindere va fi reprezentativ i pentru celelalte caracteristici
controlabile sau necontrolabile ce constituie obiectul anchetei. Criteriile pe baza crora se
formeaz eantionul se numesc criterii de cot.
103

n acest tip de sondaj fiecrui operator i este repartizat un numr de chestionare
stabilindu-se cte trebuie realizate pe fiecare categorie. Obligaia operatorului este de a
respecta aceste criterii rmnnd la latitudinea lui ce persoane s selecteze. Acesta este
motivul pentru care este necesar ca operatorii de interviu s fie foarte bine pregtii i s aib
experien n domeniu.



n esen, ceea ce i se cere unui operator este s se transforme ntr-un instrument de
selecie cvasialeatoare care, pe parcursurile pe care le urmeaz n zona care i-a fost
repartizat, s selecteze indivizii similar unei selecii care le acord probabiliti egale. n
cazul n care criteriile de cot impuse operatorului reflect corect structura zonei cercetate, un
bun anchetator realizeaz rapid seria de interviuri repartizate.
n funcie de modul n care sunt stabilite criteriile de cot avem cote marginale
(simple) sau cote ncruciate.
S presupunem c ntr-un ora se realizeaz o anchet utilizndu-se drept criterii de
cot vrsta i categoria social. Unui operator i sunt repartizate 40 de chestionare.
Pentru a stabili cotele maginale este necesar sa avem informaii legate de structura
populaiei de forma celor prezentate n tabelul 6.3.1. Pe baza acestora se va construi foaia de
cote prezentat n tabelul 6.3.3.


Tabel 4.3.1. Structura populaiei necesar pentru cote marginale
Sex % Categorie social %
masculin 47,50% salariat Cat.1. 45,00%
feminin 52,50% patron Cat.2. 7,50%
omer Cat.3. 10,00%
elev-student Cat.4. 10,00%
liber profesionist Cat.5. 5,00%
pensionar Cat.6. 22,50%
Total 100,00% Total 100,00%

Criteriile de cote marginale sunt comode pentru operatori i puin costisitoare. Ele pot
fi stabilite cu exactitate, dar ansa de a obine un eantion reprezentativ este mai mic dect n
cazul cotelor ncruciate. Dup cum se observ n acest caz nu exist nici o corelaie ntre
104

criteriile de cot. Operatorul de sondaj nu tie cte femei trebuie s ia din fiecare categorie
social sau ci brbai.
Pentru a realiza un plan de sondaj care s utilizeze cote ncruciate este necesar
cunoaterea structurii populaiei dup cele dou variabile. n cazul studiului nostru aceast
structur este prezentat n tabelul nr. 6.3.2. Foaia de cote dup care trebuie s se ghideze
operatorul n aceast situaie este prezentat n tabelul nr. 6.3.4. Prin aceast metod sunt puse
n eviden neconcordanele care exist n ceea ce privete distribuia pe categorii sociale
pentru cele dou sexe.

Tabel 6.3.2. Structura populaiei necesar pentru cote ncruciate
Sex
categorie social
salariat patron omer elev-
student
liber
profesionist
pensionar Total
masculin 24000 4500 4200 4900 2000 7900 47500
% 50,53 9,47 8,84 10,32 4,21 16,63 100
feminin 21000 3000 5800 5100 3000 14600 52500
% 40,00 5,71 11,05 9,71 5,71 27,81 100
Total 45000 7500 10000 10000 5000 22500 100000
% 45 7,5 10 10 5 22,5 100

Tabel 6.3.4. FOAIA DE COTE
40 de interviuri
Criterii de cot Categoria social
nr.
interviuri
Interviuri
masculin
salariat 10 1 2 3 4 5 6 7 8 9 10
patron 2 1 2
omer 2 1 2
elev-student 2 1 2
liber profesionist 1 1
pensionar 3 1 2 3
feminin
salariat 8 1 2 3 4 5 6 7 8
patron 1 1
omer 2 1 2
elev-student 2 1 2
liber profesionist 1 1
pensionar 6 1 2 3 4 5 6



105

Tabel 6.3.3. FOAIA DE COTE

40 de interviuri
Criterii de cot nr. interviuri/ Interviuri
s
e
x


M 19
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

F 21
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

C
a
t
e
g
o
r
i
a



s
o
c
i
a
l


Cat1
18
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Cat2
3
1 2 3

Cat3
4
1 2 3 4

Cat4
4
1 2 3 4

Cat5
2
1 2

Cat6
9
1 2 3 4 5 6 7 8 9


106

Cu toate acestea unii autori consider c n cazul sondajului pe cote se poate adopta
ipoteza unei selecii simple aleatoare cu probabiliti egale. Aceast ipotez ns nu poate fi
demonstrat. Utilizarea relaiilor de calcul a sondajului aleator cu probabiliti egale pentru
volumul eantionului i a erorilor de reprezentativitate nu pot duce dect la aproximri mai
mult sau mai puin grosolane.





n general acest tip de sondaj este utilizat n cercetri sociologice sau n studii de pia
n diferite localiti fr a avea pretenia reprezentativitii la nivel naional.
Uneori, datorit rapiditii i costului redus cu care se realizeaz, aceast eantionare
poate fi combinat cu alte procedee de eantionare n cadrul sondajelor complexe. De
exemplu, pentru realizarea unui studiu cu privire la atitudinea fa de munc a populaiei n
vrst de munc din Bucureti se proiecteaz un sondaj bistadial. Se mparte suprafaa
Bucuretiului n 100 de zone de aproximativ aceeai arie care vor constitui unitile primare
ce vor fi selectate n primul stadiu dup un procedeu simplu aleator fr revenire. Pentru a
evita efectul de serie unitile primare se stratific dup tipul zonei rezideniale. n stadiul al
doilea, pentru selectarea unitilor secundare se poate utiliza eantionarea pe cote.

107





1 Andrei, T.
Stancu, S,.
Pele, D.T.
Statistic Teorie i aplicaii, Ediia a doua, Bucureti, Editura
Economic , 2002
2 Isaic-Maniu
Al.,
Mitru C.,
Voineagu V.

Statistica pentru managementul afacerilor, Editura Economic 1999
3 Isaic-Maniu
Al.
Tehnica sondajelor i anchetelor, Editura Independena economic
2001

4 Levy P.S.,
Lemeshow S.
Sampling of Populations, Third Edition, J ohn Wiley&Sons New York,
2000
5 J aba Elisabeta,
Grama Ana
Analiza Statistic cu SPSS sub Windows, Editura Polirom Iai 2004
1
6 Dumitrescu,
M
Sondaje statistice i aplicaii, Bucureti, Editura Tehnic, 2000
7 Mihoc Gh.,
Craiu V.
Tratat de statistic matematic volumul Verificarea ipotezelor
statistice, Ed. Academiei R.S.R, Bucureti 1977

8 Niculescu-
Aron I. G.,
Sondajul statistic n cercetarea forei de munc, Editura ASE, Bucureti
2005

9 Porojan D. Statistica si teoria sondajului, Bucureti, Casa de Editur ansa 1993
10 Rotariu T.I. Ancheta sociologic i sondajul de opinie, Editura Polirom 1999
11 Rotariu T.
(coordonator)
Metode statistice aplicate n tiinele sociale, Bucureti, Editura
Polirom, 1999
12 Sandu Gh., Modele experimentale n zootehnie, Editura Coral Sanivet 1993

13 Saporta G., Enquetes et Sondages 2003-2004, http:// cedric.cnam.fr/~saporta

14 Sincich T., Business statistics by example, Prentice Hall, New J ersez 1996

15 Wilson M.,
Littell R.
Statistical Methods Research I Course Notes,
http://www.stat.ufl.edu/STA6166/Fall06/Course%20Notes.html

16 *** http://biol10.biol.umontreal.ca/BIO2042

17 *** http://www3.imperial.ac.uk/portal/pls/portallive/docs/1/7292119.PDF

BIBLIOGRAFIE

S-ar putea să vă placă și