Sunteți pe pagina 1din 107

ACADEMIA DE STUDII ECONOMICE DIN BUCURETI

FACULTATEA DE CIBERNETIC, STATISTIC I INFORMATIC


ECONOMIC

ILEANA GABRIELA NICULESCU-ARON

SONDAJE I ANCHETE
Suport de curs pentru nvmntul la distan

BUCURETI
2011
1

Copyright 2011, Ileana Gabriela Niculescu-Aron


Toate drepturile asupra acestei ediii sunt rezervate autorului

Editura ASE
Piaa Roman nr. 6, sector 1, Bucureti, Romnia
cod 010374

www.ase.ro
www.editura.ase.ro
editura@ase.ro

Refereni:
Prof. univ. dr. Constantin MITRU
Prof. univ. dr. Emilia IAN

ISBN 978-606-505-457-8

CUPRINSUL CURSULUI

INTRODUCERE
Unitatea de nvare 1.
NOIUNI DE BAZ N TEORIA SONDAJELOR
1.1 Obiectivele unitii de nvare
1.2 Metode de observare utilizate n domeniul economico-social
1.3 Rolul Sondajului statistic n sistemul informaional statistic
1.4 Definirea conceptelor de baz utilizate n sondajele statistice.
1.5 Procedee de eantionare utilizate

5
6
6
6
7
8
9

Unitatea de nvare 2.
ORGANIZAREA SONDAJELOR STATISTICE
2.1 Obiectivele unitii de nvare
2.2 Etape preliminare n organizarea unui sondaj
2.3 Elaborarea chestionarului
2.4 Ancheta pilot
2.5 Extragerea eantionului
2.6 Culegerea i verificarea datelor

14
14
14
18
26
26
28

Unitatea de nvare 3.
ASPECTE PRACTICE N REALIZAREA UNUI SONDAJ STATISTIC
3.1. Obiectivele unitii de nvare
3.2. Problematica non-rspunsurilor
3.3. Tipuri de erori ntlnite n cercetarea selectiv
3.4. Verificarea reprezentativitii eationului
3.5. Aplicaii

29
29
29
34
38
39

Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE
4.1. Obiectivele unitii de nvare
4.2. Sondajul simplu aleator
4.2.1. Sondajul simplu aleator cu probabiliti egale
4.2.2. Sondajul de volum redus
4.3. Sondajul stratificat
4.4. Sondajul de serii
4.5. Aplicaii

47
47
47
48
54
55
61
69

Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE
5.1. Obiectivele unitii
5.2. Sondajul multistadial
5.3. Sondajul multifazic
5.4. Sondajul pe baz de eantioane fixe
5.5. Aplicaii

87
87
87
90
91
95

Unitatea de nvare 6
SONDAJE NEPROBABILISTICE
6.1. Obiectivele unitii de nvare
6.2. Tipuri de sondaje neprobabilistice
6.3. Sondajul pe cote

101
101
101
102

BIBLIOGRAFIE

107

INTRODUCERE

Cursul de SONDAJE I ANCHETE se adreseaz studenilor nscrii la programul de studiu


ID, organizat de facultatea Cibernetic, Statistic i Informatic Economic i face parte din
planul de nvmnt aferent anului III, semestrul 1.

Obiectivele principale ale acestui curs, concretizate n competenele dobndite dup


parcurgerea i asimilarea lui:
nsuirea tehnicilor de proiectare a anchetelor i sondajelor statistice;
Codificarea, culegerea i verificarea completitudinii datelor;
nsuirea tehnicilor de proiectare a sondajelor complexe;
Prelucrarea i analiza datelor obinute cu ajutorul metodelor statistice superioare.

Cursul SONDAJE SI ANCHETE este structurat pe ase uniti de nvare (capitole).


Pentru ca procesul de instruire s se desfoare ntr-un mod riguros, dar i atractiv, se vor
putea utiliza un set de resurse suplimentare indicate pe parcursul cursului.

Evaluarea cunotinelor se va realiza sub dou forme:


evaluare continu, pe baza a dou proiecte realizate n conformitate cu modelele prezentate
n resursele de pe platform;
evaluare final, realizat prin examenul susinut n perioada de sesiune.

Criteriile de evaluare constau n:


1. Punctajul obinut la cele dou proiecte menionate;
2. Gradul de implicare n discuiile tematice organizate prin opiunea Forum a platformei
electronice;
3. Punctajul obinut la examenul susinut in sesiune.

Ponderile asociate fiecrui criteriu precizat sunt urmtoarele:


criteriul 1 (C1) Proiect 1: 1 punct
Proiect 2: 2 puncte.
criteriul 2 (C2) 1 punct pentru grad de implicare de 100%;
criteriul 3 (C3) 6 puncte pentru examenul susinut n sesiune.

Unitatea de nvare 1
NOIUNI DE BAZ N TEORIA
SONDAJELOR

Ce cuprinde aceast unitate de nvare?


1.1 Obiectivele unitii de nvare
1.2 Metode de observare utilizate n domeniul economico-social
1.3 Avantajele cercetrii selective
1.4 Definirea conceptelor de baz utilizate n sondajele statistice
1.5 Procedee de eantionare utilizate

1.1. Obiectivele unitii de nvare

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Importanta sondajului statistic in obinerea informaiilor n timp real


Conceptele de baz utilizate n cercetarea selectiv
Procedeele ce stau la baza formarii eantioanelor

1.2. Metode de observare utilizate n domeniul economico-social


Pentru satisfacerea nevoii de informaii n vederea analizrii fenomenelor i proceselor
din sfera social este necesar s se organizeze cercetri statistice. Cercetarea statistic se
realizeaz prin prelucrarea datelor preluate din alte forme de evideniere a fenomenelor
sociale sau prin prelucrarea datelor obinute prin observri statistice special organizate.
Observarea statistic se ocup de nregistrarea datelor individuale de mas, ceea ce
presupune soluionarea unor probleme metodologice i organizatorice complexe.

Principalele metode de culegere a datelor

Recensmntul
cea mai veche forma de observare statistic
se culeg datele de la toate unitile colectivitii
cheltuieli mari caracter periodic
rezolvarea unor probleme delicate prin complexitatea lor:
scopul observrii
scopul culegerii datelor
timpul la care se refer datele
sfera de cuprindere
elaborarea de definiii, clasificri i nomenclatoare etc.
Rapoarte statistice
observri totale, permanente
datele statistice referitoare la diferitele fenomene i procese sociale se culeg pe
cale administrativ
Sondaje statistice
observri pariale
Ancheta statistic
nu presupune reprezentativitatea eantionului
se realizeaz pe baza chestionarului completat direct sau prin pot
Observarea prii principale (masivul principal sau panelul)
culegere a datelor numai de la cele mai semnificative (masivul principal)
uniti ale colectivitii
Panelul eantion cu caracter stabil
cercetarea se face longitudinal
Monografia
metod de observare aprofundat a fenomenelor i proceselor sociale

1.3 Avantajele cercetrii selective


Cele mai evidente avantaje ale cercetrii prin sondaj fa de observarea tuturor
elementelor populaiei apar n dou cazuri: cnd observarea implic distrugerea elementelor
observate (de exemplu controlul calitii produselor) i cnd cercetarea total implic cheltuieli
foarte mari.1
Alte avantaje:

operativitate, economii de resurse (financiare i umane), calitate superioar a rezultatelor


pentru populaii totale foarte mari
erori de nregistrare mai mici i mai uor de nlturat pentru o populaie cercetat mai
mic dect cea total i folosind personal specializat calitate i fiabilitate a rezultatelor
net superioar celor obinute printr-o cercetare exhaustiv
caracterizarea mai aprofundat a fenomenelor studiate datorit posibilitii de a include
un numr mai mare de caracteristici dect n programul observrii totale

Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti p. 184.

Sondajul statistic poate fi folosit i la verificarea datelor culese printr-o observare total
de mare amploare precum i la prelucrarea datelor dintr-o cercetare exhaustiv ntr-o prim faz
selectiv i mai trziu total.
Sfera de cuprindere a informaiilor statistice este foarte larg incluznd toate fenomenele
cu caracter de mas. Totodat, informaia statistic este utilizat de ctre organele de conducere
la nivel micro i macroeconomic n exercitarea funciilor de previzionare, execuie i control.

1.4. Definirea conceptelor de baz utilizate in sondajele statistice.

Realizarea unui sondaj statistic presupune parcurgea a dou faze.

M(X) se mai noteaz i cu

**

m(x) se mai noteaz i cu

1.5. Procedee de eantionare utilizate


Pentru a se asigura reprezentativitatea eantionului este necesar s se respecte
urmtoarele principii:

n teoria i practica sondajului pentru formarea eantionului se folosesc mai multe


procedee i anume: eantionare aleatoare, eantionare dirijat i eantionare mixt.

10

11

Toate aceste procedee de eantioane se pot aplica direct populaiei totale sau pe grupe
ceea ce nseamn c se pot obine sondaje simple sau stratificate. La aplicarea procedeului de
selecie se pot folosi uniti simple numerotate de la 1 la N sau uniti complexe, denumite
serii numerotate de la 1 la R. n cel de-al doilea caz vom avea un sondaj de serii.

12

13

14

Unitatea de nvare 2
ORGANIZAREA SONDAJELOR
STATISTICE

Ce cuprinde aceast unitate de nvare?


2.1 Obiectivele unitii de nvare
2.2 Etape preliminare n organizarea unui sondaj
2.3 Elaborarea chestionarului
2.4 Ancheta pilot
2.5 Extragerea eantionului
2.6 Culegerea i verificarea datelor

2.1. Obiective

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Stabilirea obiectivelor unui sondaj pornind de la scopul urmarit de


beneficiar

Alegerea variabilelor auxiliare necesare in stabilirea planului de sondaj


Formularea intrebarilor pornind de la obiectivele propuse

2.2 Etape preliminare n organizarea unui sondaj


Sondajele statistice se bazeaz pe concepte, metode i procedee clar definite i se
aplic unei fraciuni mai mari sau mai mici din populaie. Calitatea rezultatelor depinde de
formularea corect a problemei, de selectarea unitilor din eantion, de precizia estimrii
parametrilor de interes. Efectuarea unui sondaj presupune un lan de lucrri complexe.

15

Prima sarcin este formularea obiectivelor sondajului. n general cei care comand
sondajul vin doar cu o formulare vag a problemelor care i intereseaz i cu o imagine
neclar asupra modului cum vor utiliza rezultatele obinute. n dialogul beneficiar-statistician,
sociologului i revine rolul de a i ajuta pe acetia s stabileasc obiectivele. Aceste probleme
vor fi apoi analizate pentru a structura forma de prezentare a rezultatelor i pentru a evalua
resursele financiare i umane necesare.
Cnd vorbim despre populaie avem n vedere nelesul statistic al noiunii care denot
mulimea unitilor simple sau complexe pe care le are n vedere cercetarea efectuat.
Fiecare sondaj are problemele sale proprii legate de delimitarea populaiei n timp i n spaiu.

Este foarte important s stabilim dac populaia cercetat este sau nu omogen i care
este structura acesteia n vederea realizrii unei eventuale stratificri. Tot aici este important
s delimitm unitile din care este constituit populaia. Facem distincie ntre:

Unitate de observare unitatea despre care se culege informaia


Unitatea de eantionare unitatea de la care se culege informaia

Baza de sondaj orice sistematizare a unitilor astfel nct s permit selectarea lor
ntmpltoare n vederea formrii eantionului. Bazele de sondaj pot fi elaborate de ctre cel
care organizeaz selecia sau pot fi preluate din listele electorale, lista abonailor posturilor
telefonice, lista adreselor potale, registre ale populaiei, registrul statistic al agenilor
economici, fiierul bilanurilor contabile, baze de date, hri, etc.

16

Condiiile pe care trebuie s le ndeplineasc o baz de sondaj sunt:

s fie adecvat scopului urmrit i s cuprind ntreaga populaie care va fi supus


sondajului;
s nu conin nregistrri repetate;
s fie exact, evitndu-se includerea unor uniti care n-ar trebui s figureze din
diferite motive;
s fie ct mai actual posibil. Chiar dac n momentul ntocmirii ei a fost complet i
exact timpul a erodat-o.

n funcie de resursele financiare i umane disponibile, dar i n funcie de acurateea


dorit a rezultatelor, se trece la stabilirea metodei de colectare a informaiei, care se poate
realiza sub urmtoarele forme:

Variante utilizate n practic:


1. la domiciliul su, persoana intervievat completeaz chestionarul pe loc sau operatorul
poate veni dup un timp pentru a recupera chestionarul completat;
2. chestionarele se aplic simultan unui numr mai mare de indivizi cuprini ntr-o sal;
17

3. chestionarele sunt trimise prin pot, fax;


4. chestionarul este publicat n ziare sau reviste
5. chestionarele sunt completate prin intermediul internetului (interviul online).
inovaie bine-venit n lumea sondajelor
numr mare de respondeni posibili i arie larg de acoperire ntr-un timp
foarte scurt
chestionarele online pot fi dinamice i contingente, cu salturi i ramificaii n
funcie de rspunsurile primite
pot oferi respondenilor materiale vizuale
nu este nc foarte clar dac n cazul sondajelor online calitatea informaiilor
este mai bun sau nu dect n alte cazuri
se aseamn cu sondajele administrate neasistat prin faptul c ne putem atepta
la niveluri crescute de non-rspunsuri nu este prezent nici un intervievator
care s i ndemne pe respondeni s rspund. Dar exist de asemenea dovezi
cum c respondenii iau chestionarul mai n serios i consum mai mult
energie cognitiv pentru sondajele online dect pentru cele prin telefon.
Problema principal: cum s reueti s ai un sondaj la care a rspuns
eantionul dorit;
Sumarul considerentelor mai importante n alegerea metodei de culegere a datelor este
prezentat n Tabelul urmator. Costul este aproape ntotdeauna o problem critic i poate cntri
mai mult dect alte considerente, dar nici celelelte criterii prezentate nu trebuie neglijate.
Criterii

Interviu
direct

Metoda de culegere
Interviu prin
Interviu prin
pot
telefon

Cost

Foarte
mare

Sczut pn
la moderat

Accesul la populaia int

Foarte
mare

Mare

Durata colectrii datelor


Infrastructura i personalul
necesar pentru administrare
Nivelul de complexitate al
chestionarului
Lungimea maxim a
chestionarului

Moderat
Foarte
mare

Mare
Sczut pn
la moderat

Ridicat

Rata de rspuns

Moderat pn la
ridicat

Interviu
online
Sczut
pn la
moderat

Moderat (exist
gospodrii far
telefon)
Rapid

Moderat

Moderat

Sczut

Moderat

Sczut

Moderat

Lung

Moderat

Moderat

Moderat

Moderat

Sczut

Sczut

Foarte
sczut

Capacitatea cognitiv necesar


a respondentului

Sczut

Ridicat

Moderat

Ridicat

Folosirea funciilor multimedia

Nu

Parial
(grafice
statice)

Nu

Da

Numrul de non-rspunsuri
pariale

Sczut

Moderat

Sczut

Control asupra ordinii


ntrebrilor la care se rspunde

Ridicat

Sczut

Ridicat

Abilitatea de a controla cine


rspunde

Ridicat

Sczut

Ridicat

18

Moderat

Moderat ridicat
Ridicat
prin
utilizarea
funciilor
Sczut

2.3. Elaborarea chestionarului


Dup stabilirea caracteristicilor cantitative i calitative n concordan cu obiectivele
sondajului se ntocmete chestionarul. Acesta este o etap crucial n realizarea sondajului.
Un chestionar prost conceput este cauza eecului ntregului studiu.
Chestionarul este un fel de plas ce colecteaz informaiile cutate i permite ca
informaiile fr valoare s fie filtrate.2

Elaborarea chestionarului necesit cunotine multidisciplinare, n sensul c necesit


mbinarea de informaii din mai multe discipline tiinifice (economie, statistic, matematic,
sociologie, psihologie, informatic).3
Construirea unui chestionar este privit n mod corect ca o art imperfect. Nu exist
proceduri prestabilite care vor duce neaprat la un chestionar bun. Una dintre consecine
este c ar putea aprea erori cauzate de ambiguitatea ntrebrilor de 20 sau chiar 30 de puncte
procentuale. Din fericire, astfel de erori extreme pot fi reduse considerabil prin bunul sim i
experienele altor cercettori.

2.3.1. Principii n elaborarea chestionarului


Un chestionar bun este acela care ndeplinete obiectivele cercetrii (n figura 2.3.1 este
prezentat schema elaborrii unui astfel de instrument). Sondajele trebuie construite dup
specificul scopurilor cercetrii i reprezint mult mai mult dect o colecie de ntrebri
neambigue. Exist foarte multe constrngeri asupra numrului, ordinii i formei ntrebrilor n
funcie de metoda de culegere a informaiilor. Dorina i abilitatea respondenilor de a rspunde,
ct i formularea i ordinea ntrebrilor, influeneaz formatul final al chestionarului.

2
3

Isaic Maniu Al., 2001, Tecnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 193.
Isaic Maniu Al., op.cit. pg. 194

19

Figura 2.3.1. Schema elaborrii unui chestionar


Pai logici de urmat pentru a realiza un chestionar bun

Planificarea a ceea ce se dorete a fi msurat


Formularea ntrebrilor astfel nct s faciliteze obinerea informaiilor
Hotrrea asupra ordinii i formulrii ntrebrilor i a aranjrii n pagin a
chestionarului
Testarea chestionarului, utiliznd un eantion de volum mic, pentru a evita omisiunile
i ambiguitatea
Corectarea problemelor (i o nou pretestare, dac este necesar)
Principii generale pentru ntocmirea chestionarului

Lungimea chestionarului - trebuie evitat tendina mririi numrului de ntrebri.


Dac chestionarul este prea lung constituie o surs de oboseal si plictiseal att pentru
operator ct i pentru respondent. Acest lucru va determina creterea proporiei nonrspunsurilor ce vor afecta reprezentativitatea eantionului. Pe de alt parte, un
chestionar prea scurt va lsa unele aspecte nelmurite n legtur cu obiectivele
propuse.
Evitarea acelor ntrebri la care respondenii s nu fie n msur s dea
rspunsuri utilizabile orice chestionar presupune existena unui dialog. Se impune
deci redactarea ntrebrilor intr-un limbaj adecvat populaiei creia ne adresm.
Succesiunea ntrebrilor ordinea ntrebrilor n chestionar poate influena
rspunsurile celor chestionai. n stabilirea ordinii ntrebrilor trebuie respectate
urmtoarele reguli (vezi figura 2.3.2):

succesiunea logic a ntrebrilor ce decurge din problematica abordat (organizarea


chestionarelor pe module) astfel nct s se poat rspunde cu uurin;

rspunsurile la o ntrebare s nu fie influenate de desfurarea anterioar a interviului.

ntrebrile de nceput trebuie s creasc interesul respondentului de a participa la


procesul intervievrii strnind curiozitatea astfel nct s justifice timpul i efortul
necesar participrii la interviu.

Natura exact a ntrebrilor de nceput depinde de metoda de intervievare

Interviul fa n fa sau prin telefon - scop: realizarea legturii operator respondent.


Tonul trebuie s fie prietenos i s prezinte interes i curiozitate din partea operatorului
(similar conversaiei dintre dou persoane care abia sau cunoscut).

20

Cererea de informaii demografice i economice la nceputul unui chestionar poate


sugera imaginea unui document oficial iar respondentul s nu fie motivat n a ncepe s
l completeze.

Restul chestionarului se orienteaz spre sarcinile corespunztoare studiului.


ntrebrile de la mijloc sunt concentrate pe informaiile necesare n conformitate cu
obiectivele fixate. Aici se pot plasa i ntrebrile de atitudine, preferine i opinii.

ntrebrile delicate ar trebui plasate la mijlocul sau la sfritul chestionarului, dup ce


s-a stabilit relaia i interesul. Nivelul de sociabilitate poate minimiza jena i rezistena
la rspuns

Figura 2.3.2. Succesiunea ntrebrilor ntr-un chestionar

Un chestionar bine ntocmit reprezint cheia succesului unui sondaj. Dac chestionarul
prezint deficiene, informaiile obinute pot fi incomplete, fcnd imposibil o analiz
complex. Nicio corectare posterioar nu poate remedia o astfel de situaie.
21

2.3.2. Tipuri de ntrebri utilizate

La aceste ntrebri respondentul este rugat s aleag o variant sau mai multe dintr-o
list, s realizeze o ierarhie sau s dea o valoare n catul variabilelor numerice

Avantaje

gama variat de rspunsuri ce poate fi obinut


lipsa influenei asupra ntrebrilor din cadrul categoriilor prespecificate
respondenii consider asta adesea drept libertate, dup cum se poate vedea din frecvena
surprinztoare cu care oamenii noteaz comentarii pe marginea sondajelor prin pot
atunci cnd consider c sentimentele lor nu sunt descrise corect de categoriile de rspuns.

Dezavantaje

variabilitatea n ceea ce privete claritatea i profunzimea rspunsurilor depinde ntr-o


mare msur de:
fluena respondentului ntr-o anumit situaie a interviului
dorina de a compune un rspuns scris ntr-un sondaj prin pot
abilitatea personal sau telefonic a intervievatorului de a nregistra verbatime repede
sau de a sumariza rapid

22

Tipul
ntrebrii
nchise

Deschise

Avantaje

Dezavantaje

uurina completrii chestionarului


precizarea coninutului ntrebrii
necesit timp scurt pentru rspuns
uniformitatea nelegerii ntrebrilor
i a nregistrrii rspunsurilor
uurina codificrii i evitarea erorilor
n realizarea acesteia
uureaz munca operatorilor
rapiditatea i uurina prelucrrii
permite compararea grupurilor
faciliteaz efectuarea testelor de
semnificaie
spontaneitatea rspunsurilor
indic fidel nivelul cunotinelor
subiectului asupra problemei
investigate
indic elementele crora subiectul le
acord cea mai mare importan
evit consecinele efectelor de format
specifice ntrebrilor nchise (prin
limitarea i ordonarea rspunsurilor)

- pierderea spontaneitii rspunsurilor


- limiteaz cmpul opiunilor celor
intervievai
- induce o ordine de preferin prin
ordinea nscrierii variantelor n
chestionar
- sporete artificial frecvena
rspunsurilor nu tiu/nu rspund

23

- lungete timpul de completare a


chestionarului
- cer un efort suplimentar
respondentului
- rata de non-rspuns este mai mare
dect la ntrebrile nchise
- sunt foarte dificil de codificat i
analizat;nu ofer nici o informaie
respondenilor despre tipul de
rspuns ateptat de la ei

ntrebri factologice vizeaz situaii ce caracterizeaz subiecii


furnizeaz informaii ce ar putea fi obinute i prin metoda observaiei dac aceasta nar presupune eforturi prea mari
n cazul ntrebrilor factologice de clasificare sau identificare, informaiile permit
identificarea caracteristicilor diferitelor grupuri de respondenti.
lsate de obicei la sfritul chestionarului
excepie: sondajul pe cote (ntrebrile factologice ce formeaz criteriile de cot
vor fi puse la nceputul chestionarului pentru a vedea dac persoana
corespunde sau nu criteriilor de formare a eantionului)
ntrebri de opinie sau atitudine vizeaz aspecte ce in de universul interior al
individului (prerile, ateptrile, evalurile, ataamentul fa de valori, explicaiile
fenomenelor din jur, comportament etc.)
ntrebrile de cunotine au un specific foarte clar i au ca scop caracterizarea
nivelului de cunotine al subiectului
pot fi utilizate i ca ntrebri de control, validnd sinceritatea si capabilitatea
subiectului
ntrebri filtru permit bifurcarea succesiunii ntrebrilor n chestionar printr-un salt
ctre o alt zon de continuitate n interviu.

2.3.3. Tipuri de scale utilizate si caracteristicile acestora


Scala

Variabila

nominal

calitativ

ordinal

calitativ

cardinal

calitativ

proporional

cantitativ

Proprieti
Echivalena ntre
treptele scalei
Ierarhizare ntre
treptele scalei
Msoar diferenele
dintre treptele scalei
Punctul zero natural
24

Operaii permise
Frecvene absolute i relative, modul,
coeficient de asociere, testul 2
n plus: cuartile, coeficienii de corelaie
a rangurilor
n plus: medii de calcul, dispersii,
corelaia parametric, regresia, testele
parametrice
Toate operaiile

Scala binar cea mai simpl modalitate


Respondentul este solicitat s aleag ntre dou poziii diametral opuse: da sau nu; acord
sau dezacord; adevrat sau fals.
Difereniala semantic scal cu alegere multipl cu 5 sau 7 trepte
Respondentul trebuie s plaseze rspunsul ntr-una din boxele dintre dou atribute bipolare
extreme.
Scala lui Likert tot o scala cu alegere multipl cu 5 trepte
Respondentul este rugat sa-si plaseze atitudinea fa de un subiect ntre acord total, acord,
indiferent, dezacord i dezacord total.
O problem controversat cu privire la difereniala semantic i scala lui Likert este
dac s includem sau nu alternativele de mijloc n chestionare. Experiena a dovedit c
exist o tendin de cumulare a rspunsurilor ctre centrul scalei (de exemplu nici
acord nici dezacord) ceea ce din punct de din punct de vedere analizei reprezint lips
de informaie.
Scala tip rating
Respondentul trebuie s rspund la o ntrebare dnd note de la 0 la 10 (sau 100) .

25

2.4. Ancheta pilot


n comparaie cu multe alte tipuri de cercetare, cercetarea prin sondaj beneficiaz de
testarea n lumea real a chestionarelor i a tehnicilor de administrare a sondajului.
Ancheta pilot este o repetiie general a sondajului propriu-zis absolut necesar n
special n anchetele mari. Volumul i schema anchetei pilot reprezint o problem
dependent de timp, mijloace financiare i mai ales de aspectele ce se cer rezolvate. 4
Informaii ce pot fi furnizate de ancheta pilot:

Cheltuielile i durata probabil a anchetei.


Proporia anticipat de non-rspunsuri
Numrul posibil de refuzuri sau de necontactri poate fi estimat i se poate compara
eficacitatea diferitelor ci de reducere a acestora se poate opta pentru o anumit
metod de culegere a datelor, se pot exclude unele ntrebri sau se poate modifica
ordinea lor.
Gradul de variabilitate al populaiei i structura acesteia n cazul n care nu se cunosc
suficiente informaii necesare caracterizrii populaiei analizate n vederea stabilirii
planului de sondaj ce se poate aplica i calculrii volumului eantionului.
Pretestarea chestionarului cel mai important rol al anchetei pilot. Dup ce a fost
elaborat, chestionarul trebuie aplicat unui eantion de volum redus selectat aleator, de
persoane din populaia supus cercetrii. Astfel se pot detecta deficiene ale
chestionarului ce nu au fost observate, pot fi identificate probleme n zona
introductiv, n alegerea tipurilor de ntrebri, n formularea i succesiunea
ntrebrilor. Se au n vedere urmtoarele probleme:
simplitatea mnuirii chestionarului pe teren
eficacitatea punerii n pagin
claritatea ntrebrilor (un numr prea mare de rspunsuri nu tiu impune
reformularea ntrebrii respective)
accesibilitatea limbajului i claritatea exprimrii

Isaic Maniu Al.,2001, Tehnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 181.

26

sensibilitatea chestionarului, mai ales la ntrebrile ce testeaz atitudini. Este


posibil ca dup analiza rspunsurilor la ntrebrile deschise s se recurg la
nchiderea acestora.
analiza chestionarelor completate de prob poate arta dac operatorii au
neles corect instruciunile verificnd eficacitatea lor lor i a ndrumrii
operatorilor.
pretestarea este un pas important n procesul de design al chestionarului. Ea nu
trebuie ignorat.

2.5. Extragerea eantionului


n aceast etap se stabilete planul de sondaj, procedeul de extracie, mrimea
eantionului, estimatorii i precizia lor teoretic.
La organizarea unei cercetri prin sondaj una din problemele principale de rezolvat
este dimensionarea raional a eantionului. Pentru a stabili aceast mrime este necesar un
studiu amnunit al populaiei supuse cercetrii. Nu trebuie ns exagerat nsemntatea
stabilirii unei anumite mrimi a eantionului i nici nu trebuie s se cread c dac o stabilim
cu precizia necesar, reuita sondajului este asigurat.5
Pentru a putea calcula volumul eantionului trebuie s cunoatem, chiar cu o
aproximaie, dispersia populaiei sau o estimaie a acesteia. n practic ntlnim urmtoarele
situaii:

Se preiau informaii despre gradul de variaie din cercetri anterioare (considernd c


variabilitatea caracteristicii nu s-a modificat semnificativ);
Se organizeaz o cercetare prealabil pentru estimarea dispersiei, a legii de repartiie;
se introduce n relaia de calcul valoarea maxim posibil a dispersiei. Determinarea ei
se face n dou situaii:

(xmin x )2 (xmax x )2
2
2
o cazul caracteristicilor calitative (se consider p=0,5): max
=p(1-p)=0,25

o cazul caracteristicilor cantitative: max

n cazul n care avem mai multe variabile auxiliare, o vom alege pe aceea al crei coeficient
de variaie este maxim. Astfel vom avea estimaii cu precizie i siguran n limita admis
pentru toate celelalte caracteristici.
Mrimea eantionului este determinat de:

Modul n care urmeaz s fie analizate rezultatele. Dac se are n vedere analiza pe
subgrupe se va calcula volumul eantionului astfel nct s se obin precizia dorit pe
fiecare subgrup.
Restricii de ordin financiar pornind de la costurile admisibile. Resursele financiare
sunt totdeauna limitate i de multe ori mrimea necesar a eantioanelor nu poate fi
realizat. Recurgem la ingeniozitatea i discernmntul n alegerea acelor subiectecare
pot fi abordate cu resursele disponibile.

Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti, p. 235.

27

Ca urmare a problemelor ce apar pe teren, n ncercarea diminurii efectelor acestora,


dup calcularea volumului eantionului teoretic, trebuie s determinm care este volumul
eantionului de pornire astfel nct n final s ajungem la numrul teoretic de uniti selectate.
Situaii posibile:
Imperfeciunea listei utilizate ca baz de sondaj determin existena unor uniti
non-valide (uniti care n-ar trebui s figureze pe list dac aceasta ar corespunde
perfect populaiei studiate). Trebuie estimat aceast proporie astfel nct s putem
determina ct mai precis volumul de pornire al eantionului.
Existena unitilor non-eligibile (de exemplu dac populaia de interes este format
din populaia n vrst de munc iar unitatea de selecie este gospodria, persoanele ce
nu ndeplinesc condiia de vrst sunt considerate non-eligibile).
Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Anticipnd rata
non-rspunsurilor nc din faza de proiectare a sondajului putem redimensionarea
eantionului.
Eantionul de pornire se calculeaz pe baza relaiei: n p n th 1 1 1
Pr

Pe

Pv

np= volumul eantionului de pornire


nth= volumul eantionului teoretic
Pr=proporia de rspuns
Pe=proporia de eligibilitate
Pv=proporia de validitate
n p nth

1 1 1

Pr Pe Pv

2.6. Culegerea i verificarea datelor


Odat cu recuperarea chestionarelor se trece la pregtirea acestora n vederea
prelucrrii statistice a datelor.
Verificarea chestionarelor este o operaie obligatorie deoarece, orict de buni ar fi
operatorii, greelile sunt inerente muncii omeneti. Aceast verificare const n urmrirea n
principal a trei aspecte: completitudinea, exactitatea i uniformitatea.
Exactitatea i uniformitatea datelor
Principala modalitate de verificare a exactitii: parcurgerea chestionarului n
ansamblul su ncercnd s se vad dac rspunsurile sunt coerente sau se contrazic.
Este foarte important de tiut dac operatorii sau subiecii au neles n acelai sens ntrebrile
din chestionar. Dac dup parcurgerea unui numr de chestionare observm astfel de deosebiri
de interpretare, rezultate obinute sunt inconsistente.
Aceste probleme pot fi evitate printr-o atent ntocmire a chestionarului, validarea
acestuia printr-o anchet pilot i o instruire riguroas a operatorilor.
2. Completitudinea datelor
Prin centralizrea datelor din chestionarele completate obinem o baz de date.
Golurile din aceast baz de date reprezint nonrspunsuri pariale. Dac lipsesc valorile unui
individ pentru toate ntrebrile din chestionar suntem n situaia unui nonrspuns total.
28

Unitatea de nvare 3
ASPECTE PRACTICE N REALIZAREA
UNUI SONDAJ STATISTIC

Ce cuprinde aceast unitate de nvare?


3.1. Obiectivele unitii de nvare 3
3.2. Problematica non-rspunsurilor
3.3. Tipuri de erori ntlnite n cercetarea selectiv
3.4.Verificarea reprezentativitii eantionului
3.5. Aplicaii

3.1. Obiectivele unitii de nvare

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Importanta sondajului statistic n obinerea informaiilor n timp real


Conceptele de baz utilizate n cercetarea selectiv
Procedeele ce stau la baza formrii eantioanelor

3.2. Problematica non-rspunsurilor


n urma centralizrii datelor pentru chestionarele completate se va obine baza de date
sub forma tabelului indivizi variabile reprezentat n figura 3.2.1. Informaiile lips reprezint
non-rspunsurile pariale respectiv non-rspunsurile totale.
Nonrspunsurile reprezint o problem de care nici un investigator al colectivitilor
umane nu poate scpa. Dac numrul de non-rspunsuri este mare rezultatele sondajului vor fi
afectate de aceast situaie.

29

Nr.
Chest.
1
2

npornire

ntrebarea

Non-rspuns
parial

Non-rspuns
total
Figura 3.2.1. Tabloul indivizi-variabile

30

A.2.1. Imputaia deductiv se refer la acele situaii (rare n practic) n care se poate
stabili valoarea corect printr-o deducie logic. Este vorba de o modalitate determinist de a
corecta datele incorecte sau nevalidate. n acest caz yij = yij.
A.2.2. Imputaia predictiv prin mediere global se realizeaz nlocuind non-rspunsul
de pe poziia (i,j) cu media rspunsurilor care au fost obinute la ntrebarea j. n acest caz
avem:
r

y'ij y r, j yij r
i 1

unde r este numrul rspunsurilor valide la ntrebarea j.


Avantajul acestei metode este c nlocuirea valorii lips se face cu o valoare probabil
ceea ce i d un oarecare grad de stabilitate. Dac exist muli respondeni care nu au rspuns
la ntrebarea j vom folosi pentru toi aceeai imputaie. Dezavantaj: se produce o subevaluare
sever a dispersiei estimatorului pentru media sau totalul caracteristicii yj.
n cazul n care caracteristica este reprezentat pe o scal de intervale sau proporional
calcularea mediei aritmetice se va nlocui cu o medie de poziie (mediana n cazul unei
variabile ordinale sau modulul pentru variabilele nominale).
31

A.2.3. Imputaia predictiv prin mediere pe clase este similar imputaiei predictive
prin mediere global, cu deosebirea c nu se utilizeaz o singur imputaie, ci mai multe,
corespunztoare unor clase n care a fost mprit mulimea respondenilor. Astfel,
partiionm mulimea respondenilor r la ntrebarea j n q clase disjuncte. Identificm clasa
cruia i aparine individul i construim imputaia:
k

y' ij y rjt y ij k
i 1

unde t ia valorile 1,..,q iar k este numrul de respondeni din clasa respectiv.
Utilizarea acestui tip de imputaie reduce gradul de subestimare a dispersiei
estimatorului.
O variant a acestei metode este imputaia calculat ca medie a valorilor vecinilor
valorii lips. Aceast metod poate fi implementat automat i sub softwareurile statistice
specializate, avnd posibilitatea selectrii tipului de medie pe baza creia se va calcula
imputaia i a numrului de vecini ce vor forma baza de calcul.
A.2.4. Imputaia hot-deck. Este utilizat la scar larg deoarece, spre deosebire de
imputaia prin mediere global sau pe clase, evit subestimarea dispersiei estimatorului6.
Pentru aplicarea acestei metode se parcurg urmtoarele etape:
Etapa1: fiierul ce conine baza de date este n prealabil sortat dup caracteristicile
demografice, economice sau sociale pe baza crora se poate pune n eviden structura
eantionului.
Etapa 2: Un registru de lucru este iniializat cu valorile aferente cmpurilor cuprinse n
prima nregistrare a unei caracteristici dup care s-a realizat sortarea.
Etapa 3: Fiierul se parcurge nregistrare cu nregistrare si fiecare cmp este identificat i
verificat s nu conin valori lips.
Etapa 4: n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.
A.2.5. Imputaia cold-deck. Este o variaie a metodei hot-deck i const n nlocuirea
valorilor lips cu date provenite din alte surse dect sondajul curent cum ar fi sondaje
anterioare sau recensminte. Este necesar ca populaia sondajului din care se preiau valorile s
fie foarte asemntoare cu cea asupra cruia se realizeaz sondajul n prezent iar modul de
definire i de codificare a variabilelor supuse procesului de imputare s fie identic. Imputaia
cu care se va nlocui valoarea lips este selectat aleator din baza de date aferent sondajului
anterior.
Aceast metod prezint dezavantajul c imputaia utilizat nu provine din sondajul
curent motiv pentru care este mult mai rar utilizat.
A.2.6. Imputaia aleatoare. Const n alegerea aleatoare din mulimea respondenilor
sau dintr-o clas, a unui donator h din mulimea de r respondeni la ntrebarea j. n acest
caz avem: y'ij y hj
Este o variant a imputaiei hot-deck iar principalul avantaj fa de aceasta este c prin
selecia aleatoare a imputaiei nu mai este necesar sortarea fiierului dup diferite
caracteristici.

Levy P.S., i Lemeshow S., 2000, Sampling of Populations, Third Edition Ed. John Wiley&Sons New York p.
411.

32

A.2.7. Imputaia obiectiv. La baza acestei metode st generarea unei ecuaii de regresie
pe baza setului de date ce conin nregistrri complete ale variabilei ce urmeaz a fi supuse
procesului de imputare. Ecuaia poate avea urmtoarea form:
y b0 b1 x1 b2 x 2 ...... bk x k
unde y este variabila ce urmeaz a fi imputat pentru valorile date ale variabilelor xi, i=1,,k
corelate cu variabila y.
Imputaiile obinute n aceast manier sunt superioare celor provenite n urma aplicrii
metodelor prezentate anterior, deoarece ea se armonizeaz cu restul nregistrrilor individului
respectiv. Aplicarea acestei metode permite obinerea unui estimator nedeplasat al mediei i
nu subevalueaz dispersia acestuia7.

B.1. Reselecia pentru non-respondeni


metod utilizat pentru tratarea non-rspunsurilor totale
n funcie de restriciile de timp i de buget, se poate face o reselecie pentru
non-respondeni
mprim n mod formal populaia de volum N n dou straturi: cel al respondenilor,
de volum N1, i cel al non-respondenilor, de volum N2. Privim situaia ca a unui
sondaj organizat n dou faze. (figura 3.2.2.).

Respondeni
N1

Faza 1

Respondeni
n1

Non-respondeni
n2

Faza 2

Non-respondeni
N2

Figura 3.2.2. Organizarea reseleciei pentru non-respondeni


n prima faz se construiete eantionul E de volum n. Eantionul va conine n1
respondeni ai subeantionului E1 i n2 non-respondeni ai subeantionului E2.
Variabila aleatoare w1=n1/n este un estimator nedeplasat al lui p1=N1/N (ponderea
respondenilor). Presupunem c parametrul de interes este media Y . Pe baza
subeantionului E1 putem calcula un estimator asociat primei faze ca in figura 3.2.2.
7

Levy P.S., i Lemeshow S., 2000 , Sampling of Populations, Third Edition Ed. John Wiley&Sons New York p.
412.

33

n a doua faz a sondajului formm un eantion E2 de volum m prin selecie


aleatoare fr revenire din E2. Prin eforturile fcute de operatorul de sondaj i prin
eventuale recompensri eantionul va conine doar respondeni. Putem acum calcula
un estimator asociat celei de a doua faze (figura 3.2.2.)
Estimatorul parametrului Y construit pe baza celor dou faze are forma:
n
n
y 1 y1 2 y 2
n
n
Metoda reseleciei pentru non-respondeni are avantajul c genereaz un estimator
nedeplasat al parametrului de interes
Dezavantaj determin o cretere substanial a costului sondajului deoarece cerina
ca n a doua faz s se obin rspunsuri complete impune eforturi organizatorice i
financiare deosebite.
B.2. Metoda post-stratificrii i a calibrrii generalizate
Utilizarea acestor metode necesit utilizarea unor informaii deteliate privind
repartiiile ncrucisate dup mai multe variabile auxiliare, o dotare tehnic superioar
i un soft specializat i sunt utilizate pentru tratarea non-rspunsurilor totale.

3.3. Tipuri de erori ntlnite n cercetarea selectiv

34

35

36

BAZA DE SONDAJ
POPULAIA INT
Arie acoperit de
baza de sondaj, dar
care nu face parte din
populaia int

Arie neacoperit

Figura 3.2.3 Formarea erorilor de acoperire

B.2.1. Erorile efective se pot calcula pentru caracteristicile la care s-au obinut date i dintr-o
observare total
Considernd c media este indicatorul sintetic cel mai reprezentativ, eroarea efectiv de
sondaj se calculeaz ca diferen ntre media eantionului i media colectivitii totale
La verificarea reprezentativitii eantionului se pornete de la compararea structurii pe
grupe a colectivitii de selecie cu cea a colectivitii generale, denumit i structur
programat. n cazul n care aceste structuri nu difer cu mai mult de 5% se accept
eantionul ca fiind reprezentativ.
De cele mai multe ori n cercetarea concret nu se dispune de date cu privire la ntreaga
colectivitate pentru a putea verifica n ce msur media este sau nu reprezentativ. n
acest caz se pot efectua selecii succesive pentru a verifica gradul de stabilitate al mediei
i dispersiei, eroarea efectiv de reprezentativitate calculndu-se astfel:
dx x x

i respectiv d x %

xx
100
x

unde x este media mediilor seleciilor.


Verificarea reprezentativitii eantionului se poate realiza comparnd distribuia
populaiei cu cea a eantionului cu ajutorul testelor statistice
sau Kolmogorov-Smirnov.
B.2.2. Dei erorile de reprezentativitate ntmpltoare nu pot fi evitate, ele pot fi
calculate cu anticipaie dac sondajul este probabilistic, obinndu-se erorile probabile.
Estimaia parametrilor din populaia general se va putea face pe baza indicatorilor obinui
din prelucrarea datelor de sondaj cu o eroare medie de reprezentativitate care se gsete
ntr-un interval probabilistic. Fiecrui indicator derivat sau sintetic trebuie s i se ataeze i

37

eroarea sa de reprezentativitate pentru a putea fi generalizat la ntreaga populaie. Modul de


calcul al acestor erori depinde de tipul de sondaj utilizat.
Tocmai posibilitatea unor astfel de calcule i a analizelor respective face din metoda
sondajului un instrument viabil de cercetare.

3.4. Verificarea reprezentativitatii esantionului


nainte de a trece la analiza statistic i la interpretarea rezultatelor este important s
stabilim dac eantioanele sunt sau nu reprezentative pentru populaiile din care au fost
selectate. Dac diferenele dintre parametri cunoscui din populaie fa de valorile
estimatorilor obinui pe baza datelor din sondaj sunt semnificative atunci eantionul nu este
reprezentativ.
Pentru a vedea dac exist diferene semnificative fa de valoarea cunoscut din populaie a
ponderii fetelor fa de cea din n eantion se utilizeaz testul z (eantionul este de volum
normal) pentru compararea proporiei din eantion cu cea din populaie.
Ipotezele testului bilateral sunt: H0 : x = X 0 i H1: x X 0 .iar valoarea calculat a testului
este: zc

x X0

Valoarea calculat luat n valoare absolut se compar cu cea teoretic de 1,96


corespunztoare nivelului de semnificaie ales (=0,05) i, deoarece este mai mic dect
aceasta se accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
H0 : w= p i H1: w p .iar valoarea calculat a testului este: z c

wp
p 1 p

Pentru o probabilitate de garantare a rezultatelor de 95% cruia i corespunde un nivel de


semnificaie =0,05 n cazul efecturii unui test bilateral valoarea teoretic este z =1,96.
1

Ipotezele testului sunt:


H0 : ft= fe i H1: ftfe unde ft reprezint frecvenele teoretice iar fe frecvenele empirice.
Frecvenele empirice sunt cele obinute n urma centralizrii datelor din sondaj iar cele
teoretice se calculeaz dup relaia: fti Fti N n ( Fti fiind frecvena corespunztoare a grupei
i din populaie).
k
2

Valoarea calculat a testului este: c

i 1

f ei f ti 2
f ti

= Valoarea teoretic pentru un nivel de

semnificaie =0,05 i numrul de grade de libertate df=k-1=5-1=4 este de 9,49. Deoarece


c 2 0,05;df 4 2 se respinge ipoteza nul putnd spune c cele dou distribuii nu concord
i, deci eantionul nu este reprezentativ.
1. Testul Kolmogorov este unul dintre cele mai rspndite teste de concordan a
repartiiilor empirice i teoretice pentru variabile aleatoare continue.
Pentru efectuarea testului este necesar alctuirea claselor i stabilirea frecvenelor absolute
empirice i teoretice (n funcie de repartiia testat). Ulterior se cumuleaz aceste frecvene
cresctor i prin raportarea lor la total se obin funciile de repartiie empirice (Fn(x)) i
teoretice (F(z)).

38

Se calculeaz pe clase diferena lor i se ia diferena maxim n valoare absolut. Pe baza ei se


obine statistica a testului Kolmogorov astfel: c n max Fn( x) F(z) , unde n este
volumul eantionului.
Valoarea calculat c se compar cu valoarea teoretic tabelat n funcie de nivelul de
semnificaie. Unui =0,05 i corespunde =1,36. Dac < repartiia empiric este n
concordan cu cea teoretic.
Testul Kolmogorov Smirnov este o extindere a testului Kolmogorov pentru cazul verificrii
concordanei a dou repartiii empirice. Notnd cele dou variabile aleatoare cu x i y se
n 1 n 2
.;
calculeaz o valoare c dup relaia urmtoare: c max F( x ) F( y)
n1 n 2
unde F(x) i F(y) reprezint funciile repartiiilor empirice ale celor dou variabile.
Se compar apoi valoarea calculat cu cea teoretic. Dac c < repartiiile sunt n
concordan.

3.5. Aplicaii
Aplicaie 1
n urma centralizrii rspunsurilor obinute dintr-un sondaj n rndul studenilor unei
universiti au rezultat datele prezentate n tabelul 3.5.1
Definirea variabilelor:
STRAT. Sondajul s-a realizat dup un plan stratificatastfel: 1 anul I, 2 anul II, 3 anul
III i 4 anulIV.
SEX. 1 feminin, 2 masculin.
MEDIE. Este variabil numeric i reprezint media obinut n sesiunea din iarn.
NRORE. Este variabil numeric i reprezint numrul de ore de studiu pe sptmn
n afara sesiunii.
ACORD. Este variabila obinut n urma centralizrii rspunsurilor la ntrebarea: n
ce msur suntei de acord cu modificrile survenite n nvmntul superior?.
Codurile reprezint: 1 dezacord total, 2 dezacord, 3 indiferent, 4 acord i 5 acord total.
Se cere:
1. S se nlocuiasc valorile lips ale variabilei NRORE folosind imputaia predictiv prin
mediere global, imputaia predictiv prin mediere pe clase i imputaia obiectiv.
2. S se nlocuiasc valorile lips ale variabilei ACORD folosind imputaia hot-deck.

Rezolvare
1. Notm cu yij rspunsul pe care l d individului i din eantionul E la ntrebarea j (i=1,..,n,
j=1,... ,p). Concentrndu-ne asupra individul i din eantion constatm c vectorului (yi1,
...., yip), format din rspunsurile la ntrebrile din chestionar, i lipsesc unele componente
(non-rspunsurile). Fiecare poziie de coordonate (i,j) trebuie tratat separat, prin crearea
unei valori yij numit valoare atribuit sau imputaie.

39

Imputaia predictiv prin mediere global


Calculm media rspunsurilor obinute la ntrebarea j:
r

119
5.17
23
i 1
unde r este numrul rspunsurilor valide la ntrebarea j.
Toate cele 7 valori lips se vor nlocui cu 5.17 (vezi tabelul 3.5.2 variabila NROREIG).
Avantajul acestei metode este c nlocuirea valorii lips se face cu o valoare probabil ceea ce
i d un oarecare grad de stabilitate. Dac exist muli respondeni care nu au rspuns la
ntrebarea j vom folosi pentru toi aceeai imputaie. Este clar c se produce o subevaluare
sever a dispersiei estimatorului pentru media sau totalul caracteristicii yj.
y'ij y r, j yij r

Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4

SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2

MEDIE
7
8.33
6.67
9.67
6.33
7.8
9.67
8
7.2
8.8
6.33
7
8.8
8.2
7.9
8.8
6.67
9.33
8.33
7.7
8.2
5.67
9.2
9.33
8.9
7.8
8.2
8.9
7.9
7.5

40

NRORE
3
4
3
10
4
11
3
6
4
4
6
5
5

Tabel 3.5.1
ACORD
2
2
3
4
2
1
2
2
4
5
1
1
3
4

9
6
5
5

4
2

2
2
3

7
6
7
5
4

2
1
2

Imputaia predictiv prin mediere clase


Partiionm mulimea respondenilor r la ntrebarea j n 4 clase disjuncte, cate una pentru
fiecare strat. Identificm clasa cruia i aparine individul i construim
k

imputaia: y'ij y rjt y ij k


i 1

unde t ia valorile 1,..,4 iar k este numrul de respondeni din clasa respectiv,
Deoarece exist patru straturi se vor calcula 4 imputaii.
k
k
23
32
y'1ij y rj1 yij k
4.6 y' 2ij y rj2 y ij k
4.57
5
7
i 1
i 1
k
k
37
27
y' 3ij y rj3 yij k
6.17 y' 42ij y rj4 yij k
5.4
6
5
i 1
i 1
n tabelul 3.5.2 variabila NROREIC este obinut n urma aplicrii acestei metode. Utilizarea
acestui tip de imputaie reduce gradul de subestimare a dispersiei estimatorului.

Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4

SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2

MEDIE
6
8.33
5.67
9.67
5.33
7.8
9.67
8
7.2
8.8
6.33
6.33
8.8
8.2
7.9
8.8
5.67
9.33
8.33
7.7
8.2
5.67
9.2
9.33
8.9
7.8
8.2
8.9
7.9
7.5

NRORE
2
4
3
10
4
9
3
5
2
3
5
5
5

8
6
4
5
9
7
6
7
4
3

41

NROREIG
2
4
3
10
5.17
4
9
5.17
3
5
2
3
5
5
5
5.17
5.17
8
6
4
5
5.17
9
5.17
7
6
7
5.17
4
3

NROREIC
2
4
3
10
4.6
4
9
4.57
3
5
2
3
5
5
5
6.17
6.17
8
6
4
5
6.17
9
5.4
7
6
7
5.4
4
3

Tabel 3.5.2
NROREIO
2
4
3
10
0.49
4
9
5.19
3
5
2
3
5
5
5
6.60
1.09
8
6
4
5
1.09
9
7.53
7
6
7
6.78
4
3

Imputaia obiectiv
Pentru setul de date ce nu conine valori lips pentru variabila NRORE se stabilete forma
ecuaiei de regresie ce are ca variabil independent MEDIA. n figura 3.5.1 este reprezentat
grafic legtura dintre MEDIE i NRORE.

Fig. 3.5.1 Nr. ore studiu n funcie de media obinut n sesiunea din iarn

Pe baza ecuaiei de regresie y = 1.761x - 8.8953 se determin imputaiile cu care se vor


nlocui non-rspunsurile variabilei NRORE (vezi tabelul 3.5.2 variabila NROREIO).
De exemplu pentru prima valoare lipsa a Variabilei NRORE, MEDIA este 5.33. Introducem
aceasta valuare in ecuaia de regresie i obinemvaloarea imputaiei obiective 0.49.
2. Imputaia hot-deck.
Pentru aplicarea acestei metode se parcurg urmtoarele etape:
Etapa1. Fiierul ce conine baza de date este n prealabil sortat dup caracteristicile
demografice, economice sau sociale pe baza crora se poate pune n eviden structura
eantionului. Deoarece n tabelul 3.1 datele sunt deja sortate dup STRAT i SEX se poate
trece la etapa urmtoare.
Etapa 2. Un registru de lucru este iniializat cu valorile aferente cmpurilor cuprinse n prima
nregistrare a unei caracteristici dup care s-a realizat sortarea. n tabelul 3.5.3 este prezentat
registrul de lucru constituit.
Tabel 3.5.3
STRAT SEX
ACORD
1
1
2
1
2
2
2
1
2
2
2
1
3
1
3
3
2
2
4
1
2
4
2
1

42

Etapa 3. Fiierul (tabelul 3.5.1) se parcurge nregistrare cu nregistrare i fiecare cmp este
identificat i verificat s nu conin valori lips.
Etapa 4 . n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.
Rezultatul implementrii acestei metode este prezentat n tabelul 3.5.4.
De exemplu nregistrarea cu numarul 9 conine valoare lips pentru variabila ACORD.
nregistrarea face parte din STRAT 2 iar variabila SEX este 1-masculin. Valoarea
corespunztoare din registru este 2. nlocuim cu aceast valoare nonrspunsul parial.

Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4

SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2

ACORD
2
2
3
4
2
1
2
2
4
5
1
1
3
4
4
2
2
2
2
3
2
1
2

Tabelul 3.5.4
ACORDM
2
2
3
4
2
1
2
2
2
4
5
1
1
1
3
4
3
4
2
2
2
2
2
3
2
2
1
1
2

Aplicaie 2
S-a realizat un sondaj n rndul studenilor unei universiti partiulare pe un eantion de 90
persoane. n urma centralizrii datelor pentru variabilele auxiliare SEX i MEDIE (media
ultimei sesiuni) au rezultat urmtoarele informaii: ponderea fetelor n eantion este de 67%
iar nota medie 7.2 cu o dispersie de 1.42.
43

Se cere s se verifice reprezentativitatea eantionului stiind c ponderea fetelor n populaie


este 65% iar nota medie a studenilor este de 6.98 iar probabilitatea de garantare a rezultatelor
este de 95%.
Rezolvare
Pentru a vedea dac exist diferene semnificative fa de valoarea cunoscut din populaie a
ponderii fetelor fa de cea din n eantion se utilizeaz testul z (eantionul este de volum
normal) pentru compararea proporiei din eantion cu cea din populaie.
Ipotezele testului bilateral sunt:
H0 : w= p i H1: w p .

wp

Regiunea critic n cazul testului bilateral este dat de relaia: W:


valoarea calculat a testului este: z c

wp
p 1 p

p 1 p n

z
1

iar

=0.398
n

Pentru o probabilitate de garantare a rezultatelor de 95% cruia i corespunde un nivel de


semnificaie =0.05 n cazul efecturii unui test bilateral valoarea teoretic este z =1,96.
1

Deoarece valoarea calculat a testului luat n modul este mai mic dect valoarea teoretic se
accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
Pornind de la variabila auxiliar MEDIA, pentru verificarea reprezentativitii se utilizeaz
testul z pentru compararea mediei unui eantion cu cea a populaiei.
Ipotezele testului bilateral sunt:
H0: x = X 0 i H1: x X 0 .
Regiunea critic n cazul testului bilateral este dat de relaia: W:

x X0

calculat a testului este: zc

x X0

iar valoarea

=1.75

Valoarea calculat luat n valoare absolut se compar cu cea teoretic de 1.96


corespunztoare nivelului de semnificaie ales (=0.05) i, deoarece este mai mic dect
aceasta se accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
Problema 2
n rndul populaiei de 160000 persoane (cu vrsta peste 15 ani) dintr-o localitate s-a realizat
un sondaj pe un eantion de 800 persoane privind atitudinea fa de. n tabelul 3.5.5 este
prezentat structura eantionului i structura populaiei pe grupe de vrst.

Grupe de vrst
15-24
25-34
35-44
45-54
peste 55
Total

Structura populaiei (%)


16
20
24
21
19
100

44

Tabel 3.5.5
Structura eantionului (%)
19
23
20
17
21
100

Se cere:
1. S se verifice reprezentativitatea eantionului utiliznd testul 2 pentru un nivel de
semnificaie =0.05.
2. S se verifice reprezentativitatea eantionului utiliznd testul Kolmogorov-Smirnov pentru
un nivel de semnificaie =0.05.
Rezolvare
1.

Atunci cnd se cunoate forma distribuia variabilei n populaie pentru verificarea


reprezentativitii eantionului se poate utiliza unul din testele de concordan.
Tabelul 3.5.6

Grupe de
vrst

Structura
populaiei
(%)

15-24
25-34
35-44
45-54
peste 55
Total

16
20
24
21
19
100

Numr
salariai
n populaie
( Fti )
25600
32000
38400
33600
30400
160000

Structura
eantionul
ui
(%)
19
23
20
17
21
100

Numr
salariai
n eantion
(fei)
152
184
160
136
168
800

fei fti 2
fti
128
160
192
168
152
800

fti

4.50
3.60
5.33
6.10
1.68
21.21

Ipotezele testului 2 sunt:


H0 : ft= fe i H1: ftfe unde ft reprezint frecvenele teoretice iar fe frecvenele empirice.
Frecvenele empirice sunt cele obinute n urma centralizrii datelor din sondaj iar cele
teoretice se calculeaz dup relaia: fti Fti N n ( Fti fiind frecvena corespunztoare a grupei
i din populaie). Calculele necesare sunt sistematizate n tabelul 3.5.6.
k
2

Valoarea calculat a testului este: c

f ei f ti 2

i 1

f ti

=21.21

Valoarea teoretic pentru un nivel de semnificaie =0,05 i numrul de grade de libertate


df=k-1=5-1=4 este de 9.49. Deoarece c 2 2 0,05;df 4 se respinge ipoteza nul putnd
spune c cele dou distribuii nu concord i, deci eantionul nu este reprezentativ.
2. Calculele necesare pentru efectuarea testului Kolmogorov sunt sistematizate n tabelul
3.5.7. Considerm variabilele x i y vrsta n totalul populaiei i respectiv n eantion.
Tabel 3.5.7
Grupe de
vrst
15-24
25-34
35-44
45-54
peste 55
Total

fei

fti

fei cumulat

fti cumulat

152
184
160
136
168
800

128
160
192
168
152
800

152
336
496
632
800

128
288
480
648
800

45

f* ei cumulat
F(x)
0.19
0.42
0.62
0.79
1

f* ti cumulat
F(y)
0.16
0.36
0.6
0.81
1

di
0.03
0.06
0.02
0.02
0

n relaia de calcul a valorii teoretice c considerm n1 volumul populaiei N iar n2 volumul


eantionului n. Relaia devine: c max F( x ) F( y)

Nn

.
Nn
n cazul n care volumul populaiei este mare n raport cu eantionul (n<0.05N) c se poate

calcula dup relaia: c max F( x) F( y) n . =1.69.

=1,36. Deoarece c >

repartiia empiric nu este n concordan cu cea teoretic iar


eantionul nu este reprezentativ ceea ce va duce la obinerea unor estimatori deplasai.

46

Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE

Ce cuprinde aceast unitate de nvare?


4.1. Obiectivele unitii de nvare 4
4.2. Sondajul simplu aleator
4.2.1. Sondajul simplu aleator cu probabiliti egale
4.2.2. Sondajul de volum redus
4.3. Sondajul stratificat
4.4. Sondajul de serii
4.5. Aplicaii

4.1. Obiective

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Alegerea unui plan de sondaj simplu n funcie de caracteristicile populaiei


Estimarea parametrilor de interes pe baza valorilor de sondaj n funcie

de

planul de sondaj simplu utilizat

4.2. Sondajul simplu aleator


Sondajul simplu aleator este considerat o metod de baz n teoria sondajului. El se
poate realiza ntr-o populaie foarte omogen (coeficient de variaie sub 17%), unitile
cuprinse n eantion fiind selectate prin procedee aleatoare cu probabiliti nenule cunoscute.
Cu toate c este rareori folosit n practic el este foarte important pentru nelegerea
47

noiunilor fundamentale i nsuirea tehnicii sondajelor. Totodat sondajul simplu aleator


st la baza sondajelor complexe utilizate n practic.
Sondajul simplu aleator se poate efectua n dou variante: sondajul simplu aleator cu
probabiliti egale i sondaj simplu aleator cu probabiliti inegale.
Sondajul simplu aleator cu probabiliti egale este acel sondaj n care fiecare unitate
are aceeai probabilitate de a face parte din eantion iar probabilitile sunt independente.
Acest plan de sondaj este metoda de baz a sondajelor aleatoare din care decurg conceptele
fundamentale i formulele de calcul al erorilor specifice sondajului. Tehnica sondajului
simplu aleator este vizualizat n figura urmtoare:

Populaie

Eantion

Figura 4.2.1 Schema de realizare a sondajului simplu aleator


Exist dou tipuri de sondaj cu probabiliti egale: sondajul simplu aleator cu
probabiliti egale cu revenire cunoscut n literatura de specialitate ca plan de eantionare cu
probabiliti egale repetat (cu revenire) SAR i sondajul simplu aleator cu probabiliti
egale fr revenire cunoscut sub numele: plan de eantionare cu probabiliti egale nerepetat
(fr revenire)SAFR.
4.2.1. Sondajul simplu aleator cu probabiliti egale
Sondajul simplu aleator cu probabiliti egale cu revenire
Fie U populaia supus sondajului: U = { Ui | i= 1,,N }
n cazul acestui tip de sondaj numrul tuturor eantioanelor posibile este egal cu Nn,
iar probabilitatea fiecrei uniti din populaie de a intra n eantion la fiecare extragere este:
pik=1/N unde i= 1,,N iar k= 1,,n.
Probabilitatea ca o unitate Ui U s figureze n eantion o notm cu i unde:
n

p
k 1

48

ik

n
N

Calculul erorilor de sondaj n vederea estimrii parametrilor populaiei se bazeaz pe


principiile teoriei probabilitilor i ale statisticii matematice.
Pentru un volum de eantion n se pot obine Nn eantioane extrase succesiv din aceeai
populaie fiecare avnd o medie de sondaj. n acest proces de formare a mediilor de sondaj
fiecare medie poate s aib diferite frecvene de apariie. Se confirm astfel c media de
sondaj x i este o variabil aleatoare creia i se poate stabili legea de distribuie. Respectnd
cerinele legii numerelor mari n teoria sondajului se demonstreaz c dac volumul
eantionului este suficient de mare media de sondaj urmeaz o distribuie normal a crei
medie este chiar media populaiei totale:
n

M( x i ) X iar

x i X 0
i1

Dispersia mediilor de sondaj n jurul mediei din populaia total este egal cu raportul
dintre dispersia din populaia total i volumul eantioanelor de aceeai mrime n:
2

2x i

n
Mrimea abaterii medii ptratice a mediilor de sondaj de la media populaiei reprezint
eroarea medie de reprezentativitate i se calculeaz dup relaia:

n
Dac nu se cunoate valoarea dispersiei populaiei totale ea este estimat cu ajutorul
dispersiei de sondaj S2. n acest caz eroarea medie de reprezentativitate se calculeaz dup
relaia:
i

S
x

n
n practic ns nu procedm la extragerea tuturor eantioanelor posibile i ne
mulumim cu un singur eantion construit cu respectarea ct mai riguroas a unor anumite
condiii. n acest caz, media eantionului se poate abate mai mult sau mai puin de la media
populaiei, fapt ce determin necesitatea indicrii unui interval de ncredere despre care se
poate afirma cu o probabilitate sau siguran cunoscut c acoper valoarea mediei din
colectivitatea total. Limitele intervalului de ncredere, cea minim iinf i cea maxim sup se
calculeaz n funcie de datele de sondaj x1, x2, , xn astfel nct, cu un grad mare de
siguran, garantat de probabilitatea 1- pentru parametrul populaiei, se ndeplinete relaia:
i

P inf X sup 1 z
Intervalul inf , sup reprezint intervalul de ncredere i definete precizia estimaiei.
Probabilitatea (1- ) caracterizeaz sigurana cu care se afirm c intervalul de ncredere
cuprinde valoarea parametrului populaiei. Cu ct intervalul inf , sup este mai mic i
probabilitatea (1- ) mai mare cu att avem o estimaie mai precis cu privire la
valoarea parametrului. Intervalul inf , sup este o mrime aleatoare, limitele sale fiind

49

dependente de datele fiecrei selecii, motiv pentru care, pentru o aceeai populaie, valorile
limitelor variaz de la o selecie la alta att ca mrime ct i ca poziie.
La construirea estimaiilor, un rol important, pe lng nivelul de siguran, l joac
mrimea intervalului de ncredere. Cele dou mrimi se afl ntr-o relaie de coresponden
bine determinat. Dac eroarea de sondaj se distribuie dup legea normal atunci erorile egale
n valoare absolut cu probabilitile de apariie i pentru acelai volum al eantionului
probabilistic ce alctuiesc intervale inf , sup se pot separa n dou pri egale iar jumtatea
intervalului este eroarea limit admis.
Precizia estimaiei, probabilitatea de ncredere i intervalul de ncredere se discut pe
baza inegalitii lui Cebrev, prin care se demonstreaz c media de sondaj x pentru un
volum mare al eantionului converge n probabilitate ctre X0 media populaiei, ceea ce
semnific faptul c x este un estimator corect al mediei populaiei (nedeplasat, consistent i
eficient). Sigurana estimrii este dat de probabilitatea cu care este ndeplinit inegalitatea:
x X z unde 0, suficient de mic .
Aceast probabilitate este dat dinainte i este foarte apropiat de unitate.

P x X

Intervalul

sau P x X x

x , x

care acoper parametrul X

(4. 1.1.)
cu o probabilitate z se

numete interval de ncredere . n vederea stabilirii expresiei intervalului de ncredere pentru


media X

trebuie definit variabila de sondaj z

xX

( x este eroarea medie de

reprezentativitate). Din relaia 4.1.1 avem:

P xX

P x X


xX
P

x
x

unde

z z x x reprezint eroarea limit maxim admis.


x

Rezult c eroarea limit maxim admis este o mrime variabil ce depinde de


argumentul funciei de probabilitate (z) i de eroarea medie de reprezentativitate. Ea poate fi
redus fie prin mrirea volumului eantionului (valoare ce intr n calculul erorii medii de
reprezentativitate) fie prin modificarea probabilitii de garantare a rezultatelor.
n orice plan de cercetare prin sondaj, pentru a rspunde obiectivelor propuse sunt
necesare att caracteristici cantitative ct i calitative. n acest caz ne intereseaz dac o
unitate a eantionului posed sau nu o caracteristic. n aceast situaie calculul erorii medii de
reprezentativitate se realizeaz dup relaia:
p (1 p )
w(1 w)

n
n
(unde p este media caracteristicii binare n populaie iar w reprezint estimaia acesteia din
eantion).

50

n mod corespunztor, eroarea limit maxim admis se calculeaz astfel:

w z w
Dei determinarea volumului de eantion n realitate precede calculul erorilor necesare
estimaiilor nu putem aborda aceast tem fr cunoaterea acestor noiuni.
Dup studiul amnunit al populaiei supuse cercetrii se va alege cu mult grij
caracteristica n raport cu care se calculeaz volumul eantionului.
Pornind de la formula erorii limit maxim admis, pentru un eantion de volum mare
avem:

x z

z 2 2
2x

z2 S 2
2x

Dac abaterea medie ptratic a caracteristicii Xi n populaia general presupus


normal distribuit nu este cunoscut, atunci se extrage n prealabil un eantion de volum redus
pe baza cruia se estimeaz cu ajutorul dispersiei de sondaj S2 dispersia necunoscut.
n cazul n care volumul eantionului se calculeaz pornind de la o caracteristic
alternativ relaia de calcul a volumului eantionului este:

z 2 p(1 p)2
2w

z 2 w (1 w )2
2w

unde p este proporia celor care posed caracteristica n populaia total. n cazul n
care nu se cunoate aceast valoare i nu se poate calcula variaia caracteristicii n populaia
total aceasta se estimeaz cu dispersia din eantion calculat cu ajutorul proporiei celor care
posed caracteristica n eantion (w).
Sondajul simplu aleator cu probabiliti egale fr revenire
Sondajul simplu aleator cu probabiliti egale fr revenire este acel sondaj n care o
unitate odat selecionat nu mai particip la o nou extragere.
Numrul tuturor eantioanelor posibile n acest caz este egal cu C Nn . Probabilitatea
fiecrei uniti de a intra n eantion crete de la o extragere la alta astfel:
p i1

1
1
1
; pi 2
;..... p in
unde i 1, N
N
N 1
N ( n 1)

Probabilitatea ca o unitate Ui U s figureze n eantion o notm cu i i este dat de


relaia:
n

p
k 1

ik

n
1
1
1
n
k 1
n

....

N N 1
N (n 1) N k 1 N ( N ( k 1)) N

n
.
N
Pentru a aproxima dispersia mediilor de sondaj necesar calculrii erorii medii de
N n
reprezentativitate se aplic un coeficient de corecie
. Deoarece, de cele mai multe ori,
N 1
tinde la limita spre

51

volumul populaiilor studiate este mare, nu sesizm diferene ntre a mpri la N-1 sau la N.

n acest context, pentru simplificarea calculului considerm coeficientul de corecie 1 .


N
2x

2
2
S2
n
n
n

1 iar x
1
1
n N
n N
n N

Eroarea limit maxim admisa este: x z x z

2
S2
n
n
1 z
1
n N
n N

n cazul n care nu se cunoate dispersia populaiei totale o vom estima cu ajutorul


dispersiei de sondaj S2.
Dac variabila pe care dorim s o analizam este calitativ, eroarea medie de
reprezentativitate i eroarea limit se vor calcula dup relaiile:

p(1 p)
n
w(1 w)
n
1
1
n
n
N
N

w z w z

p(1 - p)
n
w(1- w)
n
1 z
1
n
n
N
N

Pentru determinarea volumului eantionului se pornete tot de la relaia de calcul a erorii


limit:
20
n
x z x z
1
n
N

z 2 2
2x

z 2 2
N

n cazul n care variabila este calitativ vom avea :


n

z 2 p(1 p)
2w

z 2 p(1 p)
N

z 2 w (1 w )
2w

z 2 w (1 w )
N

n situaia in care populaia total poate fi considerat infinit coeficientul de corecie a


sondajului fr revenire nu i mai gsete utilitatea. n cazul n care n<0,05N putem considera

populaia infinit, valoare 1 1 i practic diferenele intre aplicarea celor dou


N
formule de calcul a erorii de reprezentativitate fiind nesemnificative.
Estimarea parametrilor populaiei totale pe baza valorilor de sondaj
Operaia de extindere a rezultatelor obinute din sondaj (n condiii specificate de
incertitudine exprimate n termeni probabilistici) asupra ntregii populaii prin procedeul
numit inferen statistic se numete estimaie.

52

Sumarul relaiilor necesare determinrii intervalului de ncredere n cazul utilizrii


unui sondaj simplu aleator cu probabiliti egale:
Condiiile de
desfurare

Sondaj cu revenire

2 cunoscut
Populaie
infinit i
eantion de
volum normal
(n<0,05N), n>30

xz

2
n

wz

Populaie finit
i eantion de
volum normal
(n>0,05N), n>30

xz

2
n

wz

2 necunoscut
xz

S2
n

Sondaj fr revenire

2 cunoscut
xz

w (1 w )
n
xz

2 necunoscut

2
n

xz

wz

S2
n

xz

w (1 w )
n

2 N n

n N 1

wz

53

S2
n

w (1 w )
n
xz

S2 N n

n N 1

w (1 w ) N n

n
N 1

4.2.2. Sondajul de volum redus


Sondajele realizate pe baza eantioanelor de volum redus i gsesc frecvent
aplicabilitatea n domeniul cercetrilor economico-sociale. Adeseori, n activitatea desfurat
managerii sunt nevoii s ia decizii pe baza unor date sumare oferite de eantioane mici.

Dac volumul eantionului este mai mic de 30 de uniti, se consider de volum redus,
iar premizele de mai sus nu mai sunt valabile fiind necesar o tehnic nou de abordare a
problemei.
n acest caz, distribuia mediilor eantioanelor posibile depinde de forma de distribuie
a populaiei. Cum de cele mai multe ori forma de distribuie a populaiei nu este cunoscut,
nici legea de distribuie a mediilor eantioanelor nu poate fi determinat. Teoria sondajului
demonstreaz c n cazul seleciei de volum mic probabilitatea de apariie a mediilor de
diferite mrimi se distribuie mai uniform. Cu alte cuvinte probabilitile de apariie a
mediilor nu descresc n aceeai msur ca n cazul eantioanelor de volum normal n
momentul n care acestea se apropie de valorile extreme, mediile eantioanelor posibile
distribuindu-se dup curba lui Student i nu dup curba normal.
Tabelul distribuiei Student prezint coeficientul funciei de probabilitate al apariiei
mediilor eantioanelor posibile, reprezentat de coeficientul funciei (t).
Prin urmare, pentru estimarea mediei metodologia este asemntoare pentru
eantioanele de volum normal i cele de volum redus, singura diferen fiind utilizarea
valorilor repartiiei Student n funcie de numrul gradelor de libertate i probabilitatea de
garantare a rezultatelor. Relaiile sunt sistematizat astfel:
Condiiile de
desfurare
Eantion de
volum redus
n<30

Sondaj cu revenire

Sondaj fr revenire

2 cunoscut

2 necunoscut

2 cunoscut

2 necunoscut

2
x t
n

S2
xt
n 1

2 N n
xt

n N 1

xt

wt

w (1 w )
n 1

wt

54

S2 N n

n 1 N 1

w (1 w ) N n

n 1
N 1

4.3. Sondajul stratificat


Deoarece n practic de cele mai multe ori populaiile supuse cercetrii sunt
neomogene utilizarea unui sondaj simplu aleator este dificil i costisitoare. Pentru
diminuarea acestor neajunsuri i creterea preciziei estimaiilor se aplic metoda eantionrii
stratificate.
Aceast metod presupune mprirea populaiei n subpopulaii ct mai omogene
numite straturi. Straturile se delimiteaz fie artificial de ctre cei care organizeaz sondajul pe
baza unor criterii bine determinate, fie ele sunt deja constituite n populaie (an de studiu,
jude, sector, filial etc.). Pentru formarea eantionului se va realiza cte o selecie pentru
fiecare strat formndu-se cte un subeantion. Acestea vor fi obinute utilizndu-se unul din
procedeele de selecie nvate (cu probabiliti egale sau inegale, repetate sau nerepetate).
Metoda seleciei stratificate este reprezentat n figura urmtoare:

S
T
R N1
A
T

Populaie
N

Eantion
n

1
S
T
R N2
A
T
2

n1

n2

........................................
............................
..................

S
T
R Nk
A
T

nk

Figura 4.3.1 Scheme de realizare a sondajului stratificat

Acest tip de sondaj este frecvent utilizat deoarece combin simplitatea conceptual a
sondajului simplu aleator cu sigurana asigurrii ponderii necesare reprezentativitii
subgrupurilor. Totodat este o tehnic foarte convenabil atunci cnd dorim s obinem
estimaii separate pentru parametrii populaiei pe fiecare strat i ulterior pentru ntreaga
populaie sau s ne asigurm c eantionul respect structura populaiei dup criteriul de
stratificare.

55

1. Stratificarea asigur un grad mai mare de reprezentativitate i de precizie a


rezultatelor. Straturile constituite dup o caracteristic oarecare vor prezenta un mai mare
grad de omogenitate dect cel al populaiei fiind caracterizate prin indicatori ai variaiei cu
valori mai mici i deci erori de reprezentativitate mai reduse8
Pentru a nelege avantajul sondajului stratificat trebuie pornit de la variaia total a
populaiei dup o anumit caracteristic (msurat de dispersia 2 ) compus din variaia din
interiorul straturilor (msurat de dispersia 2 ) i variaia dintre straturi (msurat de
dispersia 2 ): 2 2 2 unde fiecare tip de variaie se calculeaz conform relaiilor:
N

2 ( X j X )2 N ;
j 1

2 i2 N i
i 1

Ni ;
i 1

2 ( X j X ) 2 Ni
i 1

Ni
i 1

n cazul n care s-ar organiza un sondaj simplu aleator, dispersia care determin
mrimea erorii de reprezentativitate este dispersia total. Cum n general populaiile nu sunt
omogene aceasta va fi foarte mare determinnd o eroare medie de reprezentativitate mare.
Dac se organizeaz un sondaj stratificat numai dispersia din interiorul straturilor va
influena eroarea de reprezentativitate. Aceasta este sintetizat prin media dispersiilor pariale
i este msura influenei factorilor ntmpltori asupra variaiei caracteristicii. Mrimea
dispersiei dintre straturi, msur a factorului care constituie criteriul de stratificare asupra
variaiei variabilei nu influeneaz eroarea de reprezentativitate.
Deoarece ntotdeauna 2 2 estimaiile obinute pe baza sondajului stratificat sunt
afectate de erori mai mici dect cele obinute pe baza unui sondaj simplu aleator.
2. Dac stratificarea se realizeaz pe criterii geografice culegerea datelor se poate face cu
specialiti locali, reducnd astfel costul. Mai mult, se pot analiza i interpreta datele iniial pe
fiecare strat i ulterior pe ntreaga populaie.
Problemele organizatorice care se pun n momentul organizrii unui sondaj stratificat
sunt:
A
B
C

alegerea criteriului pe baza cruia se va face stratificarea;


numrul de straturi ce se vor constitui;
repartizarea eantionului pe subeantioane.

Porojan D., 1993, Statistica i teoria sondajului, Ed. ansa SRL, Bucureti, p. 253.

56

Sondaj stratificat simplu (neproporional)


Acest sondaj este caracterizat prin aceea c din fiecare grup se extrage un numr
de uniti pentru a forma eantionul fr a ine cont de greutatea specific a fiecrei
grupe n totalul populaiei. Determinarea valorilor de sondaj n vederea estimrii
parametrilor din populaia de sondaj se realizeaz pentru toate caracteristicile cantitative i
calitative cuprinse n planul sondajului.

57

Caracteristicile cantitative
Considerm o populaie C de volum N mprit n k straturi. Din fiecare strat se
selecteaz un eantion dup unul din procedeele cunoscute astfel:
C1 (X11, X21,.., XN11)
C1 (x11, x21,.., xn11)
C2 (X12, X22,.., XN22)
C1 (x12, x22,.., xn22)

Ck (X1k, X2k,.., XNkk)


C1 (x1k, x2k,.., xnkk)
unde k este numrul de straturi
k

N1, N2,.. Nk, reprezint volumul straturilor n populaia total i

i1

n1, n2,.. nk, reprezint volumul straturilor n eantion i

i 1

Xij nivelurile caracteristicii cantitative.


Valoarea medie a caracteristicii n populaia total este X i se calculeaz nsumnd
nivelurile caracteristicii conforma relaiei 4.3.1 sau ca medie a mediilor de strat (relaia 4.3.2).
k Nj

xij
X

X i Ni

i 1 j 1

(4.3.1)

i 1

(4.3.2)

Ni
i 1

Valoarea medie a caracteristicii calculat pe baza datelor din eantion se calculeaz


similar dup una din relaiile 4.3.3 sau 4.3.4:
k

nj

i 1 j 1

ni

xij

x ji i

xi ni
(4.3.3)

i 1

(4.3.4)

unde x i

ni

j 1

(4.3.5)

ni

i 1

Deoarece media populaiei totale nu se cunoate aceasta poate fi estimat cu urmtorul


estimator calculat pe baza mediilor straturilor i a ponderilor din populaia total:
k

~
x

xi N i
i 1
k

(4.3.6)

Ni
i 1

n cazul sondajului simplu stratificat obinut prin aplicare procedeului de sondaj


aleator cu revenire, respectiv fr revenire, relaiile de calcul ale erorii de reprezentativitate
sunt:
2

N i2 i

2
ni
i 1 N
k

~x

N i2 S i

2
ni 1
i 1 N
k

(4.3.7)

58

~x

i 1

N i2 i 2
N 2 ni

n
1 i
Ni

i 1

N i2 S i 2
n
1 i
2 n 1
Ni
N
i

(4.3.8)

Pentru simplificarea relaiilor de calcul n cazul n care subeantioanele sunt de volum


normal nu se justific mprirea la ni-1 fa de cea la ni. Totodat, dac volumul fiecrui strat
Ni este suficient de mare numitorul coeficientului de corecie poate rmne Ni n loc de Ni-1.
Dac prezint interes i analiza pe fiecare strat n parte, se va calcula ntr-o prim etap
eroarea medie de reprezentativitate pe fiecare strat inndu-se cont de procedeul de selecie
utilizat n interiorul stratului astfel:
2

i
Si
(selecia din interiorul stratului este cu revenire);
xi

ni
ni 1
xi

i2
ni

n
1 i
Ni

Si 2
n
1 i (pentru selecia fr revenire).
ni 1
Ni

Eroarea medie de reprezentativitate a mediei eantionului se va calcula pe baza erorilor


de reprezentativitate ale straturilor conform relaiei:

N i2 2
~x 2 xi
i 1 N
k

(4.3.9)

Dup cum se poate observa eroarea medie de reprezentativitate nu mai depinde de


dispersia total ci de media dispersiilor straturilor. Eroarea limit maxim admis va fi:
x~ z ~x

Sondaj stratificat proporional


Specificul acestui sondaj este c structura populaiei pe straturi n populaia total
se respect i regsete i n structura eantionului. El i gsete utilitatea n cazul n care
exist diferene mari ntre volumele subpopulaiilor straturilor.
Prin definiie se numete un sondaj stratificat proporional cel pentru care este
ndeplinit condiia:
k

n1
n
n
n
2 .... i .... k
N1 N 2
Ni
Nk

ni
i 1
k

Ni

n
N

(4.3.10)

i 1

Din aceasta deducem relaia de calcul pentru eantionul fiecrui strat: ni

59

n
Ni
N

Mrimile medii calculate pe baza datelor de sondaj utilizate pentru a estima mediile
din populaia total se vor calcula n funcie de tipul variabilei dup una din relaiile:
k

~
x

xi ni

ni wi

~
(4.3.11) w

i 1
k

i 1
k

ni

ni

i 1

i 1

(4.3.12)

Eroarea medie de reprezentativitate n cazul sondajului proporional se calculeaz


asemntor sondajului stratificat simplu doar c de data aceasta putem utiliza drept ponderi
volumele eantioanelor astfel:
Selecie repetat:
n2 i2

ni
i 1
k

~x

ni2 i 2
n2 n
i
i 1
k

~x

ni2

N 2 Si 2
i 1

N i2 n
i 1

(4.3.13)

ni2 S i 2
n
n 2 n 1 1 Ni
i
i

i 1
k

n
1 i
Ni

(4.3.14)

Sau pe baza erorilor de reprezentativitate ale straturilor conform relaiei:


k

~x

ni2

n 2 x2

(4.3.15)

i 1

Avantajele sondajului stratificat proporional fa de cel neproporional sunt:


1. se evit riscul de a subevalua n eantion straturile mai mari;
2. se mrete gradul de precizie al estimaiei fa de stratificarea neproporional.
Sondajul stratificat optim
n cazul n care exist diferene mari n ceea ce privete gradul de variaie al
straturilor se recomand utilizarea sondajului stratificat optim.
n acest caz stabilirea subeantioanelor se face innd cont att de proporia pe care o
ocup stratul n populaia total ct i de abaterea medie ptratic, indicator ce exprim
variaia caracteristicii n interiorul stratului.
Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se
utilizeaz relaia:
k

nk
n1
n2

....

N1 1 N 2 2
Nk k

ni
i 1
k

(4.3.16) sau ni

N i i
k

n.

(4.3.17)

N i i

Ni i

i 1

i 1

Relaiile de calcul ale erorilor de reprezentativitate sunt aceleai ca i n cazul


sondajului neproporional.

60

Selecia din interiorul straturilor s-a realizat cu revenire


Sondaj stratificat
simplu
(neproporional)

x~

N i2 i

2
ni
i 1 N

N i2 pi (1 pi )

2
ni
i 1 N

N i2 Si

2
ni 1
i 1 N
k

N i2 w i (1 w i )

2
ni 1
i 1 N

Sondaj stratificat
proporional i
Sondaj stratificat
optim

ni2 w i (1 w i )
w2

2
ni 1
n
i 1 n

ni2 2
x~ 2 xi
i 1 n

ni2 Si

2
ni
i 1 n
k

Ni2 2
wi

2
i 1 N
k

n2
2
x~ i2 i

ni
n
i 1 n
k

N i2 2
xi

2
i 1 N
k

x~

ni2

w2 i

i 1

Selecia din interiorul straturilor s-a realizat fr revenire


Sondaj stratificat
simplu
(neproporional)

N i2 i

2
ni
i 1 N
k

x~

N i ni

Ni 1

2
N i2 S i N i ni

2
i 1 N n i 1 N i 1
k

N i2 2
~x 2 xi
i 1 N
k

N i2 p i (1 p i ) N i n i

ni
Ni 1
N2

i 1

i 1

N i2 w i (1 w i ) N i n i

Ni 1
N2 ni 1

Ni2 2
wi

2
i 1 N
k

w
Sondaj stratificat
proporional i
Sondaj stratificat
optim

~x

i 1

n i2 i
2
ni
i 1
k

n i2 i
n2 ni

Ni ni

Ni 1

2
n

N ni
i
Ni 1

i 1

n i2 S i
n 2 ni

Ni ni

Ni 1

N i ni

Ni 1

4.4. Sondajul de serii


Sondajul de serii se poate considera cel mai utilizat sondaj probabilistic. El este
preferat sondajului simplu aleator chiar dac acesta este mai facil i mai cunoscut.
Sondajului de serii este foarte important deoarece st, alturi de sondajul stratificat, la
baza sondajelor complexe asupra forei de munc, reprezentative la nivel naional.
Eantionarea simpl aleatoare presupune existena unei baze complete de sondaj din
care urmeaz s se extrag individual fiecare unitate ce va forma eantionul. Acest lucru este
rareori disponibil i ar costa prea mult realizarea unor astfel de baze. n schimb, se pot
construi baze de sondaj compuse din grupuri de elemente numite serii. Aceste serii constituie
uniti complexe (ntreprinderi, secii de votare, blocuri de locuine, grupe de studeni,
gospodria) care de cele mai multe ori reprezint forme de organizare a populaiei.
61

Pentru a asigura reprezentativitatea eantionului este necesar ca acesta s reprezinte o


structur asemntoare cu cea a populaiei fiind constituit tot din uniti complexe. Odat
selectat o serie, unitile simple ce o compun vor fi cercetate n totalitate.

POPULAIE R SERII

EANTION r SERII

Figura nr. 4.4.1. Schema de realizare a sondajului de serii


Fiecare serie este constituit din uniti simple ce pot fi definite prin caracteristici
proprii ce prezint interes pentru ancheta realizat. Ea trebuie definit fr ambiguitate, fiind
utilizat ca unitate de eantionare. Mrimea seriilor poate fi cunoscut sau necunoscut iar
seriile pot fi de mrimi egale sau inegale.

Majoritatea populaiilor supuse cercetrii nu sunt omogene, variaia total a populaiei


fiind format din variaia din interiorul seriilor pe de o parte i de variaia dintre seriile ce o
compun pe de alt parte.

62

n cazul sondajului de serii eroarea medie de reprezentativitate depinde de


variaia dintre seriile ce formeaz populaia. ntr-o astfel de populaie compus din uniti
complexe caracterul omogen sau neomogen al acesteia se transmite i seriilor din care este
format.
Eroarea medie de sondaj depinde doar de variaia dintre seriile populaiei
deoarece, cealalt component a variaiei totale (media dispersiilor din interiorul seriilor), se
consider a fi reflectat n eantion.

63

Nr. serie
001
002
003
004
005
006
007
008
009
010
011

Exemplu: selecie de serii sistematic cu probabiliti egale


Selecie
X

r = 40
R = 170
K = 170/40=4,25
D =2
Seriile selecionate:
002
2+4,25=6,25 006
6,25+4,25=10,5 011
..

170

64

Exemplu:
Mrime
Nr.
(nr. de
serie
gospodrii)
001
120
002
105
003
132
004
96
005
110
006
102
007
165
008
98
009
115
010
60
011
104
012
168

120
225
357
453
563
665
830
928
1043
1103
1207
1375

170

17219

196

Total 17219

Valoare
Nr. de
Selecie
cumulat eantionare
73

503

r = 40
R = 170
K = 17219/40=430,475
D =73
Nr. de eantionare:
73

934

73+430,475=503,475
503

1364

503,475+430,475=933,96
934
933,96+430,475=1364,425
1364

De cte ori este posibil, n cazul n care diferena de talie justific acest lucru, este
recomandat ca selecia seriilor s se realizeze prin procedeul aleator PPM. Avantajul acestui
procedeu este creterea reprezentativitii eantionului i n consecin a preciziei estimaiilor.
Notm cu:
R = numrul de uniti complexe (serii) din populaie;
r = numrul de uniti complexe (serii) din eantion;
N = numrul de uniti simple (indivizi) din populaie;
n = numrul de uniti simple (indivizi) din eantion;
N

T Yi este totalul din populaie;

i 1

1 N
Yi este totalul mediu pe serie;
R i 1

R N
1 N
j
Y

Y j este nivelul mediu pe fiecare unitate simpl (individ)

i
N i 1
j 1 N

unde Yj este nivelul mediu pe fiecare serie.


4.4.1. Estimatori i erori n cazul sondajului de serii de talie egal selectate dup
procedeul aleator cu probabiliti egale fr revenire
Avem N1= N2=.. NR= N0. Putem calcula volumul de uniti simple al populaiei i al
eantionului astfel: N=R N0 iar n= r N0. Avem urmtoarele relaii de calcul:
65

Parametrul de interes, nivelul mediu pe fiecare unitate simpl

1
N

Yi
i 1

Nj

j 1

1 R
Y j
R j 1

Yj

(4.4.1)

Estimatorul parametrului de interes, media eantionului:

1 r
Y Y j
r j 1

(4.4.2)

Dispersia estimatorului Y :
R

Y j

Rr

V Y
Rr

(4.4.3)

j 1

Estimaia dispersiei estimatorului:


r

Rr
Y
V

Rr

Y j Y

(4.4.4)

j 1

r 1

Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza


relaiei:
R

Rr
Rr

Y j

j 1

Rr 2

R
r

R r 2
R
r

(4.4.5)

Unde 2 reprezint variaia dintre serii n populaie iar 2 estimatorul acesteia


calculate conform relaiilor:
R

Y
2

Y j Y

j 1

(4.3.6) i 2

j 1

r 1

(4.4.6)

Pornind de la regula de adunare a dispersiilor: 2 2 2 , se calculeaz


coeficientul de determinaie (numit i raportul de corelaie inter-serii) notat cu 2 .

variatia dintre grupe 2


2 2 2 2
variatia total

(4.4.7)

nlocuind 2 din releia 4.3.8 n releia 4.3.5 obinem:

Rr2 2

R r

(4.4.8)

66

Dac s-ar fi organizat un sondaj simplu aleator fr revenire eroarea medie de


reprezentativitate s-ar fi calculat dup relaia:

SAFR

N n2

N
n

RN 0 rN 0 2

RN 0
rN 0

1 Rr 2
N0 R r

(4.4.9)

Comparnd relaiile 4.3.9 cu 4.3.10 observm c eroarea de reprezentativitate rezultat


n urma unei sondaj de serii va fi mai mic dect cea obinut n urma unui sondaj simplu
aleator fr revenire doar n situaia n care se respect relaia:
1
2
.
(4.4.10)
N0
n consecin putem spune c dac dorim ca eficiena sondajului de serii s fie ct mai
mare este necesar s mprim populaia n serii de dimensiuni mici iar coeficientul de
determinaie s fie ct mai mic posibil.
Extinderea rezultatelor se face pe baza intervalului de ncredere lund n considerare
probabilitatea cu care vrem s garantm rezultatele.

(4.4.11)
Y Y Y
Y

4.4.2. Estimatori i erori n cazul sondajului de serii de talie diferit selectate dup
procedeul aleator cu probabiliti egale fr revenire
n cazul n care seriile sunt de dimensiuni diferite, se recomand utilizarea unui
procedeu de selecie cu probabiliti inegale. Aplicarea acestuia necesit ns informaii
suplimentare n baza de sondaj. Dac nu dispunem de astfel de informaii vom aplica un
procedeu de selecie nerepetat (ca i n cazul planului de sondaj prezentat n subcapitolul
anterior).Cu toate acestea, deoarece seriile au dimensiuni diferite, relaiile de calcul ale
estimatorilor i erorilor de reprezentativitate
Notm cu:
Nj= numrul de uniti simple din seria j;
Tj= totalul variabilei de interes pentru toate unitile seriei j;

N = mrimea medie a unei serii n populaie;


n = mrimea medie a unei serii n eantion.

Avem urmtoarele relaii de calcul:

Parametrul de interes, nivelul mediu pe fiecare unitate simpl, calculat doar ca


medie aritmetic ponderat:
R N
1 N
j
Y Yi
Yj
(4.4.12)
N i 1
j 1 N

67

Estimatorul parametrului de interes, media eantionului:


r N

j
Y
Yj
(4.4.13)
j 1 N

Dispersia estimatorului Y :

R r
1

V Y

T
2
R
r

N

(4.4.14)

Estimaia dispersiei estimatorului:

T 2
R r
1

V Y

R
r

N 2

Unde T

(4.4.15)

reprezint dispersia totalurilor seriilor fa de totalul nregistrat pentru

2
nivelul mediu iar T este estimatorul acesteia calculate pe baza datelor din eantion. Acestea

sunt calculate conform relaiilor:


R

T
2

Y N j

j 1

2
T Y N
j
j

j 1
r

(4.4.16)

T 2

r 1

(4.4.17)

Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza


relaiei:

2
R r 1 T
2
R N
r

(4.4.18)

Deoarece numrul mediu de uniti simple ce formeaz o serie N este de cele mai
multe ori necunoscut, vom utiliza estimatorul n . Pentru unitile ce au intrat n eantion.
Acest lucru va determina o subestimare a variaiei estimatorului. Se consider c, n acest caz

V (Y ) este un bun estimator al V (Y ) dac numrul de serii ce formeaz eantionul este


suficient de mare (r20).
4.3.3. Estimatori i erori n cazul sondajului de serii de talie diferit selectate dup
procedeul aleator (cu revenire) cu probabiliti proporionale cu talia
De cte ori dispunem de informaii auxiliare privind mrimea unitilor complexe se
recomand s le utilizm pentru a calcula probabilitile de incluziune n eantion, aplicnd un
procedeu de selecie cu probabiliti inegale.
Nj
Probabilitatea ca o serie s intre n eantion la o extragere este: A j
. Cu ct o
N
unitate complex (serie) va avea o dimensiune mai mare, probabilitatea de a intra n eantion
va crete.
68

Deoarece, pentru formarea eantionului sunt necesare r extrageri, probabilitatea total


Nj
unei serii de a intra n eantion va fi: ATj r
.
N
Avem urmtoarele relaii de calcul:
Parametrul de interes, nivelul mediu pe fiecare unitate simpl se calculeaz dup
aceeai relaie ca si n cazul sondajului precedent:
R N
1 N
j
Y Yi
Yj
(4.4.19)
N i 1
j 1 N

Estimatorul parametrului de interes, media eantionului:


r N

j
Y
Yj
(4.4.20)
j 1 N

Estimaia dispersiei estimatorului:

r
Nj
2
1

V Y
(1 r N ) Y j Y (4.4.21)
r (r 1) i 1

Eroarea de reprezentativitate se va calcula pornind de la variaia estimatorului, pe baza


relaiei:

r
Nj
2
1
(1 r
) Y j Y

r ( r 1) i 1
N

(4.4.22)

4.5. Aplicaii
Aplicaie 1
n rndul celor 4000 de studeni ai unei faculti s-a realizat un sondaj simplu aleator pe un
eantion de 175 persoane.
La ntrebarea Cte ore studiai n medie pe sptmn (exceptnd sesiunea)? rspunsurile
centralizate se gsesc n tabelul 4.5.1.
Tabel 4.5.1
Intervale de
0-2
variaie (ore)*
Nr. studeni
50

2-6

6-12

12 h i peste Total

55

40

30

* limita inferioar este inclus n interval

69

175

Se cere:
1. S se estimeze pentru o probabilitate de 0.95 numrul mediu de ore studiate de un student
din facultate.
2. S se estimeze cu aceeai probabilitate ponderea studenilor care studiaz mai puin de 6
ore pe sptmn.
Rezolvare:
1. Calculm ct reprezint 5% din volumul populaiei.
0.05*N=0.05*4000=200
Deoarece n (175) <200 considerm c sondajul aleator a fost realizat ntr-o populaie infinit.
Dispersia variabilei numrul de ore studiate nu este cunoscut i va fi nlocuit cu dispersia
caracteristicii n eantion.
Tabel 4.5.2
Intervale de variaie (ore)*

ni

0-2
50
2-6
55
6-12
40
12 i peste
30
Total
175
*limita inferioar inclus n interval

xi

xini

1
4
9
15

50
220
360
450
1080

(x i x ) 2 n i

1337.18
259.33
320.03
2338.31
4254.86

Calculm estimatorul numrului mediu de ore studiate pe sptmn. Calculele necesare sunt
sistematizate n tabelul 4.5.2.

x n
n

i i
i

1080
=6.17 ore
175

Calculm dispersia estimatorului.

(x x)

n
i

ni

4254.86
=24.31
175

Calculul erorii de reprezentativitate (eroare standard).



x

S2
24.31

0.37 ore
n
175

Calculul erorii limit


x z x =1.96*0.37 =0.73 ore
Intervalul de ncredere:
x x X x x 6 .17 0.73 X 6.17 0.73 5.44 X 6.9 ore

70

Numrul mediu de ore studiate de un student ntr-o sptmn este de cel puin 5.44 i cel
mult 6.9. Garantm acest rezultat cu o probabilitate de 0.95.
2. Estimatorul ponderii studenilor care studiaz mai puin de 6 ore pe sptmn se
calculeaz pe baza relaiei:
m 50 55
w
0.6
n
175
Calculul erorii de reprezentativitate (eroare standard).
w (1 w )
0.6(1 0.6)

0.037
n
175
Calculul erorii limit
w z w =1.96*0.037=0.072
w

Intervalul de ncredere:
w w p w w 0 .6 0.072 p 00 .6 0.072 0 .528 p 0.672
Garantm cu 95% c cel puin 52.8% i cel mult 67.2% din studeni studiaz mai puin de 6
ore pe sptmn.
Aplicatie 2
n rndul celor 110 studeni ce locuiesc ntr-un cmin s-a realizat un studiu privind nivelul de
mulumire fa de condiiile existente, prelevndu-se un eantion de 25 persoane. Rspunsurile
la ntrebarea n ce msur suntei mulumii de urmtoarele condiii din cminul n care
locuii? sunt centralizate n tabelul 4.5.3.

Condiiile privind
Curenia
Cldura
apa cald
apa rece

Foarte mulumit
8
6
10
11

mulumit
10
7
9
10

aa i aa
5
2
4
3

nemulumit
2
10
2
1

Tabel 4.5.3
Total
25
25
25
25

Se cere:
1. S se stimeze pentru o probabilitate de 95% ponderea studenilor care se consider
mulumii i foarte mulumii de condiiile din cmin.
Rezolvare
Eantionul prelevat este de volum redus. n acest caz distribuia mediilor eantioanelor posibile
depinde de forma de distribuie a populaiei. Cum de cele mai multe ori forma de distribuie a
populaiei nu este cunoscut, nici legea de distribuie a mediilor eantioanelor nu poate fi
determinat. Teoria sondajului demonstreaz c n cazul seleciei de volum mic probabilitatea
71

de apariie a mediilor de diferite mrimi se distribuie mai uniform. Cu alte cuvinte


probabilitile de apariie a mediilor nu descresc n aceeai msur ca n cazul eantioanelor de
volum normal n momentul n care acestea se apropie de valorile extreme, mediile eantioanelor
posibile distribuindu-se dup curba lui Student i nu dup curba normal.
Calculele necesare estimrii procentelor celor ce se consider n general mulumii de
condiiile existente sunt sistematizate n tabelul 4.5.4.
Tabel 4.5.4
Condiiile privind Foarte mulumit i mulumit
curenia
cldura
apa cald
apa rece

18
13
19
21

Wi

0.72
0.52
0.76
0.84

0.0809
0.0901
0.0770
0.0661

0.1670
0.1859
0.1589
0.1364

0.5530
0.3341
0.6011
0.7036

0.8870
0.7059
0.9189
0.9764

Estimatorul ponderii studenilor mulumii i foarte mulumii de condiia i se calculeaz pe


baza relaiei:
m
w i i unde mi reprezint numrul celor mulumii i foarte mulumii de condiia i.
n
Calculul erorii de reprezentativitate (eroare standard).
n cazul n care nu se cunoate dispersia caracteristicii n populaie aceasta este nlocuit n
relaia de calcul a erorii standard cu dispersia caracteristicii n eantion care se va mpri la
numrul de grade de libertate n-1.
w i (1 w i ) N n

n 1
N 1
Calculul erorii limit n cazul sondajului de volum redu.
wi

w i t wi unde t este valoarea corespunztoare nivelului de siguran ales i numrului de


grade de libertate df=n-1.
n cazul nostru df=25-1=24. Primul pas n determinarea valorii lui t este identificarea este
identificarea coloanei din tabela distribuiei Student. Deoarece probabilitatea de garantare a
rezultatelor este de 0.95 aria de interes este (1-0.95)/2=0,025. Pentru a construi intervalul de
ncredere cutm n tabelul repartiiei Student valoarea corespunztoare pentru df=24 i
nivelul de semnificaie =0,025 i obinem valoarea t=2,064.
Intervalul de ncredere pentru estimarea procentelor celor ce se consider n general mulumii
pentru fiecare condiie se determin calculnd limita inferioar a intervalului 1i i limita
superioar i dup relaiile: 1i w i w i i 2 i w i wi
n ceea ce privete curenia 72% din cei intervievai se consider n general mulumii.
Garantm cu o probabilitate de 95% c 72% 16.7% din studenii ce locuiesc n cmin se
consider mulumii de curenie.
52% 18.59% din totalul studenilor sunt mulumii de cldur, 76% 15.89% sunt
mulumii de apa cald i 84% 13.64% de apa rece.

72

Aplicaie 3
n rndul celor 4000 de studeni ai unei faculti urmeaz s se realizeze un sondaj cu privire
la modul de petrecere a timpului liber, utilizndu-se un procedeu de selecie simplu aleator
fr revenire. Din surse administrative se cunosc informaiile din tabelul 4.5.5. Din cercetri
anterioare pe teme similare efectuate n mediul studenesc s-a constata c variabilele din
tabelul 1.10 sunt puternic corelate cu variabilele de interes ale studiului.
Tabel 4.5.5
ponderea
studenilor care
(%):

locuiesc n cmin

au un loc de munc

sunt bursieri

35

20

25

Se cere:
1. Alegei variabila pe baza creia se va calcula volumul eantionului.
2. tiind c unitile ce vor forma eantionul se vor selecta dup procedeul simplu aleator fr
revenire din lista studenilor furnizat de ctre secretariatul facultii, s se calculeze
volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%.
3. Tot din cercetri anterioare se cunoate c proporia de nonrspunsuri n acest tip de
populaii este de 5%. Pe de alt parte se apreciaz c 2% din studenii ce figureaz n baza
de date urmeaz s fie exmatriculai. Acetia se consider uniti non-eligibile. S se
calculeze n aceste condiii eantionul de pornire.
Rezolvare:
1. Pentru a asigura reprezentativitatea eantionului pentru toate variabilele de interes, volumul
eantionului se va calcula pornind de la acea variabil auxiliar pentru care coeficientul de
variaie are valoarea maxim. Calculele necesare sunt sistematizate n tabelul 4.5.6.
Tabel 4.5.6
ponderea studenilor care:

Media

dispersia

coeficient de variaie (%)

locuiesc n cmin

35

0.35

0.2275

73.38

au un loc de munc

20

0.2

0.16

50

sunt bursieri

25

0.25

0.1875

57.73

Media unei caracteristici calitative de tip alternativ se calculeaz dup relaia:


M
unde M reprezint numrul celor care ndeplinesc condiia n populaie iar N este
p
N
volumul populaiei.

73

Dispersia caracteristicii alternative se calculeaz astfel:

2 p p (1 p)
Valoarea coeficientului de variaie este dat de relaia:
p
V
100
max( p, (1 - p))
Din datele din tabelul 4.5.6 se observ c dup variabila locuiesc n cmin populaia
studenilor este cel mai puin omogen. Se recomand calcularea volumului eantionului
pornind de la aceast variabil.
2. Deoarece procedeul de selecie utilizat este simplu aleator fr revenire la calculul
volumului eantionului se folosete relaia:

z 2 p(1 p )
z 2 p(1 p )
2w
N

1.96 2 0.35 (1 0.35)


1.96 2 0.35 (1 0.35)
0.032
4000

781 persoane

3. Dup determinarea volumului eantionului teoretic necesar trebuie s determinm care este
volumul eantionului de pornire astfel nct n final s ajungem la numrul teoretic de
uniti selectate.
Se pune problema s inem cont de imperfeciunea listei utilizate ca baz de sondaj.
Considerm uniti non-valide acele uniti care n-ar trebui s figureze pe list dac aceasta ar
corespunde perfect populaiei studiate. n practic, n ciuda eforturilor actualizrii bazelor de
date utilizate ca baze de sondaj, exist n mod curent un numr de uniti non-valide. Trebuie
estimat aceast proporie astfel nct s putem determina ct mai precis volumul de pornire al
eantionului.
n funcie de modul de definire a populaiei supuse studiului este posibil ca unele uniti s fie
considerate non-eligibile. De exemplu dac populaia de interes este format din totalitatea
persoanelor cu vrsta cuprins ntre 15 i 64 ani (populaia n vrst de munc) iar unitatea de
selecie este gospodria, persoanele ce nu ndeplinesc condiia de vrst sunt considerate noneligibile.
Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Din aceast cauz se
recomand anticiparea ratei non-rspunsurilor nc din faza de proiectare a sondajului pentru a
redimensiona eantionul.
Relaia de calcul a volumului eantionului de pornire este:
1 1 1
n p n th
unde:
Pr Pe Pv
np= volumul eantionului de pornire; nth= volumul eantionului teoretic; Pr=proporia de
rspuns; Pe=proporia de eligibilitate; Pv=proporia de validitate
1 1 1
n p 781

839 persoane.
0.95 1 0.98

74

Aplicaia 4
n rndul salariailor unei ntreprinderi se va realiza un sondaj stratificat . Organizatorii
sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare strat urmnd s
se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din evidena
personalului s-a calculat, pornind de la variabila vrsta n ani mplinii media i dispersia pe
fiecare strat. Rezultatele se gsesc n tabelul 4.5.7:

numr salariai (pers.)


535
365

sex
masculin
feminin

Tabel 4.5.7
Dispersia
36,4
45,8

vrsta medie (ani)


48
39

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit
maxim admis de 3% din valoarea vrstei medii a tuturor angajailor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate.
Rezolvare
Calculele necesare sunt sistematizate n tabelul 4.5.8.
1. Vrsta medie a celor 900 de salariai se calculeaz ca medie aritmetic ponderata a vrstei
medii a salariailor din cele dou straturi dup relaia:
k

Xi N i

i 1

i 1

39915
44.35 ani
900

Eroarea limit propus este:

x 0.03 X 0.02 42 1.33 ani


Tabel 4.5.8
sex
M
F
Total

Xi

Ni
(pers.)

(ani)

535
365

48
39

i2

Ni Xi

N i 2i

Ni i

36.4
45.8

25680
14235
39915

19474
16717
36191

3227.784
2470.163
5697.947

75

ni

X X N
2

45
35

33813.34
767.4125
34580.75

Volumul eationului n cazul sondajului stratificat se calculeaz dup relaia:


z2 2

n str
2x

z2 2

1.96 2 40.21
1.96 2 40.21
1.33
900

79.6 80 pers.

N
2. Repartizarea eantionului pe straturi se poate realiza n trei moduri i anume:
o neproporional obinndu-se un sondaj stratificat neproporional sau simplu;
o proporional respectndu-se ponderea fiecrui strat n total populaie obinndu-se
un sondaj stratificat proporional;
o innd cont att de proporia fiecrui strat n total ct si de gradul de variaie al
fiecrui strat obinndu-se un sondaj stratificat optim.
Deoarece, att volumul ct i dispersiile straturilor difer considerabil vom alege stratificarea
optim.

Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se utilizeaz
relaia:
k

n1
n2
ni
nk

...
....

N 1 1 N 2 2
Ni i
Nk k

i 1

i 1

Pe baza acesteia deducem relaia de calcul pentru subeantionul ce urmeaz a fi extras din
N
fiecare strat n i k i i n .

N
i

i 1

3227,784
80 45 persoane
5697.947
2470,163
n2
80 35 persoane
5697.947
n1

3. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat , variaia de
care trebuie inut cont n momentul calculrii volumului eantionului este variaia total a
caracteristicii. Deoarece nu se cunosc valorile individuale ale variabilei vrsta pentru
toate cele N uniti din populaie nu putem calcula variaia total dup relaia:
N

(X

X) 2 N

j1

tim c 2 2 2
Vom calcula variaia total ca sum variaiilor inter i intra straturi.

76

(X i X ) 2 N i
2

i 1
k

Ni

34580 .75
38.42
900

i 1

40.21 38.42 78.63


n SAFR

z 2 2

1.96 2 78.63

144 persoane
z22
1.96 2 78.63
2
2
x
1.33
N
900

Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de un sondaj
simplu aleator fr revenire de la 144 persoane la 80 persoane.

Aplicaia 5
n rndul studenilor facultii REI urmeaz s se realizeze un sondaj avnd drept obiectiv
principal analiza calitii procesului de nvmnt. Deoarece se urmrete evidenbierea
caracteristicilor fiecrui an de studi se e va utiliza un plan de sondaj stratificat. Informaiile
necesare aplicrii planului de sondaj au fost preluate de la secretariatul facultii i sunt
prezentate n tabelul 4.5.9.

Anul de studii
An I
An II
An III
An IV
Total

Tabel 4.5.9
Ponderea studenilor fr restane (%)
20
63
45
86

Numr studeni (pers)


600
575
500
450
2125

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de
3%.
2. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul eantionului
calculat la punctul 2.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.

77

Rezolvare
Tabel 4.5.10
Anul
de studii
An I
An II
An III
An IV
Total

Ni

pi

2pi

N i 2pi

N i pi

ni

p i Ni

600
575
500
450
2125

0.2
0.63
0.45
0.86

0.16
0.2331
0.2475
0.1204

96
134.0325
123.75
54.18
407.9625

240
277.6125
248.7469
156.1442
922.5035

137
159
142
90

120
362.25
225
387
1094.25

Calculele necesare sunt prezentate n tabelul 4.5.10


1. Relaia de calcul a volumului eantionului n cazul aplicrii unei plan de sondaj stratificat
z 2 p2

i utiliznd o variabil calitativ este: n str

2w

z 2 p2

2p

2
p i Ni

i 1

407.9625
0.19 unde dispersiile straturilor sunt 2p i p i (1 p i )
2125

i 1

1.96 2 0.19
1.96 2 0.19
0.03
2125

587 persoane

2. Calculul volummului eantionului pe fiecare strat se va realiz pentru un sondaj optim


deoarece exist diferene considerabile ntre straturi n ceea ce priveste volumul i
variaiile.

Pornim de la relaia:

n1
n2
ni
nk

...
....

N 1 p1 N 2 p 2
N i pi
N k pk

n
k

N
i 1

ni

N i pi

n.

N
i

pi

i 1

240
528 137 persoane
922.5
248.7
n3
528 159 persoane
922.5
n1

277.6
528 159 persoane
922.5
156
n4
528 159 persoane
922.5

n2

78

pi

3. Variaia total a caracteristicii calitative este dat de relaia: 2p p (1 p) unde p


reprezint media caracteristicii calitative ce se calculeaz astfel:
k

i 1
k

pi Ni

i 1

Ni

1094 .25
=0.5149 2p 0.5149 (1 0.5149) 0.2498
2125

z 2 2

n SAFR
2w

z2p

1.96 2 0.2498
639 persoane
1.962 0.2498
2
0.0324
2125

N
Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta rezultatele
cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o cretere a
volumului eantionului cu 111 persoane.
Aplicaia 6
n urma unui sondaj stratificat proporional dup mediul de reziden realizat n judeul
Bacu de ctre o societate ce produce buturi rcoritoare, s-au obinut datele centralizate n
tabelul 4.5.11.

Mediul

Efectivul
populaiei
(mii pers.)

Eantion
(pers.)

Urban
Rural
Total

340
325
665

511
489
1000

Tabel 4.5.11
Informaii obinute din eantion
Ponderea celor
Venitul
Dispersia
care consum
totalmediu/gosp venitului total
sptmnal buturi
(mii lei)
mediu/gosp.
rcoritoare (%)
3.8
4.5
72
2.1
1.9
18

Se cere:
1. S se estimeze cu o probabilitate de 0.9545 venitul total mediu/gosp att pe fiecare strat ct
i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum sptmnal
buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.
Rezolvare
1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 4.5.12.

79

Tabel 4.5.12
Mediul

Ni
(mii pers.)

ni
(pers.)

Urban
Rural
Total

340
325
665

511
489
1000

x i mii lei

Si2 .

x i ni

xi

xi

Linf

Lsup

3.8
2.1

4.5
1.9

1941.8
1026.9
2968.7

0.094
0.062

0.188
0.125

3.612
1.975

3.988
2.225

Estimarea venitului mediu/persoan n mediul urban


Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N1=0,05*340000=17000
Deoarece n1<0,05*N1 considerm populaia infinit iar relaiile de calcul folosite pentru
calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire.

x1

S12
4,5

0.094 mii. Lei


n1
511

x1 z

S12
2 0.094 0.188 mii Lei
n1

Intervalul de ncredere:

x1 x1 X1 x 1 x1 3.8 0.188 X1 3.8 0.188 3.612 X1 3.988


Garantm cu o probabilitate de 95.45% c venitul total mediu/gosp n mediul urban este de cel
puin 3.612 mii lei i cel mult 3.988 mii lei.

Estimarea venitului total mediu/gosp n mediul rural


Calculm ct reprezint 5% din volumul populaiei stratului 2.
0.05*N2=0.05*325000=16250
Deoarece n2<0.05*N2 considerm populaia infinit iar relaiile de calcul folosite pentru
calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire.

x2

S 22

n2

x2 z

1 .9
0.062 mii lei
489

S22
2 0.062 0.125 mii lei
n2

Intervalul de ncredere:
x 2 x2 X 2 x 2 x2 2.1 0.125 X 2 2.1 0.125 1.975 X 2 2.225

Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este de cel puin
1.975mii lei i cel mult 2.225 mii lei.

80

Estimarea venitului mediu/persoan pe total jude


Deoarece sondajul realizat este stratificat proporional estimatorul venitului mediu/peroan la
nivelul judeului se calculeaz astfel:

~
x

xi ni

i 1

i 1

2968,7
2.9687 mii lei
1000

Calcului erorii de reprezentativitate:


k

~x

n i2

2x i 0.056821 mii lei

i 1

~x z ~x 2 0.056821 0.113642 mii lei


Intervalul de ncredere:
~
x ~x X ~
x ~x 2.9687 0.1136 X 2.9687 0 .1136 2.8551 X 3 .0823

Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n judeul Bacu este de cel


puin 2.8551 mii lei i cel mult 3.0823mii lei.
2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 4.5.13
Tabelul 4.5.13
Ni
(mii pers.)
340
325
665

Mediul
Urban
Rural
Total

ni
(pers.)
511
489
1000

wi

Si2 .

wini

wi

0.72
0.18

0.2016
0.1476

367.92
88.02
455.94

0.020 0.040 0.680 0.760


0.017 0.035 0.145 0.215

wi

Linf

Lsup

Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul urban
Estimatorul procentului celor care . consum sptmnal buturi rcoritoare n mediul urban
calculat pe baza datelor din eantion este de 72%. Pentru a estima procentul acestora n
mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Deoarece populaia este considerat infinit utilizm relaiile de calcul aferente calculul
sondajului simplu aleator cu revenire.

w1

S12
0.2016

0.020
n1
511

w1 z

S12
2 0.020 0.040
n1

Intervalul de ncredere:

w 1 w1 p1 w 1 w1 0.72 0.040 p1 0.72 0.040 0.680 p1 0.76

81

Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult 76%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
N1 w 1 w1 N1 p1 N1 w 1 w1
N1 0.72 0.040 M 1 N 1 0.72 0.040
231293 M 1 258307

Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293 persoane i cel
mult 258307 persoane consum sptmnal buturi rcoritoare.
Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul rural
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un procent de
18% al celor care consum sptmnal buturi rcoritoare.
Calculm eroarea de reprezentativitate

w2

S 22
0.1476

0.017
n2
489

w2 z

S22
2 0.017 0.035
n2

Intervalul de ncredere:
w 2 w2 p 2 w 2 w2 0.18 0.035 p 2 0.18 0.035 0.145 p 2 0.215
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel mult 21.5%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
N 2 w 2 w2 N 2 p 2 N 2 w 2 w2 47207 M 2 69793
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane i cel
mult 69793 persoane consum sptmnal buturi rcoritoare.
Estimarea procentului celor care consum sptmnal buturi rcoritoare pe total jude
Deoarece sondajul realizat este stratificat proporional estimatorul unwi variabile calitative la
nivelul judeului se calculeaz astfel:
k

~ n w
w
i i
i 1

ni
i 1

455.94
0.45594
1000

Calcului erorii de reprezentativitate:


k

w~

n2

ni2 w2i

0.013236

i 1

w~ z w~ 2 0,012236 0,026472 Intervalul de ncredere:


~ ~ p w
~ ~
w
0 .45594 0.026472 p 0 .45594 0.026472
w
w
0 .429468 p 0.482412

82

Garantm cu o probabilitate de 95.45% c cel puin 42.9468% i cel mult 48.2412% din
judeul Bacu consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
~ ~ Np N w
~ ~
Nw
w
w
285596 M 320804
Garantm cu o probabilitate de 95.45% c n judeul Bacu cel puin 285596 persoane i cel
mult 320804 persoane consum sptmnal buturi rcoritoare.

Aplicaia 7
Studenii unei faculti sunt mprii n 100 de grupe. Fiecare grup este format dintr-un numr
egal de studeni (16). S-a realizat un sondaj de serii, procedeul de selecie a grupelor fiind
simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt prezentate n tabelul 4.5.14

seria

Ponderea studenilor care doresc s


participe la cursul facultativ (%)

seria

1
2
3
4
5
6
7
8

60
54
56
62
63
50
49
58

9
10
11
12
13
14
15
16

4.5.14
Ponderea studenilor care doresc s
participe la cursul facultativ (%)
55
58
59
63
62
64
62
61

Se cere:
1. S se estimeze ponderea studenilor care doresc s participe la cursul facultativ cu o
probabilitate de 95%.
2. tiind c raportul de corelaie inter-serii este de 12% ce volum de eantion ar fi fost necesar
dac s-ar fi realizat un sondaj simplu aleator fr revenire?
Rezolvare
Tabelul 4.5.15
seria

wj

1
2
3
4
5
6
7
8
Total

0.6000
0.5400
0.5600
0.6200
0.6300
0.5000
0.4900
0.5800

0.0002
0.0020
0.0006
0.0012
0.0020
0.0072
0.0090
0.0000

seria

wj

9
10
11
12
13
14
15
16

0.5500
0.5800
0.5900
0.6300
0.6200
0.6400
0.6200
0.6100
9.3600

0.0012
0.0000
0.0000
0.0020
0.0012
0.0030
0.0012
0.0006
0.0318

83

1. Calculele necesare sunt sistematizate n tabelul 4.5.15


Estimatorul n cazul unei variabile cantitative se calculeaz astfel:
1
w
r

j1

9.36
0.585
16

Eroroarea de reprezenzentativitate este:


2
2
R r p
R r p
100 16 0.0021
w

0.01055 unde
R
r
R
r
100
16
r

0.0318
0.0021
r 1
16 1
Eroarea limit corespunztoare probabilitii de 0,95 este:
w z w 1,96 0,01055 =0,0207
Intervalul de ncredere:
Pw
0,585 0,0207 P 0,585 0,0207 0,5643 P 0,6057
w
w
w
Garantm cu o probabilitate de 95% c cel puin 56,43% i cel mult 60,57% din studeni
doresc s participe la cursul facultativ.
2. n cazul sondajului de serii numrul de elemente simple ce au format eantionul a fost de
256. Relaia de calcul pentru sondajul simplu aleator fr revenire este:
z 2 S2
1,96 2 0,585 (1 0,585)
n 2

922 studeni
w z S 2 N 0,0207 2 1,96 2 0,585 (1 0,585) 1600
2
p

i 1

Deoarece variaia dintre serii este foarte mic (raportul de corelaie inter-serii fiind doar 0,87)
sondajul de serii se dovedete foarte eficient.
Aplicaia 8
O localitate este format din 415 gospodrii(serii). Numrul de elemente dintr-o serie
(membrii) este diferit i nu se cunoate nivelul mediu al acestuia pentru toate cele 415
gospodrii. Pentru a estima venitul mediu pe persoan se extrage n mod aleator un eantion
format din 25 de serii. Datele centralizate sunt prezentate n tabelul 4.5.16
Tabel 4.5.16
seria
1
2
3
4
5
6
7
8
9
10
11
12
13

Numrul.de
rezideni
8
12
4
5
6
6
7
5
8
3
2
6
5

venit total pe serie


(mil. lei)
32
42
19
22
27
26
27
21
30
15
10
26
20

seria
14
15
16
17
18
19
20
21
22
23
24
25
Total

84

Numrul de
rezideni
10
9
3
6
5
5
4
6
8
7
3
8
151

venit total pe serie


(mil. lei)
30
32
12
25
18
21
17
22
30
25
14
29
592

Se cere s se estimeze venitul mediu pe gospodrie i venitul mediu pe persoan cu o


probabilitate de 95%.
Rezolvare
Este vorba de un sondaj de serii de dimensiune diferit selectate dup un procedeu de selecie
cu probabiliti egale. Calculele sunt sistematizate n tabelul 4.5.17
Tabel 4.5.17
seria

Nj

Tj

T j Yj N j

1
2
3
4
5
6
7
8
9
10
11
12
13
Total

8
12
4
5
6
6
7
5
8
3
2
6
5

32
42
19
22
27
26
27
21
30
15
10
26
20

0.40419
25.4657
11.0083
5.74729
12.0883
6.13464
0.19688
1.95259
1.86115
10.4873
4.66102
6.13464
0.15789

seria

Nj

Tj

T j Yj N j

14
15
16
17
18
19
20
21
22
23
24
25

10
9
3
6
5
5
4
6
8
7
3
8

30
32
12
25
18
21
17
22
30
25
14
29

84.7375
10.7897
0.05684
2.181
2.56848
1.95259
1.73681
2.32007
1.86115
5.97171
5.01048
5.58962

151

592

211.07

Estimatorul mediei populaiei este:


r

T j

N Y N
j

j1

j1

j 1
r

Nj

595
3.94 mil. lei
151

j 1

Deoarece nu se poate calcula mrimea medie seriilor din populaie N se va estima cu ajutorul
mrimii medii a seriilor din eantion n .
r

n Nj r
j 1

151
6.04
25

Estimarea dispersia totalurilor seriilor fa de totalul mediu este:


2

Y
N

j j j
j 1
r

T 2

r 1

196 .143
7.05
24

85

Eroarea medie de reprezentativitate este:


2
R r 1 T
415 25
1
7.05
2

0.085
2
R n
r
415
25
6.04

Eroarea limit maxim admis este:

z 1.96 0.085 0.1666 mil.lei


Y

Intervalul de ncredere pentru venitul mediu pe o persoan este:

Y Y Y 3,94 - 0.1666 Y 3.94 0.1666


Y

3.774 Y 4.107
garantm cu o probabilitate de 95% c venitul mediu pe o persoan n aceast localitate este
de cel puin 3.774 mil. Lei i cel mult 4.107 mil lei.
Intervalul de ncredere pentru estimarea venitului mediu pe o gospodrie:

n Y
Y

n Y n Y 6.04 3.774 T 6.04 4.107 22.793 T 24.107


Y

Venitul mediu al unei gospodrii se ncadreaz n intervalul :(22.793; 24.107) mil lei.

86

Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE

Ce cuprinde aceast unitate de nvare?


5.1. Obiectivele unitii 5
5.2. Sondajul multistadial
5.3. Sondajul multifazic
5.4. Sondajul pe baz de eantioane fixe
5.5. Aplicaii
5.1. Obiective

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Cum se organizeaz un sondaj complex n funcie de caracteristicile


populaiei i de informaiile auxiliare disponibile

Estimarea parametrilor n cazul sondajelor complexe

5.2. Sondajul multistadial


Planurile de sondaj prezentate pn acum sunt desfurate ntr-un singur stadiu n care
unitile simple sau complexe au fost selectate i au format eantionul. n cazul utilizrii unui
plan de sondaj multistadial eantionarea se realizeaz n mai multe etape numite stadii.

Principalul dezavantaj al sondajului multistadial este acelai ca i n cazul sondajului


de serii, aa numitul efect de serii. Indivizii aflai n vecintate tind s se asemene, avnd
87

multe trsturi comune ce i difereniaz de alte grupuri. Acest lucru determin o variaie mic
n interiorul unitilor primare i o variaie mare ntre acestea, deci o eroare de
reprezentativitate mare.
Un astfel de sondaj presupune extragerea n primul stadiu a unui numr de uniti
primare care nu vor fi cercetate n totalitate ci vor constitui o baz de sondaj pentru al doilea
stadiu cnd se vor selecta unitile secundare ce vor constitui baz de sondaj pentru urmtorul
stadiu. Fiecare stadiu i va aduce contribuia la calculul erorii de reprezentativitate, cea mai
mare contribuie avnd-o eroarea din primul stadiu. Din acest motiv se recomand ca
numrul de stadii s nu fie foarte mare.
Realizarea unui sondaj n mai multe stadii presupune existena unei grupri a
populaiei. Aceast grupare, de cele mai multe ori, nu trebuie realizat n mod special
deoarece unitile populaiilor sunt deja grupate dup criterii administrative, geografice,
sociale etc. De exemplu ntr-un sondaj realizat cu privire la starea de sntate a populaiei
eantionul din primul stadiu este format din zone teritoriale. n al doilea stadiu din zonele
teritoriale selectate se vor extrage localitile, iar n al treilea stadiu indivizii ce vor forma
eantionul i vor completa chestionarele. n aceast situaie nu este necesar o baz complet
de sondaj dect pentru localitile ce au fost selectate n al doilea stadiu.
Pentru exemplificare se va prezenta n continuare sondajul desfurat n dou stadii
(bistadial). Schema de realizare a acestuia este prezentat n figura 5.2.1.
Figura nr. 5.2.1 Schema de realizare a sondajului bistadial
UP
1

2 .

STADIUL I

US

1 2

r
STADIUL II

88

Notm cu:
R = numrul de uniti primare din populaie;
r = numrul de uniti primare selectate n primul stadiu;
Nj = numrul total de uniti simple (indivizi) din UPj;
nj = numrul de uniti simple (indivizi) extrase din UPj .

Numrul total de uniti simple:


R

N N j

(5.2.1)

j 1

Totalul variabilei de interes pentru unitatea primar UPj;


Nj

T j y ij

(5.2.2)

i 1

Totalul variabilei de interes pentru toate unitile primare:


R Nj

T yij

(5.2.3)

j 1 i 1

Estimatorul totalului variabilei studiate:


n

R r N j j

T
y
(5.2.4)
ij
r j 1 n j i 1
Estimatorul totalului mediu variabilei studiate pe o unitate primar:
n

1 r N j j

T
yij
(5.2.5)

r j 1 n j i 1

n cazul n care unitile primare i secundare se selecteaz dup procedeul aleator fr


revenire cu probabiliti egale, variaia estimatorului totalului variabilei studiate este dat de
relaia:
V(T)

R 2 1 1
R r

variaia dintre UP

n j 22,j
R r 2
N
1

j N n
r j 1
j
j

variaia din interiorul UP

(5.2.6)

n aceast relaie avem:


2
1. 12 , 1 variaia totalurilor unitilor primare fa de totalul mediu i estimatorul acesteia
calculate conform relaiilor:
1 R
1 r
12 (T j T ) 2
(5.2.7) i 12
(T j T ) 2 (5.2.8)
R j 1
r 1 j 1

2. 22,i variaia din interiorul unitii primare UPj cu j 1, R i estimatorul acesteia 22,i
calculate conform relaiilor:

22,i

1
Nj

Nj

( yij y j ) 2 (5.2.9) i 22,i


i 1

89

j
1
( y ij y j ) 2 (5.2.10)
n j 1 i 1

Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei


estimatorului valorii totale dup relaia:

n j 22,j
r 12
R r 2

R 1
N j 1
(5.2.11)

R
r
r
N

j nj
j 1

Pornind de la estimatorul totalului variabilei putem estima totalul mediu pe o unitate


primar i nivelul mediu al variabilei astfel:
T
T
T
i y
R
N
Primul termen al variaiei estimatorului are o contribuie substanial n determinarea
mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de sondaj trebuie
s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se recomand
stratificarea unitilor primare.

T V(T)

5.3. Sondajul n mai multe faze


Acest tip de sondaj nu trebuie confundat cu sondajul multistadial cnd, n fiecare
treapt se selecteaz unitile ce constituie baza de eantionare pentru urmtorul stadiu
urmnd s se culeag informaii de la unitile selectate n ultimul stadiu. Planul de sondaj
multifazic presupune selectarea unui eantion foarte mare n prima faz i culegerea
unor date privitoare la un numr redus de caracteristici. Eantionul din prima faz
servete ca baz de eantionare pentru urmtoarea faz. Programul de observare din a doua
faz va fi mai cuprinztor. n faza urmtoare se continu reducerea eantionului i lrgirea
programului de observare. Dintre autorii care au dezvoltat n studiile lor acest tip de
eantionare amintesc: Cochran (1977) i Scherrer (1983).

Figura 5.3.1. Schema de realizare a unui sondaj n dou faze


Populaie de volum N

Selecia din
faza 1

Eantion de volum n1
CHESTIONAR
Plan de observare
redus FAZA 1
Eantion de volum n2

Selecia din
faza 2

CHESTIONAR
Plan de observare
extins FAZA 2

Acest plan de eantionare regrupeaz diferite planuri de eantionare pentru care


obinerea de date se realizeaz ntr-un numr fixat de etape (egal cu numrul de planuri de
sondaj aplicate) ealonate n timp. Ca efect, obinerea de informaii pe etape nu nseamn
90

neaprat c acestea au rolul de a informa n scopul derulrii procesului de derulare a planului


de sondaj. Ele pot fi utilizate doar pentru analiza final.
S lum ca exemplu un sondaj privitor la cheltuielile familiilor realizat n dou faze.
Schema acestuia este prezentat n figura nr. 5.3.1. n prima faz pe un eantion mare se vor
culege date privitoare la cheltuielile efectuate pe principalele grupe de cheltuieli. Informaiile
obinute vor permite cunoaterea gradului de variabilitate al caracteristicilor i vor facilita
realizarea unui eantion reprezentativ n a doua faz. De data aceasta numrul caracteristicilor
cercetate va fi mult mai mare.

5.4. Sondajul pe baz de eantioane fixe


Esena acestei metode const n a obine informaii repetate de la acelai eantion
numit panel. Primul panel detaliat a fost realizat n Statele Unite de ctre Arthur Charles
Nielsen n anul 1929. La o diferen de 30 ani a fost creat primul panel din Frana tot de ctre
Nielsen.
n literatura de specialitate se consider c exist dou tipuri de sondaje pe baz de
eantioane fixe:
eantionul este permanent i subiectul cercetrii este identic sau foarte asemntor
(audiena emisiunilor TV);
eantionul este permanent i poate fi utilizat pentru cercetri cu subiecte diferite.
Cercetarea poate avea loc periodic sau se poate face la intervale neregulate de timp.

91

Sondajele repetate, asupra aceleiai probleme, la intervale regulate de timp, urmrind


s identifice unele tendine, periodiciti, sau alte elemente dinamice pentru parametrul de
interes se mai numesc i sondaje longitudinale. 9
Sondajele pe baza unui panel presupun iniial realizarea unui eantion reprezentativ
pentru populaia studiat. Acest eantion este de cele mai multe ori realizat dup un plan
multistadial cu stratificarea unitilor primare. Unitile care formeaz aceste eantioane
pot fi diverse: ntreprinderi, magazine, gospodrii, persoane. Eantionul astfel constituit
permite strngerea de informaii cu o anumit regularitate sau la intervale neprecizate de timp.
Pentru culegerea datelor se poate utiliza oricare din metodele cunoscute.

Dumitrescu M., 2000, Sondaje statistice i aplicaii, Ed. Tehnic, Bucureti, p. 110.

92

O soluie pentru nlturarea acestor dezavantaje o constituie rennoirea panelurilor


prin limitarea la un numr stabilit de participri la sondajele realizate dup care vor fi
nlocuii. nnoirea eantionului poate fi parial sau total.
Ca o conduit general, condiiile impuse de celelalte planuri de sondaj cu selecie
probabilistic sunt necesare i pentru construirea unui panel. De exemplu: definirea cu
exactitate a populaiei de referin, construirea unei baze de sondaj adecvate, stabilirea unui
plan de sondaj eficient, alegerea metodei de culegere a datelor, alegerea unor metode
pertinente de redresare a eantionului10.

Odat decise planul de eantionare i metoda de culegere a datelor se trece la selecia


eantionului. Se va contacta fiecare individ din cei ce au fost selecionai pentru a li se explica
ce presupune i ce importan are participarea la o astfel de cercetare. Ulterior este necesar
obinerea asigurrii unei colaborri de lung durat. Acest acord depinde de complexitatea
sarcinilor i de timpul cerut de rmnere n eantion.
n general rata de recrutare n panel este inferioar ratei de rspuns pentru o anchet
ad-hoc similar. Recrutarea unui panel este o chestiune foarte costisitoare. Asigurarea unui
nivel de colaborare ct mai ridicat posibil din partea panelitilor constituie miza major a
gestiunii unui panel. Continuitatea i coerena culegerii datelor depinde de relaia de
colaborare care se creeaz cu membrii panelului 11 Aceast relaie este fondat pe un contract
ce trebuie respectat. Pentru aceasta trebuie respectat termenul convenit i nu trebuie s se
solicite membrilor panelului sarcini care nu au fost stabilite n momentul recrutrii.

Eficiena unui panel trebuie verificat pe toat durata de via a acestuia. n principiu,
ideea de baz const n a aprecia dac s-au produs modificri semnificative n structura
eantionului sau dac modificrile survenite asupra caracteristicilor demo-economice
sunt semnificative. Pentru a verifica acest lucru se utilizeaz urmtoarele metode:
a) Metoda coeficientului de corelaie. Considerm cazul a dou sondaje succesive
asupra unui panel de dimensiune mare. Numrul de uniti cercetate rmne neschimbat. Fie
variabilele numerice de sondaj yi1i yi2 (ce provin din cele dou sondaje succesive) de medii y1
n primul sondaj i y2 n al doilea. Dispersia populaiei este cunoscut i nemodificat ntre cele
dou momente de timp. Variana diferenei dintre cele dou medii este dat de relaia:
2 2
2 2 2
V ( y 2 y1 ) V ( y 2 ) V ( y1 ) 2 cov( y 2 y1 )

2 ry y

1 2 ry y
n
n
n
n
1 2

10

1 2

Niculescu-Aron I. G., 2004, O privite general privind utilizarea panelurilor n studiul comportamentului
consumatorului, Revista de informatic social nr. 2/2004, www.ris.uvt.ro
11
Saporta G., 2003-2004, Enquetes et Sondages, http:// cedric.cnam.fr/~saporta

93

Dac panelul nu mai este eficient se poate considera c cele dou medii provin din
eantioane independente. n acest caz ntre yi1 i yi2 nu exist nici o legtur, coeficientul de
corelaie fiind nul iar variana diferenei dintre medii este:V ( y 2 y 1 ) 2 2 n
n funcie de valoarea coeficientului de corelaie pot exista urmtoarele situaii:
o ry1 y 2 0 legtur invers ntre valorile variabilei yi la cele dou momente de timp.
Uzura panelului este foarte mare i necesit rennoire total.
o ry1 y 2 0,9 legtur foarte puternic ntre valorile variabilei yi la cele dou momente de
timp. Panel eficient. Nu este necesar rennoirea acestuia;
o 0,2 ry1 y2 0,9 Exist o legtur ntre valorile variabilei yi la cele dou momente de
timp dar nu foarte puternic rennoirea parial a panelului. n funcie de valoarea
coeficientului de corelaie se decide care este proporia de rennoire (k). Unii autori
consider c valoarea optim este de 50%.
o 0 ry1 y2 0,2 Nu exist legtur ntre valorile variabilei yi la cele dou momente de
timp. Se poate spune c datele provin din eantioane independente rennoirea total a
panelului.
b) Utilizarea testului Student pentru observaii perechi. Variabilele cuprinse n
planul de sondaj pot fi variabile de interes definite n concordan cu obiectivele studiului i
variabile auxiliare sau de identificare utilizate n stabilirea planului de sondaj .
n cazul n care variabila pentru care s-a efectuat testul este o variabil auxiliar care sa utilizat n momentul proiectrii eantionului aceast diferen denot o deteriorare a
panelului i necesitatea rennoirii acestuia.
Dac ns variabila pentru care s-a efectuat testul este una din variabilele de interes
conform obiectivelor anchetei aceast diferen semnificativ va fi interpretat n contextul
analizei efectuate.
n anchetele periodice ce se realizeaz asupra forei de munc n Romnia conform
metodologiei EUROSTAT se utilizeaz un panel ce este rennoit permanent dup o schem
rotaional de forma 2-2-2. Aceasta are ca principiu de baz urmtoarea tehnic: o locuin
este cercetat dou trimestre consecutive, este scoas temporar din cercetare urmtoarele dou
trimestre, este reintrodus n cercetare urmtoarele dou trimestre apoi este scoas definitiv.
Conform schemei aplicate n fiecare trimestru se pstreaz n eantion 50% din locuinele
trimestrului anterior. 25% din locuinele cercetate cu dou trimestre n urm iar restul de 25%
sunt locuine absolut noi. Astfel se pstreaz i o acoperire de 50% a eantioanelor de la un
trimestru al unui an la acelai trimestru al anului precedent.

94

5.5. Aplicaii
Aplicaia 1
Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia de 18 ani
peste de 48000. Unitile primare sunt reprezentate de seciile de votare (27) i au fost
selectate dup un procedeu aleator cu probabiliti egale fr revenire. n tabelul 5.5.1. sunt
prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor din fiecare unitate
primar ce a fost selectat n eantion.

secia

nr. pers.
din secia i

1
2
3
4
5
6
7
8
9
10
11

2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295

nr. pers.
selectate din
secia i
43
43
43
52
42
52
46
45
42
52
52

venitul mediu
(mil lei)

dispersia dup
variabila venit

2.8
2.5
2.6
3.8
4.2
4.1
3.7
3.5
3.4
2.7
2.9

0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484

Tabelul 5.5.1
nr. pers. care
petrec la televizor
mai mult de 3 h/zi
20
25
24
28
31
36
28
29
33
36
30

Se cere:
1. S se estimeze venitul mediu din localitate pentru o probabilitate de 95%.
2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru aceeai
probabilitate.
Rezolvare
1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza calculelor
sistematizate n tabelul 5.5.2.
r
r
N ni
R r
R
27
R
i
T
y ij
Ni Y
Ti = 73023.4 =179239.25 mil lei
i
r i1 n i j1 r i1
r i1
11

Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei estimatorului


valorii totale dup relaia:

r 2 R

R 2 1 1
r
R r

unde 12

1
T
r

1
r 1

T =
i

i 1

2,i

ni

i 1

(T T)
i

i 1

n
N i2 1 i
Ni

30397397
3039739.7
10

73023,4
6638.5 mil. lei
11

95

Tabel 5.5.2
secia
1
2
3
4
5
6
7
8
9
10
11
Total

Ni
2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
22294

ni
43
43
43
52
42
52
46
45
42
52
52
512

Y
i

22,i

Ti

(Ti T ) 2

ni
1

N
i

2.8
2.5
2.6
3.8
4.2
4.1
3.7
3.5
3.4
2.7
2.9

0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484

5924.8
6075
5896.8
8914.8
7350
9782.6
8066
5369
5433.2
6455.7
3755.5
73023.4

509354.714
317522.005
550105.405
5181583.08
506245.186
9885421.98
2037782.2
1611607.17
1452726.18
33412.5164
8311636.58
30397397

0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96

N i2 1

ni
Ni

2,i

ni

4080.44
7769.85
18776.93
9314.52
17791.67
17135.15
11013.39
507.58
5328.19
4301.96
1498.25
97517.92

Calculm primul termen al erorii de reprezentativitate indus de selecia din primul stadiu al
planului de sondaj.
11 3039739.7
Termen1=272 1
=119378868.2
11
27
Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a avut loc n al
doilea stadiu, n interiorul unitilor primare ce au format eantionul.
27
Termen2= 97517.92 =239362.8
11
Observm c primul termen al variaiei estimatorului are o contribuie substanial n
determinarea mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de
sondaj trebuie s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se
recomand stratificarea unitilor primare.

T 119378868 239362.8 10937.012


Intervalul de ncredere al totalului este:
T 1.96 T T T 1.96 T

157802.7 T 200675.8 mil. Lei


Venitul mediu estimat este:
T
Y 3.734 mil. lei
N
Intervalul de ncredere al venitului mediu este :
1
T
1
(T 1.96 * T ) (T 1.96 * T )
N
N N
3.287 Y 4.18
Garantm cu o probabilitate de 95% c venitul mediu pe o persoan este de cel puin
3.287 mil. lei i cel mult 4.18 mil. lei.

96

2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate n tabelul
5.5.3.
Tabelul 5.5.3

secia Ni

ni

mi

i
w

22,i

Ti

(Ti T) 2

1
2
3
4
5
6
7
8
9
10
11
Total

43
43
43
52
42
52
46
45
42
52
52
512

20
25
24
28
31
36
28
29
33
36
30

0.4651
0.5814
0.5581
0.5385
0.7381
0.6923
0.6087
0.6444
0.7857
0.6923
0.5769

0.2488
0.2434
0.2466
0.2485
0.1933
0.2130
0.2382
0.2291
0.1684
0.2130
0.2441

984.2
1412.8
1265.9
1263.2
1291.7
1651.8
1327.0
988.6
1255.6
1655.3
747.1
13843.11

75228.67524
23816.57237
54.70016007
22.7172322
1102.383243
154749.1181
4691.155746
72838.84794
8.369917026
157484.5118
261477.9275
751474.9792

2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
22294

ni
1

Ni
0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96

Calculm estimatorul totalului variabilei studiate (numrul persoanelor care


televizor mai mult de 3 h/zi

R
T
r

i
Ni w

i 1

R
r

25378.59
32829.62
28942.27
25720.57
13757.28
22813.07
24088.40
11630.56
9967.70
22909.85
7555.70
225593.60

petrec la

27
13843.11 = 33978.54 pers.
11

n 2,i
N i2 1 i
Ni ni

i 1

Eroarea medie de reprezentativitate se va calcula pe baza relaiei:

r 2 R
R 1 1
r
R r
2

unde 12

1
T
r

1
r 1

T =
i

i 1

i 1

(T T)
i

i 1

N i2 1

ni
Ni

2,i

ni

751474.9792
75147.49792
10

13843,11
1258.465 pers.
11

11 75147.49792
Termen1=272 1
=2951247.191
11
27
27
Termen2= 225593.60 =553729.7456
11
Observm c i n acest caz primul termen al variaiei estimatorului are o contribuie
substanial n determinarea mrimii erorii de reprezentativitate. stadiu.
T 2951247.191 553729.7456 1872.158363
Intervalul de ncredere al totalului este:
T 1.96 T T T 1.96 T

30309 T 37648 persoane


Cel puin 30309 persoane i cel mult 37648 persoane petrec cel puin 3 ore pe zi la televizor.

97

Procentul mediu estimat este:

T 0.70789
w
N
Intervalul de ncredere al procentului mediu este :
1
T
1
(T 1.96 * T ) (T 1.96 * T )
N
N N
0 .6315 p 0.7843

Se garanteaz cu o probabilitate de 95% c cel puin 63.15% i cel mult 78.43% din populaia
ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.
Aplicaia 2
n rndul societilor comerciale din domeniul de activitate Hoteluri i restaurante se
realizeaz o anchet periodic ce are la baz un eantion de tip panel. Pornind de la variabila
auxiliar numr salariai prezentat n tabelul 5.5.4 (pentru exemplificare s-au luat doar
primele 20 de societi comerciale din eantion) se va verifica eficiena panelului.
Se cere:
1. S se stabileasc gradul de uzur al panelului cu ajutorul metodei coeficientului de
corelaie.
2. S se verifice eficiena panelului cu ajutorul testului Student (=0.05) pentru date nrudite
(eantioane dependente).

societate
comercial

1
2
3
4
5
6
7
8
9
10

Numr salariai (pers.)


la momentul
la momentul
verificrii
realizrii
eficienei
panelului
panelului
Yi1
Yi2
13
14
15
14
37
35
44
40
34
30
23
21
21
30
14
17
15
20
16
20

societate
comercial

11
12
13
14
15
16
17
18
19
20

18
17
22
25
28
29
33
43
25
28

1. Calculm valoarea coeficientului de corelaie dup relaia:


n
n
n
ni 1 yi1 yi 2 i 1 yi1 i 1 yi 2
ry1 y2
n n y 2 i1 n y i1 2 n n y 2 i 2 n y i 2 2
i 1
i 1

i1
i 1

98

Tabel 5.5.4
Numr salariai (pers.)
la momentul
la momentul
verificrii
realizrii
eficienei
panelului
panelului

22
22
20
25
27
28
31
41
28
30

Calculele necesare aflrii coeficientului de corelaie sunt prezentate n tabelul 5.5.5


Tabelul 5.5.5
societate
comercial
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
total

yi1

yi2

yi1 yi2

y2 i1

y2 i2

13
15
37
44
34
23
21
14
15
16
18
17
22
25
28
29
33
43
25
28
500

14
14
35
40
30
21
30
17
20
20
22
22
20
25
27
28
31
41
28
30
515

182
210
1295
1760
1020
483
630
238
300
320
396
374
440
625
756
812
1023
1763
700
840
14167

169
225
1369
1936
1156
529
441
196
225
256
324
289
484
625
784
841
1089
1849
625
784
14196

196
196
1225
1600
900
441
900
289
400
400
484
484
400
625
729
784
961
1681
784
900
14379

20 14167 500 515

ry1y2

20 14196 500 20 14379 515


2

0.9384 0.9

n aceste condiii se consider panelul eficient i nu este necesar nnoirea acestuia.


2. Utilizarea testului Student pentru date nrudite pornind de la o variabil auxiliar
presupune:
H0 : y1 y 2 ; H1 : y1 y 2
Considerm variabila d i yi1 y i 2 ce msoar diferenele individuale, pentru care calculm
media i abaterea medie ptratic (vezi tabelul 5.5.6).

d y1 y 2 25 25.75 0.75
n

Sd

n 1 229.75 / 19 3.47737

i 1

Statistica testului este: t c

y1 y 2

n 0.96455
Sd
Sd
Valoarea calculat a testului se compar cu cea teoretic corespunztoare nivelului de
semnificaie ales i n-1=19 grade de libertate. Valoarea teoretic ce corespunde nivelului de
semnificaie =0.05 i numrului de grade de libertate 19 este t=2.093 Deoarece valoarea

99

calculat este mai mic dect cea teoretic se accept ipoteza diferenei nule ceea ce
nseamn c nu exist diferene semnificative ntre cele dou medii, panelul fiind eficient
Tabelul 5.5.6
societate
comercial

yi1

yi2

di

d d

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total

13
15
37
44
34
23
21
14
15
16
18
17
22
25
28
29
33
43
25
28
25

14
14
35
40
30
21
30
17
20
20
22
22
20
25
27
28
31
41
28
30
25.75

-1
1
2
4
4
2
-9
-3
-5
-4
-4
-5
2
0
1
1
2
2
-3
-2
-0.75

0.0625
3.0625
7.5625
22.5625
22.5625
7.5625
68.0625
5.0625
18.0625
10.5625
10.5625
18.0625
7.5625
0.5625
3.0625
3.0625
7.5625
7.5625
5.0625
1.5625
229.75

100

Unitatea de nvare 6
SONDAJE NEPROBABILISTICE

Ce cuprinde aceast unitate de nvare?


6.1. Obiectivele unitii de nvare 6
6.2. Tipuri de sondaje neprobabilistice
6.3. Sondajul pe cote
6.4. Aplicaii

6.1. Obiective

Dup studiul acestei uniti de nvare vei avea cunotine despre:

Modul de construire a esantioanelor nealeatoare


Cum se realizeaza un sondaj pe cote

6.2. Tipuri de sondaje neprobabilistice


Toate tipurile de sondaj prezentate pn n acest punct sunt probabilistice. Acestea
presupun existena unei baze de sondaj din care, cu probabiliti cunoscute, se extrage fiecare
unitate a eantionului a crui mrime a fost determinat n funcie de precizia estimaiei dorite
i de probabilitatea cu care dorim s garantm rezultatele.
Exist situaii, n special n sondajele de opinie sau n studii de pia, cnd se utilizeaz
metode neprobabilistice de eantionare.
Sondajele neprobabilistice sunt cele n care elementele ce formeaz eantionul au fost
alese n mod arbitrar, iar probabilitile fiecrei uniti de a intra n eantion sunt necunoscute.
Putem spune c aceste metode sunt netiinifice. Dintre acestea cele mai cunoscute sunt
sondajele efectuate pe baza urmtoarelor procedee de eantionare: eantionarea la ntmplare
(oarb), eantionarea pe baza metodei voluntariatului, eantionarea raional i eantionarea
pe cote.

101

6.3. Sondajul pe cote


Sondajul pe cote este cel mai utilizat sondaj neprobabilistic. n cazul acestui sondaj
deplasrile anchetatorilor vor fi limitate, spre locuri alese la ntmplare dar bine determinate.
Aceast metod conduce la economii de cutare i deplasare, adesea foarte importante. Scopul
pe care i-l propune metoda este ca eantionul construit s se apropie ct mai mult posibil de
un eantion obinut pe baza unei selecii aleatoare riguroase.
Principiul care st la baza metodei pornete de la ideea c un eantion reprezentativ
red structura populaiei studiate. Astfel, dac reproducem fidel anumite caracteristici ale
populaiei, eantionul, prin extindere va fi reprezentativ i pentru celelalte caracteristici
controlabile sau necontrolabile ce constituie obiectul anchetei. Criteriile pe baza crora se
formeaz eantionul se numesc criterii de cot.
102

n acest tip de sondaj fiecrui operator i este repartizat un numr de chestionare


stabilindu-se cte trebuie realizate pe fiecare categorie. Obligaia operatorului este de a
respecta aceste criterii rmnnd la latitudinea lui ce persoane s selecteze. Acesta este
motivul pentru care este necesar ca operatorii de interviu s fie foarte bine pregtii i s aib
experien n domeniu.

n esen, ceea ce i se cere unui operator este s se transforme ntr-un instrument de


selecie cvasialeatoare care, pe parcursurile pe care le urmeaz n zona care i-a fost
repartizat, s selecteze indivizii similar unei selecii care le acord probabiliti egale. n
cazul n care criteriile de cot impuse operatorului reflect corect structura zonei cercetate, un
bun anchetator realizeaz rapid seria de interviuri repartizate.
n funcie de modul n care sunt stabilite criteriile de cot avem cote marginale
(simple) sau cote ncruciate.
S presupunem c ntr-un ora se realizeaz o anchet utilizndu-se drept criterii de
cot vrsta i categoria social. Unui operator i sunt repartizate 40 de chestionare.
Pentru a stabili cotele maginale este necesar sa avem informaii legate de structura
populaiei de forma celor prezentate n tabelul 6.3.1. Pe baza acestora se va construi foaia de
cote prezentat n tabelul 6.3.3.

Tabel 4.3.1. Structura populaiei necesar pentru cote marginale


Sex
%
Categorie social
47,50% salariat
masculin
52,50% patron
feminin
omer
elev-student
liber profesionist
pensionar
100,00% Total
Total

Cat.1.
Cat.2.
Cat.3.
Cat.4.
Cat.5.
Cat.6.

%
45,00%
7,50%
10,00%
10,00%
5,00%
22,50%
100,00%

Criteriile de cote marginale sunt comode pentru operatori i puin costisitoare. Ele pot
fi stabilite cu exactitate, dar ansa de a obine un eantion reprezentativ este mai mic dect n
cazul cotelor ncruciate. Dup cum se observ n acest caz nu exist nici o corelaie ntre

103

criteriile de cot. Operatorul de sondaj nu tie cte femei trebuie s ia din fiecare categorie
social sau ci brbai.
Pentru a realiza un plan de sondaj care s utilizeze cote ncruciate este necesar
cunoaterea structurii populaiei dup cele dou variabile. n cazul studiului nostru aceast
structur este prezentat n tabelul nr. 6.3.2. Foaia de cote dup care trebuie s se ghideze
operatorul n aceast situaie este prezentat n tabelul nr. 6.3.4. Prin aceast metod sunt puse
n eviden neconcordanele care exist n ceea ce privete distribuia pe categorii sociale
pentru cele dou sexe.
Tabel 6.3.2. Structura populaiei necesar pentru cote ncruciate
categorie social
Sex
salariat
patron
omer
elevliber
student
profesionist
4500
4200
4900
2000
masculin 24000
50,53
9,47
8,84
10,32
4,21
%
3000
5800
5100
3000
feminin 21000
40,00
5,71
11,05
9,71
5,71
%
45000
7500
10000
10000
5000
Total
45
7,5
10
10
5
%

pensionar

Total

7900
16,63
14600
27,81
22500
22,5

47500
100
52500
100
100000
100

Tabel 6.3.4. FOAIA DE COTE


40 de interviuri
Criterii de cot

masculin

feminin

Categoria social
salariat
patron
omer
elev-student
liber profesionist
pensionar
salariat
patron
omer
elev-student
liber profesionist
pensionar

nr.
interviuri
10
2
2
2
1
3
8
1
2
2
1
6

104

Interviuri
1
1
1
1
1
1
1
1
1
1
1
1

2
2
2
2

2
2

3
3

2
2
2

10

Tabel 6.3.3. FOAIA DE COTE


40 de interviuri
Criterii de cot

nr. interviuri/
19

21

sex

Categoria social

Cat1
Cat2
Cat3
Cat4
Cat5
Cat6

18
3
4
4
2
9

Interviuri

10

11

12

13

14

15

16

17

18

19

10

11

12

13

14

15

16

17

18

19

10

11

12

13

14

15

16

17

18

105

20

21

Cu toate acestea unii autori consider c n cazul sondajului pe cote se poate adopta
ipoteza unei selecii simple aleatoare cu probabiliti egale. Aceast ipotez ns nu poate fi
demonstrat. Utilizarea relaiilor de calcul a sondajului aleator cu probabiliti egale pentru
volumul eantionului i a erorilor de reprezentativitate nu pot duce dect la aproximri mai
mult sau mai puin grosolane.

n general acest tip de sondaj este utilizat n cercetri sociologice sau n studii de pia
n diferite localiti fr a avea pretenia reprezentativitii la nivel naional.
Uneori, datorit rapiditii i costului redus cu care se realizeaz, aceast eantionare
poate fi combinat cu alte procedee de eantionare n cadrul sondajelor complexe. De
exemplu, pentru realizarea unui studiu cu privire la atitudinea fa de munc a populaiei n
vrst de munc din Bucureti se proiecteaz un sondaj bistadial. Se mparte suprafaa
Bucuretiului n 100 de zone de aproximativ aceeai arie care vor constitui unitile primare
ce vor fi selectate n primul stadiu dup un procedeu simplu aleator fr revenire. Pentru a
evita efectul de serie unitile primare se stratific dup tipul zonei rezideniale. n stadiul al
doilea, pentru selectarea unitilor secundare se poate utiliza eantionarea pe cote.

106

BIBLIOGRAFIE

Andrei, T.
Stancu, S,.
Pele, D.T.
Isaic-Maniu
Al.,
Mitru C.,
Voineagu V.

Statistic Teorie i aplicaii, Ediia a doua, Bucureti, Editura


Economic , 2002

Isaic-Maniu
Al.

Tehnica sondajelor i anchetelor, Editura Independena economic


2001

Levy P.S.,
Lemeshow S.
Jaba Elisabeta,
Grama Ana
Dumitrescu,
M
Mihoc Gh.,
Craiu V.

Sampling of Populations, Third Edition, John Wiley&Sons New York,


2000
Analiza Statistic cu SPSS sub Windows, Editura Polirom Iai 2004
1
Sondaje statistice i aplicaii, Bucureti, Editura Tehnic, 2000

NiculescuAron I. G.,

Sondajul statistic n cercetarea forei de munc, Editura ASE, Bucureti


2005

5
6
7

Statistica pentru managementul afacerilor, Editura Economic 1999

Tratat de statistic matematic volumul Verificarea ipotezelor


statistice, Ed. Academiei R.S.R, Bucureti 1977

9 Porojan D.
10 Rotariu T.I.
11 Rotariu T.
(coordonator)
12 Sandu Gh.,

Statistica si teoria sondajului, Bucureti, Casa de Editur ansa 1993


Ancheta sociologic i sondajul de opinie, Editura Polirom 1999
Metode statistice aplicate n tiinele sociale, Bucureti, Editura
Polirom, 1999
Modele experimentale n zootehnie, Editura Coral Sanivet 1993

13 Saporta G.,

Enquetes et Sondages 2003-2004, http:// cedric.cnam.fr/~saporta

14 Sincich T.,

Business statistics by example, Prentice Hall, New Jersez 1996

15 Wilson M.,
Littell R.

Statistical Methods Research I Course Notes,


http://www.stat.ufl.edu/STA6166/Fall06/Course%20Notes.html

16 ***

http://biol10.biol.umontreal.ca/BIO2042

17 ***

http://www3.imperial.ac.uk/portal/pls/portallive/docs/1/7292119.PDF
107

S-ar putea să vă placă și