Documente Academic
Documente Profesional
Documente Cultură
Sondaje Anchete Niculescu Aron PDF
Sondaje Anchete Niculescu Aron PDF
SONDAJE I ANCHETE
Suport de curs pentru nvmntul la distan
BUCURETI
2011
1
Editura ASE
Piaa Roman nr. 6, sector 1, Bucureti, Romnia
cod 010374
www.ase.ro
www.editura.ase.ro
editura@ase.ro
Refereni:
Prof. univ. dr. Constantin MITRU
Prof. univ. dr. Emilia IAN
ISBN 978-606-505-457-8
CUPRINSUL CURSULUI
INTRODUCERE
Unitatea de nvare 1.
NOIUNI DE BAZ N TEORIA SONDAJELOR
1.1 Obiectivele unitii de nvare
1.2 Metode de observare utilizate n domeniul economico-social
1.3 Rolul Sondajului statistic n sistemul informaional statistic
1.4 Definirea conceptelor de baz utilizate n sondajele statistice.
1.5 Procedee de eantionare utilizate
5
6
6
6
7
8
9
Unitatea de nvare 2.
ORGANIZAREA SONDAJELOR STATISTICE
2.1 Obiectivele unitii de nvare
2.2 Etape preliminare n organizarea unui sondaj
2.3 Elaborarea chestionarului
2.4 Ancheta pilot
2.5 Extragerea eantionului
2.6 Culegerea i verificarea datelor
14
14
14
18
26
26
28
Unitatea de nvare 3.
ASPECTE PRACTICE N REALIZAREA UNUI SONDAJ STATISTIC
3.1. Obiectivele unitii de nvare
3.2. Problematica non-rspunsurilor
3.3. Tipuri de erori ntlnite n cercetarea selectiv
3.4. Verificarea reprezentativitii eationului
3.5. Aplicaii
29
29
29
34
38
39
Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE
4.1. Obiectivele unitii de nvare
4.2. Sondajul simplu aleator
4.2.1. Sondajul simplu aleator cu probabiliti egale
4.2.2. Sondajul de volum redus
4.3. Sondajul stratificat
4.4. Sondajul de serii
4.5. Aplicaii
47
47
47
48
54
55
61
69
Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE
5.1. Obiectivele unitii
5.2. Sondajul multistadial
5.3. Sondajul multifazic
5.4. Sondajul pe baz de eantioane fixe
5.5. Aplicaii
87
87
87
90
91
95
Unitatea de nvare 6
SONDAJE NEPROBABILISTICE
6.1. Obiectivele unitii de nvare
6.2. Tipuri de sondaje neprobabilistice
6.3. Sondajul pe cote
101
101
101
102
BIBLIOGRAFIE
107
INTRODUCERE
Unitatea de nvare 1
NOIUNI DE BAZ N TEORIA
SONDAJELOR
Recensmntul
cea mai veche forma de observare statistic
se culeg datele de la toate unitile colectivitii
cheltuieli mari caracter periodic
rezolvarea unor probleme delicate prin complexitatea lor:
scopul observrii
scopul culegerii datelor
timpul la care se refer datele
sfera de cuprindere
elaborarea de definiii, clasificri i nomenclatoare etc.
Rapoarte statistice
observri totale, permanente
datele statistice referitoare la diferitele fenomene i procese sociale se culeg pe
cale administrativ
Sondaje statistice
observri pariale
Ancheta statistic
nu presupune reprezentativitatea eantionului
se realizeaz pe baza chestionarului completat direct sau prin pot
Observarea prii principale (masivul principal sau panelul)
culegere a datelor numai de la cele mai semnificative (masivul principal)
uniti ale colectivitii
Panelul eantion cu caracter stabil
cercetarea se face longitudinal
Monografia
metod de observare aprofundat a fenomenelor i proceselor sociale
Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti p. 184.
Sondajul statistic poate fi folosit i la verificarea datelor culese printr-o observare total
de mare amploare precum i la prelucrarea datelor dintr-o cercetare exhaustiv ntr-o prim faz
selectiv i mai trziu total.
Sfera de cuprindere a informaiilor statistice este foarte larg incluznd toate fenomenele
cu caracter de mas. Totodat, informaia statistic este utilizat de ctre organele de conducere
la nivel micro i macroeconomic n exercitarea funciilor de previzionare, execuie i control.
**
10
11
Toate aceste procedee de eantioane se pot aplica direct populaiei totale sau pe grupe
ceea ce nseamn c se pot obine sondaje simple sau stratificate. La aplicarea procedeului de
selecie se pot folosi uniti simple numerotate de la 1 la N sau uniti complexe, denumite
serii numerotate de la 1 la R. n cel de-al doilea caz vom avea un sondaj de serii.
12
13
14
Unitatea de nvare 2
ORGANIZAREA SONDAJELOR
STATISTICE
2.1. Obiective
15
Prima sarcin este formularea obiectivelor sondajului. n general cei care comand
sondajul vin doar cu o formulare vag a problemelor care i intereseaz i cu o imagine
neclar asupra modului cum vor utiliza rezultatele obinute. n dialogul beneficiar-statistician,
sociologului i revine rolul de a i ajuta pe acetia s stabileasc obiectivele. Aceste probleme
vor fi apoi analizate pentru a structura forma de prezentare a rezultatelor i pentru a evalua
resursele financiare i umane necesare.
Cnd vorbim despre populaie avem n vedere nelesul statistic al noiunii care denot
mulimea unitilor simple sau complexe pe care le are n vedere cercetarea efectuat.
Fiecare sondaj are problemele sale proprii legate de delimitarea populaiei n timp i n spaiu.
Este foarte important s stabilim dac populaia cercetat este sau nu omogen i care
este structura acesteia n vederea realizrii unei eventuale stratificri. Tot aici este important
s delimitm unitile din care este constituit populaia. Facem distincie ntre:
Baza de sondaj orice sistematizare a unitilor astfel nct s permit selectarea lor
ntmpltoare n vederea formrii eantionului. Bazele de sondaj pot fi elaborate de ctre cel
care organizeaz selecia sau pot fi preluate din listele electorale, lista abonailor posturilor
telefonice, lista adreselor potale, registre ale populaiei, registrul statistic al agenilor
economici, fiierul bilanurilor contabile, baze de date, hri, etc.
16
Interviu
direct
Metoda de culegere
Interviu prin
Interviu prin
pot
telefon
Cost
Foarte
mare
Sczut pn
la moderat
Foarte
mare
Mare
Moderat
Foarte
mare
Mare
Sczut pn
la moderat
Ridicat
Rata de rspuns
Moderat pn la
ridicat
Interviu
online
Sczut
pn la
moderat
Moderat (exist
gospodrii far
telefon)
Rapid
Moderat
Moderat
Sczut
Moderat
Sczut
Moderat
Lung
Moderat
Moderat
Moderat
Moderat
Sczut
Sczut
Foarte
sczut
Sczut
Ridicat
Moderat
Ridicat
Nu
Parial
(grafice
statice)
Nu
Da
Numrul de non-rspunsuri
pariale
Sczut
Moderat
Sczut
Ridicat
Sczut
Ridicat
Ridicat
Sczut
Ridicat
18
Moderat
Moderat ridicat
Ridicat
prin
utilizarea
funciilor
Sczut
2
3
Isaic Maniu Al., 2001, Tecnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 193.
Isaic Maniu Al., op.cit. pg. 194
19
20
Un chestionar bine ntocmit reprezint cheia succesului unui sondaj. Dac chestionarul
prezint deficiene, informaiile obinute pot fi incomplete, fcnd imposibil o analiz
complex. Nicio corectare posterioar nu poate remedia o astfel de situaie.
21
La aceste ntrebri respondentul este rugat s aleag o variant sau mai multe dintr-o
list, s realizeze o ierarhie sau s dea o valoare n catul variabilelor numerice
Avantaje
Dezavantaje
22
Tipul
ntrebrii
nchise
Deschise
Avantaje
Dezavantaje
23
Variabila
nominal
calitativ
ordinal
calitativ
cardinal
calitativ
proporional
cantitativ
Proprieti
Echivalena ntre
treptele scalei
Ierarhizare ntre
treptele scalei
Msoar diferenele
dintre treptele scalei
Punctul zero natural
24
Operaii permise
Frecvene absolute i relative, modul,
coeficient de asociere, testul 2
n plus: cuartile, coeficienii de corelaie
a rangurilor
n plus: medii de calcul, dispersii,
corelaia parametric, regresia, testele
parametrice
Toate operaiile
25
Isaic Maniu Al.,2001, Tehnica sondajelor i anchetelor, Ed. Independena Economic Piteti, p. 181.
26
(xmin x )2 (xmax x )2
2
2
o cazul caracteristicilor calitative (se consider p=0,5): max
=p(1-p)=0,25
n cazul n care avem mai multe variabile auxiliare, o vom alege pe aceea al crei coeficient
de variaie este maxim. Astfel vom avea estimaii cu precizie i siguran n limita admis
pentru toate celelalte caracteristici.
Mrimea eantionului este determinat de:
Modul n care urmeaz s fie analizate rezultatele. Dac se are n vedere analiza pe
subgrupe se va calcula volumul eantionului astfel nct s se obin precizia dorit pe
fiecare subgrup.
Restricii de ordin financiar pornind de la costurile admisibile. Resursele financiare
sunt totdeauna limitate i de multe ori mrimea necesar a eantioanelor nu poate fi
realizat. Recurgem la ingeniozitatea i discernmntul n alegerea acelor subiectecare
pot fi abordate cu resursele disponibile.
Porojan D., 1993, Statistica i Teoria Sondajului, Ed. ansa SRL Bucureti, p. 235.
27
Pe
Pv
1 1 1
Pr Pe Pv
Unitatea de nvare 3
ASPECTE PRACTICE N REALIZAREA
UNUI SONDAJ STATISTIC
29
Nr.
Chest.
1
2
npornire
ntrebarea
Non-rspuns
parial
Non-rspuns
total
Figura 3.2.1. Tabloul indivizi-variabile
30
A.2.1. Imputaia deductiv se refer la acele situaii (rare n practic) n care se poate
stabili valoarea corect printr-o deducie logic. Este vorba de o modalitate determinist de a
corecta datele incorecte sau nevalidate. n acest caz yij = yij.
A.2.2. Imputaia predictiv prin mediere global se realizeaz nlocuind non-rspunsul
de pe poziia (i,j) cu media rspunsurilor care au fost obinute la ntrebarea j. n acest caz
avem:
r
y'ij y r, j yij r
i 1
A.2.3. Imputaia predictiv prin mediere pe clase este similar imputaiei predictive
prin mediere global, cu deosebirea c nu se utilizeaz o singur imputaie, ci mai multe,
corespunztoare unor clase n care a fost mprit mulimea respondenilor. Astfel,
partiionm mulimea respondenilor r la ntrebarea j n q clase disjuncte. Identificm clasa
cruia i aparine individul i construim imputaia:
k
y' ij y rjt y ij k
i 1
unde t ia valorile 1,..,q iar k este numrul de respondeni din clasa respectiv.
Utilizarea acestui tip de imputaie reduce gradul de subestimare a dispersiei
estimatorului.
O variant a acestei metode este imputaia calculat ca medie a valorilor vecinilor
valorii lips. Aceast metod poate fi implementat automat i sub softwareurile statistice
specializate, avnd posibilitatea selectrii tipului de medie pe baza creia se va calcula
imputaia i a numrului de vecini ce vor forma baza de calcul.
A.2.4. Imputaia hot-deck. Este utilizat la scar larg deoarece, spre deosebire de
imputaia prin mediere global sau pe clase, evit subestimarea dispersiei estimatorului6.
Pentru aplicarea acestei metode se parcurg urmtoarele etape:
Etapa1: fiierul ce conine baza de date este n prealabil sortat dup caracteristicile
demografice, economice sau sociale pe baza crora se poate pune n eviden structura
eantionului.
Etapa 2: Un registru de lucru este iniializat cu valorile aferente cmpurilor cuprinse n
prima nregistrare a unei caracteristici dup care s-a realizat sortarea.
Etapa 3: Fiierul se parcurge nregistrare cu nregistrare si fiecare cmp este identificat i
verificat s nu conin valori lips.
Etapa 4: n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.
A.2.5. Imputaia cold-deck. Este o variaie a metodei hot-deck i const n nlocuirea
valorilor lips cu date provenite din alte surse dect sondajul curent cum ar fi sondaje
anterioare sau recensminte. Este necesar ca populaia sondajului din care se preiau valorile s
fie foarte asemntoare cu cea asupra cruia se realizeaz sondajul n prezent iar modul de
definire i de codificare a variabilelor supuse procesului de imputare s fie identic. Imputaia
cu care se va nlocui valoarea lips este selectat aleator din baza de date aferent sondajului
anterior.
Aceast metod prezint dezavantajul c imputaia utilizat nu provine din sondajul
curent motiv pentru care este mult mai rar utilizat.
A.2.6. Imputaia aleatoare. Const n alegerea aleatoare din mulimea respondenilor
sau dintr-o clas, a unui donator h din mulimea de r respondeni la ntrebarea j. n acest
caz avem: y'ij y hj
Este o variant a imputaiei hot-deck iar principalul avantaj fa de aceasta este c prin
selecia aleatoare a imputaiei nu mai este necesar sortarea fiierului dup diferite
caracteristici.
Levy P.S., i Lemeshow S., 2000, Sampling of Populations, Third Edition Ed. John Wiley&Sons New York p.
411.
32
A.2.7. Imputaia obiectiv. La baza acestei metode st generarea unei ecuaii de regresie
pe baza setului de date ce conin nregistrri complete ale variabilei ce urmeaz a fi supuse
procesului de imputare. Ecuaia poate avea urmtoarea form:
y b0 b1 x1 b2 x 2 ...... bk x k
unde y este variabila ce urmeaz a fi imputat pentru valorile date ale variabilelor xi, i=1,,k
corelate cu variabila y.
Imputaiile obinute n aceast manier sunt superioare celor provenite n urma aplicrii
metodelor prezentate anterior, deoarece ea se armonizeaz cu restul nregistrrilor individului
respectiv. Aplicarea acestei metode permite obinerea unui estimator nedeplasat al mediei i
nu subevalueaz dispersia acestuia7.
Respondeni
N1
Faza 1
Respondeni
n1
Non-respondeni
n2
Faza 2
Non-respondeni
N2
Levy P.S., i Lemeshow S., 2000 , Sampling of Populations, Third Edition Ed. John Wiley&Sons New York p.
412.
33
34
35
36
BAZA DE SONDAJ
POPULAIA INT
Arie acoperit de
baza de sondaj, dar
care nu face parte din
populaia int
Arie neacoperit
B.2.1. Erorile efective se pot calcula pentru caracteristicile la care s-au obinut date i dintr-o
observare total
Considernd c media este indicatorul sintetic cel mai reprezentativ, eroarea efectiv de
sondaj se calculeaz ca diferen ntre media eantionului i media colectivitii totale
La verificarea reprezentativitii eantionului se pornete de la compararea structurii pe
grupe a colectivitii de selecie cu cea a colectivitii generale, denumit i structur
programat. n cazul n care aceste structuri nu difer cu mai mult de 5% se accept
eantionul ca fiind reprezentativ.
De cele mai multe ori n cercetarea concret nu se dispune de date cu privire la ntreaga
colectivitate pentru a putea verifica n ce msur media este sau nu reprezentativ. n
acest caz se pot efectua selecii succesive pentru a verifica gradul de stabilitate al mediei
i dispersiei, eroarea efectiv de reprezentativitate calculndu-se astfel:
dx x x
i respectiv d x %
xx
100
x
37
x X0
wp
p 1 p
i 1
f ei f ti 2
f ti
38
3.5. Aplicaii
Aplicaie 1
n urma centralizrii rspunsurilor obinute dintr-un sondaj n rndul studenilor unei
universiti au rezultat datele prezentate n tabelul 3.5.1
Definirea variabilelor:
STRAT. Sondajul s-a realizat dup un plan stratificatastfel: 1 anul I, 2 anul II, 3 anul
III i 4 anulIV.
SEX. 1 feminin, 2 masculin.
MEDIE. Este variabil numeric i reprezint media obinut n sesiunea din iarn.
NRORE. Este variabil numeric i reprezint numrul de ore de studiu pe sptmn
n afara sesiunii.
ACORD. Este variabila obinut n urma centralizrii rspunsurilor la ntrebarea: n
ce msur suntei de acord cu modificrile survenite n nvmntul superior?.
Codurile reprezint: 1 dezacord total, 2 dezacord, 3 indiferent, 4 acord i 5 acord total.
Se cere:
1. S se nlocuiasc valorile lips ale variabilei NRORE folosind imputaia predictiv prin
mediere global, imputaia predictiv prin mediere pe clase i imputaia obiectiv.
2. S se nlocuiasc valorile lips ale variabilei ACORD folosind imputaia hot-deck.
Rezolvare
1. Notm cu yij rspunsul pe care l d individului i din eantionul E la ntrebarea j (i=1,..,n,
j=1,... ,p). Concentrndu-ne asupra individul i din eantion constatm c vectorului (yi1,
...., yip), format din rspunsurile la ntrebrile din chestionar, i lipsesc unele componente
(non-rspunsurile). Fiecare poziie de coordonate (i,j) trebuie tratat separat, prin crearea
unei valori yij numit valoare atribuit sau imputaie.
39
119
5.17
23
i 1
unde r este numrul rspunsurilor valide la ntrebarea j.
Toate cele 7 valori lips se vor nlocui cu 5.17 (vezi tabelul 3.5.2 variabila NROREIG).
Avantajul acestei metode este c nlocuirea valorii lips se face cu o valoare probabil ceea ce
i d un oarecare grad de stabilitate. Dac exist muli respondeni care nu au rspuns la
ntrebarea j vom folosi pentru toi aceeai imputaie. Este clar c se produce o subevaluare
sever a dispersiei estimatorului pentru media sau totalul caracteristicii yj.
y'ij y r, j yij r
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2
MEDIE
7
8.33
6.67
9.67
6.33
7.8
9.67
8
7.2
8.8
6.33
7
8.8
8.2
7.9
8.8
6.67
9.33
8.33
7.7
8.2
5.67
9.2
9.33
8.9
7.8
8.2
8.9
7.9
7.5
40
NRORE
3
4
3
10
4
11
3
6
4
4
6
5
5
Tabel 3.5.1
ACORD
2
2
3
4
2
1
2
2
4
5
1
1
3
4
9
6
5
5
4
2
2
2
3
7
6
7
5
4
2
1
2
unde t ia valorile 1,..,4 iar k este numrul de respondeni din clasa respectiv,
Deoarece exist patru straturi se vor calcula 4 imputaii.
k
k
23
32
y'1ij y rj1 yij k
4.6 y' 2ij y rj2 y ij k
4.57
5
7
i 1
i 1
k
k
37
27
y' 3ij y rj3 yij k
6.17 y' 42ij y rj4 yij k
5.4
6
5
i 1
i 1
n tabelul 3.5.2 variabila NROREIC este obinut n urma aplicrii acestei metode. Utilizarea
acestui tip de imputaie reduce gradul de subestimare a dispersiei estimatorului.
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2
MEDIE
6
8.33
5.67
9.67
5.33
7.8
9.67
8
7.2
8.8
6.33
6.33
8.8
8.2
7.9
8.8
5.67
9.33
8.33
7.7
8.2
5.67
9.2
9.33
8.9
7.8
8.2
8.9
7.9
7.5
NRORE
2
4
3
10
4
9
3
5
2
3
5
5
5
8
6
4
5
9
7
6
7
4
3
41
NROREIG
2
4
3
10
5.17
4
9
5.17
3
5
2
3
5
5
5
5.17
5.17
8
6
4
5
5.17
9
5.17
7
6
7
5.17
4
3
NROREIC
2
4
3
10
4.6
4
9
4.57
3
5
2
3
5
5
5
6.17
6.17
8
6
4
5
6.17
9
5.4
7
6
7
5.4
4
3
Tabel 3.5.2
NROREIO
2
4
3
10
0.49
4
9
5.19
3
5
2
3
5
5
5
6.60
1.09
8
6
4
5
1.09
9
7.53
7
6
7
6.78
4
3
Imputaia obiectiv
Pentru setul de date ce nu conine valori lips pentru variabila NRORE se stabilete forma
ecuaiei de regresie ce are ca variabil independent MEDIA. n figura 3.5.1 este reprezentat
grafic legtura dintre MEDIE i NRORE.
Fig. 3.5.1 Nr. ore studiu n funcie de media obinut n sesiunea din iarn
42
Etapa 3. Fiierul (tabelul 3.5.1) se parcurge nregistrare cu nregistrare i fiecare cmp este
identificat i verificat s nu conin valori lips.
Etapa 4 . n cazul n care unul din cmpuri conine valori lips acesta va fi nlocuit cu
valoarea corespunztoare din registru.
Rezultatul implementrii acestei metode este prezentat n tabelul 3.5.4.
De exemplu nregistrarea cu numarul 9 conine valoare lips pentru variabila ACORD.
nregistrarea face parte din STRAT 2 iar variabila SEX este 1-masculin. Valoarea
corespunztoare din registru este 2. nlocuim cu aceast valoare nonrspunsul parial.
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
STRAT
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
SEX
1
1
1
1
2
2
1
1
1
1
1
2
2
2
1
1
1
1
1
1
2
2
2
1
1
1
1
2
2
2
ACORD
2
2
3
4
2
1
2
2
4
5
1
1
3
4
4
2
2
2
2
3
2
1
2
Tabelul 3.5.4
ACORDM
2
2
3
4
2
1
2
2
2
4
5
1
1
1
3
4
3
4
2
2
2
2
2
3
2
2
1
1
2
Aplicaie 2
S-a realizat un sondaj n rndul studenilor unei universiti partiulare pe un eantion de 90
persoane. n urma centralizrii datelor pentru variabilele auxiliare SEX i MEDIE (media
ultimei sesiuni) au rezultat urmtoarele informaii: ponderea fetelor n eantion este de 67%
iar nota medie 7.2 cu o dispersie de 1.42.
43
wp
wp
p 1 p
p 1 p n
z
1
iar
=0.398
n
Deoarece valoarea calculat a testului luat n modul este mai mic dect valoarea teoretic se
accept ipoteza nul concluzionndu-se c eantionul este reprezentativ.
Pornind de la variabila auxiliar MEDIA, pentru verificarea reprezentativitii se utilizeaz
testul z pentru compararea mediei unui eantion cu cea a populaiei.
Ipotezele testului bilateral sunt:
H0: x = X 0 i H1: x X 0 .
Regiunea critic n cazul testului bilateral este dat de relaia: W:
x X0
x X0
iar valoarea
=1.75
Grupe de vrst
15-24
25-34
35-44
45-54
peste 55
Total
44
Tabel 3.5.5
Structura eantionului (%)
19
23
20
17
21
100
Se cere:
1. S se verifice reprezentativitatea eantionului utiliznd testul 2 pentru un nivel de
semnificaie =0.05.
2. S se verifice reprezentativitatea eantionului utiliznd testul Kolmogorov-Smirnov pentru
un nivel de semnificaie =0.05.
Rezolvare
1.
Grupe de
vrst
Structura
populaiei
(%)
15-24
25-34
35-44
45-54
peste 55
Total
16
20
24
21
19
100
Numr
salariai
n populaie
( Fti )
25600
32000
38400
33600
30400
160000
Structura
eantionul
ui
(%)
19
23
20
17
21
100
Numr
salariai
n eantion
(fei)
152
184
160
136
168
800
fei fti 2
fti
128
160
192
168
152
800
fti
4.50
3.60
5.33
6.10
1.68
21.21
f ei f ti 2
i 1
f ti
=21.21
fei
fti
fei cumulat
fti cumulat
152
184
160
136
168
800
128
160
192
168
152
800
152
336
496
632
800
128
288
480
648
800
45
f* ei cumulat
F(x)
0.19
0.42
0.62
0.79
1
f* ti cumulat
F(y)
0.16
0.36
0.6
0.81
1
di
0.03
0.06
0.02
0.02
0
Nn
.
Nn
n cazul n care volumul populaiei este mare n raport cu eantionul (n<0.05N) c se poate
46
Unitatea de nvare 4
PLANURI DE SONDAJ SIMPLE
4.1. Obiective
de
Populaie
Eantion
p
k 1
48
ik
n
N
M( x i ) X iar
x i X 0
i1
Dispersia mediilor de sondaj n jurul mediei din populaia total este egal cu raportul
dintre dispersia din populaia total i volumul eantioanelor de aceeai mrime n:
2
2x i
n
Mrimea abaterii medii ptratice a mediilor de sondaj de la media populaiei reprezint
eroarea medie de reprezentativitate i se calculeaz dup relaia:
n
Dac nu se cunoate valoarea dispersiei populaiei totale ea este estimat cu ajutorul
dispersiei de sondaj S2. n acest caz eroarea medie de reprezentativitate se calculeaz dup
relaia:
i
S
x
n
n practic ns nu procedm la extragerea tuturor eantioanelor posibile i ne
mulumim cu un singur eantion construit cu respectarea ct mai riguroas a unor anumite
condiii. n acest caz, media eantionului se poate abate mai mult sau mai puin de la media
populaiei, fapt ce determin necesitatea indicrii unui interval de ncredere despre care se
poate afirma cu o probabilitate sau siguran cunoscut c acoper valoarea mediei din
colectivitatea total. Limitele intervalului de ncredere, cea minim iinf i cea maxim sup se
calculeaz n funcie de datele de sondaj x1, x2, , xn astfel nct, cu un grad mare de
siguran, garantat de probabilitatea 1- pentru parametrul populaiei, se ndeplinete relaia:
i
P inf X sup 1 z
Intervalul inf , sup reprezint intervalul de ncredere i definete precizia estimaiei.
Probabilitatea (1- ) caracterizeaz sigurana cu care se afirm c intervalul de ncredere
cuprinde valoarea parametrului populaiei. Cu ct intervalul inf , sup este mai mic i
probabilitatea (1- ) mai mare cu att avem o estimaie mai precis cu privire la
valoarea parametrului. Intervalul inf , sup este o mrime aleatoare, limitele sale fiind
49
dependente de datele fiecrei selecii, motiv pentru care, pentru o aceeai populaie, valorile
limitelor variaz de la o selecie la alta att ca mrime ct i ca poziie.
La construirea estimaiilor, un rol important, pe lng nivelul de siguran, l joac
mrimea intervalului de ncredere. Cele dou mrimi se afl ntr-o relaie de coresponden
bine determinat. Dac eroarea de sondaj se distribuie dup legea normal atunci erorile egale
n valoare absolut cu probabilitile de apariie i pentru acelai volum al eantionului
probabilistic ce alctuiesc intervale inf , sup se pot separa n dou pri egale iar jumtatea
intervalului este eroarea limit admis.
Precizia estimaiei, probabilitatea de ncredere i intervalul de ncredere se discut pe
baza inegalitii lui Cebrev, prin care se demonstreaz c media de sondaj x pentru un
volum mare al eantionului converge n probabilitate ctre X0 media populaiei, ceea ce
semnific faptul c x este un estimator corect al mediei populaiei (nedeplasat, consistent i
eficient). Sigurana estimrii este dat de probabilitatea cu care este ndeplinit inegalitatea:
x X z unde 0, suficient de mic .
Aceast probabilitate este dat dinainte i este foarte apropiat de unitate.
P x X
Intervalul
sau P x X x
x , x
(4. 1.1.)
cu o probabilitate z se
xX
P xX
P x X
xX
P
x
x
unde
n
n
(unde p este media caracteristicii binare n populaie iar w reprezint estimaia acesteia din
eantion).
50
w z w
Dei determinarea volumului de eantion n realitate precede calculul erorilor necesare
estimaiilor nu putem aborda aceast tem fr cunoaterea acestor noiuni.
Dup studiul amnunit al populaiei supuse cercetrii se va alege cu mult grij
caracteristica n raport cu care se calculeaz volumul eantionului.
Pornind de la formula erorii limit maxim admis, pentru un eantion de volum mare
avem:
x z
z 2 2
2x
z2 S 2
2x
z 2 p(1 p)2
2w
z 2 w (1 w )2
2w
unde p este proporia celor care posed caracteristica n populaia total. n cazul n
care nu se cunoate aceast valoare i nu se poate calcula variaia caracteristicii n populaia
total aceasta se estimeaz cu dispersia din eantion calculat cu ajutorul proporiei celor care
posed caracteristica n eantion (w).
Sondajul simplu aleator cu probabiliti egale fr revenire
Sondajul simplu aleator cu probabiliti egale fr revenire este acel sondaj n care o
unitate odat selecionat nu mai particip la o nou extragere.
Numrul tuturor eantioanelor posibile n acest caz este egal cu C Nn . Probabilitatea
fiecrei uniti de a intra n eantion crete de la o extragere la alta astfel:
p i1
1
1
1
; pi 2
;..... p in
unde i 1, N
N
N 1
N ( n 1)
p
k 1
ik
n
1
1
1
n
k 1
n
....
N N 1
N (n 1) N k 1 N ( N ( k 1)) N
n
.
N
Pentru a aproxima dispersia mediilor de sondaj necesar calculrii erorii medii de
N n
reprezentativitate se aplic un coeficient de corecie
. Deoarece, de cele mai multe ori,
N 1
tinde la limita spre
51
volumul populaiilor studiate este mare, nu sesizm diferene ntre a mpri la N-1 sau la N.
2
2
S2
n
n
n
1 iar x
1
1
n N
n N
n N
2
S2
n
n
1 z
1
n N
n N
p(1 p)
n
w(1 w)
n
1
1
n
n
N
N
w z w z
p(1 - p)
n
w(1- w)
n
1 z
1
n
n
N
N
z 2 2
2x
z 2 2
N
z 2 p(1 p)
2w
z 2 p(1 p)
N
z 2 w (1 w )
2w
z 2 w (1 w )
N
52
Sondaj cu revenire
2 cunoscut
Populaie
infinit i
eantion de
volum normal
(n<0,05N), n>30
xz
2
n
wz
Populaie finit
i eantion de
volum normal
(n>0,05N), n>30
xz
2
n
wz
2 necunoscut
xz
S2
n
Sondaj fr revenire
2 cunoscut
xz
w (1 w )
n
xz
2 necunoscut
2
n
xz
wz
S2
n
xz
w (1 w )
n
2 N n
n N 1
wz
53
S2
n
w (1 w )
n
xz
S2 N n
n N 1
w (1 w ) N n
n
N 1
Dac volumul eantionului este mai mic de 30 de uniti, se consider de volum redus,
iar premizele de mai sus nu mai sunt valabile fiind necesar o tehnic nou de abordare a
problemei.
n acest caz, distribuia mediilor eantioanelor posibile depinde de forma de distribuie
a populaiei. Cum de cele mai multe ori forma de distribuie a populaiei nu este cunoscut,
nici legea de distribuie a mediilor eantioanelor nu poate fi determinat. Teoria sondajului
demonstreaz c n cazul seleciei de volum mic probabilitatea de apariie a mediilor de
diferite mrimi se distribuie mai uniform. Cu alte cuvinte probabilitile de apariie a
mediilor nu descresc n aceeai msur ca n cazul eantioanelor de volum normal n
momentul n care acestea se apropie de valorile extreme, mediile eantioanelor posibile
distribuindu-se dup curba lui Student i nu dup curba normal.
Tabelul distribuiei Student prezint coeficientul funciei de probabilitate al apariiei
mediilor eantioanelor posibile, reprezentat de coeficientul funciei (t).
Prin urmare, pentru estimarea mediei metodologia este asemntoare pentru
eantioanele de volum normal i cele de volum redus, singura diferen fiind utilizarea
valorilor repartiiei Student n funcie de numrul gradelor de libertate i probabilitatea de
garantare a rezultatelor. Relaiile sunt sistematizat astfel:
Condiiile de
desfurare
Eantion de
volum redus
n<30
Sondaj cu revenire
Sondaj fr revenire
2 cunoscut
2 necunoscut
2 cunoscut
2 necunoscut
2
x t
n
S2
xt
n 1
2 N n
xt
n N 1
xt
wt
w (1 w )
n 1
wt
54
S2 N n
n 1 N 1
w (1 w ) N n
n 1
N 1
S
T
R N1
A
T
Populaie
N
Eantion
n
1
S
T
R N2
A
T
2
n1
n2
........................................
............................
..................
S
T
R Nk
A
T
nk
Acest tip de sondaj este frecvent utilizat deoarece combin simplitatea conceptual a
sondajului simplu aleator cu sigurana asigurrii ponderii necesare reprezentativitii
subgrupurilor. Totodat este o tehnic foarte convenabil atunci cnd dorim s obinem
estimaii separate pentru parametrii populaiei pe fiecare strat i ulterior pentru ntreaga
populaie sau s ne asigurm c eantionul respect structura populaiei dup criteriul de
stratificare.
55
2 ( X j X )2 N ;
j 1
2 i2 N i
i 1
Ni ;
i 1
2 ( X j X ) 2 Ni
i 1
Ni
i 1
n cazul n care s-ar organiza un sondaj simplu aleator, dispersia care determin
mrimea erorii de reprezentativitate este dispersia total. Cum n general populaiile nu sunt
omogene aceasta va fi foarte mare determinnd o eroare medie de reprezentativitate mare.
Dac se organizeaz un sondaj stratificat numai dispersia din interiorul straturilor va
influena eroarea de reprezentativitate. Aceasta este sintetizat prin media dispersiilor pariale
i este msura influenei factorilor ntmpltori asupra variaiei caracteristicii. Mrimea
dispersiei dintre straturi, msur a factorului care constituie criteriul de stratificare asupra
variaiei variabilei nu influeneaz eroarea de reprezentativitate.
Deoarece ntotdeauna 2 2 estimaiile obinute pe baza sondajului stratificat sunt
afectate de erori mai mici dect cele obinute pe baza unui sondaj simplu aleator.
2. Dac stratificarea se realizeaz pe criterii geografice culegerea datelor se poate face cu
specialiti locali, reducnd astfel costul. Mai mult, se pot analiza i interpreta datele iniial pe
fiecare strat i ulterior pe ntreaga populaie.
Problemele organizatorice care se pun n momentul organizrii unui sondaj stratificat
sunt:
A
B
C
Porojan D., 1993, Statistica i teoria sondajului, Ed. ansa SRL, Bucureti, p. 253.
56
57
Caracteristicile cantitative
Considerm o populaie C de volum N mprit n k straturi. Din fiecare strat se
selecteaz un eantion dup unul din procedeele cunoscute astfel:
C1 (X11, X21,.., XN11)
C1 (x11, x21,.., xn11)
C2 (X12, X22,.., XN22)
C1 (x12, x22,.., xn22)
i1
i 1
xij
X
X i Ni
i 1 j 1
(4.3.1)
i 1
(4.3.2)
Ni
i 1
nj
i 1 j 1
ni
xij
x ji i
xi ni
(4.3.3)
i 1
(4.3.4)
unde x i
ni
j 1
(4.3.5)
ni
i 1
~
x
xi N i
i 1
k
(4.3.6)
Ni
i 1
N i2 i
2
ni
i 1 N
k
~x
N i2 S i
2
ni 1
i 1 N
k
(4.3.7)
58
~x
i 1
N i2 i 2
N 2 ni
n
1 i
Ni
i 1
N i2 S i 2
n
1 i
2 n 1
Ni
N
i
(4.3.8)
i
Si
(selecia din interiorul stratului este cu revenire);
xi
ni
ni 1
xi
i2
ni
n
1 i
Ni
Si 2
n
1 i (pentru selecia fr revenire).
ni 1
Ni
N i2 2
~x 2 xi
i 1 N
k
(4.3.9)
n1
n
n
n
2 .... i .... k
N1 N 2
Ni
Nk
ni
i 1
k
Ni
n
N
(4.3.10)
i 1
59
n
Ni
N
Mrimile medii calculate pe baza datelor de sondaj utilizate pentru a estima mediile
din populaia total se vor calcula n funcie de tipul variabilei dup una din relaiile:
k
~
x
xi ni
ni wi
~
(4.3.11) w
i 1
k
i 1
k
ni
ni
i 1
i 1
(4.3.12)
ni
i 1
k
~x
ni2 i 2
n2 n
i
i 1
k
~x
ni2
N 2 Si 2
i 1
N i2 n
i 1
(4.3.13)
ni2 S i 2
n
n 2 n 1 1 Ni
i
i
i 1
k
n
1 i
Ni
(4.3.14)
~x
ni2
n 2 x2
(4.3.15)
i 1
nk
n1
n2
....
N1 1 N 2 2
Nk k
ni
i 1
k
(4.3.16) sau ni
N i i
k
n.
(4.3.17)
N i i
Ni i
i 1
i 1
60
x~
N i2 i
2
ni
i 1 N
N i2 pi (1 pi )
2
ni
i 1 N
N i2 Si
2
ni 1
i 1 N
k
N i2 w i (1 w i )
2
ni 1
i 1 N
Sondaj stratificat
proporional i
Sondaj stratificat
optim
ni2 w i (1 w i )
w2
2
ni 1
n
i 1 n
ni2 2
x~ 2 xi
i 1 n
ni2 Si
2
ni
i 1 n
k
Ni2 2
wi
2
i 1 N
k
n2
2
x~ i2 i
ni
n
i 1 n
k
N i2 2
xi
2
i 1 N
k
x~
ni2
w2 i
i 1
N i2 i
2
ni
i 1 N
k
x~
N i ni
Ni 1
2
N i2 S i N i ni
2
i 1 N n i 1 N i 1
k
N i2 2
~x 2 xi
i 1 N
k
N i2 p i (1 p i ) N i n i
ni
Ni 1
N2
i 1
i 1
N i2 w i (1 w i ) N i n i
Ni 1
N2 ni 1
Ni2 2
wi
2
i 1 N
k
w
Sondaj stratificat
proporional i
Sondaj stratificat
optim
~x
i 1
n i2 i
2
ni
i 1
k
n i2 i
n2 ni
Ni ni
Ni 1
2
n
N ni
i
Ni 1
i 1
n i2 S i
n 2 ni
Ni ni
Ni 1
N i ni
Ni 1
POPULAIE R SERII
EANTION r SERII
62
63
Nr. serie
001
002
003
004
005
006
007
008
009
010
011
r = 40
R = 170
K = 170/40=4,25
D =2
Seriile selecionate:
002
2+4,25=6,25 006
6,25+4,25=10,5 011
..
170
64
Exemplu:
Mrime
Nr.
(nr. de
serie
gospodrii)
001
120
002
105
003
132
004
96
005
110
006
102
007
165
008
98
009
115
010
60
011
104
012
168
120
225
357
453
563
665
830
928
1043
1103
1207
1375
170
17219
196
Total 17219
Valoare
Nr. de
Selecie
cumulat eantionare
73
503
r = 40
R = 170
K = 17219/40=430,475
D =73
Nr. de eantionare:
73
934
73+430,475=503,475
503
1364
503,475+430,475=933,96
934
933,96+430,475=1364,425
1364
De cte ori este posibil, n cazul n care diferena de talie justific acest lucru, este
recomandat ca selecia seriilor s se realizeze prin procedeul aleator PPM. Avantajul acestui
procedeu este creterea reprezentativitii eantionului i n consecin a preciziei estimaiilor.
Notm cu:
R = numrul de uniti complexe (serii) din populaie;
r = numrul de uniti complexe (serii) din eantion;
N = numrul de uniti simple (indivizi) din populaie;
n = numrul de uniti simple (indivizi) din eantion;
N
i 1
1 N
Yi este totalul mediu pe serie;
R i 1
R N
1 N
j
Y
i
N i 1
j 1 N
1
N
Yi
i 1
Nj
j 1
1 R
Y j
R j 1
Yj
(4.4.1)
1 r
Y Y j
r j 1
(4.4.2)
Dispersia estimatorului Y :
R
Y j
Rr
V Y
Rr
(4.4.3)
j 1
Rr
Y
V
Rr
Y j Y
(4.4.4)
j 1
r 1
Rr
Rr
Y j
j 1
Rr 2
R
r
R r 2
R
r
(4.4.5)
Y
2
Y j Y
j 1
(4.3.6) i 2
j 1
r 1
(4.4.6)
(4.4.7)
Rr2 2
R r
(4.4.8)
66
SAFR
N n2
N
n
RN 0 rN 0 2
RN 0
rN 0
1 Rr 2
N0 R r
(4.4.9)
(4.4.11)
Y Y Y
Y
4.4.2. Estimatori i erori n cazul sondajului de serii de talie diferit selectate dup
procedeul aleator cu probabiliti egale fr revenire
n cazul n care seriile sunt de dimensiuni diferite, se recomand utilizarea unui
procedeu de selecie cu probabiliti inegale. Aplicarea acestuia necesit ns informaii
suplimentare n baza de sondaj. Dac nu dispunem de astfel de informaii vom aplica un
procedeu de selecie nerepetat (ca i n cazul planului de sondaj prezentat n subcapitolul
anterior).Cu toate acestea, deoarece seriile au dimensiuni diferite, relaiile de calcul ale
estimatorilor i erorilor de reprezentativitate
Notm cu:
Nj= numrul de uniti simple din seria j;
Tj= totalul variabilei de interes pentru toate unitile seriei j;
67
j
Y
Yj
(4.4.13)
j 1 N
Dispersia estimatorului Y :
R r
1
V Y
T
2
R
r
N
(4.4.14)
T 2
R r
1
V Y
R
r
N 2
Unde T
(4.4.15)
2
nivelul mediu iar T este estimatorul acesteia calculate pe baza datelor din eantion. Acestea
T
2
Y N j
j 1
2
T Y N
j
j
j 1
r
(4.4.16)
T 2
r 1
(4.4.17)
2
R r 1 T
2
R N
r
(4.4.18)
Deoarece numrul mediu de uniti simple ce formeaz o serie N este de cele mai
multe ori necunoscut, vom utiliza estimatorul n . Pentru unitile ce au intrat n eantion.
Acest lucru va determina o subestimare a variaiei estimatorului. Se consider c, n acest caz
j
Y
Yj
(4.4.20)
j 1 N
r
Nj
2
1
V Y
(1 r N ) Y j Y (4.4.21)
r (r 1) i 1
r
Nj
2
1
(1 r
) Y j Y
r ( r 1) i 1
N
(4.4.22)
4.5. Aplicaii
Aplicaie 1
n rndul celor 4000 de studeni ai unei faculti s-a realizat un sondaj simplu aleator pe un
eantion de 175 persoane.
La ntrebarea Cte ore studiai n medie pe sptmn (exceptnd sesiunea)? rspunsurile
centralizate se gsesc n tabelul 4.5.1.
Tabel 4.5.1
Intervale de
0-2
variaie (ore)*
Nr. studeni
50
2-6
6-12
12 h i peste Total
55
40
30
69
175
Se cere:
1. S se estimeze pentru o probabilitate de 0.95 numrul mediu de ore studiate de un student
din facultate.
2. S se estimeze cu aceeai probabilitate ponderea studenilor care studiaz mai puin de 6
ore pe sptmn.
Rezolvare:
1. Calculm ct reprezint 5% din volumul populaiei.
0.05*N=0.05*4000=200
Deoarece n (175) <200 considerm c sondajul aleator a fost realizat ntr-o populaie infinit.
Dispersia variabilei numrul de ore studiate nu este cunoscut i va fi nlocuit cu dispersia
caracteristicii n eantion.
Tabel 4.5.2
Intervale de variaie (ore)*
ni
0-2
50
2-6
55
6-12
40
12 i peste
30
Total
175
*limita inferioar inclus n interval
xi
xini
1
4
9
15
50
220
360
450
1080
(x i x ) 2 n i
1337.18
259.33
320.03
2338.31
4254.86
Calculm estimatorul numrului mediu de ore studiate pe sptmn. Calculele necesare sunt
sistematizate n tabelul 4.5.2.
x n
n
i i
i
1080
=6.17 ore
175
(x x)
n
i
ni
4254.86
=24.31
175
S2
24.31
0.37 ore
n
175
70
Numrul mediu de ore studiate de un student ntr-o sptmn este de cel puin 5.44 i cel
mult 6.9. Garantm acest rezultat cu o probabilitate de 0.95.
2. Estimatorul ponderii studenilor care studiaz mai puin de 6 ore pe sptmn se
calculeaz pe baza relaiei:
m 50 55
w
0.6
n
175
Calculul erorii de reprezentativitate (eroare standard).
w (1 w )
0.6(1 0.6)
0.037
n
175
Calculul erorii limit
w z w =1.96*0.037=0.072
w
Intervalul de ncredere:
w w p w w 0 .6 0.072 p 00 .6 0.072 0 .528 p 0.672
Garantm cu 95% c cel puin 52.8% i cel mult 67.2% din studeni studiaz mai puin de 6
ore pe sptmn.
Aplicatie 2
n rndul celor 110 studeni ce locuiesc ntr-un cmin s-a realizat un studiu privind nivelul de
mulumire fa de condiiile existente, prelevndu-se un eantion de 25 persoane. Rspunsurile
la ntrebarea n ce msur suntei mulumii de urmtoarele condiii din cminul n care
locuii? sunt centralizate n tabelul 4.5.3.
Condiiile privind
Curenia
Cldura
apa cald
apa rece
Foarte mulumit
8
6
10
11
mulumit
10
7
9
10
aa i aa
5
2
4
3
nemulumit
2
10
2
1
Tabel 4.5.3
Total
25
25
25
25
Se cere:
1. S se stimeze pentru o probabilitate de 95% ponderea studenilor care se consider
mulumii i foarte mulumii de condiiile din cmin.
Rezolvare
Eantionul prelevat este de volum redus. n acest caz distribuia mediilor eantioanelor posibile
depinde de forma de distribuie a populaiei. Cum de cele mai multe ori forma de distribuie a
populaiei nu este cunoscut, nici legea de distribuie a mediilor eantioanelor nu poate fi
determinat. Teoria sondajului demonstreaz c n cazul seleciei de volum mic probabilitatea
71
18
13
19
21
Wi
0.72
0.52
0.76
0.84
0.0809
0.0901
0.0770
0.0661
0.1670
0.1859
0.1589
0.1364
0.5530
0.3341
0.6011
0.7036
0.8870
0.7059
0.9189
0.9764
n 1
N 1
Calculul erorii limit n cazul sondajului de volum redu.
wi
72
Aplicaie 3
n rndul celor 4000 de studeni ai unei faculti urmeaz s se realizeze un sondaj cu privire
la modul de petrecere a timpului liber, utilizndu-se un procedeu de selecie simplu aleator
fr revenire. Din surse administrative se cunosc informaiile din tabelul 4.5.5. Din cercetri
anterioare pe teme similare efectuate n mediul studenesc s-a constata c variabilele din
tabelul 1.10 sunt puternic corelate cu variabilele de interes ale studiului.
Tabel 4.5.5
ponderea
studenilor care
(%):
locuiesc n cmin
au un loc de munc
sunt bursieri
35
20
25
Se cere:
1. Alegei variabila pe baza creia se va calcula volumul eantionului.
2. tiind c unitile ce vor forma eantionul se vor selecta dup procedeul simplu aleator fr
revenire din lista studenilor furnizat de ctre secretariatul facultii, s se calculeze
volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%.
3. Tot din cercetri anterioare se cunoate c proporia de nonrspunsuri n acest tip de
populaii este de 5%. Pe de alt parte se apreciaz c 2% din studenii ce figureaz n baza
de date urmeaz s fie exmatriculai. Acetia se consider uniti non-eligibile. S se
calculeze n aceste condiii eantionul de pornire.
Rezolvare:
1. Pentru a asigura reprezentativitatea eantionului pentru toate variabilele de interes, volumul
eantionului se va calcula pornind de la acea variabil auxiliar pentru care coeficientul de
variaie are valoarea maxim. Calculele necesare sunt sistematizate n tabelul 4.5.6.
Tabel 4.5.6
ponderea studenilor care:
Media
dispersia
locuiesc n cmin
35
0.35
0.2275
73.38
au un loc de munc
20
0.2
0.16
50
sunt bursieri
25
0.25
0.1875
57.73
73
2 p p (1 p)
Valoarea coeficientului de variaie este dat de relaia:
p
V
100
max( p, (1 - p))
Din datele din tabelul 4.5.6 se observ c dup variabila locuiesc n cmin populaia
studenilor este cel mai puin omogen. Se recomand calcularea volumului eantionului
pornind de la aceast variabil.
2. Deoarece procedeul de selecie utilizat este simplu aleator fr revenire la calculul
volumului eantionului se folosete relaia:
z 2 p(1 p )
z 2 p(1 p )
2w
N
781 persoane
3. Dup determinarea volumului eantionului teoretic necesar trebuie s determinm care este
volumul eantionului de pornire astfel nct n final s ajungem la numrul teoretic de
uniti selectate.
Se pune problema s inem cont de imperfeciunea listei utilizate ca baz de sondaj.
Considerm uniti non-valide acele uniti care n-ar trebui s figureze pe list dac aceasta ar
corespunde perfect populaiei studiate. n practic, n ciuda eforturilor actualizrii bazelor de
date utilizate ca baze de sondaj, exist n mod curent un numr de uniti non-valide. Trebuie
estimat aceast proporie astfel nct s putem determina ct mai precis volumul de pornire al
eantionului.
n funcie de modul de definire a populaiei supuse studiului este posibil ca unele uniti s fie
considerate non-eligibile. De exemplu dac populaia de interes este format din totalitatea
persoanelor cu vrsta cuprins ntre 15 i 64 ani (populaia n vrst de munc) iar unitatea de
selecie este gospodria, persoanele ce nu ndeplinesc condiia de vrst sunt considerate noneligibile.
Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Din aceast cauz se
recomand anticiparea ratei non-rspunsurilor nc din faza de proiectare a sondajului pentru a
redimensiona eantionul.
Relaia de calcul a volumului eantionului de pornire este:
1 1 1
n p n th
unde:
Pr Pe Pv
np= volumul eantionului de pornire; nth= volumul eantionului teoretic; Pr=proporia de
rspuns; Pe=proporia de eligibilitate; Pv=proporia de validitate
1 1 1
n p 781
839 persoane.
0.95 1 0.98
74
Aplicaia 4
n rndul salariailor unei ntreprinderi se va realiza un sondaj stratificat . Organizatorii
sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare strat urmnd s
se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din evidena
personalului s-a calculat, pornind de la variabila vrsta n ani mplinii media i dispersia pe
fiecare strat. Rezultatele se gsesc n tabelul 4.5.7:
sex
masculin
feminin
Tabel 4.5.7
Dispersia
36,4
45,8
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit
maxim admis de 3% din valoarea vrstei medii a tuturor angajailor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate.
Rezolvare
Calculele necesare sunt sistematizate n tabelul 4.5.8.
1. Vrsta medie a celor 900 de salariai se calculeaz ca medie aritmetic ponderata a vrstei
medii a salariailor din cele dou straturi dup relaia:
k
Xi N i
i 1
i 1
39915
44.35 ani
900
Xi
Ni
(pers.)
(ani)
535
365
48
39
i2
Ni Xi
N i 2i
Ni i
36.4
45.8
25680
14235
39915
19474
16717
36191
3227.784
2470.163
5697.947
75
ni
X X N
2
45
35
33813.34
767.4125
34580.75
n str
2x
z2 2
1.96 2 40.21
1.96 2 40.21
1.33
900
79.6 80 pers.
N
2. Repartizarea eantionului pe straturi se poate realiza n trei moduri i anume:
o neproporional obinndu-se un sondaj stratificat neproporional sau simplu;
o proporional respectndu-se ponderea fiecrui strat n total populaie obinndu-se
un sondaj stratificat proporional;
o innd cont att de proporia fiecrui strat n total ct si de gradul de variaie al
fiecrui strat obinndu-se un sondaj stratificat optim.
Deoarece, att volumul ct i dispersiile straturilor difer considerabil vom alege stratificarea
optim.
Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se utilizeaz
relaia:
k
n1
n2
ni
nk
...
....
N 1 1 N 2 2
Ni i
Nk k
i 1
i 1
Pe baza acesteia deducem relaia de calcul pentru subeantionul ce urmeaz a fi extras din
N
fiecare strat n i k i i n .
N
i
i 1
3227,784
80 45 persoane
5697.947
2470,163
n2
80 35 persoane
5697.947
n1
3. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat , variaia de
care trebuie inut cont n momentul calculrii volumului eantionului este variaia total a
caracteristicii. Deoarece nu se cunosc valorile individuale ale variabilei vrsta pentru
toate cele N uniti din populaie nu putem calcula variaia total dup relaia:
N
(X
X) 2 N
j1
tim c 2 2 2
Vom calcula variaia total ca sum variaiilor inter i intra straturi.
76
(X i X ) 2 N i
2
i 1
k
Ni
34580 .75
38.42
900
i 1
z 2 2
1.96 2 78.63
144 persoane
z22
1.96 2 78.63
2
2
x
1.33
N
900
Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de un sondaj
simplu aleator fr revenire de la 144 persoane la 80 persoane.
Aplicaia 5
n rndul studenilor facultii REI urmeaz s se realizeze un sondaj avnd drept obiectiv
principal analiza calitii procesului de nvmnt. Deoarece se urmrete evidenbierea
caracteristicilor fiecrui an de studi se e va utiliza un plan de sondaj stratificat. Informaiile
necesare aplicrii planului de sondaj au fost preluate de la secretariatul facultii i sunt
prezentate n tabelul 4.5.9.
Anul de studii
An I
An II
An III
An IV
Total
Tabel 4.5.9
Ponderea studenilor fr restane (%)
20
63
45
86
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de
3%.
2. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul eantionului
calculat la punctul 2.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi
necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
77
Rezolvare
Tabel 4.5.10
Anul
de studii
An I
An II
An III
An IV
Total
Ni
pi
2pi
N i 2pi
N i pi
ni
p i Ni
600
575
500
450
2125
0.2
0.63
0.45
0.86
0.16
0.2331
0.2475
0.1204
96
134.0325
123.75
54.18
407.9625
240
277.6125
248.7469
156.1442
922.5035
137
159
142
90
120
362.25
225
387
1094.25
2w
z 2 p2
2p
2
p i Ni
i 1
407.9625
0.19 unde dispersiile straturilor sunt 2p i p i (1 p i )
2125
i 1
1.96 2 0.19
1.96 2 0.19
0.03
2125
587 persoane
Pornim de la relaia:
n1
n2
ni
nk
...
....
N 1 p1 N 2 p 2
N i pi
N k pk
n
k
N
i 1
ni
N i pi
n.
N
i
pi
i 1
240
528 137 persoane
922.5
248.7
n3
528 159 persoane
922.5
n1
277.6
528 159 persoane
922.5
156
n4
528 159 persoane
922.5
n2
78
pi
i 1
k
pi Ni
i 1
Ni
1094 .25
=0.5149 2p 0.5149 (1 0.5149) 0.2498
2125
z 2 2
n SAFR
2w
z2p
1.96 2 0.2498
639 persoane
1.962 0.2498
2
0.0324
2125
N
Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta rezultatele
cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o cretere a
volumului eantionului cu 111 persoane.
Aplicaia 6
n urma unui sondaj stratificat proporional dup mediul de reziden realizat n judeul
Bacu de ctre o societate ce produce buturi rcoritoare, s-au obinut datele centralizate n
tabelul 4.5.11.
Mediul
Efectivul
populaiei
(mii pers.)
Eantion
(pers.)
Urban
Rural
Total
340
325
665
511
489
1000
Tabel 4.5.11
Informaii obinute din eantion
Ponderea celor
Venitul
Dispersia
care consum
totalmediu/gosp venitului total
sptmnal buturi
(mii lei)
mediu/gosp.
rcoritoare (%)
3.8
4.5
72
2.1
1.9
18
Se cere:
1. S se estimeze cu o probabilitate de 0.9545 venitul total mediu/gosp att pe fiecare strat ct
i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum sptmnal
buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.
Rezolvare
1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 4.5.12.
79
Tabel 4.5.12
Mediul
Ni
(mii pers.)
ni
(pers.)
Urban
Rural
Total
340
325
665
511
489
1000
x i mii lei
Si2 .
x i ni
xi
xi
Linf
Lsup
3.8
2.1
4.5
1.9
1941.8
1026.9
2968.7
0.094
0.062
0.188
0.125
3.612
1.975
3.988
2.225
x1
S12
4,5
x1 z
S12
2 0.094 0.188 mii Lei
n1
Intervalul de ncredere:
x2
S 22
n2
x2 z
1 .9
0.062 mii lei
489
S22
2 0.062 0.125 mii lei
n2
Intervalul de ncredere:
x 2 x2 X 2 x 2 x2 2.1 0.125 X 2 2.1 0.125 1.975 X 2 2.225
Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este de cel puin
1.975mii lei i cel mult 2.225 mii lei.
80
~
x
xi ni
i 1
i 1
2968,7
2.9687 mii lei
1000
~x
n i2
i 1
Mediul
Urban
Rural
Total
ni
(pers.)
511
489
1000
wi
Si2 .
wini
wi
0.72
0.18
0.2016
0.1476
367.92
88.02
455.94
wi
Linf
Lsup
Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul urban
Estimatorul procentului celor care . consum sptmnal buturi rcoritoare n mediul urban
calculat pe baza datelor din eantion este de 72%. Pentru a estima procentul acestora n
mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Deoarece populaia este considerat infinit utilizm relaiile de calcul aferente calculul
sondajului simplu aleator cu revenire.
w1
S12
0.2016
0.020
n1
511
w1 z
S12
2 0.020 0.040
n1
Intervalul de ncredere:
81
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult 76%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
N1 w 1 w1 N1 p1 N1 w 1 w1
N1 0.72 0.040 M 1 N 1 0.72 0.040
231293 M 1 258307
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293 persoane i cel
mult 258307 persoane consum sptmnal buturi rcoritoare.
Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul rural
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un procent de
18% al celor care consum sptmnal buturi rcoritoare.
Calculm eroarea de reprezentativitate
w2
S 22
0.1476
0.017
n2
489
w2 z
S22
2 0.017 0.035
n2
Intervalul de ncredere:
w 2 w2 p 2 w 2 w2 0.18 0.035 p 2 0.18 0.035 0.145 p 2 0.215
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel mult 21.5%
consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
N 2 w 2 w2 N 2 p 2 N 2 w 2 w2 47207 M 2 69793
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane i cel
mult 69793 persoane consum sptmnal buturi rcoritoare.
Estimarea procentului celor care consum sptmnal buturi rcoritoare pe total jude
Deoarece sondajul realizat este stratificat proporional estimatorul unwi variabile calitative la
nivelul judeului se calculeaz astfel:
k
~ n w
w
i i
i 1
ni
i 1
455.94
0.45594
1000
w~
n2
ni2 w2i
0.013236
i 1
82
Garantm cu o probabilitate de 95.45% c cel puin 42.9468% i cel mult 48.2412% din
judeul Bacu consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare:
~ ~ Np N w
~ ~
Nw
w
w
285596 M 320804
Garantm cu o probabilitate de 95.45% c n judeul Bacu cel puin 285596 persoane i cel
mult 320804 persoane consum sptmnal buturi rcoritoare.
Aplicaia 7
Studenii unei faculti sunt mprii n 100 de grupe. Fiecare grup este format dintr-un numr
egal de studeni (16). S-a realizat un sondaj de serii, procedeul de selecie a grupelor fiind
simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt prezentate n tabelul 4.5.14
seria
seria
1
2
3
4
5
6
7
8
60
54
56
62
63
50
49
58
9
10
11
12
13
14
15
16
4.5.14
Ponderea studenilor care doresc s
participe la cursul facultativ (%)
55
58
59
63
62
64
62
61
Se cere:
1. S se estimeze ponderea studenilor care doresc s participe la cursul facultativ cu o
probabilitate de 95%.
2. tiind c raportul de corelaie inter-serii este de 12% ce volum de eantion ar fi fost necesar
dac s-ar fi realizat un sondaj simplu aleator fr revenire?
Rezolvare
Tabelul 4.5.15
seria
wj
1
2
3
4
5
6
7
8
Total
0.6000
0.5400
0.5600
0.6200
0.6300
0.5000
0.4900
0.5800
0.0002
0.0020
0.0006
0.0012
0.0020
0.0072
0.0090
0.0000
seria
wj
9
10
11
12
13
14
15
16
0.5500
0.5800
0.5900
0.6300
0.6200
0.6400
0.6200
0.6100
9.3600
0.0012
0.0000
0.0000
0.0020
0.0012
0.0030
0.0012
0.0006
0.0318
83
j1
9.36
0.585
16
0.01055 unde
R
r
R
r
100
16
r
0.0318
0.0021
r 1
16 1
Eroarea limit corespunztoare probabilitii de 0,95 este:
w z w 1,96 0,01055 =0,0207
Intervalul de ncredere:
Pw
0,585 0,0207 P 0,585 0,0207 0,5643 P 0,6057
w
w
w
Garantm cu o probabilitate de 95% c cel puin 56,43% i cel mult 60,57% din studeni
doresc s participe la cursul facultativ.
2. n cazul sondajului de serii numrul de elemente simple ce au format eantionul a fost de
256. Relaia de calcul pentru sondajul simplu aleator fr revenire este:
z 2 S2
1,96 2 0,585 (1 0,585)
n 2
922 studeni
w z S 2 N 0,0207 2 1,96 2 0,585 (1 0,585) 1600
2
p
i 1
Deoarece variaia dintre serii este foarte mic (raportul de corelaie inter-serii fiind doar 0,87)
sondajul de serii se dovedete foarte eficient.
Aplicaia 8
O localitate este format din 415 gospodrii(serii). Numrul de elemente dintr-o serie
(membrii) este diferit i nu se cunoate nivelul mediu al acestuia pentru toate cele 415
gospodrii. Pentru a estima venitul mediu pe persoan se extrage n mod aleator un eantion
format din 25 de serii. Datele centralizate sunt prezentate n tabelul 4.5.16
Tabel 4.5.16
seria
1
2
3
4
5
6
7
8
9
10
11
12
13
Numrul.de
rezideni
8
12
4
5
6
6
7
5
8
3
2
6
5
seria
14
15
16
17
18
19
20
21
22
23
24
25
Total
84
Numrul de
rezideni
10
9
3
6
5
5
4
6
8
7
3
8
151
Nj
Tj
T j Yj N j
1
2
3
4
5
6
7
8
9
10
11
12
13
Total
8
12
4
5
6
6
7
5
8
3
2
6
5
32
42
19
22
27
26
27
21
30
15
10
26
20
0.40419
25.4657
11.0083
5.74729
12.0883
6.13464
0.19688
1.95259
1.86115
10.4873
4.66102
6.13464
0.15789
seria
Nj
Tj
T j Yj N j
14
15
16
17
18
19
20
21
22
23
24
25
10
9
3
6
5
5
4
6
8
7
3
8
30
32
12
25
18
21
17
22
30
25
14
29
84.7375
10.7897
0.05684
2.181
2.56848
1.95259
1.73681
2.32007
1.86115
5.97171
5.01048
5.58962
151
592
211.07
T j
N Y N
j
j1
j1
j 1
r
Nj
595
3.94 mil. lei
151
j 1
Deoarece nu se poate calcula mrimea medie seriilor din populaie N se va estima cu ajutorul
mrimii medii a seriilor din eantion n .
r
n Nj r
j 1
151
6.04
25
Y
N
j j j
j 1
r
T 2
r 1
196 .143
7.05
24
85
0.085
2
R n
r
415
25
6.04
3.774 Y 4.107
garantm cu o probabilitate de 95% c venitul mediu pe o persoan n aceast localitate este
de cel puin 3.774 mil. Lei i cel mult 4.107 mil lei.
Intervalul de ncredere pentru estimarea venitului mediu pe o gospodrie:
n Y
Y
Venitul mediu al unei gospodrii se ncadreaz n intervalul :(22.793; 24.107) mil lei.
86
Unitatea de nvare 5
PLANURI DE SONDAJ COMPLEXE
multe trsturi comune ce i difereniaz de alte grupuri. Acest lucru determin o variaie mic
n interiorul unitilor primare i o variaie mare ntre acestea, deci o eroare de
reprezentativitate mare.
Un astfel de sondaj presupune extragerea n primul stadiu a unui numr de uniti
primare care nu vor fi cercetate n totalitate ci vor constitui o baz de sondaj pentru al doilea
stadiu cnd se vor selecta unitile secundare ce vor constitui baz de sondaj pentru urmtorul
stadiu. Fiecare stadiu i va aduce contribuia la calculul erorii de reprezentativitate, cea mai
mare contribuie avnd-o eroarea din primul stadiu. Din acest motiv se recomand ca
numrul de stadii s nu fie foarte mare.
Realizarea unui sondaj n mai multe stadii presupune existena unei grupri a
populaiei. Aceast grupare, de cele mai multe ori, nu trebuie realizat n mod special
deoarece unitile populaiilor sunt deja grupate dup criterii administrative, geografice,
sociale etc. De exemplu ntr-un sondaj realizat cu privire la starea de sntate a populaiei
eantionul din primul stadiu este format din zone teritoriale. n al doilea stadiu din zonele
teritoriale selectate se vor extrage localitile, iar n al treilea stadiu indivizii ce vor forma
eantionul i vor completa chestionarele. n aceast situaie nu este necesar o baz complet
de sondaj dect pentru localitile ce au fost selectate n al doilea stadiu.
Pentru exemplificare se va prezenta n continuare sondajul desfurat n dou stadii
(bistadial). Schema de realizare a acestuia este prezentat n figura 5.2.1.
Figura nr. 5.2.1 Schema de realizare a sondajului bistadial
UP
1
2 .
STADIUL I
US
1 2
r
STADIUL II
88
Notm cu:
R = numrul de uniti primare din populaie;
r = numrul de uniti primare selectate n primul stadiu;
Nj = numrul total de uniti simple (indivizi) din UPj;
nj = numrul de uniti simple (indivizi) extrase din UPj .
N N j
(5.2.1)
j 1
T j y ij
(5.2.2)
i 1
T yij
(5.2.3)
j 1 i 1
R r N j j
T
y
(5.2.4)
ij
r j 1 n j i 1
Estimatorul totalului mediu variabilei studiate pe o unitate primar:
n
1 r N j j
T
yij
(5.2.5)
r j 1 n j i 1
R 2 1 1
R r
variaia dintre UP
n j 22,j
R r 2
N
1
j N n
r j 1
j
j
(5.2.6)
2. 22,i variaia din interiorul unitii primare UPj cu j 1, R i estimatorul acesteia 22,i
calculate conform relaiilor:
22,i
1
Nj
Nj
89
j
1
( y ij y j ) 2 (5.2.10)
n j 1 i 1
n j 22,j
r 12
R r 2
R 1
N j 1
(5.2.11)
R
r
r
N
j nj
j 1
T V(T)
Selecia din
faza 1
Eantion de volum n1
CHESTIONAR
Plan de observare
redus FAZA 1
Eantion de volum n2
Selecia din
faza 2
CHESTIONAR
Plan de observare
extins FAZA 2
91
Dumitrescu M., 2000, Sondaje statistice i aplicaii, Ed. Tehnic, Bucureti, p. 110.
92
Eficiena unui panel trebuie verificat pe toat durata de via a acestuia. n principiu,
ideea de baz const n a aprecia dac s-au produs modificri semnificative n structura
eantionului sau dac modificrile survenite asupra caracteristicilor demo-economice
sunt semnificative. Pentru a verifica acest lucru se utilizeaz urmtoarele metode:
a) Metoda coeficientului de corelaie. Considerm cazul a dou sondaje succesive
asupra unui panel de dimensiune mare. Numrul de uniti cercetate rmne neschimbat. Fie
variabilele numerice de sondaj yi1i yi2 (ce provin din cele dou sondaje succesive) de medii y1
n primul sondaj i y2 n al doilea. Dispersia populaiei este cunoscut i nemodificat ntre cele
dou momente de timp. Variana diferenei dintre cele dou medii este dat de relaia:
2 2
2 2 2
V ( y 2 y1 ) V ( y 2 ) V ( y1 ) 2 cov( y 2 y1 )
2 ry y
1 2 ry y
n
n
n
n
1 2
10
1 2
Niculescu-Aron I. G., 2004, O privite general privind utilizarea panelurilor n studiul comportamentului
consumatorului, Revista de informatic social nr. 2/2004, www.ris.uvt.ro
11
Saporta G., 2003-2004, Enquetes et Sondages, http:// cedric.cnam.fr/~saporta
93
Dac panelul nu mai este eficient se poate considera c cele dou medii provin din
eantioane independente. n acest caz ntre yi1 i yi2 nu exist nici o legtur, coeficientul de
corelaie fiind nul iar variana diferenei dintre medii este:V ( y 2 y 1 ) 2 2 n
n funcie de valoarea coeficientului de corelaie pot exista urmtoarele situaii:
o ry1 y 2 0 legtur invers ntre valorile variabilei yi la cele dou momente de timp.
Uzura panelului este foarte mare i necesit rennoire total.
o ry1 y 2 0,9 legtur foarte puternic ntre valorile variabilei yi la cele dou momente de
timp. Panel eficient. Nu este necesar rennoirea acestuia;
o 0,2 ry1 y2 0,9 Exist o legtur ntre valorile variabilei yi la cele dou momente de
timp dar nu foarte puternic rennoirea parial a panelului. n funcie de valoarea
coeficientului de corelaie se decide care este proporia de rennoire (k). Unii autori
consider c valoarea optim este de 50%.
o 0 ry1 y2 0,2 Nu exist legtur ntre valorile variabilei yi la cele dou momente de
timp. Se poate spune c datele provin din eantioane independente rennoirea total a
panelului.
b) Utilizarea testului Student pentru observaii perechi. Variabilele cuprinse n
planul de sondaj pot fi variabile de interes definite n concordan cu obiectivele studiului i
variabile auxiliare sau de identificare utilizate n stabilirea planului de sondaj .
n cazul n care variabila pentru care s-a efectuat testul este o variabil auxiliar care sa utilizat n momentul proiectrii eantionului aceast diferen denot o deteriorare a
panelului i necesitatea rennoirii acestuia.
Dac ns variabila pentru care s-a efectuat testul este una din variabilele de interes
conform obiectivelor anchetei aceast diferen semnificativ va fi interpretat n contextul
analizei efectuate.
n anchetele periodice ce se realizeaz asupra forei de munc n Romnia conform
metodologiei EUROSTAT se utilizeaz un panel ce este rennoit permanent dup o schem
rotaional de forma 2-2-2. Aceasta are ca principiu de baz urmtoarea tehnic: o locuin
este cercetat dou trimestre consecutive, este scoas temporar din cercetare urmtoarele dou
trimestre, este reintrodus n cercetare urmtoarele dou trimestre apoi este scoas definitiv.
Conform schemei aplicate n fiecare trimestru se pstreaz n eantion 50% din locuinele
trimestrului anterior. 25% din locuinele cercetate cu dou trimestre n urm iar restul de 25%
sunt locuine absolut noi. Astfel se pstreaz i o acoperire de 50% a eantioanelor de la un
trimestru al unui an la acelai trimestru al anului precedent.
94
5.5. Aplicaii
Aplicaia 1
Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia de 18 ani
peste de 48000. Unitile primare sunt reprezentate de seciile de votare (27) i au fost
selectate dup un procedeu aleator cu probabiliti egale fr revenire. n tabelul 5.5.1. sunt
prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor din fiecare unitate
primar ce a fost selectat n eantion.
secia
nr. pers.
din secia i
1
2
3
4
5
6
7
8
9
10
11
2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
nr. pers.
selectate din
secia i
43
43
43
52
42
52
46
45
42
52
52
venitul mediu
(mil lei)
dispersia dup
variabila venit
2.8
2.5
2.6
3.8
4.2
4.1
3.7
3.5
3.4
2.7
2.9
0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484
Tabelul 5.5.1
nr. pers. care
petrec la televizor
mai mult de 3 h/zi
20
25
24
28
31
36
28
29
33
36
30
Se cere:
1. S se estimeze venitul mediu din localitate pentru o probabilitate de 95%.
2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru aceeai
probabilitate.
Rezolvare
1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza calculelor
sistematizate n tabelul 5.5.2.
r
r
N ni
R r
R
27
R
i
T
y ij
Ni Y
Ti = 73023.4 =179239.25 mil lei
i
r i1 n i j1 r i1
r i1
11
r 2 R
R 2 1 1
r
R r
unde 12
1
T
r
1
r 1
T =
i
i 1
2,i
ni
i 1
(T T)
i
i 1
n
N i2 1 i
Ni
30397397
3039739.7
10
73023,4
6638.5 mil. lei
11
95
Tabel 5.5.2
secia
1
2
3
4
5
6
7
8
9
10
11
Total
Ni
2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
22294
ni
43
43
43
52
42
52
46
45
42
52
52
512
Y
i
22,i
Ti
(Ti T ) 2
ni
1
N
i
2.8
2.5
2.6
3.8
4.2
4.1
3.7
3.5
3.4
2.7
2.9
0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484
5924.8
6075
5896.8
8914.8
7350
9782.6
8066
5369
5433.2
6455.7
3755.5
73023.4
509354.714
317522.005
550105.405
5181583.08
506245.186
9885421.98
2037782.2
1611607.17
1452726.18
33412.5164
8311636.58
30397397
0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96
N i2 1
ni
Ni
2,i
ni
4080.44
7769.85
18776.93
9314.52
17791.67
17135.15
11013.39
507.58
5328.19
4301.96
1498.25
97517.92
Calculm primul termen al erorii de reprezentativitate indus de selecia din primul stadiu al
planului de sondaj.
11 3039739.7
Termen1=272 1
=119378868.2
11
27
Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a avut loc n al
doilea stadiu, n interiorul unitilor primare ce au format eantionul.
27
Termen2= 97517.92 =239362.8
11
Observm c primul termen al variaiei estimatorului are o contribuie substanial n
determinarea mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de
sondaj trebuie s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se
recomand stratificarea unitilor primare.
96
2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate n tabelul
5.5.3.
Tabelul 5.5.3
secia Ni
ni
mi
i
w
22,i
Ti
(Ti T) 2
1
2
3
4
5
6
7
8
9
10
11
Total
43
43
43
52
42
52
46
45
42
52
52
512
20
25
24
28
31
36
28
29
33
36
30
0.4651
0.5814
0.5581
0.5385
0.7381
0.6923
0.6087
0.6444
0.7857
0.6923
0.5769
0.2488
0.2434
0.2466
0.2485
0.1933
0.2130
0.2382
0.2291
0.1684
0.2130
0.2441
984.2
1412.8
1265.9
1263.2
1291.7
1651.8
1327.0
988.6
1255.6
1655.3
747.1
13843.11
75228.67524
23816.57237
54.70016007
22.7172322
1102.383243
154749.1181
4691.155746
72838.84794
8.369917026
157484.5118
261477.9275
751474.9792
2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
22294
ni
1
Ni
0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96
R
T
r
i
Ni w
i 1
R
r
25378.59
32829.62
28942.27
25720.57
13757.28
22813.07
24088.40
11630.56
9967.70
22909.85
7555.70
225593.60
petrec la
27
13843.11 = 33978.54 pers.
11
n 2,i
N i2 1 i
Ni ni
i 1
r 2 R
R 1 1
r
R r
2
unde 12
1
T
r
1
r 1
T =
i
i 1
i 1
(T T)
i
i 1
N i2 1
ni
Ni
2,i
ni
751474.9792
75147.49792
10
13843,11
1258.465 pers.
11
11 75147.49792
Termen1=272 1
=2951247.191
11
27
27
Termen2= 225593.60 =553729.7456
11
Observm c i n acest caz primul termen al variaiei estimatorului are o contribuie
substanial n determinarea mrimii erorii de reprezentativitate. stadiu.
T 2951247.191 553729.7456 1872.158363
Intervalul de ncredere al totalului este:
T 1.96 T T T 1.96 T
97
T 0.70789
w
N
Intervalul de ncredere al procentului mediu este :
1
T
1
(T 1.96 * T ) (T 1.96 * T )
N
N N
0 .6315 p 0.7843
Se garanteaz cu o probabilitate de 95% c cel puin 63.15% i cel mult 78.43% din populaia
ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.
Aplicaia 2
n rndul societilor comerciale din domeniul de activitate Hoteluri i restaurante se
realizeaz o anchet periodic ce are la baz un eantion de tip panel. Pornind de la variabila
auxiliar numr salariai prezentat n tabelul 5.5.4 (pentru exemplificare s-au luat doar
primele 20 de societi comerciale din eantion) se va verifica eficiena panelului.
Se cere:
1. S se stabileasc gradul de uzur al panelului cu ajutorul metodei coeficientului de
corelaie.
2. S se verifice eficiena panelului cu ajutorul testului Student (=0.05) pentru date nrudite
(eantioane dependente).
societate
comercial
1
2
3
4
5
6
7
8
9
10
societate
comercial
11
12
13
14
15
16
17
18
19
20
18
17
22
25
28
29
33
43
25
28
i1
i 1
98
Tabel 5.5.4
Numr salariai (pers.)
la momentul
la momentul
verificrii
realizrii
eficienei
panelului
panelului
22
22
20
25
27
28
31
41
28
30
yi1
yi2
yi1 yi2
y2 i1
y2 i2
13
15
37
44
34
23
21
14
15
16
18
17
22
25
28
29
33
43
25
28
500
14
14
35
40
30
21
30
17
20
20
22
22
20
25
27
28
31
41
28
30
515
182
210
1295
1760
1020
483
630
238
300
320
396
374
440
625
756
812
1023
1763
700
840
14167
169
225
1369
1936
1156
529
441
196
225
256
324
289
484
625
784
841
1089
1849
625
784
14196
196
196
1225
1600
900
441
900
289
400
400
484
484
400
625
729
784
961
1681
784
900
14379
ry1y2
0.9384 0.9
d y1 y 2 25 25.75 0.75
n
Sd
n 1 229.75 / 19 3.47737
i 1
y1 y 2
n 0.96455
Sd
Sd
Valoarea calculat a testului se compar cu cea teoretic corespunztoare nivelului de
semnificaie ales i n-1=19 grade de libertate. Valoarea teoretic ce corespunde nivelului de
semnificaie =0.05 i numrului de grade de libertate 19 este t=2.093 Deoarece valoarea
99
calculat este mai mic dect cea teoretic se accept ipoteza diferenei nule ceea ce
nseamn c nu exist diferene semnificative ntre cele dou medii, panelul fiind eficient
Tabelul 5.5.6
societate
comercial
yi1
yi2
di
d d
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
13
15
37
44
34
23
21
14
15
16
18
17
22
25
28
29
33
43
25
28
25
14
14
35
40
30
21
30
17
20
20
22
22
20
25
27
28
31
41
28
30
25.75
-1
1
2
4
4
2
-9
-3
-5
-4
-4
-5
2
0
1
1
2
2
-3
-2
-0.75
0.0625
3.0625
7.5625
22.5625
22.5625
7.5625
68.0625
5.0625
18.0625
10.5625
10.5625
18.0625
7.5625
0.5625
3.0625
3.0625
7.5625
7.5625
5.0625
1.5625
229.75
100
Unitatea de nvare 6
SONDAJE NEPROBABILISTICE
6.1. Obiective
101
Cat.1.
Cat.2.
Cat.3.
Cat.4.
Cat.5.
Cat.6.
%
45,00%
7,50%
10,00%
10,00%
5,00%
22,50%
100,00%
Criteriile de cote marginale sunt comode pentru operatori i puin costisitoare. Ele pot
fi stabilite cu exactitate, dar ansa de a obine un eantion reprezentativ este mai mic dect n
cazul cotelor ncruciate. Dup cum se observ n acest caz nu exist nici o corelaie ntre
103
criteriile de cot. Operatorul de sondaj nu tie cte femei trebuie s ia din fiecare categorie
social sau ci brbai.
Pentru a realiza un plan de sondaj care s utilizeze cote ncruciate este necesar
cunoaterea structurii populaiei dup cele dou variabile. n cazul studiului nostru aceast
structur este prezentat n tabelul nr. 6.3.2. Foaia de cote dup care trebuie s se ghideze
operatorul n aceast situaie este prezentat n tabelul nr. 6.3.4. Prin aceast metod sunt puse
n eviden neconcordanele care exist n ceea ce privete distribuia pe categorii sociale
pentru cele dou sexe.
Tabel 6.3.2. Structura populaiei necesar pentru cote ncruciate
categorie social
Sex
salariat
patron
omer
elevliber
student
profesionist
4500
4200
4900
2000
masculin 24000
50,53
9,47
8,84
10,32
4,21
%
3000
5800
5100
3000
feminin 21000
40,00
5,71
11,05
9,71
5,71
%
45000
7500
10000
10000
5000
Total
45
7,5
10
10
5
%
pensionar
Total
7900
16,63
14600
27,81
22500
22,5
47500
100
52500
100
100000
100
masculin
feminin
Categoria social
salariat
patron
omer
elev-student
liber profesionist
pensionar
salariat
patron
omer
elev-student
liber profesionist
pensionar
nr.
interviuri
10
2
2
2
1
3
8
1
2
2
1
6
104
Interviuri
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
3
3
2
2
2
10
nr. interviuri/
19
21
sex
Categoria social
Cat1
Cat2
Cat3
Cat4
Cat5
Cat6
18
3
4
4
2
9
Interviuri
10
11
12
13
14
15
16
17
18
19
10
11
12
13
14
15
16
17
18
19
10
11
12
13
14
15
16
17
18
105
20
21
Cu toate acestea unii autori consider c n cazul sondajului pe cote se poate adopta
ipoteza unei selecii simple aleatoare cu probabiliti egale. Aceast ipotez ns nu poate fi
demonstrat. Utilizarea relaiilor de calcul a sondajului aleator cu probabiliti egale pentru
volumul eantionului i a erorilor de reprezentativitate nu pot duce dect la aproximri mai
mult sau mai puin grosolane.
n general acest tip de sondaj este utilizat n cercetri sociologice sau n studii de pia
n diferite localiti fr a avea pretenia reprezentativitii la nivel naional.
Uneori, datorit rapiditii i costului redus cu care se realizeaz, aceast eantionare
poate fi combinat cu alte procedee de eantionare n cadrul sondajelor complexe. De
exemplu, pentru realizarea unui studiu cu privire la atitudinea fa de munc a populaiei n
vrst de munc din Bucureti se proiecteaz un sondaj bistadial. Se mparte suprafaa
Bucuretiului n 100 de zone de aproximativ aceeai arie care vor constitui unitile primare
ce vor fi selectate n primul stadiu dup un procedeu simplu aleator fr revenire. Pentru a
evita efectul de serie unitile primare se stratific dup tipul zonei rezideniale. n stadiul al
doilea, pentru selectarea unitilor secundare se poate utiliza eantionarea pe cote.
106
BIBLIOGRAFIE
Andrei, T.
Stancu, S,.
Pele, D.T.
Isaic-Maniu
Al.,
Mitru C.,
Voineagu V.
Isaic-Maniu
Al.
Levy P.S.,
Lemeshow S.
Jaba Elisabeta,
Grama Ana
Dumitrescu,
M
Mihoc Gh.,
Craiu V.
NiculescuAron I. G.,
5
6
7
9 Porojan D.
10 Rotariu T.I.
11 Rotariu T.
(coordonator)
12 Sandu Gh.,
13 Saporta G.,
14 Sincich T.,
15 Wilson M.,
Littell R.
16 ***
http://biol10.biol.umontreal.ca/BIO2042
17 ***
http://www3.imperial.ac.uk/portal/pls/portallive/docs/1/7292119.PDF
107