Sunteți pe pagina 1din 5

Obiectivele cursului

 Să cunoaştem principiile eşantionării multistadiale (şi să


numărăm numărul de stadii).
 Să construim eşantioane în care indivizii să aibă probabilităţi
egale de selecţie.
 Să reducem cât mai mult erorile standard în condiţiile folosirii
eşantionării multistadiale.

Eșantionarea multistadială

Când folosim eşantionarea multistadială?


Eşantionare bistadială/tristadială
 Când nu există un cadru de eşantionare al elementelor finale
însă există un cadru al unităţilor primare de selecţie.
 Când accesul la elemente poate fi realizat doar prin persoane Eşantionare bistadială
cheie (angajaţi în anumite sectoare, grupuri speciale, etc.). Unităţi primare de selecţie (primary sampling units - PSU) Secţii de votare
 Pentru a reduce costurile de colectare a datelor (în special în Unităţi finale de selecţie (ultimate sampling units) Persoane
folosirea interviului face-to-face).
Eşantionare tristadială
Unităţi primare de selecţie (primary sampling units - PSU) Localităţi
Unităţi secundare de selecţie (secondary sampling units - SSU) Secţii de votare
Unităţi finale de selecţie (ultimate sampling units) Persoane

Câte stadii are eşantionul de mai jos? Câte stadii are eșantionul de mai jos?
 Volumul eşantionului:2019 persoane de 18 ani şi peste  volumul eşantionului: 1110 persoane
 Criterii de stratificare: 18 zone geografice grupate pe provincii  tipul eşantionului: stratificat XXXXX, probabilist; criteriile de stratificare
istorice, mediu rezidenţial (urban-rural), mărimea localităţii (4 au fost regiunile (provinciile) istorice ( 7 regiuni şi municipiul Bucureşti),
tipuri), gradul de dezvoltare al localităţilor rurale (3 categorii). mediul rezidenţial (urban- rural), mărimea localităţilor urbane ( 4 tipuri ).
 eşantionarea: investigaţia s-a desfăşurat în 120 de puncte de
 Eşantionare: selecţie probabilistă a localităţilor (119), a
eşantionare din 81 de localităţi (43 urbane şi 38 rurale ). Selecţia
punctelor de eşantionare (secţii de votare-135) şi persoanelor.
localităţilor, a punctelor de eşantionare şi a persoanelor s-a făcut
Pentru selecţia persoanelor au fost utilizate, în principal, probabilistic. Selecţia gospodăriilor şi a persoanelor s-a realizat cu pas
ultimele liste electorale. statistic prin metoda “drumului aleator”
 Reprezentativitate naţională pentru populaţia adultă  reprezentativitatea: eşantionul este reprezentativ la nivel naţional
neinstituţionalizată a României, cu o eroare tolerată de +/- pentru populaţia de 18 ani şi peste din România cu o eroare tolerată de
2.2% ± 2,94%
 interviurile cu chestionar au fost realizate de operatorii CURS, la
domiciliul subiecţilor, în perioada 11 – 17 mai 2006.

1
Câte stadii are eșantionul de mai jos? ExerciŃiu
Sondajul efectuat de Centrul de Sociologie Urbană şi Regională în  Stabiliţi numărul de stadii propuse în designul de eşantion din
luna iunie 2003 a avut următoarele caracteristici: Curs7_Exerciţiul 1.
 Volumul eşantionului: 1106 persoane din grupa de vârstă 18 –
29 ani;
 Eşantion : stratificat, probabilist, XXXXX;
 Criterii de stratificare: 7 provincii istorice plus oraşul Bucureşti,
mediu rezidenţial (urban-rural), mărimea localităţii urbane (4
tipuri), şi proporţia sate centru de comună - sate componente
ale comunei ;
 Eşantionare: selecţie probabilistă a localităţilor (74) şi
persoanelor;
 Reprezentativitatea naţională pentru populaţia din grupa de
vârstă 18-29 ani a României, cu o eroare tolerată de +/- 2,9%, la
o probabilitate de 95% ;

ProbabilităŃi de selecŃie ProbabilităŃi de selecŃie


 Dorim să facem un studiu pe o zonă compusă din 10 oraşe şi În cazul eşantionării multistadiale, probabilitatea de selecţie a
10 sate. Pentru aceasta selectăm 4 localităţi şi câte 20 de fiecărui element este produsul probabilităţilor (condiţionate)
de selecţie la fiecare stadiu de selecţie:
indivizi în fiecare dintre ele.
 Cum este probabil să arate eşantionul? Ce grup va fi Dacă selectăm k localităţi, j secţii de votare în fiecare localitate, i
suprareprezentat? indivizi în fiecare secţie de votare:
 Cum va arăta un indicator privind procentul populaţiei fără apă
curentă?
Pijk = P( k ) * P( j | k ) * P(i | j.k )
Pentru a avea estimări nedistorsionate, este nevoie să ponderăm
fiecare element invers proporţional cu mărimea probabilităţii
de a fi selectat.

A. PSU cu probabilităŃi egale şi


ProbabilităŃi de selecŃie număr egal de unităŃi în fiecare PSU
Există trei variante distincte de a selecta unităţile de selecţie:
A. Să selectăm unităţile primare de selecţie cu probabilităţi egale Sunt selectate 2 localități și în interiorul fiecărei localități câte 50 de indivizi.
şi apoi câte un număr fix de elemente din fiecare dintre ele.
B. Să selectăm unităţile primare de selecţie cu probabilităţi egale Care sunt indivizii cu cele mai mari probabilități de selecție?
şi apoi un număr inegal de unităţi în fiecare dintre ele, pentru
a egaliza probabilităţile finale de selecţie. Mărimea
C. Să selectăm unităţile primare de selecţie cu probabilităţi localității
proporţionale cu mărimea lor şi apoi câte un număr fix de 1.000
elemente din fiecare dintre ele.
2.000
500
În general este bine să alegem variantele cu probabilităţi de
selecţie egale pentru toate elementele (eşantioane EPSEM - 10.000
Equal probability of selection method). 5.000

2
A. PSU cu probabilităŃi egale şi A. PSU cu probabilităŃi egale şi număr egal
număr egal de unităŃi în fiecare PSU de unităŃi în fiecare PSU

Sunt selectate 2 localități și în interiorul fiecărei localități câte 50 de indivizi. Dorim să facem un studiu reprezentativ la nivelul mediului urban
din judeţul Alba (datele se găsesc în excelul MTSOP_C7_Alba)
Care sunt indivizii cu cele mai mari probabilități de selecție?
pe un eşantion de 500 de persoane.

Mărimea Probabilitatea Probabilitate Probabilitate Probabilitate Pentru aceasta ne propunem să selectăm 5 localităţi aleator iar în
localității unei localități a indivizilor finală finală interiorul fiecărei localităţi câte 100 de indivizi. Care este
de a fi de a fi
selectate selectați probabilitatea fiecărui individ de a fi selectat?
1.000 2/5 50/1.000 2/5*50/1.000 0,02
2.000 2/5 50/2.000 2/5*50/2.000 0,01 Pijk = P( k ) * P ( j | k ) * P(i | j.k )
500 2/5 50/500 2/5*50/500 0,04
10.000 2/5 50/10.000 2/5*50/10.000 0,002
5.000 2/5 50/5.000 2/5*50/5.000 0,004

B. PSU selectate cu probabilităŃi egale şi apoi


numărul de unităŃi din fiecare variabil pentru
Dezavantaje design A
echilibrarea probabilităŃilor
Designul A nu este recomandat deoarece:
Se dorește să se realizeze un eșantion de 100 de persoane. Sunt selectate 2
1. Necesită ponderări ale bazei de date pentru a echilibra localități și în interiorul fiecărei localități câte un număr variabil de indivizi
probabilităţile de selecţie. pentru ca în final indivizii să aibă probabilități egale de selecție.
2. Va duce la o scădere a preciziei comparativ cu un eşantion în Care sunt probabilitățile indivizilor din fiecare localitate de a fi
selectați?
care indivizii au probabilităţi egale de selecţie (există un
efect de design datorat ponderării – vezi Encyclopedia of Mărimea
localității
Survey Research Methods – termenul effective sample size).
1.000
2.000
500
10.000
5.000
Total=185
00

B. PSU selectate cu probabilităŃi egale şi apoi B. PSU selectate cu probabilităŃi egale şi apoi
numărul de unităŃi din fiecare variabil pentru numărul de unităŃi din fiecare variabil pentru
echilibrarea probabilităŃilor echilibrarea probabilităŃilor

Se dorește să se realizeze un eșantion de 100 de persoane. Sunt selectate 2 Se dorește să se realizeze un eșantion de 100 de persoane. Sunt selectate 2
localități și în interiorul fiecărei localități câte un număr variabil de indivizi localități și în interiorul fiecărei localități câte un număr variabil de indivizi
pentru ca în final indivizii să aibă probabilități egale de selecție. pentru ca în final indivizii să aibă probabilități egale de selecție.
Care sunt probabilitățile indivizilor din fiecare localitate de a fi Care sunt probabilitățile indivizilor din fiecare localitate de a fi
selectați? selectați?
Mărimea Probabilitat Probabilitatea unei Probabilitate Probabilitate
localității e finală localități de a fi indivizilor în indivizilor în
Mărimea Probabilitat Probabilitatea Probabilitate Probabilitat selectate interiorul localităților interiorul localităților
localități e finală unei localități indivizilor din ea
1.000 100/18500 2/5 =(100/18500)/ 0,0135
i de a fi localități indivizilor
(2/5)
selectate
2.000 100/18500 2/5 =(100/18500)/ 0,0135
1.000 100/18500 2/5 (2/5)
2.000 100/18500 2/5 500 100/18500 2/5 =(100/18500)/ 0,0135
(2/5)
500 100/18500 2/5 10.000 100/18500 2/5 =(100/18500)/ 0,0135
10.000 100/18500 2/5 (2/5)
5.000 100/18500 2/5 =(100/18500)/ 0,0135
5.000 100/18500 2/5 (2/5)
Total=18 Total=18500
500

3
B. PSU selectate cu probabilităŃi egale şi apoi B. PSU selectate cu probabilităŃi egale şi apoi
numărul de unităŃi din fiecare variabil pentru numărul de unităŃi din fiecare variabil pentru
echilibrarea probabilităŃilor echilibrarea probabilităŃilor
Se dorește să se realizeze un eșantion de 100 de persoane. Sunt selectate 2
localități și în interiorul fiecărei localități câte un număr variabil de indivizi
pentru ca în final indivizii să aibă probabilități egale de selecție.
Pik = P( k ) * P(i | k )
unde
mărimea eşantionului
Mărimea Probabilitate Nr persoane selectate (în cazul Nr
Pik =
localității indivizilor în selecției localității) final
mărimea populaţiei
interiorul
număr clustere selectate
localităților P(k ) =
1.000 0,0135 =1000*0,0135 14 număr total de clustere
2.000 0,0135 =2000*0,0135 27
500 0,0135 =500*0,0135 7
10.000 0,0135 =10.000*0,0135 135 Nr indivizi selectaţi pe cluster=Mărimea cluster*P(i|k)
5.000 0,0135 =5000*0,0135 68
Total=18500

B. PSU selectate cu probabilităŃi egale şi apoi


numărul de unităŃi din fiecare variabil pentru
echilibrarea probabilităŃilor
Probleme ale designului b (Kish, 218-219)
Deschideți documentul Curs7_Alba.xls. 1. Mărimea eşantionului nu este fixă (dependentă de clusterele
Care ar trebui să fie probabilitatea finală a unui individ de a fi selectat ce sunt incluse în eşantion).
dacă vrem ca toţi indivizii să aibă aceeaşi probabilitate de selecţie 2. Probleme de administrare a sondajului – mult prea multe
(pentru un eşantion de 500)? chestionare pentru anumite zone şi prea puţine în altele
 Dacă vrem să selectăm 5 localităţi aleator care este probabilitatea (dificultăţi pentru operatori şi pentru control).
unei localităţi de a fi selectate? 3. Eficienţa statistică este scăzută din cauza inegalităţilor
 Pentru a avea probabilităţi finale egale care ar trebui să fie dintre clusterele selectate.
probabilităţile de selecţie a indivizilor în interiorul localităţilor?
 Presupunând că aleator au fost alese localităţile Aiud, Sebeş, Baia de
Arieș, Cugir, Ocna Mureş care vor fi eşantioanele în fiecare dintre
aceste localităţi?
 Care va fi volumul total al eşantionului?
 Dar dacă în loc de Baia de Aramă am fi ales Alba Iulia?
 Dacă vrem să selectăm indivizii cu pas în interiorul localităţilor, care
ar trebui să fie pasul de selecţie?

C. SelecŃia proporŃională cu mărimea


Metode uşoare de îmbunătăŃire a metodei clusterelor!!!
Dacă optăm pentru această metodă trebuie controlăm  Selecție a două localități cu probabilități proporționale cu
coeficientul de variaţie al mărimii clusterelor. mărimea și ulterior câte 50 de indivizi în fiecare localitate.

Putem face acest lucru:


 Stratificând anterior clustere după mărime. Mărimea Probabilitatea Probabilitatea Probabilitățile
localității de selecție a indivizilor în finale
 Împărţind artificial clusterele mari sau adunând clusterele localității interiorul
reduse ca mărime. localităților
1.000 =1000/18500 =50/1.000 =50/18500
2.000 =2000/18500 =50/2.000 =50/18500
500 =500/18500 =50/500 =50/18500
10.000 =10000/18500 =50/10.000 =50/18500
5.000 =5000/18500 =50/5.000 =50/18500
Total=18500

4
C. SelecŃia proporŃională cu mărimea
clusterelor ExerciŃiu
 Indivizii sunt selectaţi cu probabilităţi egale (mărimea  Deschideți documentu l Curs7_Alba.xls
eşantionului/mărimea populaţiei): Doriți să selectați indivizii cu probabilități proporționale cu
 Localităţile se selectează cu probabilităţi proporţionale cu mărimea clusterelor.
mărimea lor (P=numărul de clustere selectate*mărimea  Care sunt probabilităţile localităţilor de a fi selectate?
localităţii/mărimea populaţiei).
 Care sunt probabilităţile indivizilor din fiecare localitate de a fi
 Numărul de unităţi în clustere este fix – (10/20, etc.). selectaţi?
 Care sunt probabilităţile finale ale indivizilor de a fi selectaţi?

Paşi în PPS (Sudman) ExerciŃiu


 În judeţul Alba, dorim să facem un eşantion de 500 de
 Clusterele sunt sortate în ordinea dorită pentru a obţine persoane astfel încât localităţile să fie selectate cu probabilităţi
beneficii din stratificare (sortare după regiune, mediu, proporţionale cu mărimea lor (numărul localităţilor selectate
dezvoltare economică, etc.). Sortarea după mărime nu este va fi 5 iar numărul aleator este 150).
necesară.
 Care sunt localităţile ce urmează să fie selectate?
 Se face o frecvenţă cumulativă a mărimii clusterelor.
 Pasul de eşantionare (s) se calculează împărţind totalul
cumulativ la m (numărul de clustere dorite).
 O valoare aleatoare (între 1 şi s) este selectată şi apoi
clusterele selectate sunt cele în care se găsesc valorile r, r+s,
r+2s, r+3s, r+(m-1)s unde r este valoarea aleatoare iar s pasul
de eşantionare.

ExerciŃiu
 Există situaţii în care intervalul de eşantionare este mai mic  Cum aţi restructura eşantionul anterior plecând de la premisa
decât numărul de elemente dintr-un cluster. Aceste clustere că mărimea unui cluster nu trebuie să fie mai mare decât pasul
vor fi cu siguranţă selectate cel puţin o dată. de eşantionare şi că numărul de cazuri selectate pe cluster
 În cazul în care mărimea unui cluster este mai mare decât trebuie să fie acelaşi (100)?
pasul de eşantionare se recomandă ca acesta să devină parte a  Care vor fi probabilităţile de selecţie ale indivizilor din diferite
unui nou strat şi să fie selectat automat. Ulterior vom folosi clustere?
ponderi sau putem recalcula numărul de cazuri de selectat din
clusterul eşantionat cu siguranţă pentru a nu fi nevoiţi să  Ce ponderi ar trebui să le dăm indivizilor din eşantionul
ponderăm eşantionul ulterior. realizat?
 Pasul de eşantionare se recalculează în funcţie de numărul nou
de clustere.
 Procedeul se repetă până pasul de eşantionare este mai mare
decât numărul de elemente din oricare dintre clustere.

S-ar putea să vă placă și