Tema 5

Tema 5.
Estimarea parametrilor în condițiile unui sondaj de tip cluster
POPULAŢIE R SERII
EŞANTION r SERII
Notăm cu:
R = numărul de unităţi complexe (serii) din populaţie;
r = numărul de unităţi complexe (serii) din eşantion;
N = numărul de unităţi simple (indivizi) din populaţie;
n = numărul de unităţi simple (indivizi) din eşantion;

N N
1
T =∑ Y i T̄ = ∑Y
i=1 este totalul din populaţie; R i=1 i este totalul mediu pe serie;
N R
1 Nj
Ȳ = ∑ Y i =∑
¯ Ȳ j
N i=1 j=1 N este nivelul mediu pe fiecare unitate simplă (individ)
unde
Ȳ j este nivelul mediu pe fiecare serie.
Estimatori şi erori în cazul sondajului de serii de talie egală selectate după procedeul
aleator cu probabilităţi egale fără revenire
Avem N1= N2=….. NR= N0. Putem calcula volumul de unităţi simple al populaţiei şi al eşantionului astfel:
N=R N0 iar n= r N0. Avem următoarele relaţii de calcul:
N R R
1 Nj 1
Ȳ = ∑ Y i =∑
¯ Ȳ j= ∑ Ȳ j
N i=1 j=1 N R j=1 este nivelul mediu pe fiecare unitate simplă;
R
∑ (Ȳ j−Ȳ¯ )2
r ¯^ )= R−r i=1
V (Y
¯^ 1
Y = ∑ Ȳ j Rr R ¯
r j=1 estimatorul mediei iar dispersia estimatorului Y^ ;
r
∑ ( Ȳ j −Y¯^ )
2
¯^ ) = R−r i=1
V^ ( Y
Rr r−1
estimarea dispersiei estimatorului Y¯^
Pornind de la regula de adunare a dispersiilor:
2 2 2
σ = {σ̄ + δ ¿varita varita vari ta¿toală din terioul dintregupe¿ grupelor¿ ,
se calculează coeficientul de determinaţie (numit şi raportul de corelaţie inter-serii) notat cu η2 .
2
2 variatia dintre grupe δ
η = = 2 ⇒ δ 2 =η 2 σ 2
variatia totală σ atunci putem scrie:
R
∑ (Ȳ¯ j−Ȳ¯ )2
¯^ ) = R−r i=1 R−r δ 2 R−r σ 2 2
V (Y = = η
Rr R R r R r
variaţia estimatorului;
r
∑ ( Ȳ¯ j−Y¯^ )
2
¯^ )= R−r R−r δ^ 2 R−r 2 2

V^ ( Y i =1
= = η S
Rr r −1 R r Rr estimaţia variaţiei .
Unde S2 este dispersia totală a variabilei de interes iar δ^ 2 este dispersia dintre serii calculate pe baza
datelor din eşantion.
Eroarea medie de reprezentativitate se va calcula după relaţia:
σ ¯^ =
Y √ R−r δ 2
R r
≈
√
R−r δ^ 2
R r (variabilă cantitativă);
√ √
δ δ
R−r p2 R−r w2
σ w= ≈
R r R r (variabilă calitativă).
R r
∑ ( pi − p̄)2 ∑ ( wi −w̄ )2
i=1 i =1
δ 2= δ 2=
p R iar w r −1 unde pi şi wi reprezintă ponderea celor care posedă
caracteristica în populaţie respectiv în eşantion.
Dacă s-ar fi organizat un sondaj simplu aleator fără revenire eroarea medie de reprezentativitate s-ar fi
calculat după relaţia:
√ √ √
RN 0 −rN 0 S 2
√
2 2 2
N−n σ N−n S 1 R−r S
σ Ȳ SAFR = ≈ = =
N n N n RN 0 rN 0 N0 R r
σ Ȳ¯ =
√ R−r δ 2
R r
≈
R r√
R−r δ^ 2
=
R−r S 2 2
R r
η
√ σ Ȳ <σ Ȳ SAFR ⇒ η2 <
1
N0
În consecinţă putem spune că dacă dorim ca eficienţa sondajului de serii să fie cât mai mare este necesar
să împărţim populaţia în serii de dimensiuni mici iar coeficientul de determinaţie să fie cât mai mic posibil.
Extinderea rezultatelor se face pe baza intervalului de încredere luând în considerare probabilitatea cu

care vrem să garantăm rezultatele.
Y¯^ − Δ ¯^ < Ȳ¯ < Y¯^ + Δ ¯^ w̄−Δ w̄ < p< w̄+ Δw̄ (variabilă calitativă)
Y Y (variabilă cantitativă);
Estimatori şi erori în cazul sondajului de serii de talie diferită selectate după procedeul
aleator cu probabilităţi egale fără revenire
Notăm cu:
Nj= numărul de unităţi simple din seria j;
Tj= totalul variabilei de interes pentru toate unităţile seriei j;
N̄ = mărimea medie a unei serii în populaţie;

n̄ = mărimea medie a unei serii în eşantion;
N R
1 Nj
Ȳ = ∑ Y i =∑
¯ Ȳ j
N i=1 j=1 N reprezintă nivelul mediu în populaţie al variabilei de interes;
r
∑ N j Ȳ j
¯ j=1
Y^ = r
δ 2
¯ R−r 1
∑ Nj V ( Y )=
^ ⋅ 2⋅ T
j=1 estimatorul mediei; R N̄ r dispersia estimatorului unde
R
∑ ( T j −Ȳ¯ N j )2
δ 2= j=1
T R este dispersia totalurilor seriilor faţă de totalul mediu.
Deoarece acesta nu se cunoaşte se foloseşte estimaţia acestuia:
r
∑ ( T j−Y¯^ N j )
2
δ^ 2
¯ R−r 1
δ^ 2= j=1 V ( Y )=
^ ^ T
⋅ 2⋅
T r −1 şi obţinem: R N̄ r
Deoarece N̄ este de cele mai multe ori necunoscut acesta se va estima cu n̄ . Acest lucru va determina o
¯ ¯
deplasare a estimatorului. Se consideră că, în acest caz V^ ( Y^ ) este un bun estimator al V ( Y^ ) dacă numărul
de serii ce formează eşantionul este suficient de mare (r≥20).
√
^
δ
R −r 1 2
σ Ȳ¯ = ⋅ 2⋅ T
Eroarea medie de reprezentativitate se calculează după relaţia: R N̄ r
Estimatori şi erori în cazul sondajului de serii de talie diferită selectate după procedeul
aleator (cu revenire) cu probabilităţi proporţionale cu talia
Nj
A j=
Probabilitatea ca o serie să intre în eşantion la o extragere este: N . Deoarece, pentru formarea
N
A j=r j
eşantionului sunt necesare r extrageri probabilitatea totală unei serii de a intra în eşantion va fi: N .
r r
¯
Y^ = ∑ N j Ȳ j / ∑ N j
Estimatorul mediei se calculează pe baza relaţiei: j=1 j=1 .
¯
Pentru calcularea erorii medii de reprezentativitate este necesară estimarea dispersiei estimatorului Y^
r
¯ 1 Nj ¯ 2
V^ ( Y^ )= ∑
r ( r−1 ) i=1
( 1−r
N
(
)⋅ Ȳ j−Y^ )
care este dată de relaţia:

Tema 5

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Tema 5

Încărcat de

Drepturi de autor:

Formate disponibile

Tema 5.

Estimarea parametrilor în condițiile unui sondaj de tip cluster

R = numărul de unităţi complexe (serii) din populaţie;

r = numărul de unităţi complexe (serii) din eşantion;

N = numărul de unităţi simple (indivizi) din populaţie;

n = numărul de unităţi simple (indivizi) din eşantion;

se calculează coeficientul de determinaţie (numit şi raportul de corelaţie inter-serii) notat cu η2 .

¯^ )= R−r R−r δ^ 2 R−r 2 2

Eroarea medie de reprezentativitate se va calcula după relaţia:

Extinderea rezultatelor se face pe baza intervalului de încredere luând în considerare probabilitatea cu

Nj= numărul de unităţi simple din seria j;

Tj= totalul variabilei de interes pentru toate unităţile seriei j;

N̄ = mărimea medie a unei serii în populaţie;

Deoarece acesta nu se cunoaşte se foloseşte estimaţia acestuia:

S-ar putea să vă placă și