Documente Academic
Documente Profesional
Documente Cultură
POPULAŢIE R SERII
EŞANTION r SERII
Notăm cu:
N R
1 Nj
Ȳ = ∑ Y i =∑
¯ Ȳ j
N i=1 j=1 N este nivelul mediu pe fiecare unitate simplă (individ)
unde
Ȳ j este nivelul mediu pe fiecare serie.
Estimatori şi erori în cazul sondajului de serii de talie egală selectate după procedeul
aleator cu probabilităţi egale fără revenire
Avem N1= N2=….. NR= N0. Putem calcula volumul de unităţi simple al populaţiei şi al eşantionului astfel:
N=R N0 iar n= r N0. Avem următoarele relaţii de calcul:
N R R
1 Nj 1
Ȳ = ∑ Y i =∑
¯ Ȳ j= ∑ Ȳ j
N i=1 j=1 N R j=1 este nivelul mediu pe fiecare unitate simplă;
R
∑ (Ȳ j−Ȳ¯ )2
r ¯^ )= R−r i=1
V (Y
¯^ 1
Y = ∑ Ȳ j Rr R ¯
r j=1 estimatorul mediei iar dispersia estimatorului Y^ ;
r
∑ ( Ȳ j −Y¯^ )
2
¯^ ) = R−r i=1
V^ ( Y
Rr r−1
estimarea dispersiei estimatorului Y¯^
Pornind de la regula de adunare a dispersiilor:
2 2 2
σ = {σ̄ + δ ¿varita varita vari ta¿toală din terioul dintregupe¿ grupelor¿ ,
2
2 variatia dintre grupe δ
η = = 2 ⇒ δ 2 =η 2 σ 2
variatia totală σ atunci putem scrie:
R
∑ (Ȳ¯ j−Ȳ¯ )2
¯^ ) = R−r i=1 R−r δ 2 R−r σ 2 2
V (Y = = η
Rr R R r R r
variaţia estimatorului;
r
∑ ( Ȳ¯ j−Y¯^ )
2
Unde S2 este dispersia totală a variabilei de interes iar δ^ 2 este dispersia dintre serii calculate pe baza
datelor din eşantion.
σ ¯^ =
Y √ R−r δ 2
R r
≈
√
R−r δ^ 2
R r (variabilă cantitativă);
√ √
δ δ
R−r p2 R−r w2
σ w= ≈
R r R r (variabilă calitativă).
R r
∑ ( pi − p̄)2 ∑ ( wi −w̄ )2
i=1 i =1
δ 2= δ 2=
p R iar w r −1 unde pi şi wi reprezintă ponderea celor care posedă
caracteristica în populaţie respectiv în eşantion.
Dacă s-ar fi organizat un sondaj simplu aleator fără revenire eroarea medie de reprezentativitate s-ar fi
calculat după relaţia:
√ √ √
RN 0 −rN 0 S 2
√
2 2 2
N−n σ N−n S 1 R−r S
σ Ȳ SAFR = ≈ = =
N n N n RN 0 rN 0 N0 R r
σ Ȳ¯ =
√ R−r δ 2
R r
≈
R r√
R−r δ^ 2
=
R−r S 2 2
R r
η
√ σ Ȳ <σ Ȳ SAFR ⇒ η2 <
1
N0
În consecinţă putem spune că dacă dorim ca eficienţa sondajului de serii să fie cât mai mare este necesar
să împărţim populaţia în serii de dimensiuni mici iar coeficientul de determinaţie să fie cât mai mic posibil.
Y¯^ − Δ ¯^ < Ȳ¯ < Y¯^ + Δ ¯^ w̄−Δ w̄ < p< w̄+ Δw̄ (variabilă calitativă)
Y Y (variabilă cantitativă);
Estimatori şi erori în cazul sondajului de serii de talie diferită selectate după procedeul
aleator cu probabilităţi egale fără revenire
Notăm cu:
r
∑ ( T j−Y¯^ N j )
2
δ^ 2
¯ R−r 1
δ^ 2= j=1 V ( Y )=
^ ^ T
⋅ 2⋅
T r −1 şi obţinem: R N̄ r
Deoarece N̄ este de cele mai multe ori necunoscut acesta se va estima cu n̄ . Acest lucru va determina o
¯ ¯
deplasare a estimatorului. Se consideră că, în acest caz V^ ( Y^ ) este un bun estimator al V ( Y^ ) dacă numărul
de serii ce formează eşantionul este suficient de mare (r≥20).
√
^
δ
R −r 1 2
σ Ȳ¯ = ⋅ 2⋅ T
Eroarea medie de reprezentativitate se calculează după relaţia: R N̄ r
Estimatori şi erori în cazul sondajului de serii de talie diferită selectate după procedeul
aleator (cu revenire) cu probabilităţi proporţionale cu talia
Nj
A j=
Probabilitatea ca o serie să intre în eşantion la o extragere este: N . Deoarece, pentru formarea
N
A j=r j
eşantionului sunt necesare r extrageri probabilitatea totală unei serii de a intra în eşantion va fi: N .
r r
¯
Y^ = ∑ N j Ȳ j / ∑ N j
Estimatorul mediei se calculează pe baza relaţiei: j=1 j=1 .
¯
Pentru calcularea erorii medii de reprezentativitate este necesară estimarea dispersiei estimatorului Y^
r
¯ 1 Nj ¯ 2
V^ ( Y^ )= ∑
r ( r−1 ) i=1
( 1−r
N
(
)⋅ Ȳ j−Y^ )
care este dată de relaţia: