Documente Academic
Documente Profesional
Documente Cultură
Metode de redresare a
eantioanelor. Ameliorarea
calitii informaiilor
obinute din sondaje
Drd. Alina BARBU
Academia de Studii Economice din Bucureti
Abstract
Cercetrile statistice prin sondaj, orict de bine proiectate, se
confrunt deseori cu faptul c structura eantionului rezultat nu reproduce
ntocmai structura colectivitii studiate. Pentru a obine estimatori mai
exaci ai variabilelor de interes se pot folosi mai multe metode de redresare
a eantioanelor. Cele mai comune sunt: post-stratificarea, estimarea prin
raport i estimarea prin regresie. Metodele de redresare pot fi aplicate
nainte sau dup colectarea datelor i ofer estimri mai bune ale
parametrilor de interes.
Cuvinte cheie: redresarea eantioanelor, ponderare, poststratificare, estimator prin regresie, estimator prin raport
***
Prin sondajele statistice se analizeaz diferite eantioane pentru a
descoperi caracteristicile colectivitii generale. Calitatea rezultatelor depinde
adeseori de gradul de reprezentativitate a eantionului n raport cu ntreaga
colectivitate. Rezultatele obinute n urma utilizrii unui sondaj statistic pot fi
ameliorate prin integrarea n formulele estimatorilor a informaiilor auxiliare.
Procedeul este frecvent denumit redresarea eantionului.
Necesitatea de a ajusta eantionul obinut este unul dintre aspectele ce
caracterizeaz cercetrile sociale i economice, deoarece rspunsurile obinute
nu pot fi controlate n totalitate i se ntmpl adesea s nu reproduc fidel
proporiile corespunztoare din totalul colectivitii (cunoscute apriori).
Metodele de redresare constau n ponderarea unitilor din cadrul
unui eantion astfel nct anumite variabile s coincid cu valorile externe
fiabile, ca de exemplu datele statistice obinute n urma unui recensmnt.
Romanian Statistical
Review nr. 7 / 2010
Cercetri statistice
selective
R = coeficientul de proporionalitate;
i = eroarea care nu poate fi controlat (nu depinde de Xi)
Relaia poate fi aplicat pentru toate unitile din cadrul colectivitii,
N
i 0
numai dac R =
i 1
X
n cazul n care extragerea este aleatoare simpl i erorile i se
compenseaz ntre diferii indivizi din cadrul eantionului:
Revista Romn de
Statistic nr. 7 / 2010
i 0 Yi RXi 0
is
Rx 0
is
Relaia
is
YR
=y
rezonabil pentru Y .
realizeaz o estimare
(~ )
Estimatorul
R
poart numele de estimator raport sau coeficient.
A estima cu ajutorul unui raport nseamn a redresa n funcie de variabila X
cnd exist un eantion care nu este reprezentativ n raport cu aceast
variabil.
Fiecrei uniti care face parte din eantion i corespunde o pondere
Y
1 X
X
~
deoarece Wi (s )Yi = y = YR .
n x
x
is
~
- Este uor deplasat. Eroarea este redus dac eantionul este mare; n
~
cazul n care eantionul este mic, YR poate fi puternic deplasat i trebuie s fie
utilizat cu reinere.
n cazul sondajului aleator simplu:
f
Deplasarea Y
Sx
Sx
Sy
X Y
X
S X SY
SX 2
fiind panta
~
- Dispersia lui Y R este stabilit cu aproximaie numai n cazul n care n
este de volum mare. n cazul unui sondaj aleator simplu (cnd n este mare),
aceasta este: V
Y 1 f S 2 n
R
Romanian Statistical
Review nr. 7 / 2010
Cercetri statistice
selective
R Xi ;
i i
S
unde
1
S
Yy
= dispersia pentru
i 2 .
1 i1
Pentru a estima dispersia n cazul n care sondajul este aleator simplu
trebuie s se nlocuiasc S 2 printr-un estimator nedeplasat s 2 calculat
pentru volumul eantionului.
Parametrul R care apare n relaia lui i
f 2
y
1
n 1 is
x
n
x
n
estimator: R
1 f
V YR
Y1
Xi
de X i i s verifice relaia:
0.
i1
N X i
i ) sunt:
i1
i1
a Y bX
N X i
X 2
Revista Romn de
Statistic nr. 7 / 2010
Cercetri statistice
selective
:
R
e
z
u
l
t
b=
(X i x )(Yi y)
is
(X i x )2
i=1
Estimatorul
= y b
REG
= y +b (X
x) =
este: YREG = y +b
is
is
Prin urmare, se poate aproxima
~
b
Performane
nu este
le statistice
cunoscu
de precizie
t
i
ale
estimatorului
trebuie
estimat.
YREG :
Un
1Este
estimato
r logicpuin deplasat n
pentru b cazul eantioanelor
este
mari (n 30); iar
obinut pentru
eantioane
prin
mici exist riscul
nlocuir obinerii
unor
ea
estimri
puin
expresiil
precise.
or
la
2n
nivelul
n
care
colectivi cazul
eantionul este mare,
tii
(necuno dispersia poate fi
scute) determinat conform
prin
relaiei:
expresiil
e
D YREG
similare
calculat
e
la
1 Yi
nivel de
a
eantion
b
W (s )Y Wi (s )=
i
~ (X
global pentru Y
tipul:
estimatorul obinut cu ajutorul regresiei.
Y
c
REG
este un estimator liniar, respectiv de
:
fiecare unitate fiind ponderat prin Wi(s). Se poate scrie c:
~
1
Y
Wi (s )Yi ,
+Xx
(
is
(X
(X
1
S
f
2
S , unde
n
x )-
N 1 i1
Romanian
Statistic
al
Review
nr. 7 /
2010
Cercetri statistice
selective
N X i X Yi Y
i 1
i 1
i 1
X i X 2 Yi Y 2
DYREG 1
D y
b,
^ ^
i Yi a bXi ; cu i 0
is
Rezult c D YREG
1 f
n
Yi a bXi
^
^
^
^
n 1 is
Y.
P N p y p
POST
este un estimator
p1
Np
p=1
yp.
np
=n.
p=1
~
1
2
2
.
V YPOST
Sh
S p
n h1 N
n h1 N
En p
V np
En
Cercetri statistice
selective
Metoda liniar
1 (x 1)2 , x
G(x )= 2 R
( R )
F (u ) = 1 +u
Metoda raking-ratio
(> 0 )
F (u ) = exp u
Metoda logit
xL
1 L
G(x ) = (x L)log
+ (U x)log
Ux 1
U 1 A
dac
cu A = (
)(
1 LU 1
F u LU 1 U 1 L exp Au L,U
U 1 1 L exp Au
G(x )=
1
2
2 (x 1)
dac L x ,U ( altfel)
F (u )=1 +u [L , U ]
Concluzii
Opiuni pentru una din cele patru metode uzuale folosite de
CALMAR. Se pot formula urmtoarele aprecieri:
1
Metoda liniar este cea mai rapid, converge totdeauna dup
dou iteraii; poate conduce la ponderi Wp negative, ceea ce nu satisface totdeauna
responsabilul de anchet. Ponderile nu sunt mrginite superior i raportul ponderilor
Wp/dp poate lua valori pe care statisticianul le poate considera ridicate.
2
Metoda raking-ratio conduce la ponderi totdeauna pozitive,
dar nemrginite superior, n general superioare (pentru ponderile cele mai
mari) celor obinute prin metoda liniar.
Romanian Statistical
Review nr. 7 / 2010
Cercetri statistice
selective
X p .
p=1
(d p X p ) X
ps
eantion s,
(W p X p )= X 3
ps
INS, 2002.
1Andrei, T., Stancu, S., Pele, D.T., (2002), Statistic. Teorie i aplicaii,
Editura Economic, Bucureti
2Aragon, Y., Bertrand, S., Cabanel, M., Le Grand, H., (2000),
o
Mthodes d`enqute par Internet: Leons de quelques expriences, Dcision Marketing, N
19,
3Coran, N., Rousseau, S., (2005), Redressement et calage de l`enqute
Sant 2003, Document INSSE, Methodologie Statistique, Paris
4Deville, J., C., Till, Y., (2005), Variance approximation under
balanced sampling, Journal of Statistical Planning and Inference, 128, 2,
5Deville, J. C., Srndal, C. E., (1992), Calibration approach estimators
o
in sampling, JASA, N 418,
6Estevao, V. M., Srndal, C. E., (2006), Survey Estimates by Calibration
on Complex Auxiliary Information, International Statistical Review, vol. 74, Nr. 2,
7Goga, C., (2008), Variance estimators in survey sampling, math.ubourgogne.fr., 16 decembrie
8Isaic-Maniu, Al., (2001), Tehnica sondajelor i anchetelor, Editura
Independena Economic, Brila
9-
Bucureti
Romanian Statistical
Review nr. 7 / 2010