Documente Academic
Documente Profesional
Documente Cultură
Metoda const n nlturarea tuturor unitilor ce conin valori lips. Este considerat una din cele mai
utilizate metode n special pentru sondajele ce nu necesit asigurarea unui nivel ridicat de reprezentativitate.
Aceast metod presupune c dac n momentul aplicrii unei metode de analiz pentru un set de variabile
exist uniti ce conin valori lips acestea vor fi nlturate.
Dei este frecvent utilizat si permite aplicarea imediat a metodelor de analiz aceast metod prezint
urmtoarele dezavantaje:
1. n primul rnd, odat cu tergerea unitilor ce conin valori lips mrimea eantionului disponibil se
reduce simitor fapt ce determin o scdere a preciziei estimaiei;
2. este posibil ca indivizii crora le corespund valorile lips (ce urmeaz s fie nlturai din baza de
date) s fie foarte diferii de cei rmai. Acest lucru va face ca estimatorii rezultai s fie puternic
deplasai;
3. n schemele sondajelor complexe fiecrui individ i este atribuit o greutate (pondere) ce poate
reflecta printre altele i probabilitatea cu care a fost selectat unitatea. tergerea din baz a unitilor
ce conin valori lips este foarte probabil s invalideze schema de ponderare.
-
Metoda imputaiilor
Metoda imputaiilor este o metod empiric foarte frecvent utilizat pentru tratarea non-rspunsurilor
pariale.
Notm cu yij rspunsul pe care l d individului i din eantionul E la ntrebarea j (i=1,..,n, j=1,... ,p).
Concentrndu-ne asupra individul i din eantion constatm c vectorului (yi1, ...., yip), format din rspunsurile
la ntrebrile din chestionar, i lipsesc unele componente (non-rspunsurile). Fiecare poziie de coordonate (i,j)
trebuie tratat separat, prin crearea unei valori y ij numit valoare atribuit sau imputaie. Aceast
nlocuire se poate face sub urmtoarele forme:
Imputaia deductiv se refer la acele situaii (rare n practic) n care se poate stabili valoarea corect
1.
printr-o deducie logic. Este vorba de o modalitate determinist de a corecta datele incorecte sau nevalidate. n
acest caz yij = yij.
Imputaia predictiv prin mediere global se realizeaz nlocuind non-rspunsul de pe poziia (i,j) cu
2.
media rspunsurilor care au fost obinute la ntrebarea j. n acest caz avem:
r
y'ij y r, j y ij r
i 1
y'ij y rjt y ij k
i 1
unde t ia valorile 1,..,q iar k este numrul de respondeni din clasa respectiv.
unde y este variabila ce urmeaz a fi imputat pentru valorile date ale variabilelor x i, i=1,,k corelate cu
variabila y.
Imputaiile obinute n aceast manier sunt superioare celor provenite n urma aplicrii metodelor
prezentate anterior, deoarece ea se armonizeaz cu restul nregistrrilor individului respectiv. Aplicarea acestei
metode permite obinerea unui estimator nedeplasat al mediei i nu subevalueaz dispersia acestuia.
Metoda imputaiilor multiple. Metodele de imputaie prezentate anterior prin care se nlocuiete
8.
valoarea lips cu o singur valoare prezint dezavantajul c nu ia n consideraie incertitudinea cu privire la
aceast valoare lips. Acest dezavantaj este nlturat de ctre metoda imputaiilor multiple introdus de Rubin la
sfritul anilor '80.
Metoda const n umplerea fiecrei celule corespunztoare unei valori lips cu una, dou sau mai multe
imputaii i analizarea fiecrui set de date. Combinnd rezultatul acestei analize cu rezultatul inferenei
statistice vom lua n consideraie i nivelul de incertitudine introdus de valorile lips.
C Reselecia pentru non-respondeni
Este o metod utilizat pentru tratarea non-rspunsurilor totale. Dac timpul i bugetul alocate sondajului
permit, se poate face o reselecie pentru non-respondeni. mprim n mod formal populaia de volum N n
dou straturi: cel al respondenilor de volum N1 i cel al non-respondenilor de volum N2. Organizm sondajul
ca o selecie n dou faze.
n prima faz se construiete eantionul E de volum n. Eantionul va conine n 1 respondeni ai
subeantionului E1 i n2 non-respondeni ai subeantionului E2. Variabila aleatoare w1=n1/n este un estimator
nedeplasat al lui p1=N1/N (ponderea respondenilor).
Presupunem c parametrul de interes este media Y . Pe baza subeantionului E1 putem calcula un estimator
asociat primei faze:
n1
y 1 y i n1
i 1
n a doua faz a sondajului formm un eantion E2 de volum m prin selecie aleatoare fr revenire din
E2. Prin eforturile fcute de operatorul de sondaj i prin eventuale recompensri eantionul va conine doar
respondeni. Putem acum calcula un estimator asociat celei de a doua faze:
m
y2 yi m
i 1