08 TSOP Nonrăspunsuri

NON-RĂSPUNSURI …
• … provocate de faptul că subiecții selectați în eșantion nu participă la

cercetare: NON-RĂSPUNS DE SUBIECT (unit non-response)
• Cauze ale acestui tip de non-răspuns: non-contact; refuz de

TEHNICA SONDAJELOR DE OPINIE participare la cercetare; subiectul nu este disponibil/capabil să
răspundă
CURS #08 • Metode de soluționare: strategii de a diminua nr. de respondenți

care refuză/ nu pot fi contactați + ponderarea bazelor de date
NON-RĂSPUNSURI
• … provocate de faptul că subiecții care participă la cercetare nu răspund
la anumite întrebări: NON-RĂSPUNS DE ÎNTREBARE (item non-
response)
• Cauze … : legate de chestionar, conținutul întrebărilor
• Soluționare: metode de tratare a datelor lipsă (în stadiul analizei de

date)
NON-RĂSPUNSURI … CÂTEVA INFORMAŢII LEGATE DE ESTIMARE

ÎNAINTE DE A DISCUTA EFECTELE NON-RĂSPUNSURILOR
• Non-răspuns de subiect ==> persoane care “lipsesc” din ASUPRA C ALITĂŢII DATELOR …
cercetare (unit non-response,“missing persons”)
• Datele obținute prin cercetări de sondarea opiniei sunt folosite
• Non-răspuns de întrebare ==> valori care “lipsesc” din variabile pentru a calcula:
(item nonresponse, missing data)
• Procente … (ex.: % care ar vota cu candidatul X dacă ar fi
alegeri săptămâna viitoare; % celor care sunt de părere că
educația este importantă pentru succesul în viață, etc.)
• Medii … (ex.: durata medie petrecută pe internet, venitul lunar

mediu, etc)
• Relații între variabile (asocieri, efecte cauzale)… (ex.: relația

dintre gen și venit, relația dintre vârstă și educație)
ESTIMARE
ESTIMARE
• Datorită faptului că folosim un eșantion (reprezentativ) pentru a spune ceva
INTERVALE DE ÎNCREDERE
despre o populație …
• Valorile estimate pe baza eșantionului (statistici) se pot generaliza la nivelul • Aceeași logică este folosită și pentru discutarea mediilor,
populației (parametri) folosind un interval de încredere corelațiilor, efectelor din populație:
• Ex: în eșantion, procentul calculat al celor care declară că au încredere în
Uniunea Europeană = 33,4%. Procentul calculat în eșantion este o estimare a
• Ex.: media vârstei studenților doctoranzi în Universitatea X
procentului din populație. Folosim un interval de încredere pentru a spune estimată într-un eșantion: 31,8, cu intervalul de încredere (95%):
ceva despre procentul din populație: estimăm că procentul din populație s- [30,2 - 33,4]. Pot spune, cu un nivel de încredere de 95%, că
ar putea afla între [29,0% și 37,8%]*. Există o probabilitate mare (95%) ca intervalul 30,2 de ani - 33,4 ani include vârsta medie a
intervalul de încredere: [29,0% și 37,8%] să includă valoarea din populație. populației doctoranzilor în Universitatea X
• *Marja de eroare (Margin of error) = 4,4%. Intervalul de încredere se
îngustează (precizie mai ridicată) pe măsură ce dimensiunea eșantionului
crește.
• [Estimarea poate fi nedeplasată (“corectă”, unbiased) sau deplasată

(biased) în funcție de: eșantionare + non-răspunsuri].
ESTIMARE ESTIMARE NEDEPLASATĂ

INTERVALE DE ÎNCREDERE
• ==> Non-răspunsurile pot influența dacă eșantionul estimează
corect sau nu cifrele (procente, medii, efecte) din populație
• Aceeași logică este folosită și pentru discutarea mediilor, corelațiilor,
efectelor din populație:
• Erorile de estimare provocate de non-răspunsuri pot fi majore
==> non-răspunsurile sunt inevitabile în cercetările prin sondaj,
• Ex.: efectul educației asupra venitului în SUA într-un eșantion: 3909,58. însă este important să prevenim apariția lor în număr mare
Intervalul de încredere (95%): [3369,58 - 4449,59].
• Educația (măsurată în ani de școală) • Din cauză că nu știm ce ar fi răspuns subiecții care nu sunt
• Venitul: măsurat în $, venit anual
prezenți în sondaj, este imposibil de calculat direct cât de mari
• Interpretarea: în SUA, în medie, un an în plus de educație duce la
sunt deplasările datorate non-răspunsurilor. Un mod de analiză a
creșterea venitului anual cu aproximativ $4000. Intervalul [3369,58 -
4449,59], include, cu un nivel de încredere de 95% valori plausibile
efectelor non-răspunsurilor: simulări cu date fictive
pentru efectul existent în populație.
• Cum ajung la această interpretare? R: Modele de estimare a
efectelor (spre ex: modele de regresie) + interpretarea intervalelor
de încredere
SIMULAREA I
SIMULARE (ÎN ABSENŢA NON-RĂSPUNSURILOR)
(J.BETHLEHEM, C AP. 7)
• Simularea I : Ce s-ar întâmpla dacă toate persoanele selectate în
eșantion ar alege să participe la cercetare și să răspundă la
• Date simulate (fictive): populație de 30 000 de votanți din orașul fictiv
întrebare (nu există problema non-răspunsului)
Rhinewood
• Datele au fost simulate astfel încât în populație se observă un procent

de 39,5% de persoane care votează cu partidul fictiv New Internet
Party (NIP)
• Simularea I : Ce s-ar întâmpla dacă toate persoanele selectate în

eșantion ar alege să participe la cercetare și să răspundă la întrebare
(nu există problema non-răspunsului)
• Extrag în mod repetat (de 900 de ori) eșantioane de câte 500 de

persoane. Pentru fiecare din cele 900 de eșantioane calculez
• Procentele estimate în cele 900 de eșantioane variază între aprox.
procentul de persoane care votează cu NIP. Rezultatul : ——>
34,5% și aprox. 44,5%, cu majoritatea eșantioanelor dând
rezultate foarte apropiate de valoarea din populația inițială: 39,5%
SIMULAREA II SIMULAREA I VS. II

(ÎN PREZENŢA NON-RĂSPUNSURILOR) (EFECTUL NON-RĂSPUNSURILOR)
• Simularea II : Ce s-ar întâmpla dacă o parte din persoane refuză să participe
la cercetare. Rata de răspuns e mare printre cei care folosesc internetul și
rata de non-răspuns e mare printre cei care nu folosesc internetul
Simularea I
(toată lumea răspunde)
Simularea II
(datele sunt afectate de non-răspuns;
Rata de răspuns = 58%)
• Procentele estimate în cele 900 de eșantioane variază între aprox. • În simularea II, procentul estimat este deplasat, apar diferențe între
40,6% și aprox. 60,6%, cu majoritatea eșantioanelor dând rezultate în procentul estimat în eșantion și cel “observat” în populație. Este ceea
ce se întâmplă de obicei în prezența non-răspunsului selectiv de subiect.
jur de 50,6%, un rezultat diferit de cel din populația inițială, de 39.5%
AR PUTEA FI CREȘTEREA DIMENSIUNII EȘANTIONULUI O SOLUŢIE? RATELE DE RĂSPUNS DE-A LUNGUL TIMPULUI (SONDAJE FAŢĂ-ÎN FAŢĂ)…
RĂSPUNS: NU!
Simularea III
(datele sunt afectate de non-răspuns,
Simularea I
dar cresc dimensiunea eșantionului )
(toată lumea răspunde)
Simularea II
(datele sunt afectate de non-răspuns)
• În simularea III, procentul estimat este în continuare incorect, doar că este estimat cu mai multă precizie …
RATELE DE RĂSPUNS … (SONDAJE TELEFONICE) RATELE DE RĂSPUNS VARIAZĂ

• Pew Research Center: ÎN FUNCŢIE DE:
• https://www.pewresearch.org/methods/
2017/05/15/what-low-response-rates-
mean-for-telephone-surveys/
• Modul de colectare a datelor
• Tema sondajului
• Producătorul/finanțatorul sondajului
• Arie (mediu rezidențial)/ țară
• Sezon
• Durata chestionarului (chestionare parțial completate)
• …
CALCUAREA RATEI DE RĂSPUNS CALCUAREA RATEI DE RĂSPUNS
• Prezența și tipurile de non-răspuns trebuie prezentate în • O formulă AAPOR calculează rata de răspuns în funcție de:
documentația sondajului, împreună cu o rată de răspuns (diverse
formule, formulele standard: AAPOR) • I = nr. de cazuri (interviuri) cu răspunsuri complete
• https://www.aapor.org/Education-Resources/For-Researchers/Poll-Survey-FAQ/Response-Rates-An-Overview.aspx • P =chestionare parțial completate
• Ex. (Bethlehem, cap. 7): • NC = non-contact (non-răspuns datorat non-contactului)
• R = refuz (non-răspuns datorat refuzurilor de a participa la

sondaj)
• NA = non-răspuns datorat faptului că nu e capabil să răspundă
• O = alte motive de non-răspuns
SOLUŢIA PROBLEMEI NON-RĂSPUNSURILOR DE SUBIECT:

NON-RĂSPUNSURI DE ÎNTREBARE
EXEMPLU (DATE FICTIVE, BAZĂ DE DATE SPSS)
PONDERAREA BAZEI DE DATE
• Ponderarea = corecție a bazei de date pentru a spori gradul de reprezentativitate
• Folosește un nr. de variabile auxiliare (de obicei: gen, vârstă, educație) pentru a
apropia compoziția eșantionului de compoziția observată în populație.
Răspunsurile devin reprezentative pentru variabilele auxiliare!!! Dc. variabilele
auxiliare sunt asociate cu alte variabile din baza de date (opinii, atitudini, intenții,
etc.), atunci erorile datorate non-răspunsurilor vor fi diminuate și pentru aceste
variabile.
• Ex. de calculare a variabilei de ponderare (pt. datele fictive din Rhinewood
(ponderea = procentul din populație/ procentul din eșantion)
Weight (M)= 51.1/48= 1.07

Weight (F)= 48.9/52=0.94
NON-RĂSPUNSURI DE ÎNTREBARE PLANUL PENTRU URMĂTOARELE ÎNTÂLNIRI
SOLUŢII
• Invitat pentru cursul următor (8 decembrie)
• Metode tradiționale (rudimentare): • Prof. Dumitru Sandu - Cum recunoastem un sondaj „bun”: probleme practice
si comparatii
• Listwise deletion
• Pairwise deletion
• Pentru că au început să apară în discuție:
• Single imputation • Estimare,
• Mean imputation • Procente, medii, efecte
• Regression imputation • Intervale de încredere

• Metode moderne mai sofisticate
• Ponderi
• Multiple imputation
• Date incomplete/ lipsă
• Full Information Maximum
Likelihood (FIML) • ==> SPSS + regresie
TEMA 2: MODELUL TEORETIC PENTRU CHESTIONAR

• Modelul conceptual/ teoretic pentru chestionar (cu justificare și
contextualizare în literatura de specialitate discutată în tema
anterioară sau cu noi referințe din literatură, populația țintă, metode
de eșantionare și implementare a cercetării și metode de colectare a
datelor)
• Termen limită: 8 decembrie, sfârșitul zilei

DE CITIT:
• Lecturi pentru 8 decembrie: Bethlehem, POP, Capitolul 7:
Nonresponse
• Lecturi pentru restul semestrului (Introducere în analiza datelor): P.

Tufiș (2020), The Language of Causal Models [Unpublished
Manuscript]

08 TSOP Nonrăspunsuri

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

08 TSOP Nonrăspunsuri

Încărcat de

Drepturi de autor:

Formate disponibile

NON-RĂSPUNSURI …

• … provocate de faptul că subiecții selectați în eșantion nu participă la

• Cauze ale acestui tip de non-răspuns: non-contact; refuz de

CURS #08 • Metode de soluționare: strategii de a diminua nr. de respondenți

• Cauze … : legate de chestionar, conținutul întrebărilor

• Soluționare: metode de tratare a datelor lipsă (în stadiul analizei de

NON-RĂSPUNSURI … CÂTEVA INFORMAŢII LEGATE DE ESTIMARE

• Medii … (ex.: durata medie petrecută pe internet, venitul lunar

• Relații între variabile (asocieri, efecte cauzale)… (ex.: relația

• [Estimarea poate fi nedeplasată (“corectă”, unbiased) sau deplasată

ESTIMARE ESTIMARE NEDEPLASATĂ

• Datele au fost simulate astfel încât în populație se observă un procent

• Simularea I : Ce s-ar întâmpla dacă toate persoanele selectate în

• Extrag în mod repetat (de 900 de ori) eșantioane de câte 500 de

SIMULAREA II SIMULAREA I VS. II

RATELE DE RĂSPUNS … (SONDAJE TELEFONICE) RATELE DE RĂSPUNS VARIAZĂ

• Arie (mediu rezidențial)/ țară

• Durata chestionarului (chestionare parțial completate)

• https://www.aapor.org/Education-Resources/For-Researchers/Poll-Survey-FAQ/Response-Rates-An-Overview.aspx • P =chestionare parțial completate

• Ex. (Bethlehem, cap. 7): • NC = non-contact (non-răspuns datorat non-contactului)

• R = refuz (non-răspuns datorat refuzurilor de a participa la

• NA = non-răspuns datorat faptului că nu e capabil să răspundă

• O = alte motive de non-răspuns

SOLUŢIA PROBLEMEI NON-RĂSPUNSURILOR DE SUBIECT:

Weight (M)= 51.1/48= 1.07

• Single imputation • Estimare,

• Mean imputation • Procente, medii, efecte

• Regression imputation • Intervale de încredere

TEMA 2: MODELUL TEORETIC PENTRU CHESTIONAR

• Termen limită: 8 decembrie, sfârșitul zilei

• Lecturi pentru restul semestrului (Introducere în analiza datelor): P.

S-ar putea să vă placă și