Documente Academic
Documente Profesional
Documente Cultură
Curs 4 Metodologie - Esantionarea (2014!12!14)
Curs 4 Metodologie - Esantionarea (2014!12!14)
Esantionarea
Curs Metodologie (II) / Dragos Iliescu
Ce analizam? Pe ce date? La ce
moment?
Cattell (1966) a propus un model sintetic
Cubul de covariaii (The Covariation Chart)
Intentii:
(1) un exemplu didactic, care s ndemne
cercettorii la o gndire multidimensional atunci
cnd i planific designurile
(2) s ilustreze istoric modalitile i naterea unor noi
modele i tehnici de analiz factorial (cum ar fi
tehnicile P, O, S i T).
The Covariation Chart
Cubul covariaiilor const din trei dimensiuni, numite i
moduri:
subieci,
variabile,
ocazii.
doresc sa evaluez cum un copil reactioneaza mai mult sau mai putin
agresiv in diverse situatii
doresc sa evaluez cum emotiile placute sunt induse la angajatii din IT prin
diversi stimuli vizuali
...
Populatie, populatie-tinta, esantion
Populatie (population)
Esantion (sample)
reprezinta o proportie (o parte) din populatia de
referinta;
un subset de elemente extras din populatia generala,
care respecta caracteristicile de baza ale populatiei.
Populatie, populatie-tinta, esantion
(contd.)
Tipuri de esantionare si
reprezentativitate
Daca populatia este destul de mica incat sa o
masuram pe toata:
cercetare recensamant (census research):
Statisticienii britanici pot prezice cate persoane vor muri anul
acesta. Cei sicilieni pot da chiar si niste nume...
Sampling frame
stabilirea cadrului de esantionare
Sampling method
stabilirea metodei de esantionare
Sample size:
determinarea marimii esantionului
Review:
compararea esantionului cu intentiile, pentru a evalua generalizabilitatea
Definirea populatiei
definim populatia catre care dorim sa
generalizam rezultatele studiului
stabilim criterii de incluziune / excluziune
de ex.
liste electorale
registrul scolar
cartea de telefon
de pe strada
din gospodarii
Sampling method
1. Probability Sampling
A. Aleatorie simpla
B. Esantionare sistematica (aleatorie)
C. Esantionare stratificata
D. Cluster Sampling
2. Nonprobability Sampling
A. Quota Sampling
B. Purposive sampling
C. Accidental/Convenience Sampling
1A. Simple Random Sampling
Fiecare membru are o sansa egala de a fi extras
Avantaje
minimizeaza erorile, interpretare facila
Dezavantaje
un esantion care nu reflecta structura populatiei de
referinta
Exemplu: analiza caracteristicilor esantionului indica
faptul ca avem 54% barbati si 46 % femei biased
sample
1A. Simple Random Sampling
(contd.)
equal chance of selection
culegere a raspunsurilor de pe strada?
carte de telefon?
se rezolva cu random-digit dialing?
liste electorale?
random selection
no bias involved in the selection of the sample
Sir Ronald Aylmer Fisher
(1890-1962)
Principiul randomizarii
Studies in Crop Variation I, II, III
BRILLIANT!!!
Idee:
nu mai punem tipuri diferite de ingrasamant pe acelasi camp, in
ani diferiti
ci impartim campul in arii mai mici, ca o tabla de sah
fertility gradient pentru camp (necunoscut: tine de inclinatia solului,
diverse substante existente, umbra vs. soare etc.)
Avantaje:
Usurinta aplicarii metodei ex: posesia de automobile lux in populatia
persoanelor cu venituri peste 1000 Euro lunar.
Potentiala crestere a eficacitatii statistice (aceasta va fi cel putin la fel
de eficienta ca in cazul SRS) (Kish, 1965)
Dezavantaje:
Ex: Sampling Frame Lista persoanelor care lucreaza in cazarme
militare. Daca lista este alcatuita in ordinea gradelor poate fi extras un
esantion omogen si nereprezentativ ex: doar ofiteri cu gradul
locotenent sau maior
1C. Esantionare Stratificata
Procedura:
Stabilirea unor sub-grupe (populatii) in functie de anumite criterii
mutual exclusive.
Criteriile ar trebui sa fie relationate sau relevante pentru modelul
de cercetare.
Procedura:
Ulterior se va aplica una din tehnicile de esantionare mentionate
anterior (ex: SRS sau Esantionarea Sistematica)
1C. Esantionare Stratificata
(contd.)
Avantaje:
asigura faptul ca diferitele sub-grupuri sunt reprezentate adecvat
in structura si volumul esantionului;
asigura un grad ridicat de control asupra esantionului
minimizand erorile;
cresterea preciziei analizelor statistice;
poate facilita realizarea unor analize mai detaliate
Dezavantaje:
costuri ridicate sub aspect material
durata cercetarii
irelevanta criteriului de stratificare (ex: trasaturi de personalitate
si IQ) pot fi generate grupuri irelevante
1C. Esantionare Stratificata
(contd.)
Alocare proportionata
N total = 15000, in functie de criteriul posesia de carti
4 grupe (n1=6000, n2=4200, n3=3300, n4=1500)
Volumul esantionului = 750 participanti
Sampling fraction = 750/15000=0.05
Ex:
n1 - 6000 X 0.05 = 300
n4 - 1500 X 0.05 = 75
Varsta
18-30 ani: 29% (99 participanti)
31-55 ani: 34% (116 participanti)
56+ ani: 37% (126 participanti)
Stratificarea bivariata a unei
populatii (Gen x Varsta, %)
18-30 ani 47 51 99
Varsta
18-30 ani: 29% (99 participanti)
31-55 ani: 34% (116 participanti)
56+ ani: 37% (126 participanti)
Mediu de provenienta
urban: 59% (201 participanti)
rural: 41% (139 participanti)
Stratificarea trivariata a unei
populatii (Gen x Varsta x Mediu, %)
Masculin Feminin Total
Urban 18-30 ani 8.21 8.9 17.11
31-55 ani 33 35 68
56+ ani 36 39 74
31-55 ani 23 25 47
56+ ani 25 27 52
Total 67 72 139
Atunci cand esantionul e stratificat
(mai ales cu straturi complicate),
trebuie sa prezentati stratificarea
... si mai complicat ...
... si raportat la populatia de
referinta ...
... si uneori diferit de populatia de
referinta (argument?)
1D. Cluster Sampling
Esantionare in clustere
Procedura:
in loc sa fie esantionate elemente individuale, se vor esantiona grupuri
de elemente
Avantaje:
Costuri reduse (materiale, timp, evaluatori)
1D. Cluster Sampling (contd.)
2A. Quota Sampling
Esantionare pe cote
Principiu:
cercetatorul stabileste in mod deliberat proportiile pe care le au diferitele
grupuri (straturi) din esantion
Principiu:
un subset non-reprezentativ al populatiei, care serveste unui
scop anume
Ex:
manageri de resurse umane
nu cunoastem populatia, nu o putem specifica
vom include orice manager de resurse umane care ne sta la
dispozitie
dar ii vom cauta in mod activ
Principiu:
includem orice participant este la indemana
de ex. voluntari, sau o intreaga clasa etc.
Sample size
Cat de mare trebuie sa fie un esantion pentru ca
analizele statistice sa fie precise si valide?
Exemplu
Politician, sondaj de opinie, N=1.500.000
Parametrul de interes (proportia totala a oamenilor care il
favorizeaza)
Din esantion (n) este necesar sa se afle proportia de oameni
care il favorizeaza (p)
Datorita erorilor parametrul nu va niciodata egal cu p
Diferenta dintre parametru si p = SAMPLING ERROR
Sample size (contd.)
Teorema limitei centrale
Pe masura ce creste volumul esantionului,
distributia mediilor esantionate tinde sa se
apropie de curba normala.
Cu cat creste n, cu atat scade eroarea de
esantionare;
Power analysis
Power analysis
Sample size:
de ce avem nevoie de esantion mai mare?
avem asteptari privind cresterea fidelitatii in
rezultate
si stim ca bigger is better
insa de fapt noi avem nevoie de un esantion
adecvat pentru scopul cercetarii
pentru respingerea sau nu (cu suficienta
corectitudine) a ipotezei nule
Power analysis (contd.)
Power analysis (contd.)
Power analysis (contd.)
Power analysis (contd.)
alpha:
willingness of rejecting a true null hypothesis
probability of committing a type I error
false negative: negative pregnancy test when a woman is in fact
pregnant
alpha < .05
beta
probability of committing a type II error
false positive: positive pregnancy test when a woman is not pregnant
significance = 1 - alpha
power = 1 - beta
Power analysis (contd.)
Type I errors vs. Type II errors
raport beta vs. alpha
4:1 ratio
alpha = .05
beta = .20
power = .80
O explicatie pas cu pas a
Erorilor de Tip 1 si 2
p si dependenta lui de N
p este dependent de marimea esantionului
http://vassarstats.net/tabs_r.html
analiza apriori:
stim la ce effect size sa ne asteptam (sau
facem un educated guess)
stim cu ce alpha operam
stim cu ce beta operam
cerem sa ni se calculeze N-ul optim
Sau dupa ce este realizat studiul
analiza apriori nu ne scuteste insa de analiza reala a
studiului nostru real, dupa ce avem datele
pentru ca viata bate filmul si pentru ca nu iese nimic fix cum ne-
am propus
Ex.
in cazul politicianului, daca p=.50, n=100?
Sample size (contd.)
European Federation of Psychologists Associations (EFPA, 2006)
Dimensiunea esantioanelor normative ale testelor
Nivelul de masurare
tipul de variabila unde se face masurarea
Nivelul de analiza
tipul de variabila unde se face analiza datelor
Research question 2:
In ce masura Well-being-ul profesorilor influenteaza
achizitiile elevilor
Research question 3:
In ce masura satisfactia muncii influenteaza
productivitatea organizatiilor
Watch me!
http://www.youtube.com/watch?v=e8i6YQ9-y5E