Documente Academic
Documente Profesional
Documente Cultură
An universitar 2016-2017
Sem. I Licenta
1
Tema 8. Eşantionarea - metode şi tehnici
1. Delimitări conceptuale privind termenii utilizaţi în
procesul de eşantionare
2. Fazele eşantionării
3. Metode de eşantionare şi criterii de alegere a lor
4. Stabilirea dimensiunii eşantionului
5. Calitatea estimaţiilor şi erori de reprezentativitate
2
1. Delimitări conceptuale privind termenii
utilizaţi în procesul de eşantionare
Eşantionarea este o tehnică de cercetare a colectivităţilor totale prin
intermediul unor părţi reprezentative ale acesteia.
3
1. Termeni cheie – delimitări conceptuale
Populaţia (colectivitatea generală cercetată) – reprezintă un grup
total ţintă de la care este solicitată informaţia. Totalitatea unităţilor
simple sau complexe care formează obiectul cercetării prin sondaj.
Se disting:
populaţii finite şi populaţii infinite.
Numărul locuitorilor ţării sau numărul studenţilor dintr-o universitate
sunt exemple de populaţie finită.
Numărul volumelor probabil ale recoltelor de grâu dintr-un anumit lan
este un exemplu de populaţie infinită.
4
1. Termeni cheie – delimitări conceptuale
O populaţie conţine diferite subpopulaţii, totodată o populaţie dată
poate fi un element al unei populaţii mai largi.
5
1. Termeni cheie – delimitări conceptuale
Eşantionul – este o mulţime de elemente selectate după anumite
criterii din populaţia întreagă pentru a fi studiate. Eşantionul
reprezintă o parte sau un număr de elemente ale populaţiei totale.
La dimensionarea eşantionului se au în vedere restricţiile de ordin:
statistic şi organizatoric.
Eşantionul se notează cu “n” cănd este format din unităţi simple
şi cu “r” când se referă la unităţi complexe. Pentru variabile
alternative, numărul unităţilor care posedă caracteristica ăn
eşantion se notează cu “m”.
Eşantionare - procesul de alegere din colectivitatea întreagă a
elementelor incluse pentru formarea eşantionului.
Scopul urmărit prin extragerea a unui eşantion dintr-o
populaţie, cu respectarea tuturor rigorilor teoriei sondajului, este
ca valorile obţinute prin prelucrarea datelor privitoare la eşantion
să poată fi generalizate asupra întregii populaţii.
Sinonimii:
Eşantion = Colectivitate de selecţie
Unitate a colectivităţii poate fi o persoană, familii, menaje,
companii, organizaţii etc.
Este important să se definească clar caracteristicile acestei unităţi.
Ex.: un supermarket poate solicita un sondaj a clienţilor efectivi sau a
cumpărătorilor. Întrucît, de regulă nu există lista nominală a
clienţilor, colectivitatea cercetată va fi identificată stabilindu-se
anumite raţiuni – posibil cei care au vizitat supermarketul şi au
făcut cumpărături.
7
1. Termeni cheie – delimitări conceptuale
Colectivitatea generală cercetată denumită şi populaţie, este
alcătuită din totalitatea unităţilor simple sau complexe care formează
fenomenul supus cercetării. Cercetarea trebuie să înceapă cu
delimitarea strictă, în timp şi în spaţiu a populaţiei.
8
1. Termeni cheie – delimitări conceptuale
Colectivitatea de selecţie (eşantion, probă, mostră) reprezintă acea
parte a colectivităţii generale de la care urmează să se culeagă datele în
scopul extinderii rezultatelor obţinute din prelucrarea acestora asupra
întregului ansamblu.
10
2. Fazele eşantionării
1. Definirea colectivităţii de studiat (planul
observării )
2. Determinarea bazei sondajului
3. Alegerea metodei de eşantionare (extracţie)
4. Stabilirea mărimii(volumului) eşantionului
5. Estimatorii şi precizia lor teoretică
11
2.1Definirea colectivităţii de studiat
(planul observării )
12
2.2 Cerinţe pentru baza sondajului
La momentul constituirii bazei sondajului este important să se
delimiteze clar:
Unitatea populaţiei
Unitatea de observare – unitatea despre care se culege informaţia
Unitatea de eşantionare – unitatea de la care se culege informaţia
13
2.2 Baza de sondaj
Eşantionul, din punct de vedere al organizării trebuie
să aibă unităţile sale simple sau complexe înscrise
într-o ordine aleatoare după un anumit criteriu:
alfabetic,
teritorial,
de timp,
etc.
care nu are nici o legătură cu rangul de mărime al
valorilor variabilelor luate în studiu.
15
3. Metode de eşantionare şi criterii de alegere a
lor
Clase de eşantioane
I. Eşantioane probabiliste (aleatorii) (probability
sample) – selecţie în care fiecare element al
colectivităţii are aceeaşi probabilitate de a fi inclus în
eşantion.
16
Procedee de selecţie a eşantionului (eşantionare)
Selecţia aleatoare - exclude orice intervenţie subiectivă a
cercetătorului în alegerea eşantionului. Acest obiectiv se poate
realiza numai dacă selectarea unui element dintr-o populaţie este
aleatoare (întâmplătoare), dacă toate elementele populaţiei au
aceeaşi şansă de a fi alese.
17
I. Metoda aleatoare de eşantionare
Sinonimii:
Eşantionare aleatoare= Eşantionare probabilistă
18
I. Metode aleatoare de eşantionare
În practică, selecţiile aleatoare (probabilistice) se realizează prin mai
multe procedee, care derivă dintr-o schemă probabilistică
corespunzătoare rezultatelor obţinute prin tragere la sorţi a unităţilor
pentru a forma eşantionul.
Selecţia aleatoare poate fi:
a. Fixă ( după planuri de sondaje simple) – presupune
stabilirea de la început a mărimii eşantionului în funcţie de
restricţiile de ordin statistic şi organizatoric. Această metodă se
poate realiza cu sau fără impunerea unor restricţii în procesul
de selecţie. Se aplică în cazul populaţiilor omogene.
b. Secvenţială (după planuri de sondaje cu mai multe etape)
– sunt extrase o serie de eşantioane succesive, până când pe
baza analizei datelor recoltate se constată că sunt îndeplinite
unul sau mai multe criterii prestabilite (stratificarea, sondajul
multistadial, multifazic, sondajul de serii, sondajul secvenţial
etc.). Se aplică în cazul populaţiilor neomogene.
21
A. Sondajul aleatoriu simplu
1. Procedeul loteriei (tragerii la sorţi) - constă în extragerea
dintr-o urnă (Bernoulli) a unor bile sau alte obiecte identice
reprezentând fiecare o unitate a colectivităţii. Se poate realiza
în două variante:
1. procedeul selecţiei aleatoare repetate (al bilei revenite/
reîntroduse);
2. procedeul selecţiei aleatoare nerepetate (al bilei nerevenite).
22
A. Sondajul aleatoriu simplu
2. Procedeul tabelului cu numere întămplătoare – aceste tabele se
alcătuiesc cu ajutorul unei maşini de amestecat numere (randomizatoare).
Plasarea numerelor este întîmplătoare, din orice parte a tabelului ar fi privite.
Este necesară numerotarea unităţilor colectivităţii generale de la 1 la N şi apoi
extragerea celor n unităţi care formează eşantionul.
Ex.:considerând că în colectivitatea generală sunt 900 unităţi şi se intenţionează constituirea
unui eşantion format din 10% (n=90) se va proceda în felul următor:
se va alege la întâmplare coloana şi rândul din coloana respectivă cu care se va începe selecţia.
Numărul respectiv şi numerele aleatoare formate din trei cifre care se vor citi pe coloana
respectivă vor fi notate dacă sunt cuprinse între 1 şi 900 şi diferă de cele reţinute anterior şi se
va renunţa la ele dacă sunt peste 900.
Se continuă în felul acesta până la formarea completă a eşantionului (90 unităţi).
23
A. Sondajul aleatoriu simplu
3. Selecţia mecanică - presupune ordonarea unităţilor colectivităţii generale
după o caracteristică oarecare (ordine alfabetică, numărul de la locuinţă
etc.) prin care să se asigure includerea pe cât posibil întâmplătoare a
unităţilor în baza de sondaj.
Ex.: pe baza unui pas - fiecare al 10-lea element, 1-ul stabilindu-se la întâmplare.
26
C. Sondajul sistematic
Metoda este numită cvasi aleatoare deoarece în momentul în care
este stabilit primul individ din eşantion este stabilit întreg eşantionul,
astfel că nu se mai respectă condiţia stabilită pentru eşantioanele
aleatoare: probabilitate egală non-nulă de selecţie pentru fiecare
subiect.
27
D. Sondajul cluster
Cluster – clusterele (ciorchini în limba engleză) adună grupuri eterogene care
sunt deja formate ca şi grupuri stabile ( şcoli, organizaţii, menaje etc). Deci, în
eşantionarea cluster, stabilim grupurile de acest tip, din care facem apoi
selecţia.
Membri grupurilor selectate constituie eşantionul.
Aceste colectivităţi de asemenea pot fi grupate, iar selecţia din acestea se
poate face, stratificat.
Ex.: Presupunem că dorim să facem o anchetă cu privire la practicarea
sporturilor la elevii de liceu. În acest caz putem să lucrăm cu o eşantionare
multistratificată de tip cluster. Stabilim că cea mai eficientă tehnică de
anchetă este cea indirectă cu aplicarea chestionarelor în colectivitate (gen
extemporal). În acest caz, obiectivul eşantionării îl vor constitui clasele
de elevi şi nu elevii înşişi. Clasele de elevi vor fi stratificate după an (a IX-a,
a X-a ...), liceu, profil sau tipul liceului (colegiu naţional, liceu teoretic, grup
şcolar). După ce se va realiza această grupare, se vor alege clasele aleator din
fiecare strat, astfel încât să se respecte proporţiile.
28
D. Sondajul cluster
Se extrag aleator grupuri de indivizi care se cercetează complet (se
extrag locuinţe, fiind intervievaţi toţi membrii locuinţei).
31
G. Sondajul Poisson
Sondajul Poisson presupune parcurgerea succesivă a
bazei de sondaj, fiecare element fiind selectat independent
de “istorie”, prin generarea unui număr aleatoriu şi
compararea cu probabilitatea de incluziune dorită.
32
H. Sondajul în trepte
Sondajul în trepte (multistadial) este un sondaj în cascadă, la
fiecare pas extrăgând-se un subeşantion din eşantionul extras
deja.
Avantaje: este utilizat când baza de sondaj este redusă, este bine
organizat, se foloseşte în redresarea nonrăspunsurilor, permite
determinarea unor erori de selecţie realiste.
Dezavantaje: nu permite calculul de volume, doar prin ipoteze
referitoare la selecţiile de la pasul 2.
33
Elaborarea unui eşantion aleator
35
II. Metode neprobabiliste de eşantionare
Sinonimii:
Metode neprobabiliste =Metode empirice
Eşantionarea dirijată (metodă empirică de eşantionare)
Este făcută de un observator, bun cunoscător al populaţiei cercetate, care
include în eşantion unităţile considerate cel mai reprezentative.
Avantaje faţă eşantionarea aleatorie: mai ieftină, se aplică pe eşantioane mici şi
când nu există sau nu este accesibilă baza de sondaj.
Principiul de includere a unităţilor în eşantion constituit prin metoda dirijată:
Fie A o caracteristică a populaţiei, cunoscută. Se presupune că, printr-un procedeu
oarecare s-a obţinut un eţantion reprezentativ pentru caracteristica A.
Atunci se admite ipoteza că acest eşantion este reprezentativ şi pentru o altă
caracteristică B, corelată în general cu A.
36
II. Metode neprobabiliste (empirice) de eşantionare
38
A. Metoda cotelor
Români Ruşi Total Români Ruşi Total
39
B. Metoda voluntariatului
Anchetele bazate pe voluntariat se aplică tot mai mult
în studiul opiniei cititorilor de presă ţi a opiniilor
persoanelor cu afinitate unor societăţi.
42
E. Metoda unităţilor tip
Se aleg unităţi considerate ca fiind reprezentative (cu o structură
similară) pentru o anumită categorie de elemente ale populaţiei.
45
4. Stabilirea mărimii(volumului) eşantionului
1. Restricţii de ordin statistic:
gradul de dispersie a valorilor caracteristicilor unităţilor
individuale ale colectivităţii;
probabilitatea cu care se garantează rezultatele; mărimea
intervalului de încredere în care se aşteaptă să se încadreze
rezultatele,
tipul de selecţie folosit.
2. Restricţii organizatorice:
fondurile băneşti alocate cercetării,
numărul şi pregătirea persoanelor ce vor efectua sondajul,
natura bazei de sondaj,
dispunerea în spaţiu a unităţilor colectivităţii cercetate,
timpul afectat cercetării etc.
( xs x ) 68,26 31,74
( xs 2 x ) 95,44 4,56
( xs 3 x ) 99,73 0,27
47
Tipuri de curbe utilizate în sondajele
de opinie
Curba în formă de J Curba în formă de L
48
Formulele de calcul a mediei şi dispersiei
Denumirea Caracteristici cantitative Caracteristici calitative
indicatorului
Colectivitatea Colectivitate Colectivitatea Colectivitate
generală de selecţie generală de selecţie
(parametrii (valori de (parametrii (valori de
populaţiei) sondaj) populaţiei) sondaj)
A 1 2 3 4
N n
x i x i
P
M w
m
i 1
Media x0 i 1
x N n
N n
n
(x x ) p p(1 p) 2w w(1 w)
N
(x x) 2 2
2
i
i 0
02 i 1
2 i 1
Dispersia N n
49
4. Stabilirea mărimii(volumului) eşantionului
Statistici implicate în estimarea reprezentativităţii:
Parametru – valoarea variabilei în populaţie – statisticile bazate
pe eşantion încearcă estimarea acestor parametri – de ex. Media
veniturilor unei populaţii.
Media pe eşantion - care estimează media din populaţie;
Varianţa - gradul de împrăştiere al caracteristicii estimate;
Eroarea de eşantionare – diferenţa dintre estimare şi mărimea
parametrului în populaţie. Erorile de eşantionare (aleatoare)
trebuie deosebite de cele sistematice, datorate unor erori în
realizarea cercetării. Cele aleatoare nu sunt datorate unor greşeli
ale cercetătorului ci variabilităţii eşantionului selectat din
populaţie.
Interval de încredere
52
4. Stabilirea mărimii(volumului) eşantionului
Dacă se notează cu „n” mărimea unui eşantion, pentru
estimarea acestuia, când caracteristica cercetată este
exprimată sub forma unor structuri, se va utiliza relaţia:
t p(1 p)
2
n
2
54
5. Principiile estimării parametrilor prin eşantioane
aleatoare
Distribuţia de eşantionare a mediei pe eşantioane este normală.
Histograma ia forma unui clopot (clopotul lui Gauss). Cu cât
numărul eşantioanelor este mai mare cu atât mai mult se apropie
distribuţia de rigorile distribuţiei normale.
C D
Varianţa populaţiei Varianţa populaţiei
Nivel de siguranţă
Eroarea selecţiei
1e.s 68% IÎ
58
Calitatea estimaţiilor
Intervalul de încredere:
Limitele intervalului de încredere:
Probabilitatea de garantare:
Pragul de semnificaţie:
Balanţa precizie –siguranţă
59
5. Erorile de reprezentativitate
Erorile de reprezentativitate specifice sondajului pot fi de două feluri:
1.erori sistematice şi 2.erori întâmplătoare.
60
5. Erorile de reprezentativitate
2. Erorile întâmplătoare de reprezentativitate pot apare chiar dacă se
respectă cu stricteţe aceste reguli. Ele derivă din însăşi esenţa metodei
de cercetare prin sondaj.
62
Erorile de reprezentativitate
În teoria selecţiei se demonstrează că dacă volumul
eşantionului este suficient de mare (pentru
fenomenele monotipice peste 40 de unităţi), mediile
de selecţie se distribuie potrivit funcţiei Gauss -
Laplace cunoscută în statistică sub denumirea de
distribuţie normală.
64
Eroarea totală a sondajului
Erorile de eşantionare – sunt erorile aleatoare de
reprezentativitate. Pentru eşantioanele neprobabiliste nu poate fi
calculată această eroare. Măsurile: eroarea medie pătratică, eroarea
medie de reprezentativitate.
Erorile bazei de sondaj – bază incompletă,înregistrări duble,unităţi
în plus, informaţii auxiliare incorecte,alterarea probabilităţii prin
înlocuiri.
Erorile de observare – determinate de operatorul de interviu.
Erorile rezultate din defecte de acoperire şi nonrăspuns
Erorile de răspuns – înţelegerea greşită a conceptelor şi definiţiilor.
Erori de procesare a chestionarului
65
Indicatorii specifici sondajelor de opinie
Indicatorul de actualitate – reflectă ponderea publicului efectiv in totalul
populaţiei, respectiv ponderea răspunsurilor (100 – non-răspunsuri).
66