Sunteți pe pagina 1din 19

Cursul 8.

Eșantionarea în cercetarea
științifică
Definiţia eşantionării
• Prin eşantionare se urmăreşte realizarea unei cercetări
reprezentative prin studierea numai a unei părţi din universul
ceretării, care alcătuieşte o colecţie statistică de unităţi
(elemente).

• Intervine în ceretări realizate prin anchetă de tipul sondajelor


de opinie publică, de marketing, de audienţă, de consum etc.,
dar şi în studiul documentelor sociale, ca şi în diverse alte
cercetări (de exemplu, se determină numărul de vizite
necesare în observaţia instantanee).

• Constă în extragerea, în condiţii specificate, a unui număr de


unităţi statistice din universul cercetării. În consecinţă,
eşantionul este un model la scară mică al universului
cercetării.
Definiţia eşantionării
• Datele obţinute din studierea eşantionului (statistică „s”) pot
fi extinse la nivelul colectivităţii totale (parametrul „p”), cu
anumite limite de variaţie, la un nivel de probabilitate
(precizie) stabilit.

• Se bazează pe două teorii statistice:


- legea numerelor mari şi
- calculul probabilităţilor.
• Legea numerelor mari (Bernoulli, Poisson) fundamentează
mărimea eşantionului (n), iar calculul probabilităţilor
reglementează selecţia subiecţilor în eşantion.
Reprezentativitatea este
dependentă de:
• mărimea eşantionulu;
• schema de eşantionare utilizată.
Reprezentativitatea (eficienţa) este cu atât mai bună cu cât
avem de-a face cu erori mai mici.

Scopurile cercetării selectice sunt acelea de :


• estimarea parametrilor (media, proporţia) ce caracterizează o
anumită caracteristică a populaţiei şi
• testarea unor ipoteze statistice despre populaţie.

Sociologul accentuează proiectarea eşantionului şi culegerea


datelor. Statisticianul este preocupat mai mult de estimări şi
informaţii.
Reprezentativitatea
eşantionului
Întrebarea de bază: Cât de mare trebuie să fie un eşantion?
Răspuns orientativ: „suficient de mare pentru a fi reprezentativ”

Teoretic – mărimea eşantionului este invers proporţională cu


pătratul erorii de eşantionare; deci, pentru a reduce eroarea la
jumătate trebuie să crească de patru ori volumul eşantionului.

Calcularea mărimii eşantionului presupune cunoaşterea


caracteristicilor distribuţiei variabilelor colectivităţii totale,
considerate crieterii de eşantionare.
ex. . ocolectivitate relativ omogenă – mărime mai mică,
eterogenă- mărime mai mare;
Reprezentativitatea
eşantionului
Probabilitatea exprimă nivelul la care se fac estimările de la eşantion la
colectivitatea totală. Eroarea de eşantionare defineşete spaţiul de variaţie a
valorilor estimate, respectiv eroarea standard a mediei sau procentului.
În practica sociologică s-a convenit ca nivelul probabilităţii cu care se fac
estimările să nu fie mai mic de 0,95 – adică valoarea estimată pentru
colectivităţile totale se situează în spaţiul de variaţie în 95 de cazuri din 100
eşantion (19 cazuri din 20).
Pragul de încredere – 0,05 probabilitatea erorii este de 5 cazuri din 100 eşantion.

• Eroarea de estimare a valorilor eşantionului este acceptată pe intervalul de


5%; altfel spus, o valoare determinată la nivel de eşantion şi estimată în
populaţia totală ia valoarea cuprinsă în spaţiul delimitat de valoarea de
eşantion  eroarea de estimare pentru o probabilitate dată.
• Ex. : partidul cu 50% notorietate în eşantion conduce la o valoare estimată în
colectivitatea totală de 49 – 51%, pentru o eroare de 1%, sau 45 – 55%, pentru o
eroare de 5%.
Câteva elemente de orientare
a eşantionării:
• pentru a obţine rezultate acceptabile nu este necesar să studiem
întreaga colectivitate, dacă este relativ mare.
La comunităţile mici, eşantionarea este neavenită. În ultimul caz
trebuie să se studieze întreaga populaţie sau loturi ale populaţiei.
• Mărimea eşantionului nu se determină ca proporţie din colectivitatea
totală
• Riscurile de eroare sunt importante, având în vedere că se studiază un
singur eşantion, comparativ cu numărul practic inabordabil de mare ce
s-ar putea constitui pentru colectivităţile mari.
ex .: colectivitate de 15 milioane – 10 000 eşantion de 1.500 persoane.
Probabilitate 0,95 – 9 500 din 10 000 să fie în limita spaţiului de variaţie,
iar în 500 cazuri să fie afară.
• eroarea de eşantionare exprimă variaţia de la un eşantion la altul! Cu
toate astea, se pot obţine estimări acceptabile ale valorilor în
colectivitatea totală cu un singur eşantion.
Mărimea eşantionării

- este rezultatul unui proces de analiză: elemente


statistice, costuri plus alte aspecte;
- normativ, valorile adecvate ale nivelului de probabilitate
şi a mărimii erorii de estimare
ex 0,95 3
Formulele teoretice de determinae a mărimii unui
eşantion sunt variabile pentru eşantionarea simplă
aleatorie şi sunt diferite:
a)variabile cantitative – când se poate calcula media (n) şi
abaterea standard a mediei ()
n=t2*2/e2
Mărimea eşantionării
b)variabile calitative (atribute) sau ori de câte ori valoarea
variabilei se exprimă în procente sau proporţii;
n=t2P(100-P)/e2
n=t2p(1-p)/e2
• t – valoarea care corespunde nivelului de probabilitate
• e – eroarea de estimare a valorii medii (sau eroarea
standard)
• P – probabilitatea
• p- proporţia
marja de eroare se stabilește în funcție de nivelul dorit al
erorii de estimare a valorilor populației totale, pe
intervalul 1-5%; recomandabil 3,2 sau chiar 1 cu o
probabiltate de 0,95; 0,97; 0,98 sau 0,99.
Tipuri de eşantioane

Criteriul principal de diferenţiere a eşantionării este legat de caracterul


probabilist (aleatoriu), respectiv neprobabilist.
Eşantion probabilist
Fiecare unitate are şansa cunoscută de a fi selectată pentru cercetare.
Datorită acestui fapt, în eşantionarea probabilistă se poate calcula
eroarea standard de estimare a nivelului unei valori obţinute în
cercetare şi astfel se pot extinde rezultatele la nivelul colectivităţii
totale. În eşantionarea probabilistă nu este posibilă estimarea de la
eşantion la colectivitatea totală.

Eşantionarea probabilistă este de două tipuri:


- Simplă – aleatorie
- Stratificată

În cazul eşantionării simple universul cercetării este tratat ca un tot


nediferenţiat. Selecţia unităţilor statistice se efectuează direct din
ansamblul universului cercetării, iar probabilitatea unei unităţi statistice
de a fi aleasă în eşantion este egală cu fracţia de eşantiona
Eşantion probabilist

- Stratificat
Se realizează o diviziune a universului cercetării în secţiuni
(straturi) semnificative determinate de numărul valorilor
variabilelor folosite drept criteriu de clasificare.
Stratificare se face pentru a asigura selecţia proporţională din
fiecare strat. Acest fapt este important când straturile sunt de
dimensiuni diferite. În eşantionarea stratificată se determină
câte un subeşantion pentru fiecare strat, eşantionul total este
suma subeşantioanelor pe straturi.
Numărul straturilor creşte pe măsura creşterii numărului de
variabile şi a numărului de diviziuni ale acestora.
Ex: stratificarea după sex, după vârstă 5-10, conturată după sex
şi vârstă ar avea 10, respectiv 20 straturi.
Eşantion probabilist

Dificultatea practicării eşantionării probabiliste se referă la:


• întocmirea listei, într-o ordine întâmplătoare (randomizate) cu toate
unităţile (membrii) din universul cercetării. La eşentioanele probabilist-
stratificate sunt necesare listele pentru fiecare strat în parte;
• costul ridicat;
• timpul necesar realizării cercetărilor.
Procedurile de selecţie probabilistă sunt cele ele:
• numerelor întâmplătoare;
• loteriei;
• pasului mecanic.
1. Procedura numerelor întâmplătoare presupune atribuirea fiecărei unităţi
statistice a unui număr, generarea unui tabel cu numere întâmplătoare.
Pentru eşantionarea simplu-aleatorie a populaţiei adulte a României ne-ar
trebui un tabel cu numere întâmplătoare din câte 8 cifre (00000001- 17 000
000).
2. Metoda loteriei (a urnei) se utilizează când numărul colecţiei din care se face
extragerea este relativ mic, de ordinul câtorva zeci. Se extrage ca la loto.
3. Metoda pasului mecanic (selecţia sistematică) se împarte universul la numărul
de unităţi şi rezultă pasul; se iau şi rezerve 10-20%.
Eşantion probabilist
• Datorită împrăştierii mari a eşantioanelor naţionale şi a lipsei codului
general de eşantionare se practică adeseori scheme de eşantionare cu mai
multe stadii. Astfel, cercetarea empirică se va concentra pe anumite zone,
iar listele cu unităţile statistice din care se face selecţia se întocmesc numai
pentru zonele respective.
• În eşantionarea bistadială se selectează mai întâi zonele (localităţile, zone în
cadrul localităţilor, cum ar fi secţiile de votare, zone de recensământ numite
clustere), iar în stadiul al doilea se selectează subiecţii de pe listele zonelor
reţinute pentru studiu. În eşantionarea cu mai multe stadii se impune să
avem informaţii despre zonele ce constituie obiect de selecţie: câte sunt, o
listă a lor, delimitări clare, indicatori sintetici de caracterizare, posibilitatea
procurării listelor cu unităţi statistice ce vor fi supuse selecţiei. În lipsa
acestor ultime liste, se poate trece la efectuarea de microrecensământuri în
zonele de referinţă. (Metoda L. Kish, dezvoltată în deceniile 6-7 la Institutul
de Cercetări Sociale din Ann Arbor, Michigan, S.U.A, pentru eşantionaea la
nivel local şi naţional.)
• „Ruta stradală” nu este schemă probabilistă, dacă strada nu a fost selectată
probabilist.
Eşantion probabilist
O altă clasificare a eşantioanelor se referă la caracterul unităţii statistice
finale de selecţie.
Aceasta poate fi constituită dintr-un singur element şi se poate vorbi de
eşantion individual, sau din mai multe elemente – eşantion de grup (cluster).
Eşantionul de grup semnifică faptul că unitatea statistică finală este un grup
care se studiază totalitate (clase de elevi dintr-o şcoală, echipe de lucru
dintr-o fabrică).
H. Blalock spunea că straturile trebuie să fie cât mai omogene în interior şi
mai diferite unele de altele, iar clusterii cât mai asemănători între ei şi cât
mai diferiţi în interior.
Ex: schema multistadială de eşantion probabilist stratificată utilizează ca şi
criterii de stratificare: provinciile istorice, mediul rezidenţial şi mărimea
localităţii urbane.
În primul stadiu se selectează localităţile, în al doilea stadiu sunt selectate
secţiie de votare din localităţile anterior selectate, iar stadiul trei îl
constituie subiecţii de pe listele electorale. În locul provinciilor istorice se
pot determina diferite arii socio-culturale (D. Sandu, Statistica în ştiinţele
sociale).
Totpop 21680974
      URBAN     RURAL  
Regiunea Aria/Judtul Mici Medii Mari Foarte mari   TOTAL
  Bc,Nt,Sv,Vn. 1.7328 0.5566 2.2514 0.0000 6.2391 10.7799
Moldova Gl, Is 0.3597 0.1942 0.0000 2.8585 3.2131 6.6255
  Bt,Vs 0.4131 0.7868 0.5307 0.0000 2.4568 4.1874
  Ag,Db,Ph 1.1985 1.0850 0.7770 1.0725 5.2039 9.3369
Muntenia Bz,Br 0.2331 0.1791 0.6191 0.9976 1.9810 4.0099
  Gr,Tr,Il,Cl,If 1.0835 1.6966 0.0000 0.0000 4.8543 7.6344
Dobrogea Ct,Tl 0.5125 0.9605 0.0000 1.4320 1.5765 4.4815
  Dj,Mh,Ot 0.9233 0.5232 0.4823 1.3957 3.7335 7.0580
Oltenia Gj,Vl 0.7270 0.4457 0.4969 0.0000 2.0228 3.6924
  Ab,Hd 1.4120 1.3042 0.0000 0.0000 1.2894 4.0056
  Bv,Sb 0.9049 0.4210 0.7144 1.3127 1.3089 4.6619
Transilvania Cj,Ms 0.6889 0.7507 0.6920 1.4665 2.3223 5.9204
  Cv,Hg 0.5362 0.6481 0.0000 0.0000 1.3463 2.5306
  Bn,Sj 0.3092 0.6650 0.0000 0.0000 1.6072 2.5814
Crisana Ar,Bh 0.8215 0.0000 0.7971 0.9530 2.3269 4.8985
Maramures MM,SM 0.7938 0.1901 1.1672 0.0000 1.8957 4.0468
Banat Cs, Tm 0.7583 0.5934 0.0000 1.4652 1.8469 4.6638
Bucuresti Buc. 0 0 0 8.8849 0.0000 8.8849
Total 13.4083 11.0002 8.5281 21.8386 45.2246 99.9998
Eşantionarea neprobabilistă
În cadrul eşantionării neprobabiliste selecţia persoanelor urmează o procedură
preferenţială (convenience) sau bazată pe experienţă (judgment).
Cea mai cunoscută schemă de eşantionare neprobabilistă este cea pe cote. În faza de
proiectare această schemă se aseamănă cu constituirea straturilor în eşantionarea
probabilistă. Diferenţa constă în faptul că la eşantionarea probabilist stratificată în
selecţia persoanelor se urmează o procedură aleatoare, la eşantionarea pe cote se
repartizează operatorilor doar numărul şi structura de realizat, urmând ca ei să facă
selecţia cu o procedură neprobabilistă.
Eşantionarea pe cote are un caracter ştiinţific. Ea permite obţinerea rde rezultate
satisfăcătoare şi la costuri mult mai mici.
Deficienţele eşantionării pe cote sunt:
- faptul că nu se poate determina eroarea de eşantionare;
- nu se pot face interferenţe de la eşantion la colectivitatea totală.
Totuşi, se pot obţine informaţii uneori mai relevante decât într-un studiu probabilist
inadecvant realizat. Dacă nu se asigură selecţia probabilistică într-o schemă astfel
definită, ca şi atunci când eroarea este inacceptabil de mare, ne conduce în fapt tot
spre situaţia unei eşantionări neprobabiliste.
În eşantionarea neprobabilistă se respectă una din cerinţele eşantionării: mărimea
eşantionului, de unde şi îndreptăţirea utilizării termenenului.
Eşantionarea neprobabilistă
Obiectivele diferite ale cercetării, urmărite într-un caz sau altul, conduc la
adoptarea unor tipuri diferite de eşantionare, cum ar fi:
• eşantioanele unice (utilizate o singură dată);
• eşantioanele panel (utilizate în mai multe cercetări).

O altă clasificare a eşantioanelor tot în fucţie de obiective este în:


• eşantioane de bază, unde se extrage un eşantion mare din care ulterior se va
elabora eşantioane reprezentative;
• eşantioane multifazice – dintr-u neşantion utilizat la un moment dat se
extrag eşantioane mai mici, pentru unele studii parţiale (Traian Rotaru,
Petre Iluţ, 1997).
Eşantionul panel serveşte la măsurarea schimbării şi la analiza sensului principal
al determinării în cazul variabilelor ce se influenţează reciproc. Avantajele
eşantionării panel sunt:
• costuri reduse (nu se mai proiectează de fiecare dată);
• informaţia obţinută cel mai adesea este mai completă şi mai sigură decât în
cadrul anchetelor sociologice unice (Chelcea, Mărginean, Cauc, 1998).
Eşantionarea neprobabilistă

Problemele eşantionului panel sunt în principal:


- participarea, adică de regulă doar 7, 8 din 10 acceptă o viitoare intervievare şi
atunci sunt probleme metodologice de genul cine sunt cei care acceptă şi cei care
refuză;
- „mortalitatea” eşantionului, în sensul că persoane îşi schimbă adresaa, îşi modifică
statutul ş.a.;
- condiţionarea – se modifică comportamentul celui care acceptă să conlucreze.
Modalităţile de corectare a eşantioanelor panel şi păstrarea reprezentativităţii sunt
în principal două:
- adăugarea de persoane selectate aleatoriu de pe o listă de rezerve,
- compararea rezultatelor cu cele ale unui eşantion alternativ.