Sunteți pe pagina 1din 5

Metode şi tehnici de eşantionare.

Organizarea unui sondaj statistic

O noţiune fundamentală în statistică este aceea de „populaţie”. Populaţia


reprezintă o colectivitate, o colecţie de unităţi statistice (subiecţi, evenimente,
fenomene) ce împărtăşesc o caracteristică comună.
Specificarea unităţilor populaţiei studiate constituie o etapă importantă în
desfăşurarea unei cercetări. În funcţie de criteriul unităţilor incluse, cercetarea
poate fi:
- cercetare totală, exhaustivă (tip recensământ);
- cercetare selectivă, a unei părţi reprezentative din populaţie (selecţie,
eşantion);
- cercetare a unei colecţii de cazuri (loturi sau grupuri)1.
- cercetare a unui caz / unitate socială (studiu de caz);

În practică, de regulă se preferă studierea eşantionul. Această opţiune oferă o


serie de avantaje:
1) costul mult mai mic;
2) operativitatea obţinerii informaţiei (timpul necesar este mult mai mic);
3) acurateţea rezultatelor (se reduc foarte mult erorile de culegere a datelor,
pentru că volumul de activitate este mai mic şi se poate folosi personal
calificat);
4) oferă posibilitatea studierii unor populaţii pentru care observaţia totală este
imposibilă (ex. populaţia fumătorilor);

Populaţia reprezintă întregul grup care ne interesează, iar eşantionul grupul


cu care lucrăm efectiv, unităţile de informaţie care sunt selecţionate pentru a fi
efectiv studiate.

Ex. dacă vrem să realizăm un studiu privind situaţia socio-familială a minorilor cu


abandon şcolar din Argeş, populaţia este reprezentată de toţi aceşti minori iar
eşantionul de cazurile selecţionate pentru a fi efectiv studiate.

Scopul studierii eşantionului nu este propriu-zis de a cunoaşte eşantionul, ci


de a cunoaşte populaţia din care acesta provine. Rezultatele obţinute pe eşantion
sunt extinse la nivelul întregii populaţii de interes2.

1
constituite printr-o manieră de eşantionare mai puţin sistematică ( „eşantionare de oportunitate”)
2
raţionamentul statistic este următorul: concluziile obţinute pe eşantion sunt extrapolate, în anumite condiţii şi
folosind anumite proceduri specializate, la întreaga populaţie
Pentru a putea face această generalizare, trebuie ca eşantionul să fie
reprezentativ pentru respectiva populaţie - să reproducă cât mai fidel structura şi
caracteristicile sale. Reprezentativitatea este cerinţa de bază pe care trebuie să o
satisfacă eşantionul.
Reprezentativitatea este o noţiune relativă, graduală, în sensul că un eşantion
este mai mult sau mai puţin reprezentativ, nu doar reprezentativ sau
nereprezentativ.

Gradul de reprezentativitate al eşantionului depinde de următoarele aspecte:


a. caracteristicile populaţiei ce urmează a fi studiate: populaţie omogenă vs.
eterogenă (nivelul dispersiei indivizilor în jurul mediei);
b. mărimea eşantionului – elemente orientative:
 mărimea eşantionului nu se determină ca proporţie din colectivitatea totală;
sporul de reprezentativitate nu este direct proporţional cu creşterea
volumului eşantionului;
 există formule teoretice de determinare a mărimii unui eşantion, care ţin cont
de nivelul probabilităţii cu care se face estimarea şi de mărimea erorilor de
estimare; acestea sunt diferite pentru variabilele numerice / nonnumerice;
c. procedura (schema) de eşantionare folosită: modul de construire, de
structurare a eşantionului; acest aspect influenţează considerabil
reprezentativitatea unui eşantion.

Procedee de eşantionare
Distincţia clasică care se face când se discută tipurile de eşantionare este între
eşantionarea aleatoare (probabilistică) şi eşantionarea nealeatoare
(neprobabilistică).

În eşantionarea aleatoare, selecţia unităţilor statistice se face „întâmplător”3,


fiecare individ din populaţie având o şansă calculabilă şi non-nulă de a fi inclus în
eşantion. Tehnicile de eşantionare aleatoare sunt:
- eşantionare simplă aleatorie: are ca prototip loteria (tragerea la sorţi); prezintă
dezavantajul că se pot extrage eşantioane nereprezentative;
- eşantionare prin stratificare: colectivitatea generală se împarte în clase (grupe,
straturi), după un anumit criteriu (ex. gen, nivel educaţional); se extrage un
subeşantion din fiecare strat, iar eşantionul final este suma acestor subeşantioane;

3
dar atenţie, este vorba de „întâmplător” în sens matematic (ex. dacă vreau să realizez un studiu pe adulţi tineri şi ies
în curtea facultăţii şi „la întâmplare” aleg 25 de studenţi, nu am constituit un eşantion aleatoriu…studenţii reprezintă
un eşantion deja selecţionat din populaţia generală a adolescenţilor)
prezintă avantajul de a asigura reprezentarea tuturor claselor în eşantion şi deci un
grad crescut de reprezentativitate al eşantionului;
- eşantionare multistadială sau grupală (sondajul de serie): se selectează grupuri, nu
indivizi (ex. aleg nu studenţi, ci grupe de studenţi); este tehnica folosită în aproape
toate cercetările concrete ce vizează populaţii extinse, pentru că presupune costuri
mai mici şi un timp mai scurt de realizare; prezintă însă dezavantajul că eşantionul
obţinut este mai puţin reprezentativ (la volum egal) decât unul simplu aleatoriu.

În eşantionarea nealeatoare (dirijată, neprobabilistică), unităţile eşantionului


sunt stabilite conform unor criterii prestabilite, obiective. Este procedura cel mai
des folosită în realizarea de anchete şi sondaje, deşi NU permite, stricto sensu,
calculul reprezentativităţii.
Cea mai cunoscută tehnică de eşantionare nealeatoare este eşantionarea pe cote.
Formal, procedeul se aseamănă cu eşantionarea prin stratificare (se folosesc şi aici,
în linii mari, aceiaşi factori de stratificare), numai că aici se indică „cote”
(frecvenţa indivizilor ce prezintă anumite însuşiri); cotele pot fi:
a. independente, ex. pt. gen: 52% F, 48% B (astfel, la 1000 persoane, vom avea:
520 F, 480 B)
b.”cote legate” (încrucişate), ex.:
B F
Urban 300 300
Rural 180 220

O modalitate de construcţie a unui eşantion naţional

1. se stabileşte volumul eşantionului; OBS. în majoritatea cercetărilor cantitative la


nivel naţional, volumul eşantionului este de 1200 subiecţi;
2. se foloseşte procedeul de stratificare, luându-se în calcul dispersia populaţiei pe
zone geografice şi medii de provenienţă:
2.1. zone geografice / euroregiuni – ex. Euroregiunile României:
 Nord-Est: Suceava, Botoşani, Neamţ, Iaşi, Bacău, Vaslui
 Sud Est: Buzău, Vrancea, Galaţi, Brăila, Tulcea, Constanţa
 Sud: Prahova, Argeş, Teleorman, Călăraşi, Ialomiţa, Giurgiu
 Sud-Vest: Olt (Craiova), Vâlcea, Gorj, Dolj, Mehedinţi
 Vest: Caraş, Timiş (Timişoara), Hunedoara, Arad
 Nord-Vest: Bihor, Satu Mare, Maramureş, Cluj, Sălaj, Bistriţa
 Centru: Sibiu, Braşov, Covasna, Harghita, Mureş, Alba (Alba Iulia)
 Bucureşti- Ilfov (Bucureşti)
2.2. tipul localităţii de domiciliu; de regulă, se disting patru categorii de localităţi:
- comune rurale;
- oraşe mici (sub 20.000 locuitori);
- oraşe mijlocii (20.000- 99.999);
- oraşe mari (peste 100.000)
OBS: Pe fiecare euroregiune, se iese din procedeul de stratificare şi se foloseşte
eşantionarea multistadială.
Se selectează 2- 3 judeţe (inclusiv judeţul regional). Apoi în fiecare judeţ se
selectează de ex. două oraşe (din care unul –reşedinţa de judeţ) şi două sate;
urbanul se împarte în “centru” şi “periferie”, iar ruralul în „centru comună” şi „sat
aparţinător”.

Trebuie acordată atenţie următoarelor aspecte:


- pe fiecare euroregiune / judeţ, se calculează ponderea fiecărei subpopulaţii4;
- pe lângă cotele pe rural / urban, există cote pe gen şi vârstă
- ponderarea pe urban - rural într-un judeţ: trebuie raportată la ponderea urban -
rural din populaţia respectivului judeţ;
- mărimea urbanelor; urban reşedinţă de judeţ nu poate avea un număr de
respondenţi egal cu urban 2- de regulă un orăşel;
- în Bucureşti trebuie acoperite toate cele 6 sectoare, atât la centru cât şi la
periferie;

3. se precizează modalitatea de selecţie a gospodăriilor / indivizilor


- ex. într-un sat, se selectează gospodăriile de pe partea dreaptă a drumului,
folosind pasul statistic 1 (casele se iau la rând); într-o gospodărie, se
selectează persoana care are vârsta de peste 18 ani şi care îşi serbează prima
ziua de naştere.

Erorile în cercetarea statistică

Acurateţea datelor este afectată de eroare.


Erorile sunt de două mari tipuri: erori de observare şi erori de reprezentativitate.
Erorile de observare (de măsurare, de culegere a datelor) sunt specifice oricărui
tip de cercetare statistică (sondaj, cercetare totală), cu menţiunea că în cazul
sondajului au o pondere mai mică (pentru că se foloseşte personal calificat pentru
culegerea datelor).

4
folosind datele din Anuarul Statistic al României
Erorile de reprezentativitate (de selecţie, de eşantionare) sunt specifice cercetării
prin sondaj. Ele vizează reprezentativitatea eşantionului (traduce faptul că
eşantionul nu reprezintă identic structura populaţiei din care a fost obţinut) şi sunt
legate de modalitatea de eşantionare. Pot fi de două tipuri:
a) erori sistematice:
- provin din acţiunea constantă a unor factori sistematici, care produce o
„deplasare” a valorilor înregistrate într-un sens sau altul (se produc într-un
singur sens);
ex. întrebând studenţii cât de des citesc cărţi, aceştia vor avea tendinţa de a
supraevalua în raportări; abordând teme sensibile (ex. violenţa în familie),
oamenii vor tinde să nu răspundă sau vor încerca să disimuleze
- afectează reprezentativitatea eşantionului într-un mod flagrant, şi de aceea
influenţează profund rezultatele

b) erori întâmplătoare:
- sunt rezultatul acţiunii unor factori aleatori; ex. la introducerea datelor, în loc
de 25 de ani la „vârsta respondentului” operatorul tastează greşit şi introduce
„23”;
- producându-se în ambele sensuri, au tendinţa să se compenseze (astfel, nu
mai influenţează rezultatele);
- nu pot fi evitate (ele există tot timpul), chiar dacă se respectă riguros
procesul de selecţie; dar: pot fi estimate probabilistic şi micşorate

Reprezentativitate şi erori de eşantionare

Reprezentativitatea este cu atât mai bună cu cât avem de-a face cu erori de
eşantionare mai mici.
În exprimarea cantitativă a gradului de reprezentativitate a unui eşantion, intervin
două entităţi:
1) eroarea maximă („d”), ce exprimă diferenţa cea mai mare pe care o
acceptăm să apară între o valoare găsită pe eşantion şi valoarea
corespunzătoare din populaţie; cu ajutorul ei, se construieşte un interval, în
interiorul căruia se va găsi valoarea căutată;
2) nivel de probabilitate sau nivel de încredere („p”); care arată ce şanse sunt
ca eroarea reală comisă, să nu depăşească limita „d”; limita minimă de
acceptabilitate este p= 0,95
Obs. cele două mărimi, d şi p, nu sunt independente; fixând una din ele, cealaltă
rezultă din calcul. Nu putem creşte simultan şi precizia estimării şi siguranţa
acesteia