Sunteți pe pagina 1din 4

Curs 4. Eşantion şi populaţie.

Modalităţi de eşantionare

Statistica este interesată de populaţii, de studiul legităţilor generale ale fenomenelor.

O populaţie (colectivitate statistică) reprezintă ansamblul unităţilor de informaţie care au


ceva în comun, care se află sub influenţa aceluiaşi grup de factori şi care reprezintă obiectul de
interes al studiului nostru.

Prin unitate de informaţie înţelegem nu doar o persoană (deci populaţie este nu doar
populaţia demografică), ci şi obiecte şi fenomene. De exemplu, am putea studia un aspect legat
de centrele de plasament (şi atunci unităţile de informaţie sunt centrele de plasament), sau am
putea cerceta cazurile de abandon şcolar (şi atunci unităţile de informaţie sunt cazurile de
abandon şcolar).

Acel „ceva” pe care unităţile de informaţie îl au în comun reprezintă, de fapt, una sau mai
multe variabile (caracteristici).

De exemplu, dorim a studia populaţia studenţilor Universităţii din Piteşti (UPIT) la


începutul celui de-al doilea semestru al anului universitar 2020-2021 (putem dori, de exemplu, să
vedem în ce măsură studenţii sunt satisfăcuţi de serviciile educaţionale oferite).

Putem proceda în felul următor:

 putem sta de vorbă cu toţi studenţii universităţii – lucru care se va dovedi extrem de
dificil;
 putem sta de vorbă cu unul sau câţiva studenţi de la diferite facultăţi – şi pentru fiecare în
parte să întocmim un studiu de caz;
 am putea construi un eşantion;
 putem alege un grup (lot) de studenţi la care avem acces – de exemplu, o grupă de
studenţi la care susţinem un curs.
Eşantionul. Eşantionul reprezintă acea parte a populaţiei care va fi efectiv studiată.
Populaţia reprezintă întregul grup care ne interesează, iar eşantionul grupul cu care lucrăm
efectiv, unităţile de informaţie care sunt selecţionate pentru a fi efectiv studiate.

Opţiunea studierii eşantionului, comparativ cu a studia toată populaţia, oferă o serie de


avantaje:

1) costul mult mai mic;


2) operativitatea obţinerii informaţiei (timpul necesar este mult mai mic);
3) acurateţea rezultatelor (se reduc foarte mult erorile de culegere a datelor, pentru că
volumul de activitate este mai mic şi se poate folosi personal calificat);
4) oferă posibilitatea studierii unor populaţii pentru care observaţia totală este imposibilă
(ex. populaţia fumătorilor).
Scopul studierii eşantionului nu este propriu-zis de a cunoaşte eşantionul, ci de a
cunoaşte populaţia din care acesta provine. Rezultatele obţinute pe eşantion sunt extinse
(extrapolate, generalizate), folosind proceduri de statistică inferenţială, la nivelul întregii
populaţii de interes.

Având în vedere acest deziderat, eşantionul trebuie să fie reprezentativ.

A fi reprezentativ înseamnă a fi o „copie în miniatură” a populaţiei. Reprezentativitatea


nu este de tip „totul sau nimic” (nu avem doar eşantioane reprezentative şi eşantioane
nereprezentative), ci gradul de reprezentativitate variază continuu, în funcţie de mai mulţi
factori:

 procedura de eşantionare folosită;


 mărimea eşantionului;
 caracteristica de omogenitate a populaţiei din care este extras eşantionul (după acest
criteriu, putem avea populaţii omogene sau eterogene).
!! Eşantionul nu reprezintă niciodată identic structura populaţiei din care a fost obţinut; apar
întotdeauna erori de reprezentativitate (de selecţie, de eşantionare); dar acestea se încearcă a fi
estimate probabilistic şi micşorate.

Procedurile (tehnicile) de eşantionare. Acestea reprezintă modalitatea practică de constituire


(structurare) a eşantionului. Sunt de două mari tipuri: aleatorii şi nonaleatorii.
I. Tehnicile aleatorii sau probabilistice (aleator = întâmplător) presupun ca fiecare
unitate a populaţiei să aibă o şansă egală şi nonnulă de a fi inclusă în eşantion. Sunt
de mai multe feluri:
a) Eşantionare aleatorie simplă – de exemplu, bazată pe metoda loteriei sau a tragerii la
sorţi. A se reţine că „aleator” înseamnă aici aleator în sens matematic. Astfel, dacă ieşim
în curtea facultăţii şi-i luăm „la întâmplare” pe studenţii aflaţi acolo, asta nu înseamnă că
am obţinut un eşantion aleator...
!! Metoda prezintă dezavantajul că se pot extrage eşantioane nereprezentative.

b) Eşantionare stratificată. Aceasta presupune împărţirea populaţiei pe straturi, urmată de


aplicarea selecţiei aleatorii. Poate fi:
 Eşantionare stratificată unistadială. De exemplu, dorim a studia situaţia centrelor de
plasament din România. În acest scop împărţim populaţia pe judeţe (am făcut
stratificarea în funcţie de judeţ), iar ulterior alegem aleator cinci judeţe (de exemplu) care
să fie incluse în studiu.
!! Stratificarea presupune împărţirea colectivităţii generale în clase (grupe, straturi), după un
anumit criteriu (ex. mediu de provenienţă, nivel educaţional); se extrage un subeşantion din
fiecare strat, iar eşantionul final este suma acestor subeşantioane.

!! Avantajul metodei: asigură reprezentarea tuturor claselor în eşantion şi deci un grad crescut de
reprezentativitate al eşantionului

 Eşantionare stratificată multistadială. De exemplu, dorim a studia ceva legat de studenţii


din UPIT. Împărţim populaţia totală pe facultăţi (o primă stratificare), apoi pe specializări
(o a doua stratificare), pe ani de studiu (o a treia stratificare) şi pe grupe de studiu (o
ultimă stratificare). La nivel de grupe, alegem aleator un număr de studenţi.

II. Tehnicile nonaleatorii (nonprobabilistice). Presupun intervenţia unui factor


nonaleator în selecţia subiecţilor. Iată principalele exemple:
 în orice studiu realizat la nivel naţional, studiu care să implice selecţia anumitor oraşe,
Bucureştiul va fi mereu luat în calcul (nu se „pune în urnă” împreună cu celelalte oraşe);
 Eşantionarea bazată pe disponibilitate: constă în folosirea unor subiecţi disponibili, la
care avem acces. În exemplul cu studenţii UPIT, un profesor ar putea constitui un
eşantion pe baza studenţilor săi. Numai că există riscul să obţină un eşantion nu tocmai
reprezentativ...;
 Eşantionarea pe cote. A stabili cote înseamnă a structura în avans populaţia, şi deci şi
eşantionul, în funcţie de o serie de caracteristici sociodemografice de bază (sex, categorie
de vârstă, mediu de provenienţă – rural / urban, ocupaţie etc.). Cotele pot fi folosite
separat sau împreună.
!! Eşantionarea pe cote este cea mai cunoscută tehnică de eşantionare nonaleatorie. Formal,
procedeul se aseamănă cu eşantionarea prin stratificare (se folosesc şi aici, în linii mari, aceiaşi
factori de stratificare), numai că aici se indică „cote” (frecvenţa indivizilor ce prezintă anumite
însuşiri).

În practică, cel mai adesea se recurge la eşantionarea pe cote.

A se observa că eşantionarea pe cote presupune o stratificare (se face stratificarea


populaţiei după cote) şi, în plus, selecţia subiecţilor individuali (de exemplu, selecţia celor opt
femei cu vârste de peste 30 de ani) se face aleator.

Rezultă de aici faptul că procedurile de eşantionare aleatorii şi cele nonaleatorii se pot


folosi împreună (nu se exclud reciproc) – şi, de fapt, cel mai adesea chiar aşa se procedează.

Mărimea eşantionului. Mărimea eşantionului NU se determină ca raport din populaţia totală (să
zicem, 10% din populaţie), cum s-ar putea crede, ci prin utilizarea anumitor formule, formule
care iau în calcul simultan factori precum:

 mărimea populaţiei de referinţă;


 designul şi obiectivele studiului;
 tehnica de eşantionare folosită;
 scala pe care se măsoară variabilele cercetării (variabile numerice / categoriale);
 eroarea maximă de eşantionare admisă (stabilită de obicei la ±3%);
 probabilitatea cu care se garantează rezultatele (fixată, de obicei, la 95%).

S-ar putea să vă placă și