Documente Academic
Documente Profesional
Documente Cultură
Esantionarea
Esantionarea
1
populaţie (cu ocazia recensămintelor, de exemplu, iar atunci ne oprim la chestiuni de
suprafaţă, pe baza unor formulare simple). Când vrem să cunoaştem comportamentul
electoral al ieşenilor, de exemplu, populaţia va fi compusă din toate persoanele cu drept de
vot (mai mari de 18 ani). În acest caz vom apela la listele electorale pentru a alege persoanele
din eşantion (spunem că avem o bază de date, o bază de sondaj etc.) Sociologia apelează la
listele diferitelor contabilităţi, ale direcţiilor de personal, la cărţile de telefon etc. (de
exemplu, la ora actuală se utilizează pe scară largă sistemul CATI - chestionarea prin telefon
asistată de calculator).
Construim eşantionul reprezentativ căutând să respectăm cerinţa de a da fiecărui
membru component al populaţiei vizate aceleaşi şanse de a face parte din el. Deci, dintr-o
populaţie putem extrage eşantioane diferite, de reprezentativitate diferită; media mediilor
eşantioanelor se va apropia mai mult de media populaţiei. Reprezentativitatea unui eşantion
creşte odată cu numărul oamenilor cuprins în el, dar sporul de reprezentativitate nu este
direct proporţional cu creşterea volumului eşantionului; dependenţa aceasta nu este liniară, ci
are forma unor curbe particulare:
100 Reprezentativitate
0 A B N
Mărimea
eşantionului
Dacă avem “un eşantion cu 0 indivizi” şi unul cu toţi indivizii populaţiei, curba care
leagă punctele va creşte rapid la valorile mici ale lui n (volumul eşantionului) şi va ajunge
rapid în apropierea plafonului reprezentativităţii care se atinge când n coincide cu N (volumul
populaţiei). J.Stoetzel a arătat că pe măsură ce se cumulează datele pe sute de indivizi,
variaţiile de răspuns devin tot mai mici: reprezentativitatea atinge repede un nivel ridicat, iar
2
o creştere suplimentară a numărului de indivizi în eşantioane nu mai aduce mare spor de
reprezentativitate.
Procente
Date succesive Procente de “Da”
cumulate
1 68 68,0
2 55 61,5
3 62 61,6
4 66 62,8
5 64 63,0
6 61 62,7
7 74 64,3
8 75 65,0
9 69 66,0
10 69 66,3
11 77 67,2
12 68 67,3
13 69 67,4
14 67 67,4
3
mărimea V* din eşantion se apropie de cea adevărată din populaţie, de care diferă cu o
mărime calculabilă.
Vom nota cu d eroarea maximă (care exprimă diferenţa cea mai acceptată între V* şi V),
cu P nivelul de probabilitate sau nivelul de încredere (care exprimă şansele care sunt ca
eroarea reală comisă atunci când aproximăm pe V prin V* să nu depăşească pe d; cu alte
cuvinte, determinând o valoare V* pe eşantion, cu ajutorul erorii maxime, d, vom construi un
interval (v*-d,v*+d) în interiorul căruia se va situa valoarea căutată, V,din populaţie).
Reprezentativitatea unui eşantion este dată de cuplul (d,P). Nu putem vorbi însă de
reprezentativitatea unui eşantion în general, ci doar în raport cu o anumită caracteristică (de
ex., un eşantion poate fi reprezentativ în raport cu vârsta, un alt cuplu (d,P) poate fi
reprezentativ în raport cu nivelul de instruire etc.). Un eşantion este mai mult sau mai puţin
reprezentativ, nu doar (ne)reprezentativ.Dacă avem construite două eşantioane şi dacă într-
unul d este mai mic, acel eşantion este mai reprezentativ decât celălalt, ca şi în cazul în care
P este mai ridicat în acel eşantion. În cercetarea sociologică se acceptă că o anumită eroare
este “suficient de mică”, sau că o probabilitate este “suficient de mare” pentru ca un eşantion
să fie bun. Pentru nivelul de probabilitate, P, valoarea minimă acceptată este de 0,95 (adică
şansele de a greşi estimarea nu trebuie să depăşească 5%); probabilitatea de a greşi se
notează cu p, complementar lui P: (p=1 – P). Spunem că un eşantion este reprezentativ
dacă în raport cu caracteristicile cercetării, eroarea d este sub o limită acceptabilă, iar p se
află sub 5%, adică P este de cel puţin 95%.
Eşantionarea poate fi: probabilistică (aleatoare) şi neprobabilistică (nealeatoare). Fiind
vorba de cercetări pe subiecţi umani, condiţiile de alegere a eşantionului nu sunt ideale (ca
atunci când alegem un număr de becuri dintr-un lot pentru a le face controlul tehnic de
calitate). În cazul cercetărilor sociologice, facem o selecţie aleatoare atunci când eliminăm
orice intervenţie subiectivă, orice factor sau condiţie care ar favoriza pe unii şi ar defavoriza
pe alţii la alegerea lor în eşantion (de ex., dacă vrem să aflăm opinia ieşenilor în raport cu o
problemă de maxim interes pentru toţi locuitorii şi vom ieşi în faţa Universităţii la ora 10 şi
50 de minute pentru a lua “la întâmplare” un număr de membri în eşantion, se poate ca el să
nu fie reprezentativ, fiindcă cele mai mari şanse de a fi cuprinşi le vor avea studenţii,
profesorii, locuitorii din Copou , nu şi alte categorii, straturi ce alcătuiesc populaţia oraşului.
Tipul de eşantioane aleatoare cere ca fiecare membru component al populaţiei să aibă şanse
calculabile egale şi nonnule de a fi ales în eşantion.
4
Cea mai simplă este eşantionare aleatoare se poate face prin procedeul loteriei, al
tragerii la sorţi, ca şi prin procedeul “numerelor aleatoare”(există tabele cu numere formate
din 4,5,6... cifre aranjate pe coloane, alcătuite prin diferite mijloace; la ora actuală există
programe pe computer care fac astfel de numere şi extrag şi indivizii pentru eşantion în baza
unei liste pe care am introdus-o; aşadar, avem o listă cu persoanele unei populaţii şi aceste
tabele; dacă avem de ales sute de persoane, vom merge pe coloane şi vom lua din liste
indivizii cu numerele aflate în aceste coloane; ex. 312, 011, 005... etc., din: 900312, 014011,
625005 etc.). Eşantionarea din straturi pleacă de la criteriul caracteristicilor care împart
populaţia în mai multe straturi cu efective: N1, N2, N3, ……, Nn (care însumate vor da N,
efectivul populaţiei). În acest caz, eşantionul n, îl vom construi în etape, selectând
eşantioanele: n1, n2, n3, ……., nn din fiecare strat, proporţionale cu mărimea straturilor
respective (fiecare proporţie din eşantion reproduce proporţia corespunzătoare din populaţia
stratului). De fapt, se pleacă de la un criteriu a cărui distribuţie este cunoscută, pentru a
exprima distribuţia altei caracteristici pe care nu o cunoaştem dar care se corelează cu
prima. În practica cercetării sociologice se utilizează stratificarea multiplă (prin împărţirea
populaţiei după: sex, vârstă, nivel de şcolarizare, loc de rezidenţă, statut matrimonial etc,
adică variabilele factuale care surprind situaţia obiectivă a unui individ în viaţa socioumană
cotidiană a unei societăţi şi care au influenţă semnificativă asupra opiniilor, atitudinilor,
comportamentelor lor). Un eşantion obţinut prin eşantionarea aleatoare din straturi are o
reprezentativitate mai mare decât unul obţinut prin eşantionarea aleatoare simplă. Dar, dacă
vom avea de făcut comparaţii între caracteristicile diferitelor subpopulaţii, straturi etc., de
exemplu, pentru a vedea cum votează cei cu patru clase şi cei cu douăzeci, cei de la sate în
comparaţie cu cei de la oraşe etc., dacă ponderile acestor straturi în populaţie sunt diferite,
unele fiind mai mici ca altele, atunci subeşantioanele aferente vor fi şi ele mai mici, ceea ce
înseamnă că îşi pot pierde gradul de reprezentativitate rezonabilă; în aceste cazuri se poate
încălca principiul egalităţii şanselor de a intra în eşantion şi vom lua un număr care să asigure
şi reprezentativitatea acestor straturi, având grijă ca la calculele valorilor de ansamblu să
ponderăm valorile parţiale la nivel de strat.
Să spunem că avem de investigat opiniile electorale ale populaţiei judeţului; este uşor
să ne imaginăm dispersia teritorială a eşantionului pe care îl vom alege; adică, în mod normal
ar trebui să luăm din fiecare localitate un număr semnificativ de locuitori, un număr de
persoane pentru eşantionul în volumul pe care ni l-am propus. Operatorii de teren ar avea de
străbătut distanţe enorme, cu cheltuieli mari etc. Există posibilitatea de a ocoli aceste
5
neajunsuri, cu mari avantaje pe planul costurilor, timpului, promptitudinii. Care este ideea de
bază? Populaţia ţării este grupată în judeţe; deci, într-un prim stadiu am alege un eşantion
reprezentativ de judeţe. Un judeţ are un număr de localităţi (un alt stadiu ar consta în alegerea
unui eşation reprezentativ de localităţi). O localitate se compune din mai multe cartiere,
străzi, uliţe etc.; vom alege eşantioane reprezentative. Ajungem la gospodării (case,
apartamente la bloc etc.) - din care alegem eşantioane reprezentative - şi la membrii acestor
gospodării, din care vom lua câte una sau mai multe persoane. Trebuie să fim atenţi la
riscurile de a comite erori de eşantionare; dacă, de pildă, vrem să aflăm opţiunile electoratului
român şi într-un prim stadiu vom alege 5 judeţe din 42, toate din Moldova, estimarea va putea
fi sortită eşecului ( putem consulta mai întâi hărţi electorale anterioare pentru a vedea tradiţia
opţiunilor politice şi apoi vom alege judeţele, localităţile cuprinse în aceste arii de opţiuni ).
Uneori sociologii pot apela la eşantioane de voluntari (eşantioane de cazuri exemplare,
pentru cercetarea unor teme delicate).
Cercetările pe eşantioane implică o anumită incertitudine. De aceea spunem că prin
cercetare estimăm pe V din populaţie. “Vizibilitatea” variabilelor de cercetat nu este
uniformă. Există întotdeauna o cifră neagră (dark number) care rămâne necunoscută, adică
există o diferenţă între cifra reală de, să spunem, “copii victimizaţi”, “prostituate” etc. şi cea
rezultată din cercetare. Diferenţa poate proveni chiar de la definirea dată, de exemplu,
“copiilor victimizaţi”: sunt cei brutalizaţi fizic? Psihic? Cei neîngrijiţi de părinţi? Cei violaţi?
Victime ale incestului? Ale pedofiliei?
Pe parcursul dezvoltării cercetărilor sociologice s-au pus la punct tehnici statistico-
matematice care permit să apreciem cât de nimerită, adecvată, bună etc. este o estimare.
Fie x o caracteristică definită pe populaţia N. Urmărim să estimăm valoarea medie a
acesteia pe un eşantion n. Să presupunem că o aşezare are 2000 de gospodării; avem de făcut
o cercetare privind “pragul de sărăcie” şi la un moment dat vrem să analizăm consumul
diferitelor produse; având în vedere, de exemplu, configuraţia celor două drumuri
perpendiculare din aşezare şi a numărului de gospodării, putem alege un număr de 50;
aplicăm metoda pasului (2000 : 50 = 40) pentru a le identifica şi investiga; luăm contact cu
fiecare familie şi: înregistrăm consumurile pe o perioadă (de ex., o lună); facem media
consumului (x); facem calculul abaterilor faţă de medie (xi - x);
-facem calculul pătratului abaterilor de la medie
6
1 3 0,5 0,25
2 1,2 -1,3 1,69
3 2,9 0,4 0,16
…………………………………………………………………………………
50 2,5
media este 2,5; acesta a fost un eşantion în care media a fost x’1, dar putem lua şi altele
în care mediile vor fi: x’2, x’3, x’4, ……., x’n ; diferenţa x’-x va însemna eroarea pe care o
comitem atunci când investigăm un eşantion n şi nu întreaga populaţie, N. Deci, în general,
pentru estimarea valorilor medii este important să ne asigurăm că extragem mai multe
eşantioane din populaţia investigată şi le supunem pe rând cercetării pe tema noastră; vom
obţine un şir de valori medii ale caracteristicii urmărite (de fiecare dată când am alcătuit
eşantionul, unii indivizi din populaţie pot apare în eşantioane diferite ): x1, x2, x3, ………..,
xk. Aceste valori medii de eşantioanare vor forma o valoare medie x’, distribuţia de
eşantionare; media caracteristicii din eşantion coincide, “se va suprapune” peste cea din
populaţie (sau mai exact spus, media mediilor tuturor eşantioanelor pe care le putem extrage
din populaţie, va “cădea” peste media din populaţie); abaterea standard a variabilei x’ este de
n ori mai mică decât abaterea standard a variabilei x din populaţia N; notăm cu e abaterea
standard a variabilei x’ din eşantion şi o numim eroare standard:
e = σ x n ; distribuţia valorilor variabilei x’ urmează o curbă normală (curba lui
Gauss); de obicei spunem că abaterea standard a variabilei din populaţie este suficient de
bine aproximată de abaterea standard a aceleiaşi variabile din eşantionul construit prin
procedeul aleator, probabilistic (aproximarea suficientă nu înseamnă însă nici o şansă de a ne
înşela; de fapt, rezultatele cercetării pe eşantioane pot fi comparate cu săgeţile trase în
direcţia unei ţinte: unele o nimeresc “în centru”, altele “pe laturi” etc., problema fiind că pe
baza dispunerii punctelor pe panou putem contura “centrul” ţintei, etc; ce înseamnă că
indicatorul de dispersie este invers proporţional cu √n? Înseamnă că, mărind eşantionul, sau
mărind numărul de eşantioane în care aflăm pe x’, mărim concentrarea valorilor x’, în jurul
lui x. Facem apel la imaginea intuitivă a curbei lui Gauss pentru a putea reţine că valorile
apar plasate simetric în jurul mediei, şi cu frecvenţă din ce în ce mai mică pe măsură ce ne
îndepărtăm de valoarea centrală, dar şi pentru a reţine o proprietate a distribuţiei normale:
dacă se consideră un interval simetric în jurul mediei, a cărui lungime se măsoară în abateri
standard ale variabilei normale respective, atunci frecvenţa indivizilor care cad pe acest
interval este aceeaşi pentru toate distribuţiile normale; adică, luând la întâmplare un individ
7
dintr-o serie statistică normală, probabilitatea P ca acest individ să se afle pe un interval (u – t
x σ, u + t x σ) depinde de t, lungimea intervalului, simetric faţă de media u, şi care este
măsurată în abateri standard. Valorile funcţiei P(t) se află în toate manualele de statistică;
sociologii se interesează de câteva care asigură o probabilitate ridicată. Aşa cum am mai spus,
din experienţa cercetărilor sociologice, cel mai folosit nivel de încredere (“prag de
încredere”, “nivel de probabilitate”) este de 0,95 (spunem: trebuie să existe cel puţin 95%
şanse ca, alegând un eşantion oarecare, valoarea medie obţinută să cadă pe intervalul
respectiv ); dacă vrem să fie mai mici, putem lua alte valori ale lui P, mai ridicate: P = 0,99
sau chiar P = 0,999. Ne uităm în tabelele statistice şi constatăm corespondenţele:
8
că votează cu un anumit partid, de ex). Cum apreciem reprezentativitatea eşantionului pentru
a putea extrapola? Calculăm eroarea standard:
G
k1 1 q k 2 q 2
2
e
n G
N
k1 şi k2 sunt valorile variabilei (k1, exprimă pe cei care posedă trăsătura, în cazul
nostru, opţiunea, k2 exprimă pe cei care nu o posedă); q = k 1 / N; adică, proporţia
complementară: 1 – q = k2 / N; (adică, variabila x, opţiunea, o putem exprima cu 2 valori: 1 şi
0; 1 pentu cei care au opţiunea, 0 pentru cei care nu au această opţiune):
k1 (1 q) 2 k 2 (0 q) 2 k1 (1 q) 2 k 2 q 2
G
N N
G q (1 q )
sau, ţinând seama de valorile lui q şi 1 – q:
G q (1 q ) 2 (1 q ) q 2 q (1 q )
Deci:
q (1 q )
e
n
În cazul nostru:
0,2 0,8 0.16 0,4 4
e 0,01
1600 40 40 100
(sau 1%)
Deci: dacă alegem P = 0,95 (căreia îi corespunde o eroare maximă de 2e), vom spune
că: sunt 95% şanse ca partidul pentru care au optat 20% din eşantion să aibă - în populaţia din
care am extras eşantionul - un procent de susţinători între (q-2e) şi (q+2e), adică: între 18 –
22%.
9
În selecţia aleatoare se disting următoarele tipuri de sondaj: simplu aleator, tipic
stratificat, de serii (cuiburi / cluster), în mai multe trepte, secvenţial.
1) esantionare aleatoare simpla
- fiecare membru al populatiei are aceeasi sansa de a fi selectionat
2) esantionare aleatoare sistematica
- fiecare al n -lea (ex : al 6 -lea) membru este selectionat dintr-o lista a populatiei
3) esantionare aleatoare stratificata
- participantii sunt aleator selectionati din grupuri, subgrupuri sau straturi ale populatiei (ex :
stratul intre 18-25 de ani)
4) esantionare aleatoare multistadiala (cluster, ciorchine)
- grupurile sunt aleator selectionate si toti membrii unui grup selectionat sunt testati (ex:
testam comportamentul liceenilor, bagam in palarie clasele de a 12-a din toate liceele si
rezulta un ciorchine)
Tehnici de esantionare nonprobabiliste
1) esantionare de convenienta
- selectionam participantii apti, disponibili (atentie la deformarea prin voluntariat; unii se
ofera sa participe si asta poate insemna ca sunt mai putin emotivi de ex.)
2) esantionare prin evaluare
- se alcatuieste un esantion dar nu aleator despre care cercetatorul crede ca e reprezentativ
3) esantionare pe cote
- se stabilesc anumite cote, proportii din populatie (x psihologi lucreaza in domeniul y)
4) esantionare prin identificare (snowball)
- potentialii participanti sunt identificati de participantii deja alesi pe baza unui criteriu
Stabilirea marimii esantionului (cat selectionam). Principiul fundamental - numarul de
participanti consuderat acceptabil pentru a forma un esantiom reprezentativ depinde de tipul
de cercetare. Astfel, pentru cercetarile corelationale sunt suficienti 30 de participanti pentru a
forma un esantion reprezentativ (se accepta ca de la 30 de subiecti distributia este normala).
Pentru cercatarile experimentale si cvasiexperimentale( similar cu experimentul cu exceptia
ca participantii nu sunt repartizati aleator in cele 2 grupuri, am gasit grupurile deja formate).
Pentru cercetarile descriptive (ex : aviatorii) un numar de 20% din populatia respectiva este
suficient. Cu cat populatia este mai mare procenrtul este mai mic. Ex : 20% din 1000 de pers
= 200 pers ; 10% din 5000 de pers = 500 de pers. Pentru populatii mici (sub 100 persoane)
esantionul este aproximativ egal cu populatia. Pentru populatii medii (in jur de 500 de pers)
10
aprox. 20%. Pentru populatii mai mari (este 5000 pers) aprox 400 pers dar si un esantion de
1% poate fi semnificativ.
11
Ex. Presupunem ca este o cercetare de tip descriptiv,rezulta ca 10% din populatie =500 de
persoane
(3)Alcatuim o lista cu toti membri populatiei
Ex.Cei 5000 de profesori sunt aranjati in ordine alfabetica ; deja lista nu este aleator alcatuita
dar procedura este valabila.
(4)Se determina parametrul sau pasul K = marimea populatiei /marimea esantionului..
Ex. K=5000/500=10
(5)Se incepe cu o pozitie oarecare de la inceputul listei .
Ex. Presupunem ca am pus degetul pe al 3-lea nume (folosind direct lista).
(6)Incepand cu pozitia aleasa fiecare al K-lea nume este ales.
EX.In esantionul nostru:3-13-23-33-etc.
(7)Daca esantionul nu a fost alcatuit pana la sfarsitul listei se revine de la inceput;notam
faptul ca datorita modului de alcatuire a listei este posibil sa nu fie reprezentativ ,dar il
acceptam.
3.Esantionarea aleatoare stratificata.
(1)Identificarea si definirea populatiei.
Ex. Pentru a compara efienta a doua metode de formare a competentei.psihosociale in
conducere in functie de nivelul stimei de sine populatia este alcatuita din cei 300 top
manageri din Constanta.
(2)Stabilirea marimei esantionului .
Ex.Marimea esantionului va fi de 45 de manageri pentru metodele a si b
(3) Se stabileste variabila si subgrupurile ,straturile pentru reprezentarea reprezentativitatii.
(Numar egal/Numar proportional in fiecare subgrupa.
Ex.Subgrupurile dorite sunt stabilite pe baza a trei nivele ale stimei de sine :Medie ,ridicata
,scazuta.(varsta,nivel de instruitre ,feminin masculin)
(4)Membri populatiei sunt repartizati in unul din subgrupurile stabilite.
Ex.300 de manageri sunt clasificati in functie de nivelul stimei de sine : 45 Stima de sine
ridicata ;225 stima de sine medie ;40 stima de sine scazuta.
(5)Prin esantionare simpla (utilizam tabelul cu numare in dezordine sau tragere la sorti) .Se
stabileste numarul de participanti din fiecare subgrup(numar proportional)
Ex.Stabilim ca din fiecare strat,se extrage un numar de 30.Utilizant tabelul cu numere
aleatoare sau tragere la sorti,extragem 30 de manageri cu stima de sine mare,30 cu stima de
12
sine medie,30 cu stima de sine scazuta..Cei 30 de participanti din fiecare esantion astfel
alcatuit ii repartizam aleator (jumatate metoda A si jumatate metoda B)
Uneori avem nevoie sa studim grupurile ca atare :proiectez o cercetare in care sa folosesc
metoda sociometrica sau alta metoda de interevaluare.
4.Esantionul aleator multistadial.
Selectia participantiolor care formeaza esantionul se face indirect prin intermediul selectiei
grupurilor din care participatii fac parte .In cercetarile din campul educational avem nevoie
de grupuri constituite de o istorie ,ca atare vom selectiona grupuri deja formate sau
constituite.
(1)Identificarea si definirea populatiei.
Ex.Populatia este alcatuita din toti cei 5000 de profesori din scoliile dobrogene.
(2) Stabilirea marimii esantionului.(Cercetare descriptiva )
Ex.Esantionul =10% =500.
(3)Se stabileste tipul logic (Clusterul)
Ex.Clasterul este scoala.
(4)Se alcatuieste lista ce contine grupurile ce alcatuiesc populatia
Ex.Se alcatuieste lista cu cele 100 de scoli din Dobrogea
(5) Se estimeaza numarul populatiei pentru fiecare grup.(Cluster)
Ex.Chiar daca scolile difera ca numar de profesori alegem doar 50 din fiecare scoala
(6) Se determina numarul de grupuri impartind marimea esantionului la marimea estimata a
grupelor.
Ex.500/50=10.
(7)Se selecteaza aleator numarul de grupuri prin tabelul cu numere aleatoare sau urna.
Ex.Selectam 10 scoli din cele 100 de scoli din Dobrogea !
(8)Toti membrii din grupurile selectate fac parte dub esantion.
Ex.Toti profesorii din cele 10 scolii fac parte din esantion.
Tragem concluziile.
Crea mai buna modalitate de a alcatui un esantion reprezentativ este esantionarea aleatoare.
Marimea esantionului si tipului de esantionare :probabilista depind de tipul de cercetare.
Pentru cercetariile corelationale si cele experimentale un numar de 30 de subiectii este
suficient pentru cercetarile descriptoare in functie de marimea populatiei de la 1-10% .
Indiferent de tefnica specifica utilizata pasii mari in esantionare constau in :
-identificarea populatiei
13
-determinarea marimii necesare
-selectia participantilor.
Esantionare aleatoare simpla e cea mai buna metoda de a obtine un esantion reprezentativ sau
statificate daca avem o varianta care intereseaza(stima de sina).
Sursa majora cu tendinte deformatoare in esantionare ,o constituie folosirea metodei
nonprobabiliste.
Prin folosirea unor tehnici nonprobaliste de regula e greu ,daca nu imposibil sa fie
descrisa populatia populatia din care a fost extras esantionul si generalizam asupra populatiei
respective rezultatele de la esantion..
14