Sunteți pe pagina 1din 12

PROBLEMATICA EANTIONRII

Harta societilor democratice se suprapune peste cea a valorizrii cercetrilor sociologice,


semn al consideraiei reale acordate oamenilor care compun societile democratice, ct i al
faptului c acolo deciziile se iau pe baza studiului realitii socioumane i nu orbete sau
pe baza revelaiilor... ntr-o societate democratic, oamenii trebuie s fie informai sub
toate aspectele pentru a cunoate i aciona n cunotin de cauz. nbuirea, trunchierea
informaiei las poart deschis zvonurilor, minciunilor, panicii, isteriei colective,
manipulrilor...
Cercetrile

sociologice dau seama de comportamentul unei populaii investignd

un

eantion al acesteia i extrapolnd rezultatele pe eantion obinute la acea populaie (de ex.,
chestionm 1500 de persoane i tragem concluzii privind comportamentul electoral al
romnilor).
Populaia este ansamblul oamenilor, grupurilor, unitilor sociale n raport cu tema de
cercetare sociologic (de exemplu, populaia Romniei, populatia studenilor, populatia
omerilor etc.).
Eantionul este o parte a acestei

populaii, selecionat prin anumite procedee de

eantionare.
Variabila discriminant este criteriul ce permite mprirea populaiei n straturi, grupuri etc.
Caracteristicile unei populaii nu sunt toate de acelai nivel. Anumite caracteristici, cum
ar fi: vrsta, sexul, locul de reziden, nivelul de instruire, categoria socioprofesional,
statutul matrimonial, sunt considerate variabile independente. Altele: opiniile,
atitudinile, comportamentele diferite sunt variabile dependente.
Cercettorul degajeaz un numr de caracteristici n relaie cu tema pe care o are de cercetat
i construiete eantionul urmrind reprezentativitatea acestuia.
Dac populaia este omogen, eantionul poate fi de talie mic. Dac populaia este
eterogen, se pleac de la teorii mai nuanate ale stratificrii sociale i se aleg eantioane
reprezentative pe straturi.
Aadar, se investigheaz un numr redus de persoane dintr-o populaie i concluziile rezultate
n urma prelucrrii datelor se extrapoleaz la acea populaie. Este permis, se justific acest
fapt?
Gnoseologia (mereologia, tiina raporturilor, a relaiilor parte ntreg ) arat c partea
reflect ntr-o anumit msur ntregul. i praxiologia arat c este posibil i necesar s
1

maximizm gradul n care partea reflect ntregul i c, procednd astfel, economisim timp,
energie, bani, avnd aceleai avantaje pe planul cunoaterii.
Cercetrile selective n raport cu cele exhaustive au avantaje:

economice cheltuielile materiale pentru realizarea unei cercetri sunt


proporionale cu numrul subiecilor investigai; ca urmare, cercetarea pe
eantion, chiar dac include costul calculelor, aduce economii materiale;

aplicative - scurtarea timpului necesar realizrii cercetrii este un avantaj


important n domeniul socialului unde schimbrile se produc cu rapiditate i
rezultatele i-ar pierde actualitatea dac ar fi obinute la intervale mari de
timp; de asemenea, cercetarea unei pri a populaiei se poate face cu un
personal (operatori de teren) mai puin numeros, ce poate fi mai bine instruit
i controlat;

de cunoatere - posibilitatea de a obine informaii exacte, profunde", detaliate,


de a avea o caracterizare mai complet a unei colectiviti.

Utilizarea metodei selective este larg aplicat n studiul fenomenelor de mas, a


fenomenelor n care acioneaz legea numerelor mari.
Exist situaii n care metoda selectiv nu poate nlocui metoda exhaustiv, de exmplu,
pentru nregistrarea n evidenele primare a datelor statistice privind natalitatea,
mortalitatea, nupialitatea, divorialitatea etc.
Sunt rare cazurile cnd cercetm ntreaga populaie (cu ocazia recensmintelor, pe baza unor
formulare).
Cnd vrem s cunoatem comportamentul electoral al ieenilor, de exemplu, populaia va fi
compus din toate persoanele cu drept de vot (cu vrsta peste 18 ani). Vom apela la listele
electorale pentru a alege persoanele din eantion. n acest caz, spunem c avem o baz de
date, o baz de sondaj etc. Sociologia apeleaz la listele diferitelor contabiliti, ale direciilor
de personal, la crile de telefon etc. (de exemplu, se utilizeaz pe scar larg sistemul CATI chestionarea prin telefon asistat de calculator).
Construim eantionul reprezentativ cutnd s respectm exigena de a da fiecrui membru
component al populaiei vizate aceleai anse de a face parte din el.
Deci, dintr-o populaie putem extrage eantioane diferite, de reprezentativitate diferit.
Media mediilor eantioanelor se va apropia mai mult de media din populaie.
Reprezentativitatea unui eantion crete odat cu numrul oamenilor cuprins n el, dar sporul
de reprezentativitate nu este direct proporional cu creterea volumului eantionului.
Dependena aceasta nu este liniar, ci are forma unor curbe particulare:

100

Reprezentativitate

N
Mrimea eantionului

Dac avem un eantion cu 0 indivizi i unul cu toi indivizii populaiei, curba care leag
punctele va crete rapid la valorile mici ale lui n (volumul eantionului) i va ajunge rapid n
apropierea plafonului reprezentativitii, atinse atunci cnd n (eantionul) coincide cu N
(volumul populaiei). J. Stoetzel a artat c pe msur ce se cumuleaz datele pe sute de
indivizi, variaiile de rspuns devin tot mai mici, iar o cretere suplimentar a numrului de
indivizi n eantion nu mai aduce spor de reprezentativitate...
Date succesive

Procente de Da

1
2
3
4
5
6
7
8
9
10
11
12
13
14

68
55
62
66
64
61
74
75
69
69
77
68
69
67

Procente
cumulate
68,0
61,5
61,6
62,8
63,0
62,7
64,3
65,0
66,0
66,3
67,2
67,3
67,4
67,4

Cu alte cuvinte, un eantion format din n componente are aceeai reprezentativitate,


indiferent de mrimea populaiei din care este extras. Un eantion de 1000 persoane poate fi
reprezentativ i pentru o populaie de un miliard i pentru un ora de cteva zeci sau sute de
mii de persoane. n eantioane, de regul, este cuprins un numr mai mare de persoane pentru
a se asigura

reprezentativitatea pe straturi (un eantion de un anumit volum poate fi

reprezentativ la nivelul populaiei, dar populaia nefiind omogen, straturile ei pot s nu fie
reprezentate corespunztor).
Aadar, avem de realizat o cercetare pentru a estima o anumit valoare v din populaie (o
medie, o proporie, o frecven, un coeficient de corelaie, de ex.: media de vrst, proporia
celor care exprim o anumit opiune politic, frecvena cu care ntlnim o anumit practic
religioas, cum se coreleaz nivelul de pregtire colar cu aflarea unui post n domeniul
aferent etc.). Putem extrage din respectiva populaie mai multe eantioane reprezentative. De
obicei, extragem un eantion construit dup toate canoanele metodologiei; n el vom afla o
valoare V* (o opinie, o nevoie a comunitii etc.) diferit de V din populaia din care am
extras eantionul. Cu ct eantionul este mai reprezentativ, cu att V* se apropie mai mult de
V din populaie.
Dar noi nu-l tim pe V... Cu alte cuvinte, pentru un eantion ales la ntmplare, vom putea
afirma cu o anumit probabilitate c mrimea V* din eantion se apropie de cea adevrat
din populaie, de care difer cu o mrime calculabil.
Vom nota cu d - eroarea maxim admis (care exprim diferena acceptat ntre V i V*), cu
P - nivelul de probabilitate sau nivelul de ncredere (care exprim ansele ca eroarea real
comis atunci cnd aproximm pe V prin V* s nu depeasc d). Cu alte cuvinte,
determinnd o valoare V* pe eantion, cu ajutorul erorii maxime, d, vom construi un interval
(v*-d, v*+d) n interiorul cruia se va situa valoarea cutat, V, din populaie).
Reprezentativitatea unui eantion este dat

de cuplul (d, P). Nu putem vorbi ns de

reprezentativitatea unui eantion n general, ci n raport cu o anumit caracteristic (de


exemplu, un eantion poate fi reprezentativ n raport cu vrsta, un alt cuplu (d,P) poate fi
reprezentativ n raport cu nivelul de instruire etc.). Un eantion este mai mult sau mai puin
reprezentativ, nu doar reprezentativ sau nereprezentativ1. Dac avem construite dou
eantioane i dac ntr-unul d este mai mic, acel eantion este mai reprezentativ dect cellalt,
ca i n cazul n care P este mai ridicat n acel eantion. n cercetarea sociologic se accept
c o anumit eroare este suficient de mic, sau c o probabilitate este suficient de mare
pentru ca un eantion s fie bine construit ca reprezentaiv. Pentru nivelul de probabilitate, P,
valoarea minim acceptat este de 0,95 (adic ansele de a grei estimarea nu trebuie s
depeasc 5%); probabilitatea de a grei se noteaz cu p, complementar lui P: (p=1 P).
Spunem c un eantion este reprezentativ, dac n raport cu caracteristicile cercetrii,
eroarea d este sub o limit acceptabil, iar p se afl sub 5%, adic P este de cel puin 95%.

Pentru a prescurta exprimarea, vom folosi adesea paranteza care cuprinde particula ce arata i contrarul
afirmaiei; de exemplu, (ne)reprezentativ arat c este vorba de reprezentativ i/sau nereprezentativ.
4

Eantionarea poate fi: probabilistic (aleatoare) i neprobabilistic (nealeatoare).


Fiind vorba de cercetarea unor subieci umani, condiiile de alegere a eantionului nu sunt
ideale2 (ca atunci cnd alegem un numr de becuri dintr-un lot pentru a le face controlul
tehnic de calitate...). n cazul cercetrii sociologice a subiecilor umani din comunitile
teritoriale concrete, spunem c facem o selecie aleatoare atunci cnd eliminm intervenia
subiectiv n alegerea membrilor eantionului, cnd eliminm orice factor sau condiie care
ar favoriza pe unii i ar defavoriza pe alii la alegerea n eantion (de exemplu, dac vrem s
aflm opinia ieenilor n raport cu o problem de maxim interes pentru toi locuitorii i vom
iei n faa Universitii la ora 10 i 50 de minute pentru a lua la ntmplare un numr de
membri n eantion, se poate ca eantionul s nu fie reprezentativ, fiindc cele mai mari anse
de a fi cuprini n eantion le vor avea studenii, profesorii, locuitorii din Copou, nu i alte
categorii, straturi ce alctuiesc populaia oraului Iai).
Tipul de eantionare aleatoare cere ca fiecare membru component al populaiei s aib anse
calculabile egale i nonnule de a fi ales n eantion.
Cea mai simpl este eantionare aleatoare se poate face prin procedeul loteriei3, al tragerii
la sori, ca i prin procedeul numerelor aleatoare(exist tabele cu numere formate din 4,
5, 6... cifre aranjate pe coloane, prin diferite mijloace; la ora actual exist programe pe
computer care fac astfel de numere i extrag i indivizii pentru eantion n baza unei liste pe
care am introdus-o)4. Aadar, avem o list cu persoanele unei populaii i aceste tabele; dac
avem de ales sute de persoane, vom lua din coloane, dup liste, indivizii cu numerele aflate
n aceste coloane; ex. 312, 11, 5... etc. din: 900312, 014011, 625005 etc.).
Tabelul cu numere aleatoare este o list cu numere generate aleator n care fiecare cifr de la 0 la 9
apare cu o probabilitate de 1/10.
Rnd
1
2
3
4
5
6

Coloane
1
8735
2552
8717
0504
8116
5485

2
6744
2967
8331
4035
0921
7888

3
5149
3599
2559
7295
9171
5791

......................................

10
5492
1100
4431
6498
1091
7895

Ca n idee, ca n minte (de exemplu, cazuri ideale sunt: fiecare locuitor al unei comuniti i cunoate pe toi
ceilali locuitori i nici un locuitor nu cunoate nici unul dintre locuitorii comunitii; ntre aceste cazuri ideale
se afl cele normale: locuitorii se cunosc ntre ei n diverse grade.
3

Sondajul simplu aleator are drept caracteristic faptul c fiecare unitate din populaie are anse egale, nenule, de a fi
selectat n eantion. Unitile sunt alese independent una de alta. Sondajul simplu aleator este de dou feluri: repetat (cu
revenire) fiecare unitate este reintrodus n populaie, i nerepetat (fr revenire) unitile nu sunt reintroduse n
populaia din care selectm. Extragerea ntmpltoare se poate face prin urmtoarele procedee de selecie: procedeul urnei /
loteriei (const n numerotarea tuturor subiecilor i extragerea lor ntmpltoare; la fiecare extragere ansa de a fi ales este 1/
N eantioanele posibile sunt Nn).
4
Pentru exemple de extragere, a se vedea i http://www.cleo.ulg.ac.be/tp/tp3resultat.xls

Se numeroteaz colectivitatea cu numere de la 1 la n, se selecteaz aleator un loc de unde ncepe


citirea numerelor de la stnga la dreapta. Se vor alege grupuri de cifre comparabile cu volumul
populaiei. Dac numrul gsit este egal cu 0 sau este N va fi eliminat.
Ex. S se aleag dintr-o populaie de 90 de indivizi un eantion de 30 de indivizi ncepnd cu rndul 3
coloana 1. Va fi ales, de exemplu, individul 87 din list, apoi 17, 83, 31 ...
Procedeul mecanic, folosete pasul de numrare KN/n. Numrtoarea ncepe de la un numr m(1,
k) ales aleator. Exemplu, dintr-o populaie de 5000 de indivizi, s se aleag un eantion de 1000 de
indivizi. n acest caz, K5000/1000 K5. Aleg aleator m3 respectnd condiia m(0,5). Vor fi
selectai indivizii care corespund numerelor: 3, 8, 13, 18 ...

Eantionarea pe cote cere respectarea, n cadrul eantionului, a anumitor caracteristici ale


populaiei totale, cum ar fi structura pe vrste, sexe, categorii socioprofesionale, statut
matrimonial, mediul de reziden etc.
Eantionarea din straturi pleac de la criteriul caracteristicilor care mpart populaia n mai
multe straturi cu efectivele: N1, N2, N3, , Nn (care nsumate vor da N, efectivul
populaiei). n acest caz, vom construi eantionul n n etape, selectnd eantioanele: n1, n2, n3,
., nn din fiecare strat, proporional cu mrimea straturilor respective (fiecare proporie
din eantion reproducnd proporia corespunztoare din populaia stratului). De fapt, se
pleac de la un criteriu a crui distribuie este cunoscut, pentru a exprima distribuia altei
caracteristici pe care nu o cunoatem dar care se coreleaz cu prima.
n practica cercetrii sociologice se utilizeaz stratificarea multipl (prin mprirea
populaiei dup sex, vrst, nivel de colarizare, loc de reziden, statut matrimonial etc.,
adic variabilele factuale care surprind situaia obiectiv a unui individ n viaa sociouman
cotidian a unei societi i care au influen semnificativ asupra opiniilor, atitudinilor,
comportamentelor lor). Un eantion obinut prin eantionarea aleatoare din straturi are o
reprezentativitate mai mare dect unul obinut prin eantionarea aleatoare simpl. Dar dac
vom avea de fcut comparaii ntre caracteristicile diferitelor subpopulaii, straturi etc. pentru
a vedea cum voteaz cei cu patru clase i cei cu douzeci de ani de studiu, cei de la sate n
comparaie cu cei de la orae etc., dac ponderile acestor straturi n populaie sunt diferite,
unele fiind mai mici ca altele, atunci subeantioanele aferente vor fi i ele mai mici, ceea ce
nseamn c i pot pierde gradul de reprezentativitate rezonabil; n aceste cazuri se poate
nclca principiul egalitii anselor de a intra n eantion i vom lua un numr care s asigure
i reprezentativitatea acestor straturi, avnd grij ca la calculele valorilor de ansamblu s
ponderm valorile pariale la nivel de strat.
S spunem c avem de investigat opiniile electorale ale populaiei judeului; este uor s ne
imaginm dispersia teritorial a eantionului pe care l vom alege; adic, n mod normal ar
6

trebui s lum din fiecare localitate un numr semnificativ de locuitori, un numr de persoane
pentru eantionul cu un volum pe care ni l-am propus. Operatorii de teren ar avea de strbtut
distane enorme, cu cheltuieli mari etc. Exist posibilitatea de a evita aceste neajunsuri, cu
mari avantaje pe planul costurilor, timpului, promptitudinii realizrii cercetrii. Care este
ideea? Populaia rii este grupat n judee; deci, ntr-un prim stadiu am alege un eantion
reprezentativ de judee. Un jude are un numr de localiti, deci un alt stadiu ar consta n
alegerea unui eation reprezentativ de localiti. O localitate se compune din mai multe
cartiere, strzi, ulie etc.; vom alege eantioane reprezentative. Ajungem la gospodrii (case,
apartamente la bloc etc.) din care alegem eantioane reprezentative i la membrii acestor
gospodrii, din care vom lua cte una sau mai multe persoane. Trebuie s fim ateni la
riscurile de a comite erori de eantionare; dac, de pild, vrem s aflm opiunile electoratului
romn i ntr-un prim stadiu vom alege 5 judee din 42, toate din Moldova, estimarea va putea
fi sortit eecului (putem consulta mai nti hri electorale anterioare pentru a vedea tradiia
opiunilor politice etc. i apoi vom alege judeele, localitile cuprinse n aceste arii de
opiuni).
n realitate, din populaia mare se pot extrage multe eantioane, de ex. n acest caz Nn
eantioane. Aceste eantioane, prin mediile lor, pot forma o nou serie statistic numit i
distribuie de eantioane. Statisticienii au demonstrat c media acestei serii este x sau
media mediilor tuturor eantioanelor posibile este egal cu media populaiei.
Ex. x2,5,8; n2. Eantioanele posibile sunt: (2,2), (2,5), (2,8), (5,2), (5,5), (5,8), (8,2), (8,5),
(8,8);
Eantion
(2,2)
(2,5)
x.(2,8)
(5,2)
2
(5,5)
3,5
(5,8)
5
(8,2)
6,5
(8,5)
8
(8,8)
Total

Media
2
3,5
5
3,5
5
6,5
5
6,5
8

fi
1
2
3
2
1
9

xi fi
2
7
15
13
8
45

x45/95
x

x (xi fi)/ fi
Satisticienii au demonstrat i c x / n
Abaterea medie ptratic din mulimea tuturor eantioanelor posibile este de n ori mai mic
fa de abaterea din populaia mare. Vom avea dificulti n a calcula

i x deoarece x

depinde de care la rndul lui este necunoscut. ns x poate fi aproximat prin valoarea din
7

eantionul extras. Dac n eantion avem, de exemplu, valoarea s a abaterii medii ptratice,
notm cu s x estimatorul pentru x i s s/n. Estimarea ncearc s fac apropierea dintre
valorile eantionului i cele ale populaiei mari. n general, media populaiei mari se
estimeaz c poate fi egal cu x x, adic poate diferi de media din eantion cu cel
mult o abatere maxim admis n plus sau n minus. x nu este dect produsul dintre abaterea
medie din populaia de eantionare i t (probabilitatea cu care este garantat rezultatul). x
x t t (/n).
Exemple
1. S se stabileasc eroarea limit admis i intervalul de ncredere pentru tiind c media
eantionului x 80, n 400, s 0,85 la o probabilitate de 95%.
Eroarea limit admis x t (/n) x 1,96 (0.85/ 400); x 0,083
Se calculeaz intervalul de ncredere x x; x x 7,917;8,083
2. S se determine intervalul de ncredere garantat cu o probabilitate de 99% pentru , dac
eantionul are 36 de uniti media de 800 iar abaterea medie ptratic de 60.
t 2,58

x t (/n)

n 36

x 2.58 (60/6) 25,8 80025,2; 80025,2

x 800

774,2; 825,8

s 60
Toate mrimile de pn acum includ pe n volumul eantionului de unde rezult c n
anumite cazuri putem calcula mrimea acestuia.
x t (/n)
x2 t 2/n
n (t2 2) /x2
3. S se determine volumul eantionului necesar pentru a estima media unei colectiviti cu
o eroare limit admis de 0,2 i o probabilitate de garantare a rezultatelor de 95%, tiind c
dintr-o cercetare anterioar s2 6,1.
n (1,962 6,1)/0,22 586.

Uneori sociologii pot apela la eantioane de voluntari (eantioane de cazuri exemplare,


pentru cercetarea unor teme delicate).
Cercetrile pe eantioane implic o anumit incertitudine. De aceea spunem c prin cercetare
estimm pe V din populaie. Vizibilitatea variabilelor de cercetat nu este uniform. Exist
ntotdeauna o cifr neagr (dark number) care rmne necunoscut, adic exist o diferen
ntre cifra real de, s spunem, copii victimizai, prostituate etc. i cea rezultat din
cercetare. Diferena poate proveni chiar de la definirea dat acestor categorii de persoane, de
exemplu, cine sunt copiii victimizai: cei brutalizai fizic? psihic? cei nengrijii de prini?
cei violai? victime ale incestului? ale pedofiliei?
Pe parcursul dezvoltrii cercetrilor sociologice s-au pus la punct tehnici statisticomatematice care permit s apreciem ct de nimerit, adecvat, bun etc. este o estimare.
Fie x o caracteristic definit pe populaia N. Urmrim s estimm valoarea medie a acesteia
pe un eantion n. S presupunem c o aezare are 2000 de gospodrii; avem de fcut o
cercetare privind pragul de srcie i la un moment dat vrem s analizm consumul
diferitelor produse; avnd n vedere, de exemplu, configuraia celor dou drumuri
perpendiculare din aezare i a numrului de gospodrii, putem alege un numr de 50;
aplicm metoda pasului (2000 : 50 = 40) pentru a le identifica i investiga; lum contact cu
fiecare familie din eantionul de 50 i nregistrm consumurile pe o perioad (de exemplu, o
lun); facem media consumului (x); facem calculul abaterilor fa de medie (x i - x), calculul
ptratului abaterilor de la medie:
Gospodria

Consumul pe lun
Xi-X
1
3
0,5
2
1,2
-1,3
3
2,9
0,4

50
2,5

(Xi-X)2
0,25
1,69
0,16

Aflm c media este 2,5; acesta a fost un eantion n care media a fost x1, dar putem lua i
altele n care mediile vor fi: x2, x3, x4, ., xn ; diferena x-x va nsemna eroarea pe care o
comitem atunci cnd investigm un eantion n i nu ntreaga populaie, N. Deci, n general,
pentru estimarea valorilor medii este important s ne asigurm c putem extrage mai multe
eantioane din populaia investigat pe care le-am putea supune pe rnd cercetrii pe tema
noastr, obinnd un ir de valori medii ale caracteristicii urmrite (de fiecare dat cnd am
alctuit eantionul, unii indivizi din populaie pot apare n eantioane diferite ): x1, x2, x3,
.., xk. Aceste valori medii de eantioanare vor forma o valoare medie x, distribuia
de eantionare; media caracteristicii din eantion coincide, se va suprapune peste cea din
9

populaie (sau mai exact spus, media mediilor tuturor eantioanelor pe care le putem extrage
din populaie, va cdea peste media din populaie); abaterea standard a variabilei x este de
n ori mai mic dect abaterea standard a variabilei x din populaia N; notm cu e abaterea
standard a variabilei x din eantion i o numim eroare standard:
e = x n ; distribuia valorilor variabilei x poate urma o curb normal (curba lui Gauss);
de obicei spunem c abaterea standard a variabilei din populaie este suficient de bine
aproximat de abaterea standard a aceleiai variabile din eantionul construit prin
procedeul aleator, probabilistic (aproximarea suficient nu nseamn ns nici o ans de a ne
nela; de fapt, rezultatele cercetrii pe eantioane pot fi comparate cu sgeile trase n
direcia unei inte: unele o nimeresc n centru, altele pe laturi, iar pe baza dispunerii
punctelor pe int putem contura centrul acesteia. Ce nseamn c indicatorul de dispersie
este invers proporional cu n? nseamn c, mrind eantionul, sau mrind numrul de
eantioane n care aflm pe x, mrim concentrarea valorilor x, n jurul lui x. Facem apel la
imaginea intuitiv a curbei lui Gauss pentru a reine c valorile apar plasate n jurul mediei, i
cu frecven din ce n ce mai mic pe msur ce ne ndeprtm de valoarea central, dar i
pentru a reine o proprietate a distribuiei normale: dac se consider un interval simetric n
jurul mediei, a crui lungime se msoar n abateri standard ale variabilei normale
respective, atunci frecvena indivizilor care intr n acest interval este aceeai pentru toate
distribuiile normale; adic, lund la ntmplare un individ dintr-o serie statistic normal,
probabilitatea P ca acest individ s se afle pe un interval (u t x , u + t x ) depinde de
lungimea intervalului, simetric fa de media u, i care este msurat n abateri standard.
Valorile funciei P(t) se afl n toate manualele de statistic; sociologii se intereseaz de
cteva care asigur o probabilitate ridicat. Aa cum am mai spus, din experiena cercetrilor
sociologice, cel mai folosit nivel de ncredere (prag de ncredere, nivel de probabilitate)
este de 0,95 (spunem: trebuie s existe cel puin 95% anse ca, alegnd un eantion
oarecare, valoarea medie obinut s cad pe intervalul respectiv ); dac vrem s fie mai
mici, putem lua alte valori ale lui P, mai ridicate: P = 0,99 sau chiar P = 0,999. Ne uitm n
tabelele statistice i constatm corespondenele:
P=0,95

p=0,05, iar t=2

P=0,99

p=0,01, iar t=2,6

P=0,999

p=0,001, iar t=3,3

10

(spunem: exist 95% anse ca o valoare medie determinat prin cercetarea unui eantion, s
se abat cu mai puin de 2e de la valoarea medie existent n populaie.)
Cum calculm abaterea standard? n formula de mai sus am pus abaterea din populaie, dar
nu o cunoatem; folosim abaterea aflat n eantionul investigat () i vom avea:
e = x n
Vom calcula apoi pe d (eroarea maxim admis ):

d = t x e.

De exemplu: avem un eantion de 900 persoane dintr-o populaie oarecare; vrem s tim
vrsta medie i abaterea n populaie; calculm vrsta medie n eantion (de exemplu, 35 ani);
calculm abaterea medie (de exemplu, 12 ani); conform formulei:
e = 12 : 30 = 0,4;
dac lum P = 0,95 i t = 2, atunci vom putea spune, cu un risc de 5%, c valoarea adevrat a
mediei de vrst din populaie se va situa ntre: (35-2 x 0,4) i (35+2 x 0,4), adic ntre 34,2 i
35,8 ani.
S se calculeze volumul eantionului pentru o populaie de 1550 studeni, tiind c la
psihologie sunt 375, la sociologie 475, la pedagogie 360 iar la asisten social 340, pentru o
eroare limit admis de 4%.
n (t2D2)/x2 (t2D2/n)
n (1,9622500)/42 (1,9622500/1550) 384
Pedagogie

Sociologie

Psihologie

Total

Populaie

Asisten
social
340

360

475

375

1550

Populaie %

21,93

23,22

30,65

24,20

100

Eantion
iniial

84

89

118

93

Eantion %

21,88

23,17

30,73

24,22

100

Eantion
real

85

90

117

92

384

Testul 2 indic raportul dintre eantionul stabilit iniial i cel real.


2 (ftf0)2 / ft , unde ft reprezint frecvenele teoretice iar f0 frecvenele observate.
2 (84 85)2 / 84 (89 90)2 / 89 (118 117)2 / 118 (93 92)2 / 93 0,04
df (n 1)( m 1), unde n reprezint numrul de linii i m numrul de coloane
df 7,84
2 2t 0,04 7,84 diferenele dintre eantionul iniial i cel real sunt minime.
11

Ce putem spune despre estimarea proporiilor?


Un eantion are o anumit reprezentativitate pentru fiecare variabil n parte. n sondaje
se pune problema estimrii unor proporii n populaie, adic procentul celor care au o
anumit trstur. Problema se reduce, n mare, la cele discutate deja despre medii. De
exemplu, am investigat, pentru a estima opiunile politice, un eantion de 1600 persoane;
facem prelucrarea primar a rezultatelor i aflm o frecven de 20% (q=0,2); (20% declar
c voteaz cu un anumit partid, de exemplu). Cum apreciem reprezentativitatea eantionului
pentru a putea extrapola cele aflate la ntreaga populaie? Calculm eroarea standard:
k1 1 q k 2 q 2
N
k1 i k2 sunt valorile variabilei (k1, exprim pe cei care posed trstura, n cazul nostru,
e

G
n

opiunea politic, k2 exprim pe cei care nu o posed); q = k1 / N; adic, proporia


complementar: 1 q = k2 / N;
Variabila x, opiunea, o putem exprima cu 2 valori: 1 i 0; 1 pentu cei care au
opiunea, 0 pentru cei care nu au aceast opiune):
G
G

k1 (1 q ) 2 k 2 (0 q ) 2

k1 (1 q ) 2 k 2 q 2
N

q (1 q )

sau, innd seama de valorile lui q i 1 q:

q (1 q )
n

n cazul nostru:

0,2 0,8
1600

0.16
0,4
4

0,01
40
40 100

(sau 1%)
Deci: dac alegem P = 0,95 (creia i corespunde o eroare maxim de 2e), vom spune
c: sunt 95% anse ca partidul pentru care au optat 20% din eantion s aib - n populaia din
care am extras eantionul - un procent de susintori ntre (q-2e) i (q+2e), adic: ntre 18
22%.

12

S-ar putea să vă placă și