Sunteți pe pagina 1din 5

Capitolul 7

Populaie i eantion

n urma parcurgerii acestui capitol: vei nelege modalitatea de desfurare a eantionrii aleatoare vei putea efectua eantionri aleatoare simple pe n programul SPSS

n tiinele sociale, populaia total supus studiului are cel mai adesea dimensiuni foarte mari de ordinul miilor, sutelor de mii sau chiar milioanelor de uniti (aceste uniti pot fi persoane individuale, familii/gospodrii sau organi aii!" ntruc#t efectuarea unor studii pe ntreaga populaie ar fi foarte costisitoare, se apelea de regul la cercetrile statistice conduse pe un eantion de volum mult mai redus dec#t cel al populaiei totale" $ou pro%leme se pot pune n legtur cu eantionarea& ' determinarea erorii de estimare a unui parametru (de regul media unei varia%ile!, pe care ne'o permite un eantion dat i ' sta%ilirea volumului eantionului care permite estimarea parametrului cu o eroare ma(im impus" S presupunem c dintr'o populaie total format din N uniti se e(trage un eantion de volum n" )odul de calcul al indicatorilor statistici, at#t pentru populaia total c#t i pentru eantion, este pre entat n ta%elul urmtor&
Caracteristic nealternativ Populaia total (*! )edia& +antion (n!

x
i =,

)edia&

m=

x
i =,

$ispersia&

- =

( xi ! i =,

$ispersia&

s- =

(x
i =,

m! -

n ,
+antion (n!

Caracteristic alternativ Populaia total (*!

)edia& (frecvena de apariie a strii .da/ sau , n populaia total! $ispersia& - = (, !

)edia& p (frecvena de apariie a strii .da/ sau , n eantion! $ispersia& s-0p(,'p!

Tabelul 1. Parametrii populaiei i cei ai eantionului Se o%serv c pentru a nota parametrii populaiei totale am folosit caractere greceti, iar pentru cei ai eantionului caractere latine" )edia eantionului m este un estimator (mai mult sau mai puin precis! pentru media populaiei totale 1, care de regul nu este cunoscut" $iferena +0m' 1 poart numele de eroare de estimare" Pe aceasta ne interesea s o determinm" 2eoria statistic ne spune c dac o varia%il are o distri%uie normal de medie 1 i dispersie 3-, atunci mediile (m! ale eantioanelor de volum dat n vor avea tot o distri%uie normal, de medie 1 i dispersie 3-/n (aceasta poart numele de dispersie de selecie). Proprietatea aceasta este foarte important pentru eantionare" S repre entm cur%a normal a distri%uiei mediilor eantioanelor de volum n&

*(1, 3-/n!

9:;
-":; 1'+ 1 -":; 16+

Figura 1. 4ur%a normal a distri%uiei mediilor eantioanelor de volum n +roarea de estimare + este de regul fi(at (impus! de ctre cercettor" 5ntervalul simetric (1 +, 1 6+! poart numele de interval de ncredere. 7ria suprafaei de su% %olta cur%ei lui 8auss care corespunde acestui interval se numete nivel de ncredere. *ivelul de ncredere ne arat cu ce pro%a%ilitate garantm estimarea noastr" n tiinele sociale se folosete de o%icei un nivel de ncredere de 9:;, ceea ce nseamn c putem garanta n proporie de 9:; c eroarea de estimare nu va depi nivelul + fi(at" 4u alte cuvinte, e(ist un risc de :; ca eroarea real s depeasc aceast limit" 7cest risc mai poart denumirea de nivel de semnificaie al studiului"

4um vom estima eroarea n condiiile n care nu'l cunoatem pe 1< =c#nd apel la scorurile z " Pentru media m a unui eantion oarecare, scorul z se calculea astfel&
z= m / n

ntruc#t dispersia populaiei totale nu este de regul cunoscut, ea se estimea cu a>utorul unei anchete preliminare pe un eantion pilot de ?@'-@@ de persoane" Se presupune c dispersia s2 a acestui eantion apro(imea dispersia 2 a populaiei" n acest ca putem rescrie ultima formul&
m s/ n

z=

$e aici putem determina cu uurin eroarea m- pe care n'o asigur un eantion de volum dat n&
E =z s n

n ceea ce'l privete pe z, l vom prelua din ta%elele statistice" preci m c vom folosi n e(emplele noastre un nivel de ncredere al cercetrii de 9:"AA;, cruia i corespunde o valoare 0-" $ac dorim s estimm media populaiei cu o eroare ma(im admisi%il +, volumul eantionului necesar pentru aceasta se calculea cu urmtoarea formul (dedus din cea anterioar!&
n= z-sE-

n ca ul n care avem de'a face cu o caracteristic alternativ, formula este aceeaiB se schim% doar modalitatea de calcul a dispersiei (ve i ta%elul ,!&
n= z - p(, p ! E-

S dm acum dou e(emple concrete de calcul al volumului eantionului& unul pentru caracteristicile cantitative, altul pentru cele alternative" +(emplul , S presupunem c din cei :@@@ de lucrtori ai unei mari companii se e(trag n mod aleator ,@@" )edia de v#rst a eantionului e(tras (m! este de AA de ani, iar a%aterea medie

ptratic (s! de ,: ani" Se pune ntre%area care este eroarea cu care media acestui eantion estimea media de v#rst a lucrtorilor din companie, cu un nivel de ncredere de 9:"AA; ( 0-!" Cn calcul simplu, cu a>utorul formulei de determinare a erorii pre entate mai sus, ne arat c aceast eroare este de ? ani" 7adar, putem spune c media de v#rst a lucrtorilor este situat ntre A, i AD de ani (AAE?!, cu un nivel de ncredere de 9:"AA;" $ac aceast eroare de ? ani este mult prea mare i nu poate fi tolerat, va tre%ui s mrim volumul eantionului" S presupunem c se dorete estimarea v#rstei medii a lucrtorilor cu o eroare ma(im admisi%il (E! de numai , an" n urma calculelor, utili #nd formula de determinare a volumului eantionului, re ult c volumul eantionului ar tre%ui s fie de 9@@ de lucrtori, adic de 9 ori mai mare dec#t cel iniial" +(emplul Fa fel ca la e(emplul ,, desfurm studiul nostru ntr'o companie cu :@@@ de anga>ai, din care alegem la nt#mplare ,@@" $intre acetia, G- sunt cstorii (G-;!, iar ?H necstorii" 7plic#nd formula de calcul a erorii, a>ungem la conclu ia c acest eantion apro(imea procenta>ul anga>ailor cstorii cu o eroare de E9"D; (:-"?;'D,"D;!" $ac dorim o eroare de estimare mai redus, de e(emplu :;, volumul eantionului de studiu tre%uie s fie de ?DD de anga>ai"

Eantionarea aleatoare n S SS
$ac dorim ca dintr'o %a de date de mari dimensiuni s e(tragem un mod aleatoriu un numr de ca uri, putem face acest lucru cu a>utorul comen ii de filtrare cunoscute& Data > Select Cases n caseta de dialog pe care ne'o pre int programul selectm opiunea Random sample of cases i apsm %utonul Sample" Se deschide o nou caset, n care ni se ofer dou posi%iliti& s e(tragem un anumit procent din totalul ca urilor s e(tragem un numr e(act de ca uri" $up ce ne e(primm opiunea, SPSS'ul alege n mod aleator ca urile care din eantion i le .%area / pe cele e(cluse" S presupunem c dorim s e(tragem aleatoriu circa -:; cei ADA anga>ai din fiierul Emplo!ee data.sav" n urma efecturii pailor descrii mai sus, SPSS'ul a selectat circa ,,H ca uri din total" 2oate anali ele statisitce vor fi rulate acum doar pentru aceste ca uri" Pentru a elimina filtrul, procedm aa cum am artat la capitolul :& e(ecutm din nou comanda "ata # Select Cases i alegem opiunea All cases"

$e%umat

n tiinele sociale, populaia total supus studiului are cel mai adesea dimensiuni foarte mari de ordinul miilor, sutelor de mii sau chiar milioanelor de uniti (aceste uniti pot fi persoane individuale, familii/gospodrii sau organi aii!" ntruc#t efectuarea unor studii pe ntreaga populaie ar fi foarte costisitoare, se apelea de regul la cercetrile statistice conduse pe un eantion de volum mult mai redus dec#t cel al populaiei totale"

Teste de control ," +(plicati modalitatea de calcul a volumului eantionului pentru o eantionare aleatoare" -" +(ecutati o eantionare aleatoare n SPSS, pe o %a de date la alegere"