Sunteți pe pagina 1din 46

Capitolul 5

CERCETAREA PRIN SONDAJ


5.1 NECESITATEA FOLOSIRII SONDAJULUI STATISTIC Pentru caracterizarea statistic a fenomenelor i proceselor socialeconomice de mas n scopul evidenierii legitilor specifice acestora, se folosesc date individuale obinute prin metode de nregistrare total sau parial. n practic, din diferite motive, pentru anumite colectiviti nu se poate face nregistrarea total a unitilor ce le compun, fie c ar fi necesitat cheltuieli foarte mari, fie c operativitatea obinerii rezultatelor cercetrii nu este asigurat. Toate aceste considerente i altele nespecificate, necesit tot mai frecvent organizarea unor nregistrri pariale de tipul sondajelor statistice. n etapa actual de trecere la economia de pia, cercetarea prin sondaj i extinde continuu aria de investigare, datorit multiplelor avantaje pe care le prezint. Dintre avantajele pe care le prezint cercetarea prin sondaj, enunm pe cele mai semnificative: n cele mai multe cazuri, cnd colectivitatea total este foarte mare iar cercetarea ei exhaustiv ar necesita un volum mare de cheltuieli materiale i de munc este avantajos s se recurg la sondaj, care este mai operativ i mai ieftin; partea supus nregistrrii fiind cu mult mai mic dect cea total, iar personalul care face nregistrarea unitilor fiind de specialitate, de regul, erorile de nregistrare sunt n acest caz mai puin numeroase i mai uor de nlturat n faza de verificare a datelor; programul observrilor prin sondaj cuprinde, de regul, un numr mai mare de caracteristici dect programul observrii totale, ceea ce permite caracterizarea mai aprofundat a fenomenelor studiate prin metode statistice; cercetarea prin sondaj este singura posibil atunci cnd prin cercetarea exhaustiv a unitilor s-ar ajunge la distrugerea

STATISTICA

produsului respectiv (de pild, controlul distructiv al calitii unui produs); evaluarea rezervelor subterane de crbune, petrol, gaze naturale etc. nu este posibil dect pe baza unui sondaj statistic; sondajul statistic poate fi folosit la verificarea datelor culese printr-o observare total de mare amploare n care s-au folosit i nespecialiti precum i la prelucrarea selectiv a unor date. De exemplu, datele culese prin recensminte pot fi prelucrate ntr-o prim faz selectiv i mai trziu total; sondajul poate fi utilizat cu bune rezultate n verificarea programului unei observri totale ct i la verificarea unor ipoteze statistice. Avantajele amintite au permis ca metoda selectiv s capete un cmp larg de aplicare n cele mai diferite domenii ale vieii socialeconomice i culturale. Metoda sondajului este folosit cu succes n industrie pentru determinarea productivitii muncii n uniti naturale, n cercetarea calitii produselor se folosete pe scar larg n timpul desfurrii proceselor tehnologice pentru prevenirea rebuturilor, n depistarea cauzelor care provoac fluctuaia forei de munc, n studierea capacitilor de producie, a suprafeelor de producie etc. n comer, sondajul este utilizat pentru testarea acceptrii noilor produse, la studierea aspectelor complexe ale cererii de mrfuri n funcie de variaia factorilor care o influeneaz, precum i la estimarea tendinelor specifice ale activitilor de desfacere a mrfurilor i a prestrilor de servicii ctre populaie. Sondajul statistic se aplic cu rezultate bune i n celelalte ramuri ale economiei naionale, nct se poate spune pe drept cuvnt c aproape nu exist domeniu unde sondajul statistic, datorit avantajelor pe care le prezint, ct i a exactitii rezultatelor s nu fie folosit. Acesta este de fapt i principalul motiv pentru care n ultimii ani n toate rile, cercetrilor prin sondaj li se acord o atenie din ce n ce mai mare att sub raport teoretic ct i din punct de vedere practic.

Cercetarea prin sondaj

5. 2 NOTIUNI SPECIFICE SONDAJULUI STATISTIC Cercetarea parial al crei scop este ca, pe baza rezultatelor prelucrrii datelor obinute, s se estimeze, folosind principiile teoriei probabilitilor, parametrii corespunztori ai colectivitii totale, poart denumirea de sondaj statistic. Cu alte cuvinte, cercetare prin sondaj realizat cu un efort material i uman mai redus are drept rezultat obinerea unor indicatori derivai care permit caracterizarea complet i real a ntregii colectiviti. n vederea atingerii acestui deziderat cercetarea prin sondaj se desfoar n dou etape: prima etap, n care se culeg i se prelucreaz date statistice de la unitile colectivitii generale care au fost incluse n eantion din care rezult indicatori derivai: mrimi relative, mrimi medii, indici etc. care descriu statistic eantionul folosit; a doua etap, n care indicatorii obinui prin prelucrarea datelor din eantion se extind, cu o anumit probabilitate, asupra ntregii colectiviti n scopul caracterizrii acesteia din punct de vedere statistic. Din cele relatate mai sus rezult c noiunea de "cercetare statistic prin sondaj" nu trebuie confundat nici cu noiunea de cercetare statistic total care comport cele trei faze ale cercetrii statistice: culegere, prelucrare, analiz i interpretarea datelor i nici cu noiunea de "observare selectiv" care se rezum doar la culegerea informaiilor de la unitile care alctuiesc eantionul. Cercetarea prin sondaj implic folosirea unor noiuni pereche ca de pild: colectivitate general - colectivitate de selecie; media colectivitii generale - media colectivitii de selecie; dispersia colectivitii generale - dispersia colectivitii de selecie; valoarea statistic calculat - valoarea estimat .a. Colectivitatea general denumit i populaie, este alctuit din totalitatea unitilor simple sau complexe care formeaz fenomenul supus cercetrii. Pentru ca cercetarea statistic s-i ating scopul propus este necesar delimitarea n timp, spaiu i dup volum a acestei colectiviti. Volumul colectivitii generale, din care urmeaz s se extrag unitile n scopul formrii eantionului se noteaz de obicei cu N n cazul unitilor simple i cu R n cazul celor complexe. Dac s-au

STATISTICA

nregistrat i variabile alternative, atunci unitile care posed caracteristica se noteaz cu M. Colectivitatea de selecie (eantion , prob, mostr) reprezint acea parte a colectivitii generale de la care urmeaz s se culeag datele n scopul extinderii rezultatelor obinute din prelucrarea acestora asupra ntregului ansamblu. Volumul colectivitii de selecie se noteaz cu n cnd este format din uniti simple i cu r cnd se refer la uniti complexe. Pentru variabile alternative numrul unitilor care posed caracteristica se noteaz cu m. De remarcat este faptul c dintr-o anumit populaie (colectivitate general) pot fi extrase mai multe eantioane, care s difere ntre ele att ca volum ct i ca structur. Din aceast cauz indicatorii statistici cu care caracterizm colectivitatea de sondaj pot fi considerai de forma unor variabile aleatoare pentru care se pot stabili distribuii de frecvene corespunztoare, spre deosebire de media i dispersia din colectivitatea general studiat, care nu pot lua dect cte o singur valoare pentru condiii date de timp i spaiu. Formulele de calcul ale mediei i dispersiei sunt trecute n tabelul 5.1.
Tabelul 5.1
Denumirea indicatorului
A

Caracteristica nealternativ Colectivitatea Colectivitate general de selecie


1 2

Caracteristica alternativ Colectivitatea Colectivitate general de selecie


3 4

Media

x0 =
Dispersia
N

x
i =1

N
i

x=
2

x
i =1

P=

n
i

M N

w=

m n

0 =
2

(x
i =1

x0)

2 =

(x x) 2
i =1

2 2 = p(1 p) w = w(1 w) p

n studiul statistic al fenomenelor se folosete foarte frecvent perechea de noiuni valoare statistic calculat i valoarea estimat. Se consider c valoarea statistic calculat este rezultatul obinut dintr-o cercetare empiric. Aceste valori statistice sunt folosite pentru a

Cercetarea prin sondaj

estima un indicator corespunztor, dar pentru care nu avem date suficiente. Cel mai frecvent aceste noiuni se folosesc n teoria sondajului cnd indicatorii din eantion devin estimatori ai parametrilor corespunztori din colectivitatea general. Pentru ca cercetare selectiv s-i ating scopul propus este necesar o pregtire minuioas a acesteia, pe baza unui plan care s permit obinerea unor informaii ct mai veridice. Un astfel de plan al cercetrii prin sondaj trebuie s cuprind: delimitarea n timp i spaiu a colectivitii generale prin identificarea tuturor cazurilor individuale sub care se manifest fenomenele respective; verificarea gradului de omogenitate al colectivitii generale. Dac exist o observare total anterioar aceasta se poate realiza prin analiza indicatorilor variaiei caracteristicilor eseniale pentru care este necesar s se organizeze mai multe sondaje succesive pentru verificarea gradului de stabilitate a mediei i dispersiei caracteristicilor dup care se va face eantionarea; alegerea sau stabilirea bazei de sondaj. Prin baz de sondaj se nelege orice sistematizare a unitilor colectivitii generale (liste, hri) astfel nct s permit alegerea aleatoare a unitilor ce vor intra n eantion; determinarea mrimii eantionului; alegerea tipului i procedeului de selecie; stabilirea periodicitii efecturii sondajului; stabilirea planului observrii care de regul, este mai bogat dect al unei observri totale similare; stabilirea planului de prelucrare a datelor de selecie din punct de vedere metodologic i organizatoric; analiza, interpretarea, extinderea i prezentarea datelor; trebuie alese procedeele de verificare a semnificaiei indicatorilor de selecie i de extindere a rezultatelor seleciei asupra ntregului ansamblu. Rezolvarea cu competen a problemelor cuprinse n planul de sondaj are drept scop asigurarea reprezentativitii eantionului, de aceasta depinznd n totalitate valoarea rezultatelor obinute n urma cercetrii prin sondaj.

STATISTICA

Un eantion este considerat reprezentativ atunci cnd reproduce n structura sa aceeai structur pe care o prezint i colectivitatea general. Teoria i practica statistic demonstreaz c asigurarea reprezentativitii eantionului presupune respectarea cu strictee a urmtoarelor condiii: includerea n eantion a unitilor n mod obiectiv fr a acorda preferin uneia dintre ele, fiecare unitate fiind extras dup principiul hazardului cu o probabilitate calculabil i diferit de zero; eantionul stabilit s fie suficient de mare ca s permit redarea trsturilor eseniale ale populaiei totale, ceea ce va permite obinerea, pe baza datelor de sondaj, a unor indicatori cu un grad mare de stabilitate; includerea fiecrei uniti n eantion trebuie s se fac independent de alte uniti. De remarcat faptul c, n cazul n care populaia total (colectivitatea general) este mprit n grupe, eantionul trebuie s reproduc o structur corespunztoare acestor componente. Practica sondajului demonstreaz c reprezentativitatea unui eantion depinde n primul rnd, de alegerea corect a procedeelor i tipurilor de selecie. 5.3 PROCEDEE DE SELECTIE FOLOSITE PENTRU CONSTITUIREA ESANTIONULUI

n teoria i practica statistic, la formarea eantionului se folosesc mai multe procedee cunoscute sub denumirea de selecii aleatoare, selecii subiectiv organizate sau selecii dirijate i selecii mixte. Folosirea seleciei aleatoare exclude orice intervenie subiectiv n alegerea eantionului. Acest obiectiv se poate realiza numai dac selectarea unui element dintr-o populaie este aleatoare (ntmpltoare), dac toate elementele populaiei au aceeai ans de a fi alese. n mod analog, eantioanele formate din n elemente sunt aleatoare, atunci cnd selecia a fost fcut la toate eantioanele posibile cu respectarea riguroas a principiilor probabiliste. Selecia aleatoare i

Cercetarea prin sondaj

demonstreaz utilitatea prin faptul c rezultatele obinute pe baza ei pot fi apreciate n termeni probabilistici. Spre deosebire de seleciile probabiliste, n seleciile dirijate alegerea unitilor se face de ctre persoanele care culeg datele. Prezena unui element oarecare care sa favorizeze alegerea subiectiv din partea celui care face observarea, implic riscul producerii unei distorsiuni. Acest lucru trebuie evitat n msura posibilului. Din aceast cauz, acest tip de selecie se folosete mai rar n practic mai ales n situaiile n care se cer rezultate garantate cu o mare rigoare tiinific. Cnd folosirea acestui tip de selecie nu poate fi evitat, este necesar ca iniial s se cunoasc i s se fac o analiz amnunit din punct de vedere calitativ a colectivitii generale, formarea eantionului depinznd de modul n care sunt valorificate corect aceste informaii. Selecia mixt combin principiile sondajului aleator cu ale celui dirijat. n acest caz este necesar ca mai nti s se mpart colectivitatea n grupe tipice dup o anumit caracteristic (de exemplu, personalul dup categoria de ncadrare sau dup calificare etc.) i apoi s se extrag aleator cte un eantion din fiecare grup. Tehnica de selecie n fiecare caz n parte depinde ntr-o mare msur de circumstanele cazului i de resursele observatorului. n practic, seleciile aleatoare (probabilistice) se realizeaz prin mai multe procedee, care deriv dintr-o schem probabilistic corespunztoare rezultatelor obinute prin tragere la sori a unitilor pentru a forma eantionul.
5.3.1 Procedeul tragerii la sori

Acest procedeu const n extragerea dintr-o urn a unor bile sau alte obiecte identice reprezentnd fiecare o unitate a colectivitii. Extragerea bilelor din urn se face n dou variante: procedeul seleciei repetate (al bilei revenite); procedeul seleciei nerepetate (al bilei nerevenite). n cazul folosirii procedeului bilei revenite, probabilitatea de includere n eantion a fiecrei uniti este constant (p=1/N) tot timpul ct dureaz operaia de construire a eantionului, iar la sfrit n urn rmn (N-1) uniti.

STATISTICA

n cel de-al doilea caz, procedeul bilei nerevenite, bila odat extras nu se mai introduce n urn, mrind astfel ansa fiecrei uniti rmas de a intra n eantion (p1=1/N ; p2=1/(N-1);... pn= 1/(N-(n-1))). Rezult n acest caz c n urn rmn la sfrit N-n uniti. Datorit faptului c n cazul seleciei nerepetate este exclus posibilitatea extragerii de mai multe ori a aceleiai uniti, erorile sunt mai mici, deci rezultatele obinute au un grad de precizie mai ridicat. Procedeul tragerii la sori se folosete n cazurile n care colectivitatea general cuprinde un numr mai mic de uniti pentru care se pot asigura bile sau alte obiecte identice care s poat fi incluse ntr-o urn.
5.3.2 Procedeul tabelului cu numere aleatoare

Tabelele cu numere aleatoare elaborate de Kendall, Smith, Yates etc. au fost ntocmite cu ajutorul unui dispozitiv de amestecat numere. Aceste numere se nscriu n continuare n mod aleator. Tot aleator se stabilete coloana i rndul de unde ncepe citirea lor, n vederea formrii eantionului. Pentru folosirea tabelului cu numere aleatoare este necesar numerotarea unitilor colectivitii generale de la 1 la N i apoi extragerea celor n uniti care formeaz eantionul. De exemplu, considernd c n colectivitatea general sunt 900 uniti i se intenioneaz constituirea unui eantion format din 10% (n=90) se va proceda n felul urmtor: se va alege la ntmplare coloana i rndul din coloana respectiv cu care se va ncepe selecia. Numrul respectiv i numerele aleatoare formate din trei cifre care se vor citi pe coloana respectiv vor fi notate dac sunt cuprinse ntre 1 i 900 i difer de cele reinute anterior i se va renuna la ele dac sunt peste 900. Se continu n felul acesta pn la formarea complet a eantionului (90 uniti).
5.3.3 Selecia mecanic

Procedeul seleciei mecanice presupune ordonarea unitilor dup o caracteristic oarecare (ordine alfabetic, numrul de la locuin etc.) prin care s se asigure includerea pe ct posibil intmpltoare a unitilor n baza de sondaj. Operaia de alctuire a eantionului n acest caz este

Cercetarea prin sondaj

precedat de stabilirea pasului de numrare - care trebuie s fie un numr ntreg - calculat ca raport ntre volumul colectivitii generale i volumul colectivitii de selecie (N/n). Prin calculul pasului de numrare se obine mprirea colectivitii generale n grupe de volum egal. Pentru constituirea eantionului se procedeaz n felul urmtor: se selecteaz la ntmplare (prin tragere la sori) o unitate din prima grup la care se adaug succesiv pasul de numrare pn la obinerea celor n uniti ale eantionului. Folosind exemplul precedent, pasul de numrare este egal cu 10 i se procedeaz astfel: din primele 10 uniti, extragem una la ntmplare (prin tragere la sori); presupunnd c am extras unitatea cu numrul trei, adugm succesiv 10 i obinem eantionul format din unitile cu numerele de ordine: 3, 13, 23, 33, ... . Se observ c, n cazul seleciei mecanice, constituirea eantionului nu este pe deplin aleatoare, deoarece fiecare unitate selectat depinde de numrul de ordine al celei precedente. De aceea, selecia mecanic este considerat n literatura de specialitate o selecie cvasialeatoare, caracterul aleator fiind asigurat doar de alctuirea ntmpltoare a bazei de sondaj. Datorit existenei unor baze de sondaj adecvate, selecia mecanic este folosit cu succes n statistica agricol i statistica nivelului de trai. Seleciile dirijate i cele mixte se folosesc n special n sondajele de opinie, n cercetrile sociologice i uneori n studiul cererii de consum a populaiei. n sondajele aplicate la studiul fenomenelor economice unde, de regul, se lucreaz cu un numr mare de uniti este necesar s se elaboreze baze de sondaj, fie cu caracter permanent, fie pentru o singur dat. Baza de sondaj pentru o colectivitate general din care va lua natere eantionul, va trebui, din punct de vedere al organizrii, s aib unitile sale simple sau complexe nscrise ntr-o ordine aleatoare dup un anumit criteriu - alfabetic, teritorial, de timp, etc. - care nu are nici o legtur cu rangul de mrime al valorilor variabilelor luate n studiu. Bazele de sondaj pot fi elaborate de ctre cel ce organizeaz selecia sau pot fi preluate din diferite situaii ntocmite n alt scop. Exemplele cele mai concludente pot fi datele din listele electorale, lista abonailor posturilor telefonice etc.

STATISTICA

O baz de sondaj trebuie s ndeplineasc o serie de condiii, i anume:


s fie adecvat scopului urmrit (s cuprind ntreaga populaie); s fie ferit de orice repetiie (fiecare unitate s fie cuprins n baza de sondaj o singur dat); s fie exact; s fie ct mai actual posibil; este convenabil s fie disponibil ntr-un singur centru. n concluzie, o baz de sondaj trebuie s fie complet, constituit pe principiul hazardului i corespunztor scopului propus. 5.4 ERORILE CERCETARII PRIN SONDAJ

n accepiunea cea mai larg, se consider eroare de selecie abaterea care exist ntre valoarea unui parametru (de exemplu, media) calculat prin prelucrarea datelor din eantion i valoarea aceluiai parametru care s-ar fi obinut dac s-ar fi organizat o observare total i ar fi fost prelucrate datele de la toate unitile colectivitii. Erorile ntlnite n cadrul sondajului sunt de dou feluri: erori comune tuturor tipurilor de observri - erori de nregistrare; erori specifice cercetrii prin sondaj - erori de reprezentativitate. Deoarece nregistrarea datelor se face de un personal specializat i pentru un numr restrns de uniti, de regul, n sondaje, erorile de nregistrare apar ntr-un numr mic de cazuri i pot fi nlturate cu uurin printr-un eventual control riguros. Erorile de reprezentativitate specifice sondajului pot fi de dou feluri: erori sistematice i erori ntmpltoare. Erorile de reprezentativitate sistematice pot fi evitate dac se respect ntocmai principiile teoriei seleciei, prin nlturarea cauzelor ce duc la producerea lor. Principalele cauze care pot duce la apariia erorilor sistematice sunt: alegerea deliberat a aa-ziselor uniti "reprezentative"; alegerea la "nimereal" (nu la ntmplare) a unitilor de eantion;

Cercetarea prin sondaj selectarea preferenial a acelor uniti care s duc la

rezultatul dorit de cercettor;


substituirea din comoditate a unei uniti de cercetare prin alta

asemntoare; cuprinderea incomplet n sondaj a unitilor, din motive de comoditate. Erorile ntmpltoare de reprezentativitate pot apare chiar dac se respect cu strictee aceste reguli. Ele deriv din nsi esena metodei de cercetare prin sondaj. Prin numrul mic de uniti care alctuiesc eantionul nu se poate reproduce dect ntmpltor identic seria de distribuie a variabilei din colectivitatea general sau parametrii acesteia. Dei nu pot fi evitate, erorile de reprezentativitate, pot fi calculate cu anticipaie dac selecia este probabilistic. Estimarea parametrilor din colectivitatea general se va putea face deci pe baza indicatorilor obinui din prelucrarea datelor de sondaj cu o eroare ntmpltoare de reprezentativitate care se gsete ntr-un anumit interval probabilistic. Rezult deci c fiecrui indicator derivat sau sintetic trebuie s i se ataeze i eroarea sa de reprezentativitate, pentru a putea fi generalizat pentru ntregul ansamblu. n practica sondajului erorile de reprezentativitate se pot calcula ca erori efective i ca erori probabile.

5.4.1 Erori efective. Verificarea reprezentativitii eantionului Erorile efective de reprezentativitate se pot calcula numai pentru caracteristicile la care s-au obinut date i dintr-o observare total. Considernd c i n acest caz media este indicatorul sintetic cel mai reprezentativ, eroarea efectiv de sondaj se calculeaz ca diferen ntre media eantionului i media colectivitii totale. Calculul erorii efective de sondaj nu este altceva dect verificarea gradului de reprezentativitate a unui eantion n raport cu structura colectivitii totale. Practica demonsteaz c numai ntmpltor este posibil reproducerea unei structuri identice cu aceea a colectivitii generale, ceea ce nseamn c eantioanele extrase pot avea grade diferite de

STATISTICA

reprezentativitate. Ca atare, nainte de a se trece la prelucrarea datelor culese se va face verificarea reprezentativitii eantionului. Caracteristicile utilizate la alegerea eantionului prezint, de regul, forme variate de manifestare i de aceea verificarea reprezentativitii eantionului nu este ntotdeauna o operaie uoar. La verificarea reprezentativitii eantionului se pornete de la compararea structurii pe grupe a colectivitii de selecie cu cea a colectivitii generale, denumit i structur programat. n cazul n care aceast structur nu difer cu mai mult de +/- 5% se accept eantionul constituit ca fiind reprezentativ. De exemplu, pentru a verifica gradul de reprezentativitate a unei observri selective privind cererea de consum a unei grupe de populaie se efectueaz dou selecii succesive ce vor fi analizate n continuare. Este tiut c cererea de consum depinde n primul rnd de mrimea veniturilor obinute de grupa respectiv de populaie. Deci, n acest caz, se va folosi drept caracteristic de eantionare, dup care se va alctui colectivitatea de selecie, mrimea veniturilor, n raport cu variaia creia se verific gradul de reprezentativitate a seleciei. Considerm c volumul total al unitilor din grupa respectiv de populaie este de 20.000, c volumul celor dou selecii succesive este de 10% i pe baza centralizrii datelor pe grupe de venituri s-au obinut seriile empirice de distribuie de frecvene, prezentate n tabelul 5.2.

Cercetarea prin sondaj

Distribuia vnzrilor dup marimea veniturilor sptmnale n dou eantioane succesive Tabelul 5.2
Grupe de Distribuia numrului de vnztori vnztori colectivitatea n prima selecie n a doua selecie dup marimea general veniturilor frecvene frecvene frecvene frecvene frecvene frecvene sptmnale absolute relative absolute relative absolute relative (mii lei)
0 1 2 3 4 5 6

sub 200 200 - 220 220 - 240 240 - 260 260 - 280 280 i peste TOTAL

1000 2400 5600 7400 2200 1400 20000

5,0 12,0 28,0 37,0 11,0 7,0 100,0

60 164 440 840 280 216 2000

3,0 8,2 22,0 42,0 14,0 10,8 100,0

124 260 500 760 240 116 2000

6,2 13,0 25,0 38,0 12,0 5,8 100,0

Comparnd cele dou distribuii de selecie cu distribuia de frecvene a colectivitii generale se pot constata unele abateri care le imprim acestora tendine diferite. n prima selecie, valorile mai mari sunt mai bine reprezentate, pe cnd n cea de-a doua selecie ponderile mai mari sunt ataate valorilor mai mici. Pentru a putea face o apreciere asupra modului n care colectivitatea de selecie reprezint sau nu colectivitatea general, se vor calcula abaterile de structur ale celor dou colectiviti de selecie de la structura teoretic a colectivitii de selecie. Aceste abateri se vor nota cu df i sunt nscrise n tabelul 5.3. n literatura de specialitate, structurii colectivitii de selecie i se mai spune i structura programat, deoarece structura ei este identic cu cea a colectivitii generale, ceea ce face ca eroarea ei de selecie s fie egal cu zero. Selecia teoretic (programat) se obine prin aplicarea frecvenelor relative ale colectivitii generale, la volumul colectivitii de selecie (vezi tabelul 5.2 coloana 1).

STATISTICA

Rezult deci c pe ansamblu abaterile de structur, la acelai volum de selecie, se compenseaz reciproc, deoarece :

df

= 0.

Pentru a putea msura gradul de abatere a structurii seleciei de la structura programat, se va face raportul dintre suma abaterilor de structur pozitive i negative luate n valoare absolut i volumul seleciei (n), adic: df 100 Kf = n unde: K f = coeficientul de realizare a structurii programate a colectivitii de selecie.
Verificarea reprezentativitii eantionului Tabelul 5.3

Grupe de vnztori Distribuia numrului de vnztori dup Selecie teoretic n prima selecie n a doua selecie marimea veniturilor Abateri fa Abateri fa de sptmnal frecvene frecvene frecvene de cele frecvene cele teoretice absolute absolute relative absolute teoretice df df e (mii lei)
0 1 2 3 4 5 6

sub 200 200 220 220 240 240 260 260 280 280 i peste TOTAL

100 240 560 740 220 140 2000

5,0 12,0 28,0 37,0 11,0 7,0 100,0

60 164 440 840 280 216 2000

d = 0 d = 472
f

- 40 - 76 - 120 + 100 + 60 + 76

124 260 500 760 240 116 2000

d = 0
f
f

+ 24 + 20 - 60 + 20 + 20 - 24

= 168

Cercetarea prin sondaj

n urma efecturii calculelor se constat c, la prima selecie aproape 1/4 din unitile selectate prezint abateri de la structura programat i n cazul n care nu se vor compensa reciproc vor provoca erori mai mari sau mai mici ntr-un sens sau altul, n timp ce la cea de-a doua selecie, coeficientul de abatere este sub 10%. Este de ateptat ca indicatorii obinui din prelucrarea datelor de selecie de la cea de-a doua colectivitate s estimeze mai bine parametrii respectivi din colectivitatea general. Este suficient s se verifice acest lucru prin calcularea mediilor de selecie i a mediei colectivitii generale: x0 = 241,6 mii lei
Selecia Media de selecie (mii lei) Eroarea efectiv de reprezentativitate (d x) dx = xs x0

selecia I

xI = 247,6

d x = 247,6 - 241,6 = 6 mii lei d x = 240,8 - 241,6 = - 0,8 mii lei

selecia II xII =240,8

Pentru a stabili gradul de reprezentativitate a eantionului pe baza erorii medii de selecie se raporteaz aceast eroare la valoarea mediei colectivitii totale:

Selecia

Gradul de reprezentativitate
dx % = xs x 0 100 x0

Selecia I
dx % =

6 0.100 = +2,5% 241,6 0,8 0.100 = 0,33% 241,6

Selecia II
dx % =

STATISTICA

Deci eantionul al doilea este mult mai reprezentativ dect primul, dei amndou se ncadreaz n intervalul admis (+/- 5%). De cele mai multe ori n cercetarea concret nu se dispune de date cu privire la ntreaga colectivitate, pentru a putea verifica astfel n ce msur media de selecie este sau nu reprezentativ. n cazurile n care media pe ntreaga colectivitate nu este anterior cunoscut este necesar s se efectueze mai multe selecii succesive pentru a verifica gradul de stabilitate a mediei i dispersiei pentru variabila dup care se face eantionarea. n acest caz, eroarea de reprezentativitate se va calcula: dx = x x n care: x - media mediilor seleciilor efectuate pentru verificarea stabilitii ei.

5.4.2 Eroarea medie probabil i eroarea limit


Dup cum s-a artat, n practic, erorile efective de reprezentativitate nu se pot calcula dect pentru caracteristicile la care se cunosc, pe lng datele din eantion i datele pentru ntreaga colectivitate. Cum de regul, programul observrii este mai amplu ntr-o cercetare selectiv n comparaie cu o observare total similar, nseamn c pentru unele caracterstici nu exist deci posibilitatea de a estima printr-un calcul statistic mrimea erorii de selecie. Cu att mai mult, aceast problem trebuie rezolvat pentru cazul n care metoda selectiv este singura cale de caracterizare statistic a ntregului ansamblu de fenomene de acelai tip. De aceea, concluziile formulate pe baza prelucrrii datelor obinute prin sondaj trebuie s fie considerate ca enunuri probabile obinute ca urmare a aplicrii metodei de selecie aleatoare care permite interpretarea mediei de sondaj ca o variabil aleatoare ce urmeaz la limit o funcie de probabilitate cunoscut, elaborat de statistica matematic. Pornind de la aceste considerente, rezult c ntreaga teorie a sondajului statistic se bazeaz pe principiile teoriei probabilitilor i ale statisticii matematice, de la formarea eantionului i pn la estimarea parametrilor colectivitii totale pe baza datelor din eantion. n teoria seleciei se demonstreaz c dac volumul colectivitii de selecie este suficient de mare, mediile de sondaj urmeaz la limit legea distribuiei din colectivitatea general, iar media de selecie ca

Cercetarea prin sondaj

expresie sintetic a nivelurilor individuale ale tuturor unitilor cercetate, va fi ct mai aproape de media colectivitii generale. n practic ns pentru acelai volum de selecie se pot obine mai multe eantioane extrase succesiv din aceai colectivitate total, obinnd astfel valori diferite ale mediei de selecie. n acest proces de formare a mediilor de selecie fiecare medie poate s apar o singur dat sau de mai multe ori. Se confirm astfel c i media de selecie este tot o variabil aleatoare creia i se poate stabili legea de distribuie. Pentru a putea urmri modul de formare a distribuiei de eantionare a mediei se va lua un exemplu, n care volumul colectivitii generale este de patru uniti (A; B; C; D) din care se vor forma toate eantioanele posibile din cte dou uniti, deci N=4, iar n=2. Dac se efectueaz toate seleciile posibile, folosind procedeul bilei revenite (selecie repetat) se vor obine urmtoarele eantioane, de cte dou uniti: (A+A); (A+B); (A+C); (A+D); (B+A); (B+B); (B+C); (B+D); (C+A); (C+B); (C+C); (C+D); (D+A); (D+B); (D+C); (D+D);. Generaliznd, nseamn c n cazul seleciei repetate se poate efectua un numr de eantioane egal cu Nn, respectiv n exemplul luat 42=16. n cazul seleciei nerepetate (procedeul bilei nerevenite) combinaiile sunt mai puine datorit faptului c aceeai unitate nu poate participa dect ntr-un singur eantion. n exemplul prezentat vor apare urmtoarele combinaii posibile: (A+B); (A+C); (A+D); (B+A); (B+C); (B+D); (C+D). Formula de calcul a numrului de eantioane posibile pentru selecia nerepetat este dat de formula de calcul a combinrilor, aplicat la selecie:
n CN =

N! n! ( N n )!

Fiecare eantion va fi definit de o medie i o dispersie calculabil pentru fiecare caracteristic nregistrat, care vor prezenta abateri fa de media i dispersia colectivitii totale. Erorile de selecie obinute ca diferene ntre media de selecie i media general iau valori diferite de la un eantion la altul, ceea ce face necesar calcularea unui indicator sintetic numit eroarea medie de reprezentativitate.

STATISTICA

Pentru a evita compensarea unor erori de sensuri diferite la calculul erorii medii de reprezentativitate se folosete media ptratic a abaterilor, notat cu x

x = x =

s =1

( x s x0 ) 2 n s
s =1

ns

(5.1)

n care : k - reprezint numrul eantioanelor posibile; ns - frecvena mediilor de selecie posibile. Dac se consider media de selecie n sens probabilistic, adic fiecare valoare a sa ca eveniment favorabil fa de toate celelalte evenimente egal posibile, orict am repeta selecia, frecvena de apariie a fiecrei valori a mediei, luat ca frecven relativ, are tendina de a coincide cu probabilitatea de producere a erorii sale fa de valoarea mediei colectivitii generale. n cazul seleciei aleatoare se poate demonstra c pentru o anumit fracie de selecie (n/N), fiecrei valori a mediei de selecie i corespunde o probabilitate de apariie bine determinat, n funcie de mrimea absolut a abaterii sale fa de media colectivitii generale. De aici rezult c mrimea i probabilitile de apariie a diferitelor medii de selecie sunt determinate i de volumul eantionului. Potrivit legii numerelor mari, cu ct eantionul cuprinde un numr mai mare de uniti n raport cu cel al colectivitii generale cu att media de selecie va estima mai bine media pe total. Aceasta corespunde legii numerelor mari, formulat de J.Bernoulli, potrivit creia probabilitatea ca diferena n valoare absolut dintre frecvena relativ f* i probabilitatea p de producere a unui eveniment s fie mai mic dect un numr pozitiv i arbitrar , tinde ctre unu cnd volumul eantionului tinde ctre infinit, adic:
n

lim P(17 * p / < ) 1 oricare ar fi > 0

Respectnd cerinele legii numerelor mari, n teoria seleciei se demonstreaz c dac volumul eantionului este suficient de mare (pentru fenomenele monotipice peste 40 de uniti), media de selecie se distribuie potrivit funciei Gauss - Laplace cunoscut n statistic sub denumirea de distribuie normal.

Cercetarea prin sondaj

Distribuia normal este de forma unei distribuii simetrice n care cea mai mare probabilitate de apariie n cazul sondajului o are acea medie de selecie care coincide n valoare cu media colectivitii generale i pentru care eroarea de reprezentativitate este egal cu zero. Fa de aceast valoare central, celelalte valori ale mediei de selecie se distribuie simetric de ambele pri cu probabiliti bine determinate, egale pentru aceeai abatere absolut ntr-un sens sau altul. Fa de probabilitatea maxim, probabilitile de apariie a mediilor de selecie descresc proporional i simetric, ctre capetele distribuiei. Deci se poate spune c probabilitile descresc pe msur ce cresc erorile de reprezentativitate care sunt exprimate n aceleai uniti de msur ca i variabila studiat. Pentru a le elibera de aceast form concret i a le face comparabile pentru orice variabil numeric, abaterile absolute se transform n abateri normale normate: xs x0 = zi x Dac mediile de selecie se distribuie dup legea normal nseamn c i erorile ntmpltoare de reprezentativitate urmeaz aceeai form de repartiie i interpretarea lor se face pe baza proprietilor distribuiei normale (vezi tabelul 5.4), potrivit creia trebuie stabilit intervalul de ncredere, nivelul de siguran i pragul de semnificaie.

STATISTICA

Intervalele de ncredere, nivelurile de siguran i pragurile de semnificaie Tabelul 5.4 Intervalul de ncredere Nivelul de siguran Pragul de semnificaie (%) (%) ( x s z x )
0 1 2

( xs x ) ( xs 1,96 x ) ( xs 2 x ) ( xs 2,58 x ) ( xs 3 x ) ( xs 4 x )

68,26 % 95,00 % 95,44 % 99,00 % 99,73 % 99,99 %

31,74 % 5,00 % 4,56 % 1,00 % 0,27 % 0,00 %

Pentru interpretarea modului de formare a erorii de reprezentativitate, pentru o selecie probabilist de n uniti extrase dintro colectivitate general N, a crui volum este suficient de mare i pentru care se poate formula ipoteza c media de selecie se distribuie normal se folosete i reprezentarea grafic (vezi fig. 5.1).

x 3

x 2

x +

x + 2

x + 3

Figura 5.1

Interpretnd graficul se constat c pe diferite intervale de variaie a mediei de selecie, considerate ca intervale de ncredere, se opereaz cu dou noiuni complementare: nivelul de siguran i pragul de semnificaie.

Cercetarea prin sondaj

Dac se efectueaz toate seleciile posibile, intervalul de variaie al tuturor mediilor obinute este acoperit cu suma probabilitilor lor de apariie
s =1

p s = 1,0; unde k = numrul tuturor mediilor de selecie. Dac

se restrnge intervalul de variaie a mediei de selecie, atunci eroarea de reprezentativitate se poate calcula n abateri normale normate ale mediei de selecie de la media colectivitii totale. Aceste intervale de variaie ( x 0 x ; x 0 2 x ; x 0 3 x ;...) sunt garantate ca nivel de siguran cu probabilitile corespunztoare funciei de repartiie normale. Potrivit teoremei formulat de Leapunov probabilitatea ca variabila aleatoare (media de eantionare) s fie cuprins ntre dou limite fixate anticipat, adic: P = ( x s z x ) < x0 < ( x s + z x ) poate fi aproximat cu relaia:

1 2
( x ) .

Produsul z x este cunoscut sub denumirea de eroare limit

z2 2

dz = ( z )

x = z x

Coeficientul z reprezint argumentul funciei Laplace i se gsete tabelat. Urmrind valorile probabilitii ( z) , se constat c z crete corespunztor (vezi anexa 2), ceea ce nseamn c, cu ct scade probabilitatea cu att crete intervalul de ncredere al mediei i scade exactitatea cu care se estimeaz media general pe baza mediei de selecie. Calculul erorii medii de reprezentativitate, necesit cunoaterea tuturor mediilor de selecie posibile, frecvenelor corespunztoare lor i a mediei colectivitii generale. n practic ns cercetarea prin sondaj se folosete fie pentru a completa o observare total de mare amploare, fie ca singura posibilitate de caracterizare statistic a fenomenelor respective. n aceste condiii, cunoscnd, de regul, numai media calculat pe baza datelor rezultate de la un singur eantion, pentru determinarea erorii medii de

STATISTICA

reprezentativitate trebuie s se recurg la relaia care exist ntre abaterea medie ptratic ( 0 ) , eroarea medie ptratic de reprezentativitate ( x ) i volumul eantionului. n teoria seleciei se demonstreaz c n cazul seleciei aleatoare repetate ntre cei doi indicatori amintii exist relaia: 2 2 0 = x n de unde: 0 0 x = = n n Se desprinde concluzia c eroarea medie de reprezentativitate este direct proporional cu abaterea medie ptratic a colectivitii generale i invers proporional cu radical din volumul eantionului. Cum abaterea medie ptratic, n anumite condiii de timp i spaiu este un indicator stabil, rezult c marimea erorii medii de selecie poate fi influenat n plus sau n minus prin modificarea volumului eantionului. De regul, urmrindu-se reducerea erorii de reprezentativitate se folosete relaia:

k k2 n n cazul seleciei nerepetate numrul de eantioane fiind mai mic datorit faptului c fiecare unitate nu particip dect o singur dat la 2 selecie, relaia 0 = 2 n se transform ntr-o inegalitate deoarece x cmpul de variaie al erorilor de reprezentativitate se micoreaz. n relaiile existente ntre indicatorii variaiei din colectivitatea N n . Cu general i cei de selecie, n acest caz va interveni raportul N 1 acest raport se corecteaz eroarea medie pentru sondajul repetat i se obine formula de calcul a erorii medii pentru sondajul nerepetat:

2 0

) ( n N 1 n practic, dac volumul colectivitii generale este foarte mare se renun la (-1) din numitorul formulei i formula de calcul a erorii medii de reprezentativitate devine:

x =

2 0 N n

Cercetarea prin sondaj

n ) (5.4.) N n Pentru caracteristica alternativ, eroarea medie de reprezentativitate se va nota cu w , deci:

x =

2 0

(1

pentru selecia repetat: w =

p(1 p ) n
p(1 p ) n (1 ) N n

(5.5)

pentru selecia nerepetat w =

Dac nu se dispune de dipersia din colectivitatea general, atunci se poate nlocui cu un estimator al acesteia, adic dispersia de eantion. n acest caz se corecteaz volumul eantionului din formula erorii medii cu un grad de libertate. Calculul erorii medii de reprezentativitate presupune efectuarea unor calcule necesare determinrii erorii limit, ce se poate accepta n cercetarea prin sondaj. Deoarece media sondajului folosit pentru estimarea parametrilor din colectivitatea general poate lua valori mai apropiate sau mai ndeprate de media general, este necesar s se stabileasc mrimea erorii limit. Eroarea limit de reprezentativitate se determin ca o abatere ntre media de selecie i media colectivitii generale, garantat cu probabilitatea corespunztoare limitelor intervalului de variaie. Din formulele prezentate se observ c eroarea limit este o mrime variabil, direct proporional cu probabilitatea cu care se garanteaz rezultatele i invers proporional cu precizia rezultatelor. Eroarea limit se poate mri fie prin modificarea volumului eantionului (n), fie prin modificarea probabilitii cu care se garanteaz rezultatele, deoarece pentru condiii date de timp i spaiu dispersia colectivitii totale este o valoare constant. n concluzie, se poate afirma c eroarea medie i eroarea limit pot fi calculate anticipat dac despre o variabil statistic se cunosc media i dispersia general sau un estimator al acestora i s-a stabilit cu ce volum al eantionului se va lucra i cu ce probabiliti se vor garanta rezultatele. Pentru acelai volum al eantionului se obine o singur eroare medie i

STATISTICA

mai multe erori limit schimbnd coeficientul de probabilitate i pentru acelai coeficient de probabilitate se pot obine mai multe erori limit dac se modific volumul eantionului. Deci, valoarea erorii limit depinde de volumul de selecie i de sigurana cu care se estimeaz abaterea dintre media eantionului i media colectivitii generale. Indicatorii de selecie calculai media, eroarea medie de reprezentativitate i eroarea limit pot servi la estimarea parametrilor din colectivitatea general. n acest scop se folosesc urmtoarele procedee: procedeul coeficientului de corectare a erorilor de nregistrare; procedeul extinderii directe a rezultatelor sondajului la estimarea colectivitii totale. Procedeul coeficientului de corectare a erorilor de nregistrare se bazeaz pe probabilitatea ca erorile depistate n sondajul efectuat s coincid cu aceeai probabilitate ca i pe total. Deci, refcnd nregistrarea la o parte a unitilor selectate aleator se face raportul dintre datele observrii totale i cele de sondaj i coeficientul respectiv se aplic datelor din observarea total. Procedeul extinderii directe este cel mai frecvent utilizat n aplicarea cercetrii prin sondaj ca mijloc de caracterizare a ntregii colectiviti. Aplicarea acestui procedeu permite estimarea intervalului de ncredere pentru nivelul mediu al caracteristicii ct i determinarea limitelor ntre care variaz nivelul totalizat al caracteristicii pe ntrega colectivitate, acest lucru fiind posibil numai n cazul n care se cunoate volumul colectivitii totale (N). De asemenea, pornind de la relaia de calcul a erorii limit se poate determina volumul eantionului. Formulele de calcul difer n funcie de tipul seleciei i de procedeul de selecie folosit i ca urmare formulele de calcul vor fi prezentate n subcapitolul care urmeaz.
5.5 TIPURI DE SONDAJ

Tipul de sondaj folosit n studiul fenomenelor social-economice este n funcie de gradul de omogenitate al colectivitatii studiate selectiv precum i de forma de organizare a colectivitii ce formeaz obiectul cercetrii.

Cercetarea prin sondaj

Frecvent n practica statistic se folosesc urmtoarele tipuri de selecii: selecia aleatoare simpl; selecia tipic; selecia de serii etc. n fiecare dintre seleciile prezentate se calculeaz trei indicatori de baz i anume: eroarea medie de reprezentativitate, eroarea limit i volumul eantionului. Pe baza rezultatelor folosite se realizeaz estimarea parametrilor din colectivitatea general. Prezentm n continuare modul de calcul al indicatorilor de selecie pentru principalele tipuri de sondaj ntlnite n statistica socialeconomic.
5.5.1 Selecia aleatoare simpl

Practica sondajului demonstreaz c selecia aleatoare simpl poate fi folosit cu succes numai n studierea unor colectiviti monotipice care prezint un grad ridicat de omogenitate. n acest caz, eantionul se formeaz din uniti simple care se extrag din colectivitatea general prin procedeul repetat sau nerepetat pe baza unei scheme probabiliste. Acest tip de selecie dispune de cele mai simple formule de calcul a indicatorilor de selecie care cu unele modificri se folosesc ca baz de calcul i n celelalte tipuri de selecie. Se poate spune pe drept cuvnt c dei acest tip de selecie nu d rezultate bune n cazul colectivitilor neomogene, prezint avantajul c multe din principiile fundamentale ale seleciei pot fi explicate pe baza seleciei aleatoare simple. n aceast situaie sondajul simplu apare ca o variant a procedeului bilei revenite sau nerevenite.

STATISTICA

Intervalul de ncredere al mediei colectivitii generale este determinat de mrimea medie a eantionului i de eroarea limit respectiv, astfel: pentru caracteristica nealternativ: x s x < x0 < x s + x

pentru caracteristica alternativ:

w w < p < w + w n mod asemntor se poate calcula intervalul de ncredere al oricrui alt parametru. Determinarea intervalului de variaie al mediei estimate pe baza datelor de selecie permite i stabilirea intervalului de variaie al nivelului totalizat al caracteristicii care se poate determina dup relaia: pentru caracteristica nealternativ: N( x s x ) < x i < N( x s + x )
i =1 N

pentru caracteristica alternativ: N ( w w ) < M < N ( w + w ) Dup cum s-a artat precizia rezultatelor seleciei, posibilitatea extinderii lor asupra ntregii colectiviti depinde i de numrul de uniti la care se face culegerea datelor. Dac se consider, drept criteriu de eficien a sondajului mrimea erorii de estimare a mediei generale, atunci trebuie ca volumul eantionului s corespund relaiei: zx x Pentru determinarea limitei minime a volumului eantionului se ine seama de procedeul de selecie aplicat. Pentru sondajul simplu repetat va fi:

x = z de unde: z 2 2 n = 2 0 x

2 0 n

(5.11)

Cercetarea prin sondaj

Aceast mrime este minim pentru asigurarea gradului de reprezentativitate dorit. Pentru sondajul simplu nerepetat:
x = z
2 0 n (1 ) n N

de unde: 2 2 z0 (5.12) n= 2 2 z0 2 x + N Comparnd cele dou relaii rezult c pentru acelai grad de reprezentativitate volumul eantionului este cel mai mic dac se folosete procedeul bilei nerevenite. Pentru a urmri tehnica de calcul a indicatorilor de selecie amintii, prezentm datele convenionale din tabelul 5.5 obinute n urma nregistrrii i prelucrrii datelor referitoare la volumul desfacerilor trimestriale la 120 societi comerciale (10% din populaia total). Tabelul 5.5
Grupe de societi dup volumul desfacerilor trimestriale (mil lei)
A

Numrul societilor
1

400 - 410 410 - 420 420 - 430 430 - 440 440 - 450 450 - 460 TOTAL

8 16 22 30 26 18 120

Not: Limita inferioar inclus n interval


Deoarece nu cunoatem dispersia dintr-o cercetare total anterioar, vom folosi dispersia de selecie pentru calculul erorii medii i erorii limit. Efectund calculele am obinut: x s = 433,67 mil lei i
2 s = 211,56

STATISTICA

44 = 0,37 120 2 w = w( 1 w ) = 0,37( 1 0,37 ) = 0,2331 Ne propunem s calculm indicatorii de selecie ( x i x , w i w ), n condiiile n care rezultatele vor fi garantate cu o probabilitate p = (z)=0,95 la care corespunde z = 1,96. w=

selecia repetat:
2 s

x =

211,56 = 1,33 mil lei n 120 x = z x = 1,96 1,33 = 2,60 mil lei = selecia nerepetat:
2 s N n

211,56 1200 120 = = 1,33 mil lei n N 1 120 1199 x = z x = 1,96 1,26) = 2,47 mil lei Se poate aprecia, pe baza probabilitii cu care se garanteaz rezultatele, c n 9500 de cazuri din 10000 posibile, media de selecie se va abate de la volumul vnzrilor din colectivitatea general cu cel mult +2,60 milioane lei n cazul n care eantionul s-a construit dup procedeul bilei revenite i +2,47 milioane de lei cnd eantionul s-a format dup procedeul bilei nerevenite. Eroarea medie i eroarea limit a greutii specifice a societilor comerciale cu un volum al desfacerilor mai mare dect media (n cazul caracteristicii alternative) vor fi:

x =

selecia repetat

w( 1 w ) 0,2331 = = 0,044 n 120 w = z w = 1,96 0,044) = 0,0862 sau 8,6%

w = w =

Cercetarea prin sondaj selecia nerepetat

w = w =

w( 1 w ) N n 0,2331 120 = 1 = 0,042 n 120 1200 N 1

w = z w = 1,96 0,042) = 0,082 sau 8,2%


Deci, greutatea specific a societilor comerciale care obin un volum al desfacerilor mai mare dect media, se va abate ntr-un sens sau altul cu + 8,6% n cazul seleciei repetate i cu + 8,2% n cazul seleciei nerepetate, rezultatele fiind garantate cu aceeai probabilitate de 0,95. Rezultatele obinute confirm concluzia formulat teoretic potrivit crei n selecia nerepetat erorile sunt mai mici. Ca urmare a acestui fapt intervalul de ncredere pentru estimarea parametrilor colectivitii generale va fi mai mic, deci rezultatele vor avea un grad de precizie mai ridicat att pentru caracteristica nealternativ ct i pentru cea alternativ. ntr-adevr, folosind procedeul extinderii directe vom obine urmtoarele intervale de ncredere pentru x 0 : selecia repetat x s x < x0 < x s + x 433,67 2,60 < x0 < 433,67 + 2,60 431,07 < x0 < 436,27 mil. lei/s.c. selecia nerepetat xs x < x0 < xs + x 433,67 2,47 < x0 < 433,67+ 2,47 431,20< x0 < 436,14 mil. lei/s.c. Rezult c volumul desfacerilor realizate, n medie, de o societate comercial este cuprins ntre 431,07 milioane de lei i 436,27 milioane de lei n cazul seleciei repetate i ntre 431,20 i 436,14 milioane de lei n cazul seleciei nerepetate. Volumul total al desfacerilor realizate de cele 1200 societi va fi pentru: selecia repetat N ( x s x ) = 1200(433,6 7 2,60)

STATISTICA
1200 i =1

517284 <

xi < 523524 mil. lei

selecia nerepetat

N ( xs x ) = 1200(433,6 7 2,47)

517440 <

1200 i =1

xi < 523368 mil. lei

Proporia societilor care vor realiza un volum al desfacerilor mai mare dect media, n colectivitatea general, se va situa ntre urmtoarele valori pentru: selecia repetat w w < p < w + w 0,37 0,0862 < p < 0,37 + 0,0862 0,2838 < p < 0,4562 selecia nerepetat 0 ,37 0 ,082 < p < 0,37 + 0,082 0,288 < p < 0 ,452 n continuare trebuie s se determine volumul necesar pentru proiectarea unui nou sondaj dac rezultatele se garanteaz cu aceeai probabilitate iar eroarea limit se micoreaz de 1,1 ori. Aplicnd formulele de calcul vom obine pentru:
selecia repetat
2 z 2 s

n=

x 1,1

1,9 2 * 211,56 2 ,60 1,1


2

= 137 societi comerciale

selecia nerepetat

n=

2 z 2 s 2

2 z 2 s x + N 1,1 comerciale

1,9 2 * 211,56 1,9 2 * 211,56 2,47 + 1200 1,1


2

= 135

societi

Cercetarea prin sondaj

Deci n selecia nerepetat, volumul eantionului este de 135 societi comerciale, cu 2 mai puin dect n selecia repetat.
5.5.2 Selecie tipic (stratificat)

Selecia tipic constituie tipul de selecie care se aplic cel mai frecvent n cercetarea fenomenelor social-economice de mas. Selecia tipic se aplic n cazul colectivitilor neomogene formate din uniti simple i presupune structurarea colectivitii generale pe straturi (grupe) mai omogene i extragerea din fiecare strat a unui subeantion folosind un procedeu de selecie aleatoare. Pentru delimitarea straturilor se folosesc fie variabile calitative (judee, medii de provenien etc.), fie variabile cantitative (cifra de afaceri, numrul de angajai, vrsta etc.). Numrul de straturi se stabilete astfel nct : fiecare subeantion s conin un numr suficient de mare de uniti; sporul de precizie adus de stratificare s nu fie anihilat de creterea costurilor i complicarea calculelor. Erorile de reprezentativitate la selecia tipic sunt mai mici dect la selecia simpl. Cu ct grupele n care a fost mprit colectivitatea sunt mai omogene, cu att mediile de grup au valori mai apropiate de valorile individuale din care s-au calculat i, deci, abaterile ntr-un sens sau altul sunt mai puin importante. n acest caz, variaia mediilor de selecie posibile va depinde de gradul de variaie a fiecrei grupe, sintetizat n mrimea mediei 2 dispersiilor pariale ( ). Deoarece 2 < 2 , vor rezulta erori mai mici prin aplicarea seleciei tipice, i n acest caz, dac nu dispunem de date dintr-o cercetare total anterioar, vom folosi pentru calculul indicatorilor de selecie media dispersiilor pariale din colectivitatea de selecie ( 2 ). n vederea repartizrii eantionului pe subeantioane corespunztor tipurilor calitative, se pot aplica trei modaliti.

STATISTICA

1. Repartizarea n mod egal a eantionului pe subeantioane indiferent de numrul unitilor ce compun straturile populaiei totale: n ni = k unde: ni dimensiunea fiecrui subeantion k numrul de straturi n populaia total Acest tip de selecie mai poart denumirea de selecie tipic (stratificat) neproporional. De reinut c la determinarea erorii medii de reprezentativitate se ine cont de ponderea straturilor n colectivitatea general. 2. Eantionul se separ pe subeantione n funcie de ponderea fiecrui strat n colectivitatea general: n n1 n ni = n = 2 = ... = i = ... = N1 N 2 Ni Ni Ni de unde: Ni ni = n Ni Acest tip de selecie se mai numete selecia tipic (stratificat) proporional i se folosete frecvent n practic, deoarece datorit modului de formare a eantionului, structura colectivitii de selecie (a eantionului) este identic cu aceea a colectivitii generale, asigurnduse n felul acesta erori mai mici. 3. La formarea subeantioanelor se ia n consideraie att ponderea fiecrui strat n colectivitatea general ct i gradul de omogenitate al straturilor, reprezentat de abaterea medie ptratic: N ni = n k i i N i i
i =1

Acest tip de selecie se mai numete selecia tipic (stratificat) optim. deoarece d cele mai mici erori n practic, dar este greu de aplicat. Deoarece eantinul se formeaz prin extragerea aleatoare de subeantione din straturile existente n colecivitatea general, la determinarea erorii medii de reprezentativitate se vor folosi dispersiile de

Cercetarea prin sondaj

grup sintetizate prin intermediul mediei dispersiilor de grup. Media dispersiilor de grup fiind ntotdeauna mai mic dect dispersia total, nseamn c erorile de reprezentativitate generate de selecia tipic sunt ntotdeauna mai mici dect cele ale seleciei aleatoare simple. Relaiile de calcul n cazul sondajului tipic proporional se particulariaz pornind de la cele ale sondajului aleator simplu, nlocuind dispersia colectivitii generale sau dispersia eantionului (cnd nu se cunoate dispersia colectivitii generale) cu media dispersiilor de grup. Ca urmare:
eroarea medie de reprezentatrivitate:

x =

2
n

pentru selecia repetat

n 1 pentru selecia nerepetat n N eroarea limit maxim admis

x =

x = z x = z

2
n

pentru selecia repetat

n 1 pentru selecia nerepetat n N estimarea mediei la nivelul colectivitii generale x x < x0 < x + x unde xi ni x= ni estimarea nivelului totalizat al caracteristicii N ( x x ) < xi < N ( x + x )
i =1 N

dimensionarea eantionului z 2 2 n= pentru selecie repetat 2

STATISTICA

n=

z 2 2

2 x

z 2 2 N

pentru selecie nerepetat

Pentru estimarea cheltuielilor suplimentare medii i totale zilnice efectuate de turitii din cadrul unui sejur de 3 zile s-a efectuat un sondaj stratificat proporional de 5%, datele nregistrate s-au prelucrat i rezultatele calculelor sunt prezentate n tabelul 5.6.
Cheltuielile medii zilnice i coeficientul de variaie n eantion

Grupe de turiti dup vrst (ani)


0

Numrul turitilor

Cheltuieli suplimentare medii zilnice (mii lei)


2

Tabelul nr. 5.6 Coeficientul de variaie al cheltuielilor suplimentare (%)


3

sub30 30-50 50 si peste TOTAL

130 180 90 400

200 300 400

20 25 33 ...

Calculul indicatorilor de selecie i estimarea parametrilor colectivitii generale (se vor folosi notaiile de la regula adunrii dispersiilor)
media mediilor de grup:

y=

i =1 r

y i ni
=
i =1

ni

200 130 + 300 180 + 400 90 = 290 miilei/turist 400

Cercetarea prin sondaj

dispersiile de grup i2
vi =

( )
i =
vi y i 100

i
yi

100 de unde:

1 =
2 = 3 =

20 200 = 40 mii lei/turist 100 25 300 = 75 mii lei/turist 100 33 400 = 132 mii lei/turist 100

2 1 = 1600

2 2 = 5625

2 3 = 17424

media dispersiilor de grup 2

( )

2=

i2 ni
i =1

n
i =1

1600 130 + 5625 180 + 17424 90 = 6971,65 400

eroarea medie de reprezentativitate y

( )

y =

n 1 = n N

6971,65 400 = 4 ,069 mii lei 1 400 800

eroarea limit maxim admis y

( )

y = z y = 2 4,069 = 8,138 mii lei

STATISTICA

estimarea cheltuielilor medii zilnice suplimentare pe total colectivitate:

y y < y0 < y + y
de unde: 290 8,138< y 0 <290 + 8,138 281,862 < y 0 < 298,138 mii lei/turist

estimarea cheltuielilor zilnice suplimentare totale:

N ( y y ) < yi < N ( y + y )
i =1

8000 281,862 <


8000
i =1

8000
i =1

yi < 8000 298,138

2154896 <

yi < 2385104 mii lei

Dac pentru formarea eantionului s-ar fi folosit sondajul aleatoriu simplu nerepetat, pentru asigurarea aceleiai precizii, volumul eantionului s-ar fi determinat dup formula:
n=
2 z 2 0

2 + y

2 z 2 0 N

Deoarece nu cunoatem dispersia total din colectivitatea general ci numai datele despre eantionul format prin respectarea principiilor unei scheme probabilistice, putem nlocui acest indicator prin dispersia total a datelor din eantion.

Cercetarea prin sondaj

Dispersia total a eantionului se determin n acest caz din regula de adunare a dispersiilor:
2 = 2 + 2

2 =

i =1

( yi y )ni
i =1

ni

( 200 290 )2 130 + ( 300 290 )2 180 + ( 400 290 ) 2 90 400

= 5400

2 = 5400 + 6971,65 = 12371,65


n= 2 2 12371,65 2 2 12371,65 8,138 + 8000
2

= 684 turiti.

Deci, n cazul utilizrii unui sondaj aleator simplu pentru acelai grad de reprezentativitate trebuie luai n studiu 684 turiti fa de numai 400 ct sunt necesari, dac populaia se stratific pe cele trei grupe de vrst. Dac se organizeaz o nou cercetare selectiv i se accept o eroare limt maxim admis cu 5% mai mare dect cea calculat anterior, celelalte condiii rmnnd nemodificate, volumul eantionului se calculeaz dup relaia:

n =

z 2

2 2

( y )2 + z

unde:

y = 1,05 y = 8,545 mii lei/turist

STATISTICA

n =

4 6971,65 = 364 turiti 4 6971,65 2 8,545 + 8000

Repartizarea pe subeantioane lund n calcul sondajul tipic nerepetat (n = 364 turiti): neproporional ni = n 364 = 121 turiti 3 r

proporional
ni = n Ni

Ni
i =1

Rezultatele calculelor sunt prezentate n tabelul 5.7.


Tabelul 5.7

Grupe de turiti dup vrst (ani)


0

Numrul turitilor ( Ni )

% turitilor Ni 100 r Ni
i =1
2

ni

Sub 30 30-50 50 si peste TOTAL

2600 3600 1800 8000

32,5 45,0 22,5 100,0

118 164 82 364

Cercetarea prin sondaj

De reinut: Pentru a obine acelai grad de precizie a rezultatelor, eantionul constituit prin stratificare este mai mic dect cel pentru sondajul aleator simplu; Pentru acelai volum al eantionului, precizia este mai mare n cazul sondajului stratificat dect n cazul sondajului aleator simplu; Eantionul trebuie dimensionat astfel nct fiecare subeantion s conin un numr suficient de uniti pentru a permite calcularea dispersiilor la nivelul subeantioanelor (ni>35);
5.5.3 Selecia de serii

Se folosete n cazul n care colectivitatea general este format din uniti complexe (echipe, brigzi, ferme, etc.) Seriile sunt uniti complexe care sunt formate la rndul lor din uniti simple. Unitile complexe, fiind alctuite din uniti simple ce posed caracteristici proprii ce le deosebesc una de alta, nu se aseamn cu grupele tipice alctuite din uniti omogene. Pentru ca eantionul format n acest caz s fie reprezentativ pentru ntreaga colectivitate se va extrage printr-unul din procedeele de selecie artate mai nainte uniti complexe. Caracteristic pentru acest tip de sondaj este faptul c n locul variantelor concrete ale caracteristicii din sondajele individuale se vor folosi indicatori calculai la nivelul seriei. Pentru ca seriile ce formeaz eantionul s reflecte structura colectivitii generale, va trebui ca acestea s fie formate din uniti la fel de omogene sau neomogene. Cu ct mediile din serii sunt mai apropiate ntre ele, vor estima mai corect valoarea medie a ntregii colectiviti, relizndu-se condiia de reprezentativitate a eantionului. n acest tip de sondaj dispersia dintre serii ( 2 ) nlocuiete
2 dispersia general 0 din sondajul simplu i ca atare erorile de reprezentativitate calculate pe baza datelor unui sondaj de serii, sunt mai 2 mici, sau cel mult egale cu erorile sondajului simplu (deoarece 2 < 0 )

ca i component a dispersiei generale este mai mic dect aceasta.

STATISTICA

Eantionarea fcndu-se pe baz de serii, eantionul este format dintr-un numr de serii notat cu r, iar n colectivitatea general numrul seriilor se va nota cu R. Analog cu selecia tipic se vor elabora i formulele pentru selecia de serii, cu deosebirea c n locul mediei dispersiilor de grup se va folosi dispersia dintre grupe (serii), iar n locul volumului eantionului (n) se va folosi numrul de serii din eantioane (r) care este mult mai mic dect volumul eantionului adic:

xrep = xnerep = wrep =

2 x ;. r 2 Rr x ; r R 1 2 p r ;

nerep

2 p r

Rr . R 1

Aplicaie

Pentru verificarea duratei medii de ardere a unui bec s-a organizat un sondaj de 5% dintr-un lot de 2000 de becuri ambalate n cutii de cte 10 buci. n urma cronometrrii duratei de ardere a becurilor din fiecare cutie (serie) s-a calculat durata medie de ardere (vezi tabelul 5.8 coloana 1).

Cercetarea prin sondaj

Tabelul 5.8 Nr.crt. al seriei Durata medie de ardere (n ore) ( xi )


1

( xi x s ) 2

1 2 3 4 5 6 7 8 9 10 TOTAL

2100 2250 2080 1950 2325 2230 2170 2050 2175 2200 21530

2809 9409 5329 41209 29584 5929 289 10609 484 2209 107860

Deoarece cutiile (seriile) sunt de aceeai dimensiune, pentru calculul mediei pe total se folosete relaia:
xs =

xi = 21530 = 2153 ore/bec


r

10

Pentru calcularea erorii medii este necesar calcularea dispersiei dintre serii (vezi tabelul 5.8, col.2):

s2 =

( x i x s )2
i =1

107860 = 10786 10

STATISTICA

Fiind un sondaj de serii unde R = 200, r = 10 eroarea limit se calculeaz astfel: x = z

s2 R r
r R 1

= 1,96

10786 200 10 = 62,9 ore 10 200 1

Limitele ntre care se va ncadra media pe total: xs x < x0 < xs + x de unde: 2153 - 62,9 < x0 < 2153 + 62,9 2090,1 < x 0 < 2215,9 ore/bec

Dac se organizeaz o nou cercetare selectiv i pentru garantarea rezultatelor se folosete o probabiltate de 0,9973 (z=3), noul volum de sondaj va fi:
r =
2 R (z )2 s

(R 1) 2 + (z )2 s2 x

200 3 2 10786 199 62 ,9 2 + 3 2 10786

= 21,95 22

n concluzie, se poate spune, c alegerea tipului de selecie trebuie s se fac n funcie de gradul de precizie a rezultatelor, de structura calitativ a colectivitii generale i de mrimea cheltuielilor ce se fac cu observarea i prelucrarea datelor provenite dintr-un sondaj statistic. Eficient este ca din multitudinea de soluii s se aleag acele tipuri de selecie care s permit estimarea parametrilor din colectivitatea general cu gradul de siguran cel mai ridicat n condiiile unui cost minim.

Cercetarea prin sondaj

5.6 NTREBRI I TESTE-GRIL 5.6.1 ntrebri recapitulative

1. Care sunt principalele avantaje ale sondajului statistic? 2. Ce este un eantion reprezentativ? 3. Ce condiii trebuie respectate pentru a asigura reprezentativitatea eantionului? 4. Ce criterii se folosesc la dimensionarea eantionului? 5. Ce sunt erorile de reprezentativitate? 6. De cte feluri sunt erorile de reprezentativitate? 7. Prin ce se caracterizeaz erorile de reprezentativitate ntmpltoare? 8. Prin ce se caracterizeaz erorile de reprezentativitate sistematice? 9. Cum pot fi evitate erorile de reprezentativitate sistematice? 10. Ce tipuri de selecie aleatoare cunoatei? 11. Cum se realizeaz selecia aleatoare? 12. Ce procedee de selecie aleatoare cunoatei? 13. Prin ce se caracterizeaz procedeul bilei revenite? 14. Prin ce se caracterizeaz procedeul bilei nerevenite? 15. Prin ce se caracterizeaz procedeul tabelului cu numere aleatoare? 16. Ce metode de selecie dirijat cunoatei? 17. Cum se realizeaz selecia mecanic? 18. Cnd se utilizeaz sondajul aleator simplu? 19. Cum se construiete eantionul n cazul sondajului aleator simplu? 20. Cum se calculeaz erorile n cazul sondajului aleator simplu? 21. Ce informaii sunt necesare pentru dimensionarea eantionului n cazul sondajului aleator simplu? 22. Cnd se utilizeaz sondajul stratificat? 23. Ce tipuri de sondaj stratificat cunoatei? 24. Ce criterii se folosesc la stabilirea straturilor? 25. Ce este variabila de stratificare i cum se stabilete aceasta?

STATISTICA

26. Cum se formeaz eantionul n cazul sondajului stratificat neproporional? 27. Cum se formeaz eantionul n cazul sondajului stratificat proporional? 28. Cum se formeaz eantionul n cazul sondajului stratificat proporional optim? 29. Cum se calculeaz erorile n cazul sondajului stratificat proporional? 30. Cum este dimensiunea eantionului n cazul sondajului aleator simplu fa de cea a eantionului n cazul sondajului stratificat dac se dorete asigurarea aceleiai precizii a rezultatelor? 31. Cum este precizia n cazul sondajului aleator simplu fa de sondajul stratificat pentru aceeai dimensiune a eantionului? Justificai rspunsul. 32. Cum variaz intervalul de ncredere comparativ cu precizia rezultatelor? 33. Cnd se utilizeaz sondajul de serii? 34. Ce presupune sondajul de serii? 35. Cum se calculeaz erorile n cazul sondajului de serii? 5.6.2 Teste-gril 1. a) b) c) d) 2. a) b) c) d) 3. a) b) c)

Cercetrile selective sunt singurele posibile pentru: controlul calitii produselor prin metode distructive; determinarea preferinelor consumatorilor; analiza veniturilor i cheltuielilor populaiei; estimarea productivitii muncii. Un eantion este considerat reprezentativ atunci cnd: volumul su este mic; reproduce n structura sa structura colectivitii generale; eroarea medie de reprezentativitate este mare; s-a folosit selecia aleatoare. Erorile probabile de sondaj sunt: direct proporionale cu volumul eantionului; invers proporionale cu volumul eantionului; independente de volumul eantionului;

Cercetarea prin sondaj

d) evitabile.
4. a) b) c) d) e) 5. a) b) c)

Precizia sondajului aleator repetat se dubleaz dac: eantionul se dubleaz; eantionul se reduce la jumtate; volumul eantionului se mrete de 4 ori; volumul eantionului se micoreaz de 4 ori; nu exist legtur ntre volumul eantionului i precizia sondajului. Precizia sondajului crete dac: se mrete volumul eantionului; se micoreaz volumul eantionului; se fac selecii dirijate.

6. Dac s-a exclus orice intervenie subiectiv la alegerea eantionului, atunci selecia este: a) aleatoare; b) dirijat; c) mixt; d) incorect. 7. Comparativ cu selecia presupune: a) erori mai mari; b) erori mai mici; c) acelai nivel de eroare; d) exclude erorile.

repetat,

selecia

nerepetat

8. Procedeul tragerii la sori se folosete: a) pentru colectiviti de dimensiuni mari; b) pentru colectiviti de dimensiuni mici; c) pentru selecii dirijate; d) pentru selecia mecanic. 9. Erorile de reprezentativitate specifice sondajului pot fi: a) sistematice i ntmpltoare; b) de nregistrare i de calcul; c) efective i probabile;

STATISTICA

d) cantitative i calitative. Alegei combinaia corect: A(a,c); B(a,b,c); C(d).


10. n cazul colectivitiilor omogene formate din uniti simple, nemprite n grupe, se utilizeaz: a) selecia aleatoare simpl; b) selecia mecanic; c) selecia tipic; d) selecia de serii. 11. n cazul colectivitiilor neomogene formate din uniti simple, mprite n grupe, se utilizeaz: a) selecia aleatoare simpl; b) selecia mecanic; c) selecia tipic; d) selecia de serii. 12. n cazul colectivitiilor formate din uniti complexe, se utilizeaz: a) selecia aleatoare simpl; b) selecia mecanic; c) selecia tipic; d) selecia de serii. 13. Pentru a obine aceeai precizie a rezultatelor, eantionul constituit prin stratificare (sondaj tipic) este: a) mai mic dect cel pentru sondajul aleatoriu simplu; b) mai mare dect cel pentru sondajul aleatoriu simplu; c) egal cu cel pentru sondajul aleatoriu simplu. 14. La acelai volum al eantionului, n cazul sondajului aleatoriu simplu precizia este: a) mai mare dect la sondajul tipic; b) mai mic dect la sondajul tipic; c) egal. Soluii: 1.a; 2.b; 3.b; 4.c; 5.a; 6a; 7.b; 8.b; 9.A; 10.a; 11.c; 12.d; 13.a; 14.b.