Sunteți pe pagina 1din 46

Capitolul 5

CERCETAREA PRIN SONDAJ

5.1 NECESITATEA FOLOSIRII


SONDAJULUI STATISTIC

Pentru caracterizarea statistică a fenomenelor şi proceselor social-


economice de masă în scopul evidenţierii legităţilor specifice acestora, se
folosesc date individuale obţinute prin metode de înregistrare totală sau
parţială.
În practică, din diferite motive, pentru anumite colectivităţi nu se
poate face înregistrarea totală a unităţilor ce le compun, fie că ar fi
necesitat cheltuieli foarte mari, fie că operativitatea obţinerii rezultatelor
cercetării nu este asigurată. Toate aceste considerente şi altele
nespecificate, necesită tot mai frecvent organizarea unor înregistrări
parţiale de tipul sondajelor statistice.
În etapa actuală de trecere la economia de piaţă, cercetarea prin
sondaj îşi extinde continuu aria de investigare, datorită multiplelor
avantaje pe care le prezintă. Dintre avantajele pe care le prezintă
cercetarea prin sondaj, enunţăm pe cele mai semnificative:
• în cele mai multe cazuri, când colectivitatea totală este foarte
mare iar cercetarea ei exhaustivă ar necesita un volum mare de
cheltuieli materiale şi de muncă este avantajos să se recurgă la
sondaj, care este mai operativ şi mai ieftin;
• partea supusă înregistrării fiind cu mult mai mică decât cea
totală, iar personalul care face înregistrarea unităţilor fiind de
specialitate, de regulă, erorile de înregistrare sunt în acest caz
mai puţin numeroase şi mai uşor de înlăturat în faza de verificare
a datelor;
• programul observărilor prin sondaj cuprinde, de regulă, un
număr mai mare de caracteristici decât programul observării
totale, ceea ce permite caracterizarea mai aprofundată a
fenomenelor studiate prin metode statistice;
• cercetarea prin sondaj este singura posibilă atunci când prin
cercetarea exhaustivă a unităţilor s-ar ajunge la distrugerea
STATISTICA

produsului respectiv (de pildă, controlul distructiv al calităţii


unui produs);
• evaluarea rezervelor subterane de cărbune, petrol, gaze naturale
etc. nu este posibilă decât pe baza unui sondaj statistic;
• sondajul statistic poate fi folosit la verificarea datelor culese
printr-o observare totală de mare amploare în care s-au folosit şi
nespecialişti precum şi la prelucrarea selectivă a unor date. De
exemplu, datele culese prin recensăminte pot fi prelucrate într-o
primă fază selectiv şi mai târziu total;
• sondajul poate fi utilizat cu bune rezultate în verificarea
programului unei observări totale cât şi la verificarea unor
ipoteze statistice.
Avantajele amintite au permis ca metoda selectivă să capete un
câmp larg de aplicare în cele mai diferite domenii ale vieţii social-
economice şi culturale.
Metoda sondajului este folosită cu succes în industrie pentru
determinarea productivităţii muncii în unităţi naturale, în cercetarea
calităţii produselor se foloseşte pe scară largă în timpul desfăşurării
proceselor tehnologice pentru prevenirea rebuturilor, în depistarea
cauzelor care provoacă fluctuaţia forţei de muncă, în studierea
capacităţilor de producţie, a suprafeţelor de producţie etc.
În comerţ, sondajul este utilizat pentru testarea acceptării noilor
produse, la studierea aspectelor complexe ale cererii de mărfuri în funcţie
de variaţia factorilor care o influenţează, precum şi la estimarea
tendinţelor specifice ale activităţilor de desfacere a mărfurilor şi a
prestărilor de servicii către populaţie.
Sondajul statistic se aplică cu rezultate bune şi în celelalte ramuri
ale economiei naţionale, încât se poate spune pe drept cuvânt că aproape
nu există domeniu unde sondajul statistic, datorită avantajelor pe care le
prezintă, cât şi a exactităţii rezultatelor să nu fie folosit. Acesta este de
fapt şi principalul motiv pentru care în ultimii ani în toate ţările,
cercetărilor prin sondaj li se acordă o atenţie din ce în ce mai mare atât
sub raport teoretic cât şi din punct de vedere practic.
Cercetarea prin sondaj

5. 2 NOTIUNI SPECIFICE
SONDAJULUI STATISTIC

Cercetarea parţială al cărei scop este ca, pe baza rezultatelor


prelucrării datelor obţinute, să se estimeze, folosind principiile teoriei
probabilităţilor, parametrii corespunzători ai colectivităţii totale, poartă
denumirea de sondaj statistic. Cu alte cuvinte, cercetare prin sondaj
realizată cu un efort material şi uman mai redus are drept rezultat
obţinerea unor indicatori derivaţi care permit caracterizarea completă şi
reală a întregii colectivităţi. În vederea atingerii acestui deziderat
cercetarea prin sondaj se desfăşoară în două etape:
• prima etapă, în care se culeg şi se prelucrează date statistice de la
unităţile colectivităţii generale care au fost incluse în eşantion
din care rezultă indicatori derivaţi: mărimi relative, mărimi
medii, indici etc. care descriu statistic eşantionul folosit;
• a doua etapă, în care indicatorii obţinuţi prin prelucrarea datelor
din eşantion se extind, cu o anumită probabilitate, asupra întregii
colectivităţi în scopul caracterizării acesteia din punct de vedere
statistic.
Din cele relatate mai sus rezultă că noţiunea de "cercetare
statistică prin sondaj" nu trebuie confundată nici cu noţiunea de
cercetare statistică totală care comportă cele trei faze ale cercetării
statistice: culegere, prelucrare, analiză şi interpretarea datelor şi nici cu
noţiunea de "observare selectivă" care se rezumă doar la culegerea
informaţiilor de la unităţile care alcătuiesc eşantionul.
Cercetarea prin sondaj implică folosirea unor noţiuni pereche ca
de pildă: colectivitate generală - colectivitate de selecţie; media
colectivităţii generale - media colectivităţii de selecţie; dispersia
colectivităţii generale - dispersia colectivităţii de selecţie; valoarea
statistică calculată - valoarea estimată ş.a.
Colectivitatea generală denumită şi populaţie, este alcătuită din
totalitatea unităţilor simple sau complexe care formează fenomenul supus
cercetării. Pentru ca cercetarea statistică să-şi atingă scopul propus este
necesară delimitarea în timp, spaţiu şi după volum a acestei colectivităţi.
Volumul colectivităţii generale, din care urmează să se extragă
unităţile în scopul formării eşantionului se notează de obicei cu ”N” în
cazul unităţilor simple şi cu ”R” în cazul celor complexe. Dacă s-au
STATISTICA

înregistrat şi variabile alternative, atunci unităţile care posedă


caracteristica se notează cu ”M”.
Colectivitatea de selecţie (eşantion , probă, mostră) reprezintă acea
parte a colectivităţii generale de la care urmează să se culeagă datele în
scopul extinderii rezultatelor obţinute din prelucrarea acestora asupra
întregului ansamblu.
Volumul colectivităţii de selecţie se notează cu ”n” când este
format din unităţi simple şi cu ”r” când se referă la unităţi complexe.
Pentru variabile alternative numărul unităţilor care posedă caracteristica
se notează cu ”m”.
De remarcat este faptul că dintr-o anumită populaţie (colectivitate
generală) pot fi extrase mai multe eşantioane, care să difere între ele atât
ca volum cât şi ca structură. Din această cauză indicatorii statistici cu care
caracterizăm colectivitatea de sondaj pot fi consideraţi de forma unor
variabile aleatoare pentru care se pot stabili distribuţii de frecvenţe
corespunzătoare, spre deosebire de media şi dispersia din colectivitatea
generală studiată, care nu pot lua decât câte o singură valoare pentru
condiţii date de timp şi spaţiu.
Formulele de calcul ale mediei şi dispersiei sunt trecute în tabelul
5.1.
Tabelul 5.1
Denumirea Caracteristica nealternativă Caracteristica alternativă
indicatorului Colectivitatea Colectivitate Colectivitatea Colectivitate
generală de selecţie generală de selecţie
A 1 2 3 4
Media N n
∑x i ∑x i
P=
M
w=
m
i =1 i =1
x0 = x= N n
N n
Dispersia N n
∑ (x i
− x0)
2

∑ (x − x) 2 i
σ2p = p(1− p) σw = w(1− w)
2

σ0 =
2 i =1
i =1
N σ2 =
n

În studiul statistic al fenomenelor se foloseşte foarte frecvent


perechea de noţiuni valoare statistică calculată şi valoarea estimată.
Se consideră că valoarea statistică calculată este rezultatul obţinut
dintr-o cercetare empirică. Aceste valori statistice sunt folosite pentru a
Cercetarea prin sondaj

estima un indicator corespunzător, dar pentru care nu avem date


suficiente. Cel mai frecvent aceste noţiuni se folosesc în teoria sondajului
când indicatorii din eşantion devin estimatori ai parametrilor
corespunzători din colectivitatea generală.
Pentru ca cercetare selectivă să-şi atingă scopul propus este
necesară o pregătire minuţioasă a acesteia, pe baza unui plan care să
permită obţinerea unor informaţii cât mai veridice.
Un astfel de plan al cercetării prin sondaj trebuie să cuprindă:
• delimitarea în timp şi spaţiu a colectivităţii generale prin
identificarea tuturor cazurilor individuale sub care se manifestă
fenomenele respective;
• verificarea gradului de omogenitate al colectivităţii generale.
Dacă există o observare totală anterioară aceasta se poate realiza
prin analiza indicatorilor variaţiei caracteristicilor esenţiale
pentru care este necesar să se organizeze mai multe sondaje
succesive pentru verificarea gradului de stabilitate a mediei şi
dispersiei caracteristicilor după care se va face eşantionarea;
• alegerea sau stabilirea bazei de sondaj. Prin bază de sondaj se
înţelege orice sistematizare a unităţilor colectivităţii generale
(liste, hărţi) astfel încât să permită alegerea aleatoare a unităţilor
ce vor intra în eşantion;
• determinarea mărimii eşantionului;
• alegerea tipului şi procedeului de selecţie;
• stabilirea periodicităţii efectuării sondajului;
• stabilirea planului observării care de regulă, este mai bogat
decât al unei observări totale similare;
• stabilirea planului de prelucrare a datelor de selecţie din punct
de vedere metodologic şi organizatoric;
• analiza, interpretarea, extinderea şi prezentarea datelor; trebuie
alese procedeele de verificare a semnificaţiei indicatorilor de
selecţie şi de extindere a rezultatelor selecţiei asupra întregului
ansamblu.
Rezolvarea cu competenţă a problemelor cuprinse în planul de
sondaj are drept scop asigurarea reprezentativităţii eşantionului, de
aceasta depinzând în totalitate valoarea rezultatelor obţinute în urma
cercetării prin sondaj.
STATISTICA

Un eşantion este considerat reprezentativ atunci când reproduce


în structura sa aceeaşi structură pe care o prezintă şi colectivitatea
generală.
Teoria şi practica statistică demonstrează că asigurarea
reprezentativităţii eşantionului presupune respectarea cu stricteţe a
următoarelor condiţii:
• includerea în eşantion a unităţilor în mod obiectiv fără a acorda
preferinţă uneia dintre ele, fiecare unitate fiind extrasă după
principiul hazardului cu o probabilitate calculabilă şi diferită de
zero;
• eşantionul stabilit să fie suficient de mare ca să permită redarea
trăsăturilor esenţiale ale populaţiei totale, ceea ce va permite
obţinerea, pe baza datelor de sondaj, a unor indicatori cu un grad
mare de stabilitate;
• includerea fiecărei unităţi în eşantion trebuie să se facă
independent de alte unităţi.
De remarcat faptul că, în cazul în care populaţia totală
(colectivitatea generală) este împărţită în grupe, eşantionul trebuie să
reproducă o structură corespunzătoare acestor componente.
Practica sondajului demonstrează că reprezentativitatea unui
eşantion depinde în primul rând, de alegerea corectă a procedeelor şi
tipurilor de selecţie.

5.3 PROCEDEE DE SELECTIE FOLOSITE PENTRU


CONSTITUIREA ESANTIONULUI

În teoria şi practica statistică, la formarea eşantionului se folosesc


mai multe procedee cunoscute sub denumirea de selecţii aleatoare, selecţii
subiectiv organizate sau selecţii dirijate şi selecţii mixte.
Folosirea selecţiei aleatoare exclude orice intervenţie subiectivă în
alegerea eşantionului. Acest obiectiv se poate realiza numai dacă
selectarea unui element dintr-o populaţie este aleatoare (întâmplătoare),
dacă toate elementele populaţiei au aceeaşi şansă de a fi alese.
În mod analog, eşantioanele formate din n elemente sunt aleatoare,
atunci când selecţia a fost făcută la toate eşantioanele posibile cu
respectarea riguroasă a principiilor probabiliste. Selecţia aleatoare îşi
Cercetarea prin sondaj

demonstrează utilitatea prin faptul că rezultatele obţinute pe baza ei pot fi


apreciate în termeni probabilistici.
Spre deosebire de selecţiile probabiliste, în selecţiile dirijate
alegerea unităţilor se face de către persoanele care culeg datele. Prezenţa
unui element oarecare care sa favorizeze alegerea subiectivă din partea
celui care face observarea, implică riscul producerii unei distorsiuni.
Acest lucru trebuie evitat în măsura posibilului. Din această cauză, acest
tip de selecţie se foloseşte mai rar în practică mai ales în situaţiile în care
se cer rezultate garantate cu o mare rigoare ştiinţifică.
Când folosirea acestui tip de selecţie nu poate fi evitată, este
necesar ca iniţial să se cunoască şi să se facă o analiză amănunţită din
punct de vedere calitativ a colectivităţii generale, formarea eşantionului
depinzând de modul în care sunt valorificate corect aceste informaţii.
Selecţia mixtă combină principiile sondajului aleator cu ale celui
dirijat. În acest caz este necesar ca mai întâi să se împartă colectivitatea în
grupe tipice după o anumită caracteristică (de exemplu, personalul după
categoria de încadrare sau după calificare etc.) şi apoi să se extragă
aleator câte un eşantion din fiecare grupă.
Tehnica de selecţie în fiecare caz în parte depinde într-o mare
măsură de circumstanţele cazului şi de resursele observatorului.
În practică, selecţiile aleatoare (probabilistice) se realizează prin
mai multe procedee, care derivă dintr-o schemă probabilistică
corespunzătoare rezultatelor obţinute prin tragere la sorţi a unităţilor
pentru a forma eşantionul.

5.3.1 Procedeul tragerii la sorţi

Acest procedeu constă în extragerea dintr-o urnă a unor bile sau


alte obiecte identice reprezentând fiecare o unitate a colectivităţii.
Extragerea bilelor din urnă se face în două variante:
• procedeul selecţiei repetate (al bilei revenite);
• procedeul selecţiei nerepetate (al bilei nerevenite).
În cazul folosirii procedeului bilei revenite, probabilitatea de
includere în eşantion a fiecărei unităţi este constantă (p=1/N) tot timpul
cât durează operaţia de construire a eşantionului, iar la sfârşit în urnă
rămân (N-1) unităţi.
STATISTICA

În cel de-al doilea caz, procedeul bilei nerevenite, bila odată


extrasă nu se mai introduce în urnă, mărind astfel şansa fiecărei unităţi
rămasă de a intra în eşantion (p1=1/N ; p2=1/(N-1);... pn= 1/(N-(n-1))).
Rezultă în acest caz că în urnă rămân la sfârşit N-n unităţi.
Datorită faptului că în cazul selecţiei nerepetate este exclusă
posibilitatea extragerii de mai multe ori a aceleiaşi unităţi, erorile sunt
mai mici, deci rezultatele obţinute au un grad de precizie mai ridicat.
Procedeul tragerii la sorţi se foloseşte în cazurile în care
colectivitatea generală cuprinde un număr mai mic de unităţi pentru care
se pot asigura bile sau alte obiecte identice care să poată fi incluse într-o
urnă.

5.3.2 Procedeul tabelului cu numere aleatoare

Tabelele cu numere aleatoare elaborate de Kendall, Smith, Yates


etc. au fost întocmite cu ajutorul unui dispozitiv de amestecat numere.
Aceste numere se înscriu în continuare în mod aleator. Tot aleator se
stabileşte coloana şi rândul de unde începe citirea lor, în vederea formării
eşantionului.
Pentru folosirea tabelului cu numere aleatoare este necesară
numerotarea unităţilor colectivităţii generale de la 1 la N şi apoi
extragerea celor n unităţi care formează eşantionul. De exemplu,
considerând că în colectivitatea generală sunt 900 unităţi şi se
intenţionează constituirea unui eşantion format din 10% (n=90) se va
proceda în felul următor: se va alege la întâmplare coloana şi rândul din
coloana respectivă cu care se va începe selecţia. Numărul respectiv şi
numerele aleatoare formate din trei cifre care se vor citi pe coloana
respectivă vor fi notate dacă sunt cuprinse între 1 şi 900 şi diferă de cele
reţinute anterior şi se va renunţa la ele dacă sunt peste 900. Se continuă în
felul acesta până la formarea completă a eşantionului (90 unităţi).

5.3.3 Selecţia mecanică

Procedeul selecţiei mecanice presupune ordonarea unităţilor după


o caracteristică oarecare (ordine alfabetică, numărul de la locuinţă etc.)
prin care să se asigure includerea pe cât posibil intâmplătoare a unităţilor
în baza de sondaj. Operaţia de alcătuire a eşantionului în acest caz este
Cercetarea prin sondaj

precedată de stabilirea pasului de numărare - care trebuie să fie un număr


întreg - calculat ca raport între volumul colectivităţii generale şi volumul
colectivităţii de selecţie (N/n). Prin calculul pasului de numărare se obţine
împărţirea colectivităţii generale în grupe de volum egal. Pentru
constituirea eşantionului se procedează în felul următor: se selectează la
întâmplare (prin tragere la sorţi) o unitate din prima grupă la care se
adaugă succesiv pasul de numărare până la obţinerea celor n unităţi ale
eşantionului.
Folosind exemplul precedent, pasul de numărare este egal cu 10 şi
se procedează astfel: din primele 10 unităţi, extragem una la întâmplare
(prin tragere la sorţi); presupunând că am extras unitatea cu numărul trei,
adăugăm succesiv 10 şi obţinem eşantionul format din unităţile cu
numerele de ordine: 3, 13, 23, 33, ... . Se observă că, în cazul selecţiei
mecanice, constituirea eşantionului nu este pe deplin aleatoare, deoarece
fiecare unitate selectată depinde de numărul de ordine al celei precedente.
De aceea, selecţia mecanică este considerată în literatura de specialitate o
selecţie cvasialeatoare, caracterul aleator fiind asigurat doar de alcătuirea
întâmplătoare a bazei de sondaj.
Datorită existenţei unor baze de sondaj adecvate, selecţia
mecanică este folosită cu succes în statistica agricolă şi statistica nivelului
de trai.
Selecţiile dirijate şi cele mixte se folosesc în special în sondajele
de opinie, în cercetările sociologice şi uneori în studiul cererii de consum
a populaţiei.
În sondajele aplicate la studiul fenomenelor economice unde, de
regulă, se lucrează cu un număr mare de unităţi este necesar să se
elaboreze baze de sondaj, fie cu caracter permanent, fie pentru o singură
dată.
Baza de sondaj pentru o colectivitate generală din care va lua
naştere eşantionul, va trebui, din punct de vedere al organizării, să aibă
unităţile sale simple sau complexe înscrise într-o ordine aleatoare după un
anumit criteriu - alfabetic, teritorial, de timp, etc. - care nu are nici o
legătură cu rangul de mărime al valorilor variabilelor luate în studiu.
Bazele de sondaj pot fi elaborate de către cel ce organizează selecţia sau
pot fi preluate din diferite situaţii întocmite în alt scop. Exemplele cele
mai concludente pot fi datele din listele electorale, lista abonaţilor
posturilor telefonice etc.
STATISTICA

O bază de sondaj trebuie să îndeplinească o serie de condiţii, şi


anume:
• să fie adecvată scopului urmărit (să cuprindă întreaga
populaţie);
• să fie ferită de orice repetiţie (fiecare unitate să fie cuprinsă în
baza de sondaj o singură dată);
• să fie exactă;
• să fie cât mai actuală posibil;
• este convenabil să fie disponibilă într-un singur centru.
În concluzie, o bază de sondaj trebuie să fie completă, constituită
pe principiul hazardului şi corespunzător scopului propus.

5.4 ERORILE CERCETARII PRIN SONDAJ

În accepţiunea cea mai largă, se consideră eroare de selecţie


abaterea care există între valoarea unui parametru (de exemplu, media)
calculat prin prelucrarea datelor din eşantion şi valoarea aceluiaşi
parametru care s-ar fi obţinut dacă s-ar fi organizat o observare totală şi
ar fi fost prelucrate datele de la toate unităţile colectivităţii.
Erorile întâlnite în cadrul sondajului sunt de două feluri:
• erori comune tuturor tipurilor de observări - erori de
înregistrare;
• erori specifice cercetării prin sondaj - erori de
reprezentativitate.
Deoarece înregistrarea datelor se face de un personal specializat şi
pentru un număr restrâns de unităţi, de regulă, în sondaje, erorile de
înregistrare apar într-un număr mic de cazuri şi pot fi înlăturate cu
uşurinţă printr-un eventual control riguros.
Erorile de reprezentativitate specifice sondajului pot fi de două
feluri: erori sistematice şi erori întâmplătoare.
Erorile de reprezentativitate sistematice pot fi evitate dacă se
respectă întocmai principiile teoriei selecţiei, prin înlăturarea cauzelor ce
duc la producerea lor. Principalele cauze care pot duce la apariţia erorilor
sistematice sunt:
• alegerea deliberată a aşa-ziselor unităţi "reprezentative";
• alegerea la "nimereală" (nu la întâmplare) a unităţilor de
eşantion;
Cercetarea prin sondaj

• selectarea preferenţială a acelor unităţi care să ducă la


rezultatul dorit de cercetător;
• substituirea din comoditate a unei unităţi de cercetare prin alta
asemănătoare;
• cuprinderea incompletă în sondaj a unităţilor, din motive de
comoditate.
Erorile întâmplătoare de reprezentativitate pot apare chiar dacă
se respectă cu stricteţe aceste reguli. Ele derivă din însăşi esenţa metodei
de cercetare prin sondaj. Prin numărul mic de unităţi care alcătuiesc
eşantionul nu se poate reproduce decât întâmplător identic seria de
distribuţie a variabilei din colectivitatea generală sau parametrii acesteia.
Deşi nu pot fi evitate, erorile de reprezentativitate, pot fi calculate cu
anticipaţie dacă selecţia este probabilistică. Estimarea parametrilor din
colectivitatea generală se va putea face deci pe baza indicatorilor obţinuţi
din prelucrarea datelor de sondaj cu o eroare întâmplătoare de
reprezentativitate care se găseşte într-un anumit interval probabilistic.
Rezultă deci că fiecărui indicator derivat sau sintetic trebuie să i se
ataşeze şi eroarea sa de reprezentativitate, pentru a putea fi generalizat
pentru întregul ansamblu.
În practica sondajului erorile de reprezentativitate se pot calcula ca
erori efective şi ca erori probabile.

5.4.1 Erori efective. Verificarea reprezentativităţii eşantionului

Erorile efective de reprezentativitate se pot calcula numai pentru


caracteristicile la care s-au obţinut date şi dintr-o observare totală.
Considerând că şi în acest caz media este indicatorul sintetic cel mai
reprezentativ, eroarea efectivă de sondaj se calculează ca diferenţă între
media eşantionului şi media colectivităţii totale. Calculul erorii efective
de sondaj nu este altceva decât verificarea gradului de reprezentativitate a
unui eşantion în raport cu structura colectivităţii totale.
Practica demonstează că numai întâmplător este posibilă
reproducerea unei structuri identice cu aceea a colectivităţii generale,
ceea ce înseamnă că eşantioanele extrase pot avea grade diferite de
STATISTICA

reprezentativitate. Ca atare, înainte de a se trece la prelucrarea datelor


culese se va face verificarea reprezentativităţii eşantionului.
Caracteristicile utilizate la alegerea eşantionului prezintă, de
regulă, forme variate de manifestare şi de aceea verificarea
reprezentativităţii eşantionului nu este întotdeauna o operaţie uşoară.
La verificarea reprezentativităţii eşantionului se porneşte de la
compararea structurii pe grupe a colectivităţii de selecţie cu cea a
colectivităţii generale, denumită şi structură programată. În cazul în care
această structură nu diferă cu mai mult de +/- 5% se acceptă eşantionul
constituit ca fiind reprezentativ.
De exemplu, pentru a verifica gradul de reprezentativitate a unei
observări selective privind cererea de consum a unei grupe de populaţie
se efectuează două selecţii succesive ce vor fi analizate în continuare.
Este ştiut că cererea de consum depinde în primul rând de
mărimea veniturilor obţinute de grupa respectivă de populaţie. Deci, în
acest caz, se va folosi drept caracteristică de eşantionare, după care se va
alcătui colectivitatea de selecţie, mărimea veniturilor, în raport cu variaţia
căreia se verifică gradul de reprezentativitate a selecţiei.
Considerăm că volumul total al unităţilor din grupa respectivă de
populaţie este de 20.000, că volumul celor două selecţii succesive este de
10% şi pe baza centralizării datelor pe grupe de venituri s-au obţinut
seriile empirice de distribuţie de frecvenţe, prezentate în tabelul 5.2.
Cercetarea prin sondaj

Distribuţia vânzărilor după marimea veniturilor săptămânale


în două eşantioane succesive
Tabelul 5.2
Grupe de Distribuţia numărului de vânzători
vânzători colectivitatea în prima selecţie în a doua selecţie
după marimea generală
veniturilor frecvenţe frecvenţe frecvenţe frecvenţe frecvenţe frecvenţe
săptămânale absolute relative absolute relative absolute relative
(mii lei)
0 1 2 3 4 5 6
sub 200 1000 5,0 60 3,0 124 6,2
200 - 220 2400 12,0 164 8,2 260 13,0
220 - 240 5600 28,0 440 22,0 500 25,0
240 - 260 7400 37,0 840 42,0 760 38,0
260 - 280 2200 11,0 280 14,0 240 12,0
280 şi peste 1400 7,0 216 10,8 116 5,8
TOTAL 20000 100,0 2000 100,0 2000 100,0

Comparând cele două distribuţii de selecţie cu distribuţia de


frecvenţe a colectivităţii generale se pot constata unele abateri care le
imprimă acestora tendinţe diferite. În prima selecţie, valorile mai mari
sunt mai bine reprezentate, pe când în cea de-a doua selecţie ponderile
mai mari sunt ataşate valorilor mai mici.
Pentru a putea face o apreciere asupra modului în care
colectivitatea de selecţie reprezintă sau nu colectivitatea generală, se vor
calcula abaterile de structură ale celor două colectivităţi de selecţie de la
structura teoretică a colectivităţii de selecţie. Aceste abateri se vor nota cu
df şi sunt înscrise în tabelul 5.3.
În literatura de specialitate, structurii colectivităţii de selecţie i se
mai spune şi structura programată, deoarece structura ei este identică cu
cea a colectivităţii generale, ceea ce face ca eroarea ei de selecţie să fie
egală cu zero. Selecţia teoretică (programată) se obţine prin aplicarea
frecvenţelor relative ale colectivităţii generale, la volumul colectivităţii de
selecţie (vezi tabelul 5.2 coloana 1).
STATISTICA

Rezultă deci că pe ansamblu abaterile de structură, la acelaşi


volum de selecţie, se compensează reciproc, deoarece :
∑ df = 0.
Pentru a putea măsura gradul de abatere a structurii selecţiei de la
structura programată, se va face raportul dintre suma abaterilor de
structură pozitive şi negative luate în valoare absolută şi volumul selecţiei
(n), adică:

Kf =
∑ df ⋅ 100
n
unde:
K f = coeficientul de realizare a structurii programate a colectivităţii
de selecţie.

Verificarea reprezentativităţii eşantionului

Tabelul 5.3
Grupe de
vânzători Distribuţia numărului de vânzători
după Selecţie teoretică În prima selecţie În a doua selecţie
marimea
veniturilor Abateri faţă Abateri faţă de
săptămânal frecvenţe frecvenţe frecvenţe
absolute relative absolute
de cele
frecvenţe
absolute
cele teoretice
e teoretice d f df
(mii lei)
0 1 2 3 4 5 6
sub 200 100 5,0 60 - 40 124 + 24
200 – 220 240 12,0 164 - 76 260 + 20
220 – 240 560 28,0 440 - 120 500 - 60
240 – 260 740 37,0 840 + 100 760 + 20
260 – 280 220 11,0 280 + 60 240 + 20
280 şi peste 140 7,0 216 + 76 116 - 24
TOTAL 2000 100,0 2000 ∑d = 0 f 2000 ∑d = 0f

∑ d = 472
f
∑d f = 168
Cercetarea prin sondaj

În urma efectuării calculelor se constată că, la prima selecţie


aproape 1/4 din unităţile selectate prezintă abateri de la structura
programată şi în cazul în care nu se vor compensa reciproc vor provoca
erori mai mari sau mai mici într-un sens sau altul, în timp ce la cea de-a
doua selecţie, coeficientul de abatere este sub 10%.
Este de aşteptat ca indicatorii obţinuţi din prelucrarea datelor de
selecţie de la cea de-a doua colectivitate să estimeze mai bine parametrii
respectivi din colectivitatea generală.
Este suficient să se verifice acest lucru prin calcularea mediilor de
selecţie şi a mediei colectivităţii generale:
x0 = 241,6 mii lei

Selecţia Media de Eroarea efectivă de


selecţie reprezentativitate
(mii lei) (d x)
dx = xs − x0
selecţia I xI = 247,6 d x = 247,6 - 241,6 = 6 mii lei
selecţia II xII =240,8 d x = 240,8 - 241,6 = - 0,8 mii lei

Pentru a stabili gradul de reprezentativitate a eşantionului pe baza


erorii medii de selecţie se raportează această eroare la valoarea mediei
colectivităţii totale:

Selecţia Gradul de reprezentativitate


xs − x 0
dx % = ⋅ 100
x0
Selecţia I
6
dx % = ⋅ 0.100 = +2,5%
241,6
Selecţia II
− 0,8
dx % = ⋅ 0.100 = −0,33%
241,6
STATISTICA

Deci eşantionul al doilea este mult mai reprezentativ decât primul,


deşi amândouă se încadrează în intervalul admis (+/- 5%).
De cele mai multe ori în cercetarea concretă nu se dispune de date
cu privire la întreaga colectivitate, pentru a putea verifica astfel în ce
măsură media de selecţie este sau nu reprezentativă. În cazurile în care
media pe întreaga colectivitate nu este anterior cunoscută este necesar să
se efectueze mai multe selecţii succesive pentru a verifica gradul de
stabilitate a mediei şi dispersiei pentru variabila după care se face
eşantionarea. În acest caz, eroarea de reprezentativitate se va calcula:
dx = x − x
în care:
x - media mediilor selecţiilor efectuate pentru verificarea
stabilităţii ei.

5.4.2 Eroarea medie probabilă şi eroarea limită

După cum s-a arătat, în practică, erorile efective de


reprezentativitate nu se pot calcula decât pentru caracteristicile la care se
cunosc, pe lângă datele din eşantion şi datele pentru întreaga colectivitate.
Cum de regulă, programul observării este mai amplu într-o cercetare
selectivă în comparaţie cu o observare totală similară, înseamnă că pentru
unele caracterstici nu există deci posibilitatea de a estima printr-un calcul
statistic mărimea erorii de selecţie. Cu atât mai mult, această problemă
trebuie rezolvată pentru cazul în care metoda selectivă este singura cale
de caracterizare statistică a întregului ansamblu de fenomene de acelaşi
tip. De aceea, concluziile formulate pe baza prelucrării datelor obţinute
prin sondaj trebuie să fie considerate ca enunţuri probabile obţinute ca
urmare a aplicării metodei de selecţie aleatoare care permite interpretarea
mediei de sondaj ca o variabilă aleatoare ce urmează la limită o funcţie de
probabilitate cunoscută, elaborată de statistica matematică.
Pornind de la aceste considerente, rezultă că întreaga teorie a
sondajului statistic se bazează pe principiile teoriei probabilităţilor şi ale
statisticii matematice, de la formarea eşantionului şi până la estimarea
parametrilor colectivităţii totale pe baza datelor din eşantion.
În teoria selecţiei se demonstrează că dacă volumul colectivităţii
de selecţie este suficient de mare, mediile de sondaj urmează la limită
legea distribuţiei din colectivitatea generală, iar media de selecţie ca
Cercetarea prin sondaj

expresie sintetică a nivelurilor individuale ale tuturor unităţilor cercetate,


va fi cât mai aproape de media colectivităţii generale.
În practică însă pentru acelaşi volum de selecţie se pot obţine mai
multe eşantioane extrase succesiv din aceaşi colectivitate totală,
obţinând astfel valori diferite ale mediei de selecţie. În acest proces de
formare a mediilor de selecţie fiecare medie poate să apară o singură dată
sau de mai multe ori. Se confirmă astfel că şi media de selecţie este tot o
variabilă aleatoare căreia i se poate stabili legea de distribuţie.
Pentru a putea urmări modul de formare a distribuţiei de
eşantionare a mediei se va lua un exemplu, în care volumul colectivităţii
generale este de patru unităţi (A; B; C; D) din care se vor forma toate
eşantioanele posibile din câte două unităţi, deci N=4, iar n=2.
Dacă se efectuează toate selecţiile posibile, folosind procedeul
bilei revenite (selecţie repetată) se vor obţine următoarele eşantioane, de
câte două unităţi:
(A+A); (A+B); (A+C); (A+D); (B+A); (B+B); (B+C); (B+D);
(C+A); (C+B); (C+C); (C+D); (D+A); (D+B); (D+C); (D+D);.
Generalizând, înseamnă că în cazul selecţiei repetate se poate
efectua un număr de eşantioane egal cu Nn, respectiv în exemplul luat
42=16.
În cazul selecţiei nerepetate (procedeul bilei nerevenite)
combinaţiile sunt mai puţine datorită faptului că aceeaşi unitate nu poate
participa decât într-un singur eşantion.
În exemplul prezentat vor apare următoarele combinaţii posibile:
(A+B); (A+C); (A+D); (B+A); (B+C); (B+D); (C+D). Formula de calcul
a numărului de eşantioane posibile pentru selecţia nerepetată este dată de
formula de calcul a combinărilor, aplicată la selecţie:
N!
C Nn =
n! ( N − n )!
Fiecare eşantion va fi definit de o medie şi o dispersie calculabilă
pentru fiecare caracteristică înregistrată, care vor prezenta abateri faţă de
media şi dispersia colectivităţii totale.
Erorile de selecţie obţinute ca diferenţe între media de selecţie şi
media generală iau valori diferite de la un eşantion la altul, ceea ce face
necesară calcularea unui indicator sintetic numit eroarea medie de
reprezentativitate.
STATISTICA

Pentru a evita compensarea unor erori de sensuri diferite la


calculul erorii medii de reprezentativitate se foloseşte media pătratică a
abaterilor, notată cu µx
k
∑ ( x s − x0 ) 2 n s
s =1
µx = σ x = k
(5.1)
∑ ns
s =1
în care : k - reprezintă numărul eşantioanelor posibile;
ns - frecvenţa mediilor de selecţie posibile.
Dacă se consideră media de selecţie în sens probabilistic, adică
fiecare valoare a sa ca eveniment favorabil faţă de toate celelalte
evenimente egal posibile, oricât am repeta selecţia, frecvenţa de apariţie a
fiecărei valori a mediei, luată ca frecvenţă relativă, are tendinţa de a
coincide cu probabilitatea de producere a erorii sale faţă de valoarea
mediei colectivităţii generale. În cazul selecţiei aleatoare se poate
demonstra că pentru o anumită fracţie de selecţie (n/N), fiecărei valori a
mediei de selecţie îi corespunde o probabilitate de apariţie bine
determinată, în funcţie de mărimea absolută a abaterii sale faţă de media
colectivităţii generale. De aici rezultă că mărimea şi probabilităţile de
apariţie a diferitelor medii de selecţie sunt determinate şi de volumul
eşantionului. Potrivit legii numerelor mari, cu cât eşantionul cuprinde un
număr mai mare de unităţi în raport cu cel al colectivităţii generale cu atât
media de selecţie va estima mai bine media pe total.
Aceasta corespunde legii numerelor mari, formulată de
J.Bernoulli, potrivit căreia probabilitatea ca diferenţa în valoare absolută
dintre frecvenţa relativă f* şi probabilitatea p de producere a unui
eveniment să fie mai mică decât un număr pozitiv şi arbitrar ε, tinde către
unu când volumul eşantionului tinde către infinit, adică:
lim P(17 * −p / < ε ) → 1 oricare ar fi ε > 0
n →∞

Respectând cerinţele legii numerelor mari, în teoria selecţiei se


demonstrează că dacă volumul eşantionului este suficient de mare (pentru
fenomenele monotipice peste 40 de unităţi), media de selecţie se
distribuie potrivit funcţiei Gauss - Laplace cunoscută în statistică sub
denumirea de distribuţie normală.
Cercetarea prin sondaj

Distribuţia normală este de forma unei distribuţii simetrice în care


cea mai mare probabilitate de apariţie în cazul sondajului o are acea
medie de selecţie care coincide în valoare cu media colectivităţii generale
şi pentru care eroarea de reprezentativitate este egală cu zero. Faţă de
această valoare centrală, celelalte valori ale mediei de selecţie se
distribuie simetric de ambele părţi cu probabilităţi bine determinate, egale
pentru aceeaşi abatere absolută într-un sens sau altul. Faţă de
probabilitatea maximă, probabilităţile de apariţie a mediilor de selecţie
descresc proporţional şi simetric, către capetele distribuţiei. Deci se poate
spune că probabilităţile descresc pe măsură ce cresc erorile de
reprezentativitate care sunt exprimate în aceleaşi unităţi de măsură ca şi
variabila studiată. Pentru a le elibera de această formă concretă şi a le face
comparabile pentru orice variabilă numerică, abaterile absolute se
transformă în abateri normale normate:
xs − x0
= zi
σx

Dacă mediile de selecţie se distribuie după legea normală


înseamnă că şi erorile întâmplătoare de reprezentativitate urmează aceeaşi
formă de repartiţie şi interpretarea lor se face pe baza proprietăţilor
distribuţiei normale (vezi tabelul 5.4), potrivit căreia trebuie stabilit
intervalul de încredere, nivelul de siguranţă şi pragul de semnificaţie.
STATISTICA

Intervalele de încredere, nivelurile de siguranţă şi pragurile de


semnificaţie
Tabelul 5.4
Intervalul de încredere Nivelul de siguranţă Pragul de semnificaţie
( x s ± zσ x ) (%) (%)
0 1 2

( xs ± σ x ) 68,26 % 31,74 %
( xs ± 1,96σ x ) 95,00 % 5,00 %
( xs ± 2σ x ) 95,44 % 4,56 %
( xs ± 2,58σ x ) 99,00 % 1,00 %
( xs ± 3σ x ) 99,73 % 0,27 %
( xs ± 4σ x ) 99,99 % 0,00 %

Pentru interpretarea modului de formare a erorii de


reprezentativitate, pentru o selecţie probabilistă de n unităţi extrase dintr-
o colectivitate generală N, a cărui volum este suficient de mare şi pentru
care se poate formula ipoteza că media de selecţie se distribuie normal se
foloseşte şi reprezentarea grafică (vezi fig. 5.1).

−∞ x − 3σ x − 2σ x −σ x x +σ x + 2σ x + 3σ +∞

Figura 5.1

Interpretând graficul se constată că pe diferite intervale de variaţie


a mediei de selecţie, considerate ca intervale de încredere, se operează cu
două noţiuni complementare: nivelul de siguranţă şi pragul de
semnificaţie.
Cercetarea prin sondaj

Dacă se efectuează toate selecţiile posibile, intervalul de variaţie


al tuturor mediilor obţinute este acoperit cu suma probabilităţilor lor de
k
apariţie ∑ p s = 1,0; unde k = numărul tuturor mediilor de selecţie. Dacă
s =1
se restrânge intervalul de variaţie a mediei de selecţie, atunci eroarea de
reprezentativitate se poate calcula în abateri normale normate ale mediei
de selecţie de la media colectivităţii totale. Aceste intervale de variaţie
( x 0 ± σ x ; x 0 ± 2σ x ; x 0 ± 3σ x ;...) sunt garantate ca nivel de siguranţă cu
probabilităţile corespunzătoare funcţiei de repartiţie normale.
Potrivit teoremei formulată de Leapunov probabilitatea ca
variabila aleatoare (media de eşantionare) să fie cuprinsă între două limite
fixate anticipat, adică:
P = ( x s − zα σ x ) < x0 < ( x s + zα σ x )
poate fi aproximată cu relaţia:
zα z2
1 −
∫e 2 dz = Φ ( zα )
2π − zα
Produsul zα σ x este cunoscut sub denumirea de eroare limită
( ∆x ) .
∆ x = zα σ x
Coeficientul zα reprezintă argumentul funcţiei Laplace şi se
găseşte tabelat. Urmărind valorile probabilităţii Φ( z) , se constată că zα
creşte corespunzător (vezi anexa 2), ceea ce înseamnă că, cu cât scade
probabilitatea cu atât creşte intervalul de încredere al mediei şi scade
exactitatea cu care se estimează media generală pe baza mediei de
selecţie.
Calculul erorii medii de reprezentativitate, necesită cunoaşterea
tuturor mediilor de selecţie posibile, frecvenţelor corespunzătoare lor şi a
mediei colectivităţii generale.
În practică însă cercetarea prin sondaj se foloseşte fie pentru a
completa o observare totală de mare amploare, fie ca singura posibilitate
de caracterizare statistică a fenomenelor respective. În aceste condiţii,
cunoscând, de regulă, numai media calculată pe baza datelor rezultate de
la un singur eşantion, pentru determinarea erorii medii de
STATISTICA

reprezentativitate trebuie să se recurgă la relaţia care există între abaterea


medie pătratică (σ 0 ) , eroarea medie pătratică de reprezentativitate (σ x )
şi volumul eşantionului.
În teoria selecţiei se demonstrează că în cazul selecţiei aleatoare
repetate între cei doi indicatori amintiţi există relaţia:
σ 02 = σ x2 ⋅ n
de unde:
σ0 σ0
σx = =
n n
Se desprinde concluzia că eroarea medie de reprezentativitate este
direct proporţională cu abaterea medie pătratică a colectivităţii generale şi
invers proporţională cu radical din volumul eşantionului.
Cum abaterea medie pătratică, în anumite condiţii de timp şi
spaţiu este un indicator stabil, rezultă că marimea erorii medii de selecţie
poate fi influenţată în plus sau în minus prin modificarea volumului
eşantionului. De regulă, urmărindu-se reducerea erorii de
reprezentativitate se foloseşte relaţia:
σx σ 02
=
k k2 ⋅n
În cazul selecţiei nerepetate numărul de eşantioane fiind mai mic
datorită faptului că fiecare unitate nu participă decât o singură dată la
selecţie, relaţia σ 02 = σ 2x ⋅ n se transformă într-o inegalitate deoarece
câmpul de variaţie al erorilor de reprezentativitate se micşorează.
În relaţiile existente între indicatorii variaţiei din colectivitatea
N −n
generală şi cei de selecţie, în acest caz va interveni raportul . Cu
N −1
acest raport se corectează eroarea medie pentru sondajul repetat şi se
obţine formula de calcul a erorii medii pentru sondajul nerepetat:
σ 02 N − n
σx = ( )
n N −1
În practică, dacă volumul colectivităţii generale este foarte mare se
renunţă la (-1) din numitorul formulei şi formula de calcul a erorii medii
de reprezentativitate devine:
Cercetarea prin sondaj

σ 02 n
σx = (1 −
) (5.4.)
n N
Pentru caracteristica alternativă, eroarea medie de reprezentativitate
se va nota cu σ w , deci:

p(1− p )
• pentru selecţia repetată: σw = (5.5)
n

p(1− p ) n
• pentru selecţia nerepetată σw = ⋅ (1 − )
n N
Dacă nu se dispune de dipersia din colectivitatea generală, atunci
se poate înlocui cu un estimator al acesteia, adică dispersia de eşantion. În
acest caz se corectează volumul eşantionului din formula erorii medii cu
un grad de libertate.
Calculul erorii medii de reprezentativitate presupune efectuarea
unor calcule necesare determinării erorii limită, ce se poate accepta în
cercetarea prin sondaj.
Deoarece media sondajului folosit pentru estimarea parametrilor
din colectivitatea generală poate lua valori mai apropiate sau mai
îndepărate de media generală, este necesar să se stabilească mărimea
erorii limită. Eroarea limită de reprezentativitate se determină ca o abatere
între media de selecţie şi media colectivităţii generale, garantată cu
probabilitatea corespunzătoare limitelor intervalului de variaţie.
Din formulele prezentate se observă că eroarea limită este o
mărime variabilă, direct proporţională cu probabilitatea cu care se
garantează rezultatele şi invers proporţională cu precizia rezultatelor.
Eroarea limită se poate mări fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează
rezultatele, deoarece pentru condiţii date de timp şi spaţiu dispersia
colectivităţii totale este o valoare constantă.
În concluzie, se poate afirma că eroarea medie şi eroarea limită pot
fi calculate anticipat dacă despre o variabilă statistică se cunosc media şi
dispersia generală sau un estimator al acestora şi s-a stabilit cu ce volum
al eşantionului se va lucra şi cu ce probabilităţi se vor garanta rezultatele.
Pentru acelaşi volum al eşantionului se obţine o singură eroare medie şi
STATISTICA

mai multe erori limită schimbând coeficientul de probabilitate şi pentru


acelaşi coeficient de probabilitate se pot obţine mai multe erori limită
dacă se modifică volumul eşantionului. Deci, valoarea erorii limită
depinde de volumul de selecţie şi de siguranţa cu care se estimează
abaterea dintre media eşantionului şi media colectivităţii generale.
Indicatorii de selecţie calculaţi – media, eroarea medie de
reprezentativitate şi eroarea limită – pot servi la estimarea parametrilor
din colectivitatea generală. În acest scop se folosesc următoarele
procedee:
• procedeul coeficientului de corectare a erorilor de înregistrare;
• procedeul extinderii directe a rezultatelor sondajului la
estimarea colectivităţii totale.
Procedeul coeficientului de corectare a erorilor de înregistrare se
bazează pe probabilitatea ca erorile depistate în sondajul efectuat să
coincidă cu aceeaşi probabilitate ca şi pe total. Deci, refăcând
înregistrarea la o parte a unităţilor selectate aleator se face raportul dintre
datele observării totale şi cele de sondaj şi coeficientul respectiv se aplică
datelor din observarea totală.
Procedeul extinderii directe este cel mai frecvent utilizat în
aplicarea cercetării prin sondaj ca mijloc de caracterizare a întregii
colectivităţi. Aplicarea acestui procedeu permite estimarea intervalului de
încredere pentru nivelul mediu al caracteristicii cât şi determinarea
limitelor între care variază nivelul totalizat al caracteristicii pe întrega
colectivitate, acest lucru fiind posibil numai în cazul în care se cunoaşte
volumul colectivităţii totale (N).
De asemenea, pornind de la relaţia de calcul a erorii limită se
poate determina volumul eşantionului. Formulele de calcul diferă în
funcţie de tipul selecţiei şi de procedeul de selecţie folosit şi ca urmare
formulele de calcul vor fi prezentate în subcapitolul care urmează.

5.5 TIPURI DE SONDAJ

Tipul de sondaj folosit în studiul fenomenelor social-economice


este în funcţie de gradul de omogenitate al colectivitatăţii studiate selectiv
precum şi de forma de organizare a colectivităţii ce formează obiectul
cercetării.
Cercetarea prin sondaj

Frecvent în practica statistică se folosesc următoarele tipuri de


selecţii:
• selecţia aleatoare simplă;
• selecţia tipică;
• selecţia de serii etc.
În fiecare dintre selecţiile prezentate se calculează trei indicatori
de bază şi anume: eroarea medie de reprezentativitate, eroarea limită şi
volumul eşantionului. Pe baza rezultatelor folosite se realizează estimarea
parametrilor din colectivitatea generală.
Prezentăm în continuare modul de calcul al indicatorilor de
selecţie pentru principalele tipuri de sondaj întâlnite în statistica social-
economică.

5.5.1 Selecţia aleatoare simplă

Practica sondajului demonstrează că selecţia aleatoare simplă


poate fi folosită cu succes numai în studierea unor colectivităţi
monotipice care prezintă un grad ridicat de omogenitate. În acest caz,
eşantionul se formează din unităţi simple care se extrag din colectivitatea
generală prin procedeul repetat sau nerepetat pe baza unei scheme
probabiliste.
Acest tip de selecţie dispune de cele mai simple formule de calcul
a indicatorilor de selecţie care cu unele modificări se folosesc ca bază de
calcul şi în celelalte tipuri de selecţie. Se poate spune pe drept cuvânt că
deşi acest tip de selecţie nu dă rezultate bune în cazul colectivităţilor
neomogene, prezintă avantajul că multe din principiile fundamentale ale
selecţiei pot fi explicate pe baza selecţiei aleatoare simple. În această
situaţie sondajul simplu apare ca o variantă a procedeului bilei revenite
sau nerevenite.
STATISTICA

Intervalul de încredere al mediei colectivităţii generale este


determinat de mărimea medie a eşantionului şi de eroarea limită
respectivă, astfel:
• pentru caracteristica nealternativă:
x s − ∆ x < x0 < x s + ∆ x
• pentru caracteristica alternativă:
w − ∆w < p < w + ∆w
În mod asemănător se poate calcula intervalul de încredere al
oricărui alt parametru.
Determinarea intervalului de variaţie al mediei estimate pe baza
datelor de selecţie permite şi stabilirea intervalului de variaţie al nivelului
totalizat al caracteristicii care se poate determina după relaţia:
• pentru caracteristica nealternativă:
N
N( x s − ∆ x ) < ∑ x i < N( x s + ∆ x )
i =1
• pentru caracteristica alternativă:
N ( w − ∆ w ) < M < N ( w + ∆w )
După cum s-a arătat precizia rezultatelor selecţiei, posibilitatea
extinderii lor asupra întregii colectivităţi depinde şi de numărul de unităţi
la care se face culegerea datelor.
Dacă se consideră, drept criteriu de eficienţă a sondajului mărimea
erorii de estimare a mediei generale, atunci trebuie ca volumul
eşantionului să corespundă relaţiei:
zασx ≤ ∆ x
Pentru determinarea limitei minime a volumului eşantionului se
ţine seama de procedeul de selecţie aplicat. Pentru sondajul simplu repetat
va fi:
σ 02
∆ x = zα
n
de unde:
z 2 σ2
n = α2 0 (5.11)
∆x
Cercetarea prin sondaj

Această mărime este minimă pentru asigurarea gradului de


reprezentativitate dorit.
Pentru sondajul simplu nerepetat:
σ 02 n
∆x = zα (1 − )
n N
de unde:
z α2 σ 02
n= (5.12)
2 z α2 σ 02
∆x +
N
Comparând cele două relaţii rezultă că pentru acelaşi grad de
reprezentativitate volumul eşantionului este cel mai mic dacă se foloseşte
procedeul bilei nerevenite.
Pentru a urmări tehnica de calcul a indicatorilor de selecţie
amintiţi, prezentăm datele convenţionale din tabelul 5.5 obţinute în urma
înregistrării şi prelucrării datelor referitoare la volumul desfacerilor
trimestriale la 120 societăţi comerciale (10% din populaţia totală).
Tabelul 5.5
Grupe de societăţi după Numărul societăţilor
volumul desfacerilor
trimestriale (mil lei)
A 1
400 - 410 8
410 - 420 16
420 - 430 22
430 - 440 30
440 - 450 26
450 - 460 18
TOTAL 120
Notă: Limita inferioară inclusă în interval
Deoarece nu cunoaştem dispersia dintr-o cercetare totală
anterioară, vom folosi dispersia de selecţie pentru calculul erorii medii şi
erorii limită.
Efectuând calculele am obţinut:
x s = 433,67 mil lei şi
σ s2 = 211,56
STATISTICA

44
w= = 0,37
120
σ w2 = w( 1 − w ) = 0,37( 1 − 0,37 ) = 0,2331
Ne propunem să calculăm indicatorii de selecţie ( σ x şi ∆ x , σ w şi
∆ w ), în condiţiile în care rezultatele vor fi garantate cu o probabilitate
p = Φ(z)=0,95 la care corespunde z = 1,96.
• selecţia repetată:

σ s2 211,56
σx = = = 1,33 mil lei
n 120
∆ x = z ⋅ σ x = 1,96 ⋅ 1,33 = 2,60 mil lei
• selecţia nerepetată:

σ s2  N − n  211,56  1200 − 120 


σx =  =   = 1,33 mil lei
n  N −1  120  1199 
∆ x = z ⋅ σ x = 1,96 ⋅ 1,26) = 2,47 mil lei
Se poate aprecia, pe baza probabilităţii cu care se garantează
rezultatele, că în 9500 de cazuri din 10000 posibile, media de selecţie se
va abate de la volumul vânzărilor din colectivitatea generală cu cel mult
+2,60 milioane lei în cazul în care eşantionul s-a construit după procedeul
bilei revenite şi +2,47 milioane de lei când eşantionul s-a format după
procedeul bilei nerevenite.
Eroarea medie şi eroarea limită a greutăţii specifice a societăţilor
comerciale cu un volum al desfacerilor mai mare decât media (în cazul
caracteristicii alternative) vor fi:
• selecţia repetată

w( 1 − w ) 0,2331
µw = σ w = = = 0,044
n 120
∆w = zα µ w = 1,96 ⋅ 0,044) = 0,0862 sau 8,6%
Cercetarea prin sondaj

• selecţia nerepetată

w( 1 − w )  N − n  0,2331  120 
µw = σ w =  = 1 −  = 0,042
n  N −1  120  1200 

∆w = zα µ w = 1,96 ⋅ 0,042) = 0,082 sau 8,2%


Deci, greutatea specifică a societăţilor comerciale care obţin un
volum al desfacerilor mai mare decât media, se va abate într-un sens sau
altul cu + 8,6% în cazul selecţiei repetate şi cu + 8,2% în cazul selecţiei
nerepetate, rezultatele fiind garantate cu aceeaşi probabilitate de 0,95.
Rezultatele obţinute confirmă concluzia formulată teoretic potrivit
cărei în selecţia nerepetată erorile sunt mai mici. Ca urmare a acestui fapt
intervalul de încredere pentru estimarea parametrilor colectivităţii
generale va fi mai mic, deci rezultatele vor avea un grad de precizie mai
ridicat atât pentru caracteristica nealternativă cât şi pentru cea alternativă.
Într-adevăr, folosind procedeul extinderii directe vom obţine
următoarele intervale de încredere pentru x 0 :
• selecţia repetată
x s − ∆ x < x0 < x s + ∆ x
433,67 − 2,60 < x0 < 433,67 + 2,60
431,07 < x0 < 436,27 mil. lei/s.c.
• selecţia nerepetată
xs − ∆x < x0 < xs + ∆x
433,67− 2,47 < x0 < 433,67+ 2,47
431,20< x0 < 436,14 mil. lei/s.c.
Rezultă că volumul desfacerilor realizate, în medie, de o societate
comercială este cuprins între 431,07 milioane de lei şi 436,27 milioane de
lei în cazul selecţiei repetate şi între 431,20 şi 436,14 milioane de lei în
cazul selecţiei nerepetate.
Volumul total al desfacerilor realizate de cele 1200 societăţi va fi
pentru:
• selecţia repetată
N ( x s ± ∆ x ) = 1200(433,6 7 ± 2,60)
STATISTICA

1200
517284 < ∑ xi < 523524 mil. lei
i =1

• selecţia nerepetată

N ( xs ± ∆ x ) = 1200(433,6 7 ± 2,47)
1200
517440 < ∑ xi < 523368 mil. lei
i =1
Proporţia societăţilor care vor realiza un volum al desfacerilor mai
mare decât media, în colectivitatea generală, se va situa între următoarele
valori pentru:
• selecţia repetată
w − ∆w < p < w + ∆w
0,37 − 0,0862 < p < 0,37 + 0,0862
0,2838 < p < 0,4562
• selecţia nerepetată
0 ,37 − 0 ,082 < p < 0,37 + 0,082
0,288 < p < 0 ,452
În continuare trebuie să se determine volumul necesar pentru
proiectarea unui nou sondaj dacă rezultatele se garantează cu aceeaşi
probabilitate iar eroarea limită se micşorează de 1,1 ori.
Aplicând formulele de calcul vom obţine pentru:
• selecţia repetată

z 2σ s2 1,9 2 * 211,56
n= 2
= 2
= 137 societăţi comerciale
 ∆x   2 ,60 
   
 1,1   1,1 
• selecţia nerepetată

z 2σ s2 1,9 2 * 211,56
n= 2
= 2
= 135 societăţi
 ∆x  z 2σ s2  2,47  1,9 2 * 211,56
  +   +
 1,1  N  1,1  1200
comerciale
Cercetarea prin sondaj

Deci în selecţia nerepetată, volumul eşantionului este de 135


societăţi comerciale, cu 2 mai puţin decât în selecţia repetată.

5.5.2 Selecţie tipică (stratificată)

Selecţia tipică constituie tipul de selecţie care se aplică cel mai


frecvent în cercetarea fenomenelor social-economice de masă. Selecţia
tipică se aplică în cazul colectivităţilor neomogene formate din unităţi
simple şi presupune structurarea colectivităţii generale pe straturi (grupe)
mai omogene şi extragerea din fiecare strat a unui subeşantion folosind un
procedeu de selecţie aleatoare.
Pentru delimitarea straturilor se folosesc fie variabile calitative
(judeţe, medii de provenienţă etc.), fie variabile cantitative (cifra de
afaceri, numărul de angajaţi, vârsta etc.).
Numărul de straturi se stabileşte astfel încât :
• fiecare subeşantion să conţină un număr suficient de mare de
unităţi;
• sporul de precizie adus de stratificare să nu fie anihilat de
creşterea costurilor şi complicarea calculelor.
Erorile de reprezentativitate la selecţia tipică sunt mai mici decât
la selecţia simplă. Cu cât grupele în care a fost împărţită colectivitatea
sunt mai omogene, cu atât mediile de grupă au valori mai apropiate de
valorile individuale din care s-au calculat şi, deci, abaterile într-un sens
sau altul sunt mai puţin importante.
În acest caz, variaţia mediilor de selecţie posibile va depinde de
gradul de variaţie a fiecărei grupe, sintetizat în mărimea mediei
2
dispersiilor parţiale (σ ).
Deoarece σ 2 < σ 2 , vor rezulta erori mai mici prin aplicarea
selecţiei tipice, şi în acest caz, dacă nu dispunem de date dintr-o cercetare
totală anterioară, vom folosi pentru calculul indicatorilor de selecţie
media dispersiilor parţiale din colectivitatea de selecţie ( σ 2 ).
În vederea repartizării eşantionului pe subeşantioane
corespunzător tipurilor calitative, se pot aplica trei modalităţi.
STATISTICA

1. Repartizarea în mod egal a eşantionului pe subeşantioane


indiferent de numărul unităţilor ce compun straturile populaţiei totale:
n
ni =
k
unde:
ni – dimensiunea fiecărui subeşantion
k – numărul de straturi în populaţia totală
Acest tip de selecţie mai poartă denumirea de selecţie tipică
(stratificată) neproporţională. De reţinut că la determinarea erorii medii
de reprezentativitate se ţine cont de ponderea straturilor în colectivitatea
generală.
2. Eşantionul se separă pe subeşantione în funcţie de ponderea
fiecărui strat în colectivitatea generală:
n1 n n
= 2 = ... = i = ... =
∑ ni = n
N1 N 2 Ni ∑ Ni ∑ Ni
de unde:
Ni
ni = n
∑ Ni
Acest tip de selecţie se mai numeşte selecţia tipică (stratificată)
proporţională şi se foloseşte frecvent în practică, deoarece datorită
modului de formare a eşantionului, structura colectivităţii de selecţie (a
eşantionului) este identică cu aceea a colectivităţii generale, asigurându-
se în felul acesta erori mai mici.
3. La formarea subeşantioanelor se ia în consideraţie atât
ponderea fiecărui strat în colectivitatea generală cât şi gradul de
omogenitate al straturilor, reprezentat de abaterea medie pătratică:

ni = n k i i
∑ N iσ i
i =1
Acest tip de selecţie se mai numeşte selecţia tipică (stratificată)
optimă. deoarece dă cele mai mici erori în practică, dar este greu de
aplicat.
Deoarece eşantinul se formează prin extragerea aleatoare de
subeşantione din straturile existente în colecivitatea generală, la
determinarea erorii medii de reprezentativitate se vor folosi dispersiile de
Cercetarea prin sondaj

grupă sintetizate prin intermediul mediei dispersiilor de grupă. Media


dispersiilor de grupă fiind întotdeauna mai mică decât dispersia totală,
înseamnă că erorile de reprezentativitate generate de selecţia tipică sunt
întotdeauna mai mici decât cele ale selecţiei aleatoare simple.
Relaţiile de calcul în cazul sondajului tipic proporţional se
particulariază pornind de la cele ale sondajului aleator simplu, înlocuind
dispersia colectivităţii generale sau dispersia eşantionului (când nu se
cunoaşte dispersia colectivităţii generale) cu media dispersiilor de grupă.
Ca urmare:
• eroarea medie de reprezentatrivitate:

σ2
σx = pentru selecţia repetată
n
σ2 n
σx = 1 −  pentru selecţia nerepetată
n  N
• eroarea limită maximă admisă
σ2
∆x = z ⋅ pentru selecţia repetată
n
σ2 n
∆x = z ⋅ 1 −  pentru selecţia nerepetată
n  N
• estimarea mediei la nivelul colectivităţii generale
x − ∆ x < x0 < x + ∆ x
unde
x=
∑ xi ni
∑ ni
• estimarea nivelului totalizat al caracteristicii
N
N ( x − ∆ x ) < ∑ xi < N ( x + ∆ x )
i =1
• dimensionarea eşantionului
z 2σ 2
n= 2
pentru selecţie repetată
∆x
STATISTICA

z 2σ 2
n= pentru selecţie nerepetată
z 2σ 2
∆2x +
N
Pentru estimarea cheltuielilor suplimentare medii şi totale zilnice
efectuate de turiştii din cadrul unui sejur de 3 zile s-a efectuat un sondaj
stratificat proporţional de 5%, datele înregistrate s-au prelucrat şi
rezultatele calculelor sunt prezentate în tabelul 5.6.

Cheltuielile medii zilnice şi coeficientul de variaţie în eşantion


Tabelul nr. 5.6
Grupe de turişti Numărul Cheltuieli Coeficientul de
după vârstă turiştilor suplimentare variaţie al
(ani) medii zilnice cheltuielilor
(mii lei) suplimentare (%)
0 1 2 3
sub30 130 200 20
30-50 180 300 25
50 si peste 90 400 33
TOTAL 400 … ...

Calculul indicatorilor de selecţie şi estimarea parametrilor


colectivităţii generale (se vor folosi notaţiile de la regula adunării
dispersiilor)
• media mediilor de grupă:
r
∑ y i ni
200 ⋅ 130 + 300 ⋅ 180 + 400 ⋅ 90
y= i =1
r
= = 290 miilei/turist
400
∑ ni
i =1
Cercetarea prin sondaj

• dispersiile de grupă σ i2 ( )
σi vi ⋅ y i
vi = ⋅ 100 de unde: σi =
yi 100

20 ⋅ 200
σ1 = = 40 mii lei/turist ⇒ σ 12 = 1600
100

25 ⋅ 300
σ2 = = 75 mii lei/turist ⇒ σ 22 = 5625
100

33 ⋅ 400
σ3 = = 132 mii lei/turist ⇒ σ 32 = 17424
100

• media dispersiilor de grupă σ 2 ( )


r
∑ σ i2 ni 1600 ⋅130 + 5625 ⋅180 + 17424 ⋅ 90
i =1
σ2= r
= = 6971,65
400
∑ n⋅
i =1

• eroarea medie de reprezentativitate σ y ( )


σ2  n 6971,65  400 
σy = ⋅ 1 −  = 1 −  = 4 ,069 mii lei
n  N 400  800 

• eroarea limită maximă admisă ∆ y ( )


∆ y = z ⋅ σ y = 2 ⋅ 4,069 = 8,138 mii lei
STATISTICA

• estimarea cheltuielilor medii zilnice suplimentare pe total


colectivitate:

y − ∆ y < y0 < y + ∆ y

de unde:

290 – 8,138< y 0 <290 + 8,138

281,862 < y 0 < 298,138 mii lei/turist

• estimarea cheltuielilor zilnice suplimentare totale:

N
N ( y − ∆ y ) < ∑ yi < N ( y + ∆ y )
i =1

8000
8000 ⋅ 281,862 < ∑ yi < 8000 ⋅ 298,138
i =1

8000
2154896 < ∑ yi < 2385104 mii lei
i =1

Dacă pentru formarea eşantionului s-ar fi folosit sondajul aleatoriu


simplu nerepetat, pentru asigurarea aceleiaşi precizii, volumul
eşantionului s-ar fi determinat după formula:

z 2 ⋅ σ 02
n=
z 2 ⋅ σ 02
∆2y +
N
Deoarece nu cunoaştem dispersia totală din colectivitatea generală
ci numai datele despre eşantionul format prin respectarea principiilor unei
scheme probabilistice, putem înlocui acest indicator prin dispersia totală a
datelor din eşantion.
Cercetarea prin sondaj

Dispersia totală a eşantionului se determină în acest caz din regula


de adunare a dispersiilor:

σ2 = δ2 + σ 2

r
∑ ( yi − y )ni
i =1 ( 200 − 290 )2 ⋅ 130 + ( 300 − 290 )2 ⋅ 180 + ( 400 − 290 ) 2 ⋅ 90
δ2 = r
=
400
∑ ni
i =1
= 5400

σ 2 = 5400 + 6971,65 = 12371,65

2 2 ⋅ 12371,65
n= = 684 turişti.
2 2 ⋅ 12371,65
2
8,138 +
8000

Deci, în cazul utilizării unui sondaj aleator simplu pentru acelaşi


grad de reprezentativitate trebuie luaţi în studiu 684 turişti faţă de numai
400 cât sunt necesari, dacă populaţia se stratifică pe cele trei grupe de
vârstă.

Dacă se organizează o nouă cercetare selectivă şi se acceptă o


eroare limtă maximă admisă cu 5% mai mare decât cea calculată anterior,
celelalte condiţii rămânând nemodificate, volumul eşantionului se
calculează după relaţia:

z 2 ⋅σ 2
n′ = 2
⋅σ 2
(∆ ′y )2 + z N

unde:

∆ ′y = 1,05 ⋅ ∆ y = 8,545 mii lei/turist


STATISTICA

4 ⋅ 6971,65
n′ = = 364 turişti
2 4 ⋅ 6971,65
8,545 +
8000

Repartizarea pe subeşantioane luând în calcul sondajul tipic


nerepetat (n = 364 turişti):

• neproporţională

n 364
ni = = ≅ 121 turişti
r 3

• proporţională

Ni
ni = n r
∑ Ni
i =1

Rezultatele calculelor sunt prezentate în tabelul 5.7.

Tabelul 5.7
Grupe de Numărul % ni
turişti după turiştilor turiştilor
vârstă ( Ni ) Ni
⋅ 100
(ani) r
∑ Ni
i =1
0 1 2 4
Sub 30 2600 32,5 118
30-50 3600 45,0 164
50 si peste 1800 22,5 82
TOTAL 8000 100,0 364
Cercetarea prin sondaj

De reţinut:
• Pentru a obţine acelaşi grad de precizie a rezultatelor, eşantionul
constituit prin stratificare este mai mic decât cel pentru sondajul
aleator simplu;
• Pentru acelaşi volum al eşantionului, precizia este mai mare în
cazul sondajului stratificat decât în cazul sondajului aleator
simplu;
• Eşantionul trebuie dimensionat astfel încât fiecare subeşantion să
conţină un număr suficient de unităţi pentru a permite calcularea
dispersiilor la nivelul subeşantioanelor (ni>35);

5.5.3 Selecţia de serii

Se foloseşte în cazul în care colectivitatea generală este formată


din unităţi complexe (echipe, brigăzi, ferme, etc.)
Seriile sunt unităţi complexe care sunt formate la rândul lor din
unităţi simple. Unităţile complexe, fiind alcătuite din unităţi simple ce
posedă caracteristici proprii ce le deosebesc una de alta, nu se aseamănă
cu grupele tipice alcătuite din unităţi omogene.
Pentru ca eşantionul format în acest caz să fie reprezentativ pentru
întreaga colectivitate se va extrage printr-unul din procedeele de selecţie
arătate mai înainte unităţi complexe. Caracteristic pentru acest tip de
sondaj este faptul că în locul variantelor concrete ale caracteristicii din
sondajele individuale se vor folosi indicatori calculaţi la nivelul seriei.
Pentru ca seriile ce formează eşantionul să reflecte structura
colectivităţii generale, va trebui ca acestea să fie formate din unităţi la fel
de omogene sau neomogene.
Cu cât mediile din serii sunt mai apropiate între ele, vor estima
mai corect valoarea medie a întregii colectivităţi, relizându-se condiţia de
reprezentativitate a eşantionului.
În acest tip de sondaj dispersia dintre serii (δ 2 ) înlocuieşte
dispersia generală σ 02 din sondajul simplu şi ca atare erorile de
reprezentativitate calculate pe baza datelor unui sondaj de serii, sunt mai
mici, sau cel mult egale cu erorile sondajului simplu (deoarece δ 2 < σ 02 )
ca şi componentă a dispersiei generale este mai mică decât aceasta.
STATISTICA

Eşantionarea făcându-se pe bază de serii, eşantionul este format


dintr-un număr de serii notat cu r, iar în colectivitatea generală numărul
seriilor se va nota cu R. Analog cu selecţia tipică se vor elabora şi
formulele pentru selecţia de serii, cu deosebirea că în locul mediei
dispersiilor de grupă se va folosi dispersia dintre grupe (serii), iar în locul
volumului eşantionului (n) se va folosi numărul de serii din eşantioane (r)
care este mult mai mic decât volumul eşantionului adică:
δ 2x
µ xrep = ;.
r
δ 2x R−r
µ xnerep = ⋅ ;
r R −1
δ 2p
µ wrep = ;
r
δ 2p R−r
µw nerep = ⋅ .
r R −1

Aplicaţie

Pentru verificarea duratei medii de ardere a unui bec s-a organizat


un sondaj de 5% dintr-un lot de 2000 de becuri ambalate în cutii de câte
10 bucăţi. În urma cronometrării duratei de ardere a becurilor din fiecare
cutie (serie) s-a calculat durata medie de ardere (vezi tabelul 5.8
coloana 1).
Cercetarea prin sondaj

Tabelul 5.8
Nr.crt. Durata medie ( xi − x s ) 2
al seriei de ardere (în
ore)
( xi )
A 1 2
1 2100 2809
2 2250 9409
3 2080 5329
4 1950 41209
5 2325 29584
6 2230 5929
7 2170 289
8 2050 10609
9 2175 484
10 2200 2209
TOTAL 21530 107860

Deoarece cutiile (seriile) sunt de aceeaşi dimensiune, pentru


calculul mediei pe total se foloseşte relaţia:

xs =
∑ xi = 21530 = 2153 ore/bec
r 10

Pentru calcularea erorii medii este necesară calcularea dispersiei


dintre serii (vezi tabelul 5.8, col.2):
r
∑ ( x i − x s )2 107860
i =1
δ s2 = = = 10786
r 10
STATISTICA

Fiind un sondaj de serii unde R = 200, r = 10 eroarea limită se


calculează astfel:

δ s2 R − r 10786 200 − 10
∆x = z ⋅ = 1,96 ⋅ = 62,9 ore
r R −1 10 200 − 1

Limitele între care se va încadra media pe total:

xs − ∆x < x0 < xs + ∆x

de unde:
2153 - 62,9 < x0 < 2153 + 62,9
2090,1 < x 0 < 2215,9 ore/bec

Dacă se organizează o nouă cercetare selectivă şi pentru


garantarea rezultatelor se foloseşte o probabiltate de 0,9973 (z=3), noul
volum de sondaj va fi:

R ⋅ (z ′)2 ⋅ δ s2 200 ⋅ 3 2 ⋅ 10786


r′ = = =
(R − 1) ⋅ ∆2x + (z ′)2 ⋅ δ s2 199 ⋅ 62 ,9 2 + 3 2 ⋅ 10786
= 21,95 ≅ 22

În concluzie, se poate spune, că alegerea tipului de selecţie trebuie


să se facă în funcţie de gradul de precizie a rezultatelor, de structura
calitativă a colectivităţii generale şi de mărimea cheltuielilor ce se fac cu
observarea şi prelucrarea datelor provenite dintr-un sondaj statistic.
Eficient este ca din multitudinea de soluţii să se aleagă acele tipuri de
selecţie care să permită estimarea parametrilor din colectivitatea generală
cu gradul de siguranţă cel mai ridicat în condiţiile unui cost minim.
Cercetarea prin sondaj

5.6 ÎNTREBĂRI ŞI TESTE-GRILĂ

5.6.1 Întrebări recapitulative

1. Care sunt principalele avantaje ale sondajului statistic?


2. Ce este un eşantion reprezentativ?
3. Ce condiţii trebuie respectate pentru a asigura
reprezentativitatea eşantionului?
4. Ce criterii se folosesc la dimensionarea eşantionului?
5. Ce sunt erorile de reprezentativitate?
6. De câte feluri sunt erorile de reprezentativitate?
7. Prin ce se caracterizează erorile de reprezentativitate
întâmplătoare?
8. Prin ce se caracterizează erorile de reprezentativitate
sistematice?
9. Cum pot fi evitate erorile de reprezentativitate sistematice?
10. Ce tipuri de selecţie aleatoare cunoaşteţi?
11. Cum se realizează selecţia aleatoare?
12. Ce procedee de selecţie aleatoare cunoaşteţi?
13. Prin ce se caracterizează procedeul bilei revenite?
14. Prin ce se caracterizează procedeul bilei nerevenite?
15. Prin ce se caracterizează procedeul tabelului cu numere
aleatoare?
16. Ce metode de selecţie dirijată cunoaşteţi?
17. Cum se realizează selecţia mecanică?
18. Când se utilizează sondajul aleator simplu?
19. Cum se construieşte eşantionul în cazul sondajului aleator
simplu?
20. Cum se calculează erorile în cazul sondajului aleator simplu?
21. Ce informaţii sunt necesare pentru dimensionarea eşantionului
în cazul sondajului aleator simplu?
22. Când se utilizează sondajul stratificat?
23. Ce tipuri de sondaj stratificat cunoaşteţi?
24. Ce criterii se folosesc la stabilirea straturilor?
25. Ce este variabila de stratificare şi cum se stabileşte aceasta?
STATISTICA

26. Cum se formează eşantionul în cazul sondajului stratificat


neproporţional?
27. Cum se formează eşantionul în cazul sondajului stratificat
proporţional?
28. Cum se formează eşantionul în cazul sondajului stratificat
proporţional optim?
29. Cum se calculează erorile în cazul sondajului stratificat
proporţional?
30. Cum este dimensiunea eşantionului în cazul sondajului aleator
simplu faţă de cea a eşantionului în cazul sondajului stratificat
dacă se doreşte asigurarea aceleiaşi precizii a rezultatelor?
31. Cum este precizia în cazul sondajului aleator simplu faţă de
sondajul stratificat pentru aceeaşi dimensiune a eşantionului?
Justificaţi răspunsul.
32. Cum variază intervalul de încredere comparativ cu precizia
rezultatelor?
33. Când se utilizează sondajul de serii?
34. Ce presupune sondajul de serii?
35. Cum se calculează erorile în cazul sondajului de serii?

5.6.2 Teste-grilă

1. Cercetările selective sunt singurele posibile pentru:


a) controlul calităţii produselor prin metode distructive;
b) determinarea preferinţelor consumatorilor;
c) analiza veniturilor şi cheltuielilor populaţiei;
d) estimarea productivităţii muncii.
2. Un eşantion este considerat reprezentativ atunci când:
a) volumul său este mic;
b) reproduce în structura sa structura colectivităţii generale;
c) eroarea medie de reprezentativitate este mare;
d) s-a folosit selecţia aleatoare.
3. Erorile probabile de sondaj sunt:
a) direct proporţionale cu volumul eşantionului;
b) invers proporţionale cu volumul eşantionului;
c) independente de volumul eşantionului;
Cercetarea prin sondaj

d) evitabile.
4. Precizia sondajului aleator repetat se dublează dacă:
a) eşantionul se dublează;
b) eşantionul se reduce la jumătate;
c) volumul eşantionului se măreşte de 4 ori;
d) volumul eşantionului se micşorează de 4 ori;
e) nu există legătură între volumul eşantionului şi precizia
sondajului.
5. Precizia sondajului creşte dacă:
a) se măreşte volumul eşantionului;
b) se micşorează volumul eşantionului;
c) se fac selecţii dirijate.
6. Dacă s-a exclus orice intervenţie subiectivă la alegerea
eşantionului, atunci selecţia este:
a) aleatoare;
b) dirijată;
c) mixtă;
d) incorectă.
7. Comparativ cu selecţia repetată, selecţia nerepetată
presupune:
a) erori mai mari;
b) erori mai mici;
c) acelaşi nivel de eroare;
d) exclude erorile.

8. Procedeul tragerii la sorţi se foloseşte:


a) pentru colectivităţi de dimensiuni mari;
b) pentru colectivităţi de dimensiuni mici;
c) pentru selecţii dirijate;
d) pentru selecţia mecanică.
9. Erorile de reprezentativitate specifice sondajului pot fi:
a) sistematice şi întâmplătoare;
b) de înregistrare şi de calcul;
c) efective şi probabile;
STATISTICA

d) cantitative şi calitative.
Alegeţi combinaţia corectă: A(a,c); B(a,b,c); C(d).
10. În cazul colectivităţiilor omogene formate din unităţi simple,
neîmpărţite în grupe, se utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
11. În cazul colectivităţiilor neomogene formate din unităţi
simple, împărţite în grupe, se utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
12. În cazul colectivităţiilor formate din unităţi complexe, se
utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
13. Pentru a obţine aceeaşi precizie a rezultatelor, eşantionul
constituit prin stratificare (sondaj tipic) este:
a) mai mic decât cel pentru sondajul aleatoriu simplu;
b) mai mare decât cel pentru sondajul aleatoriu simplu;
c) egal cu cel pentru sondajul aleatoriu simplu.
14. La acelaşi volum al eşantionului, în cazul sondajului aleatoriu
simplu precizia este:
a) mai mare decât la sondajul tipic;
b) mai mică decât la sondajul tipic; c) egală.
Soluţii:
1.a; 2.b; 3.b; 4.c; 5.a; 6a; 7.b; 8.b; 9.A; 10.a; 11.c; 12.d; 13.a; 14.b.

S-ar putea să vă placă și