Sunteți pe pagina 1din 20

Elemente de sondaj statistic

ELEMENTE DE SONDAJ STATISTIC

Introducere
Cunoasterea realitatii din oricare domeniu de activitate presupune sa se dispuna de date
individuale pentru caracteristicile care intereseaza, iar prin sistematizarea si prelucrarea acestor
date sa se obtina informatii care raspund obiectivului urmarit. Datele empirice individuale pot fi
obtinute prin metode de inregistrare (observari) exhaustiva sau partiala.
Inregistrarile partiale, cunoscute in practica statistica sub numele de anchete statistice, sunt
preferate investigatiilor totale datorita avantajelor pe care le au fata de ultimele.
In acest capitol se prezinta fundamentele sondajului statistic ca instrument metodologic de
realizare a anchetelor statistice. Se trateaza etapele sondajului statistic, avanta 131j92b jele si
limitele acestei forme de investigare a realitatii, procedeele de esantionare, calculul indicatorilor
specifici principalelor tipuri de selectie si extinderea rezultatelor sondajului asupra colectivitatii
generale care face obiectul cercetarii.
Definire, etape, notiuni, avantaje
Sondajul statistic reprezinta o forma a cercetarii statistice pe baza unei parti reprezentative
din colectivitatea generat a. Realizarea unui sondaj statistic presupune parcurgerea urmatoarelor
etape:
a) extragerea unui esantion reprezentativ din colectivitatea generala si culegerea datelor despre
unitatile care au intrat in esantion ;
b) determinarea indicatorilor statistici pe baza datelor observate pentru fiecare caracteristica
inregistrata (descrierea statistica)
c) generalizarea (extinderea) rezultatelor obtinute pentru esantion asupra colectivitatii generale,
denumita estimarea parametrilor colectivitatii generale.
Esantionul (mostra, colectivitatea de selectie, proba) reprezinta o parte din colectivitatea
generala, extrasa astfel incat sa reproduca principalele trasaturi esentiale ale colectivitatii
generale din care a fost extras. Numarul unitatilor care compun esantionul reprezinta volumul
acestuia (n). Sondajul statistic poate caracteriza suficient de corect realitatea numai daca
esantionul este reprezentativ. Indicatorii statistici calculati pe baza datelor inregistrate pentru

esantion sunt numiti estimatori.


Colectivitatea generala este alcatuita din totalitatea unitatilor / elementelor care formeaza
fenomenul sau procesul care face obiectul cercetarii. Din colectivitatea generala se extrag
unitatile care compun esantionul. Din acest motiv se mai numeste baza de sondaj. Numarul
unitatilor care alcatuiesc baza de sondaj defineste volumul acestuia (N).
Indicatorii statistici calculati pe baza datelor aferente colectivitatii generale se mai
numesc parametrii colectivitatii generale. Acesti parametrii se estimeaza in cazul sondajului
statistic cu ajutorul estimatorilor.
Baza de sondaj reprezinta, uzual, o lista cu toate unitatile compun colectivitatea generala,
lista alcatuita dupa un criteriu care nu are nici o legatura cu ordinul de marime al valorilor
variabilelor inregistrate. Exemple de baze de sondaj folosite frecvent in cazul anchetelor
statistice ar putea fi: registrul auto, liste electorale, lista localitatilor, lista agentilor economici. O
baza de sondaj trebuie sa indeplineasca cateva cerinte fundamentale si anume:
- sa cuprinda intreaga populatie;
- sa fie actuala;
- sa fie ferita de orice repetitie.
Notatiile folosite uzual pentru indicatorii colectivitatii generale si cei ai colectivitatii de
selectie se prezinta in tabelul nr. 5.1.
Tabelul 5.1
Indicator

Caracteristica

Caracteristica

nealternativa

alternativa

Colectivitatea
generala
Media

Esantion

Colectivitatea
generala

Esantion

Dispersia

Utilizarea sondajului statistic in cercetarea fenomenelor si proceselor in domenii diverse


ale vietii economice si sociale este expresia avantajelor acestui mod de cercetare comparativ cu
cercetarea totala. Dintre avantajele cele mai semnificative mentionam:

in multe situatii sondajul statistic este singura alternativa la care se poate recurge si
anume atunci cand cercetarea conduce la distrugerea elementelor. De exemplu: estimarea
recoltei agricole inainte de recoltare; determinarea duratei de functionare a unor produse;
cercetarea rezistentei diferitelor materiale;

este mai operativ si mai ieftin deoarece numarul unitatilor de la care se culeg date este
semnificativ mai mic decat colectivitatea generala;

permite cunoasterea mai completa in sensul ca in cazul unui numar mai mic de unitati
se poate folosi un program de observare mai amplu comparativ cu cel utilizat in cazul
unei inregistrari exhaustive;

erorile de inregistrare sunt de mai mica amploare si pot fi depistate mai usor;

poate fi folosita ca mijloc de verificare a rezultatelor unei cercetari totale.

La judecarea avantajelor mentionate se adauga faptul ca sondajul statistic, fiind o


cercetare statistica partiala, ofera doar o estimare a parametrilor colectivitatii generale, deci
rezultatele nu sunt determinari exacte.
In concluzie, sondajul statistic s-a impus in practica cercetarii din majoritatea domeniilor
de activitate datorita operativitatii cu care se obtin rezultatele, datorita costului informatiilor si
nu in ultimul rand datorita faptului ca ofera rezultate suficient de exacte despre colectivitatea
studiata.
Cercetarea realitatii economice si sociale se bazeaza, in prezent, in practica statistica, in
majoritatea cazurilor prin metoda sondajului.
Inregistrari si cercetari totale se organizeaza in cazul catorva fenomene si procese
(recensaminte ale populatiei, recensaminte agricole, comertul exterior). Partea covarsitoare a
indicatorilor macroeconomici se estimeaza pe baza rezultatelor obtinute in urma cercetarii prin
sondaj. Productia industriala, productia agricola, produsul intern brut, volumul investitiilor,
efectivul salariatilor, castigul salarial mediu, rata inflatiei etc sunt doar cateva exemple de
indicatori statistici determinati prin aplicarea sondajului statistic.

Procedee de selectie
In vederea formarii esantionului pot fi aplicate mai multe procedee de extragere a
unitatilor din colectivitatea generala
(baza de sondaj). La alegerea procedeului de esantionare
este indicat sa se tina seama de volumul colectivitatii generale (N), de volumul esantionului (n)
si de gradul de omogeniatte al bazei de sondaj prin prisma caracteristicilor care intereseaza.
Procedeele de sondaj se diferentiaza dupa mai multe criterii:

Dupa algoritmul de extragere a eantionului, se deosebesc:

sondaje aleatoare (intamplatoare);

sondaje dirijate;

sondaje mixte.

Dupa volumul esantionului, se disting:

sondaje de volum mare esantionul este format din cel putin 120 de unitati;

sondaje de volum redus esantionul sub 30 de unitati.

Dupa numarul etapelor parcurse la formarea esantionului, sondajele se separa in:

sondaje simple, cand se parcurge o singura etapa la extragerea esantionului;

sondaje in trepte, cand se parcurg cel putin doua etape la formarea esantionului.

Selectiile aleatoare se recomanda a fi aplicate daca colectivitatea generala care se


studiaza este omogena. Caracteristic acestui tip de selectie este faptul ca elimina orice interventie
subiectiva in alegerea unitatilor ce formeaza esantionul.
Selectiile dirijate se aplica daca colectivitatea generala este eterogena, respectiv daca
exista o anumita stratificare (impartire pe tipuri calitative). Prin dirijarea formarii esantionului se
asigura patrunderea in esantion a unor unitati din toate straturile, respectiv se asigura ca structura
esantionului sa corespunda cu structura colectivitatii generale.
Dupa ce s-a stabilit volumul esantionului (n) se extrage din fiecare strat existent in
colectivitatea generala cate un subesantion folosind un procedeu aleator.
Selectiile mixte combina principiile sondajului aleator cu cele ale sondajului dirijat.
In vederea formarii esantionului se pot aplica mai multe procedee: procedeul tragerii la
sorti; procedeul tabelului cu numere intamplatoare; procedeul mecanic sau al pasului de

numarare.
Procedeul tragerii la sorti (procedeul loteriei) se aplica in cazul colectivitatilor
omogene si de volum restrans. Se procedeaza astfel: se numeroteaza unitatile colectivitatii
generale de la 1 la N
si se extrage cate o unitate (bila sau jeton) pana la completarea
esantionului de volum n. Extragerea poate fi facuta in doua variante:

procedeul selectiei repetate (al bilei revenite);

procedeul selectiei nerepetate (al bilei nerevenite).

In cazul aplicarii procedeului selectiei repetate, o unitate o data extrasa se restituie bazei
de sondaj, fapt ce face ca o unitate sa poata patrunde de mai multe ori in esantion.
Ca urmare, probabilitatea de includere in esantion a fiecarei unitati este constanta pe
parcursul procesului de extragere in vederea formariiesantionului
. Datorita faptului
ca o unitate poate intra de mai multe ori in esantion, reprezentativitatea esantionului poate fi
redusa si ca urmare erorile pot fi mari. Numarul esantioanelor care se pot forma in acest caz este
egal cu

Procedeul selectiei nerepetate presupune ca o unitate o data extrasa nu se mai restituie


bazei de sondaj. In acest caz creste probabilitatea unitatilor de a fi incluse in esantion pe
parcursul extragerii, de la
extrageri.

in cazul primei extrageri la

, in cazul ultimei

Datorita faptului ca o unitate nu poate intra de mai multe ori in esantion, erorile sunt mai
mici comparativ cu selectia repetata. Numarul de esantioane de volumul n care se pot forma in
acest caz este egal cu

Procedeul tabelului cu numere intamplatoare se recomanda in vederea formarii


esantionului cand vulumul colectivitatii generale este mare. Folosirea acestui procedeu
presupune intocmirea listei unitatilor de la 1 la N si extragerea celor n unitati care compun
esantionul.
Numerele cuprinse intr-un astfel de tabel sunt sistematizate pe randuri si pe coloane. In
vederea formarii esantionului se alege la intamplare randul si coloana cu care va incepe selectia.
De exemplu, daca colectivitatea generala este formata din 2000 de unitati si se propune formarea
unui esantion de 5% (n=100) se va proceda astfel: pornind de la randul si coloana alese la
intamplare, vor fi cuprinse in esantion toate unitatile la care numarul din lista de la 1 la N
corespunde cu numerele citite din tabel, care sunt cuprinse intre 1 si 2000.
Procedeul mecanic asigura o selectie cvasialeatoare deoarece numai prima unitate se
extrage la intamplare.

Se porneste de la lista tuturor unitatilor care compun colectivitatea generala si se extrage


la intamplare o unitate din primele n unitati ale bazei de sondaj. Celelalte unitati care vor fi
cuprinse in esantion sunt determinate de pasul de numarare sau de fractia de sondaj.
Pasul de numarare este raportul dintre numarul unitatilor din colectivitatea generala si
cel din esantion
. Esantionul de n unitati este format din prima unitate extrasa la
intamplare si din celelalte n-1 unitati determinate prin adaugarea succesiva a pasului de
numarare la numarul de ordine al primei unitati. De exemplu, daca
si prima unitate
extrasa corespunde numarului 7, atunci vor fi cuprinse in esantion: 7, 17, 27, 37, .
Selectia mecanica se aplica frecvent in cazul cercetarilor din agricultura si in cele privind
nivelul de trai. Aplicarea selectiei mecanice presupune, ca de altfel si celelalte tipuri de selectie,
existenta unor baze de sondaj adecvate.
Erorile sondajului statistic
Prin organizarea unui sondaj statistic se urmareste, cel mai adesea, estimarea indicatorilor
unei colectivitati de mare amploare, pentru determinarea carora nu este posibila sau nu se
justifica organizarea unei cercetari exhaustive, pornind de la indicatorii calculati pe baza datelor
esantionului.
Trebuie acceptata situatia ca oricat de corecta ar fi facuta esantionarea, valorile rezultate
din prelucrarea datelor aferente esantionului se abat de la cele determinate pe baza datelor
inregistrate pentru colectivitatea generala.
Erorile de sondaj (de selectie) se considera diferentele care exista intre valorile oricarui
indicator calculat pe baza datelor esantionului si valorile aceluiasi indicator determinate pe baza
datelor aferente colectivitatii generale. In cadrul sondajului statistic se disting doua feluri de
erori:

erori de inregistrare, comune tuturor tipurilor de observari statistice;

erori de reprezentativitate, specifice cercetarii prin sondaj.

Erorile de inregistrare care intervin in cazul sondajului statistic sunt de mai mica
amploare comparativ cu cele in cazul unei inregistrari totale. Aceasta, datorita faptului ca
volumul datelor inregistrate este semnificativ mai mic, iar culegerea datelor se realizeaza de un
personal de specialitate.
Erorile de reprezentativitate sunt specifice sondajului statistic. Ele pot fi erori
sistematice si erori intamplatoare.
Erorile de reprezentativitate sistematice se concretizeaza in abateri de la realitate intr-un
singur sens. Aceasta grupa de erori se datoreaza nerespectarii principiilor pe care se
fundamenteaza sondajul statistic. Printre principalele cauze care pot duce la aparitia erorilor

sistematice mentionam:

alegerea deliberata a unor unitati considerate reprezentative;

selectarea preferentiala a acelor unitati care sa duca la rezultatul dorit de cercetator;

baze de sondaj incomplete;

volumul redus al esantionului.

Aceste erori pot fi evitate daca se respecta intocmai principiile teoriei selectiei.
Erorile de reprezentativitate intamplatoare nu pot fi evitate, chiar daca se respecta toate
regulile sondajului statistic. Aceasta deoarece prin numarul mic de unitati care compun
esantionul nu se pot reproduce intocmai toate trasaturile esentiale ale colectivitatii generale.
Erorile de reprezentativitate intamplatoare, desi nu pot fi evitate, ele pot fi calculate cu
anticipatie, daca selectia este probabilistica. Parametrii colectivitatii generale se estimeaza pe
baza indicatorilor obtinuti din prelucrarea datelor esantionului cu o anumita eroare intamplatoare
de reprezentativitate.
Eroarea de reprezentativitate se determina de cele mai multe ori pe baza diferentei dintre
media esantionului
si media colectivitatii generale
reprezentativ daca eroarea se incadreaza in intervalul

. Se considera ca un esantion este


, ceea ce inseamna ca:

(4.1)

Determinarea erorii de reprezentativitate pe baza relatiei 4.1 presupune sa se cunoasca


media colectivitatii generale, ceea ce presupune ca s-a recurs, anterior, la o observare totala. De
cele mai multe ori sondajul statistic inlocuieste o cercetare totala, deci nu se cunosc parametrii
acesteia (media, dispersia etc). In asemenea situatii se recomanda, in vederea verificarii
reprezentativitatii esantionului, extragerea a doua esantioane de volum diferit si compararea
mediilor celor doua esantioane. Daca diferenta nu este semnificativa, atunci oricare din cele
doua esantioane poate fi folosit pentru estimarea parametrilor colectivitatii generale. In cazul in
care diferenta este semnificativa se recomanda extragerea unui al treilea esantion (diferit de
primele doua), volumul caruia este cel putin egal cu volumul cumulat al primelor doua
esantioane. In final se va opta pentru unul din primele doua esantioane la care media se apropie
ami mult de media celui de-al treilea esantion.
Eroarea medie si eroarea limita
Eroarea de reprezentativitate este diferenta dintre media esantionului si media
colectivitatii generale. Dar, dintr-o colectivitate generala N se pot extrage succesiv mai multe

esantioane de acelasi volum n. Numarul esantioanelor posibile de format este egal cu


cazul sondajului repetat si cu
media

si dispersia

in

in cazul sondajului repetat. Fiecare esantion va fi definit de

calculata pentru caracteristica sau caracteristicile care intereseaza.

Mediile de selectie difera intre ele si ca urmare si erorile de reprezentativitate


diferite de la un esantion la altul.

vor fi

Daca se iau in considerare toate esantioanele de un anumit volum n, se remarca ca


mediile de selectie
se distribuie normal fata de media care are frecventa cea mai mare de
aparitie. Media de selectie cu frecventa cea mai mare coincide cu media colectivitatii generale.
Dar cum nu se cunoaste care din esantioanele posibile s-a extras, nu se cunoaste eroarea de
reprezentativitate aferent.
In aceste conditii se recurge la eroarea medie de reprezentativitatesau la media erorilor
de reprezentativitate

sau

).

Eroarea medie de reprezentativitate se calculeaza ca o abatere medie patratica a tuturor


mediilor de selectie de la media colectivitatii generale.

(5.2)
unde :
numarul esantioanelor posibile
frecventa mediilor de selectie posibile
Aplicarea relatiei (5.2) presupune sa se cunoasca mediile tuturor esantioanelor
frecventelor corespunzatoare de aparitie (

sau

si a

).

In practica sondajelor se extrage, ca regula, un singur esantion. Ca atare nu se stie care


din esantioanele posibile s-a extras si nici eroarea de reprezentativitate aferenta acestui esantion.
Eroarea medie de reprezentativitate se poate calcula anticipat, pornind de la relatia dintre
dispersia colectivitatii generale

, dispersia mediilor de selectie, de la media colectivitatii

generale

si volumul esantionului (n).

In cazul selectiei simple repetate aceasta relatie pentru o variabila numerica este:
(5.3)
Eroarea medie de reprezentativitate se calculeaza pe baza relatiei:

(5.4)
ceea ce inseamna ca marimea erorii este direct proportionala cu dispersia colectivitatii generale
si invers proportionala cu volumul esantionului. Deci, cu cat imprastierea valorilor individuale in
jurul mediei este mai pronuntata cu atat eroarea este mai mare, iar cu cat volumul esantionului
este mai mare cu atat esantionul este mai reprezentativ si, implicit, eroarea de reprezentativitate
este mai mica.
Aplicarea relatiei (5.4) presupune sa se cunoasca dintr-o cercetare totala anterioara
dispersia colectivitatii generale, situatie foarte rar intalnita in practica organizarii unui sondaj
statistic.
Daca nu se cunoaste

, esantionul este suficient de mare, se accepta ipoteza ca

dispersia esantionului extras


poate caracteriza suficient de corect variatia in cadrul
colectivitatii generale. Eroarea medie de reprezentativitate se calculeaza, in acest caz, pe baza
relatiei :

(5.5)
Pentru calculul erorii medii de reprezentativitate in cazul seleciei simple repetate pe
o variabila alternativa, relatiile (5.4) si (5.5) se particularizeaza, tinand seama de
media

si dispersia

unei astfel de variabile, si anume:

(5.6)
daca se cunoaste dispersia colectivitatii generale si

(5.7)
daca se cunoaste numai media si dispersia esantionului (W si W(1-W)).
In cazul selectiei simple nerepetate o unitate poate intra o singura data in esantion si ca
urmare esantioanele sunt mai reprezentative decat in cazul selectiei repetate, ceea ce inseamna ca
eroarea este mai mica. Acest fapt se reflecta in relatia de calcul a erorii medii de
reprezentativitate prin introducerea unui coeficient de corectie:
. Daca volumul
colectivitatii generale este foarte mare se renunta la '1' din numitorul raportului, iar coeficientul
mentionat este egal cu

Eroarea medie de reprezentativitate pentru sondajul nerepetat se calculeaza pe baza


relatiilor:

(5.8)
respectiv:

(5.9)
daca nu se cunoaste dispersia colectivitatii generale.
In cazul unei variabile alternative, eroarea medie de reprezentativitate se determina pe
baza relatiilor:

(5.10)
respectiv:

(5.11)
In pracatica se considera ca un esantion este reprezentativ daca abaterea medie de selectie

de la media colectivitatii generale (eroarea de reprezentativitate) este cuprinsa intre


.
Aceasta inseamna ca intereseaza mai putin eroarea medie de reprezentativitate ci abaterea cea
mai mare (eroarea limita) care poate sa apara intre media esantionului si media colectivitatii
generale.
Eroarea limita de reprezentativitate
se determina ca o abatere a mediei de
selectie de la media colectivitatii generale garantata cu suma probabilitatilor corespunzatoare
limitelor intervalului de variatie. Eroarea limita se calculeaza ca un produs dintre eroarea medie
de reprezentativitate
sau

si argumentul z sau t corespunzatoare functiei de probabilitate

.
Eroarea limita se calculeaza astfel:

pentru o variabila numerica:

(5.12)

pentru o variabila alternativa:

(5.13)
Relatiile (5.12) si (5.13) se particularizeaza pentru selectia simpla repetata si nerepetata
tinand seama de relatiile de calcul pe baza carora se calculeaza eroarea limita.
Argumentul probabilitatii z se obtine din tabelul intocmit pentru functia Gauss-Laplace si
depinde de probabilitatea cu care se garanteaza rezultatele sondajului pentru care s-a optat. Daca
de exemplu se opteaza pentru o probabilitate de 0.95, atunci z = 1.96, respectiv z = 3 daca
probabilitatea care se foloseste este 0,9973.
Din relatiile (5.12) si (5.13) se observa faptul ca eroarea limita este direct proportionala
cu probabilitatea cu care se garanteaza rezultatele si invers proportionala cu precizia acestora.
Pentru a ilustra posibilitatile de cunoastere oferite de indicatorii sondajului prezentat,
presupunem ca managerul unei firme cu 2000 de muncitori a dispus organizarea unui studiu cu
privire la folosirea timpului de lucru intr-un schimb. Esantionul pentru care s-au inregistrat date
a fost de 5% (n = 100).
Programul de observare selectiva a cuprins, pe langa alte caracteristici, si timpul nelucrat

in cadrul unui schimb exprimat in minute. Rezultatele sistematizarii muncitorilor dupa timpul
nelucrat se prezinta in tabelul nr. 5.2.
Repartitia muncitorilor dupa timpul nelucrat
Tabelul nr. 5.2
Grupe dupa timpul nelucrat
(minute)

Numarul
muncitorilor

Sub 10

15

10 14

25

14 18

30

18 22

15

22 26

10

26 si peste

5
Total

100

Caracterizarea sintetica a esantionului prin prisma timpului nelucrat presupune


cunoasterea mediei si dispersiei valorilor individuale.
* Media esantionului:

minute
* Dispersia esantionului:

Coeficientul de variatie (V) este egal cu 33,0%, ceea ce inseamna ca esantionul poate fi
considerat omogen iar media timpului nelucrat de 18,8 minute reprezentativa. In aceste conditii
dispersia colectivitatii generale
, care nu se cunoaste, poate fi estimata prin dispersia
esantionului. Dupa formarea esantionului s-a recurs la o selectie nerepetata, iar rezultatele
sondajului se garanteaza cu o probabilitate egala cu 0,9973, eroarea medie de reprezentativitate
si eroarea limita se calculeaza astfel:

eroarea de reprezentativitate:

minute,
ceea ce inseamna ca media unui esantion n = 100 se abate in medie cu 0,37 minute de la media
timpului nelucrat a celor 2000 de muncitori.

eroarea limita:

minute
In tabelele intocmite pentru repartitia normala z corespunzator probabilitatii de 0,9973
este egal cu 3.
Aceasta inseamna ca abaterea cea mai mare care poate apare intre media esantionului si
media colectivitatii generale este de 1,11 minute.
Variabila nealternativa in functie de care s-a construit distributia muncitorilor prezentata
in tabelul nr. 5.2 poate fi transformata intr-o variabila alternativa daca se judeca timpul nelucrat
de catre fiecare muncitor in raport cu media.
Daca intereseaza, de exemplu, care este proportia muncitorilor din colectivitatea generala
la care timpul nelucrat depaseste media, se procedeaza astfel, pornind de la datele esantionului:

media esantionului:

sau

dispersia esantionului:

eroarea limita, daca

, z =3.

sau
Semnificatia rezultatului: proportia muncitorilor din esantion la care timpul nelucrat depaseste
media (18,8 minute) se poate abate de la proportia existenta in colectivitatea generala cu cel mult
13,5%, daca

Tipuri de sondaje folosite frecvent in practica statistica

In practica statistica se pot aplica mai multe tipuri de sondaje in functie de gradul de
omogenitate al colectivitatii studiate si de forma de organizare a acesteia. Cel mai frecvent se
folosesc urmatoarele tipuri:

sondajul aleator (intamplator) simplu;

sondajul tipic (stratificat);

sondajul de serii.

Fiecare tip de sondaj mentionat poate fi, in functie de procedeul de extragere folosit,
repetat sau nerepetat.
Sondajul aleator simplu poate fi aplicat in cazul in care colectivitatea generala este
omogena. In vederea formarii esantionului se extrag aleator unitati simple, prin procedeul repetat
sau nerepetat.
Eroarea de reprezentativitate
5.4 5.13.

si eroarea limita

se calculeaza pe baza formulelor

Sondajul tipic (stratificat) se recomanda in situatia in care colectivitatea este


neomogena. In acest caz se separa unitatile simple pe straturi (grupe) mai omogene dupa o
variabila calitativa sau cantitativa. Daca, de exemplu, colectivitatea generala este formata din
totalitatea agentilor economici, in vederea separarii pe straturi (grupe, tipuri) s-ar putea folosi

caracteristici ca: domeniul de activitate, numarul angajatilor, cifra de afaceri etc.


Esantionul se formeaza prin extragerea din fiecare strat a unui numar de unitati simple
(subesantioane, ni), fapt ce conduce la o mai mare reprezentativitate, si ca atare la erori mai mici.
Eroarea de reprezentativitate si eroarea limita se calculeaza tinand cont nu de variatia in
colectivitatea generala
sau la nivelul intregului esantion
ci de variatia la nivelul
fiecarui strat (grupe). Caracterizarea variatiei la nivelul fiecarui strat presupune determinarea
dispersiei fiecarei grupe sau strat

Variatia din toate grupele (straturile) se sintetizeaza prin media dispersiilor


de grupa
. Cum
comparativ cu sondajul aleator simplu.

, sondajul stratificat conduce la erori mai mici

Relatiile care se aplica pentru calculul erorii de reprezentativitate si a erorii limita


mentionate la sondajul aleator simplu se particularizeaza la sondajul stratificat prin inlocuirea
dispersiei colectivitatii generale

sau a esantionului, cu media dispersiilor de grupa.

sondajul stratificat repetat:

sau

(5.14)

si

sau

(5.15)

sondajul stratificat nerepetat:

sau
si

(5.16)

sau

(5.17)

Asa cum s-a mentionat, esantionul (n) este format din sumasubesantioanelor
.
Problema care trebuie rezolvata se refera la numarul unitatilor care compun fiecare subesantion,
respectiv la repartizarea esantionului pe subesantioane.
La repartizarea esantionului pe subesantioane se pot aplica trei modalitati:
a) Repartizarea in mod egal a esantionului pe subesantioane, indiferent de numarul unitatilor
care compun fiecare strat. Dimensiunea fiecarui subesantion se obtine impartind volumul
esantionului (n) la numarul de straturi in colectivitatea generala:

(5.18)
Acest tip de sondaj stratificat este denumit sondaj stratificat neproportional;
b) Esantionul (n) se repartizeaza pe subesantioane in funcie de ponderea fiecarui strat in
colectivitatea generala

. Volumul fiecarui subesantion se determina prin relatia:

(5.19)
Acest tip de sondaj care poarta denumirea de sondaj stratificat proportional se aplica frecvent in
practica.
c) Esantionul (n) se repartizeaza pe subesantioane atat in functie de ponderea fiecarui strat in
colectivitatea generala
cat si de gradul de omogenitate al fiecarui strat
Dimensiunea fiecarui esantion se detrmina prin relatia:

(5.20)
Daca se recurge la aceasta varianta de repartizare a esantionului se foloseste sondajul
stratificat optim.

Exemplu:
Pentru estimarea castigului salarial nominal mediu net dintr-un judet s-a organizat un
sondaj stratificat proportional de 5%. In urma prelucrarii datelor inregistrate pentru esantion s-au
obtinut urmatoarele rezultate (tabelul nr. 5.3):
Tabelul nr. 5.3

Ramura

Numarul
salariatilor (sute)

Castigul salarial
mediu lunar (mil.
lei)

Abaterea medie
patratica
(mil. lei)

Industrie

20

5,4

0,8

Constructii

4,2

0,4

Altele

65

6,8

1,2

90

Total

Daca la formarea esantionului s-a folosit extragerea nerepetata, iar probabilitatea cu care
se garanteaza rezultatele este de 0,9973, indicatorii sondajului se calculeaza astfel:

media mediilor de grupa:

mil. Lei

media dispersiilor de grupa:

eroarea medie de reprezentativitate:

mil. lei

eroarea limita:
mil. lei

Sondajul de serii se aplica daca colectivitatea care trebuie studiata este formata din
unitati complexe (echipe de muncitori, gospodarii, grupe de studiu), denumite serii. Pentru
formarea esantionului se extrag prin unul din procedeele mentionate, un anumit numar de unitati
complexe (serii). Pentru fiecare serie se calculeaza media acesteia, iar pe baza lor se determina
media colectivitatii generale

sau media esantionului.

Datorita faptului ca nu se cunosc valorile pentru fiecare unitate simpla care compune
seria, ci doar media seriei, la determinarea indicatorilor sondajului se foloseste dispersia dintre

grupe sau dintre medii

Numarul seriilor existente in colectivitatea generala se noteaza de regula cu R, iar


numarul seriilor care compun esantionul, cu r.
Eroarea medie de reprezentativitate si eroarea limita se calculeaza astfel:

sondaj de serie repetat:

(5.21)

(5.22)

sondaj de serie nerepetat:

(5.23)

(5.24)
Determinarea volumului esantionului
Realizarea unui sondaj statistic in vederea estimarii indicatorilor colectivitatii generale
presupune sa se decida asupra marimii esantionului. Criteriile in functie de care se decide
privesc exactitatea cu care se estimeaza indicatorii colectivitatii generale, costurile realizarii
sondajului s.a.
Volumul esantionului se deduce in cazul fiecarui tip de sondaj, din formula erorii limita.
Prin ridicarea la patrat a formulei erorii limita

se deduce volumul esantionului.

in cazul sondajului aleator simplu repetat:

deci,

(5.25)

in cazul sondajului aleator simplu nerepetat se porneste de la relatia:

si daca se renunta la corectia cu 1 din numitorul membrului drept se obtine:

(5.26)
Similar se deduc relatiile privind volumul esantionului pentru celelalte tipuri de sondaje.
Estimarea parametrilor colectivitatii generale
Asa cum s-a mentionat, prin organizarea unui sondaj statistic se urmareste cel mai adesea
estimarea parametrilor colectivitatii generale. In acest scop se foloseste cel mai frecvent
procedeul extinderii directe. Prin aplicarea acestui procedeu se estimeaza intervalul de incredere
pentru media colectivitatii generale si limitele intre care se va incadra nivelul totalizat al

caracteristicii pe intreaga colectivitate

Estimarea parametrilor colectivitatii generale se bazeaza pe media esantionului


eroarea limita.

si pe

Media colectivitatii generale se estimeaza pe baza relatiei:


(5.27)
iar limitele intre care variaza nivelul totalizat al caracteristicii in colectivitatea generala se
estimeaza pornind de la formula:
(5.28)
Revenind la exemplul prezentat in tabelul nr. 5.3, castigul salarial nominal mediu in
colectivitatea generala va fi cuprins intre 6,004 mil. lei si 6,676 mil. lei.

Suma salariilor nominale platite variaza intre 10807,2 si 12016,8 sute milioane lei.

S-ar putea să vă placă și