Documente Academic
Documente Profesional
Documente Cultură
Introducere
Cunoasterea realitatii din oricare domeniu de activitate presupune sa se dispuna de date
individuale pentru caracteristicile care intereseaza, iar prin sistematizarea si prelucrarea acestor
date sa se obtina informatii care raspund obiectivului urmarit. Datele empirice individuale pot fi
obtinute prin metode de inregistrare (observari) exhaustiva sau partiala.
Inregistrarile partiale, cunoscute in practica statistica sub numele de anchete statistice, sunt
preferate investigatiilor totale datorita avantajelor pe care le au fata de ultimele.
In acest capitol se prezinta fundamentele sondajului statistic ca instrument metodologic de
realizare a anchetelor statistice. Se trateaza etapele sondajului statistic, avanta 131j92b jele si
limitele acestei forme de investigare a realitatii, procedeele de esantionare, calculul indicatorilor
specifici principalelor tipuri de selectie si extinderea rezultatelor sondajului asupra colectivitatii
generale care face obiectul cercetarii.
Definire, etape, notiuni, avantaje
Sondajul statistic reprezinta o forma a cercetarii statistice pe baza unei parti reprezentative
din colectivitatea generat a. Realizarea unui sondaj statistic presupune parcurgerea urmatoarelor
etape:
a) extragerea unui esantion reprezentativ din colectivitatea generala si culegerea datelor despre
unitatile care au intrat in esantion ;
b) determinarea indicatorilor statistici pe baza datelor observate pentru fiecare caracteristica
inregistrata (descrierea statistica)
c) generalizarea (extinderea) rezultatelor obtinute pentru esantion asupra colectivitatii generale,
denumita estimarea parametrilor colectivitatii generale.
Esantionul (mostra, colectivitatea de selectie, proba) reprezinta o parte din colectivitatea
generala, extrasa astfel incat sa reproduca principalele trasaturi esentiale ale colectivitatii
generale din care a fost extras. Numarul unitatilor care compun esantionul reprezinta volumul
acestuia (n). Sondajul statistic poate caracteriza suficient de corect realitatea numai daca
esantionul este reprezentativ. Indicatorii statistici calculati pe baza datelor inregistrate pentru
Caracteristica
Caracteristica
nealternativa
alternativa
Colectivitatea
generala
Media
Esantion
Colectivitatea
generala
Esantion
Dispersia
in multe situatii sondajul statistic este singura alternativa la care se poate recurge si
anume atunci cand cercetarea conduce la distrugerea elementelor. De exemplu: estimarea
recoltei agricole inainte de recoltare; determinarea duratei de functionare a unor produse;
cercetarea rezistentei diferitelor materiale;
este mai operativ si mai ieftin deoarece numarul unitatilor de la care se culeg date este
semnificativ mai mic decat colectivitatea generala;
permite cunoasterea mai completa in sensul ca in cazul unui numar mai mic de unitati
se poate folosi un program de observare mai amplu comparativ cu cel utilizat in cazul
unei inregistrari exhaustive;
erorile de inregistrare sunt de mai mica amploare si pot fi depistate mai usor;
Procedee de selectie
In vederea formarii esantionului pot fi aplicate mai multe procedee de extragere a
unitatilor din colectivitatea generala
(baza de sondaj). La alegerea procedeului de esantionare
este indicat sa se tina seama de volumul colectivitatii generale (N), de volumul esantionului (n)
si de gradul de omogeniatte al bazei de sondaj prin prisma caracteristicilor care intereseaza.
Procedeele de sondaj se diferentiaza dupa mai multe criterii:
sondaje dirijate;
sondaje mixte.
sondaje de volum mare esantionul este format din cel putin 120 de unitati;
sondaje in trepte, cand se parcurg cel putin doua etape la formarea esantionului.
numarare.
Procedeul tragerii la sorti (procedeul loteriei) se aplica in cazul colectivitatilor
omogene si de volum restrans. Se procedeaza astfel: se numeroteaza unitatile colectivitatii
generale de la 1 la N
si se extrage cate o unitate (bila sau jeton) pana la completarea
esantionului de volum n. Extragerea poate fi facuta in doua variante:
In cazul aplicarii procedeului selectiei repetate, o unitate o data extrasa se restituie bazei
de sondaj, fapt ce face ca o unitate sa poata patrunde de mai multe ori in esantion.
Ca urmare, probabilitatea de includere in esantion a fiecarei unitati este constanta pe
parcursul procesului de extragere in vederea formariiesantionului
. Datorita faptului
ca o unitate poate intra de mai multe ori in esantion, reprezentativitatea esantionului poate fi
redusa si ca urmare erorile pot fi mari. Numarul esantioanelor care se pot forma in acest caz este
egal cu
, in cazul ultimei
Datorita faptului ca o unitate nu poate intra de mai multe ori in esantion, erorile sunt mai
mici comparativ cu selectia repetata. Numarul de esantioane de volumul n care se pot forma in
acest caz este egal cu
Erorile de inregistrare care intervin in cazul sondajului statistic sunt de mai mica
amploare comparativ cu cele in cazul unei inregistrari totale. Aceasta, datorita faptului ca
volumul datelor inregistrate este semnificativ mai mic, iar culegerea datelor se realizeaza de un
personal de specialitate.
Erorile de reprezentativitate sunt specifice sondajului statistic. Ele pot fi erori
sistematice si erori intamplatoare.
Erorile de reprezentativitate sistematice se concretizeaza in abateri de la realitate intr-un
singur sens. Aceasta grupa de erori se datoreaza nerespectarii principiilor pe care se
fundamenteaza sondajul statistic. Printre principalele cauze care pot duce la aparitia erorilor
sistematice mentionam:
Aceste erori pot fi evitate daca se respecta intocmai principiile teoriei selectiei.
Erorile de reprezentativitate intamplatoare nu pot fi evitate, chiar daca se respecta toate
regulile sondajului statistic. Aceasta deoarece prin numarul mic de unitati care compun
esantionul nu se pot reproduce intocmai toate trasaturile esentiale ale colectivitatii generale.
Erorile de reprezentativitate intamplatoare, desi nu pot fi evitate, ele pot fi calculate cu
anticipatie, daca selectia este probabilistica. Parametrii colectivitatii generale se estimeaza pe
baza indicatorilor obtinuti din prelucrarea datelor esantionului cu o anumita eroare intamplatoare
de reprezentativitate.
Eroarea de reprezentativitate se determina de cele mai multe ori pe baza diferentei dintre
media esantionului
si media colectivitatii generale
reprezentativ daca eroarea se incadreaza in intervalul
(4.1)
si dispersia
in
vor fi
sau
).
(5.2)
unde :
numarul esantioanelor posibile
frecventa mediilor de selectie posibile
Aplicarea relatiei (5.2) presupune sa se cunoasca mediile tuturor esantioanelor
frecventelor corespunzatoare de aparitie (
sau
si a
).
generale
In cazul selectiei simple repetate aceasta relatie pentru o variabila numerica este:
(5.3)
Eroarea medie de reprezentativitate se calculeaza pe baza relatiei:
(5.4)
ceea ce inseamna ca marimea erorii este direct proportionala cu dispersia colectivitatii generale
si invers proportionala cu volumul esantionului. Deci, cu cat imprastierea valorilor individuale in
jurul mediei este mai pronuntata cu atat eroarea este mai mare, iar cu cat volumul esantionului
este mai mare cu atat esantionul este mai reprezentativ si, implicit, eroarea de reprezentativitate
este mai mica.
Aplicarea relatiei (5.4) presupune sa se cunoasca dintr-o cercetare totala anterioara
dispersia colectivitatii generale, situatie foarte rar intalnita in practica organizarii unui sondaj
statistic.
Daca nu se cunoaste
(5.5)
Pentru calculul erorii medii de reprezentativitate in cazul seleciei simple repetate pe
o variabila alternativa, relatiile (5.4) si (5.5) se particularizeaza, tinand seama de
media
si dispersia
(5.6)
daca se cunoaste dispersia colectivitatii generale si
(5.7)
daca se cunoaste numai media si dispersia esantionului (W si W(1-W)).
In cazul selectiei simple nerepetate o unitate poate intra o singura data in esantion si ca
urmare esantioanele sunt mai reprezentative decat in cazul selectiei repetate, ceea ce inseamna ca
eroarea este mai mica. Acest fapt se reflecta in relatia de calcul a erorii medii de
reprezentativitate prin introducerea unui coeficient de corectie:
. Daca volumul
colectivitatii generale este foarte mare se renunta la '1' din numitorul raportului, iar coeficientul
mentionat este egal cu
(5.8)
respectiv:
(5.9)
daca nu se cunoaste dispersia colectivitatii generale.
In cazul unei variabile alternative, eroarea medie de reprezentativitate se determina pe
baza relatiilor:
(5.10)
respectiv:
(5.11)
In pracatica se considera ca un esantion este reprezentativ daca abaterea medie de selectie
.
Eroarea limita se calculeaza astfel:
(5.12)
(5.13)
Relatiile (5.12) si (5.13) se particularizeaza pentru selectia simpla repetata si nerepetata
tinand seama de relatiile de calcul pe baza carora se calculeaza eroarea limita.
Argumentul probabilitatii z se obtine din tabelul intocmit pentru functia Gauss-Laplace si
depinde de probabilitatea cu care se garanteaza rezultatele sondajului pentru care s-a optat. Daca
de exemplu se opteaza pentru o probabilitate de 0.95, atunci z = 1.96, respectiv z = 3 daca
probabilitatea care se foloseste este 0,9973.
Din relatiile (5.12) si (5.13) se observa faptul ca eroarea limita este direct proportionala
cu probabilitatea cu care se garanteaza rezultatele si invers proportionala cu precizia acestora.
Pentru a ilustra posibilitatile de cunoastere oferite de indicatorii sondajului prezentat,
presupunem ca managerul unei firme cu 2000 de muncitori a dispus organizarea unui studiu cu
privire la folosirea timpului de lucru intr-un schimb. Esantionul pentru care s-au inregistrat date
a fost de 5% (n = 100).
Programul de observare selectiva a cuprins, pe langa alte caracteristici, si timpul nelucrat
in cadrul unui schimb exprimat in minute. Rezultatele sistematizarii muncitorilor dupa timpul
nelucrat se prezinta in tabelul nr. 5.2.
Repartitia muncitorilor dupa timpul nelucrat
Tabelul nr. 5.2
Grupe dupa timpul nelucrat
(minute)
Numarul
muncitorilor
Sub 10
15
10 14
25
14 18
30
18 22
15
22 26
10
26 si peste
5
Total
100
minute
* Dispersia esantionului:
Coeficientul de variatie (V) este egal cu 33,0%, ceea ce inseamna ca esantionul poate fi
considerat omogen iar media timpului nelucrat de 18,8 minute reprezentativa. In aceste conditii
dispersia colectivitatii generale
, care nu se cunoaste, poate fi estimata prin dispersia
esantionului. Dupa formarea esantionului s-a recurs la o selectie nerepetata, iar rezultatele
sondajului se garanteaza cu o probabilitate egala cu 0,9973, eroarea medie de reprezentativitate
si eroarea limita se calculeaza astfel:
eroarea de reprezentativitate:
minute,
ceea ce inseamna ca media unui esantion n = 100 se abate in medie cu 0,37 minute de la media
timpului nelucrat a celor 2000 de muncitori.
eroarea limita:
minute
In tabelele intocmite pentru repartitia normala z corespunzator probabilitatii de 0,9973
este egal cu 3.
Aceasta inseamna ca abaterea cea mai mare care poate apare intre media esantionului si
media colectivitatii generale este de 1,11 minute.
Variabila nealternativa in functie de care s-a construit distributia muncitorilor prezentata
in tabelul nr. 5.2 poate fi transformata intr-o variabila alternativa daca se judeca timpul nelucrat
de catre fiecare muncitor in raport cu media.
Daca intereseaza, de exemplu, care este proportia muncitorilor din colectivitatea generala
la care timpul nelucrat depaseste media, se procedeaza astfel, pornind de la datele esantionului:
media esantionului:
sau
dispersia esantionului:
, z =3.
sau
Semnificatia rezultatului: proportia muncitorilor din esantion la care timpul nelucrat depaseste
media (18,8 minute) se poate abate de la proportia existenta in colectivitatea generala cu cel mult
13,5%, daca
In practica statistica se pot aplica mai multe tipuri de sondaje in functie de gradul de
omogenitate al colectivitatii studiate si de forma de organizare a acesteia. Cel mai frecvent se
folosesc urmatoarele tipuri:
sondajul de serii.
Fiecare tip de sondaj mentionat poate fi, in functie de procedeul de extragere folosit,
repetat sau nerepetat.
Sondajul aleator simplu poate fi aplicat in cazul in care colectivitatea generala este
omogena. In vederea formarii esantionului se extrag aleator unitati simple, prin procedeul repetat
sau nerepetat.
Eroarea de reprezentativitate
5.4 5.13.
si eroarea limita
sau
(5.14)
si
sau
(5.15)
sau
si
(5.16)
sau
(5.17)
Asa cum s-a mentionat, esantionul (n) este format din sumasubesantioanelor
.
Problema care trebuie rezolvata se refera la numarul unitatilor care compun fiecare subesantion,
respectiv la repartizarea esantionului pe subesantioane.
La repartizarea esantionului pe subesantioane se pot aplica trei modalitati:
a) Repartizarea in mod egal a esantionului pe subesantioane, indiferent de numarul unitatilor
care compun fiecare strat. Dimensiunea fiecarui subesantion se obtine impartind volumul
esantionului (n) la numarul de straturi in colectivitatea generala:
(5.18)
Acest tip de sondaj stratificat este denumit sondaj stratificat neproportional;
b) Esantionul (n) se repartizeaza pe subesantioane in funcie de ponderea fiecarui strat in
colectivitatea generala
(5.19)
Acest tip de sondaj care poarta denumirea de sondaj stratificat proportional se aplica frecvent in
practica.
c) Esantionul (n) se repartizeaza pe subesantioane atat in functie de ponderea fiecarui strat in
colectivitatea generala
cat si de gradul de omogenitate al fiecarui strat
Dimensiunea fiecarui esantion se detrmina prin relatia:
(5.20)
Daca se recurge la aceasta varianta de repartizare a esantionului se foloseste sondajul
stratificat optim.
Exemplu:
Pentru estimarea castigului salarial nominal mediu net dintr-un judet s-a organizat un
sondaj stratificat proportional de 5%. In urma prelucrarii datelor inregistrate pentru esantion s-au
obtinut urmatoarele rezultate (tabelul nr. 5.3):
Tabelul nr. 5.3
Ramura
Numarul
salariatilor (sute)
Castigul salarial
mediu lunar (mil.
lei)
Abaterea medie
patratica
(mil. lei)
Industrie
20
5,4
0,8
Constructii
4,2
0,4
Altele
65
6,8
1,2
90
Total
Daca la formarea esantionului s-a folosit extragerea nerepetata, iar probabilitatea cu care
se garanteaza rezultatele este de 0,9973, indicatorii sondajului se calculeaza astfel:
mil. Lei
mil. lei
eroarea limita:
mil. lei
Sondajul de serii se aplica daca colectivitatea care trebuie studiata este formata din
unitati complexe (echipe de muncitori, gospodarii, grupe de studiu), denumite serii. Pentru
formarea esantionului se extrag prin unul din procedeele mentionate, un anumit numar de unitati
complexe (serii). Pentru fiecare serie se calculeaza media acesteia, iar pe baza lor se determina
media colectivitatii generale
Datorita faptului ca nu se cunosc valorile pentru fiecare unitate simpla care compune
seria, ci doar media seriei, la determinarea indicatorilor sondajului se foloseste dispersia dintre
(5.21)
(5.22)
(5.23)
(5.24)
Determinarea volumului esantionului
Realizarea unui sondaj statistic in vederea estimarii indicatorilor colectivitatii generale
presupune sa se decida asupra marimii esantionului. Criteriile in functie de care se decide
privesc exactitatea cu care se estimeaza indicatorii colectivitatii generale, costurile realizarii
sondajului s.a.
Volumul esantionului se deduce in cazul fiecarui tip de sondaj, din formula erorii limita.
Prin ridicarea la patrat a formulei erorii limita
deci,
(5.25)
(5.26)
Similar se deduc relatiile privind volumul esantionului pentru celelalte tipuri de sondaje.
Estimarea parametrilor colectivitatii generale
Asa cum s-a mentionat, prin organizarea unui sondaj statistic se urmareste cel mai adesea
estimarea parametrilor colectivitatii generale. In acest scop se foloseste cel mai frecvent
procedeul extinderii directe. Prin aplicarea acestui procedeu se estimeaza intervalul de incredere
pentru media colectivitatii generale si limitele intre care se va incadra nivelul totalizat al
si pe
Suma salariilor nominale platite variaza intre 10807,2 si 12016,8 sute milioane lei.