Sunteți pe pagina 1din 12

CAP. 4.

SONDAJUL STATISTIC

Obiective:

După studiul acestui capitol, vei avea cunoştinţe suficiente


pentru a fi capabil:

 să întelegi conceptul de sondaj statistic si a tipurilor acestuia;


 sa cunosti procedeele de selectie statistica

Cuvinte cheie: sondaj statistic, eroare, eşantion, inteval de încredere,


volum al eşantionului

5.1. Definiţia şi erorile sondajului statistic


Sondajul
presupune Între sursele de obţinere a datelor statistice, alături de procedee ca
cercetarea pe recensămintele, rapoartele statistice, anchetele, monografiile, se află şi
sondajele statistice.
baza datelor
Sondajul este o procedură prin care se caracterizează o colectivitate
prelevate de
statistică, pe baza cercetării unei părţi a acesteia, a unui eşantion extras
la un esantion din acesta. Rezultatele obţinute pe baza datelor extrase prin sondaj se
reprezentativ extrapolează la dimensiunea întregii colectivităţi.
al Extinderea rezultatelor de la parte la întreg are caracter probabilist, deci
colectivitatii. aprecierile sunt supuse unui risc, unor erori.
Erorile de sondaj cele mai importante sunt erorile de reprezentativitate
(mai pot fi erori de înregistrare, comune şi pentru alte forme de culegere
a datelor).
Erorile de reprezentativitate apar în faza de prelucrare a informaţiilor,
sub forma diferenţei sau abaterii între indicatorii derivaţi care
caracterizează colectivitatea de selecţie, şi indicatorii corespunzători
calculaţi pentru întreaga colectivitate.
În funcţie de cauza care a dus la apariţia lor, erorile de reprezentativitate
sunt de două feluri:
- erori sistematice
- erori întâmplătoare.
Erorile sistematice apar ca urmare a ne respectării principiului de bază al
selecţiei (principiul hazardului) care cere, ca fiecărei unităţi a
colectivităţii generale să-i fie asigurată o anumită şansă de a fi inclusă în
eşantion. Întrucât erorile sistematice denaturează precizia rezultatelor
obţinute, ele trebuie evitate prin respectarea regulilor ştiinţifice de
selecţie.
Erorile întâmplătoare îşi au sursa în natura sondajului; rezultă din esenţa
metodei de selecţie. Ele se produc chiar dacă sondajul s-a organizat după
principii ştiinţifice. Apariţia lor se explică prin faptul că, într-un număr
mic de unităţi din care este format eşantionul, nu se reproduce influenţa
întregului complex de factori ce acţionează în colectivitatea generală.
În aceste condiţii, distribuţia de selecţie se abate de la distribuţia
colectivităţii generale; media sau oricare alt indicator derivat obţinut prin
selecţie prezintă anumite diferenţe în raport cu aceiaşi indicatori ai
întregii colectivităţi.
Statistica a elaborat metode prin care determină cu anticipaţie mărimea
erorii întâmplătoare de reprezentativitate. Erorile care însoţesc indicatorii
prin care se estimează parametrii colectivităţii generale se încadrează într-
un interval garantat cu o probabilitate stabilită aprioric.
Măsurarea erorii de reprezentativitate se poate efectua în mărimi absolute
şi relative. Eroarea de reprezentativitate absolută se obţine ca diferenţă
între indicatorul de sondaj (x) şi mărimea adevărată a indicatorului în
colectivitatea generală (m).
x-m
Eroarea de reprezentativitate relativă:

x m
 100
m

Dacă procentul privind eroarea de reprezentativitate este sub 5%, se poate


aprecia că sondajul este reprezentativ şi oferă o imagine fidelă a realităţii.
Teoretic, eroarea poate fi redusă oricât de mult; aceasta implică însă o
creştere a dimensiunii eşantionului, până la limita întregii colectivităţi,
dar în acest caz dispar avantajele verificării prin sondaj, adică economie
de timp şi bani. Deci pentru dimensionarea eşantionului trebuie să se
găsească un raport convenabil între nivelul erorii de reprezentativitate şi
costul măririi eşantionului.
5.2. Felurile sondajelor statistice

Statistica oferă variate procedee de extragere a unităţilor şi alcătuire a


eşantioanelor astfel încât să se asigure un grad mai ridicat de
reprezentativitate.
Principalele tipuri de sondaj sunt:
1. Sondaje aleatoare:
- sondaj simplu
- sondaj tipic
- sondaj de serii
- sondaj secvenţial
- sondaj în trepte
2. Sondaje dirijate
3. Sondaje sistematice
Din punct de vedere al modului de extragere a unităţilor, sondajele pot fi
grupate în:
- sondaje repetate, atunci când o unitate extrasă este reintrodusă în
colectivitatea generală, şi deci are şansa de a reintra în eşantion;
- sondaje nerepetate, atunci când unităţile nu sunt reintroduse în
colectivitatea generală.
Extragerea unităţilor se efectuează după diverse metode, dintre care cele
mai des utilizate sunt:
1. Procedeul LOTO, în care unităţile sunt perfect identificabile, iar
extragerea se face după corespondentul înregistrat pe bileţele amestecate
şi extrase aleator dintr-o urnă.
2. Procedeul tabelelor cu numere aleatoare este aproximativ similar celui
anterior, dar se aplică la colectivităţi de dimensiuni mari, la care metoda
LOTO este neoperantă. Numerele sunt înregistrate într-un tabel cu N
unităţi, din care se aleg serii de numere întâmplătoare ce vor alcătui un
eşantion de n unităţi.
3. Procedeul mecanic constă în alegerea unităţilor la intervale (de timp
sau numerice) bine precizate, deci la un anumit pas de numărare, aplicat
bazei de sondaj. Exemplu: dacă eşantionul n reprezintă 10% din volumul
colectivităţii N, atunci se va extrage fiecare a 10-a unitate a colectivităţii.
Pentru a îmbunătăţi caracterul aleator, nu se va începe extragerea cu
unitatea 1, ci se alege o unitate din primele 10, apoi se vor extrage şi
celelalte, cu pasul egal cu 10.
4; 4 + 10 = 14; 14 + 10 = 24; 24 + 10 = 34; …
Temă de reflecţie:

Incearcă să explici metodele de sondaj utilizate in alegerea unitatilor


statistice din esantion.

5.2.1. Sondajul aleator simplu


La prima activitate tutorială, discutaţi despre cuplul informaţie – decizie
într-o unitate economică.
Este varianta elementară de sondaj, celelalte tipuri reprezintă soluţii
obţinute prin particularizarea unor elemente ale acestui tip de sondaj.
Sondajul aleator simplu se poate realiza în una din cele două variante
(repetat şi nerepetat), din punct de vedere al modului de extragere a
unităţilor. Indicatorii de bază utilizaţi sunt numărul de unităţi din întreaga
colectivitate şi din eşantion, media aritmetică a unei caracteristici pentru
întreaga colectivitate şi pentru eşantion, dispersia pentru întreaga
colectivitate şi pentru eşantion, abaterea pătratică medie.
Indicatorii statistici calculaţi pe baza datelor de sondaj diferă de la un
eşantion la altul, ei pot fi interpretaţi ca variabile aleatoare. Indicatorii
estimaţi pe baza sondajului, fiind variabile aleatoare, pentru a putea fi
extinşi la întreaga colectivitate, trebuie să fie estimări:
- nedeplasate (adică valoarea medie a indicatorului de sondaj să fie egală
cu parametrul din colectivitatea generală);
- consistente (indicatorul de sondaj să tindă în probabilitate, pentru valori
mari ale lui “n”, către parametrul teoretic din colectivitatea generală);
- eficiente (să aibă dispersie minimă)
Estimaţiile obţinute pe baza datelor de sondaj constituie evaluări
aproximative ale adevăratelor valori ale parametrilor necunoscuţi din
colectivitatea generală. Rezultă că datele obţinute prin sondaj sunt
afectate de erori. Prin sondaj nu se obţine valoarea adevărată a
parametrului căutat, ci un interval de încredere care acoperă valoarea
necunoscută a parametrului din colectivitatea generală, cu o probabilitate
fixată de cercetător. Acest interval poartă numele de interval de estimaţie
sau interval de încredere.
Cele două limite ale intervalului de încredere, Θinf şi Θsup se calculează pe
baza datelor sondajului:
P(Θinf < Θ < Θsup) = 1 – α
Intervalul (Θinf; Θsup) reprezintă intervalul de încredere şi defineşte
precizia estimaţiei. Probabilitatea P = 1 – α caracterizează siguranţa
afirmaţiilor şi se numeşte nivel de încredere.
α este valoarea complementară a nivelului de încredere şi se numeşte
nivel sau prag de semnificaţie şi se fixează prin programul de cercetare.
Cele mai utilizate valori ale probabilităţii de încredere sunt 90%, 95%,
99% şi 99,9%, cărora le corespund niveluri de semnificaţie de 10%, 5%,
1% şi 0,1%.

5.2.2. Indicatorii sondajului aleator simplu

1. Eroarea mediei de selecţie


- pentru selecţia repetată

x1  x2  ...  xn 1 n
x   xi
n n i 1
Media de sondaj

poate fi un estimator nedeplasat al mediei “m” a colectivităţii generale


dacă se îndeplineşte condiţia ca media mediilor de selecţie să fie egală cu
media generală:
M(x) = m
Relaţia exprimă că media de sondaj, x, într-un sondaj este un estimator
nedeplasat al mediei “m” a colectivităţii generale.
Dispersia mediei de sondaj se calculează după relaţia:

2
D( x ) 
n
Deci dispersia mediei de sondaj într-un eşantion este de n ori mai mică


x 
n
2
decât dispersia σ a colectivităţii generale. De aici rezultă relaţia pentru
abaterea medie pătratică:
- pentru selecţia nerepetată
Relaţiile dintre dispersia generală (σθ2), dispersia erorilor de
reprezentativitate (σx2) şi volumul eşantionului (n) nu se verifică în
selecţia nerepetată.
Volumul ce rămâne după extragerea eşantionului de mărime (n) este
N + 1 la extragerea repetată şi N – n la extragerea nerepetată.
Din această cauză, dispersia mediilor eşantioanelor faţă de media
colectivităţii generale în selecţia nerepetată este de (N – 1)/(N – n) ori mai
mică decât în selecţia repetată.
În consecinţă, eroarea medie de reprezentativitate în selecţia nerepetată
pentru caracteristica nealternativă se corectează cu coeficientul de
corecţie

N n
N 1

adică abaterea medie pătratică

 x2  N  n   N n  n 
x       1  
n  N 1  n N 1  N

Dacă volumul N al colectivităţii este ridicat, iar al eşantionului este redus,


atunci (N – n)/(N – 1) 1, deci rezultatul indicatorului (σx) practic
coincide în ambele variante de sondaj.
Dacă N = n, atunci factorul

n
1
N

devine nul şi deci dispare şi eroarea medie de sondaj deoarece cercetarea


parţială s-a transformat în cercetare integrală.

2. Calculul erorii limită (erorii maxime admise sau probabile), Δx


Eroarea limită maxim admisă defineşte siguranţa estimării mediei m prin
variabila de sondaj x şi se măsoară cu ajutorul relaţiei:

x  m  x

Mărimea Δx caracterizează precizia estimaţiei.


Aprecierea satisfacerii inegalităţii nu se poate face decât ca o probabilitate
de realizare:

P ( x  m  x )  1  

xm
t 

n
Eroarea limită se determină pornind de la variabila:


x  t  ...........selectie _ repetata
n
Rezultă că eroarea x – m este egală cu:

şi

 n
x  t   1 ...........selectie _ nerepetata
n N

Pentru valorile uzuale


α = 0,05; 0,01; 0,001
valorile variabilei t corespunzătoare în tabele sunt:
t = 1,96; 2,33; 3,09

3. Calculul intervalului de încredere


Intervalul de încredere desemnează zona probabilă în interiorul căreia se
va plasa media colectivităţii generale. Se determină pornind de la media
de sondaj corectată cu nivelul erorii limită maxim admisă.

x  m  x
din care rezultă dubla inegalitate:

x  x  m  x  x

Deci intervalul de încredere delimitează zona probabilă în care se va


plasa valoarea adevărată, dar necunoscută a mediei din colectivitatea
generală.
Lungimea intervalului de încredere este direct proporţională cu mărimea
împrăştierii valorilor (măsurată prin abaterea medie pătratică) şi invers
proporţională cu nivelul pragului de semnificaţie (la valori mici ale lui α,
valorile lui tα cresc) şi mărimea eşantionului (la creşterea lui n, intervalul
de încredere devine mai mic, deci precizia estimaţiei sporeşte).
În unele situaţii prezintă interes şi poate avea sens logic calculul
intervalului probabil de plasare a nivelului totalizat al caracteristicii în
colectivitatea generală. Intervalul de încredere pentru valoarea agregată
Nx este:

 
N ( x  t )  N m  N ( x  t
)
n n
Pentru sondajul nerepetat, relaţia se adaptează cu formula adecvată
acestui tip de sondaj.

4. Determinarea volumului n al sondajului


La organizarea unei cercetări prin sondaj, una din problemele de rezolvat
este dimensionarea lor raţională. Este adevărat că mărimea n a sondajului
sporeşte precizia rezultatelor, reduce eroarea medie probabilă. Ţinând
seama de criteriile economice este necesar ca acest volum să fie cât mai
mic.
Luând în considerare ambele aspecte, se determină numărul minim de
unităţi de observat care să satisfacă exigenţele de precizie şi siguranţă
formulate în raport cu cercetarea respectivă.
Calculul volumului eşantionului se realizează pornind de la eroarea limită
maxim admisă.


x  t
n
- pentru sondajul repetat

astfel încât se stabileşte volumul lui n:

2
 x 2 t  2
2 2
t   n
n
2 x

- pentru sondajul nerepetat

t2   2
n
t2   2
x
2

N
Selecţia simplă nerepetată este mai economicoasă decât cea repetată,
deoarece în aceleaşi condiţii volumul necesar al eşantionul este mai mic.

Test de autoevaluare:

Încearcă să rezumi în spaţiul de mai jos principalele metode de sondaj


statistic si indicatorii selectiei aleatorea simple.

Teme de dezbatere:

Teme de dezbatere:

1. Definiţi termenul de sondaj statistic.


2. Definiţi termenul de eroare statistică
3. Enumeraţi tipurile de sondaje

Teme de control:

Problemă rezolvată:

În vederea estimării limitelor între care se va încadra valoarea medie a


cheltuielilor lunare, pentru servicii şi exploatare auto, a posesorilor de
automobile s-a efectuat o cercetare prin sondaj la un eşantion de 300
reprezentând 5% din numărul total de posesori. Persoanele chestionate au
fost împărţite în trei grupe tipice după venitul lunar.

Grupe tipice Nr.pers. Cheltuieli medii Dispersia


dupã venit cheltuielilor lunare
5% (mii lei)
Sub 50000 60 8,3 2,575
50000-100000 160 20,5 4,850
Peste 100000 80 30,8 2,145
TOTAL 300

Să se determine în condiţii de sondaj repetat mărimea eşantionului


dacă eroarea limită se micşorează cu 15% iar z = 2.

Rezolvare:
a) Determinarea mărimii eşantionului în condiţii de sondaj
repetat.
x = z   x

 i2
x 
n
k

 i
2
 ni
60  2,575  160  4,850  80  2,145 1120,10
 
i
2 i 1
k
   3,6736
n
300 300
i
i 1

3,6736
x   0,1106584
300
x = 2 · 0,1106584 = 0,2213168

După ce se află eroarea limită x în cazul problemei date, se determină


eroarea limită 'x micşorată cu 15% pe baza căreia se află noul volum al
eşantionului. Volumul eşantionului şi eroarea se găsesc în relaţie de
inversă proporţionalitate.

'x = x - x ·15%

'x = 0,2213168 - 0,2213168 · 0,15 = 0,1881168

z 2   i2 4  3,6736 14,6944
n'     415,23
' x
2
0,1881168 0,0353879
2
n'  415 persoane

Problemă propusă spre rezolvare

Să se determine ce volum de selecţie va fi necesar pentru a cerceta prin


sondaj modul de împlinire a normelor de producţie la o întreprindere de
panificaţie cu 599 muncitori în cazul în care rezultatele trebuiesc
garantate cu o probabilitate de 0,9545 eroarea limită nu trebuie să
depăşească 3,5 kg. Întrucât sondajul poate fi repetat sau nerepetat,
problema se va rezolva în ambele situaţii. Abaterea medie pătratică este
16.

BIBLIOGRAFIE
1. Baron T. şi colectiv, Statistica economică, ASE Bucureşti, 1988
2. Baron T., Biji E. şi colectiv, Statistica teoretică şi economică, Ed.
Didactică şi Pedagogică, Bucureşti, 1991
3. Bădiţă M., Baron T., Korka M., Statistică - Culegere de probleme,
ASE Bucureşti, 1994
4. Biji M., Biji E., Statistica teoretică, Ed. Didactică şi Pedagogică,
Bucureşti, 1982
5. Câmpanu I., Wagner P., Mitruţ C. Sistemul Conturilor Naţionale
şi agregate macroeconomice, Ed. All, Bucureşti, 1994
6. Câmpanu I., Statistica economică, Ed. Didactică şi Pedagogică,
Bucureşti 1982
7. Gregory and Ward, Statistics for Business Studies, Second
Edition, McGraw-Hill, London 1974
8. Haber A., Runyon R., General Statistics, Second Edition,
Addison-Wesley, London 1973
9. Ionescu E., Pantea M.F., Lile R., Bazele statisticii, Ed. Concordia,
Arad, 2004
10. Ivănescu I. Şi colectiv, Statistica, Ed. Didactică şi Pedagogică, Bucureşti
1980
11. Jaba Elisabeta, Statistica, Ed. Economică, Bucureşti, 1998
12. Korka M., Baron T., Bădiţă M., Manual de Statistică, Ed. Sylvi,
Bucureşti 1993
13. Merce E., Mărăuţă P., Statistica economică în turism şi comerţ,
Univ. "Dimitrie Cantemir", Cluj Napoca, 1995
14. Mihoc Gh., Urseanu V., Sondaje şi estimaţii statistice, Ed.
Tehnică, Bucureşti 1977
15. Pantea V., Pantea M., Cureteanu R., Analiza economico-
financiară a întreprinderii, Editura Concordia, Arad, 2004
16. Resa I.D., Petrescu Şt., Precupaş M., Câra Al., Probleme de
statistică rezolvate pe calculator, Editura Facla, Timişoara 1984
17. Szenteşi S., Rusu S., Cureteanu R., Statistica activităţii
economice, Editura Mirton, Timişoara, 2005
18. Szentesi S., Ionescu E., Lile R, Bălan L, Rusu S., (2008),
Statistică economică, editura Universităţii Aurel Vlaicu, Arad

S-ar putea să vă placă și