Sunteți pe pagina 1din 10

STATISTICĂ ECONOMICĂ



• x

• • •
• • •
• • • •
• •
••
• •

eºantion
Populaþie (colectivitate generalã)

Fig. 4.1 - Procesul inferenţei statistice

4.3. TIPURI DE SONDAJ

În selecţia aleatoare se disting următoarele tipuri de sondaj:


— sondajul simplu aleator;
— sondajul tipic (stratificat);
— sondajul de serii (cuiburi);
— sondajul în mai multe trepte;
— sondaj secvenţial.

4.4. DISTRIBUŢII DE EŞANTIONARE. PROPRIETĂŢI ALE


DISTRIBUŢIILOR DE EŞANTIONARE

Deoarece datele din eşantioane sunt valori observate ale variabilelor alea-
toare, indicatorii statistici calculaţi pentru un eşantion vor varia într-un mod
aleator de la eşantion la eşantion.

Populaţia statistică
(colectivitatea)

Eşantion Eşantion Eşantion

Indicator Indicator Indicator

Fig 4.2. Obtinerea unei distributii de esantionare


CAPITOLUL 4

În privinţa mediei de selecţie, indicator statistic obţinut pe eşantion,


trebuie arătat că, indiferent de forma distribuţiei de frecvenţe din colectivi-
tatea generală, media distribuţiei de eşantionare a mediei de selecţie ( x ) este
egală cu µ, media colectivităţii generale (pentru eşantioane mari).

µ (x) = µ

Un alt parametru al distribuţiei de eşantionare, dispersia medie de


sondaj se calculează ca:

σ2
σ x2 = (4.15)
n

Eroarea standard a mediei de sondaj este σ x , adică abaterea medie


pătratică a mediei de selecţie x de la parametrul µ:

σ 2x σx
σx = = (4.16)
n n

Evident, cum σx2 (dispersia colectivităţii generale) şi σ (abaterea medie


pătratică din colectivitatea generală) sunt necunoscute, ele se estimează prin
s2 (dispersia de sondaj) şi s (abaterea mediei pătratice de sondaj). Se obţine,
astfel, estimatorul dispersiei mediei de sondaj ( s 2x ):
s 2x
2
s = (4.17)
x n

şi estimatorul erorii medii a mediei de sondaj (adică eroarea medie de


reprezentativitate):
STATISTICĂ ECONOMICĂ

s
sx = x (4.18)
n
În privinţa distribuţiei de eşantionare a mediei de selecţie, să mai notăm
că în cazul populaţiilor normal distribuite (cu distribuţii de probabilitate
normală), distribuţia de eşantionare a mediei de selecţie este normală,
indiferent de numărul elementelor din eşantion (de volumul eşantionu-
lui).

4.5. SONDAJUL ALEATOR SIMPLU REPETAT

4.5.1. Determinarea erorii medii de reprezentativitate

În cazul unei variabile cantitative, de tip nealternativ, pentru estimarea


parametrului media colectivităţii generale (µ) este necesar să calculăm me-
dia de sondaj ( x ) (formulele 4.5 sau 4.6).
Dispersia mediilor de selecţie este:
s 2x
s2 = (4.19)
x n
Eroarea medie de reprezentativitate (abaterea medie pătratică a mediei
de sondaj) se determnină pe baza datelor din eşantion ca:

s 2x s
sx = = x (4.20)
n n

4.5.2. Determinarea erorii limită

Pentru a construi acest interval de încredere vom determina, întâi, eroa-


rea limită maximă admisibilă. Cum media de sondaj ( x ) este variabilă
aleatoare normal distribuită, de medie µ şi abaterea medie pătratică σ x =σx / n ,
înseamnă că variabila normală normată (redusă) corespunzătoare este:
CAPITOLUL 4

x−µ
z= (4.21)
σx

x−µ
z= (4.22)
sx

Pentru probabilitatea cu care garantăm rezultatele 100(1-α)%, eroarea


limită (maximă) admisibilă este:

s
∆ x = z α / 2s x = z α / 2 x (4.23)
n

4.5.3. Determinarea intervalului de încredere pentru media µ

Intervalul de încredere calculat pe baza erorii limită maximă admisibilă


este:
s
x ± zα / 2
n

Pentru un eşantion de volum normal sau mare, mărimea relativă a


intervalului de încredere poate să fie prezentată schematic astfel (Fig. 4.3)

Interval de încredere pentru 1-α=0.999

Interval de încredere pentru 1-α=0.99

Interval de încredere pentru 1-α=0.95


Interval de încredere pentru 1-α=0.90

sx sx
x
Media eşantionului

Fig. 4.3 - Mărimea relativă a intervalului de încredere


pentru un eşantion de volum mare
STATISTICĂ ECONOMICĂ

x − ∆x < µ < x + ∆x (4.24)

Intervalul de încredere ( x ± ∆ x ) este garantat cu nivelul de încredere


ales, ceea ce face ca această estimare să fie preferabilă estimării punctuale.
Intervalul de încredere pentru nivelul total al caracteristicii este:

N
N ( x − ∆ x ) < ¦ x i < N( x + ∆ x ) (4.25)
i =1

EXEMPLUL 4.1: Să se determine intervalul de încredere, garantat cu o


probabilitate de 99%, pentru media şi nivelul total al unei caracteristici
numerice X, dacă eşantionul selectat aleator repetat de 36 de unităţi, adică
5% din colectivitatea generală este de medie 800 şi abatere medie pătratică
60.
Rezolvare: Eroarea medie de reprezentativitate va fi:
s 2x s 60
sx = = x = = 10
n n 6

Eroarea limită maximă admisibilă:

∆ x = z α / 2 s x = 2.58 ⋅ 10 = 25.8

Intervalul de încredere pentru parametrul colectivităţii generale este dat


de:

x − ∆x < µ < x + ∆x
800-25.8 < m < 800+25.8
774.2 < m < 825.8

iar pentru nivelul total al caracteristicii studiate:

N( x − ∆ x ) < ¦ x i < N( x + ∆ x )
557424 < ¦ x i < 594576

Acest intervale de încredere sunt garantate cu o probabilitate de 99%.


CAPITOLUL 4

4.5.4. Determinarea volumului eşantionului

s
zα / 2 ⋅ x = ∆ x (4.26)
n
sau

s L
zα / 2 ⋅ x = (4.27)
n 2

Soluţia poate fi scrisă ca:

(z α / 2 ) 2 ⋅ s 2x
n= (4.28)
∆2
x
sau

4(z α / 2 ) 2 ⋅ s 2x
n= (4.29)
L2

Desigur, şi aici sx2 se foloseşte ca o estimaţie a lui σ 2x , în general necu-


noscută. Valoarea aproximativă a lui sx2 poate fi cunoscută dintr-o cercetare
prin sondaj anterioară. Ca o alternativă, putem aproxima amplitudinea îm-
prăştierii Ax a observaţiilor şi apoi, sub presupunerea tendinţei de norma-
litate a distribuţiei, putem calcula:

sx ≅ Ax / 6 (4.30)

EXEMPLUL 4.2: Să se determine volumul eşantionului necesar pentru a


estima media unei colectivităţi (µ) cu o eroare limită de 0.2 şi o probabilitate
de garantare a rezultatelor de 95%, ştiind dintr-o cercetare anterioară că
dispersia sx2 este aproximativ egală cu 6.1. Aceaşi cerinţă pentru lungimea
intervalului de încredere de 0.2.
Rezolvare: Pentru:
∆ x = 0 .2
100(1-α)% = 95% => zα/2 = z0.025 = 1.96
STATISTICĂ ECONOMICĂ

sx2 = 6.1
rezultă:
2 2
zα / 2 ⋅sx (1.96) 2 ⋅ 6.1
n= = = 585.84 ≅ 586 unităţi statistice
∆2 (0.2) 2
x
În cazul în care întreaga lungime a intervalului de încredere este de 0.2
(evident o precizie crescută), vom avea:
2 2
4 ⋅ zα / 2 ⋅ sx 4 ⋅ (1.96) 2 ⋅ 6.1
n= = = 2343.36 ≅ 2344 unităţi statistice
L2 (0.2) 2

4.5.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%

Coeficientul de încredere este 1-α, pentru care P(-zα/2 < Z < zα/2)=1-α.
Atunci, din formula erorii limită (maximă) admisibilă rezultă:

∆x n
zα / 2 = (4.31)
sx

Din tabelele privind distribuţia normală normată se poate determina apoi


probabilitatea 100(1-α)% de garantare a rezultatelor.

EXEMPLUL 4.3: Să se determine nivelul de încredere pentru estimaţia


privind media colectivităţii generale (µ), dacă volumul eşantionului este
n=100 unităţi statistice, media eşantionului x =258600, abaterea medie
pătratică s=8000, iar intervalul de încredere dorit este de 4000.
Rezolvare:
∆ n 2000 100
zα / 2 = x = = 2.5
s 8000
şi
1-α=P(-2.5<z<2.5)=2(0.4938)=0.9876

Probabilitatea cu care garantăm rezultatele este de 98.76%.


STATISTICĂ ECONOMICĂ

N
10848 < ¦ x i <11712
i =1

4.6.4. Determinarea volumului eşantionului

z2 s 2x N z2 s2
α/2 α/2
n= = (4.41)
z2 s 2x + ∆2 N z2 s2
x
α/2
∆2 + α/2
x N

4.7. ESTIMAREA PROPORŢIEI ÎN CAZUL SONDAJULUI


ALEATOR SIMPLU

Utilizarea lui f pentru a estima populaţia p este similară cu utilizarea lui


x pentru estimarea parametrului µ.

4.7.1. Determinarea erorii medii de reprezentativitate

Dispersia mediilor de selecţie (adică dispersia proporţiilor eşantioa-


nelor) va fi atunci:
p(1 − p)
σ f2 = (4.42)
n
estimată (pentru că, de obicei, proporţia p din colectivitatea generală este
necunoscută), prin:
f (1 − f )
s f2 = (4.43)
n
Atunci, abaterea medie pătratică a proporţiilor din eşantioane, ce repre-
zintă eroarea medie de reprezentativitate este calculată, pe baza datelor
din eşantion:
f (1 − f )
sf = pentru selecţie repetată (4.44)
n
şi
CAPITOLUL 4

f (1 − f )  n
sf = ⋅ 1 −  pentru selecţie nerepetată (4.45)
n  N

4.7.2. Determinarea erorii limită

Înlocuind eroarea medie de reprezentativitate calculată anterior obţinem


eroarea limită (maximă admisibilă):
f (1 − f )
∆ f = z α / 2 s f = zα / 2 pentru selecţie repetată (4.46)
n

şi

f (1 − f ) § n ·
∆ f = zα / 2s f = zα / 2 ⋅ ¨1 − ¸ pentru selecţie nerepetată (4.47)
n © N¹

4.7.3. Determinarea intervalului de încredere pentru proporţia p

Intervalul de încredere pentru proporţia p din colectivitatea generală


este dat de:

f-∆f < p < f+∆f (4.48)


adică:
f (1 − f ) f (1 − f )
f − zα / 2 < p < f + zα / 2 pentru selecţie repetată (4.49)
n n

şi
f (1− f ) § n · f (1− f ) § n ·
f − zα / 2 ⋅¨1− ¸ < p < f + zα / 2 ⋅¨1− ¸ (4.50)
n © N¹ n © N¹
pentru selecţie nerepetată, garantat cu o probabilitate 100(1-α)%.

Pentru estimarea numărului de răspunsuri afirmative, intervalul de


încredere este dat de:

N (f − ∆ f ) < M < N (f + ∆ f ) (4.51)


STATISTICĂ ECONOMICĂ

EXEMPLUL 4.6: Presupunem că din 100 de persoane selectate aleator şi


anchetate, 30 au o opinie favorabilă despre un produs nou. Să se estimeze cu
o probabilitate de 90%, intervalul de încredere pentru proporţia opiniilor
favorabile din colectivitatea generală (locuitorii unui oraş).
Rezolvare:
f (1 − f ) 0.21
sf = = = 0.046
n 100
∆ f = zα / 2 s f = z 0.05 s f = 1.64 ⋅ 0.046 = 0.075 (7.5%)
0.3-0.075 < p < 0.3+0.075
0.225 < p < 0.375

4.7.4. Determinarea volumului eşantionului

Pentru selecţia aleatoare repetată volumul eşantionului este dată de


relaţia:

z 2 f (1 − f )
n= (4.52)
∆2f

iar pentru selecţia fără revenire este dată de relaţia:

z 2 f (1 − f ) N z 2 f (1 − f )
n= 2 = (4.53)
∆ f N + z 2 f (1 − f ) z 2 f (1 − f )
∆2f +
N

4.7.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%

Pentru a obţine nivelul de încredere sau probabilitatea de garantare a re-


zultatelor, atunci când folosim proporţia f din eşantion pentru a estima pro-
porţia p din colectivitatea generală, vom rezolva ecuaţia:

∆f n
zα / 2 = (4.54)
f (1 − f )

S-ar putea să vă placă și