Sunteți pe pagina 1din 19

Sondajul stratificat

Sumarul relaiilor de calcul necesare calculului erorilor de reprezentativitate


utilizate n cazul sondajului stratificat sunt sistematizate n tabelul 2.1.
Notaii utilizate:

N1, N2,.. Nk, reprezint volumul straturilor n populaia total i


n1, n2,.. nk, reprezint volumul straturilor n eantion i

i =1

i =1

Ni = N

n i = n unde k

reprezint numrul straturilor.

Probleme rezolvate
Problema 1

n rndul salariailor unei ntreprinderi se va realiza un sondaj stratificat .


Organizatorii sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare
strat urmnd s se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din
evidena personalului s-a calculat, pornind de la variabila vrsta n ani mplinii media i
dispersia pe fiecare strat. Rezultatele se gsesc n tabelul 2.2:
sex
masculin
feminin

numr salariai (pers.)


535
365

vrsta medie (ani)


48
39

Tabel 2.2
Dispersia
36,4
45,8

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit maxim admis de 3% din valoarea vrstei medii tuturor angajailor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate.
Rezolvare

Calculele necesare sunt sistematizate n tabelul 2.3.


1. Vrsta medie a celor 900 de salariai se calculeaz ca medie aritmetic ponderata
a vrstei medii a salariailor din cele dou straturi dup relaia:
k

X =

i =1

Xi N i

N
i =1

39915
= 44.35 ani
900

Eroarea limit propus este:


x = 0.03 X = 0.02 42 = 1.33 ani

Tabelul 2.1
Selecia din interiorul straturilor s-a realizat cu revenire

Sondaj stratificat
simplu
(neproporional)

x~ =

N i2 i 2

2
ni
i =1 N

x~ =

N i2 S i 2
2
i =1 N ni 1
k

N i2

i =1 N

2
2 xi

w =

N i2 pi (1 pi )

2
ni
i =1 N

w =

N i2

i =1 N

ni2 i 2
=
2
i =1 n ni

x~ =

N i2 wi (1 wi )
2
ni 1
i =1 N
k

2w i

x~ =

Sondaj stratificat
proporional

Sondaj stratificat
optim

ni2 S i 2
2
i =1 n ni
k

ni2

i =1 n

ni2 w i (1 w i )
=
2
ni 1
i =1 n

w =

ni2 2
w i
2
i =1 n

x~ =

N i2 i 2 N i ni

2
ni N i 1
i =1 N

x~ =

N i2

i =1 N

N i2 S i 2 N i ni

i =1 N ni 1 N i 1
k

N i2 pi (1 pi ) N i ni

2
ni
Ni 1
i =1 N

w =

~x =

N i2

i =1 N

ni2 i 2 N i ni

i =1 n ni N i 1
k

2
n

w =

ni2 w i (1 wi ) N i ni

=
2
ni
Ni 1
i =1 n

w =

Aceleai relaii de calcul ca i n cazul sondajului neproporional

ni2

i =1 n

N i2 wi (1 wi ) N i ni

2
ni 1
Ni 1
i =1 N
k

2w i

2x i

ni2 i 2 N i ni

i =1 n ni N i 1
w2
n

w =

2
2 xi

w =

Selecia din interiorul straturilor s-a realizat fr revenire

2w i

N ni
i
Ni 1

2p N n

n N 1

ni2 S i 2 N i ni

i =1 n ni N i 1
k

Tabel 2.3
sex

M
F
Total

Xi

Ni
(pers.)

(ani)

535
365

48
39

ni

i2

N i Xi

N i 2i sondaj

Ni i

36.4
45.8

25680
14235
39915

19474
16717
36191

3227.784
2470.163
5697.947

proporional

48
32

ni
sondaj
optim

(X

45
35

33813.34
767.4125
34580.75

X Ni

Variaia total a populaiei dup o anumit caracteristic (msurat de dispersia 2 )


este compus din variaia din interiorul straturilor (msurat de dispersia 2 ) i variaia
dintre straturi (msurat de dispersia 2 ). Cele trei dispersii se calculeaz dup relaiile:
N

2 =

(X
j=1

X)

2 =

N
i =1
k

2
i

Ni
i=1

2 =

(X

X) 2 N i

i =1

i =1

Conform regulii de adunare a dispersiilor ntre aceste tipuri de variaie exist


urmtoarea relaie: 2 = 2 + 2 .
Dac n cazul sondajului simplu aleator mrimea eantionului este direct
proporional cu dispersia total a variabilei, n cazul sondajului stratificat acesta va fi
influenat doar de o parte a acestei variaii.
Deoarece ntotdeauna 2 < 2 n cazul stratificrii va fi necesar un volum de
eantion mai mic, estimaia realizndu-se n aceleai condiii de precizie i probabilitate.
Variaia din interiorul straturilor calculat ca medie a dispersiilor straturilo reste:
k

N
2
i

i =1
k

36191
= 40.21
900

i =1

Volumul eationului n cazul sondajului stratificat se calculeaz dup relaia:


z2 2
1.96 2 40.21
n=
=
= 79.6 80 pers.
z2 2
1.96 2 40.21
2
2
1.33 +
x +
900
N
2. Repartizarea eantionului pe straturi se poate realiza n trei moduri i anume:
o neproporional obinndu-se un sondaj stratificat neproporional sau simplu;
o proporional respectndu-se ponderea fiecrui strat n total populaie obinnduse un sondaj stratificat proporional;
o innd cont att de proporia fiecrui strat n total, ct si de gradul de variaie al
fiecrui strat, obinndu-se un sondaj stratificat optim.

Calculul volummului eantionului pe fiecare strat n cazul sondajului


neproporional

n acest caz nu sunt necesare informaii detaliate. Din fiecare strat se extrage un
numr de uniti pentru a forma eantionul fr a ine cont de greutatea specific a fiecruia
n totalul populaiei.
n 80
ni = =
= 40 pesroane
k 2
Calculul volummului eantionului pe fiecare strat n cazul sondajului
proporional

Acest tip de sondaj se recomand n cazul n care exist diferene mari ntre
volumele subpopulaiilor straturilor deoarece structura pe straturi n populaia total se
respect i se regsete i n structura eantionulu
Prin definiie se numete un sondaj stratificat proporional cel pentru care este
ndeplinit condiia:
k

n1
n
n
n
= 2 = .... i .... = k =
N1 N 2
Ni
Nk

i =1
k

n
N

i =1

Din aceasta deducem relaia de calcul pentru eantionul fiecrui strat: n i =

n
Ni
N

unde i=1,2,,k.
80
n1 =
535 48 persoane
900
80
n2 =
365 32 persoane
900
Calculul volummului eantionului pe fiecare strat n cazul sondajului optim

n cazul n care exist diferene mari n ceea ce privete gradul de variaie al


straturilor se recomand utilizarea sondajului stratificat optimdeoarece stabilirea
subeantioanelor se face innd cont att de proporia pe care o ocup stratul n populaia
total ct i de abaterea medie ptratic, indicator ce exprim variaia caracteristicii n
interiorul stratului.
Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se
utilizeaz relaia:
k

n1
n2
ni
nk
=
= ... =
= .... =
=
N 1 1 N 2 2
N i i
Nk k

i =1

N
i =1

Pe baza acesteia deducem relaia de calcul pentru subeantionul ce urmeaz a fi


N
extras din fiecare strat n i = k i i n .

N
i

i =1

3227,784
80 45 persoane
5697.947
2470,163
n2 =
80 35 persoane
5697.947
n1 =

2. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat
variaia de care trebuie inut cont n momentul calculrii volumului eantionului
este variaia total a caracteristicii. Deoarece nu se cunosc valorile individuale ale
variabilei vrsta pentru toate cele N uniti din populaie nu putem calcula
2

variaia total dup relaia: =

(X

X) 2 N

j=1

Deoarece = + vom calcula variaia total ca sum variaiilor inter i intra


straturi.
2

2 =

(X

X) 2 N i

i =1

34580,75
= 38,42
900

i =1

2 = 40,21 + 38,42 = 78,63


z 2 2

1.96 2 78.63
144 persoane
z 2 2
1.96 2 78.63
2
2
x +
1.33 +
N
900
Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de
un sondaj simplu aleator fr revenire de la 144 persoane la 80 persoane.
n SAFR =

Problema 2

n rndul studenilor facultii REI urmeaz s se realizeze un sondaj avnd drept


obiectiv principal analiza calitii procesului de nvmnt. Deoarece se urmrete
evidenbierea caracteristicilor fiecrui an de studi se e va utiliza un plan de sondaj
stratificat. Informaiile necesare aplicrii planului de sondaj au fost preluate de la
secretariatul facultii i sunt prezentate n tabelul 2.4.
Anul de studii
An I
An II
An III
An IV
Total

Numr studeni (pers)


600
575
500
450
2125

Tabel 2.4
Ponderea studenilor fr restane (%)
20
63
45
86

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit de 3%.
2. Deoarece realizarea sondajului pentru volumul calculat la punctul 1 necesit
cheltuieli prea mari s-a propus reducerea acestuia cu 10%. Care va fi eroarea
limit ce va trebui acceptat n aceast situaie?
3. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul
eantionului calculat la punctul 2.
4. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
Rezolvare
Tabel 2.5
Anul
de studii

Ni

pi

2pi

N i 2pi

An I

600

0.2

0.16

96

ni
sondaj
proporional
149

An II

575

0.63

0.2331

134.0325

An III

500

0.45

0.2475

An IV

450

0.86

0.1204

Total

2125

240

ni
sondaj
optim
137

143

277.6125

159

362.25

123.75

124

248.7469

142

225

54.18

112

156.1442

90

387

407.9625

N i pi

922.5035

piNi

120

1094.25

Calculele necesare sunt prezentate n tabelul 2.5


1. Relaia de calcul a volumului eantionului n cazul aplicrii unei plan de sondaj
z 2 p2
.
stratificat i utiliznd o variabil calitativ este: n =
2 2
z

p
2w +
N
k

p2 =

2
p i Ni

i =1

407.9625
= 0.19 unde dispersiile straturilor sunt p2 i = p i (1 p i )
2125

i =1

n=

1.96 2 0.19
587 persoane
1.96 2 0.19
2
0.03 +
2125
2. Dac volumul eantionului se reduce cu 10% atunci noul volum va fi
n = 0.9 n = 0.9 587 528 persoane.

p2 n
p2 N n

1 = 0.0324
n N 1
n N
Dac se reduce volumul eantionului cu 10% eroarea limit, corespunztoare unei
probabiliti de garantare a rezultatelor de 95%, este de 3.24%.
w = z

Calculul volummului eantionului pe fiecare strat n cazul sondajului


neproporional

ni =

n 528
=
65 pesroane
k
4

Calculul volummului eantionului pe fiecare strat n cazul sondajului


proporional

Pornim de la condiia ce trebuie satisfcut n cazul sondajului stratificat


proporional:
n1
n
n
n
n
n
= 2 = .... i .... = k =
n i = N i unde i=1,2,,k.
N1 N 2
Ni
Nk N
N
258
600 149 persoane
n1 =
2125
258
575 143 persoane
n2 =
2125
258
500 124persoane
n3 =
2125
258
450 112 persoane
n4 =
2125
Calculul volummului eantionului pe fiecare strat n cazul sondajului optim

Pornim de la relaia:

n1
n2
ni
nk
=
= ... =
= .... =
=
N1 p1 N 2 p 2
N i pi
N k pk

n
k

N
i =1

ni =

N i pi

n.

N
i

pi

i =1

240
528 137 persoane
922.5
277.6
528 159 persoane
n2 =
922.5
248.7
528 159 persoane
n3 =
922.5
156
528 159 persoane
n4 =
922.5
n1 =

pi

3. Variaia total a caracteristicii calitative este dat de relaia: 2p = p (1 p ) unde


p reprezint media caracteristicii calitative ce se calculeaz astfel:

pN
p=
N
k

i =1 i
k

1094.25
=0.5149 2p = 0.5149 (1 0.5149) = 0.2498
2125

i =1

z 2 2

1.96 2 0.2498
639 persoane
2
2
2
1.96

0
.
2498
z

2
p
0.0324 +
2w +
2125
N
Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta
rezultatele cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o
cretere a volumului eantionului cu 111 persoane.
n SAFR =

Problema 3

n urma unui sondaj stratificat proporional dup mediul de reziden realizat n


judeul Bacu de ctre o societate de produce buturi rcoritoares-au obinut datele
centralizate n tabelul 2.6.
Tabel 2.6
Informaii obinute din eantion
Mediul

Efecivul
populaiei (mii
pers.)

Eantion
(pers.)

Venitul
mediu/pers
(mil. lei)

Dispersia
venitului
mediu/pers.

Ponderea celor care


consum sptmnal
buturi rcoritoare (%)

Urban

340

511

3.8

4.5

72

Rural

325

489

2.1

1.9

18

Total

665

1000

Se cere:
1. S se estimeze cu o probabilitate de 0.9545 venitul mediu/pers att pe fiecare
strat ct i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum
sptmnal buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.
Rezolvare

1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.7.


Tabel 2.7
Mediul

Ni
(mii pers.)

ni
(pers.)

x i mil lei

Si2

x i ni

xi

xi

Linf

Lsup

Urban

340

511

3.8

4.5

1941.8

0.094

0.188

3.612

3.988

Rural

325

489

2.1

1.9

1026.9

0.062

0.125

1.975

2.225

Total

665

1000

2968.7

Estimarea venitului mediu/persoan n mediul urban

n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul
venitul mediu/persoan. Acesta este de 3,8 mil. Lei. Pentru a estima venitul mediu/persoan
n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N1=0,05*340000=17000
Deoarece n1<0,05*N1 considerm populaia infinit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu
revenire.
S12
4,5
=
= 0.094 mil. Lei
n1
511

x1 =

S12
= 2 0.094 = 0.188 mil. Lei
n1
Intervalul de ncredere:
x 1 x1 < X1 < x 1 + x1 3.8 0.188 < X1 < 3.8 + 0.188 3.612 < X1 < 3.988
Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n mediul urban
este de cel puin 3.612 mil. Lei i cel mult 3.988 mil. Lei.
x1 = z

Estimarea venitului mediu/persoan n mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
venit mediu/persoan. de 2.1 mil. Lei. Pentru a estima venitul mediu/persoan n mediul
urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 2.
0.05*N2=0.05*325000=16250
Deoarece n2<0.05*N2 considerm populaia infinit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu
revenire.
S 22
=
n2

x2 =

1.9
= 0.062 mil. Lei
489

S 22
= 2 0.062 = 0.125 mil. Lei
n2
Intervalul de ncredere:
x 2 x2 < X 2 < x 2 + x2 2.1 0.125 < X 2 < 2.1 + 0.125 1.975 < X 2 < 2.225
Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este
de cel puin 1.975mil. Lei i cel mult 2.225 mil. Lei.
x2 = z

Estimarea venitului mediu/persoan pe total jude

Deoarece sondajul realizat este stratificat proporional estimatorul venitului


mediu/peroan la nivelul judeului se calculeaz astfel:
~
x =

x
i =1

ni

n
i =1

2968,7
= 2.9687 mil. lei
1000

Calcului erorii de reprezentativitate:


k

~x =

n i2

n
i =1

2x i = 0.056821 mil. lei

~x = z ~x = 2 0.056821 = 0.113642 mil. Lei


Intervalul de ncredere:
~
x ~x < X < ~
x + ~x 2.9687 0.1136 < X < 2.9687 + 0.1136 2.8551 < X < 3.0823
Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n judeul Bacu
este de cel puin 2.8551 mil. Lei i cel mult 3.0823mil. Lei.

2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.8


Tabelul 2.8
Mediul

Ni
(mii pers.)

ni
(pers.)

wi

Si2

wini

wi

wi

Linf

Lsup

Urban

340

511

0.72

0.2016

367.92

0.020

0.040

0.680

0.760

Rural

325

489

0.18

0.1476

88.02

0.017

0.035

0.145

0.215

Total

665

1000

455.94

Estimarea procentului celor care consum sptmnal buturi rcoritoare n


mediul urban

Estimatorul procentului celor care . consum sptmnal buturi rcoritoare n


mediul urban calculat pe baza datelor din eantion este de 72%. Pentru a estima procentul
acestora n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea
limit.
Deoarece populaia este considerat infinit utilizm relaiile de calcul aferente
calculul sondajului simplu aleator cu revenire.
w1

S12
=
=
n1

0.2016
= 0.020
511

S12
w1 = z
= 2 0.020 = 0.040
n1
Intervalul de ncredere:
w 1 w1 < p1 < w 1 + w1 0.72 0.040 < p1 < 0.72 + 0.040 0.680 < p1 < 0.76
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult
76% consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi
rcoritoare:
N 1 (w 1 w1 ) < N 1 p1 < N 1 (w 1 + w1 ) N 1 (0.72 0.040 ) < M 1 < N 1 (0.72 + 0.040 )
231293 < M 1 < 258307
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293
persoane i cel mult 258307 persoane consum sptmnal buturi rcoritoare.

Estimarea procentului celor care consum sptmnal buturi rcoritoare n


mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
procent de 18% al celor care consum sptmnal buturi rcoritoare.
Calculm eroarea de reprezentativitate
w2 =

S 22
=
n2

0.1476
= 0.017
489

S 22
= 2 0.017 = 0.035
n2
Intervalul de ncredere:
w 2 w2 < p 2 < w 2 + w2 0.18 0.035 < p 2 < 0.18 + 0.035 0.145 < p 2 < 0.215
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel
mult 21.5% consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi
rcoritoare:
N 2 (w 2 w2 ) < N 2 p 2 < N 2 (w 2 + w2 ) 47207 < M 2 < 69793
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane
i cel mult 69793 persoane consum sptmnal buturi rcoritoare.
w2 = z

Estimarea procentului celor care consum sptmnal buturi rcoritoare pe


total jude

Deoarece sondajul realizat este stratificat proporional estimatorul unwi variabile


calitative la nivelul judeului se calculeaz astfel:
~=
w

n w n
i

i =1

i =1

455,94
= 0.45594
1000

Calcului erorii de reprezentativitate:


k

w~ =

n i2

n
i =1

2w i = 0,013236

w~ = z w~ = 2 0,012236 = 0,026472 Intervalul de ncredere:


~ ~ < p < w
~ +~
0,45594 0,026472 < p < 0,45594 + 0,026472
w
w
w
0,429468 < p < 0,482412
Garantm cu o probabilitate de 95,45% c cel puin 42,9468% i cel mult 48,2412%
din judeul Bacu consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi
rcoritoare:
~ ~ ) < N p < N (w
~ + ~ ) 285596 < M < 320804
N (w
w
w
Garantm cu o probabilitate de 95,45% c n judeul Bacu cel puin 285596
persoane i cel mult 320804 persoane consum sptmnal buturi rcoritoare.

Problema 4

n urma unui sondaj n rndul agenilor economici din judeul Bacu realizat dup
un plan stratificat optim s-au obinut datele centralizate n tabelul 2.9.
Tabel 2.9
Informaii obinute din eantion

Mediul

Efecivul
populaiei
(nr. ageni
economici)

Eantion
(nr. ageni
economici)

nr. mediu de
salariai

Dispersia
caracteristicii
"nr. Salariai"

ponderea agenilor
economici cu CA sub 1
mld. Lei (%)

Urban

4200

320

25

8.1

36

Rural

1500

200

11

2.9

78

Total

5700

520

Se cere:
1. S se estimeze cu o probabilitate de 0,95 numrul mediu de salariai/agent
economic i att pe fiecare strat ct i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0,95 pondereaagenilor economici cu cifra de
afaceri sub 1 mld lei, pe fiecare strat i pe total jude.
Rezolvare

1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.10.


Tabel 2.10
Mediul

Ni

ni

xi

Si2 .

x i Ni

xi

xi

Linf

Lsup

Urban

4200

320

25

8.1

105000

0.153

0.300

24.700

25.300

Rural

1500

200

11

2.9

16500

0.112

0.220

10.780

11.220

Total

5700

520

121500

Estimarea numrului mediu de salariai /agent economic n mediul urban

n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul un
numr mediu de salariai/agent economic de 25 persoane. Pentru a estima venitul
mediu/persoan n mediul urban este necesar s calculm eroarea reprezentativitate i
eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N1=0,05*4200=210
Deoarece n1>0,05*N1 considerm populaia finit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator
fr revenire.
x1 =

S12 N1 n 1

= 0,153 sal/ag. economic


n 1 N1 1

x1 = z x1 = 1,96 0,153 = 0,3 sal/ag. economic


Intervalul de ncredere:
x 1 x1 < X 1 < x 1 + x1
24,7 < X1 < 25,3

Garantm cu o probabilitate de 95% c numrul mediu de salariai/ag. Economic n


mediul urban este de cel puin 24,7 i cel mult 25,3.
Estimarea numrului mediu de salariai /agent economic mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinut un
numr mediu de salariai/agent economic de 11 persoane.
Calculm ct reprezint 5% din volumul populaiei stratului 2.
0,05*N2=0,05*1500=75
Deoarece n2>0,05*N2 considerm populaia finit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator fr
revenire.
S 22
n2

N2 n2

= 0,112 sal/ag. economic


N2 1
x 2 = z x 2 = 1,96 0,112 = 0,220 sal/ag. economic
Intervalul de ncredere:
x 2 x2 < X 2 < x 2 + x2 10,78 < X 2 < 11,22
Garantm cu o probabilitate de 95% c numrul mediu de salariai/agent economic
n mediul rural este de cel puin 10,78 pers. i cel mult11,22 pers..
x2 =

Estimarea numrului mediu de salariai /agent economic pe total jude

Deoarece sondajul realizat este stratificat optim estimatorul numrului mediu de


salariai/agent economic la nivelul judeului se calculeaz astfel:
k

~
x =

xi Ni

i =1

N
i =1

121500
= 21,32 sal/ag. economic
5700

Calcului erorii de reprezentativitate:


k

~x =

N i2

N
i =1

2x i = 0,11647 sal/ag. economic

~x = z ~x = 1,96 0,11647 = 0,22829 sal/ag. economic


Intervalul de ncredere:
~
x ~x < X < ~
x + ~x 21,0875 < X < 21,54408 sal/ag. economic
Garantm cu o probabilitate de 95% c numrul mediu de salariai/agent economic
n judeul Bacu este de cel puin 21,0875 persoane i cel mult21,54408 persoane.

2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.11


Tabelul 2.11
wiNi

wi

wi

Linf

Lsup

Mediul

Ni

ni

wi

Si2

Urban

4200

320

0.36

0.2304

1512

0.026

0.051

0.309

0.411

Rural

1500

200

0.78

0.1716

1170

0.027

0.053

0.727

0.833

Total

5700

520

2682

Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei n


mediul urban

Estimatorul procentului agenilor economici cu CA mai mic de 1 mld. Lei n


mediul urban calculat pe baza datelor din eantion este de 36%. Pentru a estima procentul
acestora n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea
limit.
Deoarece populaia este considerat finit utilizm relaiile de calcul aferente
calculul sondajului simplu aleator cu revenire.
w1

S12 N1 n 1

= 0,026
=
n 1 N1 1

w1 = z w1 = 1,96 0,026 = 0,051


Intervalul de ncredere:
w 1 w1 < p1 < w 1 + w1 0,309 < p1 < 0,411
Garantm cu o probabilitate de 95% c n mediul urban cel puin 30,9% i cel mult
41,1%din agenii economici au cifra de afaceri mai mic de 1 mld. Lei.
Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei n
mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
procent agenilor economici cu CA mai mic de 1 mld. Lei de 78%.
Calculm eroarea de reprezentativitate
S 22
n2

N2 n2

= 0,027
N

1
2

w 2 = z w 2 = 1,96 0,027 = 0,053


Intervalul de ncredere:
w 2 w2 < p 2 < w 2 + w2 0,727 < p 2 < 0,833
Garantm cu o probabilitate de 95% c n mediul rural cel puin 72,7% i cel mult
83,3%din agenii economici au cifra de afaceri sub 1 mld. Lei.
w2 =

Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei pe total


jude

Deoarece sondajul realizat este stratificat optim estimatorul unei variabile calitative
la nivelul judeului se calculeaz astfel:
~=
w

ni wi

i =1

i =1

2682
=0,470526
520

Calcului erorii de reprezentativitate:


k

w~ =

N i2

N
i =1

2w i = 0,02031

w~ = z w~ = 1,96 0,02031 = 0,03981


Intervalul de ncredere:
~ ~ < p < w
~ + ~ 0,43071 < p < 0,51034
w
w
w

Garantm cu o probabilitate de 95% c cel puin 43,071% i cel mult 51,034% din
agenii economici ai judeului Bacu au cifra de afaceri mai mic de 1 mld. lei.
Problema 5

n rndul celor 1800 de studeni ai unei faculti (1100 biei i 700 fete), s-a
realizat un sondaj. n faza iniial a proiectrii sondajului s-a propus realizarea unei
stratificri utiliznd sexul drept criteriu de repartizare pe straturi. Deoarece listele utilizate
ca baz de sondaj conineau studenii n ordine alfabetic nu s-a considerat necesar
modificarea acestora i s-a recus la un sondaj simplu aleator fr revenire. n urma
prelucrrii datelor s-a obinut un numr mediu de ore pe sptmn petrecute la calculator
de 14,8 cu o dispersie de 87,11.
Tabel 2.12
Sex

Numr
studeni
n populaie

Numr
studeni
n eantion

M
F
Total

1100
700
1800

112
88
200

Numrul mediu de ore


pe sptmn
petrecute la calculator
(h/student)
17
12

Dispersia

Ponderea studenilor
care lucreaz (%)

25
16

29
19

Se cere:
1. S se estimeze pentru o probabilitate de 0,95 numrul mediu de ore pe sptmn
petrecute la calculator.
2. tiind c 25% din studenii intervievai lucreaz s se estimeze procentul acestora
n populaie cu aceeai probabilitate
3. Pentru ameliorarea estimatorilor s-a recurs la o poststratificare. Pe urma
prelucrrii informaiilor s-au obinut datele din tabelul 2.12. S se estimeze n
aceste condiii, cu aceeai probabilitate, numrul mediu de ore pe sptmn
petrecute de un student la calculator i procentul studenilor care lucreaz.
Rezolvare

1. Deoarece n (200) >0,05*1800 considerm c sondajul aleator fr revenire a fost


realizat ntr-o populaie finit. Dispersia caracteristicii cantitative vrsta n
populaiei nu este cunoscut i va fi nlocuit cu dispersia caracteristicii n
eantion.
Calculul erorii de reprezentativitate (eroare standard).

S2 N n
87,11 1800 200

= 0,62 ore
n N 1
200
1800 1

Calculul erorii limit


x = z x =1,96*0,62=1,22 ore
Intervalul de ncredere:
x x < X < x + x 13,58 < X < 16.02 ore
Se garanteaz cu o probabilitate de 95% c numrul de ore petrecute pe sptmn
de un student la calculator este de cel puin 13,58 ore i cel mult 16,02 ore.

2. Calculm erorea de reprezentativitate pentru variabila calitativ:


w (1 w ) N n
0,25(1 0,25) 1800 200
w =

= 0,028868
n
N 1
200
1800 1
Calculul erorii limit
w = z w =1,96*0,028868=0,05658
Intervalul de ncredere:
w w < p < w + w 0,19342 < p < 0,30658
Garantm cu 95% c cel puin 19,342% i cel mult 30,658% din studenilucreaz.
3. Prin proiectarea unui sondaj n care eantionarea se realizeaz ca i n cazul
sondajului simplu aleator (de obicei fr revenire) dar procedura de estimare a
parametrilor populaiei este asemntoare sondajului stratificat putem obine
estimatori a cror eroare de reprezentativitate nu este cu mult mai mare dect cea
care s-ar fi obinut printr-un sondaj stratificat. Avantajul acestei metode este
eliminarea inconvenienei sau imposibilitii gruprii elementelor pe straturi
nainte de eantionare.
Tabel 2.13
Sex

Ni

ni

xi

Si2

xi Ni

M
F
Total

1100
700
1800

112
88
200

17
12

25
16

18700
8400
27100

unde

x pstr

Nx
=
N

N i2
2

Si
N ni

Ni ni

Ni 1

Ni 2
1
Si
N

0.041495
0.010754
0.05225

9.722222
9.777778
19.5

Calculm

x pstr

i =1
k

i =1

reprezint

media

eantionului

poststratificat.
Calculele necesare sunt prezentate n tabelul 2.13.
27100
= 15,05
1800
Deoarece stratificarea se realizeaz dup efectuarea seleciei eroarea medie de
reprezentativitate se va calcula dup relaia:
x pstr =

~xpstr =

i =1

N i2 i
N2 ni

Ni n i

Ni 1

1
+ 2
n

Ni

1 N

2
i

i =1

Dac , dispersia stratului i nu se cunoate se va nlocui cu estimatorul acesteia:


2
i

Si2

1
=
ni 1

Ni

(x

ij

x i ) 2 Relaia devine:

j=1

Ni ni 1 k Ni 2
1

+ 2
~xpstr =
19,5 =0,23
1
Si = 0,05225 +
N
200 2
N i 1 n i=1
i =1
Primul termen reprezint eroarea standard ateptat n cazul unui sondaj stratificat
cu alocarea pe straturi neproporional i selecia unitilor din interiorul straturilor dup
procedeul fr revenire iar al doilea termen reprezint penalizarea datorat faptului c
stratificare s-a realizat dup selecie.

N i2 Si
N2 ni

1
reduce penalizarea cu ct volumul eantionului este mai
n2
mare. Putem spune n aceste condiii c poststratificarea duce la bune estimaii atunci cnd
volumul eantionului este mare.
Calculul erorii limit
~xpstr = z ~xpstr =1,96*0,23=1,45 ore

Observm c termenul

Intervalul de ncredere:
~
x pstr ~xpstr < X < ~
x pstr + ~xpstr 14,6 < X < 15,5 ore
Se garanteaz cu o probabilitate de 95% c numrul de ore petrecute pe sptmn
de un student la calculator este de cel puin 14,6 ore i cel mult 15,5 ore.
Calculele pentru variabila calitativ sunt prezentate n tabelul 2.14.
Tabel 2.14
Sex

Ni

ni

wi

Si2

w i Ni

M
F
Total

1100
700
1800

112
88
200

0.29
0.2

0.2059
0.16

319
140
459

Nw
=
N

N i2
2

Si
N ni

Ni ni

Ni 1

Ni 2
1
Si
N

0.000342
0.000108
0.000449

0.08007222
0.09777778
0.17785000

w pstr

i =1
k

i =1

459
=0,255
200

Deoarece stratificarea se realizeaz dup efectuarea seleciei eroarea medie de


reprezentativitate se va calcula dup relaia:
k

w~pstr =

i =1

N i2 i
N2 ni

Ni n i

Ni 1

1
+ 2
n

Ni

1 N

2
i

i =1

Dac , dispersia stratului i nu se cunoate se va nlocui cu estimatorul acesteia:


2
i

Si2 = w i (1 w i ) Relaia devine:


k

w~pstr =

i =1

N i2 Si
N2 ni

Ni n i

Ni 1

1
+ 2
n

Ni

1 N S
i =1

2
i

= 0,000449 +

1
0,17785
200 2

=0,0213
Calculul erorii limit
w~pstr = z w~pstr =1,96*0,0213=0,04175
Intervalul de ncredere:
~
~
~ pstr < X < w pstr + w
~ pstr 0,21325 < X < 0.29675
w
pstr w
Se garanteaz cu o probabilitate de 95% cel puin 21,325% i cel mult 29,675 din
studeni lucreaz.

Probleme propuse
Problema 1

n rndul elevilor claselor a XII dintr-un liceu se va realiza un sondaj stratificat


Organizatorii sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare
strat urmnd s se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din
evidena secretariatului s-a calculat, pornind de la variabila media clasei a XI, media i
dispersia pe fiecare strat. Rezultatele se gsesc n tabelul 2.15.
sex
masculin
feminin

numr elevi(pers.)
135
165

vrsta medie (ani)


8,2
8,9

Tabel 2.15
Dispersia
3,9
4,8

Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit maxim admis de 3% din valoarea notei medii a elevilor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate.
Problema 2

n rndul salariailor unei instituii cu 1010 de angajai urmeaz s se realizeze un


sondaj avnd drept obiectiv principal caracterizarea mediului de lucru. Deoarece se
urmrete evidenierea caracteristicilor fiecrui departament se va utiliza un plan de sondaj
stratificat. Informaiile necesare aplicrii planului de sondaj au fost preluate de la
compartimentul resurselor umane i sunt prezentate n tabelul 2.16.
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit de 3%.
2. Deoarece realizarea sondajului pentru volumul calculat la punctul 1 necesit
cheltuieli prea mari s-a propus reducerea acestuia cu 20%. Care va fi eroarea
limit ce va trebui acceptat n aceast situaie?
3. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul
eantionului calculat la punctul 2.
4. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
Departament
I
II
III
IV
V
VI
Total

Numr salariai (pers)


80
190
110
150
260
220
1010

Tabel 2.16
Ponderea salariailor cu studii superioare (%)
92
63
75
86
15
19

Problema 3

n urma unui sondaj n rndul agenilor economici din judeul Bacu, realizat dup
un plan stratificat proporional, utiliznd drept criteriu de stratificare forma de proprietate, sau obinut datele centralizate n tabelul 2.17.
Tabel 2.17
Informaii obinute din eantion
Forma de
proprietate

Numr ageni economici Numr ageni economici


n populaie
n eantion

CA medie
(mld. lei)

Dispersia
CA.

public

150

37

124

108

privat

459

113

56

26

mixt

201

50

75

31

Se cere:
1. S se estimeze cu o probabilitate de 0,9545 cifra medie de afaceri /agent
economic att pe fiecare strat ct i la nivelul ntregului jude.
2. Ce volum de eantion ar fi fost necesar pentru a estima cifra medie de afaceri n
aceleai condiii de eroare i probabilitate dac s-ar realiza un sondaj simplu
aleator fr revenire.
Problema 4

ntr-o localitate cu 109000 locuitori cu vrsta de 18 ani si peste s-a realizat un


sondaj. Metoda de culegere a datelor a fost interviul prin telefon. Deoarece nu se putea
cunoate sexul persoanei chestionatee dect n momentul desfurrii interviului nu s-a
putut realiza o stratificare pe acest criteriu. Pentu mbuntairea estimaiilor s-a recurs la o
poststratificare. Datele centralizate sunt prezentate n tabelul 2.18
Se cere:
1. S se estimeze pentru o probabilitate de 0,95 numrul mediu de ore pe zi
petrecute la televizor procentul celor care desfoar o activitate secundar
tiind c strucura populaiei de 18 ani i peste pe sexe este:53% feminin i 47%
masculin.
Tabel 2.18
Sex

Numr
persoane
n eantion

M
F
Total

202
248
450

Numrul mediu de ore


pe zi
petrecute la televizor
(h/pers.)
2,3
1,9

Dispersia

Ponderea celor care


desfoar o activitate
secundar(%)

0,19
0,22

23
12

S-ar putea să vă placă și