Documente Academic
Documente Profesional
Documente Cultură
i =1
i =1
Ni = N
n i = n unde k
Probleme rezolvate
Problema 1
Tabel 2.2
Dispersia
36,4
45,8
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit maxim admis de 3% din valoarea vrstei medii tuturor angajailor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate.
Rezolvare
X =
i =1
Xi N i
N
i =1
39915
= 44.35 ani
900
Tabelul 2.1
Selecia din interiorul straturilor s-a realizat cu revenire
Sondaj stratificat
simplu
(neproporional)
x~ =
N i2 i 2
2
ni
i =1 N
x~ =
N i2 S i 2
2
i =1 N ni 1
k
N i2
i =1 N
2
2 xi
w =
N i2 pi (1 pi )
2
ni
i =1 N
w =
N i2
i =1 N
ni2 i 2
=
2
i =1 n ni
x~ =
N i2 wi (1 wi )
2
ni 1
i =1 N
k
2w i
x~ =
Sondaj stratificat
proporional
Sondaj stratificat
optim
ni2 S i 2
2
i =1 n ni
k
ni2
i =1 n
ni2 w i (1 w i )
=
2
ni 1
i =1 n
w =
ni2 2
w i
2
i =1 n
x~ =
N i2 i 2 N i ni
2
ni N i 1
i =1 N
x~ =
N i2
i =1 N
N i2 S i 2 N i ni
i =1 N ni 1 N i 1
k
N i2 pi (1 pi ) N i ni
2
ni
Ni 1
i =1 N
w =
~x =
N i2
i =1 N
ni2 i 2 N i ni
i =1 n ni N i 1
k
2
n
w =
ni2 w i (1 wi ) N i ni
=
2
ni
Ni 1
i =1 n
w =
ni2
i =1 n
N i2 wi (1 wi ) N i ni
2
ni 1
Ni 1
i =1 N
k
2w i
2x i
ni2 i 2 N i ni
i =1 n ni N i 1
w2
n
w =
2
2 xi
w =
2w i
N ni
i
Ni 1
2p N n
n N 1
ni2 S i 2 N i ni
i =1 n ni N i 1
k
Tabel 2.3
sex
M
F
Total
Xi
Ni
(pers.)
(ani)
535
365
48
39
ni
i2
N i Xi
N i 2i sondaj
Ni i
36.4
45.8
25680
14235
39915
19474
16717
36191
3227.784
2470.163
5697.947
proporional
48
32
ni
sondaj
optim
(X
45
35
33813.34
767.4125
34580.75
X Ni
2 =
(X
j=1
X)
2 =
N
i =1
k
2
i
Ni
i=1
2 =
(X
X) 2 N i
i =1
i =1
N
2
i
i =1
k
36191
= 40.21
900
i =1
n acest caz nu sunt necesare informaii detaliate. Din fiecare strat se extrage un
numr de uniti pentru a forma eantionul fr a ine cont de greutatea specific a fiecruia
n totalul populaiei.
n 80
ni = =
= 40 pesroane
k 2
Calculul volummului eantionului pe fiecare strat n cazul sondajului
proporional
Acest tip de sondaj se recomand n cazul n care exist diferene mari ntre
volumele subpopulaiilor straturilor deoarece structura pe straturi n populaia total se
respect i se regsete i n structura eantionulu
Prin definiie se numete un sondaj stratificat proporional cel pentru care este
ndeplinit condiia:
k
n1
n
n
n
= 2 = .... i .... = k =
N1 N 2
Ni
Nk
i =1
k
n
N
i =1
n
Ni
N
unde i=1,2,,k.
80
n1 =
535 48 persoane
900
80
n2 =
365 32 persoane
900
Calculul volummului eantionului pe fiecare strat n cazul sondajului optim
n1
n2
ni
nk
=
= ... =
= .... =
=
N 1 1 N 2 2
N i i
Nk k
i =1
N
i =1
N
i
i =1
3227,784
80 45 persoane
5697.947
2470,163
n2 =
80 35 persoane
5697.947
n1 =
2. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat
variaia de care trebuie inut cont n momentul calculrii volumului eantionului
este variaia total a caracteristicii. Deoarece nu se cunosc valorile individuale ale
variabilei vrsta pentru toate cele N uniti din populaie nu putem calcula
2
(X
X) 2 N
j=1
2 =
(X
X) 2 N i
i =1
34580,75
= 38,42
900
i =1
1.96 2 78.63
144 persoane
z 2 2
1.96 2 78.63
2
2
x +
1.33 +
N
900
Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de
un sondaj simplu aleator fr revenire de la 144 persoane la 80 persoane.
n SAFR =
Problema 2
Tabel 2.4
Ponderea studenilor fr restane (%)
20
63
45
86
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit de 3%.
2. Deoarece realizarea sondajului pentru volumul calculat la punctul 1 necesit
cheltuieli prea mari s-a propus reducerea acestuia cu 10%. Care va fi eroarea
limit ce va trebui acceptat n aceast situaie?
3. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul
eantionului calculat la punctul 2.
4. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
Rezolvare
Tabel 2.5
Anul
de studii
Ni
pi
2pi
N i 2pi
An I
600
0.2
0.16
96
ni
sondaj
proporional
149
An II
575
0.63
0.2331
134.0325
An III
500
0.45
0.2475
An IV
450
0.86
0.1204
Total
2125
240
ni
sondaj
optim
137
143
277.6125
159
362.25
123.75
124
248.7469
142
225
54.18
112
156.1442
90
387
407.9625
N i pi
922.5035
piNi
120
1094.25
p
2w +
N
k
p2 =
2
p i Ni
i =1
407.9625
= 0.19 unde dispersiile straturilor sunt p2 i = p i (1 p i )
2125
i =1
n=
1.96 2 0.19
587 persoane
1.96 2 0.19
2
0.03 +
2125
2. Dac volumul eantionului se reduce cu 10% atunci noul volum va fi
n = 0.9 n = 0.9 587 528 persoane.
p2 n
p2 N n
1 = 0.0324
n N 1
n N
Dac se reduce volumul eantionului cu 10% eroarea limit, corespunztoare unei
probabiliti de garantare a rezultatelor de 95%, este de 3.24%.
w = z
ni =
n 528
=
65 pesroane
k
4
Pornim de la relaia:
n1
n2
ni
nk
=
= ... =
= .... =
=
N1 p1 N 2 p 2
N i pi
N k pk
n
k
N
i =1
ni =
N i pi
n.
N
i
pi
i =1
240
528 137 persoane
922.5
277.6
528 159 persoane
n2 =
922.5
248.7
528 159 persoane
n3 =
922.5
156
528 159 persoane
n4 =
922.5
n1 =
pi
pN
p=
N
k
i =1 i
k
1094.25
=0.5149 2p = 0.5149 (1 0.5149) = 0.2498
2125
i =1
z 2 2
1.96 2 0.2498
639 persoane
2
2
2
1.96
0
.
2498
z
2
p
0.0324 +
2w +
2125
N
Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta
rezultatele cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o
cretere a volumului eantionului cu 111 persoane.
n SAFR =
Problema 3
Efecivul
populaiei (mii
pers.)
Eantion
(pers.)
Venitul
mediu/pers
(mil. lei)
Dispersia
venitului
mediu/pers.
Urban
340
511
3.8
4.5
72
Rural
325
489
2.1
1.9
18
Total
665
1000
Se cere:
1. S se estimeze cu o probabilitate de 0.9545 venitul mediu/pers att pe fiecare
strat ct i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum
sptmnal buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.
Rezolvare
Ni
(mii pers.)
ni
(pers.)
x i mil lei
Si2
x i ni
xi
xi
Linf
Lsup
Urban
340
511
3.8
4.5
1941.8
0.094
0.188
3.612
3.988
Rural
325
489
2.1
1.9
1026.9
0.062
0.125
1.975
2.225
Total
665
1000
2968.7
n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul
venitul mediu/persoan. Acesta este de 3,8 mil. Lei. Pentru a estima venitul mediu/persoan
n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N1=0,05*340000=17000
Deoarece n1<0,05*N1 considerm populaia infinit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu
revenire.
S12
4,5
=
= 0.094 mil. Lei
n1
511
x1 =
S12
= 2 0.094 = 0.188 mil. Lei
n1
Intervalul de ncredere:
x 1 x1 < X1 < x 1 + x1 3.8 0.188 < X1 < 3.8 + 0.188 3.612 < X1 < 3.988
Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n mediul urban
este de cel puin 3.612 mil. Lei i cel mult 3.988 mil. Lei.
x1 = z
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
venit mediu/persoan. de 2.1 mil. Lei. Pentru a estima venitul mediu/persoan n mediul
urban este necesar s calculm eroarea reprezentativitate i eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 2.
0.05*N2=0.05*325000=16250
Deoarece n2<0.05*N2 considerm populaia infinit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu
revenire.
S 22
=
n2
x2 =
1.9
= 0.062 mil. Lei
489
S 22
= 2 0.062 = 0.125 mil. Lei
n2
Intervalul de ncredere:
x 2 x2 < X 2 < x 2 + x2 2.1 0.125 < X 2 < 2.1 + 0.125 1.975 < X 2 < 2.225
Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este
de cel puin 1.975mil. Lei i cel mult 2.225 mil. Lei.
x2 = z
x
i =1
ni
n
i =1
2968,7
= 2.9687 mil. lei
1000
~x =
n i2
n
i =1
Ni
(mii pers.)
ni
(pers.)
wi
Si2
wini
wi
wi
Linf
Lsup
Urban
340
511
0.72
0.2016
367.92
0.020
0.040
0.680
0.760
Rural
325
489
0.18
0.1476
88.02
0.017
0.035
0.145
0.215
Total
665
1000
455.94
S12
=
=
n1
0.2016
= 0.020
511
S12
w1 = z
= 2 0.020 = 0.040
n1
Intervalul de ncredere:
w 1 w1 < p1 < w 1 + w1 0.72 0.040 < p1 < 0.72 + 0.040 0.680 < p1 < 0.76
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult
76% consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi
rcoritoare:
N 1 (w 1 w1 ) < N 1 p1 < N 1 (w 1 + w1 ) N 1 (0.72 0.040 ) < M 1 < N 1 (0.72 + 0.040 )
231293 < M 1 < 258307
Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293
persoane i cel mult 258307 persoane consum sptmnal buturi rcoritoare.
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
procent de 18% al celor care consum sptmnal buturi rcoritoare.
Calculm eroarea de reprezentativitate
w2 =
S 22
=
n2
0.1476
= 0.017
489
S 22
= 2 0.017 = 0.035
n2
Intervalul de ncredere:
w 2 w2 < p 2 < w 2 + w2 0.18 0.035 < p 2 < 0.18 + 0.035 0.145 < p 2 < 0.215
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel
mult 21.5% consum sptmnal buturi rcoritoare.
Intervalul de ncredere pentru numrul celor care consum sptmnal buturi
rcoritoare:
N 2 (w 2 w2 ) < N 2 p 2 < N 2 (w 2 + w2 ) 47207 < M 2 < 69793
Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane
i cel mult 69793 persoane consum sptmnal buturi rcoritoare.
w2 = z
n w n
i
i =1
i =1
455,94
= 0.45594
1000
w~ =
n i2
n
i =1
2w i = 0,013236
Problema 4
n urma unui sondaj n rndul agenilor economici din judeul Bacu realizat dup
un plan stratificat optim s-au obinut datele centralizate n tabelul 2.9.
Tabel 2.9
Informaii obinute din eantion
Mediul
Efecivul
populaiei
(nr. ageni
economici)
Eantion
(nr. ageni
economici)
nr. mediu de
salariai
Dispersia
caracteristicii
"nr. Salariai"
ponderea agenilor
economici cu CA sub 1
mld. Lei (%)
Urban
4200
320
25
8.1
36
Rural
1500
200
11
2.9
78
Total
5700
520
Se cere:
1. S se estimeze cu o probabilitate de 0,95 numrul mediu de salariai/agent
economic i att pe fiecare strat ct i la nivelul ntregului jude.
2. S se estimeze cu o probabilitate de 0,95 pondereaagenilor economici cu cifra de
afaceri sub 1 mld lei, pe fiecare strat i pe total jude.
Rezolvare
Ni
ni
xi
Si2 .
x i Ni
xi
xi
Linf
Lsup
Urban
4200
320
25
8.1
105000
0.153
0.300
24.700
25.300
Rural
1500
200
11
2.9
16500
0.112
0.220
10.780
11.220
Total
5700
520
121500
n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul un
numr mediu de salariai/agent economic de 25 persoane. Pentru a estima venitul
mediu/persoan n mediul urban este necesar s calculm eroarea reprezentativitate i
eroarea limit.
Calculm ct reprezint 5% din volumul populaiei stratului 1.
0,05*N1=0,05*4200=210
Deoarece n1>0,05*N1 considerm populaia finit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator
fr revenire.
x1 =
S12 N1 n 1
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinut un
numr mediu de salariai/agent economic de 11 persoane.
Calculm ct reprezint 5% din volumul populaiei stratului 2.
0,05*N2=0,05*1500=75
Deoarece n2>0,05*N2 considerm populaia finit iar relaiile de calcul folosite
pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator fr
revenire.
S 22
n2
N2 n2
~
x =
xi Ni
i =1
N
i =1
121500
= 21,32 sal/ag. economic
5700
~x =
N i2
N
i =1
wi
wi
Linf
Lsup
Mediul
Ni
ni
wi
Si2
Urban
4200
320
0.36
0.2304
1512
0.026
0.051
0.309
0.411
Rural
1500
200
0.78
0.1716
1170
0.027
0.053
0.727
0.833
Total
5700
520
2682
S12 N1 n 1
= 0,026
=
n 1 N1 1
n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un
procent agenilor economici cu CA mai mic de 1 mld. Lei de 78%.
Calculm eroarea de reprezentativitate
S 22
n2
N2 n2
= 0,027
N
1
2
Deoarece sondajul realizat este stratificat optim estimatorul unei variabile calitative
la nivelul judeului se calculeaz astfel:
~=
w
ni wi
i =1
i =1
2682
=0,470526
520
w~ =
N i2
N
i =1
2w i = 0,02031
Garantm cu o probabilitate de 95% c cel puin 43,071% i cel mult 51,034% din
agenii economici ai judeului Bacu au cifra de afaceri mai mic de 1 mld. lei.
Problema 5
n rndul celor 1800 de studeni ai unei faculti (1100 biei i 700 fete), s-a
realizat un sondaj. n faza iniial a proiectrii sondajului s-a propus realizarea unei
stratificri utiliznd sexul drept criteriu de repartizare pe straturi. Deoarece listele utilizate
ca baz de sondaj conineau studenii n ordine alfabetic nu s-a considerat necesar
modificarea acestora i s-a recus la un sondaj simplu aleator fr revenire. n urma
prelucrrii datelor s-a obinut un numr mediu de ore pe sptmn petrecute la calculator
de 14,8 cu o dispersie de 87,11.
Tabel 2.12
Sex
Numr
studeni
n populaie
Numr
studeni
n eantion
M
F
Total
1100
700
1800
112
88
200
Dispersia
Ponderea studenilor
care lucreaz (%)
25
16
29
19
Se cere:
1. S se estimeze pentru o probabilitate de 0,95 numrul mediu de ore pe sptmn
petrecute la calculator.
2. tiind c 25% din studenii intervievai lucreaz s se estimeze procentul acestora
n populaie cu aceeai probabilitate
3. Pentru ameliorarea estimatorilor s-a recurs la o poststratificare. Pe urma
prelucrrii informaiilor s-au obinut datele din tabelul 2.12. S se estimeze n
aceste condiii, cu aceeai probabilitate, numrul mediu de ore pe sptmn
petrecute de un student la calculator i procentul studenilor care lucreaz.
Rezolvare
S2 N n
87,11 1800 200
= 0,62 ore
n N 1
200
1800 1
= 0,028868
n
N 1
200
1800 1
Calculul erorii limit
w = z w =1,96*0,028868=0,05658
Intervalul de ncredere:
w w < p < w + w 0,19342 < p < 0,30658
Garantm cu 95% c cel puin 19,342% i cel mult 30,658% din studenilucreaz.
3. Prin proiectarea unui sondaj n care eantionarea se realizeaz ca i n cazul
sondajului simplu aleator (de obicei fr revenire) dar procedura de estimare a
parametrilor populaiei este asemntoare sondajului stratificat putem obine
estimatori a cror eroare de reprezentativitate nu este cu mult mai mare dect cea
care s-ar fi obinut printr-un sondaj stratificat. Avantajul acestei metode este
eliminarea inconvenienei sau imposibilitii gruprii elementelor pe straturi
nainte de eantionare.
Tabel 2.13
Sex
Ni
ni
xi
Si2
xi Ni
M
F
Total
1100
700
1800
112
88
200
17
12
25
16
18700
8400
27100
unde
x pstr
Nx
=
N
N i2
2
Si
N ni
Ni ni
Ni 1
Ni 2
1
Si
N
0.041495
0.010754
0.05225
9.722222
9.777778
19.5
Calculm
x pstr
i =1
k
i =1
reprezint
media
eantionului
poststratificat.
Calculele necesare sunt prezentate n tabelul 2.13.
27100
= 15,05
1800
Deoarece stratificarea se realizeaz dup efectuarea seleciei eroarea medie de
reprezentativitate se va calcula dup relaia:
x pstr =
~xpstr =
i =1
N i2 i
N2 ni
Ni n i
Ni 1
1
+ 2
n
Ni
1 N
2
i
i =1
Si2
1
=
ni 1
Ni
(x
ij
x i ) 2 Relaia devine:
j=1
Ni ni 1 k Ni 2
1
+ 2
~xpstr =
19,5 =0,23
1
Si = 0,05225 +
N
200 2
N i 1 n i=1
i =1
Primul termen reprezint eroarea standard ateptat n cazul unui sondaj stratificat
cu alocarea pe straturi neproporional i selecia unitilor din interiorul straturilor dup
procedeul fr revenire iar al doilea termen reprezint penalizarea datorat faptului c
stratificare s-a realizat dup selecie.
N i2 Si
N2 ni
1
reduce penalizarea cu ct volumul eantionului este mai
n2
mare. Putem spune n aceste condiii c poststratificarea duce la bune estimaii atunci cnd
volumul eantionului este mare.
Calculul erorii limit
~xpstr = z ~xpstr =1,96*0,23=1,45 ore
Observm c termenul
Intervalul de ncredere:
~
x pstr ~xpstr < X < ~
x pstr + ~xpstr 14,6 < X < 15,5 ore
Se garanteaz cu o probabilitate de 95% c numrul de ore petrecute pe sptmn
de un student la calculator este de cel puin 14,6 ore i cel mult 15,5 ore.
Calculele pentru variabila calitativ sunt prezentate n tabelul 2.14.
Tabel 2.14
Sex
Ni
ni
wi
Si2
w i Ni
M
F
Total
1100
700
1800
112
88
200
0.29
0.2
0.2059
0.16
319
140
459
Nw
=
N
N i2
2
Si
N ni
Ni ni
Ni 1
Ni 2
1
Si
N
0.000342
0.000108
0.000449
0.08007222
0.09777778
0.17785000
w pstr
i =1
k
i =1
459
=0,255
200
w~pstr =
i =1
N i2 i
N2 ni
Ni n i
Ni 1
1
+ 2
n
Ni
1 N
2
i
i =1
w~pstr =
i =1
N i2 Si
N2 ni
Ni n i
Ni 1
1
+ 2
n
Ni
1 N S
i =1
2
i
= 0,000449 +
1
0,17785
200 2
=0,0213
Calculul erorii limit
w~pstr = z w~pstr =1,96*0,0213=0,04175
Intervalul de ncredere:
~
~
~ pstr < X < w pstr + w
~ pstr 0,21325 < X < 0.29675
w
pstr w
Se garanteaz cu o probabilitate de 95% cel puin 21,325% i cel mult 29,675 din
studeni lucreaz.
Probleme propuse
Problema 1
numr elevi(pers.)
135
165
Tabel 2.15
Dispersia
3,9
4,8
Se cere:
1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare
limit maxim admis de 3% din valoarea notei medii a elevilor.
2. S se calculeze volumul eantioanelor pe fiecare strat.
3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar
fi necesar n aceleai condiii de eroare i probabilitate.
Problema 2
Tabel 2.16
Ponderea salariailor cu studii superioare (%)
92
63
75
86
15
19
Problema 3
n urma unui sondaj n rndul agenilor economici din judeul Bacu, realizat dup
un plan stratificat proporional, utiliznd drept criteriu de stratificare forma de proprietate, sau obinut datele centralizate n tabelul 2.17.
Tabel 2.17
Informaii obinute din eantion
Forma de
proprietate
CA medie
(mld. lei)
Dispersia
CA.
public
150
37
124
108
privat
459
113
56
26
mixt
201
50
75
31
Se cere:
1. S se estimeze cu o probabilitate de 0,9545 cifra medie de afaceri /agent
economic att pe fiecare strat ct i la nivelul ntregului jude.
2. Ce volum de eantion ar fi fost necesar pentru a estima cifra medie de afaceri n
aceleai condiii de eroare i probabilitate dac s-ar realiza un sondaj simplu
aleator fr revenire.
Problema 4
Numr
persoane
n eantion
M
F
Total
202
248
450
Dispersia
0,19
0,22
23
12