Sunteți pe pagina 1din 19

Sondajul stratificat

Sumarul relaiilor de calcul necesare calculului erorilor de reprezentativitate utilizate n cazul sondajului stratificat sunt sistematizate n tabelul 2.1. Notaii utilizate: N1, N2,.. Nk, reprezint volumul straturilor n populaia total i n1, n2,.. nk, reprezint volumul straturilor n eantion i reprezint numrul straturilor.

k i =1

i =1

Ni = N

n i = n unde k

Probleme rezolvate
Problema 1

n rndul salariailor unei ntreprinderi se va realiza un sondaj stratificat . Organizatorii sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare strat urmnd s se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din evidena personalului s-a calculat, pornind de la variabila vrsta n ani mplinii media i dispersia pe fiecare strat. Rezultatele se gsesc n tabelul 2.2:
sex masculin feminin numr salariai (pers.) 535 365 vrsta medie (ani) 48 39 Tabel 2.2 Dispersia 36,4 45,8

Se cere: 1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit maxim admis de 3% din valoarea vrstei medii tuturor angajailor. 2. S se calculeze volumul eantioanelor pe fiecare strat. 3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi necesar n aceleai condiii de eroare i probabilitate.
Rezolvare

Calculele necesare sunt sistematizate n tabelul 2.3. 1. Vrsta medie a celor 900 de salariai se calculeaz ca medie aritmetic ponderata a vrstei medii a salariailor din cele dou straturi dup relaia:

X =

i =1

Xi N i

N
i =1

39915 = 44.35 ani 900

Eroarea limit propus este: x = 0.03 X = 0.02 42 = 1.33 ani

Tabelul 2.1 Selecia din interiorul straturilor s-a realizat cu revenire


~ = x

Selecia din interiorul straturilor s-a realizat fr revenire


~ = x

N i2 i 2 2 ni i =1 N
k

N i2 S i 2 2 i =1 N ni 1
k

N i2 i 2 N i ni 2 ni i =1 N Ni 1
k k i =1 N

N i2 S i 2 N i ni 2 i =1 N ni 1 N i 1
k

Sondaj stratificat simplu (neproporional)

~ = x

i =1 N

N i2

2 2 xi

~ = x

N i2
2

2 xi

w =
w =
~ = x

N i2 pi (1 pi ) 2 ni i =1 N
k i =1 N

N i2 wi (1 wi ) 2 ni 1 i =1 N
k

w =
w =

N i2 pi (1 pi ) N i ni 2 ni Ni 1 i =1 N
k i =1 N

N i2 wi (1 wi ) N i ni 2 ni 1 Ni 1 i =1 N
k

N i2
2

2 wi
2 n ni2 S i 2 2 i =1 n ni
k

N i2
2

2 wi
= 2 n N i ni N 1 i ni2 S i 2 N i ni 2 i =1 n ni N i 1
k

ni2 i 2 = 2 i =1 n ni
k i =1 n
k

~ x =

ni2 i 2 N i ni 2 i =1 n ni N i 1

~ = x

ni2

Sondaj stratificat proporional


w =

2 2 xi
2 w n

ni2 i 2 N i ni 2 i =1 n ni N i 1
w =
k
k

ni2 w i (1 w i ) = 2 ni 1 i =1 n
k

ni2 w i (1 wi ) N i ni = 2 ni Ni 1 i =1 n

2 p N n n N 1

w =
Sondaj stratificat optim

ni2 2 w i 2 i =1 n

w =

i =1 n

ni2
2

2 wi

Aceleai relaii de calcul ca i n cazul sondajului neproporional

Tabel 2.3 sex Ni (pers.)

Xi
(ani)

i2
36.4 45.8

N i Xi
25680 14235 39915

Ni2 sondaj i
19474 16717 36191 48 32

ni

proporional

Ni i
3227.784 2470.163 5697.947

ni sondaj optim

(X

X Ni

M F Total

535 365

48 39

45 35

33813.34 767.4125 34580.75

Variaia total a populaiei dup o anumit caracteristic (msurat de dispersia 2 ) este compus din variaia din interiorul straturilor (msurat de dispersia 2 ) i variaia dintre straturi (msurat de dispersia 2 ). Cele trei dispersii se calculeaz dup relaiile:

2 =

(X
j=1

X)

2 =

N
i =1 k 2 i

Ni
i=1

2 =

(X
i =1

i k

X) 2 N i
i

N
i =1

Conform regulii de adunare a dispersiilor ntre aceste tipuri de variaie exist urmtoarea relaie: 2 = 2 + 2 . Dac n cazul sondajului simplu aleator mrimea eantionului este direct proporional cu dispersia total a variabilei, n cazul sondajului stratificat acesta va fi influenat doar de o parte a acestei variaii. Deoarece ntotdeauna 2 < 2 n cazul stratificrii va fi necesar un volum de eantion mai mic, estimaia realizndu-se n aceleai condiii de precizie i probabilitate. Variaia din interiorul straturilor calculat ca medie a dispersiilor straturilo reste:
2

N
2 i i =1 k

N
i =1

36191 = 40.21 900

Volumul eationului n cazul sondajului stratificat se calculeaz dup relaia: z2 2 1.96 2 40.21 n= = = 79.6 80 pers. z2 2 1.96 2 40.21 2 2 1.33 + x + 900 N 2. Repartizarea eantionului pe straturi se poate realiza n trei moduri i anume: o neproporional obinndu-se un sondaj stratificat neproporional sau simplu; o proporional respectndu-se ponderea fiecrui strat n total populaie obinnduse un sondaj stratificat proporional; o innd cont att de proporia fiecrui strat n total, ct si de gradul de variaie al fiecrui strat, obinndu-se un sondaj stratificat optim.

Calculul volummului eantionului pe fiecare strat n cazul sondajului neproporional

n acest caz nu sunt necesare informaii detaliate. Din fiecare strat se extrage un numr de uniti pentru a forma eantionul fr a ine cont de greutatea specific a fiecruia n totalul populaiei. n 80 ni = = = 40 pesroane k 2
Calculul volummului eantionului pe fiecare strat n cazul sondajului proporional

Acest tip de sondaj se recomand n cazul n care exist diferene mari ntre volumele subpopulaiilor straturilor deoarece structura pe straturi n populaia total se respect i se regsete i n structura eantionulu Prin definiie se numete un sondaj stratificat proporional cel pentru care este ndeplinit condiia: n1 n n n = 2 = .... i .... = k = N1 N 2 Ni Nk

n
i =1 k i =1

=
i

n N n Ni N

Din aceasta deducem relaia de calcul pentru eantionul fiecrui strat: n i = unde i=1,2,,k. 80 n1 = 535 48 persoane 900 80 n2 = 365 32 persoane 900

Calculul volummului eantionului pe fiecare strat n cazul sondajului optim

n cazul n care exist diferene mari n ceea ce privete gradul de variaie al straturilor se recomand utilizarea sondajului stratificat optimdeoarece stabilirea subeantioanelor se face innd cont att de proporia pe care o ocup stratul n populaia total ct i de abaterea medie ptratic, indicator ce exprim variaia caracteristicii n interiorul stratului. Pentru determinarea numrului de uniti ce se vor extrage din fiecare strat se utilizeaz relaia: n1 n2 ni nk = = ... = = .... = = N 1 1 N 2 2 N i i Nk k

n
i =1

N
i =1

Pe baza acesteia deducem relaia de calcul pentru subeantionul ce urmeaz a fi N extras din fiecare strat n i = k i i n .

N
i i =1

3227,784 80 45 persoane 5697.947 2470,163 n2 = 80 35 persoane 5697.947 n1 = 2. Dac sondajul organizat s-ar desfura dup un plan simplu aleator nerepetat variaia de care trebuie inut cont n momentul calculrii volumului eantionului este variaia total a caracteristicii. Deoarece nu se cunosc valorile individuale ale variabilei vrsta pentru toate cele N uniti din populaie nu putem calcula variaia total dup relaia: =
2 2 2

(X
j=1

X) 2 N

Deoarece = + vom calcula variaia total ca sum variaiilor inter i intra straturi. 2 =

(X
i =1

i k

X) 2 N i =
i

N
i =1

34580,75 = 38,42 900

2 = 40,21 + 38,42 = 78,63


1.96 2 78.63 144 persoane z 2 2 1.96 2 78.63 2 2 x + 1.33 + N 900 Prin aplicarea unui plan de sondaj stratificat s-a redus volumul eantionului fat de un sondaj simplu aleator fr revenire de la 144 persoane la 80 persoane. n SAFR = z 2 2

Problema 2

n rndul studenilor facultii REI urmeaz s se realizeze un sondaj avnd drept obiectiv principal analiza calitii procesului de nvmnt. Deoarece se urmrete evidenbierea caracteristicilor fiecrui an de studi se e va utiliza un plan de sondaj stratificat. Informaiile necesare aplicrii planului de sondaj au fost preluate de la secretariatul facultii i sunt prezentate n tabelul 2.4.
Anul de studii An I An II An III An IV Total Numr studeni (pers) 600 575 500 450 2125 Tabel 2.4 Ponderea studenilor fr restane (%) 20 63 45 86

Se cere: 1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%. 2. Deoarece realizarea sondajului pentru volumul calculat la punctul 1 necesit cheltuieli prea mari s-a propus reducerea acestuia cu 10%. Care va fi eroarea limit ce va trebui acceptat n aceast situaie? 3. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul eantionului calculat la punctul 2. 4. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
Rezolvare
Tabel 2.5 Anul de studii Ni pi ni sondaj proporional 149 ni sondaj optim 137

2 pi
0.16 0.2331 0.2475 0.1204

Ni2 pi
96 134.0325 123.75 54.18 407.9625

N i pi
240 277.6125 248.7469 156.1442 922.5035

piNi

An I An II An III An IV Total

600 575 500 450 2125

0.2 0.63 0.45 0.86

120 362.25 225 387 1094.25

143 124 112

159 142 90

Calculele necesare sunt prezentate n tabelul 2.5 1. Relaia de calcul a volumului eantionului n cazul aplicrii unei plan de sondaj 2 z 2 p . stratificat i utiliznd o variabil calitativ este: n = 2 2 z p 2w + N
2 p =

i =1 k i =1

2 p i Ni

=
i

407.9625 2 = 0.19 unde dispersiile straturilor sunt p i = p i (1 p i ) 2125

n=

1.96 2 0.19 587 persoane 1.96 2 0.19 2 0.03 + 2125 2. Dac volumul eantionului se reduce cu 10% atunci noul volum va fi n = 0.9 n = 0.9 587 528 persoane.

2 2 p p N n n z 1 = 0.0324 n N 1 n N Dac se reduce volumul eantionului cu 10% eroarea limit, corespunztoare unei probabiliti de garantare a rezultatelor de 95%, este de 3.24%.

w = z

Calculul volummului eantionului pe fiecare strat n cazul sondajului neproporional

ni =

n 528 = 65 pesroane k 4

Calculul volummului eantionului pe fiecare strat n cazul sondajului proporional

Pornim de la condiia ce trebuie satisfcut n cazul sondajului stratificat proporional: n1 n n n n n = 2 = .... i .... = k = n i = N i unde i=1,2,,k. N1 N 2 Ni Nk N N 258 600 149 persoane n1 = 2125 258 575 143 persoane n2 = 2125 258 500 124persoane n3 = 2125 258 450 112 persoane n4 = 2125
Calculul volummului eantionului pe fiecare strat n cazul sondajului optim

Pornim de la relaia:

n1 n2 ni nk = = ... = = .... = = N1 p1 N 2 p 2 N i pi N k pk

N
i =1

pi

ni =

N i pi

N
i i =1

n.
pi

240 528 137 persoane 922.5 277.6 528 159 persoane n2 = 922.5 248.7 528 159 persoane n3 = 922.5 156 528 159 persoane n4 = 922.5 n1 =

3. Variaia total a caracteristicii calitative este dat de relaia: 2 p = p (1 p ) unde p reprezint media caracteristicii calitative ce se calculeaz astfel:

pN p= N
k i =1 i k i =1 i

1094.25 =0.5149 2 p = 0.5149 (1 0.5149) = 0.2498 2125 =

1.96 2 0.2498 639 persoane 2 2 2 1.96 0 . 2498 z 2 p 0.0324 + 2 w + 2125 N Dac s-ar utiliza un plan de sondaj simplu aleator fr revenire , pentru a garanta rezultatele cu aceeai probabilitate de 95% cu o eriare limit de 3.24% ar fi necesar o cretere a volumului eantionului cu 111 persoane. n SAFR =
Problema 3

z 2 2

n urma unui sondaj stratificat proporional dup mediul de reziden realizat n judeul Bacu de ctre o societate de produce buturi rcoritoares-au obinut datele centralizate n tabelul 2.6.
Tabel 2.6 Informaii obinute din eantion Mediul Efecivul populaiei (mii pers.) Eantion (pers.) Venitul mediu/pers (mil. lei) Dispersia venitului mediu/pers. Ponderea celor care consum sptmnal buturi rcoritoare (%)

Urban Rural Total

340 325 665

511 489 1000

3.8 2.1

4.5 1.9

72 18

Se cere: 1. S se estimeze cu o probabilitate de 0.9545 venitul mediu/pers att pe fiecare strat ct i la nivelul ntregului jude. 2. S se estimeze cu o probabilitate de 0.9545 ponderea celor care consum sptmnal buturi rcoritoate i numrul lor, pe fiecare strat i pe total jude.
Rezolvare

1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.7.


Tabel 2.7 Mediul Ni (mii pers.) ni (pers.)

x i mil lei
3.8 2.1

Si2
4.5 1.9

x i ni
1941.8 1026.9 2968.7

xi
0.094 0.062

xi
0.188 0.125

Linf

Lsup

Urban Rural Total

340 325 665

511 489 1000

3.612 1.975

3.988 2.225

Estimarea venitului mediu/persoan n mediul urban

n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul venitul mediu/persoan. Acesta este de 3,8 mil. Lei. Pentru a estima venitul mediu/persoan n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit. Calculm ct reprezint 5% din volumul populaiei stratului 1. 0,05*N1=0,05*340000=17000 Deoarece n1<0,05*N1 considerm populaia infinit iar relaiile de calcul folosite pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire. x1 =
2 S1 4,5 = = 0.094 mil. Lei n1 511

2 S1 = 2 0.094 = 0.188 mil. Lei n1 Intervalul de ncredere: x 1 x1 < X1 < x 1 + x1 3.8 0.188 < X1 < 3.8 + 0.188 3.612 < X1 < 3.988 Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n mediul urban este de cel puin 3.612 mil. Lei i cel mult 3.988 mil. Lei.

x1 = z

Estimarea venitului mediu/persoan n mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un venit mediu/persoan. de 2.1 mil. Lei. Pentru a estima venitul mediu/persoan n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit. Calculm ct reprezint 5% din volumul populaiei stratului 2. 0.05*N2=0.05*325000=16250 Deoarece n2<0.05*N2 considerm populaia infinit iar relaiile de calcul folosite pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator cu revenire. x2 = S2 2 = n2 1.9 = 0.062 mil. Lei 489

S2 2 = 2 0.062 = 0.125 mil. Lei n2 Intervalul de ncredere: x 2 x2 < X 2 < x 2 + x2 2.1 0.125 < X 2 < 2.1 + 0.125 1.975 < X 2 < 2.225 Garantm cu o probabilitate 0.9545 c venitul mediu/persoan n mediul rural este de cel puin 1.975mil. Lei i cel mult 2.225 mil. Lei. x2 = z
Estimarea venitului mediu/persoan pe total jude

Deoarece sondajul realizat este stratificat proporional estimatorul venitului mediu/peroan la nivelul judeului se calculeaz astfel: ~ x =

x
i =1

ni

n
i =1

2968,7 = 2.9687 mil. lei 1000

Calcului erorii de reprezentativitate:


~ x =

n
i =1

n i2
2

2 x i = 0.056821 mil. lei

~ x = z ~ x = 2 0.056821 = 0.113642 mil. Lei Intervalul de ncredere: ~ ~ x ~ x < X < x + ~ x 2.9687 0.1136 < X < 2.9687 + 0.1136 2.8551 < X < 3.0823 Garantm cu o probabilitate de 95.45% c venitul mediu/persoan n judeul Bacu este de cel puin 2.8551 mil. Lei i cel mult 3.0823mil. Lei.

2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.8


Tabelul 2.8 Mediul Ni (mii pers.) ni (pers.) wi

Si2
0.2016 0.1476

wini

wi
0.020 0.017

wi
0.040 0.035

Linf

Lsup

Urban Rural Total

340 325 665

511 489 1000

0.72 0.18

367.92 88.02 455.94

0.680 0.145

0.760 0.215

Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul urban

Estimatorul procentului celor care . consum sptmnal buturi rcoritoare n mediul urban calculat pe baza datelor din eantion este de 72%. Pentru a estima procentul acestora n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit. Deoarece populaia este considerat infinit utilizm relaiile de calcul aferente calculul sondajului simplu aleator cu revenire. w1
2 S1 = = n1

0.2016 = 0.020 511

2 S1 w1 = z = 2 0.020 = 0.040 n1 Intervalul de ncredere: w 1 w1 < p1 < w 1 + w1 0.72 0.040 < p1 < 0.72 + 0.040 0.680 < p1 < 0.76 Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 68% i cel mult 76% consum sptmnal buturi rcoritoare. Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare: N 1 (w 1 w1 ) < N 1 p1 < N 1 (w 1 + w1 ) N 1 (0.72 0.040 ) < M 1 < N 1 (0.72 + 0.040 ) 231293 < M 1 < 258307 Garantm cu o probabilitate de 95.45% c n mediul urban cel puin 231293 persoane i cel mult 258307 persoane consum sptmnal buturi rcoritoare.

Estimarea procentului celor care consum sptmnal buturi rcoritoare n mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un procent de 18% al celor care consum sptmnal buturi rcoritoare. Calculm eroarea de reprezentativitate w2 = S2 2 = n2 0.1476 = 0.017 489

S2 2 = 2 0.017 = 0.035 n2 Intervalul de ncredere: w 2 w2 < p 2 < w 2 + w2 0.18 0.035 < p 2 < 0.18 + 0.035 0.145 < p 2 < 0.215 Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 14.5% i cel mult 21.5% consum sptmnal buturi rcoritoare. Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare: N 2 (w 2 w2 ) < N 2 p 2 < N 2 (w 2 + w2 ) 47207 < M 2 < 69793 Garantm cu o probabilitate de 95.45% c n mediul rural cel puin 47207 persoane i cel mult 69793 persoane consum sptmnal buturi rcoritoare. w2 = z
Estimarea procentului celor care consum sptmnal buturi rcoritoare pe total jude

Deoarece sondajul realizat este stratificat proporional estimatorul unwi variabile calitative la nivelul judeului se calculeaz astfel: ~= w

n w n
i i i =1 i =1

455,94 = 0.45594 1000

Calcului erorii de reprezentativitate:


~ = w

n
i =1

n i2
2

2 w i = 0,013236

~ = z w ~ = 2 0,012236 = 0,026472 Intervalul de ncredere: w ~ ~ < p < w ~ +~ 0,45594 0,026472 < p < 0,45594 + 0,026472 w w w 0,429468 < p < 0,482412 Garantm cu o probabilitate de 95,45% c cel puin 42,9468% i cel mult 48,2412% din judeul Bacu consum sptmnal buturi rcoritoare. Intervalul de ncredere pentru numrul celor care consum sptmnal buturi rcoritoare: ~ ~ ) < N p < N (w ~ + ~ ) 285596 < M < 320804 N (w w w Garantm cu o probabilitate de 95,45% c n judeul Bacu cel puin 285596 persoane i cel mult 320804 persoane consum sptmnal buturi rcoritoare.

Problema 4

n urma unui sondaj n rndul agenilor economici din judeul Bacu realizat dup un plan stratificat optim s-au obinut datele centralizate n tabelul 2.9.
Tabel 2.9 Efecivul populaiei (nr. ageni economici) Informaii obinute din eantion Eantion (nr. ageni economici) nr. mediu de salariai Dispersia caracteristicii "nr. Salariai" ponderea agenilor economici cu CA sub 1 mld. Lei (%)

Mediul

Urban Rural Total

4200 1500 5700

320 200 520

25 11

8.1 2.9

36 78

Se cere: 1. S se estimeze cu o probabilitate de 0,95 numrul mediu de salariai/agent economic i att pe fiecare strat ct i la nivelul ntregului jude. 2. S se estimeze cu o probabilitate de 0,95 pondereaagenilor economici cu cifra de afaceri sub 1 mld lei, pe fiecare strat i pe total jude.
Rezolvare

1. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.10.


Tabel 2.10 Mediul Ni ni

xi
25 11

Si2 .
8.1 2.9

x i Ni
105000 16500 121500

xi
0.153 0.112

xi
0.300 0.220

Linf

Lsup

Urban Rural Total

4200 1500 5700

320 200 520

24.700 10.780

25.300 11.220

Estimarea numrului mediu de salariai /agent economic n mediul urban

n urma prelucrrii datelor din eantionul prelevat din mediul urban s-a obinul un numr mediu de salariai/agent economic de 25 persoane. Pentru a estima venitul mediu/persoan n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit. Calculm ct reprezint 5% din volumul populaiei stratului 1. 0,05*N1=0,05*4200=210 Deoarece n1>0,05*N1 considerm populaia finit iar relaiile de calcul folosite pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator fr revenire.
x1 =
2 N1 n 1 S1 = 0,153 sal/ag. economic n1 N 1 1

x1 = z x1 = 1,96 0,153 = 0,3 sal/ag. economic Intervalul de ncredere: x 1 x1 < X 1 < x 1 + x1 24,7 < X1 < 25,3

Garantm cu o probabilitate de 95% c numrul mediu de salariai/ag. Economic n mediul urban este de cel puin 24,7 i cel mult 25,3.
Estimarea numrului mediu de salariai /agent economic mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinut un numr mediu de salariai/agent economic de 11 persoane. Calculm ct reprezint 5% din volumul populaiei stratului 2. 0,05*N2=0,05*1500=75 Deoarece n2>0,05*N2 considerm populaia finit iar relaiile de calcul folosite pentru calculul erorii de reprezentativitate vor fi cele aferente sondajului simplu aleator fr revenire.
N2 n2 N 1 = 0,112 sal/ag. economic 2 x 2 = z x 2 = 1,96 0,112 = 0,220 sal/ag. economic Intervalul de ncredere: x 2 x2 < X 2 < x 2 + x2 10,78 < X 2 < 11,22 Garantm cu o probabilitate de 95% c numrul mediu de salariai/agent economic n mediul rural este de cel puin 10,78 pers. i cel mult11,22 pers.. x2 = S2 2 n2

Estimarea numrului mediu de salariai /agent economic pe total jude

Deoarece sondajul realizat este stratificat optim estimatorul numrului mediu de salariai/agent economic la nivelul judeului se calculeaz astfel: ~ x =

i =1

xi Ni

N
i =1

121500 = 21,32 sal/ag. economic 5700

Calcului erorii de reprezentativitate:


~ x =

N
i =1

N i2
2

2 x i = 0,11647 sal/ag. economic

~ x = z ~ x = 1,96 0,11647 = 0,22829 sal/ag. economic Intervalul de ncredere: ~ ~ x ~ x < X < x + ~ x 21,0875 < X < 21,54408 sal/ag. economic Garantm cu o probabilitate de 95% c numrul mediu de salariai/agent economic n judeul Bacu este de cel puin 21,0875 persoane i cel mult21,54408 persoane.

2. Calculele necesare rezolvrii acestei cerine sunt prezentate n tabelul 2.11


Tabelul 2.11 Mediul Ni ni wi

Si2
0.2304 0.1716

wiNi

wi
0.026 0.027

wi
0.051 0.053

Linf

Lsup

Urban Rural Total

4200 1500 5700

320 200 520

0.36 0.78

1512 1170 2682

0.309 0.727

0.411 0.833

Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei n mediul urban

Estimatorul procentului agenilor economici cu CA mai mic de 1 mld. Lei n mediul urban calculat pe baza datelor din eantion este de 36%. Pentru a estima procentul acestora n mediul urban este necesar s calculm eroarea reprezentativitate i eroarea limit. Deoarece populaia este considerat finit utilizm relaiile de calcul aferente calculul sondajului simplu aleator cu revenire.
w1
2 N1 n 1 S1 = = 0,026 n1 N1 1

w1 = z w1 = 1,96 0,026 = 0,051 Intervalul de ncredere: w 1 w1 < p1 < w 1 + w1 0,309 < p1 < 0,411 Garantm cu o probabilitate de 95% c n mediul urban cel puin 30,9% i cel mult 41,1%din agenii economici au cifra de afaceri mai mic de 1 mld. Lei.
Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei n mediul rural

n urma prelucrrii datelor din eantionul prelevat din mediul rural s-a obinul un procent agenilor economici cu CA mai mic de 1 mld. Lei de 78%. Calculm eroarea de reprezentativitate
N2 n2 N 1 = 0,027 2 w 2 = z w 2 = 1,96 0,027 = 0,053 Intervalul de ncredere: w 2 w2 < p 2 < w 2 + w2 0,727 < p 2 < 0,833 Garantm cu o probabilitate de 95% c n mediul rural cel puin 72,7% i cel mult 83,3%din agenii economici au cifra de afaceri sub 1 mld. Lei. w2 = S2 2 n2

Estimarea procentului agenilor economici cu CA mai mic de 1 mld. Lei pe total jude

Deoarece sondajul realizat este stratificat optim estimatorul unei variabile calitative la nivelul judeului se calculeaz astfel: ~= w

i =1

ni wi
k

n
i =1 2

2682 =0,470526 520

Calcului erorii de reprezentativitate:


~ = w

N
i =1

N i2

2 w i = 0,02031

~ = z w ~ = 1,96 0,02031 = 0,03981 w Intervalul de ncredere: ~ ~ < p < w ~ + ~ 0,43071 < p < 0,51034 w w w

Garantm cu o probabilitate de 95% c cel puin 43,071% i cel mult 51,034% din agenii economici ai judeului Bacu au cifra de afaceri mai mic de 1 mld. lei.
Problema 5

n rndul celor 1800 de studeni ai unei faculti (1100 biei i 700 fete), s-a realizat un sondaj. n faza iniial a proiectrii sondajului s-a propus realizarea unei stratificri utiliznd sexul drept criteriu de repartizare pe straturi. Deoarece listele utilizate ca baz de sondaj conineau studenii n ordine alfabetic nu s-a considerat necesar modificarea acestora i s-a recus la un sondaj simplu aleator fr revenire. n urma prelucrrii datelor s-a obinut un numr mediu de ore pe sptmn petrecute la calculator de 14,8 cu o dispersie de 87,11.
Tabel 2.12 Sex Numr studeni n populaie Numr studeni n eantion Numrul mediu de ore pe sptmn petrecute la calculator (h/student) 17 12 Dispersia Ponderea studenilor care lucreaz (%)

M F Total

1100 700 1800

112 88 200

25 16

29 19

Se cere: 1. S se estimeze pentru o probabilitate de 0,95 numrul mediu de ore pe sptmn petrecute la calculator. 2. tiind c 25% din studenii intervievai lucreaz s se estimeze procentul acestora n populaie cu aceeai probabilitate 3. Pentru ameliorarea estimatorilor s-a recurs la o poststratificare. Pe urma prelucrrii informaiilor s-au obinut datele din tabelul 2.12. S se estimeze n aceste condiii, cu aceeai probabilitate, numrul mediu de ore pe sptmn petrecute de un student la calculator i procentul studenilor care lucreaz.
Rezolvare

1. Deoarece n (200) >0,05*1800 considerm c sondajul aleator fr revenire a fost realizat ntr-o populaie finit. Dispersia caracteristicii cantitative vrsta n populaiei nu este cunoscut i va fi nlocuit cu dispersia caracteristicii n eantion. Calculul erorii de reprezentativitate (eroare standard).
x = S2 N n 87,11 1800 200 = = 0,62 ore n N 1 200 1800 1

Calculul erorii limit x = z x =1,96*0,62=1,22 ore Intervalul de ncredere: x x < X < x + x 13,58 < X < 16.02 ore Se garanteaz cu o probabilitate de 95% c numrul de ore petrecute pe sptmn de un student la calculator este de cel puin 13,58 ore i cel mult 16,02 ore.

2. Calculm erorea de reprezentativitate pentru variabila calitativ: w (1 w ) N n 0,25(1 0,25) 1800 200 w = = = 0,028868 n N 1 200 1800 1 Calculul erorii limit w = z w =1,96*0,028868=0,05658 Intervalul de ncredere: w w < p < w + w 0,19342 < p < 0,30658 Garantm cu 95% c cel puin 19,342% i cel mult 30,658% din studenilucreaz. 3. Prin proiectarea unui sondaj n care eantionarea se realizeaz ca i n cazul sondajului simplu aleator (de obicei fr revenire) dar procedura de estimare a parametrilor populaiei este asemntoare sondajului stratificat putem obine estimatori a cror eroare de reprezentativitate nu este cu mult mai mare dect cea care s-ar fi obinut printr-un sondaj stratificat. Avantajul acestei metode este eliminarea inconvenienei sau imposibilitii gruprii elementelor pe straturi nainte de eantionare.
Tabel 2.13 Sex Ni ni

xi
17 12

Si2
25 16

xi Ni
18700 8400 27100

N i2 2

Si N ni

Ni ni N 1 i

Ni 2 1 N Si
9.722222 9.777778 19.5

M F Total

1100 700 1800

112 88 200
k

0.041495 0.010754 0.05225

Calculm

x pstr

Nx = N
i =1 k i i =1 i

unde

x pstr

reprezint

media

eantionului

poststratificat. Calculele necesare sunt prezentate n tabelul 2.13. 27100 = 15,05 1800 Deoarece stratificarea se realizeaz dup efectuarea seleciei eroarea medie de reprezentativitate se va calcula dup relaia: x pstr =

~ xpstr =
2 i

i =1

N i2 i N2 ni

Ni n i N 1 i

1 + n2

1 N
i =1

Ni

2 i

Dac , dispersia stratului i nu se cunoate se va nlocui cu estimatorul acesteia:


Si2 1 = ni 1

(x
j=1

Ni

ij

x i ) 2 Relaia devine:
2

Ni ni 1 k Ni 2 1 ~ 19,5 =0,23 1 Si = 0,05225 + xpstr = N 1 + n2 N 200 2 i i =1 i =1 Primul termen reprezint eroarea standard ateptat n cazul unui sondaj stratificat cu alocarea pe straturi neproporional i selecia unitilor din interiorul straturilor dup procedeul fr revenire iar al doilea termen reprezint penalizarea datorat faptului c stratificare s-a realizat dup selecie.

N i2 Si N2 ni

1 reduce penalizarea cu ct volumul eantionului este mai n2 mare. Putem spune n aceste condiii c poststratificarea duce la bune estimaii atunci cnd volumul eantionului este mare. Calculul erorii limit ~ xpstr = z ~ xpstr =1,96*0,23=1,45 ore

Observm c termenul

Intervalul de ncredere: ~ ~ x pstr ~ xpstr < X < x pstr + ~ xpstr 14,6 < X < 15,5 ore Se garanteaz cu o probabilitate de 95% c numrul de ore petrecute pe sptmn de un student la calculator este de cel puin 14,6 ore i cel mult 15,5 ore. Calculele pentru variabila calitativ sunt prezentate n tabelul 2.14.
Tabel 2.14 Sex Ni ni wi

Si2
0.2059 0.16

w i Ni
319 140 459

N i2 2

Si N ni

Ni ni N 1 i

Ni 2 1 N Si
0.08007222 0.09777778 0.17785000

M F Total

1100 700 1800


k

112 88 200

0.29 0.2

0.000342 0.000108 0.000449

w pstr

Nw = N
i =1 k i i =1 i

459 =0,255 200

Deoarece stratificarea se realizeaz dup efectuarea seleciei eroarea medie de reprezentativitate se va calcula dup relaia:
~ pstr = w
2 i

i =1

N i2 i N2 ni

Ni n i N 1 i

1 + n2

1 N
i =1

Ni

2 i

Dac , dispersia stratului i nu se cunoate se va nlocui cu estimatorul acesteia: Si2 = w i (1 w i ) Relaia devine:
~ pstr = w

i =1

N i2 Si N2 ni

Ni n i N 1 i

1 + n2

1 S N
i =1

Ni

2 i

= 0,000449 +

1 0,17785 200 2

=0,0213 Calculul erorii limit ~ pstr = z w ~ pstr =1,96*0,0213=0,04175 w Intervalul de ncredere: ~ ~ ~ pstr < X < w pstr + w ~ pstr 0,21325 < X < 0.29675 w pstr w Se garanteaz cu o probabilitate de 95% cel puin 21,325% i cel mult 29,675 din studeni lucreaz.

Probleme propuse
Problema 1

n rndul elevilor claselor a XII dintr-un liceu se va realiza un sondaj stratificat Organizatorii sondajului propun criteriul de stratificare sexul, selecia unitilor din fiecare strat urmnd s se realizeze dup procedeul simplu aleator fr revenire. Pe baza datelor din evidena secretariatului s-a calculat, pornind de la variabila media clasei a XI, media i dispersia pe fiecare strat. Rezultatele se gsesc n tabelul 2.15.
sex masculin feminin numr elevi(pers.) 135 165 vrsta medie (ani) 8,2 8,9 Tabel 2.15 Dispersia 3,9 4,8

Se cere: 1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit maxim admis de 3% din valoarea notei medii a elevilor. 2. S se calculeze volumul eantioanelor pe fiecare strat. 3. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi necesar n aceleai condiii de eroare i probabilitate.
Problema 2

n rndul salariailor unei instituii cu 1010 de angajai urmeaz s se realizeze un sondaj avnd drept obiectiv principal caracterizarea mediului de lucru. Deoarece se urmrete evidenierea caracteristicilor fiecrui departament se va utiliza un plan de sondaj stratificat. Informaiile necesare aplicrii planului de sondaj au fost preluate de la compartimentul resurselor umane i sunt prezentate n tabelul 2.16. Se cere: 1. S se calculeze volumul eantionului pentru o probabilitate de 95% i o eroare limit de 3%. 2. Deoarece realizarea sondajului pentru volumul calculat la punctul 1 necesit cheltuieli prea mari s-a propus reducerea acestuia cu 20%. Care va fi eroarea limit ce va trebui acceptat n aceast situaie? 3. S se calculeze volumul eantioanelor pe fiecare strat pornind de la volumul eantionului calculat la punctul 2. 4. Dac sondajul organizat ar fi simplu aleator fr revenire ce volum de eantion ar fi necesar n aceleai condiii de eroare i probabilitate cu cele de la punctul 2.
Departament I II III IV V VI Total Numr salariai (pers) 80 190 110 150 260 220 1010 Tabel 2.16 Ponderea salariailor cu studii superioare (%) 92 63 75 86 15 19

Problema 3

n urma unui sondaj n rndul agenilor economici din judeul Bacu, realizat dup un plan stratificat proporional, utiliznd drept criteriu de stratificare forma de proprietate, sau obinut datele centralizate n tabelul 2.17.
Tabel 2.17 Informaii obinute din eantion Forma de proprietate Numr ageni economici Numr ageni economici n populaie n eantion CA medie (mld. lei) Dispersia CA.

public privat mixt

150 459 201

37 113 50

124 56 75

108 26 31

Se cere: 1. S se estimeze cu o probabilitate de 0,9545 cifra medie de afaceri /agent economic att pe fiecare strat ct i la nivelul ntregului jude. 2. Ce volum de eantion ar fi fost necesar pentru a estima cifra medie de afaceri n aceleai condiii de eroare i probabilitate dac s-ar realiza un sondaj simplu aleator fr revenire.
Problema 4

ntr-o localitate cu 109000 locuitori cu vrsta de 18 ani si peste s-a realizat un sondaj. Metoda de culegere a datelor a fost interviul prin telefon. Deoarece nu se putea cunoate sexul persoanei chestionatee dect n momentul desfurrii interviului nu s-a putut realiza o stratificare pe acest criteriu. Pentu mbuntairea estimaiilor s-a recurs la o poststratificare. Datele centralizate sunt prezentate n tabelul 2.18 Se cere: 1. S se estimeze pentru o probabilitate de 0,95 numrul mediu de ore pe zi petrecute la televizor procentul celor care desfoar o activitate secundar tiind c strucura populaiei de 18 ani i peste pe sexe este:53% feminin i 47% masculin.
Tabel 2.18 Sex Numr persoane n eantion Numrul mediu de ore pe zi petrecute la televizor (h/pers.) 2,3 1,9 Dispersia Ponderea celor care desfoar o activitate secundar(%)

M F Total

202 248 450

0,19 0,22

23 12