Sunteți pe pagina 1din 6

Sondajul bistadial

Notaii utilizate:
R = numrul de uniti primare din populaie;
r = numrul de uniti primare selectate n primul stadiu;
Ni = numrul total de uniti simple (indivizi) din UPi;
ni = numrul de uniti simple (indivizi) extrase din UP ;
R

N=

numrul total de indivizi;

i =1
Ni

Ti =

ij

totalul variabilei pentru unitatea primar UPi;

ij

estimatorul totalului variabilei pentru unitatea primar UPi;

j=1

Ti =

ni

y
j=1

Ni

T=R

ij

totalul variabilei pentru toate unitile primare;

j =1

R
T =
r

N
i
ni

i =1

ni

j=1

y ij estimatorul totalului variabilei studiate.

estimatorul mediei caracteristicii calculat pentru unitatea primar UP ;


Y
i
i

Y estimatorul mediei caracteristicii la nivelul populaiei studiate;


V(T) reprezint variaia estimatorului totalului variabilei i st la baza calculrii
erorii de reprezentativitate. Este definit de urmtoarea relaie:

r 2

R 2 1 1
R r
variaia dintre UP

V(T) =

12 =

1
R

(T T )
i

n 2,i
unde:
N i2 1 i
N
n
i
i

i =1
variaia din interiorul UP
R
r

variaia n populaie a totalurilor unitilor primare.

i =1

Deoarece aceasta nu se cunoate se va utiliza estimatorul acesteia:


12

1
=
r 1

(T T )
i

i =1

22,i =
22,i

1
Ni

Ni

(y

ij

y i ) 2 variaia din interiorul unitii primare UPi

j=1

1
=
ni 1

ni

(y

ij

y i ) 2 estimatorul variaiei din interiorul unitii primare

j=1

UPi.

Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei


estimatorului valorii totale dup relaia:
(T) =
T = V

r 2
R
R 1 1 +
r
R r
2

i =1

N i2 1

ni
Ni

2,i

ni

Probleme rezolvate
Problema 1

Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia
de 18 ani peste de 48000 . Unitile primare sunt reprezentate de seciile de votare (27)
i au fost selectate dup un procedeu aleator cu probabiliti egale fr revenire. n
tabelul 4.1. sunt prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor
din fiecare unitate primar ce a fost selectat n eantion.
nr. pers.
nr. pers. din
venitul mediu
selectate din
Secia
secia i
(mil lei)
secia i
1
2116
43
2.8
2
2430
43
2.5
3
2268
43
2.6
4
2346
52
3.8
5
1750
42
4.2
6
2386
52
4.1
7
2180
46
3.7
8
1534
45
3.5
9
1598
42
3.4
10
2391
52
2.7
11
1295
52
2.9

dispersia dup
variabila venit
0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484

Tabelul 4.1
nr. pers. care
petrec la televizor
mai mult de 3 h/zi
20
25
24
28
31
36
28
29
33
36
30

Se cere:
1. S se estimeze venitul mediu din localitate pentru o probabilitate de 0,95.
2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru
aceeai probabilitate.
Rezolvare

1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza


calculelor sistematizate n tabelul 4.2.
r
r
N ni
R r
R
27
=R
i
T =
y ij =
Ni Y
Ti
=
73023,4 =179239,25 mil lei
i

r i =1 n i j=1
r i=1
r i =1
11

Tabel 4.2
Secia

Ni

ni

Yi

1
2
3
4
5
6
7
8
9
10
11
Total

2116
2430
2268
2346
1750
2386
2180
1534
1598
2391
1295
22294

43
43
43
52
42
52
46
45
42
52
52
512

2.8
2.5
2.6
3.8
4.2
4.1
3.7
3.5
3.4
2.7
2.9

22,i

Ti

(Ti T ) 2

0.04
0.0576
0.16
0.09
0.25
0.16
0.1089
0.01
0.09
0.04
0.0484

5924.8
6075
5896.8
8914.8
7350
9782.6
8066
5369
5433.2
6455.7
3755.5
73023.4

509354.714
317522.005
550105.405
5181583.08
506245.186
9885421.98
2037782.2
1611607.17
1452726.18
33412.5164
8311636.58
30397397

n
1 i

N
i

0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96

N i2 1

ni
Ni

2
2 ,i

n
i

4080.44
7769.85
18776.93
9314.52
17791.67
17135.15
11013.39
507.58
5328.19
4301.96
1498.25
97517.92

Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei


estimatorului valorii totale dup relaia:
r 2
R

R 2 1 1 +
r
R r

T =

unde 12 =
1
T =
r

1
r 1

T =
i

i =1

(T T )
i

i =1

i =1

n 2,i
N i2 1 i
Ni ni

30397397
= 3039739,7
10

73023,4
= 6638,5 mil. lei
11

Calculm primul termen al erorii de reprezentativitate indus de selecia din


primul stadiu al planului de sondaj.
11 3039739,7
=119378868,2
Termen1=272 1
11
27
Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a
avut loc n al doilea stadiu, n interiorul unitilor primare ce au format eantionul.
27
Termen2= 97517,92 =239362,8
11
Observm c primul termen al variaiei estimatorului are o contribuie
substanial n determinarea mrimii erorii de reprezentativitate. Acesta este motivul
pentru care planul de sondaj trebuie s se organizeze astfel nct s se reduc eroarea
din primul stadiu. Se recomand stratificarea unitilor primare.
T = 119378868 + 239362,8 = 10937,012
Intervalul de ncredere al totalului este:
T 1,96 T T T + 1,96 T

157802,7 T 200675,8 mil. Lei

Venitul mediu estimat este:


T
Y = = 3,734 mil. Lei
N

Intervalul de ncredere al venitului mediu este :


1
T 1
(T 1,96 * T ) (T + 1,96 * T )
N
N N
3,287 Y 4,18
Garantm cu o probabilitate de 95% c venitul mediu pe o persoan este de cel
puin 3,287 mil. lei i cel mult 4,18 mil. lei.
2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate
n tabelul 4.3.
Tabelul 4.3

Secia

Ni

1
2116
2
2430
3
2268
4
2346
5
1750
6
2386
7
2180
8
1534
9
1598
10
2391
11
1295
Total 22294

ni

mi

w i

43
43
43
52
42
52
46
45
42
52
52
512

20
25
24
28
31
36
28
29
33
36
30

0.4651
0.5814
0.5581
0.5385
0.7381
0.6923
0.6087
0.6444
0.7857
0.6923
0.5769

22,i

Ti

(Ti T ) 2

0.2488
0.2434
0.2466
0.2485
0.1933
0.2130
0.2382
0.2291
0.1684
0.2130
0.2441

984.2
1412.8
1265.9
1263.2
1291.7
1651.8
1327.0
988.6
1255.6
1655.3
747.1
13843.11

75228.67524
23816.57237
54.70016007
22.7172322
1102.383243
154749.1181
4691.155746
72838.84794
8.369917026
157484.5118
261477.9275
751474.9792

n
1 i

N
i

N i2 1

0.98
0.98
0.98
0.98
0.98
0.98
0.98
0.97
0.97
0.98
0.96

ni
Ni

2
2 ,i

n
i

25378.59
32829.62
28942.27
25720.57
13757.28
22813.07
24088.40
11630.56
9967.70
22909.85
7555.70
225593.60

Calculm estimatorul totalului variabilei studiate (numrul persoanelor care


petrec la televizor mai mult de 3 h/zi

R
T =
r

i =
Ni w

i =1

R
r

27
13843,11 = 33978,54 pers.
11

i =1

Eroarea medie de reprezentativitate se va calcula pe baza relaiei:


r 2
R
R 1 1 +
r
R r
2

T =

unde 12 =
1
T =
r

1
r 1

T =
i

i =1

(T T )
i

i =1

i =1

N i2 1

ni
Ni

2
2,i

ni

751474,9792
= 75147,49792
10

13843,11
= 1258,465 pers.
11

11 75147,49792
=2951247,191
Termen 1=272 1
11
27
27
Termen 2= 225593,60 =553729,7456
11
Observm c i n acest caz primul termen al variaiei estimatorului are o
contribuie substanial n determinarea mrimii erorii de reprezentativitate. stadiu.
T = 2951247,191 + 553729,7456 = 1872,158363

Intervalul de ncredere al totalului este:


T 1,96 T T T + 1,96 T

30309 T 37648 persoane


Cel puin 30309 persoane i cel mult 37648 persoane petrec cel puin 3 ore pe zi
la televizor.
Procentul mediu estimat este:

= T = 0,70789
w
N
Intervalul de ncredere al procentului mediu este :
1
T 1
(T 1,96 * T ) (T + 1,96 * T )
N
N N
0,6315 p 0,7843
Se garanteaz cu o probabilitate de 95% c cel puin 63,15% i cel mult 78,43%
din populaia ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.

Probleme propuse
Problema 1

S-a organizat o cercetare n rndul unitilor sanitare(spitale) cu privire la


atitudinea personaluluimedical fa de reforma sistemului sanitar. Studiul s-a desfurat
dup un plant de sondaj bistadial. n primul stadiu din 132 de spitale s-au selectat 12.
Numrul de persoane intervievate din fiecare unitate primar ce a format eantionul,
precum i informaiile obinute n urma prelucrrii datelor sunt prezentate n tabelul nr.
4.4.
Tabel 4.4
Unitatea
primar

Personal
medical

1
2
3
4
5
6
7
8
9
10
11
12

102
245
56
67
98
76
112
145
160
189
79
87

Pers. ce consider satisfctoare


Personal medical
selectat
dotarea cu aparatur asigurarea cu materiale
medical
consumabile
42
38
32
58
55
50
30
45
47
32
27
25
35
30
28
33
30
29
44
40
37
47
40
38
50
42
38
53
48
45
33
27
25
34
26
28

Se cere:
1. S se estimeze cu o probabilitate de 95% procentul personalului medical ce
consider satisfctoare dotarea cu aparatur medical.
2. S se estimeze cu o probabilitate de 95% procentul personalului medical ce
consider satisfctoare asigurarea cu materiale consumabile.

Problema 2

n rndul studenilor studenilor Academiei de Studii Economice s-a realizat o


cercetare ce a avut ca obiectiv caracterizarea modului de petrecere a timpului liber.
Studiul realizat a avut la baza un sondaj bistadial unitile primare fiind considerate
seriile iar unitile secundare studenii. n toate facultile ASE sunt 125 de serii din care
au fost selectate 12. n urma prelucrrii datelor s-au obinut inforiile din tabelul 4.5.
Tabel 4.5
Seria

studeni n
serie

1
2
3
4
5
6
7
8
9
10
11
12

87
93
78
77
85
88
94
87
83
72
70
75

studeni n venit mediu pe studeni care


eantion
lun (mil. Lei) practic sport
32
34
30
30
32
32
34
32
32
30
30
30

2.6
2.3
2.5
2.4
2.9
3
2.7
2.4
2.9
3
2.6
2.7

6
9
10
7
8
9
13
15
9
8
7
9

studeni care merg


frecvent n
excursii/drumeii
12
15
17
18
19
16
17
15
14
17
16
17

Se cere:
1. S se estimeze venitul mediu/student pentru o probabilitate de 95,45%.
2. S se estimeze procentul studenilor care practic sport si cel al studenilor
care merg frecvent n excursii pentru o probabilitate de 95%.