Sunteți pe pagina 1din 12

Sondajul de serii

Notaii utilizate:
R = numrul de uniti complexe (serii) din populaie;
r = numrul de uniti complexe (serii) din eantion;
N = numrul de uniti simple (indivizi) din populaie;
n = numrul de uniti simple (indivizi) din eantion;
Nj= numrul de uniti simple din seria j;
Tj= totalul variabilei de interes pentru toate unitile seriei j;
N = mrimea medie a unei serii n populaie;
n = mrimea medie a unei serii n eantion;
N

T=

Yi este totalul din populaie; T =

i =1

Y=

1
N

Nj

Y = N Y
i

i =1

1
R

este totalul mediu pe serie;

i =1

este nivelul mediu pe fiecare unitate simpl (individ)

j=1

unde Y j este nivelul mediu pe fiecare serie.


Sumarul formulelor necesare calculrii estimatorilor parametrilor populaiei i a
erorilor de reprezentativitate este prezentat n tabelul 3.1

Probleme rezolvate
Problema 1

Studenii unei faculti sunt mprii n 200 de grupe. Fiecare grup este format
dintr-un numr egal de studeni (11). S-a realizat un sondaj de serii, procedeul de selecie a
grupelor fiind simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt
prezentate n tabelul 3.2.
Tabel 3.2
seria

media seriei

seria

media seriei

1
2
3
4
5
6
7
8
9
10

6.16
6.18
6.27
5.18
6.73
6.82
4.64
6.55
5.64
5.45

11
12
13
14
15
16
17
18
19
20

6.47
5.73
5.45
6.27
6.55
5.36
6.55
6.73
6.27
5.27

Tabel 3.1
Tip
sondaj

Tip
variabil

Estimator

Cantitativ

1 r
Y = Y j
r j =1

Eroare reprezrentativitate

=
Y

Serii de dimensiune egal selectate


aleator nerepetat cu probabiliti egale

R r 2

R r

R r 2
R r

Y j Y
i =1

cu 2 =
r 1

Calitativ

Cantitativ

r
= 1 w
w
j
r j =1

Y = N jY j
j =1

Nj

j =1

w =

= N w
w
j j

Cantitativ

Y = N jY j

Serii de dimensiune diferit selectate


aleator cu probabiliti proporionale cu
talia
Calitativ

j =1

j =1

= N w
w
j j
j =1

Nj

j =1

Nj

j =1

Nj

j =1

2
w j w
R r p
2
i =1

cu p =
R
r
r 1

2
r

R r 1 T 2

2
cu: T 2 = T j Y N j r 1
R
r
N
j =1

w =

r
R r 1 T 2
2
cu: T 2 = T j w N j
R
r
j =1
N

Serii de dimensiune diferit selectate


aleator nerepetat cu probabiliti egale
Calitativ

2
R r p

R
r

r
Nj

1
) Y j Y
(1 r
r (r 1) i =1
N

w =

r
Nj
1
) w j w
(1 r
r (r 1) i =1
N

r 1

Se cere:
1. S se estimeze nota medie a studenilor cu o probabilitate de 95%.
2. tiind c raportul de corelaie inter-serii este de 9% ce volum de eantion ar fi
fost necesar dac s-ar fi realizat un sondaj simplu aleatoriu fr revenire?
Comentai rezultatul!
Rezolvare:

Calculele necesare sunt sistematizate n tabelul 3.3


Tabelul 3.3
seria

Yj

Yj Y

1
2
3
4
5
6
7
8
9
10
Total

6.16
6.18
6.27
5.18
6.73
6.82
4.64
6.55
5.64
5.45

0.02
0.03
0.07
0.69
0.51
0.65
1.90
0.28
0.14
0.31

seria

Yj

Yj Y

11
12
13
14
15
16
17
18
19
20

6.47
5.73
5.45
6.27
6.55
5.36
6.55
6.73
6.27
5.27
120.27

0.21
0.08
0.31
0.07
0.28
0.42
0.28
0.51
0.07
0.55
7.38

1. Fiind vorba de un sondaj de serii de dimensiune egal i cunoscut estimarea


mediei se face astfel:
1
Y=
r

j=1

120,27
= 6,01 reprezint estimaia notei medii;
20

2 =

Yj Y

i =1

r 1
R r 2

7,38
= 0,39
19

200 20 0,39

= 0,1336
Y
R r
20
20
Nota medie se situeaz n urmtorul interval de ncredere:

Y < Y < Y+

6,01 1,96 0,1336 < Y < 6,01 1,96 0,1336 = 6,01 0,262
2. n cazul sondajului de serii numrul de elemente simple ce au format
eantionul a fost de 220. Relaia de calcul pentru sondajul simplu aleator fr
revenire este:
z 2 2
z 2S 2
1,96 2 4,41

=
= 225
n=
2
2
2 2

zS
1
,
96
4
,
41
2
0,262 +
2x +
2x +
2200
N
N
2
0,397
variatia dintre grupe

S2 = 2 =
= 4,41
2 =
0,09
variatia total

Observm c, pentru aceeai eroare de reprezentativitate i aceeai probabilitate


de garantare a rezultatelor diferena n ceea ce privete dimensiunea eantionului n

urma aplicrii celor dou metode este nesemnificativ. Nu trebuie s neglijm ns


principalul avantaj al sondajului de serii: reducerea substanial a cheltuielilor.
Problema 2

Studenii unei faculti sunt mprii n 100 de grupe. Fiecare grup este format
dintr-un numr egal de studeni (16). S-a realizat un sondaj de serii, procedeul de
selecie a grupelor fiind simplu aleator fr revenire, cu probabiliti egale. Rezultatele
sunt prezentate n tabelul 3.4.
Ponderea studenilor care doresc
Seria
s participe la cursul facultativ (%)
1
60
2
54
3
56
4
62
5
63
6
50
7
49
8
58

Tabel 3.4
Ponderea studenilor care doresc
s participe la cursul facultativ (%)
55
58
59
63
62
64
62
61

seria

9
10
11
12
13
14
15
16

Se cere:
1. S se estimeze ponderea studenilor care doresc s participe la cursul
facultativ cu o probabilitate de 95%.
2. tiind c raportul de corelaie inter-serii este de 12% ce volum de eantion ar
fi fost necesar dac s-ar fi realizat un sondaj simplu aleator fr revenire?
Rezolvare
Tabelul 3.5

(w

Seria

wj

1
2
3
4
5
6
7
8
Total

0.6000
0.5400
0.5600
0.6200
0.6300
0.5000
0.4900
0.5800

0.0002
0.0020
0.0006
0.0012
0.0020
0.0072
0.0090
0.0000

seria

wj

9
10
11
12
13
14
15
16

0.5500
0.5800
0.5900
0.6300
0.6200
0.6400
0.6200
0.6100
9.3600

1. Calculele necesare sunt sistematizate n tabelul 3.5


Estimatorul n cazul unei variabile cantitative se calculeaz astfel:
=1
w
r

w
j=1

9.36
= 0.585
16

(w

0.0012
0.0000
0.0000
0.0020
0.0012
0.0030
0.0012
0.0006
0.0318

Eroroarea de reprezenzentativitate este:


2
2
R r p
R r p
100 16 0.0021
=

= 0.01055 unde

w =
R
r
R
r
100
16
r

(w

0.0318
= 0.0021
16 1
r 1
Eroarea limit corespunztoare probabilitii de 0,95 este:
w = z w = 1,96 0,01055 =0,0207
p 2 =

i =1

Intervalul de ncredere:
< P< w
+
w
w
w

0,585 0,0207 < P < 0,585 + 0,0207

0,5643 < P < 0,6057


Garantm cu o probabilitate de 95% c cel puin 56,43% i cel mult 60,57% din
studeni doresc s participe la cursul facultativ.
2. n cazul sondajului de serii numrul de elemente simple ce au format
eantionul a fost de 256. Relaia de calcul pentru sondajul simplu aleator fr
revenire este:
n=

z 2 S 2
2w + z S 2 N

1,96 2 0,585 (1 0,585)


0,0207 2 + 1,96 2 0,585 (1 0,585) 1600

922

studeni

Deoarece variaia dintre serii este foarte mic (raportul de corelaie inter-serii
fiind doar 0,87) sondajul de serii se dovedete foarte eficient.
Problema 3

O localitate este format din 415 gospodrii(serii). Numrul de elemente dintr-o


serie (membrii) este diferit i nu se cunoate nivelul mediu al acestuia pentru toate cele
415 gospodrii. Pentru a estima venitul mediu pe persoan se extrage n mod aleator un
eantion format din 25 de serii. Datele centralizate sunt prezentate n tabelul 3.6.

Seria

Numrul de
rezideni

venit total pe serie


(mil. lei)

seria

Numrul de
rezideni

1
2
3
4
5
6
7
8
9
10
11
12
13

8
12
4
5
6
6
7
5
8
3
2
6
5

32
42
19
22
27
26
27
21
30
15
10
26
20

14
15
16
17
18
19
20
21
22
23
24
25
Total

10
9
3
6
5
5
4
6
8
7
3
8
151

Tabel 3.6
venit total pe serie
(mil. lei)

30
32
12
25
18
21
17
22
30
25
14
29
592

Se cere s se estimeze venitul mediu pe gospodrie i venitul mediu pe persoan


cu o probabilitate de 95%.
Rezolvare

Este vorba de un sondaj de serii de dimensiune diferit selectate dup un


procedeu de selecie cu probabiliti egale. Calculele sunt sistematizate n tabelul 3.7
Tabel 3.7
Seria

Nj

Tj

1
2
3
4
5
6
7
8
9
10
11
12
13
Total

8
12
4
5
6
6
7
5
8
3
2
6
5

32
42
19
22
27
26
27
21
30
15
10
26
20

T j Y j N j

0.40419
25.4657
11.0083
5.74729
12.0883
6.13464
0.19688
1.95259
1.86115
10.4873
4.66102
6.13464
0.15789

seria

Nj

Tj

14
15
16
17
18
19
20
21
22
23
24
25

10
9
3
6
5
5
4
6
8
7
3
8

30
32
12
25
18
21
17
22
30
25
14
29

T j Y j N j

84.7375
10.7897
0.05684
2.181
2.56848
1.95259
1.73681
2.32007
1.86115
5.97171
5.01048
5.58962

151

592

211.07

Estimatorul mediei populaiei este:


r

Y=

N Y N
j

j=1

j=1

j=1
r

595
= 3,94 mil. lei
151

j=1

Deoarece nu se poate calcula mrimea medie seriilor din populaie N se va


estima cu ajutorul mrimii medii a seriilor din eantion n .
r
151
n=
Nj r =
= 6,04
25
j=1

Estimarea dispersia totalurilor seriilor fa de totalul mediu este:


r
2

T
Y
N
j
j j

196,143
j
1
=
2
T =
=
= 7,05
24
r 1
Eroarea medie de reprezentativitate este:
2
R r 1 T
415 25
1
7,05
=
2
=

= 0,085
Y
R n
r
415
6,04 2 25
Eroarea limit maxim admis este:
= z = 1,96 0,085 = 0,1666 mil. lei

Intervalul de ncredere pentru venitul mediu pe o persoan este:

Y < Y < Y + 3,94 - 0,1666 < Y < 3,94 + 0,1666


Y

3,774 < Y < 4,107


garantm cu o probabilitate de 95% c venitul mediu pe o persoan n aceast
localitate este de cel puin 3,774 ,il. Lei i cel mult 4,107 mil lei.
Intervalul de ncredere pentru estimarea venitului mediu pe o gospodrie:

n Y < n Y < n Y + 6,04 3,774 < T < 6,04 4,107 22,793 < T < 24,107
Y
Y

Venitul mediu al unei gospodrii se ncadreaz n intervalul: (22,793; 24,107)


mil lei.
Problema 4

Studenii din anul terminal mai uneu universiti sunt repartizai pe 140 grupe. n
vederea realizrii uneui studiu s-a selectat aleator un eantion de 14 grupe. Numrul de
studeni dintr-o grup este diferit iar nivelul mediu al acestuia pentru toate cele 140 de
grupe este de 18,2 studeni. Datele obinute n urma prelucrrii sunt centralizate n
tabelul 3.8.

Seria

Nj

1
2
3
4
5
6
7

15
18
18
22
15
16
15

Ponderea studenilor care


au un loc de munc (%)
66.7
66.7
61.1
45.5
40.0
62.5
73.3

seria

Nj

8
9
10
11
12
13
14

18
17
23
24
16
22
19

Tabel 3.8
Ponderea studenilor care
au un loc de munc (%)
44.4
52.9
39.1
58.3
50.0
54.5
52.6

Se cere
1. S se estimeze procentul studenilor care au deja un loc de munc pentru o
probabilitate de 95%.
2. S se estimeze numrul studenilor care lucreaz pentru aceeai probabilitate.
Rezolvare

Seriile sunt de dimensiuni diferite iar procedeul de selecie simplu aleator cu


probabiuliti egale. Calculele sunt sistematizate n tabelul 3.9
1. n cazul unei variabile calitative estimatorul se calculeaz dup relaia

=
w

N w N =T N
j

j=1

j=1

j=1

j=1

140
= 0,5426
258

Estimarea dispersia totalurilor seriilor fa de totalul mediu este:

T 2 =

(T w N )

r 1 =

j=1

45,0257
= 3,4635
14 1
Tabelul 3.9

Seria

Nj

wj

Tj

1
2
3
4
5
6
7
Total

15
18
18
22
15
16
15

0.667
0.667
0.611
0.455
0.400
0.625
0.733

10
12
11
10
6
10
11

(T

w j N j
3.461
4.984
1.519
3.756
4.578
1.737
8.182

seria

Nj

wj

Tj

8
9
10
11
12
13
14

18
17
23
24
16
22
19
258

0.444
0.529
0.391
0.583
0.500
0.545
0.526

8
9
9
14
8
12
10
140

(T

w j N j

3.124
0.051
12.115
0.954
0.465
0.004
0.096
45.0257

Eroarea medie de reprezentativitate este:


2
R r 1 T
140 14
1
3,4635
w =
2
=

= 0,0259
2
R N
r
140 18,2
14
Eroarea limit maxim admis este:
w = z w = 1,96 0,0259 = 0,0507
Intervalul de ncredere :
< P< w
+ 0,5426 - 0,0507 < P < 0,5426 + 0,0507
w
w
w
0,4919 < p < 0,5934
Garantm cu o probabilitate de 95% c cel puin 49,19% i cel mult 59,34% din
studenii anului terminal au deja un loc de munc.

2. Calculm numrul de studeni din anul terminal.


N = N R = 18,2 140 =2548 persoane
Intervalul de ncredere pentru estimarea numrulzui de studeni care lucreaz:
< T < N w
+
N w
1253 < T < 1512 persoane.
w
w

Cel puin 1253 i cel 1512 de studeni au un loc de munc.


Problema 5

La o facultate particular cele 171 de cadre didactice sunt repartizate pe 8


catedre (uniti complexe numite serii) prezentate n tabelul 3.10. Pentru a realiza un
sondaj n rndul acestora s-a selectat un eantion format din trei serii, utilizndu-se
procedeul de selecie cu revenire, cu probabiliti proporionale cu talia seriei.
Numerele aleatoare generate sunt: 73, 112, 163.
Catedr
Nr. profesori

1
16

2
19

3
27

4
18

5
27

6
25

7
10

Tabel 3.10
8
29

n urma culegerii datelor din cele 3 catedre ce au intrat n eantion s-au obinut
urmtoarele valori:
salariul mediu: Y1 = 22,5 mil lei, Y2 = 20,25 mil lei, Y3 = 23,15 mil lei
ponderea
profesorilor
care
colaboreaz
cu
alte
universiti:
w 1 = 25%, w 2 = 18%, w 3 = 19%
Se cere:
1. Precizai care sunt cele trei uniti complexe ce formeaz eantionul.
2. S se estimeze salariul mediu si fondul mediu de salarii pe o catedr pentru o
probabilitate de 0,95.
3. S se estimeze procentul i numrul cadrelor didactice ce colaboreaz cu alte
universiti pentru o probabilitate de 0,95.
Rezolvare

1. Este necesar s determinm care sunt unitile complexe ce formeaz


eantionul.
Pentru aceasta, considernd c mrimea unei uniti complexe este dat de
numrul de profesori, vom calcula valoarea cumulat a mrimii seriei (vezi tabelul
3.11). n funcie de fiecare numr aleator se va alege o unitate complex. Aceasta va fi
aceea pentru care valoarea cumulat este prima mai mare sau cel mult egal cu numrul
aleator.Unitile care vor intra n eantion sunt: 4, 6 i 8.
Catedr
Nr. profesori
cumul
Selecie

1
16
16

2
19
35

3
27
62

4
18
80
X

5
27
107

6
25
132
x

Tabel 3.11
8
29
171
x

7
10
142

2. Calculele necesare sunt sistematizate n tabelul 3.12.


Calculm estimatorul salariului mediu ca medie ponderat a salariului mediu
obinut pentru unitile ce au format eantionul.

Y=

N j Yj

j=1

j=1

1523,6
= 21,98 mil. lei
72
Tabelul 3.12

Seria

Nj

Yj

wj

YjN j

wjN j

1
1
2
3
Total

2
18
25
29
72

3
22.5
20.25
23.15

4
0.25
0.18
0.19

5
405
506.25
671.35
1582.6

6
4.5
4.5
5.51
14.51

Y j Y

7
0.2698
2.9948
1.3676

(1 r

Nj
N

8
0.6842
0.5614
0.4912

col.7*
col 8

9
0.1846
1.6813
0.6718
2.5377

(w

col.10*
col 8

10
0.0023
0.0005
0.0001

11
0.0016
0.0003
0.0001
0.0019

Eroarea de reprezentativitate este:


=
Y

1
r (r 1)

i =1

Nj

(1 r
) Yj Y =
2,5277 =0,65 mil. lei
N
3(3 1)

Calculm eroarea limit maxim admis:


= z = 1,96 0,65 = 1,27 mil. lei
Y

Intervalul de ncredere pentru salariul mediu este:

Y < Y < Y + 20,69 < Y < 23,23 mil. lei


Y

Pentru a estima fondul mediu de salarii pe o catedr vom calcula mrimea


medie a seriei:
R

171
= 21,375
8
R

N Y < N Y < N Y + 442 < T < 497


Y
Y

Garantnd cu o probabilitate de 95% putem afirma c salariul mediu al unui


profesor este de cel puin 20,69 i cel mult 23,23 mil. lei iar fondul de salarii al unei
catedre ia valori n intervalul (442, 497) mil. lei.
N =

j =1

3. Estimatorul mediei unei variabile calitative se calculeaz astfel:

=
w

N w N
j

j=1

j=1

14,51
=0,2
72

Eroarea de reprezentativitate este:


w =

1
r (r 1)

(1 r N ) (w
Nj

i =1

1
0,0019 =0,018
3(3 1)

Calculm eroarea limit maxim admis:


w = z w = 1,96 0,018 = 0,035
Intervalul de ncredere este:
< P< w
+ 0,165 < P < 0,235
w
w
w
Pentru o probabilitate de 0,95 se poate afirnma c cel puin 16,5% i cel mult
23,5% din cadrele didactice colaboreaz cu alte universiti.
Intervalul de ncredere necesar estimrii numrului de cadre didactice ce
colaboreaz cu alte universiti este:
< NP < N w
+ 171 0,165 < T < 171 0,235
Nw
w
w

Cel puin 28 i cel mult 40 de profesori colaboreaz cu alte universiti.

Probleme propuse
Problema 1

O societate comercial produce evi de diferite profile i dimensiuni. Un


beneficiar a solicitat un anumit tip de eav care, n vederea transportului se ncarc n
containere speciale. Fiecare container conine 10 evi. La recepia mrfii beneficiarul
dorete s verifice lotul de 90 de containere. Pentru aceasta selecteaz 9 din cele 90 de
containere i ferific dac tevile corespund din punct de vedere al calitii efectund
diverse teste i msurtori. Rezultatele prelucrrii datelor sunt prezentate n tabelul
3.13.

Se cere:
1. S se estimeze ponderea procentul i numrul evilor care corespund din punct
de vedere al finisajului cu o probabilitate de 95%.
2. S se estimeze lungimea medie a evilor pentru o proobabilitate de 0,9545.

seria

Lugimea medie (m)

1
2
3
4
5
6
7
8
9

9.86
9.98
9.57
10.18
10.33
9.82
9.64
9.55
10.14

Tabel 3.13
Procentul evilor care corespund
din punct de vedere al finisajului
98
92
93
91
89
93
95
98
93

Problema 2

Cei 600 de salariai ai unei societi de construcii sunt grupai n 35 de echipe


de lucru. Numrul de salariai dintr-o echip este diferit. Pentru a realiza un studiu n
rndul salariailor s-au selectat aleator nerepetat 9 echipe. n urma prelucrrii datelor
din chestionare s-au obinut rezultatele prezentate n tabelul 3.14.

seria

Numrul
de salariai

1
2
3
4
5
6
7
8
9

18
12
24
19
18
17
20
23
16

Tabel 3.14
Numrul mediu de ore lucreate pe zi de un Salariai care declar c sunt
salariat
unici ntreintori ai familiei

7,8
9
8
8,2
8,9
9,3
9,8
8,9
7,9

8
6
7
10
9
6
14
17
10

Se cere:
1. S se estimeze numrul mediu de ore lucrate de un muncitor corespunztor
unei probabiliti de 0,95.
2. S se estimeze ponderea salariailor unici ntreintori ai familiei pentru
aceeai probabilitate.
Problema 3

n cele 5 licee dintr-o localitate sunt 12 clase a XIIa. Numrul de elevi dintr-o
clas este diferit (vezi tabelul 3.15). Pentru a realiza un sondaj n rndul acestora s-a
selectat un eantion format din patru clase, utilizndu-se procedeul de selecie cu
revenire, cu probabiliti proporionale cu talia seriei. n urma calculrii pasului de
eantionarea i a alegerii unei numr aleator de debut s-au obinut urmtoarele valori
(pe baza crora s-a decis care uniti intr n eantion): 38, 113, 188, 263.

Clasa
nr. Elevi

1
31

2
25

3
26

4
29

5
32

6
24

7
20

8
29

9
19

10
17

11
23

Tabel 3.15
12
25

n urma culegerii datelor din cele 4 clase ce au intrat n eantion s-au obinut
urmtoarele valori:
Numrul
mediu
de
ore
de
studiu
individual
pe
zi:
Y1 = 3,4 h Y2 = 3,9 h, Y3 = 4,1 h Y4 = 3,1 h
Ponderea
elevilor
care
fumeaz:
w 1 = 32%, w 2 = 20%, w 3 = 25% w 3 = 20%
Se cere:
1. Precizai care sunt cele patru clase ce formeaz eantionul.
2. S se estimeze numrul mediu de ore de studiu individual pentru o
probabilitate de 0,95.
3. S se estimeze procentul i numrul elevilor care fumeaz pentru o
probabilitate de 0,95.

S-ar putea să vă placă și