Sunteți pe pagina 1din 12

Sondajul de serii

Notaii utilizate: R = numrul de uniti complexe (serii) din populaie; r = numrul de uniti complexe (serii) din eantion; N = numrul de uniti simple (indivizi) din populaie; n = numrul de uniti simple (indivizi) din eantion; Nj= numrul de uniti simple din seria j; Tj= totalul variabilei de interes pentru toate unitile seriei j; N = mrimea medie a unei serii n populaie; n = mrimea medie a unei serii n eantion;
T=
Y=

i =1

Yi este totalul din populaie; T =


N R

1 R

Y
i =1

este totalul mediu pe serie;

1 N

Y = N Y
i i =1 j=1

Nj

este nivelul mediu pe fiecare unitate simpl (individ)

unde Y j este nivelul mediu pe fiecare serie. Sumarul formulelor necesare calculrii estimatorilor parametrilor populaiei i a erorilor de reprezentativitate este prezentat n tabelul 3.1

Probleme rezolvate
Problema 1

Studenii unei faculti sunt mprii n 200 de grupe. Fiecare grup este format dintr-un numr egal de studeni (11). S-a realizat un sondaj de serii, procedeul de selecie a grupelor fiind simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt prezentate n tabelul 3.2.
Tabel 3.2 seria media seriei seria media seriei

1 2 3 4 5 6 7 8 9 10

6.16 6.18 6.27 5.18 6.73 6.82 4.64 6.55 5.64 5.45

11 12 13 14 15 16 17 18 19 20

6.47 5.73 5.45 6.27 6.55 5.36 6.55 6.73 6.27 5.27

Tabel 3.1 Tip sondaj Tip variabil Estimator


1 r Y = Y j r j =1

Eroare reprezrentativitate
r Y j Y 2 = i =1 cu r 1

Cantitativ Serii de dimensiune egal selectate aleator nerepetat cu probabiliti egale Calitativ

=
Y

R r 2 R r
2 R r p R r

2 Rr R r

r = 1 w w j r j =1

w =

wj w 2 Rr p 2 i =1 cu p = R r r 1

Cantitativ

r Y = N jY j j =1

j =1

Nj

=
Y

Serii de dimensiune diferit selectate aleator nerepetat cu probabiliti egale Calitativ

2 2 r Rr 1 2 = 2 T cu: T Y N r 1 T j j R r N j =1

= N w w j j
j =1

j =1

Nj

w =

2 r Rr 1 N 2 = T w 2 T cu: T j j R r j =1 N

r 1

Cantitativ Serii de dimensiune diferit selectate aleator cu probabiliti proporionale cu talia Calitativ

r Y = N jY j j =1

j =1

Nj

=
Y

r Nj 1 ) Yj Y (1 r r (r 1) i =1 N

= N w w j j
j =1

j =1

Nj

w =

r Nj 1 ) wj w (1 r r (r 1) i =1 N

Se cere: 1. S se estimeze nota medie a studenilor cu o probabilitate de 95%. 2. tiind c raportul de corelaie inter-serii este de 9% ce volum de eantion ar fi fost necesar dac s-ar fi realizat un sondaj simplu aleatoriu fr revenire? Comentai rezultatul!
Rezolvare:

Calculele necesare sunt sistematizate n tabelul 3.3


Tabelul 3.3 seria
2 2

Yj
6.16 6.18 6.27 5.18 6.73 6.82 4.64 6.55 5.64 5.45

Yj Y
0.02 0.03 0.07 0.69 0.51 0.65 1.90 0.28 0.14 0.31

seria

Yj
6.47 5.73 5.45 6.27 6.55 5.36 6.55 6.73 6.27 5.27 120.27

Yj Y
0.21 0.08 0.31 0.07 0.28 0.42 0.28 0.51 0.07 0.55 7.38

1 2 3 4 5 6 7 8 9 10 Total

11 12 13 14 15 16 17 18 19 20

1. Fiind vorba de un sondaj de serii de dimensiune egal i cunoscut estimarea mediei se face astfel:
1 Y= r

Y
j=1 r

120,27 = 6,01 reprezint estimaia notei medii; 20


2

2 =

Yj Y i =1 r 1 2 Rr

7,38 = 0,39 19

200 20 0,39 = 0,1336 Y R r 20 20 Nota medie se situeaz n urmtorul interval de ncredere: Y < Y < Y+ =
Y Y

6,01 1,96 0,1336 < Y < 6,01 1,96 0,1336 = 6,01 0,262 2. n cazul sondajului de serii numrul de elemente simple ce au format eantionul a fost de 220. Relaia de calcul pentru sondajul simplu aleator fr revenire este: z 2 2 z 2S 2 1,96 2 4,41 = = 225 n= 2 2 2 2 z zS 1 , 96 4 , 41 2 0,262 + 2x + 2x + 2200 N N 2 0,397 variatia dintre grupe S2 = 2 = = 4,41 2 = 0,09 variatia total Observm c, pentru aceeai eroare de reprezentativitate i aceeai probabilitate de garantare a rezultatelor diferena n ceea ce privete dimensiunea eantionului n

urma aplicrii celor dou metode este nesemnificativ. Nu trebuie s neglijm ns principalul avantaj al sondajului de serii: reducerea substanial a cheltuielilor.
Problema 2

Studenii unei faculti sunt mprii n 100 de grupe. Fiecare grup este format dintr-un numr egal de studeni (16). S-a realizat un sondaj de serii, procedeul de selecie a grupelor fiind simplu aleator fr revenire, cu probabiliti egale. Rezultatele sunt prezentate n tabelul 3.4.
Ponderea studenilor care doresc Seria s participe la cursul facultativ (%) 1 60 2 54 3 56 4 62 5 63 6 50 7 49 8 58 Tabel 3.4 Ponderea studenilor care doresc s participe la cursul facultativ (%) 55 58 59 63 62 64 62 61

seria

9 10 11 12 13 14 15 16

Se cere: 1. S se estimeze ponderea studenilor care doresc s participe la cursul facultativ cu o probabilitate de 95%. 2. tiind c raportul de corelaie inter-serii este de 12% ce volum de eantion ar fi fost necesar dac s-ar fi realizat un sondaj simplu aleator fr revenire?
Rezolvare
Tabelul 3.5 Seria

wj
0.6000 0.5400 0.5600 0.6200 0.6300 0.5000 0.4900 0.5800

(w

seria

wj
0.5500 0.5800 0.5900 0.6300 0.6200 0.6400 0.6200 0.6100 9.3600

(w

1 2 3 4 5 6 7 8 Total

0.0002 0.0020 0.0006 0.0012 0.0020 0.0072 0.0090 0.0000

9 10 11 12 13 14 15 16

0.0012 0.0000 0.0000 0.0020 0.0012 0.0030 0.0012 0.0006 0.0318

1. Calculele necesare sunt sistematizate n tabelul 3.5 Estimatorul n cazul unei variabile cantitative se calculeaz astfel:
=1 w r

w
j=1

9.36 = 0.585 16

Eroroarea de reprezenzentativitate este: 2 2 R r p Rr 100 16 0.0021 p = = 0.01055 unde w = R r R r 100 16 0.0318 = 0.0021 16 1 r 1 Eroarea limit corespunztoare probabilitii de 0,95 este: w = z w = 1,96 0,01055 =0,0207 2= p
i =1

(w

0,5643 < P < 0,6057 Garantm cu o probabilitate de 95% c cel puin 56,43% i cel mult 60,57% din studeni doresc s participe la cursul facultativ. 2. n cazul sondajului de serii numrul de elemente simple ce au format eantionul a fost de 256. Relaia de calcul pentru sondajul simplu aleator fr revenire este:
n= z 2 S 2
2 2 N w + zS

Intervalul de ncredere: < P< w + w w w

0,585 0,0207 < P < 0,585 + 0,0207

1,96 2 0,585 (1 0,585) 0,0207 2 + 1,96 2 0,585 (1 0,585) 1600

922

studeni

Deoarece variaia dintre serii este foarte mic (raportul de corelaie inter-serii fiind doar 0,87) sondajul de serii se dovedete foarte eficient.
Problema 3

O localitate este format din 415 gospodrii(serii). Numrul de elemente dintr-o serie (membrii) este diferit i nu se cunoate nivelul mediu al acestuia pentru toate cele 415 gospodrii. Pentru a estima venitul mediu pe persoan se extrage n mod aleator un eantion format din 25 de serii. Datele centralizate sunt prezentate n tabelul 3.6.
Numrul de rezideni venit total pe serie (mil. lei) Numrul de rezideni Tabel 3.6 venit total pe serie (mil. lei)

Seria

seria

1 2 3 4 5 6 7 8 9 10 11 12 13

8 12 4 5 6 6 7 5 8 3 2 6 5

32 42 19 22 27 26 27 21 30 15 10 26 20

14 15 16 17 18 19 20 21 22 23 24 25 Total

10 9 3 6 5 5 4 6 8 7 3 8 151

30 32 12 25 18 21 17 22 30 25 14 29 592

Se cere s se estimeze venitul mediu pe gospodrie i venitul mediu pe persoan cu o probabilitate de 95%.
Rezolvare

Este vorba de un sondaj de serii de dimensiune diferit selectate dup un procedeu de selecie cu probabiliti egale. Calculele sunt sistematizate n tabelul 3.7
Tabel 3.7 Seria Nj Tj
T j Y j N j 0.40419 25.4657 11.0083 5.74729 12.0883 6.13464 0.19688 1.95259 1.86115 10.4873 4.66102 6.13464 0.15789
2

seria

Nj

Tj

1 2 3 4 5 6 7 8 9 10 11 12 13 Total

8 12 4 5 6 6 7 5 8 3 2 6 5

32 42 19 22 27 26 27 21 30 15 10 26 20

14 15 16 17 18 19 20 21 22 23 24 25

10 9 3 6 5 5 4 6 8 7 3 8 151

30 32 12 25 18 21 17 22 30 25 14 29 592

T j Y j N j 84.7375 10.7897 0.05684 2.181 2.56848 1.95259 1.73681 2.32007 1.86115 5.97171 5.01048 5.58962

211.07

Estimatorul mediei populaiei este:

Y=

N Y N
j j j=1 j=1

T
j

N
j=1

j=1 r

595 = 3,94 mil. lei 151

Deoarece nu se poate calcula mrimea medie seriilor din populaie N se va estima cu ajutorul mrimii medii a seriilor din eantion n . r 151 n= Nj r = = 6,04 25 j=1

Estimarea dispersia totalurilor seriilor fa de totalul mediu este: r 2 T Y N j j j 196,143 j 1 = 2 = = = 7,05 T 24 r 1 Eroarea medie de reprezentativitate este: 2 Rr 1 415 25 1 7,05 = 2 T = = 0,085 Y R n r 415 6,04 2 25 Eroarea limit maxim admis este: = z = 1,96 0,085 = 0,1666 mil. lei

Intervalul de ncredere pentru venitul mediu pe o persoan este: Y < Y < Y + 3,94 - 0,1666 < Y < 3,94 + 0,1666
Y Y

3,774 < Y < 4,107 garantm cu o probabilitate de 95% c venitul mediu pe o persoan n aceast localitate este de cel puin 3,774 ,il. Lei i cel mult 4,107 mil lei. Intervalul de ncredere pentru estimarea venitului mediu pe o gospodrie: n Y < n Y < n Y + 6,04 3,774 < T < 6,04 4,107 22,793 < T < 24,107 Y Y

Venitul mediu al unei gospodrii se ncadreaz n intervalul: (22,793; 24,107) mil lei.
Problema 4

Studenii din anul terminal mai uneu universiti sunt repartizai pe 140 grupe. n vederea realizrii uneui studiu s-a selectat aleator un eantion de 14 grupe. Numrul de studeni dintr-o grup este diferit iar nivelul mediu al acestuia pentru toate cele 140 de grupe este de 18,2 studeni. Datele obinute n urma prelucrrii sunt centralizate n tabelul 3.8.
Ponderea studenilor care au un loc de munc (%) 66.7 66.7 61.1 45.5 40.0 62.5 73.3 Tabel 3.8 Ponderea studenilor care au un loc de munc (%) 44.4 52.9 39.1 58.3 50.0 54.5 52.6

Seria

Nj

seria

Nj

1 2 3 4 5 6 7

15 18 18 22 15 16 15

8 9 10 11 12 13 14

18 17 23 24 16 22 19

Se cere 1. S se estimeze procentul studenilor care au deja un loc de munc pentru o probabilitate de 95%. 2. S se estimeze numrul studenilor care lucreaz pentru aceeai probabilitate.
Rezolvare

Seriile sunt de dimensiuni diferite iar procedeul de selecie simplu aleator cu probabiuliti egale. Calculele sunt sistematizate n tabelul 3.9 1. n cazul unei variabile calitative estimatorul se calculeaz dup relaia
r r
r r

= w

N w N =T N
j j j
j

j=1

j=1

j=1

j=1

140 = 0,5426 258

Estimarea dispersia totalurilor seriilor fa de totalul mediu este:

2= T

N ) (T w
j j j j=1

r 1 =

45,0257 = 3,4635 14 1
Tabelul 3.9

Seria

Nj

wj

Tj

(T

N w j j 3.461 4.984 1.519 3.756 4.578 1.737 8.182

seria

Nj

wj

Tj

(T

N w j j 3.124 0.051 12.115 0.954 0.465 0.004 0.096 45.0257

1 2 3 4 5 6 7 Total

15 18 18 22 15 16 15

0.667 0.667 0.611 0.455 0.400 0.625 0.733

10 12 11 10 6 10 11

8 9 10 11 12 13 14

18 17 23 24 16 22 19 258

0.444 0.529 0.391 0.583 0.500 0.545 0.526

8 9 9 14 8 12 10 140

Eroarea medie de reprezentativitate este: 2 Rr 1 140 14 1 3,4635 w 2 T = = 0,0259 = 2 R N r 140 18,2 14 Eroarea limit maxim admis este: w = z w = 1,96 0,0259 = 0,0507 Intervalul de ncredere : < P< w + 0,5426 - 0,0507 < P < 0,5426 + 0,0507 w w w
0,4919 < p < 0,5934 Garantm cu o probabilitate de 95% c cel puin 49,19% i cel mult 59,34% din studenii anului terminal au deja un loc de munc.

2. Calculm numrul de studeni din anul terminal. N = N R = 18,2 140 =2548 persoane Intervalul de ncredere pentru estimarea numrulzui de studeni care lucreaz: < T < N w + N w 1253 < T < 1512 persoane. w w

Cel puin 1253 i cel 1512 de studeni au un loc de munc.


Problema 5

La o facultate particular cele 171 de cadre didactice sunt repartizate pe 8 catedre (uniti complexe numite serii) prezentate n tabelul 3.10. Pentru a realiza un sondaj n rndul acestora s-a selectat un eantion format din trei serii, utilizndu-se procedeul de selecie cu revenire, cu probabiliti proporionale cu talia seriei. Numerele aleatoare generate sunt: 73, 112, 163.
Catedr Nr. profesori 1 16 2 19 3 27 4 18 5 27 6 25 7 10 Tabel 3.10 8 29

n urma culegerii datelor din cele 3 catedre ce au intrat n eantion s-au obinut urmtoarele valori: salariul mediu: Y1 = 22,5 mil lei, Y2 = 20,25 mil lei, Y3 = 23,15 mil lei ponderea profesorilor care colaboreaz cu alte universiti: w 1 = 25%, w 2 = 18%, w 3 = 19% Se cere: 1. Precizai care sunt cele trei uniti complexe ce formeaz eantionul. 2. S se estimeze salariul mediu si fondul mediu de salarii pe o catedr pentru o probabilitate de 0,95. 3. S se estimeze procentul i numrul cadrelor didactice ce colaboreaz cu alte universiti pentru o probabilitate de 0,95.
Rezolvare

1. Este necesar s determinm care sunt unitile complexe ce formeaz eantionul. Pentru aceasta, considernd c mrimea unei uniti complexe este dat de numrul de profesori, vom calcula valoarea cumulat a mrimii seriei (vezi tabelul 3.11). n funcie de fiecare numr aleator se va alege o unitate complex. Aceasta va fi aceea pentru care valoarea cumulat este prima mai mare sau cel mult egal cu numrul aleator.Unitile care vor intra n eantion sunt: 4, 6 i 8.
Catedr Nr. profesori cumul Selecie 1 16 16 2 19 35 3 27 62 4 18 80 X 5 27 107 6 25 132 x 7 10 142 Tabel 3.11 8 29 171 x

2. Calculele necesare sunt sistematizate n tabelul 3.12. Calculm estimatorul salariului mediu ca medie ponderat a salariului mediu obinut pentru unitile ce au format eantionul.

Y=

j=1

N j Yj

N
j=1

1523,6 = 21,98 mil. lei 72


Tabelul 3.12
wjN j

Seria

Nj

Yj

wj

YjN j

1 1 2 3 Total

2 18 25 29 72

3 22.5 20.25 23.15

4 0.25 0.18 0.19

5 405 506.25 671.35 1582.6

6 4.5 4.5 5.51 14.51

Y j Y 7 0.2698 2.9948 1.3676

(1 r

Nj N

col.7* col 8

(w

col.10* col 8

8 0.6842 0.5614 0.4912

9 0.1846 1.6813 0.6718 2.5377

10 0.0023 0.0005 0.0001

11 0.0016 0.0003 0.0001 0.0019

Eroarea de reprezentativitate este:


=
Y

1 r (r 1)

i =1

1 (1 r ) Yj Y = 2,5277 =0,65 mil. lei N 3(3 1)

Nj

Calculm eroarea limit maxim admis: = z = 1,96 0,65 = 1,27 mil. lei
Y Y

Intervalul de ncredere pentru salariul mediu este: Y < Y < Y + 20,69 < Y < 23,23 mil. lei
Y Y

Pentru a estima fondul mediu de salarii pe o catedr vom calcula mrimea medie a seriei:
171 = 21,375 8 R N Y < N Y < N Y + 442 < T < 497 Y Y Garantnd cu o probabilitate de 95% putem afirma c salariul mediu al unui profesor este de cel puin 20,69 i cel mult 23,23 mil. lei iar fondul de salarii al unei catedre ia valori n intervalul (442, 497) mil. lei. N =
j =1

3. Estimatorul mediei unei variabile calitative se calculeaz astfel:

= w

N w N
j j j=1 j=1

14,51 =0,2 72

Eroarea de reprezentativitate este:


w =
1 r (r 1)

(1 r N ) (w
Nj
i =1

1 0,0019 =0,018 3(3 1)

Calculm eroarea limit maxim admis: w = z w = 1,96 0,018 = 0,035 Intervalul de ncredere este: < P< w + 0,165 < P < 0,235 w w w Pentru o probabilitate de 0,95 se poate afirnma c cel puin 16,5% i cel mult 23,5% din cadrele didactice colaboreaz cu alte universiti. Intervalul de ncredere necesar estimrii numrului de cadre didactice ce colaboreaz cu alte universiti este: < NP < N w + 171 0,165 < T < 171 0,235 Nw w w

Cel puin 28 i cel mult 40 de profesori colaboreaz cu alte universiti.

Probleme propuse
Problema 1

O societate comercial produce evi de diferite profile i dimensiuni. Un beneficiar a solicitat un anumit tip de eav care, n vederea transportului se ncarc n containere speciale. Fiecare container conine 10 evi. La recepia mrfii beneficiarul dorete s verifice lotul de 90 de containere. Pentru aceasta selecteaz 9 din cele 90 de containere i ferific dac tevile corespund din punct de vedere al calitii efectund diverse teste i msurtori. Rezultatele prelucrrii datelor sunt prezentate n tabelul 3.13.

Se cere: 1. S se estimeze ponderea procentul i numrul evilor care corespund din punct de vedere al finisajului cu o probabilitate de 95%. 2. S se estimeze lungimea medie a evilor pentru o proobabilitate de 0,9545.
Tabel 3.13 Procentul evilor care corespund din punct de vedere al finisajului 98 92 93 91 89 93 95 98 93

seria

Lugimea medie (m)

1 2 3 4 5 6 7 8 9

9.86 9.98 9.57 10.18 10.33 9.82 9.64 9.55 10.14

Problema 2

Cei 600 de salariai ai unei societi de construcii sunt grupai n 35 de echipe de lucru. Numrul de salariai dintr-o echip este diferit. Pentru a realiza un studiu n rndul salariailor s-au selectat aleator nerepetat 9 echipe. n urma prelucrrii datelor din chestionare s-au obinut rezultatele prezentate n tabelul 3.14.
Numrul de salariai Tabel 3.14 Numrul mediu de ore lucreate pe zi de un Salariai care declar c sunt salariat unici ntreintori ai familiei

seria

1 2 3 4 5 6 7 8 9

18 12 24 19 18 17 20 23 16

7,8 9 8 8,2 8,9 9,3 9,8 8,9 7,9

8 6 7 10 9 6 14 17 10

Se cere: 1. S se estimeze numrul mediu de ore lucrate de un muncitor corespunztor unei probabiliti de 0,95. 2. S se estimeze ponderea salariailor unici ntreintori ai familiei pentru aceeai probabilitate.
Problema 3

n cele 5 licee dintr-o localitate sunt 12 clase a XIIa. Numrul de elevi dintr-o clas este diferit (vezi tabelul 3.15). Pentru a realiza un sondaj n rndul acestora s-a selectat un eantion format din patru clase, utilizndu-se procedeul de selecie cu revenire, cu probabiliti proporionale cu talia seriei. n urma calculrii pasului de eantionarea i a alegerii unei numr aleator de debut s-au obinut urmtoarele valori (pe baza crora s-a decis care uniti intr n eantion): 38, 113, 188, 263.

Clasa nr. Elevi

1 31

2 25

3 26

4 29

5 32

6 24

7 20

8 29

9 19

10 17

11 23

Tabel 3.15 12 25

n urma culegerii datelor din cele 4 clase ce au intrat n eantion s-au obinut urmtoarele valori: Numrul mediu de ore de studiu individual pe zi: Y1 = 3,4 h Y2 = 3,9 h, Y3 = 4,1 h Y4 = 3,1 h Ponderea elevilor care fumeaz: w 1 = 32%, w 2 = 20%, w 3 = 25% w 3 = 20% Se cere: 1. Precizai care sunt cele patru clase ce formeaz eantionul. 2. S se estimeze numrul mediu de ore de studiu individual pentru o probabilitate de 0,95. 3. S se estimeze procentul i numrul elevilor care fumeaz pentru o probabilitate de 0,95.

Evaluare