Documente Academic
Documente Profesional
Documente Cultură
CERCETAREA SELECTIVĂ
N n
Abaterea medie
pătratică
σ 0 = σ 02 σ = σ2 σ p = σ 2p σ w = σ w2
Eroarea de reprezentativitate:
Er = x − x0
Condiţia ca media eşantionului să fie reprezentativă:
x − x0 ⋅ 100 ≤ 5%
x0
Eroarea medie de reprezentativitate:
k
∑ (x s − x0 ) 2 ns
μx =σx = s =1
k
∑n
s =1
s
în care :
k - reprezintă numărul eşantioanelor posibile;
ns - frecvenţele mediilor de selecţie posibile.
Eroare limită maximă admisă (Δ x ) .
Δ x = zσ x
unde coeficientul zα reprezintă argumentul funcţiei Laplace pentru
probabilitatea Φ (z ) cu care se garantează rezultatele.
102
SELECŢIA ALEATOARE SIMPLĂ
σ 02 ⎛ N − n ⎞ σ2 ⎛ N −n⎞ σ2 ⎛ n⎞
σ xnerep = ⎜ ⎟≈ ⎜ ⎟≈ ⎜1 − ⎟
n ⎝ N −1⎠ n ⎝ N −1⎠ n ⎝ N⎠
Pentru caracteristica alternativă, eroarea medie de reprezentativitate se va
nota cu σ w , deci:
• pentru selecţia repetată:
p(1 − p) w(1 − w)
σ wrep = ≈
n n
• pentru selecţia nerepetată
p(1 − p) n w(1 − w) n
σwnerep = ⋅ (1 − ) = ⋅ (1 − )
n N n N
Eroarea limită maximă admisă:
• pentru selecţie repetată
Δ x = z ⋅ σ x rep respectiv Δ w = z ⋅ σ w rep
103
Volumul eşantionului
• pentru sondajul simplu repetat:
σ 02 z 2σ 02
Δx = z de unde: n=
n Δ2x
• pentru sondajul simplu nerepetat:
σ 02 ⎛ n⎞ z 2σ 02
Δx = z ⎜1 − ⎟ de unde: n=
n ⎝ N⎠ z 2σ 02
Δ2x +
N
Redimensionarea eşantionului prin modificarea erorii limite maxime
admise ( Δ' x ):
• pentru selecţie repetată:
z 2σ 2
n' =
( )
Δ' x
2
104
n1 n n
= 2 = ... = i = ... =
∑n = n
i
N1 N 2 Ni ∑N ∑N i i
de unde:
Ni
ni = n
∑N i
Acest tip de selecţie se mai numeşte selecţia tipică (stratificată)
proporţională.
3. La formarea subeşantioanelor se ia în consideraţie atât ponderea
fiecărui strat în colectivitatea generală cât şi gradul de omogenitate al
straturilor, reprezentat de abaterea pătratică medie:
N iσ i
ni = n k
∑Nσ
i =1
i i
σ2
σy = pentru selecţia repetată
n
σ2⎛ n⎞
σy = ⎜1 − ⎟ pentru selecţia nerepetată
n ⎝ N⎠
• eroarea limită maximă admisă
σ2
Δy = z ⋅ pentru selecţia repetată
n
σ2⎛ n⎞
Δy = z ⋅ ⎜1 − ⎟ pentru selecţia nerepetată
n ⎝ N⎠
unde:
y=
∑yn i i
∑n i
105
• estimarea nivelului totalizat al caracteristicii
N v
N(y − Δy) < ∑y
i =1
i < N(y + Δy )
• dimensionarea eşantionului
z 2σ 2
n= pentru selecţie repetată
Δ2y
z 2σ 2
n= pentru selecţie nerepetată
z 2σ 2
Δ2y +
N
De reţinut:
• Pentru a obţine acelaşi grad de precizie a rezultatelor, eşantionul
constituit prin stratificare este mai mic decât cel pentru sondajul aleator
simplu;
• Pentru acelaşi volum al eşantionului, precizia este mai mare în cazul
sondajului stratificat decât în cazul sondajului aleator simplu;
• Eşantionul trebuie dimensionat astfel încât fiecare subeşantion să
conţină un număr suficient de unităţi pentru a permite calcularea
dispersiilor la nivelul subeşantioanelor (ni > 40);
SELECTIA DE SERII
δ x2
σ xrep =
r
δ x2 R−r
σ xnerep = ;
r R −1
106
• pentru caracteristici alternative
δ p2
σ w rep =
r
δ p2 R−r
σ w nerep = .
r R −1
δ2
Δx = z ⋅ pentru selecţia repetată
r
δ2 ⎛ R−r⎞
Δx = z ⋅ ⎜ ⎟ pentru selecţia nerepetată
r ⎝ R −1⎠
Dimensionarea eşantionului
z 2δ 2
n= pentru selecţia repetată
Δ2x
Rz 2δ 2
n= pentru selecţia nerepetată
( R − 1)Δ2x + z 2δ 2
Teste de semnificaţie
w1 − w2
Dacă > 3,
⎡1 1⎤
p ⋅ q⎢ + ⎥
⎣ n1 n2 ⎦
diferenţa dintre cele două proporţii este semnificativă.
Cazul 2 (proporţiile în cele două populaţii din care s-au format
eşantioanele nu sunt egale, fapt pentru care se folosesc dispersiile eşantioanelor)
w1 − w2
Dacă >3
w1 (1 − w1 ) w2 (1 − w2 )
+
n1 n2
108
Compararea dispersiilor necunosute a două eşantioane de volum redus
x1 − x2
tcalc =
1 1
S +
n1 n2
n1 n2
∑
i =1
( xi − x1 ) 2 + ∑ ( x' − x )
i =1
i 2
2
unde S =
n1 + n2 − 2
Dacă tcalculat<ttabelar se admite ipoteza diferenţei nule (valoarea tabelară se
stabileşte pentru numărul gradelor de libertate V=n1 + n2 - 2).
Testul F (Fisher) pentru verificarea egalităţii dispersiilor a două
eşantioane de volum redus
S12
Fcalc =
S 22
109
3.2. PROBLEME REZOLVATE
Rezolvare
∑x ⋅n
i =1
i i
1 ⋅ 5 + 3 ⋅ 15 + 5 ⋅ 20 + 7 ⋅ 8 + 9 ⋅ 2
x= 5
= = 4,48 mii RON/client
50
∑n i =1
i
• calcularea dispersiei:
110
5
∑ ( x − x) ⋅ n
2
i i
i =1
σ2= 5
=
∑n
i =1
i
2 2 2 2 2
=
(1− 4,48) ⋅ 5 + (3 − 4,48) ⋅ 15 + (5 − 4,48) ⋅ 20 + (7 − 4,48) ⋅ 8 + (9 − 4,48) ⋅ 2 =
50
= 3,8096
2 ⋅ 3,8096
2
2
(0,8) +
500
111
4. În cazul variabilei alternative, indicatorii se calculează astfel :
• media
m 20
w= = = 0 ,4
n 50
Interpretare: 40% dintre clienţi au valoarea depozitelor peste 4 mii
RON.
• dispersia
σ 2w = w ⋅ (1 − w) = 0,24
• eroarea limită maximă admisă :
σ 2w (1 − n ) = 2 ⋅ 0,24 ⋅ 0,9 = 0,13
Δ w = z ⋅σ w = z ⋅
n N 50
Estimarea proporţiei clienţilor cu valoarea depozitelor sub valoarea
considerată drept prag (4 mii RON):
w − Δw < p < w + Δw
0,4 − 0,13 < p < 0,4 + 0,13
0,27 < p < 0,53
Ponderea clienţilor care au valoarea depozitelor sub 4 mii RON este
cuprinsă între 27 şi 53%.
Estimarea numărului clienţilor cu valoarea depozitelor sub valoarea
considerată drept prag (4 mii RON):
N ⋅ ( w − Δ w) < M < N ⋅ ( w + Δ w)
500 ⋅ (0,4 − 0,13) < M < 500 ⋅ (0,4 + 0,13)
135 < M < 265
Numărul clienţilor care au valoarea depozitelor sub 4 mii RON este
cuprins între 135 şi 265.
112
Rezolvare
z 2σ 2
n' =
( )2
Δ' x +
z 2σ 2
N
'
Δ x = Δ x + 5% ⋅ Δ x = 1,05 ⋅ 8,37 = 8,7885 mii RON
3 ⋅ 900
2
n=
'
= 94,9 ≈ 95 unităţi hoteliere
3 ⋅ 900
2
2
8,7885 +
1000
n′ =
(z ')2 ⋅ σ 2 ; z' = 2 ;
(Δ x ) +
2 ( z ') ⋅ σ 2
2
N
2 ⋅ 900
2
n′ = = 48,87 ≈ 49 unităţi hoteliere
2 2
2
⋅ 900
8,37 +
1000
Între probabilitatea cu care se garantează rezultatele şi volumul
eşantionului există relaţie de directă proporţionalitate.
114
4. să se estimeze procentul maxim al sucursalelor care au o valoare a
depozitelor de cel puţin 240 mii RON;
5. să se estimeze valoarea medie a depozitelor şi valoarea totală la nivelul
colectivităţii generale pentru sucursalele care au sub 30 de angajaţi.
Rezolvare
∑ j =1
y j ⋅ n. j ∑y j =1
j ⋅ n. j
180 ⋅ 10 + 220 ⋅ 30 + 260 ⋅ 40 + 300 ⋅ 15 + 340 ⋅ 5
y= m
= 5
= =
100
∑nj =1
.j ∑nj =1
.j
∑y
j =1
j ⋅ nij
yi = m
∑n j =1
ij
∑y
j =1
j ⋅ n1 j
180 ⋅ 10 + 220 ⋅ 25 + 260 ⋅ 20
y1 = 5
= = 227 ,27 mii RON/sucursală
55
∑n j =1
1j
∑y
j =1
j ⋅ n2 j
220 ⋅ 5 + 260 ⋅ 20 + 300 ⋅ 15 + 340 ⋅ 5
y2 = 5
= = 277 ,77 mii RON/ sucursală
45
∑n
j =1
2j
∑ (y
j =1
j − yi ⋅ nij )
2
σ i2 = m
∑n j =1
ij
115
5 2
∑(y
j =1
j
− y1 ) ⋅n 1j
σ 12 = 5
=
∑n
j =1
1j
2 2 2
(180 − 227 ,27 ) ⋅ 10 + (220 − 227 ,27 ) ⋅ 25 + (260 − 227 ,27 ) ⋅ 20
= = 819,83
55
m
∑( y
2
j − y2 ) ⋅ n2 j
j =1
σ 22 = 5
=
∑n
j =1
2j
∑σ i2 ⋅ ni ∑σ i ⋅ ni
2
819,83 ⋅ 55 + 1106 ,17 ⋅ 45
σ2 = i =1
r
= i =1
2
= = 948,68
100
∑n
i =1
i ∑n
i =1
i
σ2 n 948,68
Δ y = z ⋅σ y = z ⋅ (1 − ) = 3⋅ ⋅ 0,9 = 8,76 mii RON
n N 100
Estimarea valorii medii a depozitului:
y − Δ y < y0 < y + Δ y
250 − 8,76 < y0 < 250 + 8,76
241,24 < y0 < 258,76 mii RON/sucursală
Estimarea valorii totale a depozitelor:
N
(
N ⋅ y − Δy < ) ∑y j < N ⋅ y + Δy ( )
j =1
N
1000 ⋅ 241,24 < ∑y j =1
j < 1000 ⋅ 258,76
N
241240 < ∑y
j =1
j < 258760 mii RON
116
2. Dimensionarea noului volum al eşantionului:
z ⋅σ
2 2
n′ =
( )
⋅σ 2
2
Δ' y + z
N
'
Δ y = Δ y ⋅ 1,2 = 8,76 ⋅ 1,2 = 10,512 mii RON
3 ⋅ 948,68
2
n' = = 71,72 ≈ 72 sucursale
3 ⋅ 948,68
2
110,5 +
1000
Distribuirea noului volum al eşantionului pe subeşantioane :
• distribuirea neproporţională (eşantioane de volum egal):
n' 72
ni' = = = 36 sucursale
r 2
• distribuirea proporţională (considerând că eşantioanele respectă
structura colectivităţii generale):
55
n1' = ⋅ 72 = 39,6 ≈ 40 sucursale au sub 30 de angajaţi
100
45
n2' = ⋅ 72 ≈ 32 sucursale au peste30 de angajaţi
100
• distribuirea optimă (la formarea subeşantioanelor se ia în
considerare atât ponderea fiecărui strat în colectivitatea generală,
cât şi gradul de omogenitate al straturilor reprezentat de abaterea
medie pătratică):
n1σ 1 55 ⋅ 28.63
n1' = n ' ⋅ = 72 ⋅ = 36 ,9 ≈ 40 sucursale au sub 30 ang.
2
55 ⋅ 28.63 + 45 ⋅ 32.25
∑n σ
i =1
1 1
n2σ 2 45 ⋅ 32.25
n2' = n ' ⋅ = 72 ⋅ ≈ 32 sucursale au peste 30 angajaţi.
2
55 ⋅ 28.63 + 45 ⋅ 32.25
∑n σ
i =1
2 2
∑ (y
j =1
j )
− y ⋅ n. j
2
2
(300 − 250 ) 2 ⋅15 + (340 − 250 ) ⋅ 5
+ = 1580
100
3 ⋅ 1580
2
n' = = 156 ,33 ≈ 156 sucursale
3 ⋅ 1580
2
2
8,76 +
1000
Se observă că volumul eşantionului în cazul sondajului simplu e mai mare
decât volumul eşantionului în cazul sondajului stratificat pentru acelaşi grad de
reprezentativitate.
4. Estimarea valorii medii a depozitelor pentru sucursalele care au sub 30
de angajaţi.
y1 − Δ y1 < y0 (1) < y1 + Δ y1
n ⎞
σ 12 ⎛ 819,83
Δ y1 = z ⋅ ⋅ ⎜⎜ 1 − 1 ⎟⎟ = 3 ⋅ ⋅ 0,9 = 10,98 mii RON
n1 ⎝ N1 ⎠ 55
227 ,27 − 10,98 < y0 (1) < 227 ,27 + 10,98
216 ,29 < y0 (1) < 238,25 mii RON/sucursală
Estimarea valorii totale a depozitelor pentru sucursalele care au sub 30 de
angajaţi.
N1
(
N 1 ⋅ y1 − Δ y1 < ) ∑y j (
< N 1 ⋅ y1 − Δ y1 )
j =1
N1
118959,5 < ∑y
j =1
j < 131037 ,5 mii RON
118
În vederea estimării procentului maxim sunt necesare următoarele calcule:
• calcularea mediilor de grupă pentru caracteristica alternativă ( wi ) şi a
mediei pe total (w) (vezi tabelul 3.4, coloana 4)
• calcularea dispersiilor de grupă σ 2wi ( vezi tabelul 3.4, coloana 5)
• calcularea mediei dispersiilor de grupă:
2
∑σ 2
wi
0,2304 ⋅ 55 + 0,1056 ⋅ 45
σw = i =1
2
= = 0,17424
100
∑n
i =1
i
119
nerepetată, iar rezultatele se garantează cu o probabilitate de 0,9973
(z=3);
2. să se estimeze volumul eşantionului dacă probabilitatea cu care se
garantează rezultatele este 0,9545 (z=2) şi să se precizeze relaţia care
există între probabilitate şi volumul eşantionului;
3. să se estimeze numărul de salariaţi din colectivitatea generală care au
vechimea peste 16 ani.
Rezolvare
1. Estimarea vechimii medii a angajaţilor la nivelul colectivităţii
generale:
x − Δ x < x0 < x − Δ x
............ < x0 < ..............
Pentru estimarea mediei trebuie să calculăm următorii indicatori în
prealabil:
• eroarea medie de reprezentativitate:
σ2 ⎛
n⎞
σx = ⎜1 − ⎟ =
n ⎝ N⎠
• eroarea limită maximă admisă:
Δ x = z ⋅σ x =
• calcularea mediei eşantionului:
6
∑x n
i =1
i i
x= 6
=
∑n
i =1
i
• calcularea dispersiei:
6
∑ (x − x ) n i
2
i
σ =
2 i=1
6
=
∑n
i =1
i
n′ =
(z ')2 ⋅ σ 2 =
(Δ x ) +
2 ( z ') ⋅ σ 2
2
N
Între probabilitatea cu care se garantează rezultatele şi volumul
eşantionului există o relaţie de ................... proporţionalitate.
120
Avem o caracteristică alternativă.
Tabelul 3.7.
Răspuns Număr salariaţi
A 1
DA m=
Nu n-m=
Total n=
Rezolvare
1. Calculul erorilor de reprezentativitate
• Eroarea medie de reprezentativitate:
σ2 ⎛ n⎞
σx = ⎜1 − ⎟ =
n ⎝ N⎠
• Eroarea limită maximă admisă:
Δ x = z ⋅σ x =
Pentru determinarea celor două erori va trebui să determinăm media şi dispersia
eşantionului:
• calcularea mediei eşantionului:
7
∑x n
i =1
i i
x= 7
=
∑n
i =1
i
• calcularea dispersiei:
7
∑ (x − x ) n i
2
i
σ2 = i=1
7
=
∑n
i =1
i
n
……… < ∑ x < ………
i =1
i
122
Avem o caracteristică alternativă şi indicatorii se calculează astfel:
• media caracteristicii alternative (w):
m
w= =
n
• dispersia caracteristicii alternative:
σ w2 = w ⋅ (1 − w) =
Tabelul 3.9.
Răspuns Număr angajaţi
A 1
DA m=
Nu n-m=
Total n=
• eroarea limită maximă admisă :
σ w2 n
Δw = z ⋅σ w = z ⋅ (1 − )=
n N
Problema 3: Dintr-un sondaj organizat pentru 100 sucursale ale unor bănci
comerciale din România s-au obţinut următoarele rezultate:
Tabelul 3.10.
Grupe de sucursale Număr Valoarea medie Coeficientul de
după numărul sucursale a creditelor variaţie (%)
angajaţilor de la acordate (mii
Departamentul Credite RON)
0 1 2 3
Sub 5 20 200 2,5
5 – 10 50 250 2
10 şi peste 30 280 3
Total 100 - -
123
Rezolvare
∑ y ⋅n
i =1
i i
y= 3
=
∑n i =1
i
σ1 = ⇒ σ 12 =
σ2 = ⇒ σ 22 =
σ3 = ⇒ σ 32 =
∑σ i
2
⋅ ni
σ =
2 i =1
3
=
∑n
i =1
i
∑ (y − y )
2
i ⋅ ni
δ =
2 i =1
3
=
∑n
i =1
i
124
2. Estimarea valorii medii a creditelor acordate:
y − Δ y < y0 < y + Δ y
Eroarea limită maximă admisă:
σ2 n
Δ y = z ⋅σ y = z ⋅ (1 −
)=
n N
Estimarea valorii totale a creditelor acordate:
N
N ⋅(y − Δy) < ∑y
j =1
j < N ⋅(y + Δy )
3.
3.1. Volumul noului eşantion în cazul în care eroarea limită creşte cu 20%:
z ⋅σ
2 2
n′ = =
( ) ⋅σ 2
2
'
Δy + z
N
'
Δy =
Distribuirea proporţională pe subeşantioane:
n
ni′ = 3 i ⋅ n′
∑n
i =1
i
n′ =
(z′)2 ⋅ σ 2 =
( )
Δy +
(z′)2 ⋅ σ 2
N
125
Distribuirea proporţională pe subeşantioane:
ni
ni = ⋅ n'
'
3
∑ ni
i =1
Rezolvare
126
m
∑yj =1
j ⋅ nij
yi = m
∑n j =1
ij
Prin urmare,
4
∑y
j =1
j ⋅ n1 j
y1 = 4
=
∑n
j =1
1j
∑y
j =1
j ⋅ n2 j
y2 = 4
=
∑n
j =1
2j
∑y
j =1
j ⋅ n3 j
y3 = 4
=
∑n
j =1
3j
• dispersiile de grupă:
m
∑ (y
j =1
j )
2
− yi ⋅ nij
σ i2 = m
∑n
j =1
ij
Prin urmare,
4
∑ (y
j =1
j )
− y1 ⋅ n1 j
2
σ 12 = m
=
∑n
j =1
1j
∑ (y
j =1
j )
− y2 ⋅ n2 j
2
σ 22 = m
=
∑n
j =1
2j
127
4
∑ (y
j =1
j )
− y3 ⋅ n3 j
2
σ 32 = m
=
∑n
j =1
3j
∑σ i
2
⋅ ni.
σ = 2 i =1
r
=
∑n
i =1
i.
∑ ni
i =1
Concret,
n1
n1 = 3 ⋅ n =
' '
∑ ni
i =1
n2
n2 = ⋅ n' =
'
3
∑ ni
i =1
128
n3
n3 = ⋅ n' =
'
3
∑ ni
i =1
∑σ 2
wi ⋅ ni
σ = 2
w
i =1
3
=
∑n
i =1
i
129
3.4. TEMĂ
130
1. să se estimeze numărul mediu al clienţilor dintr-o săptămână pentru o
unitate hotelieră de pe litoral, precum şi numărul total al clienţilor dacă
probabilitatea cu care se garantează rezultatele este 0,9545 (z=2);
2. câte unităţi hoteliere ar trebui incluse în eşantion dacă s-ar organiza un
nou sondaj cu o eroare limită mai mică cu 5%?
3. care este ponderea estimată a hotelurilor care au peste 300 de clienţi
săptămânal de pe litoral?
R: 1. x = 320 unităţi hoteliere; σ 2 = 3100 ; Δ x = 11,81101 ; 2. n' = 87
unităţi hoteliere; Δ'x = 11,22046 ; 3. w = 0,125; Δ w = 0,07 .
Problema 3. Pentru studierea cheltuielilor pentru alimente ale populaţiei
dintr-o regiune s-a organizat un sondaj pe un eşantion format din 100 gospodării
dintr-un total de 1500. Pentru aceste gospodării s-au înregistrat cheltuielile medii
lunare, iar în urma prelucrării datelor s-au obţinut următoarele rezultate:
100
∑x
i =1
i = 20 mii RON
100
∑ (x − x )
i =1
i
2
= 27 mii RON
Se cere:
1. să se estimeze nivelul mediu al cheltuielilor alimentare pe gospodărie
pentru întreaga regiune dacă rezultateale se garantează cu o
probabilitate de 0,9545 (z=2);
2. să se estimeze nivelul total al cheltuielilor alimentare pentru întreaga
regiune dacă rezultateale se garantează cu o probabilitate de 0,9545
(z=2).
131
2. să se stabilească limitele între care se vor încadra profitul mediu şi total
în colectivitatea generală dacă probabilitatea cu care se garantează
rezultatele este P=0,9545 (z=2).
R: 1. y = 30,5 mii RON/ag. ec.; σ 2 = 37,21 ; δ 2 = 27,25 ; R 2 = 0,73233
2. Δ y = 0,4234 mii RON/agent ec.
132
3.5. INTREBĂRI RECAPITULATIVE
133