Documente Academic
Documente Profesional
Documente Cultură
Cap 5 - Copie - Copie
Cap 5 - Copie - Copie
5. 2 NOTIUNI SPECIFICE
SONDAJULUI STATISTIC
∑ (x − x) 2 i
σ2p = p(1− p) σw = w(1− w)
2
σ0 =
2 i =1
i =1
N σ2 =
n
Kf =
∑ df ⋅ 100
n
unde:
K f = coeficientul de realizare a structurii programate a colectivităţii
de selecţie.
Tabelul 5.3
Grupe de
vânzători Distribuţia numărului de vânzători
după Selecţie teoretică În prima selecţie În a doua selecţie
marimea
veniturilor Abateri faţă Abateri faţă de
săptămânal frecvenţe frecvenţe frecvenţe
absolute relative absolute
de cele
frecvenţe
absolute
cele teoretice
e teoretice d f df
(mii lei)
0 1 2 3 4 5 6
sub 200 100 5,0 60 - 40 124 + 24
200 – 220 240 12,0 164 - 76 260 + 20
220 – 240 560 28,0 440 - 120 500 - 60
240 – 260 740 37,0 840 + 100 760 + 20
260 – 280 220 11,0 280 + 60 240 + 20
280 şi peste 140 7,0 216 + 76 116 - 24
TOTAL 2000 100,0 2000 ∑d = 0 f 2000 ∑d = 0f
∑ d = 472
f
∑d f = 168
Cercetarea prin sondaj
( xs ± σ x ) 68,26 % 31,74 %
( xs ± 1,96σ x ) 95,00 % 5,00 %
( xs ± 2σ x ) 95,44 % 4,56 %
( xs ± 2,58σ x ) 99,00 % 1,00 %
( xs ± 3σ x ) 99,73 % 0,27 %
( xs ± 4σ x ) 99,99 % 0,00 %
−∞ x − 3σ x − 2σ x −σ x x +σ x + 2σ x + 3σ +∞
Figura 5.1
σ 02 n
σx = (1 −
) (5.4.)
n N
Pentru caracteristica alternativă, eroarea medie de reprezentativitate
se va nota cu σ w , deci:
p(1− p )
• pentru selecţia repetată: σw = (5.5)
n
p(1− p ) n
• pentru selecţia nerepetată σw = ⋅ (1 − )
n N
Dacă nu se dispune de dipersia din colectivitatea generală, atunci
se poate înlocui cu un estimator al acesteia, adică dispersia de eşantion. În
acest caz se corectează volumul eşantionului din formula erorii medii cu
un grad de libertate.
Calculul erorii medii de reprezentativitate presupune efectuarea
unor calcule necesare determinării erorii limită, ce se poate accepta în
cercetarea prin sondaj.
Deoarece media sondajului folosit pentru estimarea parametrilor
din colectivitatea generală poate lua valori mai apropiate sau mai
îndepărate de media generală, este necesar să se stabilească mărimea
erorii limită. Eroarea limită de reprezentativitate se determină ca o abatere
între media de selecţie şi media colectivităţii generale, garantată cu
probabilitatea corespunzătoare limitelor intervalului de variaţie.
Din formulele prezentate se observă că eroarea limită este o
mărime variabilă, direct proporţională cu probabilitatea cu care se
garantează rezultatele şi invers proporţională cu precizia rezultatelor.
Eroarea limită se poate mări fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează
rezultatele, deoarece pentru condiţii date de timp şi spaţiu dispersia
colectivităţii totale este o valoare constantă.
În concluzie, se poate afirma că eroarea medie şi eroarea limită pot
fi calculate anticipat dacă despre o variabilă statistică se cunosc media şi
dispersia generală sau un estimator al acestora şi s-a stabilit cu ce volum
al eşantionului se va lucra şi cu ce probabilităţi se vor garanta rezultatele.
Pentru acelaşi volum al eşantionului se obţine o singură eroare medie şi
STATISTICA
44
w= = 0,37
120
σ w2 = w( 1 − w ) = 0,37( 1 − 0,37 ) = 0,2331
Ne propunem să calculăm indicatorii de selecţie ( σ x şi ∆ x , σ w şi
∆ w ), în condiţiile în care rezultatele vor fi garantate cu o probabilitate
p = Φ(z)=0,95 la care corespunde z = 1,96.
• selecţia repetată:
σ s2 211,56
σx = = = 1,33 mil lei
n 120
∆ x = z ⋅ σ x = 1,96 ⋅ 1,33 = 2,60 mil lei
• selecţia nerepetată:
w( 1 − w ) 0,2331
µw = σ w = = = 0,044
n 120
∆w = zα µ w = 1,96 ⋅ 0,044) = 0,0862 sau 8,6%
Cercetarea prin sondaj
• selecţia nerepetată
w( 1 − w ) N − n 0,2331 120
µw = σ w = = 1 − = 0,042
n N −1 120 1200
1200
517284 < ∑ xi < 523524 mil. lei
i =1
• selecţia nerepetată
N ( xs ± ∆ x ) = 1200(433,6 7 ± 2,47)
1200
517440 < ∑ xi < 523368 mil. lei
i =1
Proporţia societăţilor care vor realiza un volum al desfacerilor mai
mare decât media, în colectivitatea generală, se va situa între următoarele
valori pentru:
• selecţia repetată
w − ∆w < p < w + ∆w
0,37 − 0,0862 < p < 0,37 + 0,0862
0,2838 < p < 0,4562
• selecţia nerepetată
0 ,37 − 0 ,082 < p < 0,37 + 0,082
0,288 < p < 0 ,452
În continuare trebuie să se determine volumul necesar pentru
proiectarea unui nou sondaj dacă rezultatele se garantează cu aceeaşi
probabilitate iar eroarea limită se micşorează de 1,1 ori.
Aplicând formulele de calcul vom obţine pentru:
• selecţia repetată
z 2σ s2 1,9 2 * 211,56
n= 2
= 2
= 137 societăţi comerciale
∆x 2 ,60
1,1 1,1
• selecţia nerepetată
z 2σ s2 1,9 2 * 211,56
n= 2
= 2
= 135 societăţi
∆x z 2σ s2 2,47 1,9 2 * 211,56
+ +
1,1 N 1,1 1200
comerciale
Cercetarea prin sondaj
σ2
σx = pentru selecţia repetată
n
σ2 n
σx = 1 − pentru selecţia nerepetată
n N
• eroarea limită maximă admisă
σ2
∆x = z ⋅ pentru selecţia repetată
n
σ2 n
∆x = z ⋅ 1 − pentru selecţia nerepetată
n N
• estimarea mediei la nivelul colectivităţii generale
x − ∆ x < x0 < x + ∆ x
unde
x=
∑ xi ni
∑ ni
• estimarea nivelului totalizat al caracteristicii
N
N ( x − ∆ x ) < ∑ xi < N ( x + ∆ x )
i =1
• dimensionarea eşantionului
z 2σ 2
n= 2
pentru selecţie repetată
∆x
STATISTICA
z 2σ 2
n= pentru selecţie nerepetată
z 2σ 2
∆2x +
N
Pentru estimarea cheltuielilor suplimentare medii şi totale zilnice
efectuate de turiştii din cadrul unui sejur de 3 zile s-a efectuat un sondaj
stratificat proporţional de 5%, datele înregistrate s-au prelucrat şi
rezultatele calculelor sunt prezentate în tabelul 5.6.
• dispersiile de grupă σ i2 ( )
σi vi ⋅ y i
vi = ⋅ 100 de unde: σi =
yi 100
20 ⋅ 200
σ1 = = 40 mii lei/turist ⇒ σ 12 = 1600
100
25 ⋅ 300
σ2 = = 75 mii lei/turist ⇒ σ 22 = 5625
100
33 ⋅ 400
σ3 = = 132 mii lei/turist ⇒ σ 32 = 17424
100
y − ∆ y < y0 < y + ∆ y
de unde:
N
N ( y − ∆ y ) < ∑ yi < N ( y + ∆ y )
i =1
8000
8000 ⋅ 281,862 < ∑ yi < 8000 ⋅ 298,138
i =1
8000
2154896 < ∑ yi < 2385104 mii lei
i =1
z 2 ⋅ σ 02
n=
z 2 ⋅ σ 02
∆2y +
N
Deoarece nu cunoaştem dispersia totală din colectivitatea generală
ci numai datele despre eşantionul format prin respectarea principiilor unei
scheme probabilistice, putem înlocui acest indicator prin dispersia totală a
datelor din eşantion.
Cercetarea prin sondaj
σ2 = δ2 + σ 2
r
∑ ( yi − y )ni
i =1 ( 200 − 290 )2 ⋅ 130 + ( 300 − 290 )2 ⋅ 180 + ( 400 − 290 ) 2 ⋅ 90
δ2 = r
=
400
∑ ni
i =1
= 5400
2 2 ⋅ 12371,65
n= = 684 turişti.
2 2 ⋅ 12371,65
2
8,138 +
8000
z 2 ⋅σ 2
n′ = 2
⋅σ 2
(∆ ′y )2 + z N
unde:
4 ⋅ 6971,65
n′ = = 364 turişti
2 4 ⋅ 6971,65
8,545 +
8000
• neproporţională
n 364
ni = = ≅ 121 turişti
r 3
• proporţională
Ni
ni = n r
∑ Ni
i =1
Tabelul 5.7
Grupe de Numărul % ni
turişti după turiştilor turiştilor
vârstă ( Ni ) Ni
⋅ 100
(ani) r
∑ Ni
i =1
0 1 2 4
Sub 30 2600 32,5 118
30-50 3600 45,0 164
50 si peste 1800 22,5 82
TOTAL 8000 100,0 364
Cercetarea prin sondaj
De reţinut:
• Pentru a obţine acelaşi grad de precizie a rezultatelor, eşantionul
constituit prin stratificare este mai mic decât cel pentru sondajul
aleator simplu;
• Pentru acelaşi volum al eşantionului, precizia este mai mare în
cazul sondajului stratificat decât în cazul sondajului aleator
simplu;
• Eşantionul trebuie dimensionat astfel încât fiecare subeşantion să
conţină un număr suficient de unităţi pentru a permite calcularea
dispersiilor la nivelul subeşantioanelor (ni>35);
Aplicaţie
Tabelul 5.8
Nr.crt. Durata medie ( xi − x s ) 2
al seriei de ardere (în
ore)
( xi )
A 1 2
1 2100 2809
2 2250 9409
3 2080 5329
4 1950 41209
5 2325 29584
6 2230 5929
7 2170 289
8 2050 10609
9 2175 484
10 2200 2209
TOTAL 21530 107860
xs =
∑ xi = 21530 = 2153 ore/bec
r 10
δ s2 R − r 10786 200 − 10
∆x = z ⋅ = 1,96 ⋅ = 62,9 ore
r R −1 10 200 − 1
xs − ∆x < x0 < xs + ∆x
de unde:
2153 - 62,9 < x0 < 2153 + 62,9
2090,1 < x 0 < 2215,9 ore/bec
5.6.2 Teste-grilă
d) evitabile.
4. Precizia sondajului aleator repetat se dublează dacă:
a) eşantionul se dublează;
b) eşantionul se reduce la jumătate;
c) volumul eşantionului se măreşte de 4 ori;
d) volumul eşantionului se micşorează de 4 ori;
e) nu există legătură între volumul eşantionului şi precizia
sondajului.
5. Precizia sondajului creşte dacă:
a) se măreşte volumul eşantionului;
b) se micşorează volumul eşantionului;
c) se fac selecţii dirijate.
6. Dacă s-a exclus orice intervenţie subiectivă la alegerea
eşantionului, atunci selecţia este:
a) aleatoare;
b) dirijată;
c) mixtă;
d) incorectă.
7. Comparativ cu selecţia repetată, selecţia nerepetată
presupune:
a) erori mai mari;
b) erori mai mici;
c) acelaşi nivel de eroare;
d) exclude erorile.
d) cantitative şi calitative.
Alegeţi combinaţia corectă: A(a,c); B(a,b,c); C(d).
10. În cazul colectivităţiilor omogene formate din unităţi simple,
neîmpărţite în grupe, se utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
11. În cazul colectivităţiilor neomogene formate din unităţi
simple, împărţite în grupe, se utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
12. În cazul colectivităţiilor formate din unităţi complexe, se
utilizează:
a) selecţia aleatoare simplă;
b) selecţia mecanică;
c) selecţia tipică;
d) selecţia de serii.
13. Pentru a obţine aceeaşi precizie a rezultatelor, eşantionul
constituit prin stratificare (sondaj tipic) este:
a) mai mic decât cel pentru sondajul aleatoriu simplu;
b) mai mare decât cel pentru sondajul aleatoriu simplu;
c) egal cu cel pentru sondajul aleatoriu simplu.
14. La acelaşi volum al eşantionului, în cazul sondajului aleatoriu
simplu precizia este:
a) mai mare decât la sondajul tipic;
b) mai mică decât la sondajul tipic; c) egală.
Soluţii:
1.a; 2.b; 3.b; 4.c; 5.a; 6a; 7.b; 8.b; 9.A; 10.a; 11.c; 12.d; 13.a; 14.b.