Documente Academic
Documente Profesional
Documente Cultură
EXEMPLE REZOLVATE
Exemplul 1. Rezultatele unui studiu, efectuat pe un eşantion aleator de 64 clienţi ai unei bănci,
referitor la timpul mediu de realizare a operaţiunilor bancare solicitate de către aceştia, sunt:
timpul mediu de realizare a operaţiunilor bancare este 32 de minute, cu o dispersie de 400. Estimaţi
timpul mediu de realizare al operaţiunilor bancare pentru o probabilitate de 95% de garantare a
rezultatelor.
Rezolvare:
Intervalul de încredere este: x − x x + x
Exemplul 2. Pentru un eşantion de 50 de farmacii, ce aparţin unui anumit lanţ farmaceutic, din trei oraşe
reşedinţă de judeţ, s-au înregistrat valorile aferente vânzărilor medii zilnice, în unităţi monetare (u.m.).
După prelucrarea valorilor primare au rezultat datele din tabelul următor:
Număr de Dispersia
Oraşul Vânzări medii zilnice (u.m.)
farmacii vânzărilor
Oraşul A 15 45 100
Oraşul B 22 35 81
Oraşul C 13 66 225
Estimaţi, pentru un nivel de încredere de 95%, valoarea medie a vânzărilor zilnice la nivelul unei farmacii
ce aparţine respectivului lanţ farmaceutic.
1
Rezolvare:
x i ni
45 15 + 35 22 + 66 13
x= i =1
3
= = 46.06 u.m.
n
50
i
i =1
Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor trei grupe/straturi şi nu dispunem de
informaţii referitoare la volumul populaţiei statistice (N = nr. total de farmacii ce aparţine lanţului
farmaceutic respectiv) considerăm sondajul realizat ca fiind stratificat repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
r
s 2 s (n 2
ii i − 1)
sx = , unde s 2 = i =1
n n−r
r
s (n 2
i i − 1)
100 14 + 81 21 + 225 12
s2 = i =1
= = 123.425
n−r 50 − 3
s2 123.425
sx = = = 1.57
n 50
2
Estimaţi proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun, pentru un nivel
de semnificaţie de 5%.
Rezolvare:
Pentru determinarea proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun,
transformăm variabila categorială nealternativă „opinia” într-o variabilă alternativă de tipul:
Opinia Număr de răspunsuri
Cel mult satisfăcător (slab+satisfăcător) 75
Cel puţin bun (bun+excelent) m = 125
Total n = 200
Media şi dispersia variabilei alternative a cărei stare favorabilă este definită de aprecierea noului pachet
legislativ ca fiind cel puţin bun sunt:
m 125
= 0.625 (62,5%); s f = f (1 − f ) = 0.625 0.375 = 0.234
2
f = =
n 200
Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. total de specialişti
din domeniu) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
f (1 − f ) 0.234
sf = = = 0.034
n 200
Intervalul de încredere pentru proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind
cel puţin bun este:
0.625 − 0.067 p 0.625 + 0.067
0.558 p 0.692
Aşadar, proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun este este
cuprinsă între 55,8% şi 69,2%, pentru un nivel de semnificaţie de 5%.
Exemplul 4. In scopul adaptării pachetelor de servicii turistice, o agenţie din domeniu realizează o cercetare
statistică pe un eşantion aleator de volum 5,4% din cei 4800 de clienţi ce au apelat la serviciile agenţiei în
3
anul anterior. Agenţia este interesată în cunoaşterea venitului mediu al clienţilor şi a proporţiei clienţilor cu
studii superioare. Din analize anterioare se cunoaşte că există un grad ridicat de eterogenitate a clienţilor în
funcţie de vârstă. Pentru obţinerea unui eşantion cât mai reprezentativ şi îmbunătăţirea calităţii estimatorilor
obţinuţi s-a recurs la eşantionare stratificată, clienţii fiind împărţiţi în patru grupe omogene astfel: sub 30
ani; 30-40 ani; 40-60 ani; 60 ani şi peste. Subeşantioanele corespunzătoare fiecărui strat sunt direct
proporţionale cu ponderea stratului respectiv în populaţia statistică. După obţinerea şi prelucrarea datelor
utilizând indicatorii statistici descriptivi au fost obţinute următoarele rezultate sintetice:
Venit mediu Abaterea standard a Proporţia clienţilor
Grupe de vârstă
Nr. clienţi lunar venitului cu studii superioare
(ani)
(Eur) (Eur) (%)
sub 30 32 525 144 32
30 - 40 48 1320 387 62
40 - 60 120 2110 695 54
60 şi peste 59 630 85 86
Se cere:
a) Estimaţi, cu o probabilitate de 95% venitul mediu lunar al clienţilor agenţiei de turism.
b) Estimaţi proporţia clienţilor cu studii superioare utilizând o probabilitate de 95% de garantare a
rezultatelor.
Rezolvare
a) Notăm cu:
X variabila venit,
n volumul eşationului,
r numărul straturilor generate de variabila categorială grupa de vârstă
x n i i
525 32 + 1320 48 + 2110 120 + 630 59
x= i =1
r
= = 1430.62 Eur
n
259
i
i =1
Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor patru straturi şi dispunem de
informaţii referitoare la volumul populaţiei statistice (N=4800 de clienţi) considerăm sondajul realizat ca
fiind stratificat nerepetat.
4
Erorile specifice acestui sondaj sunt:
• Eroarea standard (eroarea medie probabilă) este:
s2 n 257180,3
sx = 1 − = 0,946 = 30,65 Eur
n N 259
r
s (n 2
i i − 1)
unde s =
2 i =1
reprezintă dispersia din interiorul grupelor, media dispersiilor de grupă
n−r
144 2 31 + 387 2 47 + 6952 119 + 852 58
s 2
= = 257.180,3
255
• Eroarea maximă admisă este:
x − x x + x
1430 .62 − 60 1430 .62 + 60 Eur
1370 .62 1490 .62 Eur
Venitul mediu lunar al clienţilor agenţiei este cuprins între 1370,62 şi 1490,62 Eur, rezultate garantate
cu o probabilitate de 95%.
fn i i
0,32 32 + 0,62 48 + 0,54 120 + 0,86 59
f = i =1
r
= = 0,6005 (60%)
n
259
i
i =1
Fiind vorba despre un sondaj stratificat nerepetat erorile specifice acestui sondaj sunt:
• Eroarea standard (eroarea medie probabilă) este:
r
n , unde 2
s 2fi ni
s f2
sf = 1 − s f = i =1 şi reprezintă dispersia din interiorul grupelor.
n N n−r
Calculele intermediare necesare determinării mediei dispersiilor de grupă sunt prezentate în următorul
tabel:
5
Grupe de vârstă Nr. clienţi Proporţia clienţilor cu studii Dispersia
(ani) ni superioare (fi) s = f i (1 − f i )
2
f
s 2
fi ni
0.2176 32 + 0.2356 48 + 0.2484 120 + 0.1204 59
s =
2 i =1
= = 0.2164
n−r 259 − 4
f
s f2 n 0,2164
sf = 1 − = 0,946 = 0,028
n N 259
Intervalul de încredere, calculat pe baza erorii limită, conţine adevărata valoare a mediei
μ a variabilei în populaţia statistică în 100 (1 − α )% din cazuri:
( )
P x − zα/ 2 s x μ x + zα/ 2 s x = 1 − α.
Cea mai folosită probabilitate de garantare a rezultatelor este de 95% z 0.025 = 1.96 , adică:
6
x−μ
P (− 1.96 z 1.96 ) = 0.95 , unde z = .
sx
În anumite situaţii se utilizează şi alte nivele de încredere, principiul de bază folosit fiind
găsirea unui echilibru între mărimea intervalului de încredere şi probabilitatea de cuprindere a
parametrului din populaţia statistică. Dacă un interval mai mic înseamnă o precizie crescută, uneori
o probabilitate crescută de garantare a rezultatelor poate fi preferată. Relaţia dintre mărimea
intervalului de încredere şi probabilitatea de garantare a rezultatelor este rezumată în figura 4.2:
În practică, adeseori, problema se pune din perspectiva resurselor financiare disponibile pentru
obţinerea informaţiilor necesare în fundamentarea deciziilor. Astfel, trebuie să determinăm volumul
eşantionului necesar pentru o anumită precizie a rezultatelor. Precizia necesară pentru estimarea
mediei cu un nivel de încredere (1 − α ) , asociată cu mărimea intervalului de încredere pentru media
populaţiei μ , poate fi exprimată, fie prin raportare la mărimea erorii limită ( x ), fie prin raportare
7
Relaţiile de calcul utilizate în dimensionarea volumului eşantionului depind de:
- tipul sondajului (simplu sau stratificat);
- tipul selecţiei (repetată sau nerepetată);
- tipul variabilei (numerică sau categorială alternativă).
repetată n=
2x r
s (n 2
i i − 1)
stratificat z s 2 2
s =
2 i =1
n= n−r
nerepetată z s2 2
+
2
x
N
b) variabilă categorială alternativă
z 2 f (1 − f )
repetată n=
2f
simplu z 2 f (1 − f ) N z 2 f (1 − f )
n= =
nerepetată 2f N + z 2 f (1 − f ) z 2 f (1 − f )
2f +
N
z 2 s f2
repetată n=
2f r
stratificat z s2 2 s 2
fi ni
n ==
f
s =
2 i =1
z 2 s f2 n−r
f
nerepetată
+ 2
f
N
Dacă pe baza calculelor efectuate se obţine un eşantion de volum redus (𝑛 < 30), se
recomandă, dacă este posibil, utilizarea unui eşantion de volum mare (𝑛 ≥ 30).
În cazul sondajului stratificat trebuie determinate volumele subeşantioanelor corespunzătoare
straturilor identificate. Reprezentarea fiecărui strat la nivelul eşantionului poate fi:
8
- proporţională cu ponderea stratului respectiv în populaţia statistică;
- optimizată în funcţie de variabilitatea fiecărui strat sau de costurile şi bugetele disponibile.
Exemplul 5. Determinaţi volumul unui nou eşantion necesar pentru estimarea venitului mediu al
clienților agenției de turism (a se vedea exemplul 4), cu o eroare maximă admisă mai mică cu 30%
în raport cu valoarea determinată în exemplu 4. Repartizaţi noul eşantion proporţional şi optim pe
subeşantioane.
Eroarea maximă admisă determinată în exemplul anterior este x = 60 Eur .
z 2 s x2 1,96 2 257.180,3
n' = = = 498.7 499 clienti
z 2 s x2 1,96 2 257.180,3
x +
'2
42 +
2
N 4.800
Stratificarea noului eşantion se poate realiza prin procedeul repartiţiei proporţionale sau, pe baza
informaţiilor statistice obţinute referitoare la gradul de variabilitate al venitului din fiecare strat,
printr-o repartizare optimă.
Pentru repartizarea proporţională se utilizează relaţia:
Ni
ni' = n '
N
9
Pentru repartizarea optimă se utilizează relaţia:
si N i
ni'' = n ' r
s N
i =1
i i
Repartizarea noului eşantion pe subeşantioane prin procedeele proporţional şi optim este prezentată
în tabelul următor:
Dimensiunea repartiţie repartiţie
stratului în proporţională optimă
Nr. Ponderea
Grupe de populaţia
clienţi stratului si N i si N i
vârstă (ani) statistică n ni'' = n '
ni' =n i' si N i 4
s N
ni ni n 4
n
Ni = i N
n
i =1
i i s
i =1
i Ni
n
sub 30 32 0,12 576 60 82944 0,04 20
30 - 40 48 0,19 912 95 352944 0,17 85
40 - 60 120 0,46 2208 230 1534560 0,74 371
60 şi peste 59 0,23 1104 114 93840 0,05 23
Total 259 1 4800 499 2064288 1 499
10