Sunteți pe pagina 1din 10

SEMINAR 6.

EXEMPLE REZOLVATE

Exemplul 1. Rezultatele unui studiu, efectuat pe un eşantion aleator de 64 clienţi ai unei bănci,
referitor la timpul mediu de realizare a operaţiunilor bancare solicitate de către aceştia, sunt:
timpul mediu de realizare a operaţiunilor bancare este 32 de minute, cu o dispersie de 400. Estimaţi
timpul mediu de realizare al operaţiunilor bancare pentru o probabilitate de 95% de garantare a
rezultatelor.
Rezolvare:
Intervalul de încredere este: x −  x    x +  x

Estimatorii determinaţi la nivelul eşantionului ( n = 64 clienţi) au valorile:


x = 32 min; s 2 = 400 ; s = 20 min.
Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. de clienţi ai
băncii) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
s 20
sx = = = 2.5 .
n 8
• Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)
 x = z / 2  s x = 1.96  2.5 = 4.9  5 min.
Timpul mediu de realizare a operaţinilor bancare, pentru o probabilitate de 95%, este
cuprins între 27 şi 37 de minute.

Exemplul 2. Pentru un eşantion de 50 de farmacii, ce aparţin unui anumit lanţ farmaceutic, din trei oraşe
reşedinţă de judeţ, s-au înregistrat valorile aferente vânzărilor medii zilnice, în unităţi monetare (u.m.).
După prelucrarea valorilor primare au rezultat datele din tabelul următor:
Număr de Dispersia
Oraşul Vânzări medii zilnice (u.m.)
farmacii vânzărilor
Oraşul A 15 45 100
Oraşul B 22 35 81
Oraşul C 13 66 225

Estimaţi, pentru un nivel de încredere de 95%, valoarea medie a vânzărilor zilnice la nivelul unei farmacii
ce aparţine respectivului lanţ farmaceutic.

1
Rezolvare:

Intervalul de încredere este: x −  x    x +  x

x - reprezintă valoarea medie a vânzărilor la nivelul eşantionului, valoare determinată ca medie a


mediilor de grupă:
3

x i  ni
45  15 + 35  22 + 66  13
x= i =1
3
= = 46.06 u.m.
n
50
i
i =1

Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor trei grupe/straturi şi nu dispunem de
informaţii referitoare la volumul populaţiei statistice (N = nr. total de farmacii ce aparţine lanţului
farmaceutic respectiv) considerăm sondajul realizat ca fiind stratificat repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
r

s 2  s (n 2
ii i − 1)
sx = , unde s 2 = i =1

n n−r
r

 s (n 2
i i − 1)
100 14 + 81  21 + 225 12
s2 = i =1
= = 123.425
n−r 50 − 3

s2 123.425
sx = = = 1.57
n 50

• Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


 x = z / 2  s x = 1.96  1.57 = 3.08 u.m.

Intervalul de încredere pentru valoarea medie a vânzărilor este:


46 .06 − 3.08    46 .06 + 3.08
Aşadar, valoarea medie a vânzărilor medii zilnice la nivelul unei farmacii ce aparţine respectivului lanţ
farmaceutic este cuprinsă între 42,98 şi 49,14 u.m., pentru un nivel de încredere de 95%.

Exemplul 3. Un eşantion de 200 de specialişti în domeniu au fost rugaţi să analizeze şi să formuleze


aprecieri asupra noului pachet legislativ din domeniul sănătăţii supus dezbaterii publice. Rezultatele
sistematizate sunt:
Opinia Excelent Bun Satisfăcător Slab
Număr de răspunsuri 45 80 64 11

2
Estimaţi proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun, pentru un nivel
de semnificaţie de 5%.

Rezolvare:

Pentru determinarea proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun,
transformăm variabila categorială nealternativă „opinia” într-o variabilă alternativă de tipul:
Opinia Număr de răspunsuri
Cel mult satisfăcător (slab+satisfăcător) 75
Cel puţin bun (bun+excelent) m = 125
Total n = 200

În cazul unei variabile categoriale alternative intervalul de încredere este: f −  f  p  f +  f .

Media şi dispersia variabilei alternative a cărei stare favorabilă este definită de aprecierea noului pachet
legislativ ca fiind cel puţin bun sunt:

m 125
= 0.625 (62,5%); s f = f (1 − f ) = 0.625  0.375 = 0.234
2
f = =
n 200
Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. total de specialişti
din domeniu) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
f (1 − f ) 0.234
sf = = = 0.034
n 200

• Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


 f = z / 2  s f = 1.96  0.034 = 0.067

Intervalul de încredere pentru proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind
cel puţin bun este:
0.625 − 0.067  p  0.625 + 0.067
0.558  p  0.692
Aşadar, proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun este este
cuprinsă între 55,8% şi 69,2%, pentru un nivel de semnificaţie de 5%.

Exemplul 4. In scopul adaptării pachetelor de servicii turistice, o agenţie din domeniu realizează o cercetare
statistică pe un eşantion aleator de volum 5,4% din cei 4800 de clienţi ce au apelat la serviciile agenţiei în

3
anul anterior. Agenţia este interesată în cunoaşterea venitului mediu al clienţilor şi a proporţiei clienţilor cu
studii superioare. Din analize anterioare se cunoaşte că există un grad ridicat de eterogenitate a clienţilor în
funcţie de vârstă. Pentru obţinerea unui eşantion cât mai reprezentativ şi îmbunătăţirea calităţii estimatorilor
obţinuţi s-a recurs la eşantionare stratificată, clienţii fiind împărţiţi în patru grupe omogene astfel: sub 30
ani; 30-40 ani; 40-60 ani; 60 ani şi peste. Subeşantioanele corespunzătoare fiecărui strat sunt direct
proporţionale cu ponderea stratului respectiv în populaţia statistică. După obţinerea şi prelucrarea datelor
utilizând indicatorii statistici descriptivi au fost obţinute următoarele rezultate sintetice:
Venit mediu Abaterea standard a Proporţia clienţilor
Grupe de vârstă
Nr. clienţi lunar venitului cu studii superioare
(ani)
(Eur) (Eur) (%)
sub 30 32 525 144 32
30 - 40 48 1320 387 62
40 - 60 120 2110 695 54
60 şi peste 59 630 85 86

Se cere:
a) Estimaţi, cu o probabilitate de 95% venitul mediu lunar al clienţilor agenţiei de turism.
b) Estimaţi proporţia clienţilor cu studii superioare utilizând o probabilitate de 95% de garantare a
rezultatelor.

Rezolvare
a) Notăm cu:
X variabila venit,
n volumul eşationului,
r numărul straturilor generate de variabila categorială grupa de vârstă

x i venitul mediu în stratul 𝑖, 𝑖 = ̅̅̅̅


1, 𝑟,

si2 dispersia venitului în stratul 𝑖, 𝑖 = ̅̅̅̅


1, 𝑟,

f i proporţia clienţilor cu studii superioare în stratul 𝑖, 𝑖 = ̅̅̅̅


1, 𝑟.

Venitul mediu în eşantion este:


r

x n i i
525  32 + 1320  48 + 2110 120 + 630  59
x= i =1
r
= = 1430.62 Eur
n
259
i
i =1

Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor patru straturi şi dispunem de
informaţii referitoare la volumul populaţiei statistice (N=4800 de clienţi) considerăm sondajul realizat ca
fiind stratificat nerepetat.

4
Erorile specifice acestui sondaj sunt:
• Eroarea standard (eroarea medie probabilă) este:

s2  n 257180,3
sx = 1 − =  0,946 = 30,65 Eur
n  N 259
r

 s (n 2
i i − 1)
unde s =
2 i =1
reprezintă dispersia din interiorul grupelor, media dispersiilor de grupă
n−r
144 2  31 + 387 2  47 + 6952 119 + 852  58
s 2
= = 257.180,3
255
• Eroarea maximă admisă este:

 x = z 2  s x = 1,96  30 .65 = 60 .074  60 Eur


Intervalul de încredere pentru venitul mediu este:

x − x    x + x
1430 .62 − 60    1430 .62 + 60 Eur
1370 .62    1490 .62 Eur
Venitul mediu lunar al clienţilor agenţiei este cuprins între 1370,62 şi 1490,62 Eur, rezultate garantate
cu o probabilitate de 95%.

c) În cazul variabilei alternative intervalul de încredere este:


f −f  p  f +f

Proporţia clienţilor cu studii superioare în eşantion este:


r

fn i i
0,32  32 + 0,62  48 + 0,54  120 + 0,86  59
f = i =1
r
= = 0,6005 (60%)
n
259
i
i =1

Fiind vorba despre un sondaj stratificat nerepetat erorile specifice acestui sondaj sunt:
• Eroarea standard (eroarea medie probabilă) este:
r

n  , unde 2 
s 2fi ni
s f2 
sf = 1 −  s f = i =1 şi reprezintă dispersia din interiorul grupelor.
n  N n−r

Calculele intermediare necesare determinării mediei dispersiilor de grupă sunt prezentate în următorul
tabel:

5
Grupe de vârstă Nr. clienţi Proporţia clienţilor cu studii Dispersia
(ani) ni superioare (fi) s = f i (1 − f i )
2
f

sub 30 32 0,32 0,2176


30 - 40 48 0,62 0,2356
40 - 60 120 0,54 0,2484
60 şi peste 59 0,86 0,1204

s 2
fi ni
0.2176  32 + 0.2356  48 + 0.2484  120 + 0.1204  59
s =
2 i =1
= = 0.2164
n−r 259 − 4
f

s f2  n  0,2164
sf = 1 −  =  0,946 = 0,028
n  N 259

• Eroarea maximă admisă este:


 f = z0.025  s f = 1,96  0,028 = 0,0548
Intervalul de încredere pentru proporţia clienţilor cu studii superioare este:
f − f  p  f + f

0,6005 − 0,0588  p  0,6005 + 0,0588


0,5417  p  0,6593
(54,17%) (65,93%)
Proporţia clienţilor agenţiei de turism ce au studii superioare este cuprinsă între 54,17% şi 65,93%, pentru
o probabilitate de 95% de garantare a rezultatelor.

Determinarea volumului eşantionului

Precizia estimaţiei şi probabilitatea cu care se garantează rezultatele unei estimaţii pe


interval de încredere sunt mărimi invers proporţionale, astfel încât aceste deziderate trebuie puse
într-o relaţie de echilibru în funcţie de scopul cercetării statistice.

Intervalul de încredere, calculat pe baza erorii limită, conţine adevărata valoare a mediei
μ a variabilei în populaţia statistică în 100  (1 − α )% din cazuri:

( )
P x − zα/ 2  s x  μ  x + zα/ 2  s x = 1 − α.

Cea mai folosită probabilitate de garantare a rezultatelor este de 95% z 0.025 = 1.96 , adică:

6
x−μ
P (− 1.96  z  1.96 ) = 0.95 , unde z = .
sx
În anumite situaţii se utilizează şi alte nivele de încredere, principiul de bază folosit fiind
găsirea unui echilibru între mărimea intervalului de încredere şi probabilitatea de cuprindere a
parametrului din populaţia statistică. Dacă un interval mai mic înseamnă o precizie crescută, uneori
o probabilitate crescută de garantare a rezultatelor poate fi preferată. Relaţia dintre mărimea
intervalului de încredere şi probabilitatea de garantare a rezultatelor este rezumată în figura 4.2:

Interval de încredere pentru 1-=0,999

Interval de încredere pentru 1-=0,99

Interval de încredere pentru 1-=0,95

Interval de încredere pentru 1-=0,90

În practică, adeseori, problema se pune din perspectiva resurselor financiare disponibile pentru
obţinerea informaţiilor necesare în fundamentarea deciziilor. Astfel, trebuie să determinăm volumul
eşantionului necesar pentru o anumită precizie a rezultatelor. Precizia necesară pentru estimarea
mediei cu un nivel de încredere (1 − α ) , asociată cu mărimea intervalului de încredere pentru media

populaţiei μ , poate fi exprimată, fie prin raportare la mărimea erorii limită (  x ), fie prin raportare

la lungimea intervalului de încredere ( L = 2   x ).

Lungimea intervalului de încredere scade dacă:


- se măreşte volumul eşantionului;
- se diminuează probabilitatea de garantare a rezultatelor;
- datele au o variabilitate redusă (omogenitate ridicată).

Pentru determinarea volumului eşantionului trebuie luaţi în considerare trei factori:


- nivelul de încredere dorit;
- eroarea limită acceptată;
- omogenitatea datelor, măsurată prin abaterea standard.

Punctul de plecare în determinarea volumului eşantionului îl constituie dimensiunea


prestabilită a erorii maxime admisă sau, echivalent, a lungimii intervalului de încredere.

7
Relaţiile de calcul utilizate în dimensionarea volumului eşantionului depind de:
- tipul sondajului (simplu sau stratificat);
- tipul selecţiei (repetată sau nerepetată);
- tipul variabilei (numerică sau categorială alternativă).

Maniera de determinare a volumului eşantionului, pe baza considerentelor prezentate, este


sintetizată în tabelul 4.3:

Tabelul 4.3. Determinarea volumului eşantionului


Tip sondaj Tip selecţie Volumul eşantionului Observaţii
a) variabilă numerică
( z / 2 ) 2  s 2
repetată n=
2x s 2 este estimatorul
simplu
z 2 / 2 s 2 N z 2 / 2 s 2 dispersiei 2, de
n= =
nerepetată z 2 / 2 s 2 + 2x N z 2 / 2 s 2 regulă necunoscută
2x +
N
( z / 2 )  s 2 2

repetată n=
2x r

 s (n 2
i i − 1)
stratificat z s 2 2
s =
2 i =1
n= n−r
nerepetată z s2 2

 +
2
x
N
b) variabilă categorială alternativă
z 2 f (1 − f )
repetată n=
2f
simplu z 2 f (1 − f ) N z 2 f (1 − f )
n= =
nerepetată 2f N + z 2 f (1 − f ) z 2 f (1 − f )
2f +
N
z 2  s f2
repetată n=
2f r

stratificat z s2 2 s 2
fi ni
n ==
f
s =
2 i =1

z 2  s f2 n−r
f
nerepetată
 + 2
f
N

Dacă pe baza calculelor efectuate se obţine un eşantion de volum redus (𝑛 < 30), se
recomandă, dacă este posibil, utilizarea unui eşantion de volum mare (𝑛 ≥ 30).
În cazul sondajului stratificat trebuie determinate volumele subeşantioanelor corespunzătoare
straturilor identificate. Reprezentarea fiecărui strat la nivelul eşantionului poate fi:
8
- proporţională cu ponderea stratului respectiv în populaţia statistică;
- optimizată în funcţie de variabilitatea fiecărui strat sau de costurile şi bugetele disponibile.

Selecţia proporţională a subeşantioanelor se aplică atunci când dispersiile din interiorul


straturilor sunt egale. Proporţiile sunt determinate de ponderile straturilor, adică:
Ni
ni = n.
N
Selecţie optimă a subeşantioanelor presupune fracţii de sondaj variabile de la un strat la
altul. De regulă, fracţiile de sondaj sunt proporţionale cu abaterea standard a variabilei la nivelul
fiecărui strat. Dacă împrăştierea datelor este ridicată la nivelul uni strat vor fi selectate mai multe unităţi
statistice, în raport cu un alt strat pentru care variabilitatea caracteristicii studiate este mai redusă.
Aşadar, pentru stratul 𝑖 volumul subeşantionului se determină cu relaţia:
r
N i si
ni = r
n, n i = n.
N s
i =1
i i
i =1

Exemplul 5. Determinaţi volumul unui nou eşantion necesar pentru estimarea venitului mediu al
clienților agenției de turism (a se vedea exemplul 4), cu o eroare maximă admisă mai mică cu 30%
în raport cu valoarea determinată în exemplu 4. Repartizaţi noul eşantion proporţional şi optim pe
subeşantioane.
Eroarea maximă admisă determinată în exemplul anterior este  x = 60 Eur .

Valoarea erorii ce stă la baza determinării volumului noului eșantion este:


 ' x = 0,7   x = 42 Eur

z 2  s x2 1,96 2  257.180,3
n' = = = 498.7  499 clienti
z 2  s x2 1,96 2  257.180,3
x +
'2
42 +
2

N 4.800
Stratificarea noului eşantion se poate realiza prin procedeul repartiţiei proporţionale sau, pe baza
informaţiilor statistice obţinute referitoare la gradul de variabilitate al venitului din fiecare strat,
printr-o repartizare optimă.
Pentru repartizarea proporţională se utilizează relaţia:
Ni
ni' = n ' 
N

9
Pentru repartizarea optimă se utilizează relaţia:
si  N i
ni'' = n '  r

s  N
i =1
i i

Repartizarea noului eşantion pe subeşantioane prin procedeele proporţional şi optim este prezentată
în tabelul următor:
Dimensiunea repartiţie repartiţie
stratului în proporţională optimă
Nr. Ponderea
Grupe de populaţia
clienţi stratului si  N i si  N i
vârstă (ani) statistică n ni'' = n ' 
ni' =n  i' si  N i 4

s N
ni ni n 4

n
Ni = i  N
n
i =1
i i s
i =1
i  Ni
n
sub 30 32 0,12 576 60 82944 0,04 20
30 - 40 48 0,19 912 95 352944 0,17 85
40 - 60 120 0,46 2208 230 1534560 0,74 371
60 şi peste 59 0,23 1104 114 93840 0,05 23
Total 259 1 4800 499 2064288 1 499

10

S-ar putea să vă placă și