Sunteți pe pagina 1din 10

ESTIMAREA PE INTERVAL DE INCREDERE A MEDIEI POPULATIEI STATISTICE

EXEMPLE REZOLVATE

Exemplul 1. Rezultatele unui studiu, efectuat pe un eşantion aleator de 64 clienţi ai unei bănci,
referitor la timpul mediu de realizare a operaţiunilor bancare solicitate de către aceştia, sunt:
timpul mediu de realizare a operaţiunilor bancare este 32 de minute, cu o dispersie de 400.
Estimaţi timpul mediu de realizare al operaţiunilor bancare pentru o probabilitate de 95% de
garantare a rezultatelor.
Rezolvare:

Intervalul de încredere este:


x̄−Δx ≤μ≤ x̄+ Δx
Estimatorii determinaţi la nivelul eşantionului ( n=64 clienţi) au valorile:
2
x̄=32 min; s =400 ; s=20 min.
Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. de clienţi
ai băncii) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
 Eroarea standard (eroarea medie probabilă):
s 20
s x= = =2.5
√n 8 .
 Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)
Δx =z α /2⋅s x =1.96⋅2.5=4.9≃5 min.
Timpul mediu de realizare a operaţinilor bancare, pentru o probabilitate de 95%, este
cuprins între 27 şi 37 de minute.

Exemplul 2. Pentru un eşantion de 50 de farmacii, ce aparţin unui anumit lanţ farmaceutic, din trei oraşe
reşedinţă de judeţ, s-au înregistrat valorile aferente vânzărilor medii zilnice, în unităţi monetare (u.m.).
După prelucrarea valorilor primare au rezultat datele din tabelul următor:
Număr de Dispersia
Oraşul Vânzări medii zilnice (u.m.)
farmacii vânzărilor
Oraşul A 15 45 100
Oraşul B 22 35 81
Oraşul C 13 66 225

1
Estimaţi, pentru un nivel de încredere de 95%, valoarea medie a vânzărilor zilnice la nivelul unei farmacii
ce aparţine respectivului lanţ farmaceutic.

Rezolvare:

Intervalul de încredere este:


x̄−Δx ≤μ≤ x̄+ Δx
x̄ - reprezintă valoarea medie a vânzărilor la nivelul eşantionului, valoare determinată ca medie a
mediilor de grupă:
3
∑ xi⋅ni
i=1 45⋅15+35⋅22+ 66⋅13
x= 3
= =46 . 06
50
∑ ni
i =1 u.m.
Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor trei grupe/straturi şi nu dispunem de
informaţii referitoare la volumul populaţiei statistice (N = nr. total de farmacii ce aparţine lanţului
farmaceutic respectiv) considerăm sondajul realizat ca fiind stratificat repetat.
Erorile specifice acestui tip de sondaj sunt:
 Eroarea standard (eroarea medie probabilă):
r

s̄ 2 ∑ s 2i ( ni −1 )
s x=
n√ r
, unde
s̄ 2 =
i=1
i

n−r

∑ s 2i ( ni −1 )
100⋅14 +81⋅21+225⋅12
s̄ 2 = i=1 = =123 . 425
n−r 50−3

s̄ 2 123 . 425
s x=
n√ √=
50
=1 . 57

 Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


Δ x =z α/2⋅s x =1.96⋅1.57=3.08 u.m.
Intervalul de încredere pentru valoarea medie a vânzărilor este:
46 . 06−3 .08≤μ≤46 . 06+3 .08
Aşadar, valoarea medie a vânzărilor medii zilnice la nivelul unei farmacii ce aparţine respectivului lanţ
farmaceutic este cuprinsă între 42,98 şi 49,14 u.m., pentru un nivel de încredere de 95%.

2
Exemplul 3. Un eşantion de 200 de specialişti în domeniu au fost rugaţi să analizeze şi să formuleze
aprecieri asupra noului pachet legislativ din domeniul sănătăţii supus dezbaterii publice. Rezultatele
sistematizate sunt:
Opinia Excelent Bu Satisfăcător Slab
n
Număr de 45 80 64 11
răspunsuri
Estimaţi proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun, pentru un nivel
de semnificaţie de 5%.

Rezolvare:

Pentru determinarea proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun,
transformăm variabila categorială nealternativă „opinia” într-o variabilă alternativă de tipul:
Opinia Număr de răspunsuri
Cel mult satisfăcător (slab+satisfăcător) 75
Cel puţin bun (bun+excelent) m = 125
Total n = 200

În cazul unei variabile categoriale alternative intervalul de încredere este:


f −Δ f ≤ p≤f + Δf .
Media şi dispersia variabilei alternative a cărei stare favorabilă este definită de aprecierea noului pachet
legislativ ca fiind cel puţin bun sunt:

m 125
f= = =0 . 625 s 2f =f (1−f )=0.625⋅0.375=0.234
n 200 (62,5%);
Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. total de specialişti
din domeniu) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
 Eroarea standard (eroarea medie probabilă):
f (1−f ) 0 . 234
sf =
√ n
=
√200
=0 . 034

 Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


Δ f =z α/2⋅s f =1 .96⋅0.034=0.067
Intervalul de încredere pentru proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind
cel puţin bun este:
0 .625−0 . 067≤ p≤0 . 625+0 .067
0 .558≤ p≤0. 692

3
Aşadar, proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun este este
cuprinsă între 55,8% şi 69,2%, pentru un nivel de semnificaţie de 5%.

Exemplul 4. In scopul adaptării pachetelor de servicii turistice, o agenţie din domeniu realizează o
cercetare statistică pe un eşantion aleator de volum 5,4% din cei 4800 de clienţi ce au apelat la serviciile
agenţiei în anul anterior. Agenţia este interesată în cunoaşterea venitului mediu al clienţilor şi a proporţiei
clienţilor cu studii superioare. Din analize anterioare se cunoaşte că există un grad ridicat de eterogenitate
a clienţilor în funcţie de vârstă. Pentru obţinerea unui eşantion cât mai reprezentativ şi îmbunătăţirea
calităţii estimatorilor obţinuţi s-a recurs la eşantionare stratificată, clienţii fiind împărţiţi în patru grupe
omogene astfel: sub 30 ani; 30-40 ani; 40-60 ani; 60 ani şi peste. Subeşantioanele corespunzătoare
fiecărui strat sunt direct proporţionale cu ponderea stratului respectiv în populaţia statistică. După
obţinerea şi prelucrarea datelor utilizând indicatorii statistici descriptivi au fost obţinute următoarele
rezultate sintetice:
Venit mediu Abaterea standard a Proporţia clienţilor
Grupe de vârstă
Nr. clienţi lunar venitului cu studii superioare
(ani)
(Eur) (Eur) (%)
sub 30 32 525 144 32
30 - 40 48 1320 387 62
40 - 60 120 2110 695 54
60 şi peste 59 630 85 86

Se cere:
a) Estimaţi, cu o probabilitate de 95% venitul mediu lunar al clienţilor agenţiei de turism.
b) Estimaţi proporţia clienţilor cu studii superioare utilizând o probabilitate de 95% de garantare a
rezultatelor.

Rezolvare
a) Notăm cu:
X variabila venit,
n volumul eşationului,
r numărul straturilor generate de variabila categorială grupa de vârstă
x i venitul mediu în stratul i, i=1´, r ,

s 2i dispersia venitului în stratul i, i=1´, r ,

f i proporţia clienţilor cu studii superioare în stratul i, i=1´, r .

Venitul mediu în eşantion este:

4
r
∑ xi n i
i=1 525⋅32+1320⋅48+2110⋅120+630⋅59
x= r
= =1430 .62 Eur
259
∑ ni
i=1

Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor patru straturi şi dispunem de
informaţii referitoare la volumul populaţiei statistice (N=4800 de clienţi) considerăm sondajul realizat ca
fiind stratificat nerepetat.
Erorile specifice acestui sondaj sunt:
 Eroarea standard (eroarea medie probabilă) este:

s̄ 2 n 257180 , 3

r
s x=
√ ( )√
n
1− =
N 259
⋅0 ,946=30 ,65 Eur

∑ s 2i ( ni −1 )
s̄ 2 = i=1
unde n−r reprezintă dispersia din interiorul grupelor, media dispersiilor de grupă

2 1442⋅31+3872⋅47+695 2⋅119+852⋅58
s̄ = =257 . 180 ,3
255
 Eroarea maximă admisă este:
Δ x =z α/2⋅s x =1,96⋅30.65=60.074≃60 Eur
Intervalul de încredere pentru venitul mediu este:

x−Δ x ≤μ≤x+ Δ x
1430. 62−60≤μ≤1430. 62+60 Eur
1370. 62≤μ≤1490 .62 Eur
Venitul mediu lunar al clienţilor agenţiei este cuprins între 1370,62 şi 1490,62 Eur, rezultate garantate
cu o probabilitate de 95%.

c) În cazul variabilei alternative intervalul de încredere este:


f −Δ f ≤ p≤f + Δf
Proporţia clienţilor cu studii superioare în eşantion este:
r
∑ f i ni
0 , 32⋅32+0 , 62⋅48+0 , 54⋅120+ 0 ,86⋅59
f = i=1r = =0 , 6005
259
∑ ni
i=1 (60%)
Fiind vorba despre un sondaj stratificat nerepetat erorile specifice acestui sondaj sunt:

5
 Eroarea standard (eroarea medie probabilă) este:
r
2
s̄ f ∑ s2f ni
sf =
√n N
( n
1− )
, unde
s̄ 2f =
i=1
n−r
i

şi reprezintă dispersia din interiorul grupelor.


Calculele intermediare necesare determinării mediei dispersiilor de grupă sunt prezentate în următorul
tabel:

Grupe de vârstă Nr. clienţi Proporţia clienţilor cu studii Dispersia


(ani) ni superioare (fi) s 2f =f i ( 1−f i )
sub 30 32 0,32 0,2176
30 - 40 48 0,62 0,2356
40 - 60 120 0,54 0,2484
60 şi peste 59 0,86 0,1204

∑ s2f ni i 0 . 2176⋅32+0 . 2356⋅48+0 .2484⋅120+0 . 1204⋅59


i=1
s̄ 2f = = =0 .2164
n−r 259−4

2

√ ( )√
n
n
s f = f 1− =
N
0 , 2164
259
×0 , 946=0 ,028

 Eroarea maximă admisă este:

Δ f =z 0 .025⋅s f =1,96⋅0,028=0,0548
Intervalul de încredere pentru proporţia clienţilor cu studii superioare este:
f −Δ f ≤ p≤f + Δf
0 , 6005−0 , 0588≤ p≤0 , 6005+0 , 0588
0, 5417≤ p≤0 , 6593
(54,17%) (65,93%)
Proporţia clienţilor agenţiei de turism ce au studii superioare este cuprinsă între 54,17% şi 65,93%, pentru
o probabilitate de 95% de garantare a rezultatelor.

Determinarea volumului eşantionului

Precizia estimaţiei şi probabilitatea cu care se garantează rezultatele unei estimaţii pe


interval de încredere sunt mărimi invers proporţionale, astfel încât aceste deziderate trebuie puse
într-o relaţie de echilibru în funcţie de scopul cercetării statistice.

6
Intervalul de încredere, calculat pe baza erorii limită, conţine adevărata valoare a mediei
μ a variabilei în populaţia statistică în 100⋅( 1−α ) % din cazuri:
P ( x−z α/ 2⋅s x̄ ≤μ≤x +z α/ 2⋅s x̄ )=1−α .

Cea mai folosită probabilitate de garantare a rezultatelor este de 95%


z 0.025=1.96 ,
adică:
x−μ
z=
P (−1. 96≤z≤1. 96 )=0 . 95 , unde s x̄ .

În anumite situaţii se utilizează şi alte nivele de încredere, principiul de bază folosit fiind
găsirea unui echilibru între mărimea intervalului de încredere şi probabilitatea de cuprindere a
parametrului din populaţia statistică. Dacă un interval mai mic înseamnă o precizie crescută,
uneori o probabilitate crescută de garantare a rezultatelor poate fi preferată. Relaţia dintre
mărimea intervalului de încredere şi probabilitatea de garantare a rezultatelor este rezumată în
figura 4.2:

Interval de încredere pentru 1-=0,999

Interval de încredere pentru 1-=0,99

În practică, adeseori, problema se pune din perspectivaInterval de încredere


resurselor pentru disponibile
financiare 1-=0,95

pentru obţinerea informaţiilor necesare în fundamentarea deciziilor. Astfel, trebuie să determinăm


volumul eşantionului necesar pentru o anumită precizie a rezultatelor. Precizia necesară pentru

estimarea mediei cu un nivel de încredere ( 1−α ) , asociată cu mărimea intervalului de încredere

pentru media populaţiei μ , poate fi exprimată, fie prin raportare la mărimea erorii limită (

Δx ), fie prin raportare la lungimea intervalului de încredere (


L=2⋅Δ x ).

Lungimea intervalului de încredere scade dacă:


- se măreşte volumul eşantionului;
- se diminuează probabilitatea de garantare a rezultatelor;

7
- datele au o variabilitate redusă (omogenitate ridicată).

Pentru determinarea volumului eşantionului trebuie luaţi în considerare trei factori:


- nivelul de încredere dorit;
- eroarea limită acceptată;
- omogenitatea datelor, măsurată prin abaterea standard.

Punctul de plecare în determinarea volumului eşantionului îl constituie dimensiunea


prestabilită a erorii maxime admisă sau, echivalent, a lungimii intervalului de încredere.

Relaţiile de calcul utilizate în dimensionarea volumului eşantionului depind de:


- tipul sondajului (simplu sau stratificat);
- tipul selecţiei (repetată sau nerepetată);
- tipul variabilei (numerică sau categorială alternativă).

Maniera de determinare a volumului eşantionului, pe baza considerentelor prezentate, este


sintetizată în tabelul 4.3:

Tabelul 4.3. Determinarea volumului eşantionului


Tip Tip
Volumul eşantionului Observaţii
sondaj selecţie
a) variabilă numerică
(z α /2 )2⋅s 2
repetată n= 2
Δx
s2 este
estimatorul dispersiei
simplu 2 2 2 2
zα/2 s N zα/2 s
n= = σ2 , de regulă
nerepetată z 2 s 2 + Δ2x N 2
z2 s2 necunoscută
α/2
Δ +
x
α/2

N
2 2
(z α /2 ) ⋅s̄
repetată n= 2 r
Δx
stratificat 2 2 ∑ s 2i ( ni −1 )
z ⋅s̄ s̄ 2 = i=1
n= n−r
nerepetată z 2⋅s̄ 2
Δ 2x +
N
b) variabilă categorială alternativă
z 2 f ( 1−f )
repetată n=
Δ 2f
2 2
simplu z f ( 1−f ) N z f ( 1−f )
n= =
nerepetată Δ f N + z 2 f ( 1−f )
2
z 2 f (1−f )
Δ2f +
N

8
2 2
z ⋅s̄ f
repetată n= 2
Δf r

stratificat z ⋅s̄ 2f
2 ∑ s 2f ni
i
i=1
n == 2 2
s̄ 2f =
nerepetată n−r
2 z ⋅s̄ f
Δf +
N

Dacă pe baza calculelor efectuate se obţine un eşantion de volum redus (n<30), se


recomandă, dacă este posibil, utilizarea unui eşantion de volum mare (n ≥ 30).
În cazul sondajului stratificat trebuie determinate volumele subeşantioanelor
corespunzătoare straturilor identificate. Reprezentarea fiecărui strat la nivelul eşantionului poate fi:
- proporţională cu ponderea stratului respectiv în populaţia statistică;
- optimizată în funcţie de variabilitatea fiecărui strat sau de costurile şi bugetele disponibile.

Selecţia proporţională a subeşantioanelor se aplică atunci când dispersiile din interiorul


straturilor sunt egale. Proporţiile sunt determinate de ponderile straturilor, adică:
Ni
ni = ⋅n
N .
Selecţie optimă a subeşantioanelor presupune fracţii de sondaj variabile de la un strat la
altul. De regulă, fracţiile de sondaj sunt proporţionale cu abaterea standard a variabilei la nivelul
fiecărui strat. Dacă împrăştierea datelor este ridicată la nivelul uni strat vor fi selectate mai multe
unităţi statistice, în raport cu un alt strat pentru care variabilitatea caracteristicii studiate este mai
redusă. Aşadar, pentru stratul ivolumul subeşantionului se determină cu relaţia:
r
N i si
ni = r
n, ∑ ni =n .
i=1
∑ N i si
i=1

Exemplul 5. Determinaţi volumul unui nou eşantion necesar pentru estimarea venitului mediu al
clienților agenției de turism (a se vedea exemplul 4), cu o eroare maximă admisă mai mică cu
30% în raport cu valoarea determinată în exemplu 4. Repartizaţi noul eşantion proporţional şi
optim pe subeşantioane.

Eroarea maximă admisă determinată în exemplul anterior este


Δ x =60 Eur .
Valoarea erorii ce stă la baza determinării volumului noului eșantion este:
Δ' x =0,7⋅Δ x =42 Eur
9
2 2
z ⋅s̄ x 1 , 96 2⋅257 . 180 ,3
n'= = =498 .7≈499 clienti
z 2⋅s̄ 2x 2
2 1 , 96 ⋅257 .180 , 3
Δ'x2 + 42 +
N 4 .800
Stratificarea noului eşantion se poate realiza prin procedeul repartiţiei proporţionale sau, pe baza
informaţiilor statistice obţinute referitoare la gradul de variabilitate al venitului din fiecare strat,
printr-o repartizare optimă.
Pentru repartizarea proporţională se utilizează relaţia:
Ni
n'i =n' ×
N
Pentru repartizarea optimă se utilizează relaţia:
s i⋅N i
n''i =n' × r
∑ si⋅N i
i =1

Repartizarea noului eşantion pe subeşantioane prin procedeele proporţional şi optim este


prezentată în tabelul următor:
Dimensiunea repartiţie repartiţie
stratului în proporţională optimă
Nr. Ponderea
Grupe de clienţi stratului populaţia si⋅N i s i⋅N i
vârstă (ani) n statistică n n''i =n' × 4
in /n i n n'i =n' × i s i⋅N i 4

N i= i⋅N n ∑ s i⋅N i ∑ si⋅N i


n i=1 i =1
sub 30 32 0,12 576 60 82944 0,04 20
30 - 40 48 0,19 912 95 352944 0,17 85
40 - 60 120 0,46 2208 230 1534560 0,74 371
60 şi peste 59 0,23 1104 114 93840 0,05 23
Total 259 1 4800 499 2064288 1 499

10

S-ar putea să vă placă și