Sunteți pe pagina 1din 6

10 Estimarea parametrilor: intervale de ncredere

Intervalele de ncredere pentru un parametru necunoscut al unei distributii (spre exemplu pentru media unei
populatii) sunt intervale (1 2 ) ce contin parametrul , nu cu certitudine, si cu anumita probabilitate (spre
exemplu cu probabilitate = 95% sau = 99%). Valoarea lui se numeste nivel de ncredere/nivel de
semnificatie iar 1 si 2 se numesc limita de ncredere inferioara si superioara.
Un astfel de interval (1 2 ) este calculat folosind o selectie din populatie. Valoarea = 95% nseamna ca
probabilitatea ca intervalul (1 2 ) sa nu-l contina pe este 1 = 5% = 005, adica aproximativ unul din 20 de
intervale astfel determinate nu l va contine pe . Cu ct valoarea lui este mai apropiata de 1, cu att este mai
mica probabilitatea erorii 1 ca intervalul de ncredere sa nu-l contina parametrul , dar n acelasi timp lungimea
2 1 a intervalului de ncredere devine mai mare (tinde la infinit pentru 1).
Intervalele de ncredere sunt mai utile dect estimatorii punctuali ai parametrilor necunoscuti, deoarece avnd
intervalul de ncredere putem considera ca estimator mijlocul 1 + 2
2
al intervalului (n acest caz, probabilitatea ca
2 1
sa difere fata de estimatorul considerat cu mai putin de 2 este egala cu ).
Pentru a determina capetele 1 si 2 ale intervalului de ncredere, consideram un esantion 1 din populatia
data. Aceste valori sunt valorile observate ale unei variabile aleatoare (reprezentnd populatia studiata), dar
ele pot fi privite ca valori ale variabile aleatoare independente 1 avnd aceeasi distributie cu variabila
aleatoare .
Atunci 1 = 1 (1 ) si 2 = 2 (1 ) sunt valorile observate ale variabilelor aleatoare 1 =
1 (1 ) si 2 = 2 (1 ). Conditia ca intervalul (1 2 ) sa-l contina parametrul cu probabilitate
se poate scrie deci sub forma
(1 2 ) = (57)
Pentru a determina variabilele aleatoare 1 si 2 folosim urmatoarea.

Teorema 10.1 (Suma de variabile aleatoare normale independente) Fie 1 variabile aleatoare nor-
male independente, avnd fiecare medie si dispersie 2 . Atunci au loc urmatoarele.

a) Suma 1 + + este o variabila aleatoare normala cu medie si dispersie 2 .


b) Variabila aleatoare
1 + +
= (58)

este o variabila aleatoare normala cu medie si dispersie 2 .
c) Variabila aleatoare

= (59)

este o variabila aleatoare normala standard (cu medie 0 si dispersie 1).

Demonstratie. a) Este suficient sa demonstram afirmatia din enunt n cazul = 2 (demonstratia poate fi apoi
completata prin inductie matematica).
Se poate arata ca deoarece variabilele aleatoare normale 1 si 2 sunt independente, variabila aleatoare 1 +2
este de asemenea o variabila aleatoare normala.
Avem
(1 + 2 ) = (1 ) + (2 ) = + = 2
si deci variabila aleatoare 1 + 2 are medie 2.
De asemenea, deoarece variabilele aleatoare 1 si 2 sunt independente, se poate arata ca dispersia sumei
1 + 2 este egala cu suma dispersiilor variabilelor aleatoare 1 si 2 , adica

2 (1 + 2 ) = 2 (1 ) + 2 (2 ) = 2 + 2 = 2 2
2
si deci variabila aleatoare 1 + 2 are
dispersie 2 .
2
Am aratat deci ca 1 + 2 N 2 2 , ncheind astfel prima parte a demonstratiei.

b) Conform primei parti a demonstratie avem ca 1 + + N 2 este o variabila aleatoare
normala

1 ++ 2
cu medie si dispersie 2 . Folosind Teorema 4.4 rezulta ca variabila aleatoare = N 2 =
2
2
N este o variabila aleatoare normala cu medie si dispersie .

45
2


c) Cum N , folosind din nou Teorema 4.4 obtinem ca variabila aleatoare standardizata =

N (0 1) este o variabila aleatoare normala cu medie 0 si dispersie 1.
Folosind teorema anterioara, putem acum determina intervale de ncredere pentru media si dispersia unei pop-
ulatii normale dupa cum urmeaza.

10.1 Intervale de ncredere pentru media unei populatii normale cu dispersie 2


cunoscuta

Daca populatia N 2 este normala cu medie (necunoscuta) si dispersie 2 (cunoscuta), conform Teoremei
10.1 rezulta ca variabila aleatoare

= N (0 1)

este o variabila aleatoare normala standard.


Pentru un nivel de ncredere fixat, folosind Anexa 2 determinam valoarea constantei astfel nct

= ( ) = () ()

Relatia anterioara se poate scrie sub forma


!

=

sau echivalent (rezolvnd dubla inegalitate n raport cu )




+ =

Considernd 1 = si 2 = + , relatia anterioara se poate scrie echivalent sub forma

(1 2 ) =

nlocuind variabilele aleatoare 1 prin valorile observate 1 ale esantionului obtinem ca un


interval de ncredere pentru media necunoscuta a populatiei este


(1 2 ) = + (60)

Exemplul 10.2 Sa se determine un interval de 95% ncredere pentru media necunoscuta a unei populatii normale
cu dispersie cunoscuta 2 = 9, folosind un esantion de volum = 100 cu medie = 5.
Folosind Anexa 2 determinam valoarea corespunzatoare probabilitatii = 095 astfel nct

() () = = 095

si obtinem = 1960.
Folosind formula (60) determinam intervalul de ncredere pentru media necunoscuta a populatiei

3 3
(1 2 ) = + = (1 2 ) = 5 1960 5 + 1960 = (4412 5588)
100 100
O alta problema n determinarea unui interval de ncredere este legata de alegerea volumului selectiei, ca n
exemplul urmator.

Exemplul 10.3 Ct de mare trebuie ales volumul al selectiei n exemplu anterior daca se doreste obtinerea unui
interval de 95% ncredere de lungime cel mult = 04?
Intervalul de ncredere pentru media a populatiei din formula (60) are lungimea


2 1 = + = 2

46
Egalnd aceasta expresie cu valoarea dorita, obtinem

= 2

de unde rezolvnd n raport cu se obtine


2 2
2 2 1960 3
= = = 86436
04

Pentru a obtine intervalul de ncredere dorit, trebuie sa alegem un volum de selectie = 865.

Observatia 10.4 Se poate arata ca pentru un nivel de ncredere 1, lungimea intervalului de ncredere core-
spunzator tinde ctre infinit 2 1 .

10.2 Intervale de ncredere pentru media unei populatii normale cu dispersie 2


necunoscuta
n cazul n care dispersia 2 a populatiei este necunoscuta, nu mai putem utiliza formula (60) pentru a determina
un interval de ncredere pentru media necunoscuta a populatiei.
Deoarece valoarea abaterii patratice medii din aceasta formula este necunoscuta, nlocuim pe prin estimatorul
s
P 2
=1 ( )
= (61)
1

al lui .
Fcnd nsa aceasta nlocuire, variabila aleatoare corespunzatoare

nu mai este o variabila aleatoare normala (este o variabila aleatoare cu 1 grade de libertate, avnd
functia de distributie () tabelata n Anexa 3), si deci valoarea trebuie determinata folosind acest tabel astfel
nct
() () =
Ca si n cazul distributiei normale standard, distributia Student are o functie de densitate simetrica fata de
origine, si deci () = 1 () pentru orice R. nlocuind n relatia ant6erioara () prin 1 ()
obtinem echivalent
() (1 ()) =
sau
1+
() = (62)
2
Obtinem deci ca n cazul unei populatii avnd dispersie necunoscuta 2 , pentru un nivel de ncredere fixat,
intervalul de ncredere pentru media necunoscuta a populatiei este


(1 2 ) = + (63)

unde este volumul selectiei, = 1 ++




este media esantionului, estimatorul al abaterii patratice medii este
dat de formula (61), iar este determinat din Anexa 3 astfel conform relatiei (62) pentru 1 grade de libertate.

Exemplul 10.5 Cinci masuratori pentru temperatura de aprindere a motorinei (n grade Fahrenheit) sunt

144 147 146 142 144

Presupunnd ca temperatura de aprindere a motorinei este o variabila aleatoare normala, sa se determine un


interval de 99% ncredere pentru temperatura medie de aprindere a motorinei.

47
n acest caz, deoarece dispersia 2 este necunoscuta, pentru a determina intervalul de ncredere vom folosi
formula (63).
Folosind datele din esantion determinam media de selectie
1 + 2 + 3 + 4 + 5
= = 1446
5
si estimam abaterea patratica medie folosind formula (61):
s
P5 2
=1 ( )

= = 38 = 195
51

Folosind Anexa 3 pentru a determina valoarea lui astfel nct sa aiba loc relatia (62), adica () = 1+099
2 =
0995 (alegem 1 = 5 1 = 4 grade de libertate), si obtinem = 460.
nlocuind aceste valori n formula (63), obtinem ca un interval de 99% pentru temperatura medie de aprindere
a motorinei este

195 195
(1 2 ) = + = 1446 460 1446 + 460 = (1405 1487)
5 5

10.3 Intervale de ncredere pentru dispersia 2 unei populatii normale


Procednd similar Teoremei 10.1, si folosind n acest caz estimatorul

1 X 2
2 =
1 =1

al dispersiei, se poate arata ca variabila aleatoare

2
= ( 1)
2
are o distributie 2 cu 1 grade de libertate (valorile functiei de distributie sunt tabelate n Anexa 4).
Deoarece aceasta distributie nu este simetrica (ca n cazul distributiei normale), n loc de si determinam
doua constante 1 si 2 astfel nct 2 se afla ntre 1 si 2 cu probabilitate , adica

(1 2 ) = . (64)

Spre exemplu, determinam constantele 1 si 2 astfel nct


1 1+
(1 ) = si (2 ) = (65)
2 2
unde () este n acest caz functia de distributie a variabilei aleatoare 2 cu 1 grade de libertate din Anexa 4
(procednd astfel, aria de sub densitatea variabilei aleatoare 2 cuprinsa ntre 1 si 2 va fi egala cu 1+ 1
2 2 = ,
si are deci loc relatia (64) de mai sus).
Relatia (64) se mai poate scrie echivalent sub forma

2
1 ( 1) 2 2 =

de unde rezolvnd inegalitatile n raport cu 2 obtinem



1 2 1 2
2 =
2 1
sau
(1 2 ) =
1 2 1 2
unde 1 = 2 si 2 = 1 .

48
nlocuind variabilele aleatoare 1 prin valorile observate 1 ale esantionului obtinem ca un
interval de ncredere pentru dispersia necunoscuta 2 a populatiei este

1 2 1 2
(1 2 ) = (66)
2 1
1
P 2
unde este volumul selectiei, 2 = 1 2
=1 ( ) este estimatorul dispersiei , iar 12 sunt determinate din
Anexa 4 pentru 1 grade de libertate conform relatiilor (65).

Exemplul 10.6 Sa se determine un interval de 95% ncredere pentru dispersia necunoscuta 2 a esantionului

89 84 87 81 89 86 91 90 78 89 87 99 83 89

reprezentnd rezistenta la rupere (kg/mm2 a unei table de metal).


1 ++14
Folosind valorile esantionului ( = 14 valori) determinam media selectiei = 14 = 8728 si estimatorul
2 al dispersiei
14
1 X
2 = ( ) = 2515
14 1 =1
Folosind Anexa 4 (cu 1 = 14 1 = 13 grade de libertate), determinam constantele 12 astfel nct (1 ) =
1
2 = 0025 si (2 ) = 1+2 = 0975. Obtinem 1 = 501 si 2 = 2474.
Folosind formula (66) determinam intervalul de ncredere pentru dispersia necunoscuta 2

1 2 1 2 14 1 14 1
(1 2 ) = = 2515 2515 = (1321 6525)
2 1 2474 501

10.4 Intervale de ncredere pentru alte distributii


Intervalele de ncredere pentru media si dispersia 2 determinate n sectiunile anterioare se aplica n cazul unei
distributii normale.
Pentru a obtine aceste formule s-a folosit faptul ca daca 1 sunt variabile aleatoare normale independente
cu medie si dispersie 2 , atunci variabila aleatoare

este o variabila aleatoare normala standard.


Una din teoremele fundamentale ale Teoriei probabilitatilor (Teorema Limita centrala) afirma ca daca 1
sunt variabile aleatoare independente cu medie si dispersie 2 (nu neaparat normale), atunci pentru valori ale lui
ale volumului selectiei suficient de mari, variabila aleatoare

este aproximativ o variabila aleatoare normala standard.


Acest fapt permite ca formulele pentru intervalele de ncredere pentru media si dispersia 2 a unei populatii
normale din sectiunile anterioare sa poata fi folosite si n cazul altor distributii, nu neaparat normale. Pentru ca
aproximarea sa fie buna, volumul al selectiei trebuie sa fie cel putin 20 n cazul intervalelor de ncredere pentru
medie, si cel putin 50 n cazul intervalelor de ncredere pentru dispersie.

Exercitii

Exercitiul 10.1 De ce sunt intervalele de ncredere mai utile dect estimatorii punctuali?

Exercitiul 10.2 Ce se ntmpla cu intervalul de ncredere din Examplul 10.2 daca se foloseste un nivel de ncredere
de 99% n loc de 95%? Dar daca media de esantionului este 8 n loc de 5?

Exercitiul 10.3 Sa se determine un interval de 99% ncredere pentru media a unei populatii normale cu abatere
patratica medie 25, folosind esantionul

308 300 299 301 317 340

49
Exercitiul 10.4 Sa se determine un interval de 95% ncredere pentru media a unei populatii normale cu abatere
patratica medie 12, folosind esantionul
10 10 8 12 10 11 10 11

Exercitiul 10.5 Sa se determine un interval de 95% ncredere pentru media a unei populatii normale cu dispersie
2 = 16, folosind un esantion de volum 200 avnd medie 7481.

Exercitiul 10.6 Ce se ntmpla cu intervalul de ncredere din exercitiul anterior daca volumul esantionului se
reduce la 50?

Exercitiul 10.7 Ce volum al esantionului este necesar pentru ca intervalul de 95% ncredere pentru medie sa aiba
o lungimea 2? ?

Exercitiul 10.8 Sa se determine un interval de 99% ncredere pentru media unei populatii normale cu dispersie
2 = 036 folosind un esantion de volum 290 cu medie 1630.

Presupunnd ca populatia din care urmatoarele esantioane au fost extrase este normala, sa se determine un
interval de 99% ncredere pentru media a populatiei.

Exercitiul 10.9 Un esantion de 20 de suruburi cu medie 1550 cm si dispersie 009 cm2 .

Exercitiul 10.10 Temperatura de topire a aluminiului (n grade Celsius) n cazul esantionului

658 665 652 661 660

Exercitiul 10.11 Continutul de cupru (n procente) a unui aliaj de alama n cazul esantionului

65 65 64 63 65 66 63 64 62 63

Exercitiul 10.12 Un interval de 99% ncredere pentru parametrul al distributiei binomiale folosind un esantion
de volum 24 000 cu frecventa relativa de aparitie a succesului 12012
24000 = 05005.

Exercitiul 10.13 Sa se determine un interval de 95% ncredere pentru procentul de masini aflate pe o autostrada
care au frne aflate n conditii necorespunzatoare, folosind folosind faptul ca din 500 masini verificate n mod aleator,
87 au avut frne aflate n conditii necorespunzatoare.

Presupunnd ca populatia din care urmatoarele esantioane au fost extrase este normala, sa se determine un
interval de 95% ncredere pentru dispersia 2 a populatiei.

Exercitiul 10.14 Rezistenta la rupere (kpsi) a unui aliaj de otel aflat la temperatura camerei, folosind esantionul

251 255 258 253 253 252 250 252 255 256

Exercitiul 10.15 Emisia de monoxid de carbon (grame pe km) a unui anumit tip de masina (avnd viteza medie
de 55 km/h), folosind esantionul
173 178 180 177 182 174 176 181

Exercitiul 10.16 Daca este o variabila aleatoare normala cu medie 40 si dispersie 4, ce fel de distributie au
variabilele aleatoare 3 si 5 2?

Exercitiul 10.17 Daca 1 si 2 sunt variabile aleatoare normale independente, cu medii 16, respectiv 12, si
dispersii 8, respectiv 2, care este distributia variabilei aleatoare 41 2 ?

Exercitiul 10.18 O masina umple cutii cntarind kg cu kg de sare, unde si sunt variabile aleatoare
nromale cu medii 200 kg, respectiv 10 kg, si dispersii 2 kg, respectiv 0.5 kg. Ce procent de cutii rezultate vor cntari
ntre 208 kg si 212 kg?

Exercitiul 10.19 Daca greutatea a sacilor de ciment este distribuita normal cu medie 40 kg si dispersie 2 kg,
cti saci de ciment poate cara un camion daca probabilitatea ca greutatea totala sa depaseasca 2 000 kg este de 5%?

50

S-ar putea să vă placă și