Sunteți pe pagina 1din 4

CAPITOLUL 2.

ELEMENTE DE STATISTICĂ MATEMATICĂ 73

2.2 Intervale de încredere


În secţiunea anterioară am determinat diverse estimări θ̂ = θ̂ (X1 , . . . , Xn ) ale parametrului necunoscut θ al den-
sităţii f = f (x, θ) a unei populaţii X folosind o selecţie X1 , . . . , Xn de volum n a acestei populaţii.
În practică, valoarea θ̂ (x1 , . . . , xn ) calculată folosind valorile observate x1 , . . . , xn ale variabilelor aleatoare
X1 , . . . , Xn nu coincide aproape niciodată cu valoarea reală a parametrului θ.
Se pune problema cât de apropiat este θ̂ de valoarea reală a lui θ, în sensul determinării unui interval (L, U )
(L = L (X1 , . . . , Xn ) şi U = U (X1 , . . . , Xn ) sunt variabile aleatoare ce depind de selecţia X1 , . . . , Xn aleasă), astfel
încât θ ∈ (L, U ) cu o probabilitatea dată, adică

P (L < θ < U ) = 1 − α,

unde α ∈ (0, 1) este o valoare dată.


Înlocuind variabilele aleatoare X1 , . . . , Xn prin valorile observate x1 , . . . , xn , obţinem l = L (x1 , . . . , xn ) şi u =
U (x1 , . . . , xn ), şi numim intervalul (l, u) un interval de 100 (1 − α) % încredere pentru parametrul necunoscut θ.
În general, se poate determina un interval de încredere pentru parametrul necunoscut θ al densităţii unei populaţii
X în următoarele condiţii:
există o variabilă aleatoare g = g (X1 , . . . , Xn , θ) cu următoarele proprietăţi:

1) g depinde netrivial de selecţia X1 , . . . , Xn şi parametrul θ


2) distribuţia variabilei aleatoare g nu depinde de θ (sau de alţi parametrii necunoscuţi).

În aceste condiţii, determinarea unui interval de 100 (1 − α) % încredere pentru θ se face astfel: se determină
constantele cL şi cU astfel încât să avem

P (cL < g (X1 , . . . , Xn , θ) < cU ) = 1 − α,

şi se rezolvă inegalităţile anterioare în raport cu θ, pentru a obţine:

P (L (X1 , . . . , Xn ) < θ < U (X1 , . . . , Xn )) = 1 − α.

Variabilele aleatoare L şi U astfel obţinute determină un interval (l, u) de 100 (1 − α) % încredere pentru para-
metrul necunoscut θ.

2.2.1 Cazul mediei distribuţiei normale (cu dispersie cunoscută)


¡ ¢
Să presupunem că populaţia X are o distribuţie normală N μ, σ 2 cu medie μ necunoscută şi dispersie σ 2 cunoscută.
¡Dacă¢X1 , . . . , Xn este o selecţie de volum n din populaţia dată, atunci X1 , . . . , Xn sunt ¡variabile¢ aleatoare
N μ, σ 2 independente, şi se poate arăta că X1 + . . . + Xn este o variabilă aleatoare normală N nμ, nσ 2 cu medie
nμ şi dispersie nσ 2 .
Rezultă deci că variabila aleatoare
X1 +...+Xn
X1 + . . . + Xn − nμ n −μ X̄ − μ
√ = =
σ n √σ √σ
n n
¡ ¢
este o variabilă aleatoare normală N μ, σ 2 , şi deci variabila aleatoare

X̄ − μ
g (X1 , . . . , Xn ) =
√σ
n

verifică ipotezele precizate anterior.


Să notăm cu zα > 0 punctul cu proprietatea că aria curpinsă între axa orizontală şi graficul densităţii normale
N (0, 1), situate la dreapta punctului zα este egală cu α, adică
Z ∞
1 x2
√ e− 2 dx = α,
zα 2π
sau echivalent Z zα Z ∞
1 x2 1 x2
Φ (zα ) = √ e− 2 dx = 1 − √ e− 2 dx = 1 − α. (2.1)
−∞ 2π zα 2π

Mihai N. Pascu — Notiţe curs Probabilităţi şi Statistică


CAPITOLUL 2. ELEMENTE DE STATISTICĂ MATEMATICĂ 74

De asemenea, să observăm că din simetria funcţiei de densitate normală, aria de sub graficul densităţii, aflate
la stânga punctului −zα este de asemenea egală cu α, adică
Z −zα
1 x2
Φ (−zα ) = √ e− 2 dx = α. (2.2)
−∞ 2π
Observaţia 2.2.1 Pentru un nivel de încredere α ∈ (0, 1) fixat, valorile lui zα se determină din tabele de valori
ale funcţiei de distribuţie a densităţii normale N (0, 1), folosind formula (2.1) sau (2.2).
Cu notaţia anterioară, avem
à ! Z zα/2
X̄ − μ 1 x2
P −zα/2 < < zα/2 = √ e− 2 dx
√σ −zα/2 2π
n
¡ ¢ ¡ ¢
= Φ zα/2 − Φ −zα/2
= 1 − α/2 − (α/2)
= 1 − α,
de unde rezolvând în raport cu parametrul μ necunoscut obţinem
µ ¶
σ σ
P X̄ − zα/2 √ < μ < X̄ + zα/2 √ = 1 − α,
n n
şi deci avem (
L = L (X1 , . . . , Xn ) = X̄ + zα/2 √σn
U = U (X1 , . . . , Xn ) = X̄ − zα/2 √σn
Am obţinut deci următoarea:
¡ ¢
Propoziţia 2.2.2 Dacă X1 , . . . , Xn este o selecţie de volum n dintr-o populaţie normală N μ, σ 2 cu dispersie σ 2
cunoscută, atunci un interval de 100 (1 − α) % încredere pentru parametrul necunoscut μ este
µ ¶
σ σ
(l, u) = x̄ − zα/2 √ , x̄ + zα/2 √ ,
n n
unde x̄ = x1 +...+x
n
n
este ¡media
¢ de selecţie a valorilor observate x1 , . . . , xn ale selecţiei X1 , . . . , Xn şi zα/2 este
determinat astfel încât Φ zα/2 = 1 − α/2.
Observaţia 2.2.3 Să presupunem că într-un exemplu concret obţinem pentru μ intervalul (5.9; 6.1) de 100 (1 − α) %
încredere. Este tentant (dar incorect!) să se considere că probabilitatea ca μ să aparţină intervalului (5.9; 6.1) este
1 − α.
Cum μ are o valoare determinată, această probabilitate este egală cu 0 sau 1, şi deci nu poate fi egală cu 1 − α
(pentru α ∈ (0, 1)).
Interpretarea corectă constă în a realiza că intervalul de încredere este un interval aleator (capetele intervalului
depind de selecţia aleasă), cu proprietatea că P (L < μ < U ) = 1 − α, adică μ se găseşte în 100 (1 − α) % din
intervalele (l, u) calculate, unde l = L (x1 , . . . , xn ) şi u = U (x1 , . . . , xn ) iar x1 , . . . , xn sunt valorile observate ale
variabilelor aleatoare X1 , . . . , Xn .
¯ ¯
Observaţia 2.2.4 (Alegerea volumului n al selecţiei) Dacă se doreşte ca eroarea de estimare ¯X̄ − μ¯ să nu
depăşească o valoare E dată cu încredere 100 (1 − α) %, atunci
¡ ¢
P −E < X̄ − μ < E ≥ 1 − α,
şi cum µ ¶
σ σ
P −zα/2 √ < X̄ − μ < zα/2 √ = 1 − α,
n n
rezultă prin comparare că trebuie să avem
σ
E ≥ zα/2 √ ,
n
de unde obţinem că volumul selecţiei trebuie să verifice inegalitatea
³ σz ´2
α/2
n≥
E

Mihai N. Pascu — Notiţe curs Probabilităţi şi Statistică


CAPITOLUL 2. ELEMENTE DE STATISTICĂ MATEMATICĂ 75

Observaţia 2.2.5 În mod similar construcţiei anterioare, atunci când ne interesează numai estimarea parametrului
necunoscut printr-o valoare limită superioară sau inferioară, se pot construi intervale de 100 (1 − α) % încredere de
mărginire: ³ ´
— superioară: (l, u) = −∞, x̄ + zα √σn ;
³ ´
— inferioară: (l, u) = x̄ − zα √σn , +∞ .

2.2.2 Intervale de încredere pentru media selecţiilor mari


Considerăm cazul estimării mediei μ a unei populaţii X, nu neapărat normal distribuită. Reamintim următoarea:

Teorema 2.2.6 (Teorema limită centrală) Dacă X1 , X2 , . . . sunt variabile aleatoare independente şi identic dis-
tribuite, cu medie M (Xi ) = μ şi dispersie σ 2 (Xi ) = σ 2 finite, atunci funcţia de distribuţie a variabilei aleatoare

X1 + . . . + Xn − nμ

σ n

tinde pentru n → ∞ către funcţia de distribuţie normală N (0, 1), adică


µ ¶ Z a
X1 + . . . + Xn − nμ 1 x2
P √ <a → √ e− 2 dx.
σ n n→ ∞ 2π
Din Teorema limită centrală rezultă deci că pentru valori n ale volumului selecţiei mari (spre exemplu n ≥ 30),
putem considera că variabila aleatoare X̄−μ
√σ este aproximativ o variabilă aleatoare normală N (0, 1).
n

În plus, dacă dispersia σ2 este necunoscută, atunci înlocuind pe σ prin estimatorul


s
Pn ¡ ¢2
i=1 Xi − X̄
σ̂ (X1 , . . . , Xn ) = ,
n−1

pentru valori n suficient de mari (spre exemplu pentru n ≥ 40), avem

X̄ − μ
≈ N (0, 1)
√σ̂
n

este aproximativ o varriabilă aleatoare normală cu medie 0 şi dispersie 1. Procedând similar cazului anterior,
obţinem următoarea:

Propoziţia 2.2.7 Pentru valori n ale volumului selecţiei X1 , . . . , Xn suficient de mari, variabila aleatoare

X̄ − μ
Z=
√σ̂
n

este aproximativ o variabilă aleatoare N (0, 1), şi deci un interval de 100 (1 − α) % încredere pentru media μ este
µ ¶
σ σ
(l, u) = x̄ − zα/2 √ , x̄ + zα/2 √ ,
n n

unde x̄ = x1 +...+x
n
n
este ¡media
¢ de selecţie a valorilor observate x1 , . . . , xn ale selecţiei X1 , . . . , Xn şi zα/2 este
determinat astfel încât Φ zα/2 = 1 − α/2.

2.2.3 Intervale de incredere pentru dispersia unei populaţii normale


— a se vedea notitele de curs —

Mihai N. Pascu — Notiţe curs Probabilităţi şi Statistică


CAPITOLUL 2. ELEMENTE DE STATISTICĂ MATEMATICĂ 76

2.2.4 Exerciţii
1. Pentru o populaţie X cu medie μ necunoscută şi dispersie σ 2 cunoscută, care este procentul de încredere
100 (1 − α) % al următoarelor intervale de încredere?
³ ´
(a) (l, u) = x̄ − 2.14 √σn , x̄ + 2.14 √σn
³ ´
(b) (l, +∞) = x̄ − 2.94 √σn , +∞
³ ´
(c) (−∞, u) = −∞, x̄ + 1.85 √σn

2. Pentru ce valoare α se obţin intervale bilaterale (l, u) de 75%, 80%, respectiv 98% încredere, pentru media μ
a unei populaţii normale?
3. Pentru ce valoare α se obţin intervale unilaterale de mărginire inferioară/superioară, (l, +∞), respectiv
(−∞, u), de 90%, 95%, respectiv 99% încredere, pentru media μ a unei populaţii normale?
4. Să se determine un interval de 100 (1 − α) % încredere pentru media μ a unei populaţii normale având dispersia
σ 2 = 400 în următoarele cazuri:

(a) Volumul selecţiei n = 10, media de selecţie x̄ = 1000, α = 0.05;


(b) Volumul selecţiei n = 25, media de selecţie x̄ = 1000, α = 0.05;
(c) Volumul selecţiei n = 10, media de selecţie x̄ = 1000, α = 0.01;
(d) Volumul selecţiei n = 25, media de selecţie x̄ = 1000, α = 0.01.

Ce se întâmplă cu intervalele de încredere odată cu creşterea lui n, respectiv α?


5. Să se determine volumul minim n al selecţiei X1 , . . . , Xn pentru care un interval de 95% încredere pentru
media μ a unei populaţii normale are lungimea cel mult 40 (eroare de aproximare este deci E < 20)
6. Două intervale de încredere pentru media μ a unei populaţii normale sunt (l, u) = (3124.9, 3215.7), respectiv
(l, u) = (3110.5, 3230.1).

(a) Dacă ambele intervale sunt calculate folosind aceeaşi selecţie, care este media selecţiei x̄?
(b) Dacă primul interval este un interval de 90% încredere, iar cel de+al doilea de 99% încredere, şi sunt
calculate folosind aceeaşi selecţie, să se determine un interval de 95% încredere pentru media μ.

7. Durata medie de viaţă a unui bec este o variabilă aleatoare X normală cu medie μ necunoscută şi dispersie
σ 2 = 252 . Dacă pentru o selecţie de volum n = 20 media de selecţie x̄ = 1014 ore de funcţionare, să se
determine:

(a) un interval bilateral (l, u) de 95% încredere pentru media μ;


(b) un interval unilateral (l, +∞) de mărginire superioară de 95% încredere pentru media μ.

8. Rezistenţa unui material este o variabilă aleatoare X având o distribuţie normală cu media μ necunoscută şi
dispersie σ 2 = 1000 kgf/cm2 . Dacă o selecţie de volum n = 12 a avut o medie de rezistenţă x̄ = 3250 kgf/cm2 ,
să se determine

(a) un interval de 95% încredere pentru media μ;


(b) un interval de 99% încredere pentru media μ;
(c) Dacă se doreşte ca eroarea de aproximare să fie mai mică decât E < 15, ce volum de selecţie trebuie ales
pentru un interval de 99% încredere pentru media μ?

Mihai N. Pascu — Notiţe curs Probabilităţi şi Statistică

S-ar putea să vă placă și