Sunteți pe pagina 1din 2

Teoria selecţiei Teoria selecţiei

Estimatori. Intervale de ı̂ncredere Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere

Teoria selecţiei Procedeul prin care se obţin informaţii privind ı̂ntreaga populaţie folosind
rezultatele din studiul eşantioanelor se numeşte inferenţă statistică.
Cercetarea statistică a unei caracteristici se poate face atât prin estimarea
Cercetarea statistică a unei caracteristici pentru o populaţie (ı̂n general de parametrilor (o caracteristică numerică, un parametru din funcţia sau
Metode numerice şi statistică volum mare) se face prin sondaje asupra unei părţi finite, aleasă aleator a densitatea de repartiţie), cât şi prin verificarea ipotezelor statistice.
Curs 11 populaţiei. Aceste părţi, care se presupun a fi omogene din punct de
vedere al caracteristicii studiate, se numesc eşantioane. Numărul de Există două tipuri de estimări utilizate mai des ı̂n practică: estimări
elemente dintr-un eşantion constituie volumul eşantionului. punctuale şi estimări prin intervale de ı̂ncredere.
În cadrul estimării punctuale a unui parametru se foloseşte un procedeu
lect. Ciprian Deliu Procedeul de a obţine un eşantion dintr-o populaţie se numeşte selecţie.
de determinare, pe baza datelor unei selecţii, a unui număr care
B cdeliu@tuiasi.ro Dacă fiecare element al populaţiei are şansă egală de a aparţine unui
aproximează valoarea reală a parametrului.
eşantion, atunci avem o selecţie aleatoare simplă.
m moodle.deliu.ro În cadrul celuilalt tip de estimare a unui parametru λ, i se poate asocia un
interval (λ, λ̄), numit interval de ı̂ncredere, cu proprietatea că orice
Selecţiile pot fi cu repetiţie dacă elementul ales este reintrodus ı̂n
Universitatea Tehnică ”Gh. Asachi” Iaşi populaţie ı̂nainte de extragerea următorului element (alegerile succesive
element din acesta reprezintă, cu o anumită probabilitate, o valoare
Facultatea de Hidrotehnică, Geodezie şi Ingineria Mediului sunt independente şi echiprobabile) şi fără repetiţie ı̂n caz contrar.
aproximativă a parametrului:
P (λ < λ < λ̄) = α, α ∈ (0, 1).
În cazul ı̂n care volumul populaţiei N este foarte mare ı̂n raport cu
2019 volumul eşantionului n, nu se face nicio diferenţă ı̂ntre selecţia cu
repetiţie şi cea fără repetiţie. Selecţia fără repetiţie prezintă interes numai Intervalul (λ, λ̄) se numeşte 100α% interval de ı̂ncredere, α este nivel de
atunci când volumul populaţiei este mic. ı̂ncredere, 1 − α este pragul de ı̂ncredere (sau nivel de semnificaţie), iar
λ, λ̄ sunt limite de ı̂ncredere pentru parametrul λ.

Metode numerice şi statistică - Curs 11 1/14 Metode numerice şi statistică - Curs 11 2/14 Metode numerice şi statistică - Curs 11 3/14

Teoria selecţiei Teoria selecţiei Teoria selecţiei


Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere Intervale de ı̂ncredere

Definiţie Definiţie Definiţie


Fie X o variabilă aleatoare teoretică asociată unei caracteristici a Fie X ∶ Ω → R o variabilă aleatoare a cărei repartiţie depinde de un Estimatorul H(X, n) se numeşte:
unei populaţii Ω şi X1 , X2 , . . . , Xn variabile aleatoare independente parametru real θ, asociată unei caracteristici numerice a unei consistent pentru parametrul θ dacă
de selecţie, asociate selecţiilor de volum n ale lui Ω. populaţii statistice Ω, {ω1 , ω2 , . . . , ωn } ⊂ Ω un eşantion de volum n
O variabilă aleatoare S ∶ Ω → R pentru care există o funcţie şi {x1 , x2 , . . . , xn } valorile lui X pe eşantionul respectiv, adică ∀ε > 0, lim P (∣H(X, n) − θ∣ < ε) = 1
H ∶ Rn → R astfel ı̂ncât
X(ωi ) = xi , i = 1, . . . , n.
n→∞

S(ω1 , ω2 , . . . , ωn ) = H (X1 (ω1 ), X2 (ω2 ), . . . , Xn (ωn )) , ∀ωi ∈ Ω, i = 1, . . . , n corect pentru parametrul θ dacă
Se numeşte estimator pentru parametrul θ orice funcţie de
se numeşte funcţie de selecţie sau statistică. selecţie H(X, n) care aproximează acest parametru; lim E(H(X, n)) = θ, lim V ar(H(X, n)) = 0
Valoarea H(x1 , x2 , . . . , xn ) = θ̂ se numeşte estimaţie n→∞ n→∞

Pentru comoditate vom nota punctuală a parametrului θ. absolut corect pentru parametrul θ dacă

S = H(X1 , X2 , . . . , Xn ) = H(X, n). Exemplu: E(H(X, n)) = θ, lim V ar(H(X, n)) = 0


Fie o variabilă aleatoare X repartizată N (µ, σ). Pe un eşantion de n→∞
Informaţiile obţinute asupra variabilelor aleatoare de selecţie volum 4 se obţin valorile x1 = 25, x2 = 30, x3 = 29, x4 = 31. Media nedeplasat pentru parametrul θ dacă
Xi , i = 1, . . . , n ne vor permite estimarea unor parametri de selecţie a acestor valori x̄ = 25+30+29+31 = 28.75 este o estimaţie
E(H(X, n)) = θ
4
asociaţi unei distribuţii. punctuală a parametrului µ.
Metode numerice şi statistică - Curs 11 4/14 Metode numerice şi statistică - Curs 11 5/14 Metode numerice şi statistică - Curs 11 6/14

Teoria selecţiei Teoria selecţiei Teoria selecţiei


Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere Intervale de ı̂ncredere

Estimatori pentru medie şi dispersie Estimatori pentru medie şi dispersie Verosimilitate maximă
Estimatorul Fie X o variabilă aleatoare discretă care ia valorile {xi ∣i = 1, . . . , n} cu
Estimatorul probabilităţile depinzând de un parametru θ şi X1 , X2 , . . . , Xn variabilele
1 n
m(X, n) = X̄ = ∑ Xi
n n
D2 (X, n) = S 2 = ∑(Xi − X̄) = ∑ Xi − X̄
1 2 1 2 2 aleatoare de selecţie independente corespunzătoare selecţiilor de volum n.
n i=1 n i=1 n i=1 Probabilitatea ca vectorul aleator (X1 , X2 , . . . , Xn ) să ia valoarea
n
se numeşte medie de selecţie şi este un estimator absolut corect se numeşte dispersie de selecţie şi este un estimator corect (x1 , x2 , . . . , xn ) este ∏ P (xi , θ). Funcţia
şi nedeplasat pentru E(X): pentru V ar(X). Avem
i=1
n

1 n 1 n n−1 V (x1 , x2 , . . . , xn ; θ) = ∏ P (xi , θ)


E(X̄) = E ( ∑ Xi ) = ∑ E(Xi ) = nE(X) = E(X) E(S ) =
1 2
V ar(X) i=1
n i=1 n i=1 n n se numeşte funcţie de verosimilitate a variabilei aleatoare X.
deci S 2 nu este un estimator nedeplasat pentru V ar(X). Dacă X este o variabilă aleatoare continuă cu densitatea de repartiţie
1 n 1 n
V ar(X̄) = V ar ( ∑ Xi ) = 2 ∑ V ar(Xi ) = 2 nV ar(X)
1
Dacă se alege f (x, θ), unde θ este un parametru care trebuie determinat, atunci funcţia
n i=1 n i=1 n de verosimilitate se defineşte ca fiind densitatea de repartiţie a vectorului
1 n aleator (X1 , X2 , . . . , Xn ), adică
s2 = S2 = ∑(Xi − X̄) ,
n 2
lim V ar(X̄) = lim V ar(X) = 0 n−1 n − 1 i=1
1 n
n→∞ n→∞ n V (x1 , x2 , . . . , xn ; θ) = ∏ f (xi , θ).
i=1
obţinem un estimator absolut corect şi nedeplasat pentru V ar(X).
Metode numerice şi statistică - Curs 11 7/14 Metode numerice şi statistică - Curs 11 8/14 Metode numerice şi statistică - Curs 11 9/14
Teoria selecţiei Teoria selecţiei Teoria selecţiei
Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere Intervale de ı̂ncredere

Principiul verosimilităţii maxime constă ı̂n determinarea parametrului θ Interval de ı̂ncredere pentru medie (σ cunoscut) Valoarea ∆X̄ = z1− α2 ⋅ √σn se numeşte marjă de eroare şi cu
din condiţia ca V (x1 , x2 , . . . , xn ; θ), considerată ca o funcţie
diferenţiabilă de θ pentru un eşantion dat, să admită un maxim. Intervalul de ı̂ncredere pentru media unei variabile aleatoare X ajutorul acesteia putem rescrie intervalul de ı̂ncredere sub
Deoarece f (x) = ln x este o funcţie monoton crescătoare, rezultă că având repartiţia N (m, σ 2 ) cu m ∈ R necunoscut şi σ 2 > 0 cunoscut forma
funcţiile ln V (x1 , x2 , . . . , xn ; θ) şi V (x1 , x2 , . . . , xn ; θ) ı̂şi ating valoarea (X̄ − ∆X̄, X̄ + ∆X̄)
este de forma (X̄ − z1− α2 ⋅ √ , X̄ + z1− α2 ⋅ √ ), cu
σ σ
Cu cât nivelul de ı̂ncredere 1 − α este mai mare, cu atât marja
maximă pentru aceeaşi valoare a lui θ.
n n
Valoarea θ̂ a parametrului θ pentru care V admite un maxim se numeşte
estimaţie de verosimilitate maximă şi este soluţia ecuaţiei de eroare ∆X̄ este mai mare şi lungimea intervalului de
P (X̄ − z1− α2 ⋅ √ < m < X̄ + z1− α2 ⋅ √ ) = 1 − α
σ σ
∂(ln V ) ∂f (xi , θ)
ı̂ncredere este mai mare.
=0⇔∑
n
= 0.
1
n n
i=1 f (xi , θ)
∂θ ∂θ Pentru un nivel de ı̂ncredere dat, volumul minim necesar al
numită ecuaţia de verosimilitate maximă. unde X̄ = X1 +X2n+⋅⋅⋅+Xn este media de selecţie, α ∈ (0, 1) este unui eşantion pentru a obţine un interval de ı̂ncredere cu
Exemplu: Pentru o variabilă aleatoare repartizată exponenţial de parametru θ nivelul de semnificaţie iar z1− α2 este cuantila de ordin 1 − α2 a marja de eroare ∆X̄ este
se obţine funcţia de verosimilitate repartiţiei normale standard, mai exact: z1− α2 ⋅ σ 2
V = (θe−θx1 )(θe−θx2 ) . . . (θe−θxn ) = θn e−θ(x1 +⋅⋅⋅+xn ) n=( )
1−α
= F −1 (1 − ) = Φ−1 ( )
α ∆X̄
care ı̂şi atinge maximumul pentru θ̂ = x1 +⋅⋅⋅+x
n
, aşadar estimatorul de z1− α2
n 2 2 Pentru selecţii de volum mare, intervalul de ı̂ncredere pentru
verosimilitate maximă pentru parametrul θ este
θ(X, n) =
n unde F este funcţia de repartiţie N (0, 1) iar Φ este funcţia lui medie este valabil şi pentru cazul ı̂n care variabila X are o
X1 + X2 + ⋅ ⋅ ⋅ + Xn
.
Laplace. repartiţie oarecare datorită teoremei limită centrală.
Metode numerice şi statistică - Curs 11 10/14 Metode numerice şi statistică - Curs 11 11/14 Metode numerice şi statistică - Curs 11 12/14

Teoria selecţiei Teoria selecţiei


Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere

Exemplu Exerciţii
De la o maşină de ı̂mbuteliat băuturi răcoritoare s-au testat 36 sticle şi s-a 1 S-a efectuat un studiu asupra ı̂nălţimii sportivilor pe un
obţinut volumul mediu de 2.25 l. Presupunând că volumul este normal
distribuit cu abaterea medie pătratică de 0.15 l, să se afle un interval de eşantion de 50 persoane, ı̂n urma căruia a rezultat că ı̂nălţimea
ı̂ncredere 90% pentru volumul mediu. Cât de mare trebuie să fie volumul medie este 1.745 m, cu abaterea medie pătratică de 0.069 m.
eşantionului pentru a avea o marjă de eroare de 0, 01? Să se găsească un interval de ı̂ncredere 98% pentru ı̂nălţimea
Rezolvare:
medie a sportivilor. Cât de mare trebuie să fie eşantionul
Avem n = 36, X̄ = 2.25 şi σ = 0.15.
pentru a avea o marjă de eroare de 0.01?
Cum nivelul de ı̂ncredere este 1 − α = 0.9, găsim nivelul de semnificaţie
R: (1.722, 1.767); n = 258.
α = 0.1, de unde 1 − α2 = 0.95.
2 În urma unui studiu făcut pe un eşantion de 100 maşini, s-a
Cuantila corespunzătoare acestei valori din repartiţia normală standard
este z1− α2 = 1.645 obţinut un număr mediu de kilometri parcurşi anual de 23500,
Marja de eroare ∆X̄ = z1− α2 ⋅ √σ
n
= 0.0411 cu abaterea medie pătratică de 3900 km.
Să se afle un interval de ı̂ncredere 99% pentru numărul mediu
Intervalul de ı̂ncredere 90% este (X̄ − ∆X̄, X̄ + ∆X̄) = (2.2089, 2.2911)
de kilometri parcurşi anual de o maşină. Cât de mare trebuie
Volumul eşantionului necesar pentru a avea o marjă de eroare de 0, 01:
să fie volumul eşantionului pentru a aproxima acest număr
z1− α2 ⋅ σ 2
n=( ) = 608.7473 ≃ 609 mediu cu o marjă de eroare de 100km?
R: (22495.4266, 24504.5734); n = 10092.
∆X̄

Metode numerice şi statistică - Curs 11 13/14 Metode numerice şi statistică - Curs 11 14/14

S-ar putea să vă placă și