Teoria Select Iei: Curs 11

Teoria selecţiei Teoria selecţiei
Estimatori. Intervale de ı̂ncredere Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere
Teoria selecţiei Procedeul prin care se obţin informaţii privind ı̂ntreaga populaţie folosind
rezultatele din studiul eşantioanelor se numeşte inferenţă statistică.
Cercetarea statistică a unei caracteristici se poate face atât prin estimarea
Cercetarea statistică a unei caracteristici pentru o populaţie (ı̂n general de parametrilor (o caracteristică numerică, un parametru din funcţia sau
Metode numerice şi statistică volum mare) se face prin sondaje asupra unei părţi finite, aleasă aleator a densitatea de repartiţie), cât şi prin verificarea ipotezelor statistice.
Curs 11 populaţiei. Aceste părţi, care se presupun a fi omogene din punct de
vedere al caracteristicii studiate, se numesc eşantioane. Numărul de Există două tipuri de estimări utilizate mai des ı̂n practică: estimări
elemente dintr-un eşantion constituie volumul eşantionului. punctuale şi estimări prin intervale de ı̂ncredere.
În cadrul estimării punctuale a unui parametru se foloseşte un procedeu
lect. Ciprian Deliu Procedeul de a obţine un eşantion dintr-o populaţie se numeşte selecţie.
de determinare, pe baza datelor unei selecţii, a unui număr care
B cdeliu@tuiasi.ro Dacă fiecare element al populaţiei are şansă egală de a aparţine unui
aproximează valoarea reală a parametrului.
eşantion, atunci avem o selecţie aleatoare simplă.
m moodle.deliu.ro În cadrul celuilalt tip de estimare a unui parametru λ, i se poate asocia un
interval (λ, λ̄), numit interval de ı̂ncredere, cu proprietatea că orice
Selecţiile pot fi cu repetiţie dacă elementul ales este reintrodus ı̂n
Universitatea Tehnică ”Gh. Asachi” Iaşi populaţie ı̂nainte de extragerea următorului element (alegerile succesive
element din acesta reprezintă, cu o anumită probabilitate, o valoare
Facultatea de Hidrotehnică, Geodezie şi Ingineria Mediului sunt independente şi echiprobabile) şi fără repetiţie ı̂n caz contrar.
aproximativă a parametrului:
P (λ < λ < λ̄) = α, α ∈ (0, 1).
În cazul ı̂n care volumul populaţiei N este foarte mare ı̂n raport cu
2019 volumul eşantionului n, nu se face nicio diferenţă ı̂ntre selecţia cu
repetiţie şi cea fără repetiţie. Selecţia fără repetiţie prezintă interes numai Intervalul (λ, λ̄) se numeşte 100α% interval de ı̂ncredere, α este nivel de
atunci când volumul populaţiei este mic. ı̂ncredere, 1 − α este pragul de ı̂ncredere (sau nivel de semnificaţie), iar
λ, λ̄ sunt limite de ı̂ncredere pentru parametrul λ.
Metode numerice şi statistică - Curs 11 1/14 Metode numerice şi statistică - Curs 11 2/14 Metode numerice şi statistică - Curs 11 3/14
Teoria selecţiei Teoria selecţiei Teoria selecţiei

Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere Intervale de ı̂ncredere
Definiţie Definiţie Definiţie

Fie X o variabilă aleatoare teoretică asociată unei caracteristici a Fie X ∶ Ω → R o variabilă aleatoare a cărei repartiţie depinde de un Estimatorul H(X, n) se numeşte:
unei populaţii Ω şi X1 , X2 , . . . , Xn variabile aleatoare independente parametru real θ, asociată unei caracteristici numerice a unei consistent pentru parametrul θ dacă
de selecţie, asociate selecţiilor de volum n ale lui Ω. populaţii statistice Ω, {ω1 , ω2 , . . . , ωn } ⊂ Ω un eşantion de volum n
O variabilă aleatoare S ∶ Ω → R pentru care există o funcţie şi {x1 , x2 , . . . , xn } valorile lui X pe eşantionul respectiv, adică ∀ε > 0, lim P (∣H(X, n) − θ∣ < ε) = 1
H ∶ Rn → R astfel ı̂ncât
X(ωi ) = xi , i = 1, . . . , n.
n→∞
S(ω1 , ω2 , . . . , ωn ) = H (X1 (ω1 ), X2 (ω2 ), . . . , Xn (ωn )) , ∀ωi ∈ Ω, i = 1, . . . , n corect pentru parametrul θ dacă
Se numeşte estimator pentru parametrul θ orice funcţie de
se numeşte funcţie de selecţie sau statistică. selecţie H(X, n) care aproximează acest parametru; lim E(H(X, n)) = θ, lim V ar(H(X, n)) = 0
Valoarea H(x1 , x2 , . . . , xn ) = θ̂ se numeşte estimaţie n→∞ n→∞
Pentru comoditate vom nota punctuală a parametrului θ. absolut corect pentru parametrul θ dacă
S = H(X1 , X2 , . . . , Xn ) = H(X, n). Exemplu: E(H(X, n)) = θ, lim V ar(H(X, n)) = 0

Fie o variabilă aleatoare X repartizată N (µ, σ). Pe un eşantion de n→∞
Informaţiile obţinute asupra variabilelor aleatoare de selecţie volum 4 se obţin valorile x1 = 25, x2 = 30, x3 = 29, x4 = 31. Media nedeplasat pentru parametrul θ dacă
Xi , i = 1, . . . , n ne vor permite estimarea unor parametri de selecţie a acestor valori x̄ = 25+30+29+31 = 28.75 este o estimaţie
E(H(X, n)) = θ
4
asociaţi unei distribuţii. punctuală a parametrului µ.

Estimatori pentru medie şi dispersie Estimatori pentru medie şi dispersie Verosimilitate maximă
Estimatorul Fie X o variabilă aleatoare discretă care ia valorile {xi ∣i = 1, . . . , n} cu
Estimatorul probabilităţile depinzând de un parametru θ şi X1 , X2 , . . . , Xn variabilele
1 n
m(X, n) = X̄ = ∑ Xi
n n
D2 (X, n) = S 2 = ∑(Xi − X̄) = ∑ Xi − X̄
1 2 1 2 2 aleatoare de selecţie independente corespunzătoare selecţiilor de volum n.
n i=1 n i=1 n i=1 Probabilitatea ca vectorul aleator (X1 , X2 , . . . , Xn ) să ia valoarea
n
se numeşte medie de selecţie şi este un estimator absolut corect se numeşte dispersie de selecţie şi este un estimator corect (x1 , x2 , . . . , xn ) este ∏ P (xi , θ). Funcţia
şi nedeplasat pentru E(X): pentru V ar(X). Avem
i=1
n
1 n 1 n n−1 V (x1 , x2 , . . . , xn ; θ) = ∏ P (xi , θ)

E(X̄) = E ( ∑ Xi ) = ∑ E(Xi ) = nE(X) = E(X) E(S ) =
1 2
V ar(X) i=1
n i=1 n i=1 n n se numeşte funcţie de verosimilitate a variabilei aleatoare X.
deci S 2 nu este un estimator nedeplasat pentru V ar(X). Dacă X este o variabilă aleatoare continuă cu densitatea de repartiţie
1 n 1 n
V ar(X̄) = V ar ( ∑ Xi ) = 2 ∑ V ar(Xi ) = 2 nV ar(X)
1
Dacă se alege f (x, θ), unde θ este un parametru care trebuie determinat, atunci funcţia
n i=1 n i=1 n de verosimilitate se defineşte ca fiind densitatea de repartiţie a vectorului
1 n aleator (X1 , X2 , . . . , Xn ), adică
s2 = S2 = ∑(Xi − X̄) ,
n 2
lim V ar(X̄) = lim V ar(X) = 0 n−1 n − 1 i=1
1 n
n→∞ n→∞ n V (x1 , x2 , . . . , xn ; θ) = ∏ f (xi , θ).
i=1
obţinem un estimator absolut corect şi nedeplasat pentru V ar(X).
Principiul verosimilităţii maxime constă ı̂n determinarea parametrului θ Interval de ı̂ncredere pentru medie (σ cunoscut) Valoarea ∆X̄ = z1− α2 ⋅ √σn se numeşte marjă de eroare şi cu
din condiţia ca V (x1 , x2 , . . . , xn ; θ), considerată ca o funcţie
diferenţiabilă de θ pentru un eşantion dat, să admită un maxim. Intervalul de ı̂ncredere pentru media unei variabile aleatoare X ajutorul acesteia putem rescrie intervalul de ı̂ncredere sub
Deoarece f (x) = ln x este o funcţie monoton crescătoare, rezultă că având repartiţia N (m, σ 2 ) cu m ∈ R necunoscut şi σ 2 > 0 cunoscut forma
funcţiile ln V (x1 , x2 , . . . , xn ; θ) şi V (x1 , x2 , . . . , xn ; θ) ı̂şi ating valoarea (X̄ − ∆X̄, X̄ + ∆X̄)
este de forma (X̄ − z1− α2 ⋅ √ , X̄ + z1− α2 ⋅ √ ), cu
σ σ
Cu cât nivelul de ı̂ncredere 1 − α este mai mare, cu atât marja
maximă pentru aceeaşi valoare a lui θ.
n n
Valoarea θ̂ a parametrului θ pentru care V admite un maxim se numeşte
estimaţie de verosimilitate maximă şi este soluţia ecuaţiei de eroare ∆X̄ este mai mare şi lungimea intervalului de
P (X̄ − z1− α2 ⋅ √ < m < X̄ + z1− α2 ⋅ √ ) = 1 − α
σ σ
∂(ln V ) ∂f (xi , θ)
ı̂ncredere este mai mare.
=0⇔∑
n
= 0.
1
n n
i=1 f (xi , θ)
∂θ ∂θ Pentru un nivel de ı̂ncredere dat, volumul minim necesar al
numită ecuaţia de verosimilitate maximă. unde X̄ = X1 +X2n+⋅⋅⋅+Xn este media de selecţie, α ∈ (0, 1) este unui eşantion pentru a obţine un interval de ı̂ncredere cu
Exemplu: Pentru o variabilă aleatoare repartizată exponenţial de parametru θ nivelul de semnificaţie iar z1− α2 este cuantila de ordin 1 − α2 a marja de eroare ∆X̄ este
se obţine funcţia de verosimilitate repartiţiei normale standard, mai exact: z1− α2 ⋅ σ 2
V = (θe−θx1 )(θe−θx2 ) . . . (θe−θxn ) = θn e−θ(x1 +⋅⋅⋅+xn ) n=( )
1−α
= F −1 (1 − ) = Φ−1 ( )
α ∆X̄
care ı̂şi atinge maximumul pentru θ̂ = x1 +⋅⋅⋅+x
n
, aşadar estimatorul de z1− α2
n 2 2 Pentru selecţii de volum mare, intervalul de ı̂ncredere pentru
verosimilitate maximă pentru parametrul θ este
θ(X, n) =
n unde F este funcţia de repartiţie N (0, 1) iar Φ este funcţia lui medie este valabil şi pentru cazul ı̂n care variabila X are o
X1 + X2 + ⋅ ⋅ ⋅ + Xn
.
Laplace. repartiţie oarecare datorită teoremei limită centrală.
Teoria selecţiei Teoria selecţiei

Estimatori. Intervale de ı̂ncredere Estimaţii punctuale Estimatori. Intervale de ı̂ncredere Estimaţii punctuale
Intervale de ı̂ncredere Intervale de ı̂ncredere
Exemplu Exerciţii
De la o maşină de ı̂mbuteliat băuturi răcoritoare s-au testat 36 sticle şi s-a 1 S-a efectuat un studiu asupra ı̂nălţimii sportivilor pe un
obţinut volumul mediu de 2.25 l. Presupunând că volumul este normal
distribuit cu abaterea medie pătratică de 0.15 l, să se afle un interval de eşantion de 50 persoane, ı̂n urma căruia a rezultat că ı̂nălţimea
ı̂ncredere 90% pentru volumul mediu. Cât de mare trebuie să fie volumul medie este 1.745 m, cu abaterea medie pătratică de 0.069 m.
eşantionului pentru a avea o marjă de eroare de 0, 01? Să se găsească un interval de ı̂ncredere 98% pentru ı̂nălţimea
Rezolvare:
medie a sportivilor. Cât de mare trebuie să fie eşantionul
Avem n = 36, X̄ = 2.25 şi σ = 0.15.
pentru a avea o marjă de eroare de 0.01?
Cum nivelul de ı̂ncredere este 1 − α = 0.9, găsim nivelul de semnificaţie
R: (1.722, 1.767); n = 258.
α = 0.1, de unde 1 − α2 = 0.95.
2 În urma unui studiu făcut pe un eşantion de 100 maşini, s-a
Cuantila corespunzătoare acestei valori din repartiţia normală standard
este z1− α2 = 1.645 obţinut un număr mediu de kilometri parcurşi anual de 23500,
Marja de eroare ∆X̄ = z1− α2 ⋅ √σ
n
= 0.0411 cu abaterea medie pătratică de 3900 km.
Să se afle un interval de ı̂ncredere 99% pentru numărul mediu
Intervalul de ı̂ncredere 90% este (X̄ − ∆X̄, X̄ + ∆X̄) = (2.2089, 2.2911)
de kilometri parcurşi anual de o maşină. Cât de mare trebuie
Volumul eşantionului necesar pentru a avea o marjă de eroare de 0, 01:
să fie volumul eşantionului pentru a aproxima acest număr
z1− α2 ⋅ σ 2
n=( ) = 608.7473 ≃ 609 mediu cu o marjă de eroare de 100km?
R: (22495.4266, 24504.5734); n = 10092.
∆X̄
Metode numerice şi statistică - Curs 11 13/14 Metode numerice şi statistică - Curs 11 14/14

Teoria Select Iei: Curs 11

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria Select Iei: Curs 11

Încărcat de

Drepturi de autor:

Formate disponibile

Teoria selecţiei Teoria selecţiei

Teoria selecţiei Teoria selecţiei Teoria selecţiei

Definiţie Definiţie Definiţie

S = H(X1 , X2 , . . . , Xn ) = H(X, n). Exemplu: E(H(X, n)) = θ, lim V ar(H(X, n)) = 0

Teoria selecţiei Teoria selecţiei Teoria selecţiei

1 n 1 n n−1 V (x1 , x2 , . . . , xn ; θ) = ∏ P (xi , θ)

Teoria selecţiei Teoria selecţiei

S-ar putea să vă placă și