Sunteți pe pagina 1din 65

Statistică inferenţială

Elemente de statistică

CURS 11 - 08.05.2015

Facultatea de Automatică şi Calculatoare

Statistică şi prelucrarea datelor

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.
Statistica inferenţială se ı̂mparte ı̂n două mari domenii:

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.
Statistica inferenţială se ı̂mparte ı̂n două mari domenii:
1 estimarea parametrilor;

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.
Statistica inferenţială se ı̂mparte ı̂n două mari domenii:
1 estimarea parametrilor;
2 ipoteze statistice.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.
Statistica inferenţială se ı̂mparte ı̂n două mari domenii:
1 estimarea parametrilor;
2 ipoteze statistice.
Fie X o v. a. cu densitatea f (x, θ), x ∈ R, θ ∈ Θ ⊂ R.
Mulţimea densităţilor de probabilitate f (x, θ) ce conţin parametrul
necunoscut θ se numeşte model probabilistic.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând


datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.
Statistica inferenţială se ı̂mparte ı̂n două mari domenii:
1 estimarea parametrilor;
2 ipoteze statistice.
Fie X o v. a. cu densitatea f (x, θ), x ∈ R, θ ∈ Θ ⊂ R.
Mulţimea densităţilor de probabilitate f (x, θ) ce conţin parametrul
necunoscut θ se numeşte model probabilistic.
Exemple de familii de densităţi de probabilitate care pot fi alese ca modele
probabilistice: normală, exponentială, Poisson etc. În momentul ı̂n care
am ales o densitate de probabilitate de o anumită formă, incertitudinea
legată de rezultatul particular al experimentului s-a transferat ı̂n
incertitudinea legată de valorile parametrului (parametrilor).

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a


variabilelor de selecţie X1 , X2 , ..., Xn . Dacă x1 , x2 , ..., xn sunt valorile luate
de X1 , X2 , ..., Xn , atunci densitatea de probabilitate a selecţiei este notată
prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a


variabilelor de selecţie X1 , X2 , ..., Xn . Dacă x1 , x2 , ..., xn sunt valorile luate
de X1 , X2 , ..., Xn , atunci densitatea de probabilitate a selecţiei este notată
prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .

Repartiţia selecţiei depinde de θ şi incorporează atât selecţia cât şi modelul
probabilistic.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a


variabilelor de selecţie X1 , X2 , ..., Xn . Dacă x1 , x2 , ..., xn sunt valorile luate
de X1 , X2 , ..., Xn , atunci densitatea de probabilitate a selecţiei este notată
prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .

Repartiţia selecţiei depinde de θ şi incorporează atât selecţia cât şi modelul
probabilistic.
Cea mai folosită formă de selecţie este selecţia aleatoare şi este bazată pe ideea
experimentului aleator.
Vom spune că X1 , X2 , ..., Xn este o selecţie aleatoare asupra v. a. X care
are densitatea de probabilitate f (x, θ) dacă X1 , X2 , ..., Xn sunt
independente şi identic repartizate (i.i.r.) ca şi X .
În cazul selecţiei aleatoare, densitatea de probabilitate comună a
variabilelor de selecţie este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:
1 datele observate sunt consistente cu modelul statistic postulat?

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:
1 datele observate sunt consistente cu modelul statistic postulat?
2 presupunând că modelul statistic postulat este consistent cu datele
observate, ce putem spune despre parametrii necunoscuţi θ ∈ Θ?

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:
1 datele observate sunt consistente cu modelul statistic postulat?
2 presupunând că modelul statistic postulat este consistent cu datele
observate, ce putem spune despre parametrii necunoscuţi θ ∈ Θ?
a) putem descreşte incertitudinea asupra lui θ prin deducerea spaţiului
parametrilor Θ la Θ0 unde Θ0 este o submulţime a lui Θ? (estimaţie prin
intervale de ı̂ncredere)

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:
1 datele observate sunt consistente cu modelul statistic postulat?
2 presupunând că modelul statistic postulat este consistent cu datele
observate, ce putem spune despre parametrii necunoscuţi θ ∈ Θ?
a) putem descreşte incertitudinea asupra lui θ prin deducerea spaţiului
parametrilor Θ la Θ0 unde Θ0 este o submulţime a lui Θ? (estimaţie prin
intervale de ı̂ncredere)
b) putem descreşte incertitudinea asupra lui θ prin alegerea unei valori
particulare θ̂ din Θ ca având cea mai reprezentativă valoare a lui θ?
(estimaţie punctuală)

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

O selecţie aleatoare poate fi constituită prin repetarea unui experiment


aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.
Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:
1 datele observate sunt consistente cu modelul statistic postulat?
2 presupunând că modelul statistic postulat este consistent cu datele
observate, ce putem spune despre parametrii necunoscuţi θ ∈ Θ?
a) putem descreşte incertitudinea asupra lui θ prin deducerea spaţiului
parametrilor Θ la Θ0 unde Θ0 este o submulţime a lui Θ? (estimaţie prin
intervale de ı̂ncredere)
b) putem descreşte incertitudinea asupra lui θ prin alegerea unei valori
particulare θ̂ din Θ ca având cea mai reprezentativă valoare a lui θ?
(estimaţie punctuală)
c) putem considera ı̂ntrebarea θ aparţine unei submulţimi Θ0 a lui Θ?
(verificarea ipotezelor statistice)
CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor
Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice


mărime semnificativă calculată dintr-un eşantion aleator al acelei populaţii.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice


mărime semnificativă calculată dintr-un eşantion aleator al acelei populaţii.
Pentru un parametru al repartiţiei, se numeşte estimator al acelui
parametru orice statistică aproximând acel parametru.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice


mărime semnificativă calculată dintr-un eşantion aleator al acelei populaţii.
Pentru un parametru al repartiţiei, se numeşte estimator al acelui
parametru orice statistică aproximând acel parametru.
Dacă parametrul are o valoare bine determinată (ı̂n cadrul analizei
statistice), orice estimator al lui se numeşte estimator punctual.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice


mărime semnificativă calculată dintr-un eşantion aleator al acelei populaţii.
Pentru un parametru al repartiţiei, se numeşte estimator al acelui
parametru orice statistică aproximând acel parametru.
Dacă parametrul are o valoare bine determinată (ı̂n cadrul analizei
statistice), orice estimator al lui se numeşte estimator punctual.

Example 1
Considerăm populaţia diametrelor unor bile de rulmenţi dintr-un lot. Ca
statistică a acestei populaţii se poate lua media de selecţie x a unui şir
(x1 , x2 , ..., xn ) format de diametrele unui eşantion de bile din acel lot. Alte
statistici sunt: s 2 , dispersia de selecţie modificată, s, abaterea medie de selecţie.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Example 2
O societate de telefoane poate considera populaţia tuturor abonaţilor. Un
eşantion se poate obţine luând pe sărite din lista abonaţilor, de exemplu, din 25
ı̂n 25. Presupunem că societatea este interesată ı̂n estimarea unui parametru
caracteristic; de exemplu, gradul de satisfacţie g al abonaţilor relativ la serviciile
oferite de socitate. Se cere o apreciere cu note de la 1 la 5. Este solicitat
răspunsul abonaţilor din eşantionul ales şi se obţine un estimator al lui g .

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Statistică inferenţială

Example 2
O societate de telefoane poate considera populaţia tuturor abonaţilor. Un
eşantion se poate obţine luând pe sărite din lista abonaţilor, de exemplu, din 25
ı̂n 25. Presupunem că societatea este interesată ı̂n estimarea unui parametru
caracteristic; de exemplu, gradul de satisfacţie g al abonaţilor relativ la serviciile
oferite de socitate. Se cere o apreciere cu note de la 1 la 5. Este solicitat
răspunsul abonaţilor din eşantionul ales şi se obţine un estimator al lui g .

De obicei se notează cu θ parametrul şi cu θ̂ un estimator al său.


De exemplu, θ reprezintă media atunci putem considera ca statistică a
mediei,
X1 + X2 + ... + Xn
θ=X = .
n
Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn atunci estimatorul lui
θ este
1
θ̂ = x = (x1 + x2 + ... + xn ) .
n
Dacă măsurătorile sunt realizate cu acurateţe şi precizie rezonabile, atunci
X1 , X2 , ..., Xn se pot considera repartizate la fel.
CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor
Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Exemple de modele statistice ce apar adesea ı̂n practică

Modelul Bernoulli
Presupunem că X1 , X2 , ..., Xn este o selecţie aleatoare a unei populaţii care
urmează o distribuţie Bernoulli cu parametrul θ ∈ [0, 1] necunoscut.
Ştim că distribuţia Bernoulli poate fi utilizată la observarea unui articol rezultat
al unui proces industrial caz ı̂n care Xi = 1 indică faptul că articolul i este bun
şi Xi = 0 dacă articolul este defect. În studii medicale rezultatul Xi = 1 indică
faptul că tratamentul aplicat pacientului i a avut succes iar Xi = 0 ı̂n caz
contrar. În aceste cazuri vrem să ştim valoarea lui θ.
Spaţiul parametrului θ este [0, 1] . Dacă x1 , x2 , ..., xn sunt valorile luate de
X1 , X2 , ..., Xn atunci densitatea de probabiltate pentru selecţia de ordin i este

f (xi , θ) = θxi (1 − θ)1−xi ,

iar densitatea de probabilitate a eşantionului este dată de


n
Y n
Y
f (xi , θ) = θxi (1 − θ)1−xi = θnx (1 − θ)n(1−x) .
i=1 i=1

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Exemple de modele statistice ce apar adesea ı̂n practică


Modelul normal
Presupunem că X1 , X2 , ..., Xn este o selecţie aleatoare a unei populaţii care
urmează o distribuţie normală N (m, σ) cu θ = (m, σ) ∈ R × (0, ∞)
necunoscuţi.
De exemplu putem avea observaţii asupra ı̂nălţimii ı̂n cm populaţiei şi intuim că
este rezonabil să presupunem că distribuţia ı̂nălţimii este normală cu media şi
dispersia necunoscute. Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn
atunci densitatea de probabiltate a unui eşantion este dată de
n
( n
)
Y  − n 1 X
2 2 2
f (xi ; m, σ) = 2πσ exp − 2 (xi − m)
i=1
2σ i=1
n n n
X X 1X
Deoarece (xi − m)2 = n (x − m)2 + (xi − x)2 , unde x = xi şi
i=1 i=1
n i=1
n
1 X
2
s = (xi − x)2 , obţinem
n − 1 i=1
n
( n
)
Y  − n 1 X n−1 2
2
f (xi ; m, σ) = 2πσ 2 exp − 2 (x − m)2 − s . (1)
i=1
2σ i=1 2σ 2

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Exemple de modele statistice ce apar adesea ı̂n practică


Modelul normal
Presupunem că X1 , X2 , ..., Xn este o selecţie aleatoare a unei populaţii care
urmează o distribuţie normală N (m, σ) cu θ = (m, σ) ∈ R × (0, ∞)
necunoscuţi.
De exemplu putem avea observaţii asupra ı̂nălţimii ı̂n cm populaţiei şi intuim că
este rezonabil să presupunem că distribuţia ı̂nălţimii este normală cu media şi
dispersia necunoscute. Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn
atunci densitatea de probabiltate a unui eşantion este dată de
n
( n
)
Y  − n 1 X
2 2 2
f (xi ; m, σ) = 2πσ exp − 2 (xi − m)
i=1
2σ i=1
n n n
X X 1X
Deoarece (xi − m)2 = n (x − m)2 + (xi − x)2 , unde x = xi şi
i=1 i=1
n i=1
n
1 X
2
s = (xi − x)2 , obţinem
n − 1 i=1
n
( n
)
Y  − n 1 X n−1 2
2
f (xi ; m, σ) = 2πσ 2 exp − 2 (x − m)2 − s . (1)
i=1
2σ i=1 2σ 2

Ne putem pune ı̂ntrebarea dacă


CURS presupunerea
11 - 08.05.2015 căşiı̂nălţimea
Statistică populaţiei urmează o
prelucrarea datelor
Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode


folosite de statistician ı̂n ı̂ncercarea de a studia distribuţia populaţiei.
ce model statistic trebuie folosit?

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode


folosite de statistician ı̂n ı̂ncercarea de a studia distribuţia populaţiei.
ce model statistic trebuie folosit?
valorile parametrilor care intra ı̂n definiţia modelului statistic (de exemplu,
ştim că ı̂nălţimea urmează o distribuţie normală, dar nu ştim media şi
dispersia)

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode


folosite de statistician ı̂n ı̂ncercarea de a studia distribuţia populaţiei.
ce model statistic trebuie folosit?
valorile parametrilor care intra ı̂n definiţia modelului statistic (de exemplu,
ştim că ı̂nălţimea urmează o distribuţie normală, dar nu ştim media şi
dispersia)
Pentru a justifica această alegere avem nevoie să studiem estimatorii
punctuali.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Să considerăm o variabilă aleatoare X a cărei lege de probabilitate conţine


un parametru θ. Fie X1 , ..., Xn - n variabile aleatoare independente care au
aceeaşi distribuţie ca şi X .
Alegem o anumită funcţie θ̂(X1 , ..., Xn ) pe care o vom utiliza ca estimator
pentru θ. Cu alte cuvinte, dacă dispunem de valorile x1 , x2 , ..., xn obţinute
experimental, numărul θ̂ (x1 , x2 , ..., xn ) va fi considerat ca estimator
punctual al parametrului θ.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Să considerăm o variabilă aleatoare X a cărei lege de probabilitate conţine


un parametru θ. Fie X1 , ..., Xn - n variabile aleatoare independente care au
aceeaşi distribuţie ca şi X .
Alegem o anumită funcţie θ̂(X1 , ..., Xn ) pe care o vom utiliza ca estimator
pentru θ. Cu alte cuvinte, dacă dispunem de valorile x1 , x2 , ..., xn obţinute
experimental, numărul θ̂ (x1 , x2 , ..., xn ) va fi considerat ca estimator
punctual al parametrului θ.

Definition 3
Se consideră o populaţie de volum N şi un parametru θ al acestei populaţii. Fie
x1 , x2 , ..., xn un eşantion reprezentativ (n << N) al populaţiei; un estimator
punctual θ̂ = θ̂ (x1 , x2 , ...,
h xn ) al lui θ se
i numeşte estimator nedeplasat sau
absolut corect dacă M θ̂(X1 , ..., Xn ) = θ.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Să considerăm o variabilă aleatoare X a cărei lege de probabilitate conţine


un parametru θ. Fie X1 , ..., Xn - n variabile aleatoare independente care au
aceeaşi distribuţie ca şi X .
Alegem o anumită funcţie θ̂(X1 , ..., Xn ) pe care o vom utiliza ca estimator
pentru θ. Cu alte cuvinte, dacă dispunem de valorile x1 , x2 , ..., xn obţinute
experimental, numărul θ̂ (x1 , x2 , ..., xn ) va fi considerat ca estimator
punctual al parametrului θ.

Definition 3
Se consideră o populaţie de volum N şi un parametru θ al acestei populaţii. Fie
x1 , x2 , ..., xn un eşantion reprezentativ (n << N) al populaţiei; un estimator
punctual θ̂ = θ̂ (x1 , x2 , ...,
h xn ) al lui θ se
i numeşte estimator nedeplasat sau
absolut corect dacă M θ̂(X1 , ..., Xn ) = θ.
h i h i
Dacă lim M θ̂(X1 , ..., Xn ) = θ şi lim D θ̂(X1 , ..., Xn ) = 0 atunci θ̂ este un
n→∞ n→∞
estimator consistent sau corect sau deplasat al lui θ.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Theorem 4

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn (v.a.


independente la fel distribuite ca şi X ), m media teoretică şi σ 2 dispersia
teoretică. Notăm cu
1P n 1P n 2
X = Xi , media de selecţie, σ 2 = Xi − X dispersia de selecţie şi
n i=1 n i=1
1 P n 2
2
S = Xi − X dispersia de selecţie modificată.
n − 1 i=1
Atunci media de selecţie este un estimator punctual pentru media teoretică, iar
dispersia de selecţie şi dispersia de selecţie modificată sunt estimatori punctuali
pentru dispersia teoretică. În plus,
1
M X = m, D X = σ 2 ⇒ media de selecţie este un estimator absolut
   
n
corect
h ial luin m. −1 2
M σ2 = σ ⇒ dispersia de selecţie este un estimator corect al lui σ 2 .
n
M S = σ 2 ⇒ dispersia de selecţie este un estimator absolut corect al lui σ 2 .
 2

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali
Dacă X ∈ Pois [λ] , atunci M [X ] = D [X ] = λ şi atunci X şi s 2 sunt estimatorii
nedeplasaţi pentru λ. Se pune ı̂ntrebarea pe care ı̂l vom alege. Cum dispersia
este o măsură a ı̂mprăştierii, intuiţia sugerează să-l alegem pe acela care are
cea mai mică dispersie şi aceasta deoarece el are o repartiţie mai concentrată ı̂n
jurul lui λ.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali
Dacă X ∈ Pois [λ] , atunci M [X ] = D [X ] = λ şi atunci X şi s 2 sunt estimatorii
nedeplasaţi pentru λ. Se pune ı̂ntrebarea pe care ı̂l vom alege. Cum dispersia
este o măsură a ı̂mprăştierii, intuiţia sugerează să-l alegem pe acela care are
cea mai mică dispersie şi aceasta deoarece el are o repartiţie mai concentrată ı̂n
jurul lui λ.
Dintre doi estimatori nedeplasaţi θ̂ şi θ̂1 pentru acelaşi parametru θ, se
consideră că este mai precis cel care are dispersie mai mică.

Theorem 5

Fie X o v. a. cu media m şi abaterea medie pătratică σ. Dacă x1 , x2 , . . . , xn


(n ≥ 2) o selecţie de valori ale lui X (v. a. independente la fel distribuite
 ca şi
σ
X ), atunci pentru n suficient de mare se poate considera că X ∈ N m, √ .
n

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali
Dacă X ∈ Pois [λ] , atunci M [X ] = D [X ] = λ şi atunci X şi s 2 sunt estimatorii
nedeplasaţi pentru λ. Se pune ı̂ntrebarea pe care ı̂l vom alege. Cum dispersia
este o măsură a ı̂mprăştierii, intuiţia sugerează să-l alegem pe acela care are
cea mai mică dispersie şi aceasta deoarece el are o repartiţie mai concentrată ı̂n
jurul lui λ.
Dintre doi estimatori nedeplasaţi θ̂ şi θ̂1 pentru acelaşi parametru θ, se
consideră că este mai precis cel care are dispersie mai mică.

Theorem 5

Fie X o v. a. cu media m şi abaterea medie pătratică σ. Dacă x1 , x2 , . . . , xn


(n ≥ 2) o selecţie de valori ale lui X (v. a. independente la fel distribuite
 ca şi
σ
X ), atunci pentru n suficient de mare se poate considera că X ∈ N m, √ .
n

Demonstraţie. Conform teoremei limită √


centrală
 avem că
Sn = X1 + X2 + ... + Xn ⇒ Sn ∈ N nm, nσ .
σ2
     
1 1 1 1 1 σ
Avem M Sn = nm = m, D Sn = 2 nσ 2 = ⇒ Sn ∈ N m, √
n n n n n n n

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor
Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Corollary 6
În condiţiile teoremei 5 pentru orice a < b avem
! !
 b−m a−m
P a≤X <b ≈Φ σ −Φ σ . (2)
√ √
n n

Statisticienii recomandă folosirea formulei (2) pentru populaţii statistice de


volum N şi eşantioane de volum n unde n ≥ 30 şi n ≤ N3 . Dacă n < 30 formula
este utilă dacă populaţia iniţială nu este departe de a fi normal distribuită.
σ
Pentru eşantioane mici statisticienii propun o corecţie care să ı̂nlocuiască √
r n
σ N −n
prin √ .
n N −1

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Problem 7
Considerăm greutăţile populaţiei de 350 studenţi dintr-o facultate s-a constatat
că media este m = 70 şi abaterea media pătratică este σ = 10.
a) Să se determine probabilitatea ca un student luat la ı̂ntâmplare să
cântărească ı̂ntre 65 şi 70 kg?
b)Să se determine probabilitatea ca media maselor să fie ı̂ntre 65 şi 75 kg.
c) Să se determine probabilitatea ca extrăgând un eşantion de 36 studenţi din
acea populaţie, media eşantionului să fie cuprinsă ı̂ntre 65 şi 75 kg.
d) Extrgı̂nd un eşantion de 100 de studenţi care este probabilitatea ca media
maselor să fie sub 65 kg?

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Soluţie.
a) Pobabilitatea cerută la punctul a) nu poate fi calculată deoarece X =
greutatea populaţiei nu este repartizată normal.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Soluţie.
a) Pobabilitatea cerută la punctul a) nu poate fi calculată deoarece X =
greutatea populaţiei nu este repartizată normal.
La fel şi la b).

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Soluţie.
a) Pobabilitatea cerută la punctul a) nu poate fi calculată deoarece X =
greutatea populaţiei nu este repartizată normal.
La fel şi la b).
c) n = 36, m = 70, σ X = √1036 = 1.6667,
75−70 65−70
  
P 65 ≤ X ≤ 75 = Φ 1. 6667
− Φ 1. 6667
= 0.9986 − 0.0014 = .9972.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Estimatori punctuali

Soluţie.
a) Pobabilitatea cerută la punctul a) nu poate fi calculată deoarece X =
greutatea populaţiei nu este repartizată normal.
La fel şi la b).
c) n = 36, m = 70, σ X = √1036 = 1.6667,
75−70 65−70
  
P 65 ≤ X ≤ 75 = Φ 1. 6667
− Φ 1. 6667
= 0.9986 − 0.0014 = .9972.
10
d) n = 100, m = 70, σ X = √100 = 1,
P X ≤ 65 = Φ 65−70
 
1
= 0.0000003.H

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda momentelor

Ideea metodei este de a egala momentele distribuţiei cu momentele statistice.şi


de.aici obţinem estimarea parametrilor.
Ştim că momentul iniţial de ordin k este
h i X n
M Xk = xik pi
i=1

dacă distribuţia este discretă şi

h i Z∞
M Xk = x k f (x)dx
−∞

dacă distribuţia este continuă, iar momentul statistic iniţial de ordin k este
k n
X = n1 Xik .
P
i=1
De exemplu momentul iniţial de ordin ı̂ntâi este media iar media statistică este
momentul statistic de ordin ı̂ntâi. Egalăm acestea şi obţinem estimarea
punctuală µ̂ = X .

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda momentelor

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn


care au o distribuţie exponenţială cu parametru λ. Avem un singur
parametru de estimat. Ştim că M [X ] = λ1 . De aici rezultă că
1
λ
= X ⇒ λ̂ = x1 este un estimator punctual al parametrului λ obţinut cu
metoda momentelor.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda momentelor

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn


care au o distribuţie exponenţială cu parametru λ. Avem un singur
parametru de estimat. Ştim că M [X ] = λ1 . De aici rezultă că
1
λ
= X ⇒ λ̂ = x1 este un estimator punctual al parametrului λ obţinut cu
metoda momentelor.
Ca exemplu, presupunem că este testat timpul de viaţă al unui modul
electronic folosi ı̂n industria automobilelor. Timpul de viaţă urmează o
distribuţie exponenţială. S-au făcut teste şi s-au obţinut următoarele date:
x1 = 11.96, x2 = 5.03, x3 = 67.40, x4 = 16.07, x5 = 31.50, x6 = 7.73,
x7 = 11.10, x8 = 22.38. Deoarece x = 21.65, estimarea punctuală a
1
parametrului λ obţinut cu metoda momentelor este λ̂ = 21.65 = 0.04618 9.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda momentelor

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn


care au o distribuţie exponenţială cu parametru λ. Avem un singur
parametru de estimat. Ştim că M [X ] = λ1 . De aici rezultă că
1
λ
= X ⇒ λ̂ = x1 este un estimator punctual al parametrului λ obţinut cu
metoda momentelor.
Ca exemplu, presupunem că este testat timpul de viaţă al unui modul
electronic folosi ı̂n industria automobilelor. Timpul de viaţă urmează o
distribuţie exponenţială. S-au făcut teste şi s-au obţinut următoarele date:
x1 = 11.96, x2 = 5.03, x3 = 67.40, x4 = 16.07, x5 = 31.50, x6 = 7.73,
x7 = 11.10, x8 = 22.38. Deoarece x = 21.65, estimarea punctuală a
1
parametrului λ obţinut cu metoda momentelor este λ̂ = 21.65 = 0.04618 9.
Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn
care au o distribuţie   normală de parametrii m şi σ. În acest caz avem
M [X ] = m, M X 2P= m2 + σ 2 .
xi , m2 + σ 2 = n1
P 2
Rezultă că m = n1 xi ⇒ m̂ = n1
P
xi ,
 i=1 2 i=1 i=1

σ̂ 2 = n1 (xi − x)2 . Reamintim că acest


P 2
xi − n1 ⇒ σ̂ 2 = n1
P P
xi
i=1 i=1 i=1
estimator pentru σ 2 este un estimator deplasat.
CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor
Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

dezvoltată de Fisher şi extinsă de Cramer, Rao şi Wald

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

dezvoltată de Fisher şi extinsă de Cramer, Rao şi Wald


cea mai folosită metodă de estimare şi joacă un rol important ı̂n verificarea
ipotezelor statistice

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

dezvoltată de Fisher şi extinsă de Cramer, Rao şi Wald


cea mai folosită metodă de estimare şi joacă un rol important ı̂n verificarea
ipotezelor statistice
Considerăm o selecţie X1 , X2 , ..., Xn i.i.d. cu v. a. X , ce are cu densitatea
de probabilitate f (x, θ). Atunci funcţia de verosimilitate maximă
corespunzătoare selecţiei este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

dezvoltată de Fisher şi extinsă de Cramer, Rao şi Wald


cea mai folosită metodă de estimare şi joacă un rol important ı̂n verificarea
ipotezelor statistice
Considerăm o selecţie X1 , X2 , ..., Xn i.i.d. cu v. a. X , ce are cu densitatea
de probabilitate f (x, θ). Atunci funcţia de verosimilitate maximă
corespunzătoare selecţiei este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1

Acceptăm următoarea axiomă: valoarea cea mai verosimilă a parametrului


este cea care maximizează funcţia L(x1 , x2 , ..., xn ; θ), ceea ce conduce la
ecuaţia
∂L(x1 , x2 , ..., xn ; θ)
= 0. (3)
∂θ

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

Cum uneori este dficil de rezolvat ecuaţia (3), introducem funcţiile


ln L(x1 , x2 , ..., xn ; θ), logaritmul funcţiei de verosimilitate şi

∂L(x1 , x2 , ..., xn ; θ)
= s (θ; x1 , x2 , ..., xn )
∂θ
funcţia scor.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

Cum uneori este dficil de rezolvat ecuaţia (3), introducem funcţiile


ln L(x1 , x2 , ..., xn ; θ), logaritmul funcţiei de verosimilitate şi

∂L(x1 , x2 , ..., xn ; θ)
= s (θ; x1 , x2 , ..., xn )
∂θ
funcţia scor.

Definition 8
tn (x1 , x2 , ..., xn ) : S → Θ se numeşte estimaţie de verosimilitate maximă
pentru parametrul θ dacă este punct de maxim pentru funcţia de verosimilitate,
adică

ln L(x1 , x2 , ..., xn ; tn ) ≥ ln L(x1 , x2 , ..., xn ; θ), ∀θ ∈ Θ.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

În cele ce urmează presupunem că f (xi , θ) sunt derivabile până la ordinul doi
∂L(x1 , x2 , ..., xn ; θ)
inclusiv ı̂n raport cu θ. Atunci există şi estimaţia de
∂θ
verosimilitate maximă este soluţie a ecuaţiei
∂L(x1 , x2 , ..., xn ; θ)
=0 (4)
∂θ

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

În cele ce urmează presupunem că f (xi , θ) sunt derivabile până la ordinul doi
∂L(x1 , x2 , ..., xn ; θ)
inclusiv ı̂n raport cu θ. Atunci există şi estimaţia de
∂θ
verosimilitate maximă este soluţie a ecuaţiei
∂L(x1 , x2 , ..., xn ; θ)
=0 (4)
∂θ

sau a ecuaţiei
∂ ln L(x1 , x2 , ..., xn ; θ)
=0 (5)
∂θ
atunci când aceasta există.
Ecuaţiile (4) şi (5) se numesc ecuaţii de verosimilitate.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media necunoscută, dispersia cunoscută

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn care


au o distribuţie normală, i. i. r. cu v. a. X ∈ N m, σ 2 .


CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media necunoscută, dispersia cunoscută

Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn care


au o distribuţie normală, i. i. r. cu v. a. X ∈ N m, σ 2 .


a) Dacă σ 2 este cunoscută şi media m este necunoscută cu Θ = R, atunci


funcţia de verosimilitate maximă este
 n ( n
)
1 1 X 2
L(x1 , x2 , ..., xn ; m) = √ exp − 2 (xi − m) .
σ 2π 2σ i=1

Deoarece funcţia ln L este strict crescătoare ı̂n L şi valoarea lui m care
maximizează ln L(x1 , x2 , ..., xn ; m) maximizează şi L(x1 , x2 , ..., xn ; m), este
mai uşor de lucrat cu logaritmul lui L decât cu L. Avem
n
n n 1 X
ln L(x1 , x2 , ..., xn ; m) = − ln 2π − ln σ 2 − 2 (xi − m)2 .
2 2 2σ i=1

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media necunoscută, dispersia cunoscută

Dar
n n
∂ ln L(x1 , x2 , ..., xn ; m) 1 X 1 X
= 2 (xi − m) , 2 (xi − m) = 0 ⇒ m̂ = x.
∂m σ i=1 σ i=1

Observăm că
∂ 2 ln L(x1 , x2 , ..., xn ; m) n
= − 2 ≤ 0, ∀m ∈ R,
∂m2 σ
deci m̂ = x este punct de maxim. Astfel tn (x1 , x2 , ..., xn ) = x este punct de
verosimilitate maximă.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media cunoscută, dispersia necunoscută

Dacă m este cunoscută şi σ 2 , Θ = (0, ∞) este necunoscut folosim forma


funcţiei de verosimilitate maximă dedusă ı̂n (1) şi obţinem
( n
)
 − n 1 X n−1 2
2
L(x1 , x2 , ..., xn ; m, σ 2 ) = 2πσ 2 exp − 2 (x − m)2 − s =
2σ i=1 2σ 2
( n
)
 − n 1 X

n−1 2

2 2 2
= 2πσ exp − 2 (x − m) exp − s .
2σ i=1 2σ 2

Fixăm m = x şi atunci


 − n

n−1 2

2
L(x1 , x2 , ..., xn ; σ 2 ) = 2πσ 2exp − s ⇒
2σ 2
n n n−1 2
ln L(x1 , x2 , ..., xn ; σ 2 ) = − ln 2π − ln σ 2 − s .
2 2 2σ 2

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media cunoscută, dispersia necunoscută

∂ ln L(x1 , x2 , ..., xn ; σ 2 ) n n − 1 2 ∂ ln L(x1 , x2 , ..., xn ; σ 2 )


= − + s , =0⇒
∂σ 2 2σ 2 2σ 4 ∂σ 2
n−1 2
σ̂ 2 = s .
n
Dar
∂ 2 ln L n3

2 n n − 1 2 1
2
(x1 , x2 , ..., xn ; σ̂ ) = − s n − 1 = − ≤0⇒
∂ (σ 2 ) 2σ 4 σ6
σ2 = s2 2 s 4 (n − 1)2
n
σ̂ 2 este estimatorul de verosimilitate maximă.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media şi dispersia necunoscute

c) Dacă m şi σ 2 sunt necunoscute, Θ = m, σ 2 | m ∈ R, σ 2 ∈ (0, ∞) ,


 

atunci valoarea maximă se găseşte rezolvând sistemul



 ∂ ln L (x1 , ..., xn ; m, σ 2 ) = 0

∂m
 ∂ ln L (x , ..., x ; m, σ 2 ) = 0,
 1 n
∂σ 2
de unde
 n
1 X
(xi − m)2 = 0


σ 2 i=1


n
n 1 X n−1 2
(x − m)2 +

 − 2 + s = 0.


2σ 2(σ 2 )2 i=1 2(σ 2 )2

Obţinem (
m̂ = x
n−1 2
σ̂ = s .
n

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime: media şi dispersia necunoscute

Diferenţiala de ordinul doi este

1 n3
d 2 ln L(x1 , ..., xn ; m, σ 2 ) = −
2
dm2 − (dσ 2 )2 ,
σ 2(n − 1)2 (s 2 )2
 
n−1 2
negativ definită. De aici rezultă că x, s este unicul estimator de
n
2

verosimilitate maximă pentru m, σ .

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

Example 9 (Modelul exponenţial)


Presupunem că timpul de viaţă a unui aparat este distribuit Exp [θ] unde
θ ∈ (0, ∞) este necunoscut. Bazându-ne pe o selecţie (x1 , x2 , ..., xn ) de valori
ale variabilelor X1 , X2 , ..., Xn care au o distribuţie exponenţială obţinem funcţia
de verosimilitate
L(x1 , x2 , ..., xn ; θ) = θn exp {−nxθ} ⇒
∂ ln L(x1 , x2 , ..., xn ; θ) n
ln L(x1 , x2 , ..., xn ; θ) = n ln θ − nxθ ⇒ = − nx ⇒
∂θ θ
n
− nx = 0 ⇒ θ̂ = x1 .
θ
∂ 2 ln L n ∂ 2 ln L
2
(x1 , x2 , ..., xn ; θ) = − 2 ⇒ (x1 , x2 , ..., xn ; x1 ) = −n (x)2 ≤ 0 ⇒
∂θ θ ∂θ2
θ̂ este estimatorul de verosimilitate maximă.H

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

Example 10
Fie X o variabila aleatoare cu densitatea de probabilitate
1 1−θ
(
x θ , 0 < x ≤ 1, θ > 0
f (x) = θ
0, ı̂n rest

Se face o selecţie x1 , x2 , ..., xn . Să se determine estimatorul de verosimilitate


maximă pentru parametrul θ al repartitiei.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor


Statistică inferenţială
Estimatori punctuali
Statistică inferenţială
Metoda momentelor
Metoda verosimilităţii maxime

Metoda verosimilităţii maxime

Example 11
Fie X o variabila aleatoare cu densitatea de probabilitate

(1 + λ)x λ , 0 ≤ x ≤ 1, λ > 0

f (x) =
0, ı̂n rest.

Se face o selecţie x1 , x2 , ..., xn . Să se determine estimatorul de verosimilitate


maximă pentru parametrul λ al repartitiei.

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

S-ar putea să vă placă și