Elemente de Statistic A: CURS 11 - 08.05.2015

Statistică inferenţială
Elemente de statistică
CURS 11 - 08.05.2015
Facultatea de Automatică şi Calculatoare
Statistică şi prelucrarea datelor
CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Estimatori punctuali
Metoda momentelor
Metoda verosimilităţii maxime
Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

datele uneia sau mai multor selecţii aleatoare şi calcule probabilistice.

Metoda momentelor

Statistica inferenţială se ı̂mparte ı̂n două mari domenii:

Metoda momentelor

1 estimarea parametrilor;

Metoda momentelor

2 ipoteze statistice.

Metoda momentelor

Fie X o v. a. cu densitatea f (x, θ), x ∈ R, θ ∈ Θ ⊂ R.
Mulţimea densităţilor de probabilitate f (x, θ) ce conţin parametrul
necunoscut θ se numeşte model probabilistic.

Metoda momentelor

Fie X o v. a. cu densitatea f (x, θ), x ∈ R, θ ∈ Θ ⊂ R.
Mulţimea densităţilor de probabilitate f (x, θ) ce conţin parametrul
necunoscut θ se numeşte model probabilistic.
Exemple de familii de densităţi de probabilitate care pot fi alese ca modele
probabilistice: normală, exponentială, Poisson etc. În momentul ı̂n care
am ales o densitate de probabilitate de o anumită formă, incertitudinea
legată de rezultatul particular al experimentului s-a transferat ı̂n
incertitudinea legată de valorile parametrului (parametrilor).

Metoda momentelor
Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a

variabilelor de selecţie X1 , X2 , ..., Xn . Dacă x1 , x2 , ..., xn sunt valorile luate
de X1 , X2 , ..., Xn , atunci densitatea de probabilitate a selecţiei este notată
prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .

Metoda momentelor

prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .
Repartiţia selecţiei depinde de θ şi incorporează atât selecţia cât şi modelul
probabilistic.

Metoda momentelor

prin
L(x1 , x2 , ..., xn ; θ), (x1 , x2 , ..., xn ) ∈ Rn .
Repartiţia selecţiei depinde de θ şi incorporează atât selecţia cât şi modelul
probabilistic.
Cea mai folosită formă de selecţie este selecţia aleatoare şi este bazată pe ideea
experimentului aleator.
Vom spune că X1 , X2 , ..., Xn este o selecţie aleatoare asupra v. a. X care
are densitatea de probabilitate f (x, θ) dacă X1 , X2 , ..., Xn sunt
independente şi identic repartizate (i.i.r.) ca şi X .
În cazul selecţiei aleatoare, densitatea de probabilitate comună a
variabilelor de selecţie este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1

Metoda momentelor
O selecţie aleatoare poate fi constituită prin repetarea unui experiment

aleator de n ori. Realizarea selecţiei aleatoare (datele obţinute ı̂n urma
selecţiei) se notează cu (x1 , x2 , ..., xn ) şi mulţimea tuturor realizărilor
defineşte spaţiul observaţiilor.

Metoda momentelor

Modelul probabilist f (x, θ) ı̂mpreună cu selecţia (X1 , X2 , ..., Xn ) definesc
modelul statistic.

Metoda momentelor

modelul statistic.
Modelul statistic ı̂mpreună cu datele observate → ı̂ntrebări:

Metoda momentelor

modelul statistic.
1 datele observate sunt consistente cu modelul statistic postulat?

Metoda momentelor

modelul statistic.
2 presupunând că modelul statistic postulat este consistent cu datele
observate, ce putem spune despre parametrii necunoscuţi θ ∈ Θ?

Metoda momentelor

modelul statistic.
a) putem descreşte incertitudinea asupra lui θ prin deducerea spaţiului
parametrilor Θ la Θ0 unde Θ0 este o submulţime a lui Θ? (estimaţie prin
intervale de ı̂ncredere)

Metoda momentelor

modelul statistic.
b) putem descreşte incertitudinea asupra lui θ prin alegerea unei valori
particulare θ̂ din Θ ca având cea mai reprezentativă valoare a lui θ?
(estimaţie punctuală)

Metoda momentelor

modelul statistic.
b) putem descreşte incertitudinea asupra lui θ prin alegerea unei valori
particulare θ̂ din Θ ca având cea mai reprezentativă valoare a lui θ?
(estimaţie punctuală)
c) putem considera ı̂ntrebarea θ aparţine unei submulţimi Θ0 a lui Θ?
(verificarea ipotezelor statistice)
Metoda momentelor
Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice

mărime semnificativă calculată dintr-un eşantion aleator al acelei populaţii.

Metoda momentelor

Pentru un parametru al repartiţiei, se numeşte estimator al acelui
parametru orice statistică aproximând acel parametru.

Metoda momentelor

Dacă parametrul are o valoare bine determinată (ı̂n cadrul analizei
statistice), orice estimator al lui se numeşte estimator punctual.

Metoda momentelor

Dacă parametrul are o valoare bine determinată (ı̂n cadrul analizei
statistice), orice estimator al lui se numeşte estimator punctual.
Example 1
Considerăm populaţia diametrelor unor bile de rulmenţi dintr-un lot. Ca
statistică a acestei populaţii se poate lua media de selecţie x a unui şir
(x1 , x2 , ..., xn ) format de diametrele unui eşantion de bile din acel lot. Alte
statistici sunt: s 2 , dispersia de selecţie modificată, s, abaterea medie de selecţie.

Metoda momentelor
Example 2
O societate de telefoane poate considera populaţia tuturor abonaţilor. Un
eşantion se poate obţine luând pe sărite din lista abonaţilor, de exemplu, din 25
ı̂n 25. Presupunem că societatea este interesată ı̂n estimarea unui parametru
caracteristic; de exemplu, gradul de satisfacţie g al abonaţilor relativ la serviciile
oferite de socitate. Se cere o apreciere cu note de la 1 la 5. Este solicitat
răspunsul abonaţilor din eşantionul ales şi se obţine un estimator al lui g .

Metoda momentelor
Example 2
O societate de telefoane poate considera populaţia tuturor abonaţilor. Un
eşantion se poate obţine luând pe sărite din lista abonaţilor, de exemplu, din 25
ı̂n 25. Presupunem că societatea este interesată ı̂n estimarea unui parametru
caracteristic; de exemplu, gradul de satisfacţie g al abonaţilor relativ la serviciile
oferite de socitate. Se cere o apreciere cu note de la 1 la 5. Este solicitat
răspunsul abonaţilor din eşantionul ales şi se obţine un estimator al lui g .
De obicei se notează cu θ parametrul şi cu θ̂ un estimator al său.

De exemplu, θ reprezintă media atunci putem considera ca statistică a
mediei,
X1 + X2 + ... + Xn
θ=X = .
n
Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn atunci estimatorul lui
θ este
1
θ̂ = x = (x1 + x2 + ... + xn ) .
n
Dacă măsurătorile sunt realizate cu acurateţe şi precizie rezonabile, atunci
X1 , X2 , ..., Xn se pot considera repartizate la fel.
Metoda momentelor
Exemple de modele statistice ce apar adesea ı̂n practică
Modelul Bernoulli
Presupunem că X1 , X2 , ..., Xn este o selecţie aleatoare a unei populaţii care
urmează o distribuţie Bernoulli cu parametrul θ ∈ [0, 1] necunoscut.
Ştim că distribuţia Bernoulli poate fi utilizată la observarea unui articol rezultat
al unui proces industrial caz ı̂n care Xi = 1 indică faptul că articolul i este bun
şi Xi = 0 dacă articolul este defect. În studii medicale rezultatul Xi = 1 indică
faptul că tratamentul aplicat pacientului i a avut succes iar Xi = 0 ı̂n caz
contrar. În aceste cazuri vrem să ştim valoarea lui θ.
Spaţiul parametrului θ este [0, 1] . Dacă x1 , x2 , ..., xn sunt valorile luate de
X1 , X2 , ..., Xn atunci densitatea de probabiltate pentru selecţia de ordin i este
f (xi , θ) = θxi (1 − θ)1−xi ,
iar densitatea de probabilitate a eşantionului este dată de

n
Y n
Y
f (xi , θ) = θxi (1 − θ)1−xi = θnx (1 − θ)n(1−x) .
i=1 i=1

Metoda momentelor

Modelul normal
urmează o distribuţie normală N (m, σ) cu θ = (m, σ) ∈ R × (0, ∞)
necunoscuţi.
De exemplu putem avea observaţii asupra ı̂nălţimii ı̂n cm populaţiei şi intuim că
este rezonabil să presupunem că distribuţia ı̂nălţimii este normală cu media şi
dispersia necunoscute. Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn
atunci densitatea de probabiltate a unui eşantion este dată de
n
( n
)
Y − n 1 X
2 2 2
f (xi ; m, σ) = 2πσ exp − 2 (xi − m)
i=1
2σ i=1
n n n
X X 1X
Deoarece (xi − m)2 = n (x − m)2 + (xi − x)2 , unde x = xi şi
i=1 i=1
n i=1
n
1 X
2
s = (xi − x)2 , obţinem
n − 1 i=1
n
( n
)
Y − n 1 X n−1 2
2
f (xi ; m, σ) = 2πσ 2 exp − 2 (x − m)2 − s . (1)
i=1
2σ i=1 2σ 2

Metoda momentelor

Modelul normal
urmează o distribuţie normală N (m, σ) cu θ = (m, σ) ∈ R × (0, ∞)
necunoscuţi.
De exemplu putem avea observaţii asupra ı̂nălţimii ı̂n cm populaţiei şi intuim că
este rezonabil să presupunem că distribuţia ı̂nălţimii este normală cu media şi
dispersia necunoscute. Dacă x1 , x2 , ..., xn sunt valorile luate de X1 , X2 , ..., Xn
atunci densitatea de probabiltate a unui eşantion este dată de
n
( n
)
Y − n 1 X
2 2 2
f (xi ; m, σ) = 2πσ exp − 2 (xi − m)
i=1
2σ i=1
n n n
X X 1X
Deoarece (xi − m)2 = n (x − m)2 + (xi − x)2 , unde x = xi şi
i=1 i=1
n i=1
n
1 X
2
s = (xi − x)2 , obţinem
n − 1 i=1
n
( n
)
Y − n 1 X n−1 2
2
f (xi ; m, σ) = 2πσ 2 exp − 2 (x − m)2 − s . (1)
i=1
2σ i=1 2σ 2
Ne putem pune ı̂ntrebarea dacă

CURS presupunerea
11 - 08.05.2015 căşiı̂nălţimea
Statistică populaţiei urmează o
prelucrarea datelor
Metoda momentelor
Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode

folosite de statistician ı̂n ı̂ncercarea de a studia distribuţia populaţiei.
ce model statistic trebuie folosit?

Metoda momentelor

valorile parametrilor care intra ı̂n definiţia modelului statistic (de exemplu,
ştim că ı̂nălţimea urmează o distribuţie normală, dar nu ştim media şi
dispersia)

Metoda momentelor

valorile parametrilor care intra ı̂n definiţia modelului statistic (de exemplu,
ştim că ı̂nălţimea urmează o distribuţie normală, dar nu ştim media şi
dispersia)
Pentru a justifica această alegere avem nevoie să studiem estimatorii
punctuali.

Metoda momentelor
Să considerăm o variabilă aleatoare X a cărei lege de probabilitate conţine

un parametru θ. Fie X1 , ..., Xn - n variabile aleatoare independente care au
aceeaşi distribuţie ca şi X .
Alegem o anumită funcţie θ̂(X1 , ..., Xn ) pe care o vom utiliza ca estimator
pentru θ. Cu alte cuvinte, dacă dispunem de valorile x1 , x2 , ..., xn obţinute
experimental, numărul θ̂ (x1 , x2 , ..., xn ) va fi considerat ca estimator
punctual al parametrului θ.

Metoda momentelor

Definition 3
Se consideră o populaţie de volum N şi un parametru θ al acestei populaţii. Fie
x1 , x2 , ..., xn un eşantion reprezentativ (n << N) al populaţiei; un estimator
punctual θ̂ = θ̂ (x1 , x2 , ...,
h xn ) al lui θ se
i numeşte estimator nedeplasat sau
absolut corect dacă M θ̂(X1 , ..., Xn ) = θ.

Metoda momentelor

Definition 3
Se consideră o populaţie de volum N şi un parametru θ al acestei populaţii. Fie
x1 , x2 , ..., xn un eşantion reprezentativ (n << N) al populaţiei; un estimator
punctual θ̂ = θ̂ (x1 , x2 , ...,
h xn ) al lui θ se
i numeşte estimator nedeplasat sau
absolut corect dacă M θ̂(X1 , ..., Xn ) = θ.
h i h i
Dacă lim M θ̂(X1 , ..., Xn ) = θ şi lim D θ̂(X1 , ..., Xn ) = 0 atunci θ̂ este un
n→∞ n→∞
estimator consistent sau corect sau deplasat al lui θ.

Metoda momentelor
Theorem 4
Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn (v.a.

independente la fel distribuite ca şi X ), m media teoretică şi σ 2 dispersia
teoretică. Notăm cu
1P n 1P n 2
X = Xi , media de selecţie, σ 2 = Xi − X dispersia de selecţie şi
n i=1 n i=1
1 P n 2
2
S = Xi − X dispersia de selecţie modificată.
n − 1 i=1
Atunci media de selecţie este un estimator punctual pentru media teoretică, iar
dispersia de selecţie şi dispersia de selecţie modificată sunt estimatori punctuali
pentru dispersia teoretică. În plus,
1
M X = m, D X = σ 2 ⇒ media de selecţie este un estimator absolut

n
corect
h ial luin m. −1 2
M σ2 = σ ⇒ dispersia de selecţie este un estimator corect al lui σ 2 .
n
M S = σ 2 ⇒ dispersia de selecţie este un estimator absolut corect al lui σ 2 .
2

Metoda momentelor
Dacă X ∈ Pois [λ] , atunci M [X ] = D [X ] = λ şi atunci X şi s 2 sunt estimatorii
nedeplasaţi pentru λ. Se pune ı̂ntrebarea pe care ı̂l vom alege. Cum dispersia
este o măsură a ı̂mprăştierii, intuiţia sugerează să-l alegem pe acela care are
cea mai mică dispersie şi aceasta deoarece el are o repartiţie mai concentrată ı̂n
jurul lui λ.

Metoda momentelor
jurul lui λ.
Dintre doi estimatori nedeplasaţi θ̂ şi θ̂1 pentru acelaşi parametru θ, se
consideră că este mai precis cel care are dispersie mai mică.
Theorem 5
Fie X o v. a. cu media m şi abaterea medie pătratică σ. Dacă x1 , x2 , . . . , xn

(n ≥ 2) o selecţie de valori ale lui X (v. a. independente la fel distribuite
ca şi
σ
X ), atunci pentru n suficient de mare se poate considera că X ∈ N m, √ .
n

Metoda momentelor
jurul lui λ.
Dintre doi estimatori nedeplasaţi θ̂ şi θ̂1 pentru acelaşi parametru θ, se
consideră că este mai precis cel care are dispersie mai mică.
Theorem 5
Fie X o v. a. cu media m şi abaterea medie pătratică σ. Dacă x1 , x2 , . . . , xn

(n ≥ 2) o selecţie de valori ale lui X (v. a. independente la fel distribuite
ca şi
σ
X ), atunci pentru n suficient de mare se poate considera că X ∈ N m, √ .
n
Demonstraţie. Conform teoremei limită √

centrală
avem că
Sn = X1 + X2 + ... + Xn ⇒ Sn ∈ N nm, nσ .
σ2

1 1 1 1 1 σ
Avem M Sn = nm = m, D Sn = 2 nσ 2 = ⇒ Sn ∈ N m, √
n n n n n n n

Metoda momentelor
Corollary 6
În condiţiile teoremei 5 pentru orice a < b avem
! !
b−m a−m
P a≤X <b ≈Φ σ −Φ σ . (2)
√ √
n n
Statisticienii recomandă folosirea formulei (2) pentru populaţii statistice de

volum N şi eşantioane de volum n unde n ≥ 30 şi n ≤ N3 . Dacă n < 30 formula
este utilă dacă populaţia iniţială nu este departe de a fi normal distribuită.
σ
Pentru eşantioane mici statisticienii propun o corecţie care să ı̂nlocuiască √
r n
σ N −n
prin √ .
n N −1

Metoda momentelor
Problem 7
Considerăm greutăţile populaţiei de 350 studenţi dintr-o facultate s-a constatat
că media este m = 70 şi abaterea media pătratică este σ = 10.
a) Să se determine probabilitatea ca un student luat la ı̂ntâmplare să
cântărească ı̂ntre 65 şi 70 kg?
b)Să se determine probabilitatea ca media maselor să fie ı̂ntre 65 şi 75 kg.
c) Să se determine probabilitatea ca extrăgând un eşantion de 36 studenţi din
acea populaţie, media eşantionului să fie cuprinsă ı̂ntre 65 şi 75 kg.
d) Extrgı̂nd un eşantion de 100 de studenţi care este probabilitatea ca media
maselor să fie sub 65 kg?

Metoda momentelor
Soluţie.
a) Pobabilitatea cerută la punctul a) nu poate fi calculată deoarece X =
greutatea populaţiei nu este repartizată normal.

Metoda momentelor
Soluţie.
La fel şi la b).

Metoda momentelor
Soluţie.
La fel şi la b).
c) n = 36, m = 70, σ X = √1036 = 1.6667,
75−70 65−70

P 65 ≤ X ≤ 75 = Φ 1. 6667
− Φ 1. 6667
= 0.9986 − 0.0014 = .9972.

Metoda momentelor
Soluţie.
La fel şi la b).
c) n = 36, m = 70, σ X = √1036 = 1.6667,
75−70 65−70

P 65 ≤ X ≤ 75 = Φ 1. 6667
− Φ 1. 6667
= 0.9986 − 0.0014 = .9972.
10
d) n = 100, m = 70, σ X = √100 = 1,
P X ≤ 65 = Φ 65−70

1
= 0.0000003.H

Metoda momentelor
Metoda momentelor
Ideea metodei este de a egala momentele distribuţiei cu momentele statistice.şi

de.aici obţinem estimarea parametrilor.
Ştim că momentul iniţial de ordin k este
h i X n
M Xk = xik pi
i=1
dacă distribuţia este discretă şi
h i Z∞
M Xk = x k f (x)dx
−∞
dacă distribuţia este continuă, iar momentul statistic iniţial de ordin k este
k n
X = n1 Xik .
P
i=1
De exemplu momentul iniţial de ordin ı̂ntâi este media iar media statistică este
momentul statistic de ordin ı̂ntâi. Egalăm acestea şi obţinem estimarea
punctuală µ̂ = X .

Metoda momentelor
Metoda momentelor
Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn

care au o distribuţie exponenţială cu parametru λ. Avem un singur
parametru de estimat. Ştim că M [X ] = λ1 . De aici rezultă că
1
λ
= X ⇒ λ̂ = x1 este un estimator punctual al parametrului λ obţinut cu
metoda momentelor.

Metoda momentelor
Metoda momentelor

1
λ
metoda momentelor.
Ca exemplu, presupunem că este testat timpul de viaţă al unui modul
electronic folosi ı̂n industria automobilelor. Timpul de viaţă urmează o
distribuţie exponenţială. S-au făcut teste şi s-au obţinut următoarele date:
x1 = 11.96, x2 = 5.03, x3 = 67.40, x4 = 16.07, x5 = 31.50, x6 = 7.73,
x7 = 11.10, x8 = 22.38. Deoarece x = 21.65, estimarea punctuală a
1
parametrului λ obţinut cu metoda momentelor este λ̂ = 21.65 = 0.04618 9.

Metoda momentelor
Metoda momentelor

1
λ
metoda momentelor.
Ca exemplu, presupunem că este testat timpul de viaţă al unui modul
electronic folosi ı̂n industria automobilelor. Timpul de viaţă urmează o
distribuţie exponenţială. S-au făcut teste şi s-au obţinut următoarele date:
x1 = 11.96, x2 = 5.03, x3 = 67.40, x4 = 16.07, x5 = 31.50, x6 = 7.73,
x7 = 11.10, x8 = 22.38. Deoarece x = 21.65, estimarea punctuală a
1
parametrului λ obţinut cu metoda momentelor este λ̂ = 21.65 = 0.04618 9.
care au o distribuţie normală de parametrii m şi σ. În acest caz avem
M [X ] = m, M X 2P= m2 + σ 2 .
xi , m2 + σ 2 = n1
P 2
Rezultă că m = n1 xi ⇒ m̂ = n1
P
xi ,
i=1 2 i=1 i=1
σ̂ 2 = n1 (xi − x)2 . Reamintim că acest

P 2
xi − n1 ⇒ σ̂ 2 = n1
P P
xi
i=1 i=1 i=1
estimator pentru σ 2 este un estimator deplasat.
Metoda momentelor
dezvoltată de Fisher şi extinsă de Cramer, Rao şi Wald

Metoda momentelor

cea mai folosită metodă de estimare şi joacă un rol important ı̂n verificarea
ipotezelor statistice

Metoda momentelor

Considerăm o selecţie X1 , X2 , ..., Xn i.i.d. cu v. a. X , ce are cu densitatea
de probabilitate f (x, θ). Atunci funcţia de verosimilitate maximă
corespunzătoare selecţiei este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1

Metoda momentelor

Considerăm o selecţie X1 , X2 , ..., Xn i.i.d. cu v. a. X , ce are cu densitatea
de probabilitate f (x, θ). Atunci funcţia de verosimilitate maximă
corespunzătoare selecţiei este
n
Y
L(x1 , x2 , ..., xn ; θ) = f (xj , θ).
j=1
Acceptăm următoarea axiomă: valoarea cea mai verosimilă a parametrului

este cea care maximizează funcţia L(x1 , x2 , ..., xn ; θ), ceea ce conduce la
ecuaţia
∂L(x1 , x2 , ..., xn ; θ)
= 0. (3)
∂θ

Metoda momentelor
Cum uneori este dficil de rezolvat ecuaţia (3), introducem funcţiile

ln L(x1 , x2 , ..., xn ; θ), logaritmul funcţiei de verosimilitate şi
∂L(x1 , x2 , ..., xn ; θ)
= s (θ; x1 , x2 , ..., xn )
∂θ
funcţia scor.

Metoda momentelor
Cum uneori este dficil de rezolvat ecuaţia (3), introducem funcţiile

ln L(x1 , x2 , ..., xn ; θ), logaritmul funcţiei de verosimilitate şi
∂L(x1 , x2 , ..., xn ; θ)
= s (θ; x1 , x2 , ..., xn )
∂θ
funcţia scor.
Definition 8
tn (x1 , x2 , ..., xn ) : S → Θ se numeşte estimaţie de verosimilitate maximă
pentru parametrul θ dacă este punct de maxim pentru funcţia de verosimilitate,
adică
ln L(x1 , x2 , ..., xn ; tn ) ≥ ln L(x1 , x2 , ..., xn ; θ), ∀θ ∈ Θ.

Metoda momentelor
În cele ce urmează presupunem că f (xi , θ) sunt derivabile până la ordinul doi
∂L(x1 , x2 , ..., xn ; θ)
inclusiv ı̂n raport cu θ. Atunci există şi estimaţia de
∂θ
verosimilitate maximă este soluţie a ecuaţiei
∂L(x1 , x2 , ..., xn ; θ)
=0 (4)
∂θ

Metoda momentelor
În cele ce urmează presupunem că f (xi , θ) sunt derivabile până la ordinul doi
∂L(x1 , x2 , ..., xn ; θ)
inclusiv ı̂n raport cu θ. Atunci există şi estimaţia de
∂θ
verosimilitate maximă este soluţie a ecuaţiei
∂L(x1 , x2 , ..., xn ; θ)
=0 (4)
∂θ
sau a ecuaţiei
∂ ln L(x1 , x2 , ..., xn ; θ)
=0 (5)
∂θ
atunci când aceasta există.
Ecuaţiile (4) şi (5) se numesc ecuaţii de verosimilitate.

Metoda momentelor
Metoda verosimilităţii maxime: media necunoscută, dispersia cunoscută
Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn care

au o distribuţie normală, i. i. r. cu v. a. X ∈ N m, σ 2 .


Metoda momentelor
Fie x1 , x2 , . . . , xn (n ≥ 2) o selecţie de valori ale variabilelor X1 , X2 , ..., Xn care

au o distribuţie normală, i. i. r. cu v. a. X ∈ N m, σ 2 .

a) Dacă σ 2 este cunoscută şi media m este necunoscută cu Θ = R, atunci

funcţia de verosimilitate maximă este
n ( n
)
1 1 X 2
L(x1 , x2 , ..., xn ; m) = √ exp − 2 (xi − m) .
σ 2π 2σ i=1
Deoarece funcţia ln L este strict crescătoare ı̂n L şi valoarea lui m care
maximizează ln L(x1 , x2 , ..., xn ; m) maximizează şi L(x1 , x2 , ..., xn ; m), este
mai uşor de lucrat cu logaritmul lui L decât cu L. Avem
n
n n 1 X
ln L(x1 , x2 , ..., xn ; m) = − ln 2π − ln σ 2 − 2 (xi − m)2 .
2 2 2σ i=1

Metoda momentelor
Dar
n n
∂ ln L(x1 , x2 , ..., xn ; m) 1 X 1 X
= 2 (xi − m) , 2 (xi − m) = 0 ⇒ m̂ = x.
∂m σ i=1 σ i=1
Observăm că
∂ 2 ln L(x1 , x2 , ..., xn ; m) n
= − 2 ≤ 0, ∀m ∈ R,
∂m2 σ
deci m̂ = x este punct de maxim. Astfel tn (x1 , x2 , ..., xn ) = x este punct de
verosimilitate maximă.

Metoda momentelor
Metoda verosimilităţii maxime: media cunoscută, dispersia necunoscută
Dacă m este cunoscută şi σ 2 , Θ = (0, ∞) este necunoscut folosim forma

funcţiei de verosimilitate maximă dedusă ı̂n (1) şi obţinem
( n
)
− n 1 X n−1 2
2
L(x1 , x2 , ..., xn ; m, σ 2 ) = 2πσ 2 exp − 2 (x − m)2 − s =
2σ i=1 2σ 2
( n
)
− n 1 X

n−1 2

2 2 2
= 2πσ exp − 2 (x − m) exp − s .
2σ i=1 2σ 2
Fixăm m = x şi atunci

− n

n−1 2

2
L(x1 , x2 , ..., xn ; σ 2 ) = 2πσ 2exp − s ⇒
2σ 2
n n n−1 2
ln L(x1 , x2 , ..., xn ; σ 2 ) = − ln 2π − ln σ 2 − s .
2 2 2σ 2

Metoda momentelor
Metoda verosimilităţii maxime: media cunoscută, dispersia necunoscută
∂ ln L(x1 , x2 , ..., xn ; σ 2 ) n n − 1 2 ∂ ln L(x1 , x2 , ..., xn ; σ 2 )

= − + s , =0⇒
∂σ 2 2σ 2 2σ 4 ∂σ 2
n−1 2
σ̂ 2 = s .
n
Dar
∂ 2 ln L n3

2 n n − 1 2 1
2
(x1 , x2 , ..., xn ; σ̂ ) = − s n − 1 = − ≤0⇒
∂ (σ 2 ) 2σ 4 σ6
σ2 = s2 2 s 4 (n − 1)2
n
σ̂ 2 este estimatorul de verosimilitate maximă.

Metoda momentelor
Metoda verosimilităţii maxime: media şi dispersia necunoscute
c) Dacă m şi σ 2 sunt necunoscute, Θ = m, σ 2 | m ∈ R, σ 2 ∈ (0, ∞) ,

atunci valoarea maximă se găseşte rezolvând sistemul


 ∂ ln L (x1 , ..., xn ; m, σ 2 ) = 0

∂m
 ∂ ln L (x , ..., x ; m, σ 2 ) = 0,
 1 n
∂σ 2
de unde
 n
1 X
(xi − m)2 = 0


σ 2 i=1


n
n 1 X n−1 2
(x − m)2 +

 − 2 + s = 0.


2σ 2(σ 2 )2 i=1 2(σ 2 )2
Obţinem (
m̂ = x
n−1 2
σ̂ = s .
n

Metoda momentelor
Metoda verosimilităţii maxime: media şi dispersia necunoscute
Diferenţiala de ordinul doi este
1 n3
d 2 ln L(x1 , ..., xn ; m, σ 2 ) = −
2
dm2 − (dσ 2 )2 ,
σ 2(n − 1)2 (s 2 )2

n−1 2
negativ definită. De aici rezultă că x, s este unicul estimator de
n
2

verosimilitate maximă pentru m, σ .

Metoda momentelor
Example 9 (Modelul exponenţial)

Presupunem că timpul de viaţă a unui aparat este distribuit Exp [θ] unde
θ ∈ (0, ∞) este necunoscut. Bazându-ne pe o selecţie (x1 , x2 , ..., xn ) de valori
ale variabilelor X1 , X2 , ..., Xn care au o distribuţie exponenţială obţinem funcţia
de verosimilitate
L(x1 , x2 , ..., xn ; θ) = θn exp {−nxθ} ⇒
∂ ln L(x1 , x2 , ..., xn ; θ) n
ln L(x1 , x2 , ..., xn ; θ) = n ln θ − nxθ ⇒ = − nx ⇒
∂θ θ
n
− nx = 0 ⇒ θ̂ = x1 .
θ
∂ 2 ln L n ∂ 2 ln L
2
(x1 , x2 , ..., xn ; θ) = − 2 ⇒ (x1 , x2 , ..., xn ; x1 ) = −n (x)2 ≤ 0 ⇒
∂θ θ ∂θ2
θ̂ este estimatorul de verosimilitate maximă.H

Metoda momentelor
Example 10
Fie X o variabila aleatoare cu densitatea de probabilitate
1 1−θ
(
x θ , 0 < x ≤ 1, θ > 0
f (x) = θ
0, ı̂n rest
Se face o selecţie x1 , x2 , ..., xn . Să se determine estimatorul de verosimilitate

maximă pentru parametrul θ al repartitiei.

Metoda momentelor
Example 11
Fie X o variabila aleatoare cu densitatea de probabilitate
(1 + λ)x λ , 0 ≤ x ≤ 1, λ > 0

f (x) =
0, ı̂n rest.
Se face o selecţie x1 , x2 , ..., xn . Să se determine estimatorul de verosimilitate

maximă pentru parametrul λ al repartitiei.

Elemente de Statistic A: CURS 11 - 08.05.2015

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Elemente de Statistic A: CURS 11 - 08.05.2015

Încărcat de

Drepturi de autor:

Formate disponibile

Statistică inferenţială

Facultatea de Automatică şi Calculatoare

Statistică şi prelucrarea datelor

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Statistica inferenţială trage concluzii valabile pentru populaţie utilizând

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Repartiţia selecţiei (X1 , X2 , ..., Xn ) este definită ca repartiţia comună a

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

O selecţie aleatoare poate fi constituită prin repetarea unui experiment

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Dată o populaţie de volum N se numeşte statistică a acelei populaţii orice

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

De obicei se notează cu θ parametrul şi cu θ̂ un estimator al său.

Exemple de modele statistice ce apar adesea ı̂n practică

f (xi , θ) = θxi (1 − θ)1−xi ,

iar densitatea de probabilitate a eşantionului este dată de

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Exemple de modele statistice ce apar adesea ı̂n practică

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Exemple de modele statistice ce apar adesea ı̂n practică

Ne putem pune ı̂ntrebarea dacă

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Construcţia histogramei şi ı̂ncercarea de a intui modelul statistic sunt metode

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor

Să considerăm o variabilă aleatoare X a cărei lege de probabilitate conţine

CURS 11 - 08.05.2015 Statistică şi prelucrarea datelor