Sunteți pe pagina 1din 3

Teoria estimaţiei

Să considerăm că avem o selecţie dintr-o populaţie dată a cărei funcţie de repartiţiei teoretică are o formă
matematică cunoscută, în care intră anumiţi parametri cu valori necunoscute. Există o infinitate de funcţii
de selecţie (statistici) care pot fi propuse ca estimaţii pentru parametrii necunoscuţi, dar trebuie alese
acelea care dau cea mai bună aproximare a parametrilor.
De exemplu, să presupunem că studiind un fenomen ajungem la concluzia că repartiţia lui este normală
( )
N m, σ 2 deci:
( x− m ) 2
1 −
f ( x) = e 2σ
2

σ 2π
Pentru aplicaţii practice trebuie să determinăm valorile numerice ale celor doi parametri m şi σ .
Repartiţia exprimată printr-o funcţie dată în care intră anumiţi parametri necunoscuţi se spune că este o
lege de repartiţie specificată.
Dacă cunoaştem valorile numerice ale parametrilor avem o lege de repartiţie complet specificată.
Deci o lege de repartiţie nespecificată corespunde unei legi de repartiţie necunoscute.
Determinarea valorilor parametrilor unei repartiţii specificate se face cu ajutorul unei selecţii de volum n
care conduce la valorile x1 ,..., x n legate de variabila studiată.
În cele ce urmează ne vom ocupa de repartiţii specificate care depind de un singur parametru. Deci
funcţia de repartiţie teoretică conţine un singur parametru necunoscut θ . O selecţie de volum n din
colectivitate ne-a dat estimaţia θ1* altă selecţie de volum n ne dă estimaţia θ 2* etc. Repetând procedeul
obţinem estimaţiile θ1* ,..., θ r* .
Deci o estimaţie θ * a lui θ poate fi privită ca o variabilă aleatoare cu valorile posibile θ1* ,..., θ r* .
Estimaţii consistente, corecte şi absolut corecte, nedeplasate, deplasate
Fie θ un parametru al colectivităţii generale (medie, dispersie, mediană etc.) şi θ * ( x1 ,..., xn ) o funcţie de
selecţie.
Definiţia 3. Dacă θ * ( x1 ,..., xn ) converge în probabilitate către parametrul θ , spunem că θ * este o
estimaţie consistentă a lui θ .
Definiţia 4. Dacă:
( )
M θ * ( x1 ,..., xn ) = θ

n→∞
2
( *
)
lim D θ ( x1 ,..., xn ) = 0
(7)

spunem că θ * ( x1 ,..., xn ) este o estimaţie absolută corectă a parametrului θ .


Teorema 5. Momentele de selecţie sunt estimaţii absolut corecte ale momentelor teoretice.
Teorema 6. Dispersia de selecţie este o estimaţie consistentă pentru dispersia teoretică.

Funcţii de estimaţie eficiente. Metoda verosimilităţii maxime

De multe ori o estimaţie nedeplasată nu ne dă cea mai bună aproximare a parametrului de estimat. Valorile
( )
posibile ale estimaţiei lui θ pot fi mult împrăştiate în jurul valorii medii (dacă D 2 θ * este mare), iar
estimaţia calculată de o selecţie dată poate fi îndepărtată de valoarea medie a lui θ , deci se face o eroare
*

alegând θ * ca estimaţie pentru θ .


( )
Dacă θ * este o estimaţie absolut corectă pentru parametrul θ > 0 şi M θ * < ∞ atunci inegalitatea lui
Cebâşev:
D 2 (θ )
P(θ * −θ ≥ ε ) <
ε2
dă un criteriu pentru alegerea estimaţiilor şi anume: alegem acea estimaţie care are dispersia minimă.
Fie f ( x,θ ) o familie de densităţi de probabilitate ale unei repartiţii specificate continue, cu θ
parametrul real. Vom admite continuitatea funcţiilor f ( x,θ ) şi existenţa derivatelor acestor funcţii în
raport cu θ până la ordinele necesare calculelor.
( )
Teorema 7. (Rao-Cramer). Dacă θ * x1 ,..., x este o estimaţie absolut corectă a parametrului θ, atunci:

( )
D 2 θ * (x1 ,..., xn ) ≥
1
  ∂ ln f ( x,θ )  2  (8)
nM    
 ∂θ  

Egalitatea are loc dacă şi numai dacă există o constantă k, ce depinde de n şi θ , aşa încât, aproape
sigur:
∂ ln f ( xi ,θ )
[ ]
n

∑ = k θ * (x1 ,..., xn ) − θ .
i =1 ∂ θ
Definiţia 5. O estimaţie absolut corectă θ * ( x1 ,..., xn ) a parametrului θ se numeşte estimaţie eficientă
dacă are dispersia minimă.
Dacă θ * este o funcţie de estimaţie absolut corectă, raportul:
1
  ∂ ln f ( x,θ ) 2 
nM     (9)
 ∂θ  
( )
en θ =* 
D θ
2
( )
*

se numeşte eficienţa lui θ .


( ) ( )
Se observă că: 0 ≤ en θ * ≤ 1 . Dacă en θ * = 1 , estimaţia este eficientă.

Teorema 8. Două estimaţii eficiente ale parametrului θ sunt egale aproape sigur.
Fie repartiţia de tip continu f ( x,θ ) unde θ poate lua orice valoare dintr-un interval I. Valorile de
selecţie x1 ,..., x n obţinute în urma a n extracţii independente din populaţie sunt variabile aleatoare
independente cu aceeaşi densitate de probabilitate f ( x,θ ) . Fiecare selecţie ( x1 ,..., x n ) o considerăm ca
un punct în spaţiul de selecţie n-dimensional R n , iar probabilitatea elementară a vectorului ( x1 ,..., x n )
este:
P(x1 ,..., xn ;θ )dx1 ,..., dxn = f (x1 ,θ )... f ( xn ,θ )dx1...dxn (10)
Definiţia 6. Funcţia P : R n × I → R se numeşte funcţie de verosimilitate.
Definiţia 6. Estimaţia θˆ(x1 ,..., xn ) se numeşte estimaţie de verosimilitate dacă θˆ este un punct de maxim
pentru funcţia de verosimilitate.
Rezultă că θˆ este o soluţie a ecuaţiei:
∂ ln P (x1 ,..., xn ;θ ) n ∂ ln f (xi ,θ )
=∑ =0 (11)
∂θ i =1 ∂θ
Ecuaţia (11) se numeşte ecuaţie de verosimilitate.
Teorema 9. Orice estimaţie eficientă a parametrului θ este o estimaţie de verosimilitate maximă.

S-ar putea să vă placă și