Sunteți pe pagina 1din 6

Curs 3

Estimatorii și metodele de estimare

Pentru a consolida unele proprietăți ale estimatorilor, putem considera mai multe valori
pentru variabila X (aleatoare), valori care sunt definite prin distribuții probabilistice.
Considerăm că populația are în caracteristicile sale parametrul U. Acesta poate
reprezenta media populației sau dispersia acesteia.
Parametrul U poate fi exprimat dintr-un eșantion de m observații ale variabilei aleatoare
și va fi reprezentat sub forma (X1,…,Xm). Așadar, Xt reprezintă observarea t. Vom utiliza ̂ ca
estimator al parametrului U real. Prin urmare putem scrie funcția:

̂ ̂ (3.1)

Considerând pe ̂ ca fiind media populației vom avea un estimator care va fi media


eșantionului și totodată o funcție a valorilor Xt:

(3.2)

Toți estimatorii conform relației (3.1) au distribuții de selecție și dacă sunt extrase mai
multe eșantioane de acest fel vom obține o distribuție ̂ , care va avea propria medie E( ̂ ) și
dispersie E[ ̂ ̂ ].

3.1 Estimator nedeplasat

Un estimator ̂ se spune că este un estimator nedeplasat al parametrului U, dacă:

E( ̂ ) = U (3.3)

Reprezentarea grafică a unui astfel de estimator este redată în figura 3.1:

1
Figura 3.1: Estimator nedeplasat

0 ̂
E 𝑈 =U 𝑈
)

Dacă avem un estimator precum cel dat de relația (3.3) și nu este adevarat, în consecință
este definit ca un estimator deplasat. Această diferență dintre E( ̂ ) și U o cunoaștem ca
deplasare (bias) și se exprimă conform relației:

( ̂) ( ̂) (3.4)

În cazul mai multor eșantioane, dacă media valorilor lui ̂ se situează peste U , atunci
spunem că deplasarea este pozitivă. În celălalt caz, când se va afla sub U, atunci deplasarea
este negativă.
Este indicat ca un estimator pe lângă proprietatea de a fi nedeplasat să aibă și o dispersie
a distribuției de selecție cât mai mică.

3.2 Eficiența eșantionului

Puten spune că estimatorul ̂ al parametrului U este unul eficient, dacă:


- este nedeplasat, adică E( ̂ ) = U;
- nu există alt estimator al parametrului U care să aibă o dispersie mai mică.

2
Pornind de la condiția că estimatorul trebuie să fie nedeplasat și trebuie minimizată
probabilitatea de a avea o estimare diferita de realul U, s-a formulat și denumirea pentru acest
estiamtor ca fiind cel mai bun estimator nedeplasat.
Demonstrația pornește de la faptul ca dispersia estimatorului trebuie să fie minimă față
de dispersiile celorlați estimatori deplasați.
Putem considera media eșantionului care reprezintă un eșantion nedeplasat al mediei
populației u, iar în aceste condiții un estimator nedeplasat alternativ ar fi:

(3.5)

unde și cea mai mare și cea mai mică observare a eșantionului extras
În cazul mai multor eșantioane vom constata că variația va fi mai mică decât cea a lui
̃ . Acest aspect este prezentat în figura următoare:

Figura 3.2: Distribuția de selecție pentru și ̃

𝑋̃

0 u 𝑋 𝑋̃

Cu alte cuvinte dacă estimăm valoarea lui u prin , va exista o probabilitate mai mică
de avea o estimare mai depatrată de u, decât dacă am fi utilizat estimatorul ̃ .
În general este mai ușor să identifici cel mai eficient estimator dintre toti estimatorii
liniari nedeplasați, iar un astfel de estimator poate fi exprimat printr-o funcție liniara de
forma:

3
̂ (3.6)

unde valorile lui a sunt constante.


Media eșantionului va fi un estimator liniar al mediei populației deoarece poate fi
exprimat sub forma:

(3.7)

Avantjul estimatorilor liniari este că din punct de vedere matematic se poate lucra mai
ușor decât cu cei non-liniari.

3.3 Estimatorul BLUE

Putem spune că estimatorul ̂ al parametrului U este cel mai bun estimator BLUE,
dacă:
- este estimator liniar;
- este nedeplasat;
- nu există alt estimator nedeplasat care să aibă o dispersie mai mică.
Un estimator BLUE nu este neapărat cel mai bun estimator. Pot exista situații când un
estimator non-linear poate avea o variație mai mică decât cea a unui BLUE, dar totodată
există situații când este greu de identificat estimatorul eficient și vonm utiliza unul BLUE.
Dacă constatăm că estimatorul eficient este și liniar, atunci estimatorul BLUE va fi identic cu
cel eficient.

3.4 Eroarea medie pătratică

O să avem în vedere imposibilitatea de a gasi un estimator nedeplasat și care să aiba o


variație mică. Acest aspect este prezentat grafic in figura 3.3

4
Figura 3.3: Distribuția de selecție

̂
𝑈

̂
𝑈

0 u

Estimatorul eficient pentru U este ̂ . Acesta este nedeplasat, dar poate avea o variație mare.
În același timp estimatorul ̂ are o variație mult mai mică, dar este deplasat.

Eroarea pătratului mediei va fi raportată ca și variația, și anume la dispersia distribuției


de selecție a unui estimator. Dacă variația masoară dispersia în jurul valorii previzionate,
eroarea patratului mediei va măsura dispersia în jurul valorii adevărate a parametrului care
este estimat.

Notam eroarea medie pătratică cu EMP și o putem defini astfel:

( ̂) (̂ ) (3.8)

Deoarece ( ̂) [̂ ( ̂ )] , variția și eroarea medie pătratică au aceeași


valoare numai dacă ( ̂) . Adică în condițiile în care estimatorul este nedeplasat. Dacă
nu este îndeplinită condiția, atunci relația dintre EMP și variație va avea forma:

( ̂) ( ̂) [ ( ̂ )] (3.9)

5
Conform relației (3.9) EMP reprezintă suma dintre variație și pătratul influenței, ceea ce
putem deduce că relația oferă o cale de compensare între a avea o variație mică sau o influență
mică.

Este indicat să selectăm acel estimator care are cea mai mică eroare a pătratului mediei.
Aceasta va ajuta la evitarea posibilității de a avea ori o influență prea mare, ori o variație prea
mare.

Dacă avem doi estimatori nedeplasați atunci variațiile erorii medii pătratice sunt
identice și alegerea estimatorului cu cea mai mică EMP va coincide cu alegerea celui mai
eficient estimator.

S-ar putea să vă placă și