Sunteți pe pagina 1din 33

Curs 4.

Elemente de teoria estimaţiei


Definitie
Evaluarea valorilor parametrilor unei legi de probabilitate prin
mijloace statistice se numeşte estimaţie statistică.
Definitie
Evaluarea valorilor parametrilor unei legi de probabilitate prin
mijloace statistice se numeşte estimaţie statistică.

Tipuri de estimări pentru parametrii unei variabile teoretice:


estimări punctuale
estimări cu ajutorul intervalelor de ı̂ncredere
Să presupunem că relativ la colectivitatea statistică Ω cercetăm
caracteristica X , care urmează legea de probabilitate dată prin
funcţia f (x, λ), λ fiind un parametru necunoscut.

Fie
X1 , X2 , ..., Xn variabilele de selecţie
x1 , ..., xn datele de selecţie corespunzătoare.
Definitie
Se numeşte funcţie de estimaţie (punctuală) sau estimator pentru
parametrul λ funcţia de selecţie (statistică)

λ
e = λ(X
e 1 , X2 , ..., Xn ),

cu ajutorul căreia se obţin informaţii despre parametrul λ.


Definitie
Zicem că funcţia de estimaţie λ
e este o funcţie de estimaţie
consistentă sau estimator consistent pentru parametrul necunoscut
λ, dacă pentru orice  > 0 avem
e − λ| < ) = 1,
lim P(|λ
n→∞

P
e 1 , X2 , ..., Xn ) →
adică λ
e = λ(X λ.
Valoarea numerică corespunzătoare λ e = λ(x
e 1 , x2 , ..., xn ) se numeşte
estimaţie consistentă pentru parametrul λ.
Definitie
Funcţia de estimaţie λ
e = λ(X
e 1 , X2 , ..., Xn ) se numeşte funcţie de
estimaţie (estimator) absolut corectă (sau nedeplasată) pentru
parametrul λ, dacă satisface condiţiile:
i) M(λ)e = λ; ii) lim D 2 (λ)
e = 0.
n→∞
Valoarea numerică λe = λ(x
e 1 , x2 , ..., xn ) se numeşte estimaţie
absolut corectă pentru parametru λ.
Definitie
O funcţie de estimaţie λ
e = λ(X
e 1 , X2 , ..., Xn ) se numeşte funcţie de
estimaţie (estimator) corectă (deplasată) pentru parametrul λ dacă
satisface condiţiile:
i) lim M(λ) e = λ; ii) lim D 2 (λ) e = 0.
n→∞ n→∞
Valoarea numerică λ e = λ(x
e 1 , x2 , ..., xn ) se numeşte estimaţie
corectă (deplasată) pentru λ.
Definitie
O funcţie de estimaţie λ
e = λ(X
e 1 , X2 , ..., Xn ) se numeşte funcţie de
estimaţie (estimator) corectă (deplasată) pentru parametrul λ dacă
satisface condiţiile:
i) lim M(λ) e = λ; ii) lim D 2 (λ) e = 0.
n→∞ n→∞
Valoarea numerică λ e = λ(x
e 1 , x2 , ..., xn ) se numeşte estimaţie
corectă (deplasată) pentru λ.

Definitie
Se numeşte distorsiunea sau deplasarea unui estimator λ e al
parametrului λ, diferenţa M(λ̃) − λ.
Dacă distorsiunea este nulă se zice că estimatorul λ
e este
nedeplasat.
Propozitie

Dacă λ
e = λ(X
e 1 , X2 , ..., Xn ) este o estimaţie absolut corectă pentru
parametrul λ, atunci estimaţia este consistentă.
Propozitie

Dacă λ
e = λ(X
e 1 , X2 , ..., Xn ) este o estimaţie absolut corectă pentru
parametrul λ, atunci estimaţia este consistentă.

Example

Fie caracteristica X pentru care există momentul teoretic de ordinul


k, νk = M(X k ) şi fie o selecţie repetată de volum n. Momentul de
1P n
selecţie de ordinul k este ν k = X k . Sa se arate că ν k este o
n i=1 i
estimaţie absolut corectă pentru momentul teoretic νk .
Propozitie

Dacă λ
e = λ(X
e 1 , X2 , ..., Xn ) este o estimaţie absolut corectă pentru
parametrul λ, atunci estimaţia este consistentă.

Example

Fie caracteristica X pentru care există momentul teoretic de ordinul


k, νk = M(X k ) şi fie o selecţie repetată de volum n. Momentul de
1P n
selecţie de ordinul k este ν k = X k . Sa se arate că ν k este o
n i=1 i
estimaţie absolut corectă pentru momentul teoretic νk .

Observatie
Pentru k = 1 din exemplul precedent rezultă că media de selecţie
X = ν 1 este un estimator absolut corect pentru media teoretică
M(X ) = ν1 .
Example

Să arătăm că momentul centrat de selecţie de ordinul doi


n
1X
ν2 = (Xi − X )2
n
i=1

este o funcţie de estimaţie corectă pentru momentul centrat


teoretic de ordinul doi µ2 = D 2 (X ), adică pentru dispersia
teoretică.
Example
Să arătăm că funcţia de estimaţie care defineşte dispersia
1 P n
modificată de selecţie σ 21 = (Xi − X )2 este o funcţie de
n − 1 i=1
estimaţie absolut corectă pentru dispersia teoretică µ2 = D 2 (X ).
Definitie
Numim cantitate de informaţie (a lui Fisher) a unei selecţii de
volum n relativ la parametrul λ ∈ R necunoscut valoarea
"  #
∂ ln f (X , λ) 2
In(λ) = nM ,
∂λ

unde f (X , λ) este legea de probabilitate teoretică pe care dorim să


o aflăm.
Propozitie

O funcţie de selecţie absolut corectă λ


e pentru parametrul λ verifică
inegalitatea
e ≥ 1 ,
D 2 (λ)
In(λ)
numită inegalitatea lui Rao-Cramer.
Propozitie

O funcţie de selecţie absolut corectă λ


e pentru parametrul λ verifică
inegalitatea
e ≥ 1 ,
D 2 (λ)
In(λ)
numită inegalitatea lui Rao-Cramer.

Definitie
Funcţia de estimaţie λ
e absolut corectă pentru parametrul λ se
e = 1 , adică avem egalitate ı̂n
numeşte eficientă dacă D 2 (λ)
In(λ)
inegalitatea lui Rao-Cramer.
1
Mărimea e(λ)
e = se numeşte eficienţa estimatorului λ.
e
In(λ)D 2 (λ)e
Example
 
1 0
Fie caracteristica dată de X : , p + q = 1, p ≥ 0, q ≥ 0.
p q
Să se arate că media de selecţie X este o funcţie de estimaţie
eficientă pentru p ∈ (0, 1).
Densitatea de probabilitate a caracteristicii X este dată prin
f (x, p) = p x (1 − p)1−x pentru x = 0 şi x = 1.
Conceptul de verosimilitate

Să presupunem că f (x; λ1 , λ2 , ..., λk ) este funcţia de probabilitate


pentru caracteristica X cercetată, λ1 , λ2 , ..., λk fiind parametrii
necunoscuţi, k = 1, 2, ... .

Deaorece variabilele de selecţie X1 , ..., Xn sunt variabile aleatoare


independente, urmând aceeaşi lege de probabilitate X , rezultă că
vectorul aleator (X1 , X2 , ..., Xn ) va avea densitatea de probabiltate
n
Y
V (x1 , ..., xn ; λ1 , λ2 , ..., λk ) = f (xi ; λ1 , λ2 , ..., λk ),
i=1

numită funcţie de verosimilitate.


Definitie
Spunem că estimatorii (funcţiile de selecţie)
λei = λei (X1 , ..., Xn ), i = 1, k, sunt estimatori de verosimilitate
maximă, respectiv pentru parametrii λi , i = 1, k, dacă ei realizează
maximul funcţiei de verosimilitate.
Pentru simplificarea calculelor, se consideră:
n
X
log V (x1 , ..., xn ; λ1 , ..., λk ) = log f (xi ; λ1 , ..., λk ).
i=1

Se calculează
∂ log V ∂ log V ∂ log V
= 0, = 0, ..., = 0,
∂λ1 ∂λ2 ∂λk
numit sistemul de verosimilitate maximă.
Example
Să determinăm estimatorii de verosimilitate maximă pentru o
caracteristică X care urmează legea normală N(m, σ).
Metoda momentelor

Aceasta metoda constă ı̂n estimarea parametrilor funcţiei de


probabilitate prin egalarea momentelor teoretice iniţiale ale
caracteristicii X cu momentele de selecţie corespunzătoare.

Astfel se obţine sistemul νi = νi , i = 1, k, cu necunoscutele


λ1 , ..., λk dacă caracteristica X are funcţia de probabilitate
f (x; λ1 , ..., λk ).
Example

Fie caracteristica X, care urmează legea Gamma de parametrii


p, q > 0 necunoscuţi. funcţia de probabilitate a caracteristicii X
este
x

 1 x p−1 e − q , dacă x > 0
p
f (x; p, q) = Γ(p)q
 0, dacă x ≤ 0.
Să se estimeze acesti parametrii, utilizând metoda momentelor,
având la dispoziţie datele de selecţie x1 , x2 , ..., xn .
Determinarea intervalelor de incredere

Fie caracteristica X cercetată despre care stim sau


presupunem că urmează legea de probabilitate f (x, θ), unde θ
este un parametru necunoscut.
Asupra caracteristicii X se obţin datele statistice
x1 , x2 , . . . , xn . Acestea sunt valorile variabilelor de selectie
X1 , X2 , . . . , Xn independente şi care urmează aceasi lege de
probabilitate ca X .
Dorim sa determinam două funcţii de selecţie θ1 (X1 , · · · , Xn ),
θ2 (X1 , · · · , Xn ) astfel incat

P(θ1 (X1 , · · · , Xn ) < θ < θ2 (X1 , · · · , Xn ) = 1 − α,

unde α ∈ (0, 1).


α se numeste coeficient de risc si este foarte mic;
1 − α se numeste coeficient de incredere.
In general
1 − α = 95%, 99%, 99, 9%

α = 5%, 1%, 0, 1%
Intervalul aleator (θ1 (X1 , . . . , Xn ), θ2 (X1 , . . . , Xn )) se numeşte
interval de incredere.

In aplicaţiile practice intervalul aleator este inlocuit cu intervalul


numeric corespunzător

(θ1 (x1 , . . . , xn ), θ2 (x1 , . . . , xn )).


Metodă de determinare a intervalului de incredere

se caută o funcţie de selecţie Zn = Zn (X1 , · · · , Xn , θ) a cărei


lege de probabilitate să fie cunoscută şi să nu depindă de θ;
pentru fiecare coeficient de incredere se determină intervalul
numeric (z1 , z2 ) astfel incat
Z z2
P(z1 < Zn < z2 ) = f (u)du = 1 − α.
z1

Din relaţia z1 < Zn (X1 , · · · , Xn , θ) < z2 se obţine forma


echivalentă

θ1 (X1 , . . . , Xn ) < θ < θ2 (X1 , . . . , Xn ).


Exemple funcţii de selecţie (statistici)

X −m
Z= urmează legea normală N(0, 1);
√σ
n

X −m
T = urmează legea Student cu n − 1 grade de
σ∗

n
libertate, unde
n
1 X
σ∗ = (Xi − X )2
p
µ2 , µ2 =
n−1
i=1

(n − 1)σ ∗ 2
H= urmează legea χ2 cu n − 1 grade de libertate;
σ2
m=media teoretică;
σ=abaterea standard teoretică;
σ 2 =dispersia teoretică.
Example
Caracteristica X urmează legea normală N(m, σ), unde m ∈ R este
necunoscut şi σ > 0 este cunoscut. Determinăm intervalul de
incredere pentru media teoretică m cu o probabilitate (coeficient)
de incredere 1 − α.
Example
Caracteristica X urmează legea normală N(m, σ), unde m ∈ R este
necunoscut şi σ > 0 este cunoscut. Determinăm intervalul de
incredere pentru media teoretică m cu o probabilitate (coeficient)
de incredere 1 − α.

Example
Caracteristica X urmează legea normală N(m, σ), unde m ∈ R şi
σ > 0 sunt cunoscuti. Determinăm intervalul de incredere pentru
media teoretică m cu o probabilitate (coeficient) de incredere
1 − α.
Example
Caracteristica X urmează legea normală N(m, σ), unde m ∈ R şi
σ > 0 sunt cunoscuti. Determinăm intervalul de incredere pentru
dispersia teoretică σ 2 cu o probabilitate (coeficient) de incredere
1 − α.
APLICATIE. Consideram un esantion de 30 de elevi.
Caracteristica X reprezinta nota la bacalaureat si urmeaza o legea
normala N(m, σ). Sa se determine:
a) intervalul de incredere pentru media teoretica m cu
coeficientul de risc α = 0.02, daca se cunoaste σ = 1.4;
b) intervalul de incredere pentru media teoretica m cu
coeficientul de risc α = 0.01;
c) intervalul de incredere pentru dispersia teoretica σ 2 cu
coeficientul de risc α = 0.05.

S-ar putea să vă placă și