Elemente de Teoria Estimaţiei

Elemente de teoria estimaiei
n multe aplicaii ale statisticii matematice, n tehnic sau tiinele experimentale, exist motivaia teoretic pentru a admite c repartiia variabilei (ce exprim o caracteristic a unei populaii statistice ce se studiaz) este o funcie cunoscut, n care intervin parametri cu valori necunoscute. entru finalizarea aplicaiilor practice, este necesar s se cunoasc repartiia exact, deci trebuie s fie determinate (estimate) valorile parametrilor respectivi, pentru ca le!ea de repartiie s fie complet specificat. ". #biectul teoria estimaiei. $onceptul de estimator. %ie & o variabil aleatoare cu densitatea de probabilitate f ( x ; ) i
x1 , x 2 , ..., x n un eantion de volum n asupra lui &.
resupunem c se cunoate natura repartiiei statistice a unei anumite caracteristici i ne intereseaz care sunt valorile efective ale parametrului n cazul analizat (eventual ale parametrilor n cazul n care sunt mai muli parametri). 'alorile lor adevrate nuse vor cunoate, dar se pot afla estimaii ale lor din datele x1 , x 2 , ..., x n de care dispunem( (parametrul) estimaia (funcie de x1 , x 2 , ..., x n ). )etodele de estimare a parametrilor repartiiilor statistice au drept obiect cutarea unor estimatori * c+t mai buni , , care s implice o form convenabil de calcul (rapiditate de calcul), s necesite un numr c+t mai mic de observaii (din cauza costurilor corespunztoare experimentrii) i care s fie c+t mai apropiat de adevrata valoare a parametrului estimat, deci care s permot concluzionri valide. -ezult de aici c un estimator al parametrului necunoscut al repartiiei F ( x ; ) . notat
. este o funcie de valorile de selecie
= g n ( x1 , x2 ,..., xn )
cu anumite proprieti/ # funcie de valorile de selecie o vom numi statistic. Este clar c valorile statisticii g n trebuie s nu depind de . Exemple de statistici
este aadar o variabil aleatoare.
1n r a). 0tatistica r = xi se numete moment de selectie de ordinul r. n i= 1

^
)omentul de selectie de ordinul nt+i
1n 1 = xi = x n i= 1
^
este aa.numita medie de selecie.
1n ^ r b). 0tatistica = ( xi 1 ) se numete moment centrat de selectie de r n i= 1

^
ordinul r. )omentul centrat de selectie de ordinul 1
1n ^ 2 2 = ( xi 1 ) n i= 1
^
se numete dispersie de selecie. utem astfel s definim un estimator ca fiind o funcie g n ( x1 , x 2 ,..., x n ) , unde x1 , x 2 ,..., x n sunt observaiile asupra variabilei & cu repartiia F ( x ; ) , care nu depinde de . )ai exact vorbind, dac f ( x1 , x 2 ,..., x n ) este o funcie de observaiile de selecie i dac
f ( x1 , x 2 ,..., x n )
A ,
n
adic f ( x1 , x 2 ,..., x n ) conver!e n probabilitate ctre 2, atunci f ( x1 , x 2 ,..., x n ) reprezint un estimator al valorii necunoscute 2. 3efiniia ". Estimatorul f ( x1 , x 2 ,..., x n ) al lui 2 se numete absolut corect, dac(
M ( f ( x1 , x 2 ,..., x n )) = A
i
D 2 ( f ( x1 , x 2 ,..., x n )) 0 .
n
3ac M ( f ( x1 , x 2 ,..., x n )) = A + B (n) i B(n) 0 c+nd estimatorul f ( x1 , x 2 ,..., x n ) se numete corect. #bservaie( n ambele cazuri are loc(
f ( x1 , x 2 ,..., x n )
n ,
A .
n
$+t de 4bun, sau c+t de 4slab, este acest estimator, n sensul *apropierii, respectiv *deprtrii, de valoarea real a parametrului vom vedea n cele ce urmeaz. -emarcm faptul c observaiile asupra variabilei & sunt aleatoare, deci rezultatul unei analize statistice . sintetizat n g n . este i el aleator. n mod natural g n ( x1 , x 2 ,..., x n ) nu va coincide cu valoarea lui / la o alt ' ' ' experien, se vor obine alte realizri x1 , x 2 ,..., x n care vor furniza alt valoare pentru statistica g n , deci o alt valoare a estimatorului. 5at motivaia afirmaiei c
3eoarece valoarea observat a unei statistici variaz de la o selecie la alta, o problem important n statistic este determinarea repartiiei statisticii.
este variabil aleatoare.
# cerin esenial a estimatorului fie , deci
este ca valoarea medie a acestuia s
M ( ) =
3efiniia 1. 6n estimator dac
al parametrului se numete nedeplasat
M ( ) =
. 1 n xi este un estimator nedeplasat al n i =1
Exemplu( )edia de selecie x =
medie teoretice M ( X ) = 1 . ntr.adevr, avem( 1 n 1 n 1 M ( x) = M ( xi ) = M ( xi ) = n 1 = 1 . n i =1 n i =1 n
3efiniia 7. 8irul de statistici
1 , 2 ,. ., n
^ ^ ^
se numete ir consistent de
estimatori pentru , dac(
lim P(| n | < ) = 1 .

n
9eorema ". #ricare ar fi repartiia variabilei aleatoare &, media i dispersia mediei de selecie sunt(
M ( x ) = M ( X ) = ( = 1 )
i respectiv
D 2 ( x) = 1 2 2 D (X ) = . n n
9eorema 1. )edia de selecie conver!e n probabilitate ctre valoarea medie a variabilei aleatoare & a populaiei. 3emonstraie. 3in ine!alitatea lui $eb+ev rezult( D 2 ( x) 2 , P (| x |< ) 1 = 1 2 n 2 de unde rezult( lim P ( | x | < ) = 1
n
deoarece probabilitatea nu poate fi mai mare dec+t ". #bservaie. 3in teorema precedent retult c media de selecie este un estimator consistent pentru parametrul .
1. )etode de estimare a parametrilor.

3intre metodele consacrate de estimare a parametrilor menionm( metoda momentelor/
metoda verosimilitii maxime/ metoda celor mai mici ptrate/ metoda bazat pe intervale de ncredere.
)etoda momentelor
)etoda momentelor, propus de :. earson n ";<", este cea mai veche i tot odat cea mai simpl metod pentru estimarea parametrilor. $onsiderm x1 , x 2 ,..., x n o selecie dintr.o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare & av+nd funcia de frecven (cazul discret) sau densitatea de repartiie (cazul continuu) f ( x; 1 , 2 ,..., k sunt = parametri ce trebuiesc estimai/ 1 , 2 ,..., k ) unde = ( , ,..., ), k 1 notm . 1 2 k )etoda momentelor const n urmtorele( ^
0e calculeaz primele = momente de selecie
j ( j = 1, 2,..., k ) /
1n j j = xi , ( j = 1, 2,..., k ) n i= 1
j i se e!aleaz cu momentele teoretice j = M ( X ), j = 1, 2,..., k , care sunt, n !eneral funcii de parametrii 1 , 2 ,..., k / j M ( X ) = g j (1 , 2 ,..., k ), j =1, 2,..., k . - Estimatorii parametrilor 1 , 2 ,..., k prin metoda momentelor se obin rezolv+nd ecuaiile(
g j ( 1 , 2 ,..., k ) = j , j = 1, 2,..., k ,
dac acestea sunt funcional independente i
j = kj( 1, 2,. , k)
m= = x
2 2
^ ^^ ^
Exemplul ". %ie x1 , x 2 ,..., x n o selecie de volum n dintr.o populaie de medie m i dispersie 2 . rimele dou momente ale populaiei sunt( M ( ) = m = g1 (m , 2 ) / M ( 2 ) = m 2 + 2 = g 2 ( m, 2 ) . Estimaiile parametrilor m i 2 se obin ca soluii ale sistemului( ^ , 1
1n 2 m + = 2 = xi . n i= 1
^
-ezult(
m = 1 = x = h1( 1, 2)
^2 ^ ^
^^
^^
^ ^ 1 1 2 2 = 2 ( 1) = x x = (xi x) = h2( 1 , 2) n i= 1 n i= 1 2 2 i
b +a = g 1 ( a , b) / 2 b 2 + ab + a 2 M ( 2 ) = = g 2 (a , b) / 3 M ( ) =
Exemplul 1. %ie x1 , x 2 ,..., x n o selecie de volum n asupra variabilei aleatoare repartizat uniform pe intervalul (a, b). 2vem(
i ecuaiile care trebuie rezolvate pentru a determina estimatorii pentru a i b sunt(
b+ a / 2 2 ^ b + ab + a 2 . 2= 3
1=
-ezult(
3(n 1) a = 1 3( 2 1 ) = x a n
^ ^ ^ ^2
3(n 1) b = 1+ 3( 2 1 ) = x + s n
^ ^ ^ ^2
unde s 2 este valoarea observat a dispersiei de selecie(
n 1 2 ( 1 )2 = s 2 / n
^ ^
1 n s = ( xi x ) 2 . n 1 i =1
2
)etoda verosimilitii maxime

resupunem c densitatea de probabilitate (n cazul continuu) sau funcia de frecven (n cazul discret) aseleciei x1 , x 2 ,..., x n este( P( x1 , x 2 ,..., x n ; ) = f ( xi , ) .
i =1 n
(")
)etoda verosimilitii maxime const n a considera ca estimaii ale parametrilor, acele valori ale acestora care maximizeaz funcia de verosimilitate maxim (") / funcia (") ca funcie de parametrii poart numele de funcie de verosimilitate. 3eci, valoarea cea mai verosimil pentru parametrul este aceea pentru care P ( x1 , x 2 ,..., x n ; ) este maxim. %ie * o valoare a lui pentru care P ( x1 , x 2 ,..., x n ; ) este maxim/ n !eneral * depinde de x1 , x 2 ,..., x n , adic * = * ( x1 , x 2 ,..., x n ) . 'om elimina valorile lui * care nu depind de x1 , x 2 ,..., x n i vom considera ca estimatori ai lui numai valorile lui * care sunt funcii de x1 , x 2 ,..., x n . )aximul lui P ( x1 , x 2 ,..., x n ; ) are loc are loc n acelai timp cu maximul lui ln P ( x1 , x 2 ,..., x n ; ) . 2tunci funcia de estimaie sau, cu alte cuvinte, estimatorul de verosimilitate maxim * verific ecuaia( n ln P( x1 , x 2 ,..., x n ; ) ln f ( xi , ) = =0 (1) i =1 n cazul n care avem de estimat un sin!ur parametru sistemul de ecuaii se reduce la( n d ln f ( xi , ) = 0. d i =1 Exemple( ". >e propunem s estimm proporia de indivizi, dintr.o populaie, care au o anumit caracteristic. $onsiderm o selecie de n indivizi din aceast populaie i observm numrul de indivizi care au proprietatea respectiv. 2sociem fiecrui individ o variabil aleatoare care poate lua valoarea " sau ? dup cum individul respectiv posed sau nu caracteristica cercetat. %uncia de frecven a variabilei aleatoare este( f ( x, ) = x (1 )1x ; x = 0 ,1 . entru o selecie de n indivizi, observaiile asupra lui vo fi x1 , x 2 ,..., x n , deci(
P ( x1 , x 2 ,..., x n ; ) = i =1 (1 ) -ezult c(
n i =1
xi
xi .
i =1
ln P( x1 , x 2 ,..., x n ; ) = xi ln + ( n xi ) ln(1 )
i =1
i
n ln P 1 n 1 = xi (n xi ) . i =1 1 i =1 3in
rezult(
ln P =0
1n = xi . n i= 1
^
#bservaie( 3eoarece(
1 M ( ) = n M ( ) = n
^
1 n 2 1 2 (1 ) , D ( ) = 2 D ( ) = 2 n D ( ) = n n i= 1 n ^ 1 n rezult c = xi este un estimator nedlasat pentru , proporia indivizilor n i= 1

2 ^
care posed caracteristica respectiv. 1. >e propunem s estimm parametrul al repartiiei oisson, in+nd deci seama de faptul c( k P ( x ; ) = e , k = 0 , 1, 2 ,... pe baza unei selecii repetate robabilitatea ca s avem( 1 , 2 ,..., n . 1 = x1 , 2 = x 2 , ..., n = x n , valorile x1 , x 2 ,..., x n fiind ntre!i nene!ativi este(
P ( x1 , x 2 ,..., x n ; ) = e n
k!
xi
i =1
xi !
i =1
3in ecuaia verosimilitii maxime(

ln P ( x1 , x 2 ,..., x n ; ) =0 rezult (
1 n n + xi = 0 , i =1 deci estimatorul parametrului este(
1n = xi . n i= 1
^
7. %ie x1 , x 2 ,..., x n o selecie de volum n dintr.o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare av+nd o repartiie >(m, 2 ) / m i 2 sunt parametrii necunoscui ce urmeaz a fi estimai. %uncia de verosimilitate este(
n
P ( x1 , x 2 ,..., x n ; m , 2 ) =
deci
1 (2 )
n/2
1 2
2
( xi m ) 2
i =1
,
n
n n 1 ln P ( x1 , x 2 ,..., x n ; m , ) = ln(2 ) ln 2 2 2 2 2 0istemul de ecuaii de verosimilitate maxim este( ln P 1 n = 2 ( x i m) = 0 / m i =1 n ln P n 1 = + ( x i m) 2 = 0 / 2 2 2 2( 2 ) 2 i =1 care furnizeaz soluia(
2
( x
i =1
m) 2 .
1n m = xi / n i= 1 ^2 1 n 1n 2 = ( xi xi ) . n i= 1 n i= 1
^
3eoarece
1 n 1 n 1 M (m} = M ( xi ) = M ( xi ) = nM ( ) = m n i=1 n i=1 n

^
rezult c
m
^2
este un estimator nedeplasat pentru m.
n continuare avem(
1n 2 1 n 2 1n 2 1 n 2 M ( ) = M ( xi 2 ( xi ) ) = M ( xi ) 2 M ( xi ) , n i= 1 n i= 1 n i= 1 n i= 1
dar M( 1 n 2 1 n 1 n 2 x ) = M ( x ) = M ( 2 ) = M ( 2 ) , i n i n i =1 n i =1 i =1
iar n baza faptului c x1 , x 2 ,..., x n sunt independente i repartizate la fel ca , rezult(
1n 1 n M ( xi ) = 2 M ( xi2 + 2 xi x j ) = n i= 1 n i= 1 i, j = 1
i j
1 n(n 1) 1 [ M ( xi2 ) + 2 M ( xi ) M ( x j )] = 2 nM ( 2 ) + n(n 1) M 2 ( ) . 2 2 n i =1 n 2adar avem(

n
1 n 1 n 1 M ( ) = M ( 2 ) [ M ( 2 ) + M 2 ( )] = [M ( 2 ) M 2 ( )] = n n n
^2
n 1 2 , n
ceea ce arat faptul c

2 .
nu este un estimator nedeplasat pentru parametrul
)etoda celor mai mici ptrate ca metod de estimare a parametrilor

%ie 1 , 2 ,..., n variabile aleatoare necorelate cu dispersiile constante 2 2 2 cunoscute 1 , 2 ,..., n ale cror medii mi (1 , 2 ,..., k ) , 1 i n depind de = parametrii, funciile mi fiind cunoscute. )etoda celor mai mici ptrate const n determinarea unor estimatori ai parametrilor 1 , 2 ,..., k din condiia de minimizare a sumei ptratelor abaterilor standard ale variabilelor aleatoare de la valorile medii respective, adic( n ( m ) 2 F (1 , 2 ,..., k ) = i 2 i minim.
i =1
>e limitm la a prezenta cazul n care mediile variabilelor aleatoare sunt funcii liniare de parametri, deci(
mi (1 , 2 ,..., k ) = aij j = a i11 + a i 2 2 + ... + a ik k , 1 i n
k j =1
unde ai@ sunt constante cunoscute, j sunt parametrii necunoscui, iar dispersiile sunt e!ale( 2 2 12 = 2 = ... = n = 2 (necunoscut), prin urmare, funcia care se minimizeaz este( F (1 , 2 ,..., k ) = ( i ai11 a i 2 2 ... a ik k ) 2 minim.
i =1 n
F = 0 , (1 j k ) , j
entru a determina punctul (punctele) de minim punem condiia ca(
adic( 2 ( i ai11 ai 2 2 ... aik k ) aij = 0, 1 j k

i =1 n
sau
a1 j (1 ai11 a i 22 ... aik k ) + a 2 j (2 a 211 a i 22 ... a 2 k k ) + + a nj (n a n11 a n 22 ... a nk k ) = 0 , 1 j k .
0istemul de mai sus devine( unde am notat(
Q j b j11 b j 22 ... b jk k = 0 , 1 j k
(7)
Q j = a1 j 1 + a 2 j 2 + ... + a nj n /
b ji = a1 j a1i + a 2 j a 2i + ... + a nj a ni / 1 i k .
0istemul de ecuaii (7) este deseori numit sistemul ecuaiilor normale i
admite cel puin o soluie
1 , 2 , . ., k
^ ^
0punem c funcia liniar parametric( ' = l11 + l 22 + ... + l k k unde l1 , l 2 ,..., l k sunt coeficieni cunoscui este estimabil dac exist un estimator nedeplasat pentru . 3ac este estimabil, estimatorul su nedeplasat de minim dispersie este dat de(
= l1 1+ l2 2+ . + lk k
^
^ ^ ^ ^
3eoarece fiecare
^ j
este funcie liniar de Q1 , Q2 ,..., Qk
= 1 Q1 + 2 Q2 + ... + k Qk
rezult c
D ( ) = (l1 1 + l2 2 + ... + lk k ) 2 .
2
)etoda de estimare a parametrilor cu a@utorul intervalelor de ncredere

%ie x1 , x 2 ,..., x n valorile de selecie pentru o variabil aleatoare cu repartiia F ( x , ) , sau, n mod echivalent, cu densitatea de probabilitate f ( x , ) , fiind parametrul necunoscut ce trebuie estimat. %ie de asemenea 1 statistici, I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) cu proprietatea c I < S , astfel nc+t probabilitatea ine!alitii (A) I ( x1 , x 2 ,..., x n ) S ( x1 , x 2 ,..., x n ) s nu depind de , adic(
P({
( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) =
unde nu depinde de . 3ac numrul este foarte apropiat de ", atunci ine!alitatea (A) este ndeplinit n ma@oritatea cazurilor.$um ns este cuprins ntre I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) , rezult c am !sit un interval care acoper pe cu o probabilitate , apropiat de ". $u c+t acest interval este mai mic i probabilitatea este mai mare, cu at+t avem o indicaie mai precis cu privire la valoarea lui . 3ac I i S sunt astfel nc+t pentru un dat, 0 < < 1 , s avem(
P({
( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) = 1
(B)
atunci (I , S ) se numete 4interval de ncredere, pentru parametrul . -elaia (B) trebuie citit astfel( 4cu probabilitatea 1 intervalul (I , S ) acoper adevrata valoare a parametrului , i nu 4probabilitatea ca s se !seasc n intervalul (I , S ) este 1 ,, deoarece parametrul este fix, fiind un numr real (de cele mai multe ori pozitiv) i nu o variabil aleatoare. 5ntervalul de ncredere este o variabil aleatoare/ valoarea 1 se numete 4coeficient de ncredere,, iar expresia S ( x1 , x 2 ,..., x n ) I ( x1 , x 2 ,..., x n ) este 4lun!imea intervalului de ncredere,. 5ntervalele de ncredere pot fi determinate n urmtoarele dou cazuri( a). resupunem c exist o funcie g ( x1 , x 2 ,..., x n ;) aa nc+t probabilitatea ca s avem( a g ( x1 , x 2 ,..., x n ;) b nu depinde de . 0e pot !si atunci dou numere a () i b() care depind de aa nc+t P ( a ( ) g ( x1 , x 2 ,..., x n ; ) b( )) = unde ale!em pe c+t mai apropiat de ". n ipoteza c funcia g ( x1 , x 2 ,..., x n ;) este o funcie strict monoton n raport cu (pentru precizarea lucrurilor vom considera funcia strict cresctoare raport cu ) exist o valoare unic A( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( a () g ( x1 , x 2 ,..., x n ; ) A( x1 , x 2 ,..., x n ; ) s fie echivalente i de asemenea o valoare unic B ( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( g ( x1 , x 2 ,..., x n ;) b( ) B ( x1 , x 2 ,..., x n ; ) s fie evchivalente. -ezult atunci c ine!alitile( a ( ) g ( x1 , x 2 ,..., x n ;) b( ) sunt echivalente cu ine!alitile( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) . 2tunci putem scrie(
prin urmare am determinat un interval de ncredere C2, DE pentru . b). resupunem c g ( x1 , x 2 ,..., x n ) este o statistic a crei funcie de repartiie este cunoscut (notat H ( x, ) ) i c acest funcie de repartiie admite o densitate de probabilitate continu (notat h( x, ) ). %ie r i s dou numere pozitive aa nc+t r F s G" i a1 ( ; ) , b1 ( ; ) dou funcii de i pentru care au loc relaiile(
a1 ( , )
P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) =
h ( x ,) dx = r (1 )
a
b
(H) (I)
b1 (, )
h ( x , ) dx = s (1 )
(;)
3ac Ca, bE este intervalul valorilor funciei g ( x1 , x 2 ,..., x n ) avem(
h( x,) dx =1 .
a
3in (H), (I), (;) rezult(

b1 ( , ) a1 ( , )
h ( x, ) dx = .
(<)
2rtm c dac funciile a1 ( ; ) i b1 ( ; ) sunt respectiv descresctoare i cresctoare n raport cu , se poate construi un interval de ncredere pentru . ntr.adevr, n baza relaiei (<) putem scrie( P ( a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , )) = , deci probabilitatea ine!alitii( a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , ) ("?) nu depinde de . %uncia a1 ( ; ) fiind descresctoare n raport cu , exist, analo! ca n cazul a), un numr A( x1 , x 2 ,..., x n ; ) astfel c ine!alitile( A( x1 , x 2 ,..., x n ; ) a1 ( , ) g ( x1 , x 2 ,..., x n ) s fie echivalente i la fel, funcia b1 ( ; ) fiind cresctoare n raport cu , exist un numr B ( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( B ( x1 , x 2 ,..., x n ; ) g ( x1 , x 2 ,..., x n ;) b1 ( , ) s fie echivalente. -ezult atunci c ine!alitatea ("?) este echivalent cu ine!alitatea( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) i prin urmare P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) = , ceea ce exprim faptul c am determinat intervalul de ncredere C2, DE pentru parametrul . Exemple( (i). $azul repartiiei normale >(m, ").
n acest caz densitatea de probabilitate este( ( x m ) 2 1 f ( x; m) = e 2 . 2 1 n x m $onsiderm statistica unde x = xi . n n i =1 'om demonstra c aceast statistic aparine clasei N (0 , ce rezult din teorema urmtoare. 9eorema 7. 3ac repartiia teoretic are media media i dispersia mediei de selecie
x
1 ) , afirmaie n
m i dispersia 2 , atunci 2 sunt respectiv m i .

n
3emonstraie. n 1 1 n 1 M ( x) = M ( xi ) = M ( xi ) = nm = m / n n i =1 n i =1 n n 1 1 M ( x m) 2 = M ( xi m) 2 = 2 M [ ( xi m)] 2 = n i =1 n i =1 2 n 1 = 2 M ( ( x i m) 2 = . n n i =1 2m folosit faptul c n cazul seleciilor repetate variabilele aleatoare , 1 2 ,..., n sunt independente i au aceeai repartiie cu variabila aleatoare (caracteristica studiat). 0tatistica considerat este descresctoare n raport cu m i repartiia ei nu depinde de m , prin urmare, suntem n condiiile cazului a), deci putem construe un interval de ncredere pentru parametrul m . 2vem relaia( n x b x m n 2 P ( ) = e dx . n 2 utem ale!e numerele i astfel nc+t s aib loc e!alitatea( n x n ("") e 2 = , 2 fiind un numr apropiat de ", de unde rezult c(
2 2 2 2
P (
x m n
) =
sau
P ( x n m x n ) = . 2m construit astfel intervalul de ncredere
[ x n , x n ]
pentru parametrul m. #bservm c se pot obine o infinitate de intervale de ncredere pentru parametrul m, toate cu aceeai probabilitate , deoarece numerele i verific o sin!ur condiie (""). entru ale!erea intervalului cel mai convenabil exist criterii asimptotice n teoria testelor de verificare a ipotezelor. (ii). $azul repartiiei normale >(?,
).
3ensitatea de probabilitate este, n acest caz( . 2 $onsiderm statistica( 2 2 x12 + x 2 + ... + x n 2 care aparine clasei J(n ,"), dup cum rezult din teorema urmtoare( 9eorema A. 3ac variabilele aleatoare independente 1 ,..., s aparin 2 2 clasei >(?, ), atunci variabila = 1 + ... + s aparine clasei J(s , ). 3emonstraie. 3eterminm, pentru nceput, funcia caracteristic a 2 variabilei j , 1 j s . 2vem pentru x ?( e
P ( < x) = P ( x < j < x ) =
2 j
f ( x; ) =
x2 2 2
y2 2 2
dy =
e
0
y2 2 2
dy .
x
2 d 1 P ( j2 < x) = e 2 . dx 2 x %uncia caracteristic a variabilei aleatoare j este(
dx . 2 0 3ezvoltm n serie de puteri pe e xti deci avem(

e xti = 1 +
M (e
2 j ti
)=
xti e x
1 2
x 2 2
xti ( xti ) 2 ( xti ) n + + ... + + ... 1! 2! n!

( p) ap
1 2
i in+nd seama c pentru a K ? avem(
x
0
p 1
e ax dx =
rezult c( deci funcia caracteristic a variabilei este(

(t ) = M (e
j =1 s
M (e
2 j ti
) = (1 2 2 ti )
2 j ti
) = (1 2 2 ti )
s 2
adic funcia caracteristic a repartiiei J(s , ). 9eorema este demonstrat. 0tatistica considerat este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n cazul a), deci putem construi un interval de ncredere pentru parametrul . 2vem relaia( n x 2 2 1 x12 + x 2 + ... + x n 1 2 2 P ( ) = n x e dx . 2 n 2 2 ( ) 2
2le!em numerele i astfel nc+t( n x 1 1 x 2 e 2 dx = , n 2 n ( ) 2 fiind un numr apropiat de ". -ezult deci c( 2 2 x12 + x2 + ... + x n P( ) = 2 sau
P(
xi2
i =1
ceea ce nseamn c am determinat o infinitate de intervale de ncredere pentru parametrul , toate cu aceeai probabilitate .
(iii). $azul repartiiei normale >(m,
x
i =1
2 i
)=
).
3ensitatea de probabilitate n acest caz este(
f ( x; m, ) =
( x m ) 2 2 2
3eterminm intervale de ncredere pentru parametrul m. $onsiderm statistica(

n 1 x m
unde(
x1 + x 2 + ... + x n ( x x) 2 + ... + ( x n x) 2 , 2 = 1 . n n 0tatistica considerat aparine clasei 0(n.") i repartiia ei nu depinde de . 2ceste afirmaii rezult din urmtoarele dou teoreme. 9eorema B. n cazul seleciilor repetate de volum n pentru o caracteristic normal N ( m , ) sunt adevrate afirmaiile( ) . (i). )edia de selecie x aparine clasei N ( m , x=
(ii). 'ariabilele i 2 (momentul centrat de selecie de ordinul doi) sunt independente i n 2 aparin clasei H ( n 1, ) . (iii). 3ensitatea de probabilitate a variabilei = 2 este(
x e , x 0. n 1 2 ( ) 2 3emonstraie. 2firmaia (i) a fost demonstrat. entru a demonstra (ii) putem presupune m G ? , deoarece momentul de selecie 2 este invariabil la o schimbare a ori!inii. Este cunoscut c(
n 1 2 n 1
f ( x) =
2n
n 1 2
n 2
nx 2 2
( x1 x) 2 + ... + ( x n x) 2 1 n = ( xi x ) 2 . n n i =1 2vem identitile( n n 1 n ( xi x) 2 = xi2 ( xi ) 2 n i =1 i =1 i =1
2 =
i
i n 1 n2 1 , 2 i=2 i =3 ( xi x) = ( x1 ) + ( x2 ) 2 + ... + ( x n 1 x n ) 2 n n 1 n 1 n2 2 i =1 de unde rezult( n i 2
x
n
x
n
xi . 1 n n 1 n2 1 2 2 2 2 i=2 i =3 x = ( x ) + ( x ) + ( x ) + ... + ( x x ) i 1 2 n 1 n n i =1 n n 1 n 1 n2 2 i =1 n membrul al doilea al e!alitii ultime avem o sum de n forme patratice pozitiv definite, fiecare av+nd ran!ul e!al cu ". 3eoarece suma ran!urilor acestor forma ptratice pozitiv definite este e!al cu n iar variabilele x k , 1 k n aparin clasei N (0 , ) , variabilele(
n 2 i
xi
1 =
xi n 1 , i =2 ( x1 ) n n 1 xi n2 , i =3 ( x2 ) n 1 n2
1 ( x n 1 x n ) , 2
n n
2 =
....................................
1
n 1 =
xi n i =1 sunt independente. 3in faptul c( 2 + 22 + ... + n21 2 = i n rezult independena variabilelor x i 2 . entru a demonstra (iii) observm c( M (k ) = 0 i D 2 ( k ) = 2 , 1 k n , deci variabila aleatoare n 2 aparine clasei H ( n 1, ) i funcia de repartiie a variabilei = 2 va fi(
n =
t e dt , x 0 . n 0 2 ( ) 2 3eriv+nd n raport cu x obinem densitatea de probabilitate a lui . 9eorema H. n cazul seleciilor repetate de volum n pentru o caracteristic normal variabila
P ( < x) = P (n 2 < nx ) =
2 n 1 2 2 2 n 1
nx 2
n 3 2
= n 1
aparine clasei 0(n."). 0tatistica fiind descresctoare n raport cu m suntem n condiiile cazului a), prin urmare avem( n ( ) n x m x 2 2 2 P( n 1 ) = ( 1 + ) n 1 dx . n 1 2 (n 1)( ) 2 2le!em numerele i astfel ca n ( ) n x 2 2 2 ( 1 + ) n 1 dx = , n 1 (n 1)( ) 2 fiind un numr apropiat de ". -ezult deci c(
P ( n 1 x m
) =
sau
P( x
2 m x 2 ) = . n 1 n 1
utem obine o infinitate de intervale de ncredere pentru parametrul m, toate cu probabilitatea . 2ceste intervale sunt determinate oricare ar fi valoarea lui , care este deci un parametru inutil. 3eterminm acum un interval de ncredere pentru . $onsiderm statistica ( x1 x) 2 + ... + ( x n x) 2 2 care aparine clasei J(n L", ")/ statistica este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n condiiile cazului a), aadar putem construi un interval de ncredere pentru parametrul . 2vem relaia(
n 1 2 ( ) 2 2le!em numerele i astfel nc+t( n 3 x 1 2 2 x e dx = n 1 n 1 2 2 ( ) 2

sau
P(
P (
(x
i =1
x) 2 ) =
n 1 2
n 3 2
e dx .
x 2
1 n 1 n 2 ( x x ) ( xi x ) 2 = . i i =1 i =1 #binem i de aceast dat o infinitate de inervale de ncredere pentru parametrul , care se pot determina oricare ar fi valoarea lui m/ parametrul m este, n acest caz, un parametru inutil.

Elemente de Teoria Estimaţiei

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Elemente de Teoria Estimaţiei

Încărcat de

Drepturi de autor:

Formate disponibile

Elemente de teoria estimaiei

. este o funcie de valorile de selecie

este aadar o variabil aleatoare.

1n r a). 0tatistica r = xi se numete moment de selectie de ordinul r. n i= 1

)omentul de selectie de ordinul nt+i

este aa.numita medie de selecie.

1n ^ r b). 0tatistica = ( xi 1 ) se numete moment centrat de selectie de r n i= 1

este variabil aleatoare.

# cerin esenial a estimatorului fie , deci

este ca valoarea medie a acestuia s

3efiniia 1. 6n estimator dac

al parametrului se numete nedeplasat

. 1 n xi este un estimator nedeplasat al n i =1

Exemplu( )edia de selecie x =

medie teoretice M ( X ) = 1 . ntr.adevr, avem( 1 n 1 n 1 M ( x) = M ( xi ) = M ( xi ) = n 1 = 1 . n i =1 n i =1 n

3efiniia 7. 8irul de statistici

estimatori pentru , dac(

lim P(| n | < ) = 1 .

1. )etode de estimare a parametrilor.

0e calculeaz primele = momente de selecie

i ecuaiile care trebuie rezolvate pentru a determina estimatorii pentru a i b sunt(

unde s 2 este valoarea observat a dispersiei de selecie(

)etoda verosimilitii maxime

1 n 2 1 2 (1 ) , D ( ) = 2 D ( ) = 2 n D ( ) = n n i= 1 n ^ 1 n rezult c = xi este un estimator nedlasat pentru , proporia indivizilor n i= 1

3in ecuaia verosimilitii maxime(

1 n n + xi = 0 , i =1 deci estimatorul parametrului este(

1 n 1 n 1 M (m} = M ( xi ) = M ( xi ) = nM ( ) = m n i=1 n i=1 n

este un estimator nedeplasat pentru m.

iar n baza faptului c x1 , x 2 ,..., x n sunt independente i repartizate la fel ca , rezult(

1 n(n 1) 1 [ M ( xi2 ) + 2 M ( xi ) M ( x j )] = 2 nM ( 2 ) + n(n 1) M 2 ( ) . 2 2 n i =1 n 2adar avem(

ceea ce arat faptul c

nu este un estimator nedeplasat pentru parametrul

)etoda celor mai mici ptrate ca metod de estimare a parametrilor

entru a determina punctul (punctele) de minim punem condiia ca(

adic( 2 ( i ai11 ai 2 2 ... aik k ) aij = 0, 1 j k

a1 j (1 ai11 a i 22 ... aik k ) + a 2 j (2 a 211 a i 22 ... a 2 k k ) + + a nj (n a n11 a n 22 ... a nk k ) = 0 , 1 j k .

0istemul de mai sus devine( unde am notat(

0istemul de ecuaii (7) este deseori numit sistemul ecuaiilor normale i

admite cel puin o soluie

este funcie liniar de Q1 , Q2 ,..., Qk

)etoda de estimare a parametrilor cu a@utorul intervalelor de ncredere

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) =

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) = 1

3ac Ca, bE este intervalul valorilor funciei g ( x1 , x 2 ,..., x n ) avem(

3in (H), (I), (;) rezult(

m i dispersia 2 , atunci 2 sunt respectiv m i .

2 d 1 P ( j2 < x) = e 2 . dx 2 x %uncia caracteristic a variabilei aleatoare j este(

dx . 2 0 3ezvoltm n serie de puteri pe e xti deci avem(

xti ( xti ) 2 ( xti ) n + + ... + + ... 1! 2! n!

i in+nd seama c pentru a K ? avem(

rezult c( deci funcia caracteristic a variabilei este(

3ensitatea de probabilitate n acest caz este(

3eterminm intervale de ncredere pentru parametrul m. $onsiderm statistica(

( x1 x) 2 + ... + ( x n x) 2 1 n = ( xi x ) 2 . n n i =1 2vem identitile( n n 1 n ( xi x) 2 = xi2 ( xi ) 2 n i =1 i =1 i =1

n 1 2 ( ) 2 2le!em numerele i astfel nc+t( n 3 x 1 2 2 x e dx = n 1 n 1 2 2 ( ) 2

S-ar putea să vă placă și