Sunteți pe pagina 1din 17

Elemente de teoria estimaiei

n multe aplicaii ale statisticii matematice, n tehnic sau tiinele experimentale, exist motivaia teoretic pentru a admite c repartiia variabilei (ce exprim o caracteristic a unei populaii statistice ce se studiaz) este o funcie cunoscut, n care intervin parametri cu valori necunoscute. entru finalizarea aplicaiilor practice, este necesar s se cunoasc repartiia exact, deci trebuie s fie determinate (estimate) valorile parametrilor respectivi, pentru ca le!ea de repartiie s fie complet specificat. ". #biectul teoria estimaiei. $onceptul de estimator. %ie & o variabil aleatoare cu densitatea de probabilitate f ( x ; ) i
x1 , x 2 , ..., x n un eantion de volum n asupra lui &.

resupunem c se cunoate natura repartiiei statistice a unei anumite caracteristici i ne intereseaz care sunt valorile efective ale parametrului n cazul analizat (eventual ale parametrilor n cazul n care sunt mai muli parametri). 'alorile lor adevrate nuse vor cunoate, dar se pot afla estimaii ale lor din datele x1 , x 2 , ..., x n de care dispunem( (parametrul) estimaia (funcie de x1 , x 2 , ..., x n ). )etodele de estimare a parametrilor repartiiilor statistice au drept obiect cutarea unor estimatori * c+t mai buni , , care s implice o form convenabil de calcul (rapiditate de calcul), s necesite un numr c+t mai mic de observaii (din cauza costurilor corespunztoare experimentrii) i care s fie c+t mai apropiat de adevrata valoare a parametrului estimat, deci care s permot concluzionri valide. -ezult de aici c un estimator al parametrului necunoscut al repartiiei F ( x ; ) . notat

. este o funcie de valorile de selecie

= g n ( x1 , x2 ,..., xn )
cu anumite proprieti/ # funcie de valorile de selecie o vom numi statistic. Este clar c valorile statisticii g n trebuie s nu depind de . Exemple de statistici

este aadar o variabil aleatoare.

1n r a). 0tatistica r = xi se numete moment de selectie de ordinul r. n i= 1


^

)omentul de selectie de ordinul nt+i

1n 1 = xi = x n i= 1
^

este aa.numita medie de selecie.

1n ^ r b). 0tatistica = ( xi 1 ) se numete moment centrat de selectie de r n i= 1


^
ordinul r. )omentul centrat de selectie de ordinul 1

1n ^ 2 2 = ( xi 1 ) n i= 1
^
se numete dispersie de selecie. utem astfel s definim un estimator ca fiind o funcie g n ( x1 , x 2 ,..., x n ) , unde x1 , x 2 ,..., x n sunt observaiile asupra variabilei & cu repartiia F ( x ; ) , care nu depinde de . )ai exact vorbind, dac f ( x1 , x 2 ,..., x n ) este o funcie de observaiile de selecie i dac
f ( x1 , x 2 ,..., x n )

A ,
n

adic f ( x1 , x 2 ,..., x n ) conver!e n probabilitate ctre 2, atunci f ( x1 , x 2 ,..., x n ) reprezint un estimator al valorii necunoscute 2. 3efiniia ". Estimatorul f ( x1 , x 2 ,..., x n ) al lui 2 se numete absolut corect, dac(
M ( f ( x1 , x 2 ,..., x n )) = A

i
D 2 ( f ( x1 , x 2 ,..., x n )) 0 .
n

3ac M ( f ( x1 , x 2 ,..., x n )) = A + B (n) i B(n) 0 c+nd estimatorul f ( x1 , x 2 ,..., x n ) se numete corect. #bservaie( n ambele cazuri are loc(
f ( x1 , x 2 ,..., x n )

n ,

A .
n

$+t de 4bun, sau c+t de 4slab, este acest estimator, n sensul *apropierii, respectiv *deprtrii, de valoarea real a parametrului vom vedea n cele ce urmeaz. -emarcm faptul c observaiile asupra variabilei & sunt aleatoare, deci rezultatul unei analize statistice . sintetizat n g n . este i el aleator. n mod natural g n ( x1 , x 2 ,..., x n ) nu va coincide cu valoarea lui / la o alt ' ' ' experien, se vor obine alte realizri x1 , x 2 ,..., x n care vor furniza alt valoare pentru statistica g n , deci o alt valoare a estimatorului. 5at motivaia afirmaiei c

3eoarece valoarea observat a unei statistici variaz de la o selecie la alta, o problem important n statistic este determinarea repartiiei statisticii.

este variabil aleatoare.

# cerin esenial a estimatorului fie , deci

este ca valoarea medie a acestuia s

M ( ) =

3efiniia 1. 6n estimator dac

al parametrului se numete nedeplasat

M ( ) =

. 1 n xi este un estimator nedeplasat al n i =1

Exemplu( )edia de selecie x =

medie teoretice M ( X ) = 1 . ntr.adevr, avem( 1 n 1 n 1 M ( x) = M ( xi ) = M ( xi ) = n 1 = 1 . n i =1 n i =1 n

3efiniia 7. 8irul de statistici

1 , 2 ,. ., n

^ ^ ^

se numete ir consistent de

estimatori pentru , dac(

lim P(| n | < ) = 1 .


n

9eorema ". #ricare ar fi repartiia variabilei aleatoare &, media i dispersia mediei de selecie sunt(
M ( x ) = M ( X ) = ( = 1 )

i respectiv
D 2 ( x) = 1 2 2 D (X ) = . n n

9eorema 1. )edia de selecie conver!e n probabilitate ctre valoarea medie a variabilei aleatoare & a populaiei. 3emonstraie. 3in ine!alitatea lui $eb+ev rezult( D 2 ( x) 2 , P (| x |< ) 1 = 1 2 n 2 de unde rezult( lim P ( | x | < ) = 1
n

deoarece probabilitatea nu poate fi mai mare dec+t ". #bservaie. 3in teorema precedent retult c media de selecie este un estimator consistent pentru parametrul .

1. )etode de estimare a parametrilor.


3intre metodele consacrate de estimare a parametrilor menionm( metoda momentelor/

metoda verosimilitii maxime/ metoda celor mai mici ptrate/ metoda bazat pe intervale de ncredere.

)etoda momentelor
)etoda momentelor, propus de :. earson n ";<", este cea mai veche i tot odat cea mai simpl metod pentru estimarea parametrilor. $onsiderm x1 , x 2 ,..., x n o selecie dintr.o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare & av+nd funcia de frecven (cazul discret) sau densitatea de repartiie (cazul continuu) f ( x; 1 , 2 ,..., k sunt = parametri ce trebuiesc estimai/ 1 , 2 ,..., k ) unde = ( , ,..., ), k 1 notm . 1 2 k )etoda momentelor const n urmtorele( ^

0e calculeaz primele = momente de selecie

j ( j = 1, 2,..., k ) /

1n j j = xi , ( j = 1, 2,..., k ) n i= 1
j i se e!aleaz cu momentele teoretice j = M ( X ), j = 1, 2,..., k , care sunt, n !eneral funcii de parametrii 1 , 2 ,..., k / j M ( X ) = g j (1 , 2 ,..., k ), j =1, 2,..., k . - Estimatorii parametrilor 1 , 2 ,..., k prin metoda momentelor se obin rezolv+nd ecuaiile(

g j ( 1 , 2 ,..., k ) = j , j = 1, 2,..., k ,
dac acestea sunt funcional independente i

j = kj( 1, 2,. , k)
m= = x
2 2

^ ^^ ^

Exemplul ". %ie x1 , x 2 ,..., x n o selecie de volum n dintr.o populaie de medie m i dispersie 2 . rimele dou momente ale populaiei sunt( M ( ) = m = g1 (m , 2 ) / M ( 2 ) = m 2 + 2 = g 2 ( m, 2 ) . Estimaiile parametrilor m i 2 se obin ca soluii ale sistemului( ^ , 1

1n 2 m + = 2 = xi . n i= 1
^

-ezult(

m = 1 = x = h1( 1, 2)
^2 ^ ^

^^

^^

^ ^ 1 1 2 2 = 2 ( 1) = x x = (xi x) = h2( 1 , 2) n i= 1 n i= 1 2 2 i
b +a = g 1 ( a , b) / 2 b 2 + ab + a 2 M ( 2 ) = = g 2 (a , b) / 3 M ( ) =

Exemplul 1. %ie x1 , x 2 ,..., x n o selecie de volum n asupra variabilei aleatoare repartizat uniform pe intervalul (a, b). 2vem(

i ecuaiile care trebuie rezolvate pentru a determina estimatorii pentru a i b sunt(

b+ a / 2 2 ^ b + ab + a 2 . 2= 3

1=

-ezult(

3(n 1) a = 1 3( 2 1 ) = x a n
^ ^ ^ ^2

3(n 1) b = 1+ 3( 2 1 ) = x + s n
^ ^ ^ ^2

unde s 2 este valoarea observat a dispersiei de selecie(

n 1 2 ( 1 )2 = s 2 / n
^ ^
1 n s = ( xi x ) 2 . n 1 i =1
2

)etoda verosimilitii maxime


resupunem c densitatea de probabilitate (n cazul continuu) sau funcia de frecven (n cazul discret) aseleciei x1 , x 2 ,..., x n este( P( x1 , x 2 ,..., x n ; ) = f ( xi , ) .
i =1 n

(")

)etoda verosimilitii maxime const n a considera ca estimaii ale parametrilor, acele valori ale acestora care maximizeaz funcia de verosimilitate maxim (") / funcia (") ca funcie de parametrii poart numele de funcie de verosimilitate. 3eci, valoarea cea mai verosimil pentru parametrul este aceea pentru care P ( x1 , x 2 ,..., x n ; ) este maxim. %ie * o valoare a lui pentru care P ( x1 , x 2 ,..., x n ; ) este maxim/ n !eneral * depinde de x1 , x 2 ,..., x n , adic * = * ( x1 , x 2 ,..., x n ) . 'om elimina valorile lui * care nu depind de x1 , x 2 ,..., x n i vom considera ca estimatori ai lui numai valorile lui * care sunt funcii de x1 , x 2 ,..., x n . )aximul lui P ( x1 , x 2 ,..., x n ; ) are loc are loc n acelai timp cu maximul lui ln P ( x1 , x 2 ,..., x n ; ) . 2tunci funcia de estimaie sau, cu alte cuvinte, estimatorul de verosimilitate maxim * verific ecuaia( n ln P( x1 , x 2 ,..., x n ; ) ln f ( xi , ) = =0 (1) i =1 n cazul n care avem de estimat un sin!ur parametru sistemul de ecuaii se reduce la( n d ln f ( xi , ) = 0. d i =1 Exemple( ". >e propunem s estimm proporia de indivizi, dintr.o populaie, care au o anumit caracteristic. $onsiderm o selecie de n indivizi din aceast populaie i observm numrul de indivizi care au proprietatea respectiv. 2sociem fiecrui individ o variabil aleatoare care poate lua valoarea " sau ? dup cum individul respectiv posed sau nu caracteristica cercetat. %uncia de frecven a variabilei aleatoare este( f ( x, ) = x (1 )1x ; x = 0 ,1 . entru o selecie de n indivizi, observaiile asupra lui vo fi x1 , x 2 ,..., x n , deci(

P ( x1 , x 2 ,..., x n ; ) = i =1 (1 ) -ezult c(
n i =1

xi

xi .
i =1

ln P( x1 , x 2 ,..., x n ; ) = xi ln + ( n xi ) ln(1 )
i =1

i
n ln P 1 n 1 = xi (n xi ) . i =1 1 i =1 3in

rezult(

ln P =0

1n = xi . n i= 1
^

#bservaie( 3eoarece(

1 M ( ) = n M ( ) = n
^

1 n 2 1 2 (1 ) , D ( ) = 2 D ( ) = 2 n D ( ) = n n i= 1 n ^ 1 n rezult c = xi este un estimator nedlasat pentru , proporia indivizilor n i= 1


2 ^

care posed caracteristica respectiv. 1. >e propunem s estimm parametrul al repartiiei oisson, in+nd deci seama de faptul c( k P ( x ; ) = e , k = 0 , 1, 2 ,... pe baza unei selecii repetate robabilitatea ca s avem( 1 , 2 ,..., n . 1 = x1 , 2 = x 2 , ..., n = x n , valorile x1 , x 2 ,..., x n fiind ntre!i nene!ativi este(
P ( x1 , x 2 ,..., x n ; ) = e n
k!

xi
i =1

xi !
i =1

3in ecuaia verosimilitii maxime(


ln P ( x1 , x 2 ,..., x n ; ) =0 rezult (

1 n n + xi = 0 , i =1 deci estimatorul parametrului este(

1n = xi . n i= 1
^

7. %ie x1 , x 2 ,..., x n o selecie de volum n dintr.o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare av+nd o repartiie >(m, 2 ) / m i 2 sunt parametrii necunoscui ce urmeaz a fi estimai. %uncia de verosimilitate este(
n

P ( x1 , x 2 ,..., x n ; m , 2 ) =
deci

1 (2 )
n/2

1 2
2

( xi m ) 2
i =1

,
n

n n 1 ln P ( x1 , x 2 ,..., x n ; m , ) = ln(2 ) ln 2 2 2 2 2 0istemul de ecuaii de verosimilitate maxim este( ln P 1 n = 2 ( x i m) = 0 / m i =1 n ln P n 1 = + ( x i m) 2 = 0 / 2 2 2 2( 2 ) 2 i =1 care furnizeaz soluia(
2

( x
i =1

m) 2 .

1n m = xi / n i= 1 ^2 1 n 1n 2 = ( xi xi ) . n i= 1 n i= 1
^

3eoarece

1 n 1 n 1 M (m} = M ( xi ) = M ( xi ) = nM ( ) = m n i=1 n i=1 n


^

rezult c

m
^2

este un estimator nedeplasat pentru m.

n continuare avem(

1n 2 1 n 2 1n 2 1 n 2 M ( ) = M ( xi 2 ( xi ) ) = M ( xi ) 2 M ( xi ) , n i= 1 n i= 1 n i= 1 n i= 1
dar M( 1 n 2 1 n 1 n 2 x ) = M ( x ) = M ( 2 ) = M ( 2 ) , i n i n i =1 n i =1 i =1

iar n baza faptului c x1 , x 2 ,..., x n sunt independente i repartizate la fel ca , rezult(

1n 1 n M ( xi ) = 2 M ( xi2 + 2 xi x j ) = n i= 1 n i= 1 i, j = 1
i j

1 n(n 1) 1 [ M ( xi2 ) + 2 M ( xi ) M ( x j )] = 2 nM ( 2 ) + n(n 1) M 2 ( ) . 2 2 n i =1 n 2adar avem(


n

1 n 1 n 1 M ( ) = M ( 2 ) [ M ( 2 ) + M 2 ( )] = [M ( 2 ) M 2 ( )] = n n n
^2

n 1 2 , n

ceea ce arat faptul c


2 .

nu este un estimator nedeplasat pentru parametrul

)etoda celor mai mici ptrate ca metod de estimare a parametrilor


%ie 1 , 2 ,..., n variabile aleatoare necorelate cu dispersiile constante 2 2 2 cunoscute 1 , 2 ,..., n ale cror medii mi (1 , 2 ,..., k ) , 1 i n depind de = parametrii, funciile mi fiind cunoscute. )etoda celor mai mici ptrate const n determinarea unor estimatori ai parametrilor 1 , 2 ,..., k din condiia de minimizare a sumei ptratelor abaterilor standard ale variabilelor aleatoare de la valorile medii respective, adic( n ( m ) 2 F (1 , 2 ,..., k ) = i 2 i minim.
i =1

>e limitm la a prezenta cazul n care mediile variabilelor aleatoare sunt funcii liniare de parametri, deci(
mi (1 , 2 ,..., k ) = aij j = a i11 + a i 2 2 + ... + a ik k , 1 i n
k j =1

unde ai@ sunt constante cunoscute, j sunt parametrii necunoscui, iar dispersiile sunt e!ale( 2 2 12 = 2 = ... = n = 2 (necunoscut), prin urmare, funcia care se minimizeaz este( F (1 , 2 ,..., k ) = ( i ai11 a i 2 2 ... a ik k ) 2 minim.
i =1 n

F = 0 , (1 j k ) , j

entru a determina punctul (punctele) de minim punem condiia ca(

adic( 2 ( i ai11 ai 2 2 ... aik k ) aij = 0, 1 j k


i =1 n

sau

a1 j (1 ai11 a i 22 ... aik k ) + a 2 j (2 a 211 a i 22 ... a 2 k k ) + + a nj (n a n11 a n 22 ... a nk k ) = 0 , 1 j k .

0istemul de mai sus devine( unde am notat(

Q j b j11 b j 22 ... b jk k = 0 , 1 j k

(7)

Q j = a1 j 1 + a 2 j 2 + ... + a nj n /

b ji = a1 j a1i + a 2 j a 2i + ... + a nj a ni / 1 i k .

0istemul de ecuaii (7) este deseori numit sistemul ecuaiilor normale i

admite cel puin o soluie

1 , 2 , . ., k

^ ^

0punem c funcia liniar parametric( ' = l11 + l 22 + ... + l k k unde l1 , l 2 ,..., l k sunt coeficieni cunoscui este estimabil dac exist un estimator nedeplasat pentru . 3ac este estimabil, estimatorul su nedeplasat de minim dispersie este dat de(

= l1 1+ l2 2+ . + lk k
^

^ ^ ^ ^

3eoarece fiecare

^ j

este funcie liniar de Q1 , Q2 ,..., Qk

= 1 Q1 + 2 Q2 + ... + k Qk
rezult c

D ( ) = (l1 1 + l2 2 + ... + lk k ) 2 .
2

)etoda de estimare a parametrilor cu a@utorul intervalelor de ncredere


%ie x1 , x 2 ,..., x n valorile de selecie pentru o variabil aleatoare cu repartiia F ( x , ) , sau, n mod echivalent, cu densitatea de probabilitate f ( x , ) , fiind parametrul necunoscut ce trebuie estimat. %ie de asemenea 1 statistici, I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) cu proprietatea c I < S , astfel nc+t probabilitatea ine!alitii (A) I ( x1 , x 2 ,..., x n ) S ( x1 , x 2 ,..., x n ) s nu depind de , adic(

P({

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) =

unde nu depinde de . 3ac numrul este foarte apropiat de ", atunci ine!alitatea (A) este ndeplinit n ma@oritatea cazurilor.$um ns este cuprins ntre I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) , rezult c am !sit un interval care acoper pe cu o probabilitate , apropiat de ". $u c+t acest interval este mai mic i probabilitatea este mai mare, cu at+t avem o indicaie mai precis cu privire la valoarea lui . 3ac I i S sunt astfel nc+t pentru un dat, 0 < < 1 , s avem(

P({

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) = 1

(B)

atunci (I , S ) se numete 4interval de ncredere, pentru parametrul . -elaia (B) trebuie citit astfel( 4cu probabilitatea 1 intervalul (I , S ) acoper adevrata valoare a parametrului , i nu 4probabilitatea ca s se !seasc n intervalul (I , S ) este 1 ,, deoarece parametrul este fix, fiind un numr real (de cele mai multe ori pozitiv) i nu o variabil aleatoare. 5ntervalul de ncredere este o variabil aleatoare/ valoarea 1 se numete 4coeficient de ncredere,, iar expresia S ( x1 , x 2 ,..., x n ) I ( x1 , x 2 ,..., x n ) este 4lun!imea intervalului de ncredere,. 5ntervalele de ncredere pot fi determinate n urmtoarele dou cazuri( a). resupunem c exist o funcie g ( x1 , x 2 ,..., x n ;) aa nc+t probabilitatea ca s avem( a g ( x1 , x 2 ,..., x n ;) b nu depinde de . 0e pot !si atunci dou numere a () i b() care depind de aa nc+t P ( a ( ) g ( x1 , x 2 ,..., x n ; ) b( )) = unde ale!em pe c+t mai apropiat de ". n ipoteza c funcia g ( x1 , x 2 ,..., x n ;) este o funcie strict monoton n raport cu (pentru precizarea lucrurilor vom considera funcia strict cresctoare raport cu ) exist o valoare unic A( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( a () g ( x1 , x 2 ,..., x n ; ) A( x1 , x 2 ,..., x n ; ) s fie echivalente i de asemenea o valoare unic B ( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( g ( x1 , x 2 ,..., x n ;) b( ) B ( x1 , x 2 ,..., x n ; ) s fie evchivalente. -ezult atunci c ine!alitile( a ( ) g ( x1 , x 2 ,..., x n ;) b( ) sunt echivalente cu ine!alitile( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) . 2tunci putem scrie(

prin urmare am determinat un interval de ncredere C2, DE pentru . b). resupunem c g ( x1 , x 2 ,..., x n ) este o statistic a crei funcie de repartiie este cunoscut (notat H ( x, ) ) i c acest funcie de repartiie admite o densitate de probabilitate continu (notat h( x, ) ). %ie r i s dou numere pozitive aa nc+t r F s G" i a1 ( ; ) , b1 ( ; ) dou funcii de i pentru care au loc relaiile(
a1 ( , )

P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) =

h ( x ,) dx = r (1 )
a
b

(H) (I)

b1 (, )

h ( x , ) dx = s (1 )
(;)

3ac Ca, bE este intervalul valorilor funciei g ( x1 , x 2 ,..., x n ) avem(

h( x,) dx =1 .
a

3in (H), (I), (;) rezult(


b1 ( , ) a1 ( , )

h ( x, ) dx = .

(<)

2rtm c dac funciile a1 ( ; ) i b1 ( ; ) sunt respectiv descresctoare i cresctoare n raport cu , se poate construi un interval de ncredere pentru . ntr.adevr, n baza relaiei (<) putem scrie( P ( a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , )) = , deci probabilitatea ine!alitii( a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , ) ("?) nu depinde de . %uncia a1 ( ; ) fiind descresctoare n raport cu , exist, analo! ca n cazul a), un numr A( x1 , x 2 ,..., x n ; ) astfel c ine!alitile( A( x1 , x 2 ,..., x n ; ) a1 ( , ) g ( x1 , x 2 ,..., x n ) s fie echivalente i la fel, funcia b1 ( ; ) fiind cresctoare n raport cu , exist un numr B ( x1 , x 2 ,..., x n ; ) astfel nc+t ine!alitile( B ( x1 , x 2 ,..., x n ; ) g ( x1 , x 2 ,..., x n ;) b1 ( , ) s fie echivalente. -ezult atunci c ine!alitatea ("?) este echivalent cu ine!alitatea( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) i prin urmare P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) = , ceea ce exprim faptul c am determinat intervalul de ncredere C2, DE pentru parametrul . Exemple( (i). $azul repartiiei normale >(m, ").

n acest caz densitatea de probabilitate este( ( x m ) 2 1 f ( x; m) = e 2 . 2 1 n x m $onsiderm statistica unde x = xi . n n i =1 'om demonstra c aceast statistic aparine clasei N (0 , ce rezult din teorema urmtoare. 9eorema 7. 3ac repartiia teoretic are media media i dispersia mediei de selecie
x

1 ) , afirmaie n

m i dispersia 2 , atunci 2 sunt respectiv m i .


n

3emonstraie. n 1 1 n 1 M ( x) = M ( xi ) = M ( xi ) = nm = m / n n i =1 n i =1 n n 1 1 M ( x m) 2 = M ( xi m) 2 = 2 M [ ( xi m)] 2 = n i =1 n i =1 2 n 1 = 2 M ( ( x i m) 2 = . n n i =1 2m folosit faptul c n cazul seleciilor repetate variabilele aleatoare , 1 2 ,..., n sunt independente i au aceeai repartiie cu variabila aleatoare (caracteristica studiat). 0tatistica considerat este descresctoare n raport cu m i repartiia ei nu depinde de m , prin urmare, suntem n condiiile cazului a), deci putem construe un interval de ncredere pentru parametrul m . 2vem relaia( n x b x m n 2 P ( ) = e dx . n 2 utem ale!e numerele i astfel nc+t s aib loc e!alitatea( n x n ("") e 2 = , 2 fiind un numr apropiat de ", de unde rezult c(
2 2 2 2

P (

x m n

) =

sau
P ( x n m x n ) = . 2m construit astfel intervalul de ncredere
[ x n , x n ]

pentru parametrul m. #bservm c se pot obine o infinitate de intervale de ncredere pentru parametrul m, toate cu aceeai probabilitate , deoarece numerele i verific o sin!ur condiie (""). entru ale!erea intervalului cel mai convenabil exist criterii asimptotice n teoria testelor de verificare a ipotezelor. (ii). $azul repartiiei normale >(?,

).

3ensitatea de probabilitate este, n acest caz( . 2 $onsiderm statistica( 2 2 x12 + x 2 + ... + x n 2 care aparine clasei J(n ,"), dup cum rezult din teorema urmtoare( 9eorema A. 3ac variabilele aleatoare independente 1 ,..., s aparin 2 2 clasei >(?, ), atunci variabila = 1 + ... + s aparine clasei J(s , ). 3emonstraie. 3eterminm, pentru nceput, funcia caracteristic a 2 variabilei j , 1 j s . 2vem pentru x ?( e
P ( < x) = P ( x < j < x ) =
2 j

f ( x; ) =

x2 2 2

y2 2 2

dy =

e
0

y2 2 2

dy .
x

2 d 1 P ( j2 < x) = e 2 . dx 2 x %uncia caracteristic a variabilei aleatoare j este(

dx . 2 0 3ezvoltm n serie de puteri pe e xti deci avem(


e xti = 1 +

M (e

2 j ti

)=

xti e x

1 2

x 2 2

xti ( xti ) 2 ( xti ) n + + ... + + ... 1! 2! n!


( p) ap
1 2

i in+nd seama c pentru a K ? avem(

x
0

p 1

e ax dx =

rezult c( deci funcia caracteristic a variabilei este(


(t ) = M (e
j =1 s

M (e

2 j ti

) = (1 2 2 ti )
2 j ti

) = (1 2 2 ti )

s 2

adic funcia caracteristic a repartiiei J(s , ). 9eorema este demonstrat. 0tatistica considerat este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n cazul a), deci putem construi un interval de ncredere pentru parametrul . 2vem relaia( n x 2 2 1 x12 + x 2 + ... + x n 1 2 2 P ( ) = n x e dx . 2 n 2 2 ( ) 2

2le!em numerele i astfel nc+t( n x 1 1 x 2 e 2 dx = , n 2 n ( ) 2 fiind un numr apropiat de ". -ezult deci c( 2 2 x12 + x2 + ... + x n P( ) = 2 sau
P(

xi2
i =1

ceea ce nseamn c am determinat o infinitate de intervale de ncredere pentru parametrul , toate cu aceeai probabilitate .
(iii). $azul repartiiei normale >(m,

x
i =1

2 i

)=

).

3ensitatea de probabilitate n acest caz este(

f ( x; m, ) =

( x m ) 2 2 2

3eterminm intervale de ncredere pentru parametrul m. $onsiderm statistica(


n 1 x m

unde(
x1 + x 2 + ... + x n ( x x) 2 + ... + ( x n x) 2 , 2 = 1 . n n 0tatistica considerat aparine clasei 0(n.") i repartiia ei nu depinde de . 2ceste afirmaii rezult din urmtoarele dou teoreme. 9eorema B. n cazul seleciilor repetate de volum n pentru o caracteristic normal N ( m , ) sunt adevrate afirmaiile( ) . (i). )edia de selecie x aparine clasei N ( m , x=

(ii). 'ariabilele i 2 (momentul centrat de selecie de ordinul doi) sunt independente i n 2 aparin clasei H ( n 1, ) . (iii). 3ensitatea de probabilitate a variabilei = 2 este(

x e , x 0. n 1 2 ( ) 2 3emonstraie. 2firmaia (i) a fost demonstrat. entru a demonstra (ii) putem presupune m G ? , deoarece momentul de selecie 2 este invariabil la o schimbare a ori!inii. Este cunoscut c(
n 1 2 n 1

f ( x) =

2n

n 1 2

n 2

nx 2 2

( x1 x) 2 + ... + ( x n x) 2 1 n = ( xi x ) 2 . n n i =1 2vem identitile( n n 1 n ( xi x) 2 = xi2 ( xi ) 2 n i =1 i =1 i =1

2 =

i
i n 1 n2 1 , 2 i=2 i =3 ( xi x) = ( x1 ) + ( x2 ) 2 + ... + ( x n 1 x n ) 2 n n 1 n 1 n2 2 i =1 de unde rezult( n i 2

x
n

x
n

xi . 1 n n 1 n2 1 2 2 2 2 i=2 i =3 x = ( x ) + ( x ) + ( x ) + ... + ( x x ) i 1 2 n 1 n n i =1 n n 1 n 1 n2 2 i =1 n membrul al doilea al e!alitii ultime avem o sum de n forme patratice pozitiv definite, fiecare av+nd ran!ul e!al cu ". 3eoarece suma ran!urilor acestor forma ptratice pozitiv definite este e!al cu n iar variabilele x k , 1 k n aparin clasei N (0 , ) , variabilele(
n 2 i

xi

1 =

xi n 1 , i =2 ( x1 ) n n 1 xi n2 , i =3 ( x2 ) n 1 n2
1 ( x n 1 x n ) , 2
n n

2 =

....................................
1

n 1 =

xi n i =1 sunt independente. 3in faptul c( 2 + 22 + ... + n21 2 = i n rezult independena variabilelor x i 2 . entru a demonstra (iii) observm c( M (k ) = 0 i D 2 ( k ) = 2 , 1 k n , deci variabila aleatoare n 2 aparine clasei H ( n 1, ) i funcia de repartiie a variabilei = 2 va fi(
n =

t e dt , x 0 . n 0 2 ( ) 2 3eriv+nd n raport cu x obinem densitatea de probabilitate a lui . 9eorema H. n cazul seleciilor repetate de volum n pentru o caracteristic normal variabila
P ( < x) = P (n 2 < nx ) =
2 n 1 2 2 2 n 1

nx 2

n 3 2

= n 1

aparine clasei 0(n."). 0tatistica fiind descresctoare n raport cu m suntem n condiiile cazului a), prin urmare avem( n ( ) n x m x 2 2 2 P( n 1 ) = ( 1 + ) n 1 dx . n 1 2 (n 1)( ) 2 2le!em numerele i astfel ca n ( ) n x 2 2 2 ( 1 + ) n 1 dx = , n 1 (n 1)( ) 2 fiind un numr apropiat de ". -ezult deci c(
P ( n 1 x m

) =

sau
P( x

2 m x 2 ) = . n 1 n 1

utem obine o infinitate de intervale de ncredere pentru parametrul m, toate cu probabilitatea . 2ceste intervale sunt determinate oricare ar fi valoarea lui , care este deci un parametru inutil. 3eterminm acum un interval de ncredere pentru . $onsiderm statistica ( x1 x) 2 + ... + ( x n x) 2 2 care aparine clasei J(n L", ")/ statistica este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n condiiile cazului a), aadar putem construi un interval de ncredere pentru parametrul . 2vem relaia(

n 1 2 ( ) 2 2le!em numerele i astfel nc+t( n 3 x 1 2 2 x e dx = n 1 n 1 2 2 ( ) 2


sau
P(

P (

(x
i =1

x) 2 ) =
n 1 2

n 3 2

e dx .

x 2

1 n 1 n 2 ( x x ) ( xi x ) 2 = . i i =1 i =1 #binem i de aceast dat o infinitate de inervale de ncredere pentru parametrul , care se pot determina oricare ar fi valoarea lui m/ parametrul m este, n acest caz, un parametru inutil.

S-ar putea să vă placă și