Sunteți pe pagina 1din 17

Elemente de teoria estimaiei

n multe aplicaii ale statisticii matematice, n tehnic sau tiinele experimentale, exist motivaia teoretic pentru a admite c repartiia variabilei (ce exprim o caracteristic a unei populaii statistice ce se studiaz) este o funcie cunoscut, n care intervin parametri cu valori necunoscute. Pentru finalizarea aplicaiilor practice, este necesar s se cunoasc repartiia exact, deci trebuie s fie determinate (estimate) valorile parametrilor respectivi, pentru ca legea de repartiie s fie complet specificat. 1. Obiectul teoria estimaiei. Conceptul de estimator. Fie X o variabil aleatoare cu densitatea de probabilitate f ( x ; ) i
x1 , x 2 , ..., x n un eantion de volum n asupra lui X.

Presupunem c se cunoate natura repartiiei statistice a unei anumite caracteristici i ne intereseaz care sunt valorile efective ale parametrului n cazul analizat (eventual ale parametrilor n cazul n care sunt mai muli parametri). Valorile lor adevrate nuse vor cunoate, dar se pot afla estimaii ale lor din datele x1 , x 2 , ..., x n de care dispunem: (parametrul) estimaia (funcie de x1 , x 2 , ..., x n ). Metodele de estimare a parametrilor repartiiilor statistice au drept obiect cutarea unor estimatori ct mai buni , care s implice o form convenabil de calcul (rapiditate de calcul), s necesite un numr ct mai mic de observaii (din cauza costurilor corespunztoare experimentrii) i care s fie ct mai apropiat de adevrata valoare a parametrului estimat, deci care s permot concluzionri valide. Rezult de aici c un estimator al parametrului necunoscut al repartiiei F ( x ; ) - notat

- este o funcie de valorile de selecie

= g n ( x1 , x2 ,..., xn )
cu anumite proprieti; O funcie de valorile de selecie o vom numi statistic. Este clar c valorile statisticii g n trebuie s nu depind de . Exemple de statistici

este aadar o variabil aleatoare.

1n r a). Statistica r = xi se numete moment de selectie de ordinul r. n i= 1


^

Momentul de selectie de ordinul nti

1n 1 = xi = x n i= 1
^

este aa-numita medie de selecie.

1n ^ r b). Statistica = ( xi 1 ) se numete moment centrat de selectie de r n i= 1


^
ordinul r. Momentul centrat de selectie de ordinul 2

1n ^ 2 2 = ( xi 1 ) n i= 1
^
se numete dispersie de selecie. Putem astfel s definim un estimator ca fiind o funcie g n ( x1 , x 2 ,..., x n ) , unde x1 , x 2 ,..., x n sunt observaiile asupra variabilei X cu repartiia F ( x ; ) , care nu depinde de . Mai exact vorbind, dac f ( x1 , x 2 ,..., x n ) este o funcie de observaiile de selecie i dac
f ( x1 , x 2 ,..., x n )

A ,
n

adic f ( x1 , x 2 ,..., x n ) converge n probabilitate ctre A, atunci f ( x1 , x 2 ,..., x n ) reprezint un estimator al valorii necunoscute A. Definiia 1. Estimatorul f ( x1 , x 2 ,..., x n ) al lui A se numete absolut corect, dac:
M ( f ( x1 , x 2 ,..., x n )) = A

i
D 2 ( f ( x1 , x 2 ,..., x n )) 0 .
n

Dac M ( f ( x1 , x 2 ,..., x n )) = A + B ( n) i B(n) 0 cnd estimatorul f ( x1 , x 2 ,..., x n ) se numete corect. Observaie: n ambele cazuri are loc:
f ( x1 , x 2 ,..., x n )

n ,

A .
n

Ct de bun sau ct de slab este acest estimator, n sensul apropierii respectiv deprtrii de valoarea real a parametrului vom vedea n cele ce urmeaz. Remarcm faptul c observaiile asupra variabilei X sunt aleatoare, deci rezultatul unei analize statistice - sintetizat n g n - este i el aleator. n mod natural g n ( x1 , x 2 ,..., x n ) nu va coincide cu valoarea lui ; la o alt ' ' ' experien, se vor obine alte realizri x1 , x 2 ,..., x n care vor furniza alt valoare pentru statistica g n , deci o alt valoare a estimatorului. Iat motivaia afirmaiei c

Deoarece valoarea observat a unei statistici variaz de la o selecie la alta, o problem important n statistic este determinarea repartiiei statisticii.

este variabil aleatoare.

O cerin esenial a estimatorului fie , deci

este ca valoarea medie a acestuia s

M ( ) =

Definiia 2. Un estimator dac

al parametrului se numete nedeplasat

M ( ) =

. 1 n xi este un estimator nedeplasat al n i =1

Exemplu: Media de selecie x =

medie teoretice M ( X ) = 1 . ntr-adevr, avem: 1 n 1 n 1 M ( x ) = M ( xi ) = M ( xi ) = n 1 = 1 . n i =1 n i =1 n

Definiia 3. irul de statistici

1 , 2 ,. ., n

^ ^ ^

se numete ir consistent de

estimatori pentru , dac:

lim P(| n | < ) = 1 .


n

Teorema 1. Oricare ar fi repartiia variabilei aleatoare X, media i dispersia mediei de selecie sunt:
M ( x ) = M ( X ) = ( = 1 )

i respectiv
D 2 ( x) = 1 2 2 D (X ) = . n n

Teorema 2. Media de selecie converge n probabilitate ctre valoarea medie a variabilei aleatoare X a populaiei. Demonstraie. Din inegalitatea lui Cebev rezult: D 2 ( x) 2 , P (| x |< ) 1 = 1 2 n 2 de unde rezult: lim P ( | x | < ) = 1
n

deoarece probabilitatea nu poate fi mai mare dect 1. Observaie. Din teorema precedent retult c media de selecie este un estimator consistent pentru parametrul .

2. Metode de estimare a parametrilor.


Dintre metodele consacrate de estimare a parametrilor menionm: metoda momentelor;

metoda verosimilitii maxime; metoda celor mai mici ptrate; metoda bazat pe intervale de ncredere.

Metoda momentelor
Metoda momentelor, propus de K. Pearson n 1891, este cea mai veche i tot odat cea mai simpl metod pentru estimarea parametrilor. Considerm x1 , x 2 ,..., x n o selecie dintr-o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare X avnd funcia de frecven (cazul discret) sau densitatea de repartiie (cazul continuu) f ( x; 1 , 2 ,..., k sunt k parametri ce trebuiesc estimai; 1 , 2 ,..., k ) unde = ( , ,..., ), k 1 notm . 1 2 k Metoda momentelor const n urmtorele: ^

Se calculeaz primele k momente de selecie

j ( j = 1, 2,..., k ) ;

1n j j = xi , ( j = 1, 2,..., k ) n i= 1
j i se egaleaz cu momentele teoretice j = M ( X ), j = 1, 2,..., k , care sunt, n general funcii de parametrii 1 , 2 ,..., k ; j M ( X ) = g j (1 , 2 ,..., k ), j =1, 2,..., k . - Estimatorii parametrilor 1 , 2 ,..., k prin metoda momentelor se obin rezolvnd ecuaiile:

g j ( 1 , 2 ,..., k ) = j , j = 1, 2,..., k ,
dac acestea sunt funcional independente i

j = kj( 1, 2,. , k)
m= = x
2 2

^ ^^ ^

Exemplul 1. Fie x1 , x 2 ,..., x n o selecie de volum n dintr-o populaie de medie m i dispersie 2 . Primele dou momente ale populaiei sunt: M ( ) = m = g1 (m , 2 ) ; M ( 2 ) = m 2 + 2 = g 2 ( m, 2 ) . Estimaiile parametrilor m i 2 se obin ca soluii ale sistemului: ^ , 1

1n 2 m + = 2 = xi . n i= 1
^

Rezult:

m = 1 = x = h1( 1, 2)
^2 ^ ^

^^

^^

^ ^ 1 1 2 2 = 2 ( 1) = x x = (xi x) = h2( 1 , 2) n i= 1 n i= 1 2 2 i
b +a = g 1 ( a , b) ; 2 b 2 + ab + a 2 M ( 2 ) = = g 2 (a , b) ; 3 M ( ) =

Exemplul 2. Fie x1 , x 2 ,..., x n o selecie de volum n asupra variabilei aleatoare repartizat uniform pe intervalul (a, b). Avem:

i ecuaiile care trebuie rezolvate pentru a determina estimatorii pentru a i b sunt:

b+ a ; 2 2 ^ b + ab + a 2 . 2= 3

1=

Rezult:

3(n 1) a = 1 3( 2 1 ) = x a n
^ ^ ^ ^2

3(n 1) b = 1+ 3( 2 1 ) = x + s n
^ ^ ^ ^2

unde s 2 este valoarea observat a dispersiei de selecie:

n 1 2 ( 1 )2 = s 2 ; n
^ ^
1 n s = ( xi x ) 2 . n 1 i =1
2

Metoda verosimilitii maxime


Presupunem c densitatea de probabilitate (n cazul continuu) sau funcia de frecven (n cazul discret) aseleciei x1 , x 2 ,..., x n este: P ( x1 , x 2 ,..., x n ; ) = f ( xi , ) .
i =1 n

(1)

Metoda verosimilitii maxime const n a considera ca estimaii ale parametrilor, acele valori ale acestora care maximizeaz funcia de verosimilitate maxim (1) ; funcia (1) ca funcie de parametrii poart numele de funcie de verosimilitate. Deci, valoarea cea mai verosimil pentru parametrul este aceea pentru care P ( x1 , x 2 ,..., x n ; ) este maxim. Fie * o valoare a lui pentru care P ( x1 , x 2 ,..., x n ; ) este maxim; n general * depinde de x1 , x 2 ,..., x n , adic * = * ( x1 , x 2 ,..., x n ) . Vom elimina valorile lui * care nu depind de x1 , x 2 ,..., x n i vom considera ca estimatori ai lui numai valorile lui * care sunt funcii de x1 , x 2 ,..., x n . Maximul lui P ( x1 , x 2 ,..., x n ; ) are loc are loc n acelai timp cu maximul lui ln P ( x1 , x 2 ,..., x n ; ) . Atunci funcia de estimaie sau, cu alte cuvinte, estimatorul de verosimilitate maxim * verific ecuaia: n ln P ( x1 , x 2 ,..., x n ; ) ln f ( xi , ) = =0 (2) i =1 n cazul n care avem de estimat un singur parametru sistemul de ecuaii se reduce la: n d ln f ( xi , ) = 0. d i =1 Exemple: 1. Ne propunem s estimm proporia de indivizi, dintr-o populaie, care au o anumit caracteristic. Considerm o selecie de n indivizi din aceast populaie i observm numrul de indivizi care au proprietatea respectiv. Asociem fiecrui individ o variabil aleatoare care poate lua valoarea 1 sau 0 dup cum individul respectiv posed sau nu caracteristica cercetat. Funcia de frecven a variabilei aleatoare este: f ( x, ) = x (1 )1x ; x = 0 ,1 . Pentru o selecie de n indivizi, observaiile asupra lui vo fi x1 , x 2 ,..., x n , deci:

P ( x1 , x 2 ,..., x n ; ) = i =1 (1 ) Rezult c:
n i =1

xi

xi .
i =1

ln P ( x1 , x 2 ,..., x n ; ) = xi ln + ( n xi ) ln(1 )
i =1

i
n ln P 1 n 1 = xi (n xi ) . i =1 1 i =1 Din

rezult:

ln P =0

1n = xi . n i= 1
^

Observaie: Deoarece:

1 M ( ) = n M ( ) = n
^

1 n 2 1 2 (1 ) , D ( ) = 2 D ( ) = 2 n D ( ) = n n i= 1 n ^ 1 n rezult c = xi este un estimator nedlasat pentru , proporia indivizilor n i= 1


2 ^

care posed caracteristica respectiv. 2. Ne propunem s estimm parametrul al repartiiei Poisson, innd deci seama de faptul c: k P ( x ; ) = e , k = 0 , 1, 2 ,... pe baza unei selecii repetate 1 , 2 ,..., n . Probabilitatea ca s avem: 1 = x1 , 2 = x 2 , ..., n = x n , valorile x1 , x 2 ,..., x n fiind ntregi nenegativi este:
P ( x1 , x 2 ,..., x n ; ) =e n
k!

xi
i =1

xi !
i =1

Din ecuaia verosimilitii maxime:


ln P ( x1 , x 2 ,..., x n ; ) =0 rezult :

1 n n + xi = 0 , i =1 deci estimatorul parametrului este:

1n = xi . n i= 1
^

3. Fie x1 , x 2 ,..., x n o selecie de volum n dintr-o populaie n care caracteristica ce se cerceteaz este o variabil aleatoare avnd o repartiie N(m, 2 ) ; m i 2 sunt parametrii necunoscui ce urmeaz a fi estimai. Funcia de verosimilitate este:
n

P ( x1 , x 2 ,..., x n ; m , 2 ) =
deci

1 (2 )
n/2

1 2
2

( xi m ) 2
i =1

,
n

n n 1 ln P( x1 , x 2 ,..., x n ; m , ) = ln(2 ) ln 2 2 2 2 2 Sistemul de ecuaii de verosimilitate maxim este: ln P 1 n = 2 ( x i m) = 0 ; m i =1 n ln P n 1 = + ( x i m) 2 = 0 ; 2 2 2 2( 2 ) 2 i =1 care furnizeaz soluia:
2

( x
i =1

m) 2 .

1n m = xi ; n i= 1 ^2 1 n 1n 2 = ( xi xi ) . n i= 1 n i= 1
^

Deoarece

1 n 1 n 1 M (m} = M ( xi ) = M ( xi ) = nM ( ) = m n i=1 n i=1 n


^

rezult c

m
^2

este un estimator nedeplasat pentru m.

n continuare avem:

1n 2 1 n 2 1n 2 1 n 2 M ( ) = M ( xi 2 ( xi ) ) = M ( xi ) 2 M ( xi ) , n i= 1 n i= 1 n i= 1 n i= 1
dar M( 1 n 2 1 n 1 n 2 x ) = M ( x ) = M ( 2 ) = M ( 2 ) , i n i n i =1 n i =1 i =1

iar n baza faptului c x1 , x 2 ,..., x n sunt independente i repartizate la fel ca , rezult:

1n 1 n M ( xi ) = 2 M ( xi2 + 2 xi x j ) = n i = 1 n i = 1 i, j = 1
i j

1 n(n 1) 1 [ M ( xi2 ) + 2 M ( xi ) M ( x j )] = 2 nM ( 2 ) + n(n 1) M 2 ( ) . 2 2 n i =1 n Aadar avem:


n

1 n 1 n 1 M ( ) = M ( 2 ) [ M ( 2 ) + M 2 ( )] = [M ( 2 ) M 2 ( )] = n n n
^2

n 1 2 , n

ceea ce arat faptul c


2 .

nu este un estimator nedeplasat pentru parametrul

Metoda celor mai mici ptrate ca metod de estimare a parametrilor


Fie 1 , 2 ,..., n variabile aleatoare necorelate cu dispersiile constante 2 2 2 cunoscute 1 , 2 ,..., n ale cror medii mi (1 , 2 ,..., k ) , 1 i n depind de k parametrii, funciile mi fiind cunoscute. Metoda celor mai mici ptrate const n determinarea unor estimatori ai parametrilor 1 , 2 ,..., k din condiia de minimizare a sumei ptratelor abaterilor standard ale variabilelor aleatoare de la valorile medii respective, adic: n ( m ) 2 F (1 , 2 ,..., k ) = i 2 i minim.
i =1

Ne limitm la a prezenta cazul n care mediile variabilelor aleatoare sunt funcii liniare de parametri, deci:
mi (1 , 2 ,..., k ) = a ij j = a i11 + a i 2 2 + ... + aik k , 1 i n
k j =1

unde aij sunt constante cunoscute, j sunt parametrii necunoscui, iar dispersiile sunt egale: 2 2 12 = 2 = ... = n = 2 (necunoscut), prin urmare, funcia care se minimizeaz este: F (1 , 2 ,..., k ) = ( i ai11 a i 2 2 ... aik k ) 2 minim.
i =1 n

Pentru a determina punctul (punctele) de minim punem condiia ca:


F = 0 , (1 j k ) , j
n

adic: 2 ( i ai11 ai 2 2 ... aik k ) aij = 0, 1 j k


i =1

sau

a1 j (1 a i11 a i 22 ... a ik k ) + a 2 j (2 a 211 a i 22 ... a 2 k k ) + + a nj (n a n11 a n 22 ... a nk k ) = 0 , 1 j k .

Sistemul de mai sus devine: unde am notat:

Q j b j11 b j 22 ... b jk k = 0 , 1 j k

(3)

Q j = a1 j 1 + a 2 j 2 + ... + a nj n ;

b ji = a1 j a1i + a 2 j a 2 i + ... + a nj a ni ; 1 i k .

Sistemul de ecuaii (3) este deseori numit sistemul ecuaiilor normale i

admite cel puin o soluie

1 , 2 , . ., k

^ ^

Spunem c funcia liniar parametric: ' = l11 + l 22 + ... + l k k unde l1 , l 2 ,..., l k sunt coeficieni cunoscui este estimabil dac exist un estimator nedeplasat pentru . Dac este estimabil, estimatorul su nedeplasat de minim dispersie este dat de:

= l1 1+ l2 2+ . + lk k
^

^ ^ ^ ^

Deoarece fiecare

^ j

este funcie liniar de Q1 , Q2 ,..., Qk

= 1 Q1 + 2 Q2 + ... + k Qk
rezult c

D ( ) = (l1 1 + l2 2 + ... + lk k ) 2 .
2

Metoda de estimare a parametrilor cu ajutorul intervalelor de ncredere


Fie x1 , x 2 ,..., x n valorile de selecie pentru o variabil aleatoare cu repartiia F ( x , ) , sau, n mod echivalent, cu densitatea de probabilitate f ( x , ) , fiind parametrul necunoscut ce trebuie estimat. Fie de asemenea 2 statistici, I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) cu proprietatea c I < S , astfel nct probabilitatea inegalitii (4) I ( x1 , x 2 ,..., x n ) S ( x1 , x 2 ,..., x n ) s nu depind de , adic:

P({

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) =

unde nu depinde de . Dac numrul este foarte apropiat de 1, atunci inegalitatea (4) este ndeplinit n majoritatea cazurilor.Cum ns este cuprins ntre I ( x1 , x 2 ,..., x n ) i S ( x1 , x 2 ,..., x n ) , rezult c am gsit un interval care acoper pe cu o probabilitate , apropiat de 1. Cu ct acest interval este mai mic i probabilitatea este mai mare, cu att avem o indicaie mai precis cu privire la valoarea lui . Dac I i S sunt astfel nct pentru un dat, 0 < < 1 , s avem:

P({

( x1 , x2 ,..., x n ) < < S ( x1 , x2 ,..., xn )}) = 1

(5)

atunci (I , S ) se numete interval de ncredere pentru parametrul . Relaia (5) trebuie citit astfel: cu probabilitatea 1 intervalul (I , S ) acoper adevrata valoare a parametrului i nu probabilitatea ca s se gseasc n intervalul (I , S ) este 1 , deoarece parametrul este fix, fiind un numr real (de cele mai multe ori pozitiv) i nu o variabil aleatoare. Intervalul de ncredere este o variabil aleatoare; valoarea 1 se numete coeficient de ncredere, iar expresia S ( x1 , x 2 ,..., x n ) I ( x1 , x 2 ,..., x n ) este lungimea intervalului de ncredere. Intervalele de ncredere pot fi determinate n urmtoarele dou cazuri: a). Presupunem c exist o funcie g ( x1 , x 2 ,..., x n ;) aa nct probabilitatea ca s avem: a g ( x1 , x 2 ,..., x n ;) b nu depinde de . Se pot gsi atunci dou numere a () i b() care depind de aa nct P ( a ( ) g ( x1 , x 2 ,..., x n ; ) b( )) = unde alegem pe ct mai apropiat de 1. n ipoteza c funcia g ( x1 , x 2 ,..., x n ;) este o funcie strict monoton n raport cu (pentru precizarea lucrurilor vom considera funcia strict cresctoare raport cu ) exist o valoare unic A( x1 , x 2 ,..., x n ; ) astfel nct inegalitile: a () g ( x1 , x 2 ,..., x n ;) A( x1 , x 2 ,..., x n ; ) s fie echivalente i de asemenea o valoare unic B ( x1 , x 2 ,..., x n ; ) astfel nct inegalitile: g ( x1 , x 2 ,..., x n ;) b( ) B ( x1 , x 2 ,..., x n ; ) s fie evchivalente. Rezult atunci c inegalitile: a ( ) g ( x1 , x 2 ,..., x n ;) b( ) sunt echivalente cu inegalitile: A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) . Atunci putem scrie:

prin urmare am determinat un interval de ncredere [A, B] pentru . b). Presupunem c g ( x1 , x 2 ,..., x n ) este o statistic a crei funcie de repartiie este cunoscut (notat H ( x, ) ) i c acest funcie de repartiie admite o densitate de probabilitate continu (notat h( x, ) ). Fie r i s dou numere pozitive aa nct r + s =1 i a1 ( ; ) , b1 ( ; ) dou funcii de i pentru care au loc relaiile:
a1 ( , )

P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) =

h ( x ,) dx = r (1 )
a
b

(6) (7)

b1 (, )

h ( x ,) dx = s (1 )
(8)

Dac [a, b] este intervalul valorilor funciei g ( x1 , x 2 ,..., x n ) avem:

h( x,) dx =1 .
a

Din (6), (7), (8) rezult:


b1 ( , ) a1 ( , )

h ( x, ) dx = .

(9)

Artm c dac funciile a1 ( ; ) i b1 ( ; ) sunt respectiv descresctoare i cresctoare n raport cu , se poate construi un interval de ncredere pentru . ntr-adevr, n baza relaiei (9) putem scrie: P ( a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , )) = , deci probabilitatea inegalitii: a1 ( , ) g ( x1 , x 2 ,..., x n ) b1 ( , ) (10) nu depinde de . Funcia a1 ( ; ) fiind descresctoare n raport cu , exist, analog ca n cazul a), un numr A( x1 , x 2 ,..., x n ; ) astfel c inegalitile: A( x1 , x 2 ,..., x n ; ) a1 ( , ) g ( x1 , x 2 ,..., x n ) s fie echivalente i la fel, funcia b1 ( ; ) fiind cresctoare n raport cu , exist un numr B ( x1 , x 2 ,..., x n ; ) astfel nct inegalitile: B ( x1 , x 2 ,..., x n ; ) g ( x1 , x 2 ,..., x n ;) b1 ( , ) s fie echivalente. Rezult atunci c inegalitatea (10) este echivalent cu inegalitatea: A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; ) i prin urmare P ( A( x1 , x 2 ,..., x n ; ) B ( x1 , x 2 ,..., x n ; )) = , ceea ce exprim faptul c am determinat intervalul de ncredere [A, B] pentru parametrul . Exemple: (i). Cazul repartiiei normale N(m, 1).

n acest caz densitatea de probabilitate este: ( x m ) 2 1 f ( x; m) = e 2 . 2 1 n x m Considerm statistica unde x = xi . n n i =1 Vom demonstra c aceast statistic aparine clasei N (0 , ce rezult din teorema urmtoare. Teorema 3. Dac repartiia teoretic are media media i dispersia mediei de selecie
x

1 ) , afirmaie n

m i dispersia 2 , atunci 2 sunt respectiv m i .


n

Demonstraie. n 1 1 n 1 M ( x) = M ( xi ) = M ( xi ) = nm = m ; n n i =1 n i =1 n n 1 1 M ( x m) 2 = M ( xi m) 2 = 2 M [ ( xi m)]2 = n i =1 n i =1 2 n 1 = 2 M ( ( x i m) 2 = . n n i =1 Am folosit faptul c n cazul seleciilor repetate variabilele aleatoare , 1 2 ,..., n sunt independente i au aceeai repartiie cu variabila aleatoare (caracteristica studiat). Statistica considerat este descresctoare n raport cu m i repartiia ei nu depinde de m , prin urmare, suntem n condiiile cazului a), deci putem construe un interval de ncredere pentru parametrul m . Avem relaia: n x b x m n 2 P ( ) = e dx . n 2 Putem alege numerele i astfel nct s aib loc egalitatea: n x n (11) e 2 = , 2 fiind un numr apropiat de 1, de unde rezult c:
2 2 2 2

P (

x m n

) =

sau
P ( x n m x n ) = . Am construit astfel intervalul de ncredere
[ x n , x n ]

pentru parametrul m. Observm c se pot obine o infinitate de intervale de ncredere pentru parametrul m, toate cu aceeai probabilitate , deoarece numerele i verific o singur condiie (11). Pentru alegerea intervalului cel mai convenabil exist criterii asimptotice n teoria testelor de verificare a ipotezelor. (ii). Cazul repartiiei normale N(0,

).

Densitatea de probabilitate este, n acest caz: . 2 Considerm statistica: 2 2 x12 + x 2 + ... + x n 2 care aparine clasei H(n ,1), dup cum rezult din teorema urmtoare: Teorema 4. Dac variabilele aleatoare independente 1 ,..., s aparin 2 2 clasei N(0, ), atunci variabila = 1 + ... + s aparine clasei H(s , ). Demonstraie. Determinm, pentru nceput, funcia caracteristic a 2 variabilei j , 1 j s . Avem pentru x 0: e
P ( < x) = P ( x < j < x ) =
2 j

f ( x; ) =

x2 2 2

y2 2 2

dy =

e
0

y2 2 2

dy .
x

2 d 1 P( j2 < x ) = e 2 . dx 2 x Funcia caracteristic a variabilei aleatoare j este:

dx . 2 0 Dezvoltm n serie de puteri pe e xti deci avem:


e xti = 1 +

M (e

2 j ti

)=

xti e x

1 2

x 2 2

xti ( xti ) 2 ( xti ) n + + ... + + ... 1! 2! n!


( p) ap
1 2

i innd seama c pentru a > 0 avem:

x
0

p 1

e ax dx =

rezult c: deci funcia caracteristic a variabilei este:


(t ) = M (e
j =1 s

M (e

2 j ti

) = (1 2 2 ti )
2 j ti

) = (1 2 2 ti )

s 2

adic funcia caracteristic a repartiiei H(s , ). Teorema este demonstrat. Statistica considerat este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n cazul a), deci putem construi un interval de ncredere pentru parametrul . Avem relaia: n x 2 2 1 x12 + x 2 + ... + x n 1 2 2 P( ) = n x e dx . 2 n 2 2 ( ) 2

Alegem numerele i astfel nct: n x 1 1 x 2 e 2 dx = , n 2 n ( ) 2 fiind un numr apropiat de 1. Rezult deci c: 2 2 x12 + x2 + ... + x n P( ) = 2 sau
P(

xi2
i =1

ceea ce nseamn c am determinat o infinitate de intervale de ncredere pentru parametrul , toate cu aceeai probabilitate .
(iii). Cazul repartiiei normale N(m,

x
i =1

2 i

)=

).

Densitatea de probabilitate n acest caz este:

f ( x; m, ) =

( x m ) 2 2 2

Determinm intervale de ncredere pentru parametrul m. Considerm statistica:


n 1 x m

unde:
x1 + x 2 + ... + x n ( x x) 2 + ... + ( x n x) 2 , 2 = 1 . n n Statistica considerat aparine clasei S(n-1) i repartiia ei nu depinde de . Aceste afirmaii rezult din urmtoarele dou teoreme. Teorema 5. n cazul seleciilor repetate de volum n pentru o caracteristic normal N ( m , ) sunt adevrate afirmaiile: ) . (i). Media de selecie x aparine clasei N (m , x=

(ii). Variabilele i 2 (momentul centrat de selecie de ordinul doi) sunt independente i n 2 aparin clasei H ( n 1, ) . (iii). Densitatea de probabilitate a variabilei = 2 este:

x e , x 0. n 1 2 ( ) 2 Demonstraie. Afirmaia (i) a fost demonstrat. Pentru a demonstra (ii) putem presupune m = 0 , deoarece momentul de selecie 2 este invariabil la o schimbare a originii. Este cunoscut c:
n 1 2 n 1

f ( x) =

2n

n 1 2

n 2

nx 2 2

( x1 x) 2 + ... + ( x n x) 2 1 n = ( xi x ) 2 . n n i =1 Avem identitile: n n 1 n ( xi x ) 2 = xi2 ( xi ) 2 n i =1 i =1 i =1

2 =

i
i n 1 n2 1 , 2 i=2 i =3 ( xi x ) = ( x1 ) + ( x2 ) 2 + ... + ( x n 1 x n ) 2 n n 1 n 1 n2 2 i =1 de unde rezult: n i 2

x
n

x
n

xi . 1 n n 1 n2 1 2 2 2 2 i=2 i =3 x = ( x ) + ( x ) + ( x ) + ... + ( x x ) i 1 2 n 1 n n i =1 n n 1 n 1 n2 2 i =1 n membrul al doilea al egalitii ultime avem o sum de n forme patratice pozitiv definite, fiecare avnd rangul egal cu 1. Deoarece suma rangurilor acestor forma ptratice pozitiv definite este egal cu n iar variabilele x k , 1 k n aparin clasei N (0 , ) , variabilele:
n 2 i

xi

1 =

xi n 1 , i =2 ( x1 ) n n 1 xi n2 , i =3 ( x2 ) n 1 n2
1 ( x n 1 x n ) , 2
n n

2 =

....................................
1

n 1 =

xi n i =1 sunt independente. Din faptul c: 2 + 22 + ... + n21 2 = i n rezult independena variabilelor x i 2 . Pentru a demonstra (iii) observm c: M (k ) = 0 i D 2 ( k ) = 2 , 1 k n , deci variabila aleatoare n 2 aparine clasei H ( n 1, ) i funcia de repartiie a variabilei = 2 va fi:
n =

t e dt , x 0 . n 0 2 ( ) 2 Derivnd n raport cu x obinem densitatea de probabilitate a lui . Teorema 6. n cazul seleciilor repetate de volum n pentru o caracteristic normal variabila
P ( < x ) = P( n 2 < nx ) =
2 n 1 2 2 2 n 1

nx 2

n 3 2

= n 1

aparine clasei S(n-1). Statistica fiind descresctoare n raport cu m suntem n condiiile cazului a), prin urmare avem: n ( ) n x m x 2 2 2 P( n 1 ) = ( 1 + ) n 1 dx . n 1 2 (n 1)( ) 2 Alegem numerele i astfel ca n ( ) n x 2 2 2 ( 1 + ) n 1 dx = , n 1 ( n 1)( ) 2 fiind un numr apropiat de 1. Rezult deci c:
P ( n 1 x m

) =

sau
P( x

2 m x 2 ) = . n 1 n 1

Putem obine o infinitate de intervale de ncredere pentru parametrul m, toate cu probabilitatea . Aceste intervale sunt determinate oricare ar fi valoarea lui , care este deci un parametru inutil. Determinm acum un interval de ncredere pentru . Considerm statistica ( x1 x) 2 + ... + ( x n x) 2 2 care aparine clasei H(n 1, 1); statistica este descresctoare n raport cu i repartiia ei nu depinde de , deci suntem n condiiile cazului a), aadar putem construi un interval de ncredere pentru parametrul . Avem relaia:

n 1 2 ( ) 2 Alegem numerele i astfel nct: n 3 x 1 2 2 x e dx = n 1 n 1 2 2 ( ) 2


sau
P(

P (

(x
i =1

x) 2 ) =
n 1 2

n 3 2

e dx .

x 2

1 n 1 n 2 ( x x ) ( xi x) 2 = . i i =1 i =1 Obinem i de aceast dat o infinitate de inervale de ncredere pentru parametrul , care se pot determina oricare ar fi valoarea lui m; parametrul m este, n acest caz, un parametru inutil.

S-ar putea să vă placă și