Sunteți pe pagina 1din 35

Capitolul 7 ELEMENTE DE TEORIA SELECIEI I ESTIMAIEI 7.1.

Noiuni generale
Orice cercetare statistic pornete de la o colectivitate sau populaie alctuit din elemente sau indivizi care au o caracteristic general i care se difereniaz prin anumite atribute. Elementele colectivitii (populaiei) le vom numi uniti. n studiul colectivitilor statistice, n majoritatea cazurilor suntem nevoii s studiem numai pri din ntreaga colectivitate. Ori, n acest caz, se pune n mod natural ntrebarea dac concluziile ce le obinem concord cu rezultatul ce l-am obine dac studiem ntreaga populaie. Apare astfel problema de a studia modul n care valorile tipice (pe baza crora tragem concluzii) ale colectivitii pariale investigate pot furniza informaii asupra valorilor tipice ale ntregii colectiviti. Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate {, K, P}, n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate pe K. Dup cum se tie, dac este finit, atunci K coincide cu mulimea prilor lui , iar P este o repartiie discret uniform pe . Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar nu putem cerceta dect un numr finit i deci obinem o informaie trunchiat. Dar, n cazul cnd numrul elementelor populaiei este finit, atunci cnd cercetarea calitii elementelor conduce la distrugerea lor, evident c se impune alegerea unui numr finit pentru cercetare. Dac inem seama de faptul c orice investigare (cercetare) implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din populaia total. Vom numi selecie (eantion) o colectivitate parial de elemente alese la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei. Spunem c o selecie este repetat, dac elementul ales la ntmplare este reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri. Selecia este nerepetat dac, elementele alese nu se mai introduc n colectivitatea general. S efectum deci o selecie de volum n dintr-o colectivitate C i s notm cu x1, x2, , xn valorile de observaie. Acestea se refer la valorile unei variabile aleatoare X care d legitatea caracteristicii studiate. Considerate aposteriori, valorile de selecie x1, x2, , xn sunt valori bine determinate ale variabilei aleatoare X. Privite apriori, valorile X1, X2, , Xn pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X, n cazul unei selecii repetate. Dac selecia este nerepetat, atunci variabilele X1, X2, , Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete. Dac volumul colectivitii generale este suficient de mare iar volumul seleciei este suficient de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice o selecie nerepetat se trateaz dup metodele seleciei repetate.

Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic. S considerm acum o selecie de volum n: X1, X2, , Xn i s dispunem n ordine nedescresctoare aceste date: X(1) X(2) X(n) , unde X(1) = min {X1, X2, , Xn}. X(n) = max {X1, X2, , Xn}. Mulimea {X(1), X(2), , X(n)}, constituie o statistic a ordinei. Pornind de la selecia considerat, putem defini imediat amplitudinea de selecie. W ( X1 , X 2 ,..., X m ) = X ( m ) X (1) , care este evident o statistic (o funcie de selecie). Un rol deosebit de important l are n statistica matematic funcia empiric de repartiie, care se definete astfel: n Fn ( x ) = x , x R , unde n este volumul seleciei, iar nx este numrul valorilor de n selecie mai mici dect x. Funciei F(x) = P(: X() < x) i vom spune funcie teoretic de repartiie. Noi vom considera numai selecii repetate. Justificarea teoretic a metodei seleciei apare n mod natural din teorema lui V.I.Glivenko, cunoscut sub numele de teorema fundamental a statisticii matematice. Teorema lui Glivenko

Dac F(x) este funcie teoretic de repartiie, iar Fn(x) funcia empiric de repartiie, atunci: P lim sup Fn ( x ) F( x ) = 0 =1 n xR Teorema lui A.N.Kolmogorov ofer posibilitatea de a evalua distana dintre Fn(x) i F(x). Teorem. Dac F(x) este o funcie continu, atunci: 2 2 lim P sup Fn ( x ) F( x ) = K( ) = ( 1) k e k , cu > 0 n < x < n 7.2. Momente de selecie Dac este dat selecia de volum n: X1, X2, , Xn , atunci vom numi momentul de selecie de ordinul r i-l vom nota M r , variabila aleatoare:
Mr =

1 n r Xj n j =1 1 n Xj n j =1

Pentru r = 1, obinem media de selecie: M1 = x =

S considerm media i dispersia variabilei aleatoare M r :

1 n 1 n M ( M r ) = M X rj = M ( X rj ) = M r ( X ) n j =1 n j =1

2 2 1 n 1 n M Xr D 2 ( M r ) = M 2 ( M r ) M 2 ( M r ) = M X r j j = n n j = 1 j =1

= =

1 n2 1 n2

1 1 M( X ) + n M( X ) M( X ) n M
n n j =1 n 2r j 2 j pk 2 r j r k 2 j =1

(X j)

1 n2

M( X ) M( X ) =
j pk r j r k

[ M ( X ) M ( X ) ] = n [ M
j =1 2 r j r j

2r

( X ) M r2 ( X )]

Aplicnd acum inegalitatea lui Cebev, obinem: M 2 r ( X ) M r2 ( X ) P Mr Mr ( X ) < 1 , de unde urmeaz c: n 2

justific nlocuirea n aplicaii a momentelor teoretice de ordinul r, cnd acestea exist, cu momentele empirice de ordinul r, dac n este suficient de mare.
Momentele centrate de selecie, r

lim P M r M r ( X ) < = 1, ceea ce ne conduce la:

M r n M r ( X ) , fapt care

Prin definiie: r =

1 n ( x j x )r n j =1 Pentru r = 2 se obine dispersia de selecie necorectat:

2 = 2 =

1 n ( x j x )2 n j=1

Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu ajutorul momentelor obinuite de selecie i invers: r n rh 1 n r rh h h h h 1 r = ( 1) h C h , Xj r X j X = ( 1) C r X n j=1 h =0 n j=1 h =0
h deci r = ( 1) h C h r X M rh h =0 r

r( r 1) 2 X r 2 +... , r N * 2 Ne propunem acum s determinm repartiia asimptotic a mediei de selecie X . Teorem. Dac se efectueaz o selecie de volum n: X1, X2,, Xn, dintr-o colectivitate caracterizat de variabila aleatoare X pentru care exist M(X) = m, M[(X m)2] = 2 0, B xm Y N(0,1) / n n Xj Demonstraie: S notm Y j = , 1 j n n n Xj m Atunci: x = Y j si M(Y j ) = m j = M = n n j =1 i M r = r + rx r 1 +

X j m 2 2 M Y j m j = = M = n n2 3 X m 3 3 j = , 1 j n M Yj m j = 3 = M j n3 n3 S considerm condiiile lui Leapunov:


2 2 j

[(
(

)]

2 n n 2 j n j=1 Fiind ndeplinit condiia lui Leapunov, rezult conform teoremei: x 1 xm z2 / 2 = P < x e lim dz / n 2 n n mod analog, rezult: Teorem: Dac exist valorile medii M(Xr) = Mr(X); M(X2r) = M2r(X) i n

lim

n 3 j j= 2

1/ 3

1/ 2

= lim

3 2 n

1/ 3

1/ 2

= lim

1 1/ 6 = 0 n n

M Mr Mr ( X )

) , atunci M

M r Mr ( X )
2r

( X ) M r2 ( X ) n

1/ 2

B Y N(0,1) n

Pornind de la relaiile: 1 = 0
2 2 = M 2 M 1 3 3 = M 3 M 2 M 1 + 2 M 1 4 4 4 = M 4 4M 3 M 1 + 6M 2 M 1 3M 1

obinem: M ( 1 ) = 0
M ( 2 ) = M ( M 2 ) M ( M12 ) = n 1 2 ( X ) n

( n 1)( n 2) 3 ( X ) n2 M ( 4 ) = M ( M 4 ) 4 M ( M 3 M1 ) + 6 M ( M 2 M12 ) 3 M ( M14 ) = M ( 3 ) = M ( M 3 ) 3 M ( M 2 M1 ) + 2 M ( M13 ) = = ( n 1)( n 2 3n + 3) 3( n 1)( 2n 3) 2 4 ( X ) + 2 ( X ) 2 n n3

Aceste rezultate au loc oricare ar fi repartiia variabilei aleatoare X, ce caracterizeaz colectivitatea din care s-a efectuat selecia. Cu ajutorul momentelor de selecie putem pune n eviden i ali indicatori de selecie, ca: asimetria, excesul, coeficientul de corelaie, calculate pe baza datelor de selecie. Astfel, asimetria de selecie:

1 =

3 23/ 2

Excesul de selecie:

2 =

4 3 22

Coeficientul de corelaie de selecie (empiric): 1 n X j X Yj Y n j =1 = n 2 1 2 1 n X X Yj Y j n j =1 n j =1

)(

7.3. Selecia dintr-o populaie normal N(m, ) n multe situaii, ne intereseaz repartiia exact a diverselor statistici, Tn(X1, X2, ,Xn), chiar cnd n este mic. Toate rezultatele obinute anterior rmn valabile, inclusiv cele referitoare la repartiie asimptotic a unor funcii de selecie normate convenabil. Vom presupune acum c populaiile din care se efectueaz seleciile sunt normale N(m, ) i, n aceste condiii, vom cuta s stabilim repartiiile exacte ale celor mai importante funcii de selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal. Teorem. Dac X1, X2, ,Xn este o selecie de volum n dintr-o populaie caracterizat 1 n de o variabil aleatoare X N(m, ), atunci media de selecie X = X j are o lege de n j =1 repartiie N m, n Demonstraie. Cum Xj N(m, ), 1 j n, rezult c:

Xj ( t ) = e
Atunci:

itm

t 2 2 2

n it 1 t t 2 2 t 2 2 Xj n it Xj n t n i n m 2 n 2 itm n itX j = 1 n 2n = M e =e X (t ) = M (e ) = M , = X j = e e n j =1 j =1 j =1

care este funcia caracteristic a unei variabile aleatoare normale N m, n Urmeaz c densitatea de repartiie a variabilei X este:
n 2 fX (x) = e 2
n x m
2

x R

S artm c variabila abatere normat Z =

X m este repartizat normal N(0; 1). / n


n X

ntr-adevr:

Z (t ) = M (e
i t

itZ

it = M e

X m

it n m i t e = M e
2 2 2

t t t n t i nm i nm t n 2 2 n =e X e =e 2, =e care este funcia caracteristic a unei variabile normale N(0; 1).

nm

Deci densitatea de repartiie a variabilei Z =


z2

X m este: / n

1 2 f Z ( z) = e , z R 2 Teorem. Dac X1, X2, ,Xn este o selecie de volum n, dintr-o populaie normal N(m, ), atunci X i 2 sunt variabile aleatoare independente. Demonstraie. Putem presupune c m = 0, ntruct momentul de selecie 2 este invariabil la o schimbare a originii. 2 1 n ntruct: 2 = ( X k X ) , n k =1 s exprimm:

(X
k =1

X)

1 n = X 2 X X k + nX = X X k n k =1 k =1 k =1 k =1
n

2 k

2 k

ns:
n n X Xk 2 k n n n 1 1 + n 2 X k =3 + X k2 X k = X1 k =2 2 n k =1 n n 1 n 1 n2 k =1 2 2

+...+

1 ( X n1 X n )2 2
n n X Xk k n 1 +...+ 1 ( X n1 X n ) 2 + n 2 X 2 k =3 = X1 k =2 n n 1 n 1 n2 n 2 2

Deci:

(X
k =1

X)

Urmeaz c:
n n X Xk 2 k n n 1 n 1 +...+ 1 ( X n1 X n ) 2 + n 2 X 2 k =3 X k2 = X k + X1 k =2 n k =1 2 n n 1 n 1 n2 k =1 2 2

n membrul doi al acestei egaliti avem o sum de n forme ptratice pozitiv definite, fiecare avnd rangul egal cu unu. Deoarece suma rangurilor acestor forme ptratice pozitiv definite este egal cu n, iar variabilele Xk N(0, ) , 1 k n, din teorema lui Cochran (pe care nu o vom demonstra)* rezult c variabilele:

* Teorema lui Cochran. Fie X1, X2, , Xn variabile aleatoare independente, repartizate normal N(0, ) i Q1, Q2, , QS , forme ptratice n X1, X2, , Xn avnd rangul k1, k2, , kS , respectiv. Dac:

Q j = X k2 , atunci
j =1 k =1

condiia necesar i suficient ca variabilele Q1, Q2, , QS s fie independente este ca k1+ k2 + + kS = n.

Y1 =

n Xk n 1 X1 k = 2 n n 1 n Xk n 2 X 2 k =3 n 1 n2

Y2 =

................................................... 1 Yn 1 = ( X n 1 X n ) 2 1 n Yn = Xk n k =1 sunt independente. 1 n1 Se constat imediat c: 2 = Yk2 i, prin urmare, rezult c X i 2 sunt n k =1 independente.
Teorem. Variabila aleatoare n2 are o repartiie 2 cu n 1 grade de libertate i parametrul , adic are densitatea de repartiie: , x 0 0 x n 1 1 1 n 1 f ( x) = x 2 e 2 , x > 0 n-1 n 1 n 1 2 2 2 n Variabila aleatoare 22 are o repartiie cu n 1 grade de libertate i parametrul = 1.

Variabila aleatoare = 2 are densitatea de repartiie:

, x 0 0 n-1 nx 2 2 f ( x ) = 2n 2 n 2 2 x e , x > 0 n 1 n-1 n 1 2 2 2 n 1 Y 2 + Y22 +...+Yn21 rezult: n2 = Yk2 , unde Y1, Y2,, Yn-1 Demonstraie. Din 2 = 1 n k =1 sunt variabile aleatoare independente, repartizate normal, de parametri M(Yk) = 0; D2(Yk) = 2. Deci n2 urmeaz o lege de repartiie X 2 cu n 1 grade de libertate i parametru . De asemenea: 2 n2 n 1 Yk = 2 k =1 Y Y M k = 0; D 2 k = 1 i, deci, variabila aleatoare n2 /2 urmeaz o lege de repartiie a crei densitate este:

, x 0 0 n 1 x 1 1 f ( x) = x 2 e 2 , x > 0 n-1 n 1 2 2 2 Pentru a obine densitatea de repartiie a variabilei = 2 , pornim de la funcia de repartiie: 0 , x 0 P( < x ) = = 2 < nx P n , x > 0 2

, x 0 0 y nx 2 n 3 2 1 y 2 e 2 dy , x > 0 = n 1 n 1 0 2 2 n 1 2 Derivnd, obinem: , x 0 0 n-1 2 nx 2 2 f ( x ) = n-1 2n x n 2 e 2 , x > 0 2 2 n 1 n 1 2

1 n ( X k m) 2 , unde X1, X2, , Xn este o selecie de n k =1 volum n dintr-o colectivitate normal N(m, ). Atunci: 2 n n *2 x k m = 2 k =1 X m independente, n membrul al doilea avem o sum de ptrate de variabile Yk = k S considerm acum *2 =

repartizate normal N(0, 1). Deci, variabila aleatoare

cu parametrul = 1 S considerm acum variabila aleatoare: 2 1 n s2 = X k X ) pe care o numim dispersia de selecie corectat. ( n 1 k =1 ntruct:

2 * 2

urmeaz o lege de repartiie (2n )

( X k X ) = ( X k m) ( X m) = ( X k m) 2( X m) ( X k m) +
2 2 2 k =1 k =1 k =1 k =1

+ n( X m) = ( X k m) n( X m)
2 2 k =1

rezult c: ( n 1)s 2

2
n

X m X m = k / n k =1
n 2

X m Dar, k k =1 independent de (2n ) .

este o variabil

2 (n)

X m iar / n

2 2 este o variabil (1)

Rezult c

( n 1)s 2

urmeaz o lege de repartiie (2n 1) cu parametrul = 1

Am vzut c M ( (2n ) ) = n; D 2 ( (2n ) ) = 2 n cnd parametrul este 1. n Atunci M 22 = n 1 , de unde rezult:


n 1 2 n2 2 2 n 2 M ( 2 ) = ; D 2 = 2( n 1); D ( 2 ) = 2( n 1) i deci: n 4

2( n 1) 4 n2 n acelai timp: ( n 1)s 2 2 2 M = n 1 , care conduce la: M(s ) = 2 D 2 ( 2 ) =


( n 1)s 2 D2 = 2( n 1), 2

adic D 2 ( s 2 ) =

2 4 n 1

ntruct

xm (n - 1)s 2 N ( 0,1), iar = (2n 1) 2 / n Urmeaz c: xm xm / n = / n = x m are o lege de repartiie Student cu n 1 grade de s/ n (2n 1) ( n 1)s 2

n 1

( n 1) 2

libertate. S presupunem c dispunem de dou colectiviti, C1 i C2, caracterizate de o variabil aleatoare X1 N(m1, T1) respectiv X2 N(m2, T2), X1 i X2 independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X11, X12, , X 1n1 , iar din colectivitatea C2 se efectueaz o selecie de volum n2: X21, X22, , X 2 n2 . Pe baza acestor selecii, obinem mediile de selecie X 1 i X 2 , dispersiile de selecie:

s12 =

1 n1 X1 j x1 n1 1 j =1

2 , respectiv s2 =

1 n2 ( X 2 k x2 )2 . n2 1 k =1

Variabila aleatoare X 1 X 2 urmeaz o lege normal:


2 12 2 . De aici rezult c: N m m + , 2 1 n1 n 2 x1 x 2 ( m1 m2 ) N ( 0,1)

12
n1

2 2

Evident c: M ( X1 X 2 ) = m1 m 2

n2

D 2 ( X1 X 2 ) = D 2 ( X1 ) + D 2 ( X 2 ) =

12
n1

2 2

n2
1

2 = 2 , atunci variabila aleatoare Dac 12 = 2

[( n 1)s
1

2 1

2 + ( n2 1)s2

are o

repartiie 2 cu n1 + n2 2 grade de libertate.

Rezult c variabila aleatoare: ( X1 X 2 ) ( m1 m2 )

12
n2

2 2

n2

2 2 ( n1 1)s12 + ( n2 1)s2 ( n1 1)s12 + ( n2 1)s2 ( n1 + n2 2) 2 n1 + n2 2 urmeaz o lege de repartiie Student cu n1 + n2 2 grade de libertate. n virtutea teoremei conform creia dac variabilele (2 1 ) , (2 2 ) sunt independente,

(X

X 2 ) ( m1 m2 )

n1 n2 n1 + n2

atunci variabilele aleatoare (2 1 ) / 1: (2 2 ) / 2 urmeaz o lege de repartiie Snedecor cu 1, 2 grade de libertate, respectiv, rezult c variabila: ( n1 1)s12 ( n 1) 2 s12 = Fn1 1; n2 1 = 1 2 2 ( n2 1)s2 s2 ( n2 1) 2 are o lege de repartiie Snedecor (este o variabil Fn1 1; n2 1 cu n1-1, n2-1 grade de libertate respectiv. n aplicaiile practice trebuie s se in seama de faptul c tabelele pentru repartiia Snedecor se construiesc pentru valori ale variabilei Fn1 1; n2 1 mai mari dect unu.
2 Ca atare este necesar s lum la numrtor s1 > s2 2 i, totodat, s avem grij s nu inversm ordinea gradelor de libertate. Inversiunea ordinei gradelor de libertate este echivalent cu: 2 s2 1 1 Fn1 1; n2 1 = 2 = 2 = s1 s1 Fn1 1; n2 1 2 s12 ceea ce justific de ce s-au construit tabele numai pentru F1 ,2 > 1 .

7.4. Elemente de teoria estimaiei n toate aplicaiile statisticii matematice, n economie, n tehnic i, n general, n tiinele experimentale este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut. Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri). Pentru a nelege mai bine cum stau lucrurile, s dm unele exemple. Dac variabila aleatoare X reprezint numrul de apeluri la o central telefonic ntrun interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie Poisson: x x X: a a e , x = 0, 1, 2, ... x! adic P( X = x; a ) = e a ax , pentru x = 0, 1, 2, ...; a > 0 i avem o lege de repartiie ce x! depinde de parametrul a > 0.

n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse necorespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: P( X = x; p) = Cnx p x (1 p ) n x , x = 0, 1, 2, ..., n S considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de repartiie: 1 t f T ( t ; ) = e , t > 0 >0 0 , t0 Este vorba, iari, de o lege de repartiie de form exponenial cu un singur parametru > 0 . n fine, dac X reprezint abaterile unei piese prelucrate de la cota nominal menionat n fia tehnologic, atunci X urmeaz o lege normal N(m, ) a crei densitate este:
1 2 f ( x; m, ) = e 2 , x R , 2 care este o lege de repartiie cu doi parametri (m, ) Rx(0, ). n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este adic valorile exacte ale parametrilor ce intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie adic avem o problem complet specificat. Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2, , Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei X1, X2, , Xn, le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei statistici (o funcie de datele de selecie) construite cu ajutorul seleciei X1, X2, , Xn i pe care o vom nota Tn(X1, X2, , Xn). Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X care admite legea de repartiie dat de f(x; ), unde f(x; ) este o densitate de repartiie n cazul c exist densitate sau, n cazul unei variabile discrete este P(X = x; ). Cu ajutorul funciei de selecie Tn(X1, X2, , Xn) dorim s estimm parametrul (forma fiind cunoscut). Este clar c dispunem numai de informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci, Tn(X1, X2, , Xn) trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Evident c aceast convergen trebuie s aib loc n probabilitate, adic: lim P( Tn ( X1 , X 2 ,..., X n ) < ) = 1

( X m )2

Valoarea luat de Tn(X1, , Xn) pentru valori bine determinate ale variabilelor X1, X2, , Xn o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric. P spunem c Tn(X1, X2, , Xn) este o estimaie Dac Tn(X1, X2, , Xn) n corect pentru parametrul .

Cum exist o infinitate de funcii Tn(X1, X2, , Xn) care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, deci care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, care prezint avantajul c este comod n calcul. Funcia de estimaie Tn(X1, X2, , Xn) este o funcie de variabilele aleatoare independente X1, X2, , Xn i, deci, o variabil aleatoare cu o funcie de repartiie. Cum am presupus c lucrm cu convergen n medie ptratic, am admis implicit c Tn(X1, X2, , Xn) are momente de ordinul doi cel puin. Definiie. Spunem c statistica Tn(X1, X2, , Xn) este o estimaie nedeplasat a parametrului dac: M(Tn(X1, X2, , Xn)) = . Spunem c statistica Tn(X1, X2, , Xn) este o estimaie deplasat a parametrului , dac: M(Tn(X1, X2, , Xn)) = + h(n) Funcia h(n) pe care o vom numi deplasare a estimaiei are proprietatea c h( n) = 0. n Este clar c ntre eroarea de estimaie i deplasare exist o clar deosebire. n timp ce eroarea de estimare este Tn(X1, , Xn) - i este o variabil aleatoare, deplasarea h(n) = M(Tn(X1, X2, , Xn)) - este o funcie numeric, care depinde de volumul de selecie i eventual de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare. Dac deplasarea h(n) > 0 spunem c Tn(X1, X2, , Xn) este pozitiv deplasat, iar dac h(n) < 0 spunem c Tn(X1, X2, , Xn) este negativ deplasat. Din definiia funciei numerice deplasare, h(n), rezult importana cunoaterii n cazul seleciilor de volum mic. Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja. 1 n Aa de exemplu, Tn(X1, X2, , Xn) = X = X j este o estimaie nedeplasat a n j =1 mediei teoretice, m , a unei variabile aleatoare: M ( X ) = m De asemenea, frecvena relativ k este o estimaie nedeplasat a probabilitii, p, de n apariie a unui eveniment n cazul unei repartiii binomiale: np k 1 =p M = M (k ) = n n n Am vzut c, dac efectum o selecie dintr-o populaie normal i notm: 1 n 2 = ( X j X ) 2 (dispersia de selecie necorectat) i cu: n j =1

s2 =

1 n ( X j X ) 2 (dispersia de selecie corectat), atunci n 1 j =1


2

n Rezult c 2 este o estimaie negativ deplasat a dispersiei teoretice 2, n timp ce s2 este o estimaie nedeplasat a dispersiei teoretice 2 . Definiie. Spunem c Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul , dac: M(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) 0 n

M ( 2 ) =

, M(s 2 ) = 2

Spunem c Tn(X1, X2, , Xn) este o estimaie corect pentru , dac: , h(n) n 0 M(Tn(X1, X2, , Xn)) = + h(n) 0 D2(Tn(X1, X2, , Xn)) n Utiliznd rezultate obinute anterior, se deduce c momentul de selecie de ordinul r, M r este o estimaie absolut corect pentru momentul teoretic de ordinul r, Mr(X). ntr-adevr: M( M r ) = Mr(X) M 2 r ( X ) M r2 ( X ) n 0 n n particular, X este estimaie absolut corect pentru M(X) = m. D2( M r ) = n 2 2( n 1) 4 D 2 ( s2 ) = n 0 D 2 ( 2 ) = n 0 n 1 n2 Urmeaz de aici c s2 este o estimaie absolut corect pentru 2, n timp ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N(m, )). Este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru . Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i atunci este natural s o preferm pe aceea care are dispersia mai mic, ntruct valorile statisticii Tn(X1, X2, , Xn) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii. n acest sens, dm binecunoscuta teorem a minimului dispersiei, cunoscut i sub numele de teorema lui Rao-Cramer. 7.5. Teorema Rao-Cramer.Dac Tn(X1, X2, , Xn) este o estimaie absolut corect pentru parametrul din repartiia dat de f(x; ) a variabilei aleatoare X (discret sau continu), atunci: 1 , unde I( ) este cantitatea de informaie pe o D2(Tn(X1, X2, , Xn)) nI ( ) ln f ( x; 2 2 ln f ( x; ) observaie i are expresia: I ( ) = M = M 2
4

M(s2) = 2

M( 2 ) = 2

Demonstraie. Din relaia:

se obine, prin derivare n raport cu parametrul : f ( x; ) lnf(x; ) lnf(x; ) =0 dx = 0 sau - f ( x; )dx = 0 , adic M Estimaia Tn(X1, X2, , Xn) fiind nedeplasat, obinem:
M(Tn(X1, X2, , Xn)) =

f ( x; )dx = 1

... Tn ( X1 , X 2 ,..., X n ) f ( x j ; )dx1... dx n =


j =1

Derivnd, i aici, n raport cu , se obine: n ln f ( x; ) n ... T ( X , X ,..., X ) f ( x; )dx1... dx n = 1 n n 1 2


j =1

j =1

Pe de alt parte: n ln f ( x j ; ) n ... f ( x j; )dx1... dx n = 0


j=1

j=1

nmulind aceast relaie cu i scznd din relaia anterioar, obinem: n ln f ( x ; ) n j ... T ( X , X ,... X ) [ ] f ( x j; )dx1... dx n = 1, n 1 2 n

j=1

j=1

adic: n ln f ( x ; ) j M (Tn ( X1 , X 2 ,..., X n ) ) =1 j=1 Aplicnd inegalitatea lui Schwarz, se obine: n ln f ( x; ) 2 1 M Tn ( X1 , X 2 ,..., X n ) 1 j =
n ln f ( x j ; ) D 2 ( Tn ( X1 , X 2 ,..., X n ) ) D 2 j 1 = ntruct M(Tn(X1, X2, , Xn)) = i X1, X2, , Xn sunt independente, obinem: D2(Tn(X1, X2, , Xn)) = D2(Tn(X1, X2, , Xn)) n ln f(x j ; ) n 2 ln f(x j ; ) ln f(x; ) = D2 = nD 2 = D j =1 j =1 ln f(x; ) 2 = nI ( ) = nM Deci: D2(Tn(X1, X2, , Xn))
1 ln f(x; ) 2 nM

S artm c: ln f ( x; ) 2 2 ln f ( x; ) I ( ) = M = M 2 ntr-adevr, din: ns: 2 f ( x; )

f ( x; ) dx = 0

rezult:

2 f ( x; ) dx = 0 2

2 f ( x; ) lnf ( x; ) ln f ( x; ) = = ( ; ) f x f ( x; ) + 2 2

lnf ( x; ) f ( x; ) 2 ln f ( x; ) lnf ( x; ) + = f ( x; ) + f ( x; ) 2
Deci:

2 ln f ( x; ) ln f ( x; ) f ( x; )dx + f ( x; )dx = 0 2 2
i, deci: ln f ( x; ) 2 2 ln f ( x; ) M = M 2
Definiie. Spunem c estimaia Tn(X1, X2, , Xn) este eficient dac: 1 D2(Tn(X1, X2, , Xn)) nI ( )

Fie acum Tn(X1, X2, , Xn) o estimaie absolut corect oarecare. Atunci, vom numi eficien a lui , raportul: 1 nI ( ) e(Tn(X1, X2, , Xn)) = 2 D (Tn (X 1 , X 2 , ..., X n ) ) i Tn(X1, X2, , Xn) este Este evident c: 0 e (Tn(X1, X2, , Xn)) 1 eficient dac e(Tn(X1, X2, , Xn)) = 1. Cum eficiena este o funcie de volumul n a seleciei i cum la limit trebuie s obinem cea mai mare informaie posibil, rezult c, dac: lim e( Tn (X1 , X 2 , ..., X n )) = 1 , atunci estimaia Tn(X1, X2, , Xn) este asimptotic
n

eficient. Ilustrm noiunea de eficien a unei estimaii prin dou exemple prin care s cuprindem o repartiie care admite densitate de repartiie i o repartiie de tip discret. 1 n (1) S se arate c Tn(X1, X2, , Xn) = X = X j este o estimaie eficient pentru n j =1 parametrul m al repartiiei normale N(m; ); (2) S se arate c: Tn(X1, X2, , Xn) = X parametrul al unei repartiii Poisson. (P(X = x / ) = e
Soluie

este

estimaie

eficient

pentru

x
x!

, x = 0, 1, 2, ... )

(1) Din consideraii anterioare, tim c: M ( X ) = m; D 2 ( X ) = Rmne s artm c: D 2 ( X ) =


1 f ( x; m, ) = e 2
( X m )2 2 2

2
n

1 nI ( )

, x R, > 0

ln f ( x; m, ) = ln( 2 )

( X m) 2 2 2

X m 2 ln f ( x; m, ) 2 ln f ( x; m, ) X m = ; M = = M 2 m 2 m 1

M ( X m) 2 =

2 1 = 2 4
1 1 2 = = i deci: nI ( m) n / 2 n

I ( m) =

Cum D 2 ( X ) = m.

1 , nI ( m)

rezult c X este estimaie eficient pentru parametrul D2 ( X ) = n n

(2) Pentru o repartiie Poisson, D 2 ( X ) =

ln P( X = x | ) = ln e

x
x!

= + x ln ln x !

ln P( X = x ) x = 1 +
x 2 x2 2 x 1 I ( ) = M 1 = M 2 2 + 1 = 2 M ( X 2 ) M ( X ) + 1 = 1 2 + 2 +1 = 2

1 , rezult eficiena estimaiei X pentru parametrul . nI ( ) Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de proprietile pe care le au, s le clasificm. Vom cuta acum s punem n eviden modaliti sau metode de obinere a unor estimaii. n cele ce urmeaz, ne vom opri asupra a dou metode de obinere a estimaiilor pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime. Cum D 2 ( X ) = 7.6. Metoda momentelor Am vzut c momentele de selecie de ordinul r sunt estimaii absolut corecte ale momentelor teoretice de acelai ordin: M ( Mr ) = Mr ( X )
M 2 r ( X ) M r2 ( X ) n 0 n Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic momentul empiric de acelai ordin. S presupunem c am efectuat o selecie de volum n:x1, x2, , xn, dintr-o populaie caracterizat de variabila aleatoare X care are legea de repartiie dat de f ( x; 1 , 2 ,..., k ) , unde f ( x; 1 ,..., k ) este densitatea de repartiie, dac aceasta exist, sau P( X = x; 1 , 2 ,..., k ) , dac variabila X este de tip discret. Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de k parametri. Admitem c variabila aleatoare X are moment cel puin pn la ordinul k inclusiv. Atunci: M s ( X 1 , 2 ,..., k ) sunt funcii de parametrii necunoscui 1 , 2 ,..., k . Alctuind sistemul de ecuaii: M s ( X 1 , 2 ,..., k ) = M s , 1 s k , D2 ( Mr ) =
1 n s Xj n j=1 i presupunnd c sistemul admite soluii reale, se obin: $ = $ ( M , M ,..., M ); 1 s k care sunt estimaiile parametrilor s s 1 2 k 1 , 2 ,..., k . prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele 1 , 2 ,..., k . i din care s se obin ct mai uor posibil soluia cutat. Vom da acum unele exemple care s ilustreze metoda propus. Exemplu. S se estimeze prin metoda momentelor, pe baza unei selecii de volum n:x1, x2, , xn, extras dintr-o populaie caracterizat de: unde M s =

1 , dac x [1 , 2 ] f ( x; 1 , 2 ) = 2 1 , a parametrilor 1 , 2 . , dac x [1 , 2 ] 0 Soluie. ntruct + 2 2 + 1 2 + 22 ; M2 ( X ) = 1 M ( X 1 , 2 ) = 1 , 2 3 avem sistemul de ecuaii: 1 + 2 2 = M1 , 2 + + 2 1 1 2 2 = M2 3 a crui soluie este: $ = M 3 M M2 ; $ = M + 3 M M 2 , sau 1 1 2 1 2 1 2 1

$ = xs 1

3( n 1) ; n

$ =x $ +s 2

3( n 1) n

Lungimea intervalului se estimeaz prin: 2 1 = 2s

3( n 1) n La aceleai rezultate se ajunge mai simplu, dac lum sistemul: 1 + 2 = 2 x 2 , ( 2 1 ) = 2 = M 2 M12 12

sau:

1 + 2 = 2 x 2 1 = 2 32

i se continu, ajungndu-se la acelai rezultat. Exemplu. Estimarea parametrilor a, b din repartiia Beta, care are densitatea: , x (0, 1) 0 ( a, b) f ( x; a , b ) = , x a 1 (1 x ) b1 , x (0, 1) ( a ) ( b) a > 0, b> 0.

Prin calcul direct, se obine: a M1 ( X | a , b ) = a+b ab D 2 ( X | a, b) = 2 ( a + b) ( a + b + 1) $ se obin rezolvnd sistemul de ecuaii: $, b Estimaiile a
a a + b = X ab = s2 2 ( a + b) ( a + b + 1)

De aici rezult: X 2 (1 X ) $ = (1 - X) X(1 - X) 1 $= a X; b s2 2 s Exemplu. Cazul unei repartiii normale N(m; ). Dup cum se tie: M(X| m, ) = m M2(X| m, ) = m2 + 2 i avem, astfel, de rezolvat sistemul de ecuaii: $ =X m = X m care conduce la: 2 2 $ 2 = M 2 X 2 = 2 m + = M 2 7.7.Metoda verosimilitii maxime Metoda momentelor pe care am prezentat-o este simpl i uor de aplicat. Prezint, totui, o serie de neajunsuri n ceea ce privete calitile estimatorilor obinui pe aceast cale. De aceea, statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat R.A.Fisher i prezint avantajul unui plus de eficacitate. S considerm pentru nceput cazul unui singur parametru i c legea de repartiie a variabilei X ce caracterizeaz populaia din care s-a efectuat selecia de volum n, x1, x2, , xn este dat de f(x; ). Atunci, repartiia vectorului aleator (x1, x2, , xn) este:
P(x1, x2, , xn; ) =

f ( x ; ) , pe care o considerm ca funcie de .


j j =1

Valorile x1, x2, , xn fiind considerate ca date, ele fiind rezultatul experienei, vom considera ca valoare cea mai verosimil a parametrului , valoarea pentru care probabilitatea P(x1, x2, , xn; ) devine maxim, ceea ce ne conduce la faptul c estimaia de verosimilitate maxim , este soluia ecuaiei: P( x1 , x 2 ,..., x n ; ) =0 Funcia P(x1, x2, , xn; ) poart numele de funcie de verosimilitate. ntruct lnP(x1, x2, , xn; ) i P(x1, x2, , xn; ) sunt n acelai timp cresctoare sau descresctoare, estimaia de verosimilitate maxim se obine ca soluie a ecuaiei. ln P( x1 , x 2 ,..., x n ; ) =0

Funcia L(x1, x2, , xn; ) = ln P(x1, x2, , xn; ) =

ln f ( x ; )
j j =1

vom

numi tot funcie de verosimilitate. n cazul cnd repartiia unidimensional depinde de mai muli parametri, f ( x; 1 , 2 ,..., k ) , funcia de verosimilitate devine: L( x1 , x 2 ,..., x n ; 1 , 2 ,..., k ) , iar estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii: L(x1 , x 2 ,... , x n ; 1 , 2 ,.., k ) = 0 ; 1 j k

$ = $ ( x , x ,..., x ), 1 j k , estimaii de Rezolvnd sistemul, se obin: j j 1 2 n

verosimilitate maxim. L Ecuaiile = 0, 1 j k

poart numele de ecuaii de verosimilitate.

Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate maxim, care le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, dar, pentru valori mari ale lui n, repartiia ei este aproximativ normal, cu $) = i cu dispersia: media M ( 1 $) = D 2 ( ln f ( x; ) 2 nM
$ obinut prin metoda verosimilitii maxime este asimptotic Altfel spus, estimaia eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic. Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic, rezolvnd ecuaia de verosimilitate. Exemple. Pe baza unei selecii de volum n, s se estimeze parametrul din repartiia Poisson: e x P( X = x ) = , x = 0,1,2, ... x!

P(x1 , x 2 ,..., x n ; ) = P( X = x j ; ) =
j =1 j =1

e x e n j =1 = n x! xj !
j =1 n

xj

lnP(x1, x2, , xn; ) = L(x1, x2, , xn; ) = n + x j ln ln ( x j !)


j =1 j =1

L( x1 , x 2 ,..., x n ; ) j=1 = n +
iar n+

x
j=1

=0

are soluia: 1 n $ = xj = x n j=1

2 L( x1 , x 2 ,..., x n ; ) j=1 = 2 2
n

x x

$) 2 L( x1 , x 2 ,..., x n ; j=1 = 2 <0, 2 x $ asigur maximul funciei de verosimilitate. Cazul repartiiei: adic
P(X = x; p) = px (1-p)1-x , x = 0, 1 1 0 X: , 0< p < 1 p q

Funcia de verosimilitate: L( x1 , x s ,..., x n ; p ) = x j ln p + (1 x j ) ln(1 p )


j =1 n

]
,

L( x1 , x s ,..., x n ; p ) = p
care are soluia: 1 n $ = xj p n j =1

xj
j =1

n xj
j =1

1 p

=0

n n , x n xj j 2 L( x1 , x 2 ,..., x n ; p ) j =1 j =1 <0 = 2 + p p 2 (1 p ) 2

ntruct:

x
j =1

n.

Cazul repartiiei normale N(m, ):


1 2 f ( x; m, ) = e 2 , x R, > 0 2 Funcia de verosimilitate: ( X m )2

2 ( xm ) 1 2 j=1 P(x1 , x 2 ,..., x n ; m, ) = e n ( 2 )

L( x1 , x 2 ,..., x n ; m, ) = n ln 2 n ln

1 2
2

(x m)
j=1

L( x1 , x 2 ,..., x n ; m, ) 1 n = 2 ( x j m )2 m j=1 n 1 n L( x1 , x 2 ,..., x n ; m, ) = + 3 ( x j m )2 j=1


Sistemul de ecuaii de verosimilitate devine:
n ( x j m) = 0 j =1 n n + 1 ( x m) 2 = 0 , 2 j =1 j cu soluia:
$= m

1 n xj = x n j =1 1 n ( x j x ) 2 = 2 n j =1

$2 =

$ 2 ) este punct de maxim pentru L. $ , S artm c ( m 2 L( x1 , x 2 ,..., x n ; m, ) n = 2 <0 2 m 2 L( x1 , x 2 ,..., x n ; m, ) n 3 n = ( x j m) 2 2 2 4

j =1

2 L( x1 , x 2 ,..., x n ; m, ) 2 n = 3 ( x j m) m j =1
Urmeaz c:

n 2 2L 2L $) 2 3 (x j m 2 $ $ 1 j = m = = m 2 n n 3 n 2L 2L $ $ )2 3 ( x j m) 4 (x j m 2 2 $ j =1 $ $ j =1 m
n

Dar,

(x
j =1

$ ) = nm $ nm $ =0 m

i atunci: n 2 $ = 0

0 3 n 4 2 $ $

(x
j =1

$ )2 m

n $2

0
n

3n 2 $ $4

n 3n 2n + 4 = 4 >0 $4 $ $

$ 2 ) este punct de maxim pentru L. $ , deci, ( m

Cazul repartiiei normale bidimensionale f ( x , y; m1 , m2 , 1 , 2 , ) =

2 1 2 1 2 L( x1 , y1 ;...; x n , y n ; m1 , m2 , 1 , 2 , ) =
=

1 ( x m1 )2 2 ( x m1 )( y m2 ) ( y m2 )2 + 2 2 1 2 2 1 2 1

1 1 2

1 2 1

( x j m1 ) 2
j =1

1 2

( x j m1 )( y j m2 ) +
j =1

2 2 j =1

( y

m2 ) 2

n ln(1 2 ) ln( 2 ) n 2 L L L L = 0; = 0; = 0; = 0; Rezolvnd sistemul: m1 m2 1 2 se obin estimaiile de verosimilitate maxim: 1 n $ 12 = ( x j x ) 2 $1 = x m n j =1 n ln 1 n ln 2

L = 0,

$2 = y m

$2 =

1 n ( y j y )2 n j =1

1 n ( x j x )( y j y ) n j =1 $= $1 $2

7.8. Intervale de ncredere S considerm variabila aleatoare X, caracterizat de familia de repartiii f(x; ), ce depind de parametrul , a crui valoare bine determinat nu o cunoatem i pe care dorim s-o estimm, pe baza unei selecii de volum n:x1, x2, , xn . n metoda punctual de estimare se caut o funcie de selecie Tn(x1, x2, , xn) pe P care, n cazul cnd Tn(x1, x2, , xn) , o numim funcie de estimaie a parametrului . n ntruct Tn(x1, x2, , xn) variaz ca precizie, este de dorit s dispunem de o indicaie asupra preciziei ei, iar metoda intervalelor de ncredere pe care o punem n eviden acum are astfel de virtui. S presupunem c, pe baza seleciei menionate, se pot determina dou funcii de selecie, 1 ( X 1 , X 2 ,..., X n ) i 2 ( X 1 , X 2 ,..., X n ) astfel nct probabilitatea inegalitii: 1 ( X1 , X 2 ,..., X n ) 2 ( X1 , X 2 ,..., X n ) este independent de i P( 1 ( X 1 , X 2 ,..., X n ) 2 ( X 1 , X 2 ,..., X n ) ) = ( independent de ) Numrul se ia foarte apropiat de 1, ceea ce nseamn c inegalitatea 1 2 este ndeplinit n majoritatea cazurilor. Pentru o selecie efectuat 1 ( X 1 , X 2 ,..., X n ) i 2 ( X 1 , X 2 ,..., X n ) iau valori bine determinate i prin urmare am gsit un interval [ 1 ( X 1 , X 2 ,..., X n ) ; 2 ( X 1 , X 2 ,..., X n ) ] care acoper parametrul cu o probabilitate apropiat de 1. Cu ct lungimea acestui interval este mai mic i probabilitatea este mai apropiat de 1, cu att vom avea o indicaie mai precis asupra valorii parametrului . Intervalul [ 1 ( X 1 , X 2 ,..., X n ) ; 2 ( X 1 , X 2 ,..., X n ) ] este numit interval de ncredere, iar numrul nivel de ncredere. Numrul = 1 - este numit nivel de semnificaie. Subliniem faptul c afirmaia intervalul [ 1, 2] acoper valoarea parametrului cu probabilitatea este corect, cci este fixat (dei necunoscut) iar 1, 2 capetele intervalului i variabile aleatoare, depinznd de variabilele de selecie x1, x2, , xn . Vom prezenta acum dou cazuri utilizate frecvent n aplicaii pentru determinarea unui interval de ncredere. 1. Exist o funcie de datele de selecie x1, x2, , xn i de parametrul , U(x1, x2, , xn; ), cu proprietile: a) U(x1, x2, , xn; ) este continu i strict monoton n raport cu ; b) Funcia de repartiie a variabilei aleatoare U(x1, x2, , xn; ) nu depinde de sau de ali parametri necunoscui. Atunci, putem determina dou numere 1 ( ) i 2 ( ) astfel nct: P 1 ( ) U ( x1 , x 2 ,..., x n ; ) 2 ( ) =

S folosim acum faptul c U(x1, x2, , xn; ) este continu i strict monoton n raport cu . Pentru a ne fixa ideile, s presupunem c este strict cresctoare n raport cu . n acest caz, evenimentul: [ 1() U(x1, x2, , xn; ) 2()] este echivalent cu evenimentul: [ 1(x1, x2, , xn; ) 2(x1, x2, , xn; n, )] i, prin urmare, au aceeai probabilitate : P [ 1(x1, x2, , xn; n, ) 2(x1, x2, , xn; n, )] = Am determinat astfel un interval: [ 1(x1, x2, , xn; n, ); 2(x1, x2, , xn; n, )] care acoper parametrul cu probabilitatea fixat . 2. S considerm o funcie de selecie U(x1, x2, , xn) care are funcia de repartiie: G(x; ) = P (U(x1, x2, , xn) < x). Presupunem c funcia de repartiie G(x; ) admite densitatea de repartiie g(x; ).

Fie acum r, s dou numere reale pozitive, r 0, s 0, astfel nct r + s = 1 i a1( ; ), b1( ; ) dou funcii de i pentru care au loc egalitile:
a1 ( , )

g( x; )dx = r(1 );

b1 ( , )

g( x; )dx = s(1 )

Dac [a, b] este intervalul n care funcia de selecie U(x1, x2, , xn) ia valori, atunci:

g( x; )dx = 1
a

n baza proprietilor numerelor r, s i a funciilor a1( ; ), b1( ; ), rezult:


b1 ( , ) a1 ( , )

g( x; )dx = g( x; )dx
a

a1 ( , )

g( x; )dx

b1 ( , )

g( x; )dx = 1 r(1 ) s(1 ) =

Urmeaz de aici c: P(a1( ; ) U(x1, x2, , xn) b1( ; ) = i, deci, probabilitatea inegalitii U1( ; ) U(x1, x2, , xn) b1( ; ) este independent de . S presupunem c funciile a1( ; ) i b1( ; ) sunt continue i strict cresctoare n raport cu . Atunci, exist un numr A(x1, x2, , xn; ) astfel nct inegalitile: A(x1, x2, , xn; ) a1( ; ) U(x1, x2, , xn) s fie echivalente; analog, exist un numr B(x1, x2, , xn; ) astfel nct inegalitile: B(x1, x2, , xn; ) U(x1, x2, , xn) b1( ; ) s fie echivalente. Dar, atunci, inegalitatea: a1( ; ) U(x1, x2, , xn) b1( ; ) este echivalent cu: A(x1, x2, , xn; ) B(x1, x2, , xn; ) Rezult c am determinat un interval [A(x1, x2, , xn; ); B(x1, x2, , xn; )] care acoper cu o probabilitate , parametrul . n cazul n care repartiia teoretic a variabilei aleatoare de selecie U(x1, x2, , xn) este discret, n loc s considerm un interval de ncredere care acoper cu probabilitatea parametrul , vom considera un interval de ncredere care acoper parametrul cu o probabilitate cel puin egal cu . n acest caz, egalitile:
a1 ( , )

g( x; )dx = r(1 );

b1 ( , )

g( x; )dx = s(1 )

devin:
a1 ( , )

x =a

P(U = x; ) r (1 );

x=b1 ( , )

P(U = x; ) s(1 )

Intervale de ncredere pentru parametrii m i 2, dintr-o repartiie normal N(m, )

Pentru a construi un interval de ncredere pentru parametrul m vom distinge dou cazuri: cunoscut i necunoscut.
Intervalul de ncredere pentru parametrul m cnd este cunoscut. Considerm funcia de selecie: X m U(X1, X2, , Xn;n, m) = / n

X m / n este normal N(0; 1) i, deci, funcia ei de repartiie este independent de parametrul m. X m este continu i strict descresctoare n variabila m. Pe de alt parte / n Din faptul c U(x1, x2, , xn, n, m) are o repartiie normal N(0, 1) urmeaz c, pentru orice (0, 1), apropiat de 1, putem determina dou numere z1, z2 astfel nct: z 1 2 x2 /2 X m P z1 z2 = dx = ( z 2 ) ( z1 ) = , e / n 2 z1 dar evenimentul: X m z1 este echivalent cu: z2 / n Selecia fiind efectuat dintr-o proporie normal N(m, ), variabila aleatoare z1

X m z2

, care este echivalent cu:

n n m x z1 Deci: P x z 2 = n n

x z2

m x z1

i am determinat un interval:

care, cu probabilitatea , acoper parametrul m. x z 2 n ; x - z1 n Pentru fixat, se pot determina o infinitate de numere z1, z2 care s satisfac condiia (z2) - (z1) = Pe noi ne intereseaz s obinem o precizie ct mai bun i aceasta se obine cnd lungimea intervalului este minim. Urmeaz s determinm minimul funciei:
L( z1 , z 2 ) =

( z 2 z1 )

(lungimea intervalului de ncredere),

cu legtura: z 1 2 x2 /2 e dx = 2 z1 Aplicnd metoda multiplicatorilor lui Lagrange, cutm minimul funciei: 1 z2 x 2 / 2 H ( z1 , z 2 , ) = ( z 2 z1 ) + e dx n 2 z1 H H = 0; =0 rezult: Dar z1 z 2

, n n 2 adic z12 = z 2 sau z1= z2. Cum > 0, z1 = z2 nu convine i, deci, z1 = -z2; z2 = z . n acest caz, intervalul de ncredere devine: x z n ; x + z n ; z se determin din relaia: (z) - (-z) = , de unde urmeaz:
e1 e

z /2 z e = 0 i + e n 2 n 2 2 z / 2 2 z / 2

2 1
2

2 2 /2

=0

i de aici:

2 2

2(z) 1 = , sau (z) =


Deci: z este z
1

1+ 1+1 = = 1 2 2 2 1 cvantila unei repartiii normale N(0, 1). 2

n final, intervalul de ncredere pentru m, cu nivelul de ncredere = 1 - este: ; x+z x z1 1 n n 2 2


Intervalul de ncredere pentru m cnd este necunoscut.

n acest caz, se consider statistica: X m T(x1, x2, , xn; n, m) = , s/ n Dup cum am vzut, variabila

s2 =

1 n ( x j x )2 n 1 j =1

X m urmeaz o lege de repartiie Student cu n-1 s/ n X m grade de libertate. Dar legea de repartiie Student nu depinde de m i n plus este s/ n funcie continu i strict descresctoare de m. Atunci, pentru un dat, se pot determina numerele t1 i t2 astfel nct: n n/ 2 t2 2 X m t2 P t1 t2 = dt = 1 + n 1 n 1 s/ n t 1 ( n 1) 2 X m t2 este echivalent cu evenimentul: s/ n s s x t2 m x t1 , rezult c: n n s s P( x t 2 m x t1 ) = i, deci, am determinat un interval de ncredere: n n s s care, cu probabilitatea , acoper parametrul m. x t 2 n ; x t1 n Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu restricia: n n t2 2 t2 2 1 + dt = n 1 n 1 t ( n 1) 1 2 Aplicnd, i de data aceasta, metoda multiplicatorilor lui Lagrange se obine din: n n t2 2 2 2 s t + dt 1 H ( t1 , t 2 , ) = ( t 2 t1 ) + n 1 n ( n 1) n 1 t1 2 H ( t1 , t 2 , ) H ( t1 , t 2 , ) i = 0, =0 t1 t2 Cum evenimentul t1

c t1 = - t2 ,

t2 = t

iar intervalul de ncredere devine:

s s ; x+t x t1 ;n 1 1 ; n 1 n n 2 2
Intervalul de ncredere pentru 2

Se consider statistica U(X1, X2, , Xn ; 2) = o lege de repartiie (2n 1) (cu n-1 grade de libertate).

( n 1)s 2

care, dup cum se tie, are

2 astfel nct: Atunci pentru = 1 - fixat se pot determina dou numere 12 i 2

( n 1)s 2 2 P 12 2 = 2

1 n 2 2
n 2

2 2

12

x2 e

x 2

dx =

Dar funcia de repartiie a variabilei ( n 1)s


2

( n 1)s 2

este independent de 2 i n plus

este funcie continu i strict descresctoare de 2 ceea ce ne conduce la faptul c ( n 1)s 2

evenimentul:

12
2 2

2 2 este echivalent cu evenimentul:

( n 1)s

( n 1)s 2

12
adic am determinat un interval:

Deci: P(

( n 1)s 2 ( n 1)s 2 2 )=, 2 X2 X12

( n 1)s 2 ( n 1)s 2 ; 2 12 2

care, cu o probabilitate , acoper parametrul 2.

2 S stabilim valorile 12 i 2 . Densitatea de repartiie a unei variabile X2 nemaifiind simetric, i lund numai valori pozitive adoptm urmtoarea regul:

P 2 < 12 = f(x)

2 P 2 < 2 =

numit i regula cozilor egale.

1- /2 0 /2 x

2/2

12 / 2

Din modul cum s-a construit tabelele pentru repartiia (2n ) , se obine:
P 2 < 12 =

( (

) )

, deci 12 = 2/ 2; n 1

2 Urmeaz c intervalul de ncredere de nivel = 1 - este: ( n 1)s 2 ( n 1)s 2 ; 2 2/ 2; n-1 1 / 2; n-1 Dac ne intereseaz intervalul de ncredere pentru , atunci inem seama de faptul c n 1 s are densitatea de repartiie: variabila

2 P 2 < 2 = 1

2 , deci 2 = 12 / 2; n 1

x0 0 , x2 1 n 2 x e 2 , x >0 f ( x ) = n 3 n 1 2 2 2 Pentru = 1 - fixat, se pot determina dou numere U1 , U2 astfel nct: U2 2 1 n 1 s P U 1 U 2 = n 3 x n 2 e x / 2 dx = n 1 U1 2 2 2 Se obine astfel intervalul: n 1 s n 1 s ; care acoper cu o probabilitate valoarea parametrului U1 U2

Valorile numerice se pot determina cu ajutorul cuantilelor unei variabile X2. S presupunem acum c dispunem de dou selecii: x11, x12, , x1n1 efectuat dintr-o populaie N(m1, 1) i x21, x22, , x 2 n2 efectuat

dintr-o populaie N(m2, 2). Pe baza acestor selecii, obinem: 1 n1 1 n1 2 x1 = x1 j s1 = x1 j x1 n1 j =1 n1 1 j =1

1 x2 = n2

x
j =1

n2

2j

1 n2 s = x2 j x2 n2 1 j =1
2 2

Intervalul de ncredere pentru m1 m2 n cazul cnd 1, 2 sunt cunoscute

Se consider statistica: U X11 ,..., X1n1 , X 21 ,..., X 2 n 2 ; m 1 m 2 =

X1 X 2 ( m1 m 2 )

12

n1 n 2 care este o variabil normal N(0; 1), de unde urmeaz, parcurgnd punct cu punct calea urmat n cazul unei singure selecii, intervalul de ncredere.

2 2

2 12 2 + ; x1 x 2 z 1 n1 n2 2

x1 x 2 z

12
n1

2 2

n2

Intervalul de ncredere pentru parametrul m1 m2 n cazul cnd 1, 2 sunt 2 necunoscute, dar 12 = 2 =2

Se consider statistica:
X1 X 2 ( m1 m 2 ) 1 1 + n1 n 2

, 2 ( n1 1)s1 + ( n 2 1)s 2 2 n1 + n 2 2 care are repartiie Student cu n1 + n2 2 grade de libertate. Atunci procednd ca n cazul unei singure selecii dintr-o populaie normal N(m, ), obinem pentru un fixat, intervalul de ncredere:
x1 x 2 t x1 x 2 + t
1 ; n1 + n 2 2 2

U X11 ,..., X1n1 , X 21 ,..., X 2 n 2 ; m 1 m 2 =

2 + ( n 2 1)s 2 n 1 + n 2 ( n 1 1)s1 2 ; n1n 2 n1 + n 2 2 2 + ( n 2 1)s 2 n 1 + n 2 ( n 1 1)s1 2 n1n 2 n1 + n 2 2

1 ; n1 + n 2 2 2

Acest interval acoper cu probabilitatea valoarea m1 m2 .

12 Intervalul de ncredere pentru raportul 2 . 2


Am vzut c funcia de selecie:
2 U ( X 11 , X 12 ,..., X 1n1 , X 21 , X 22 ,..., X 2 n2 ; 12 , 2 )=

12
2 2 2 s2

s12

are o repartiie Snedecor cu n1-1, n2-1 grade de libertate. Am notat: 2 s12 Fn1 1, n2 1 = 2 2 i am vzut c funcia de repartiie este independent de 1, 2, 12 s2 iar Fn1 1, n2 1 ca funcie de 2 1
2

este continu i strict cresctoare.

Atunci, pentru = 1 - dat, se pot determina dou numere F(1) i F(2), astfel nct: P F (1) Fn1 1, n2 1 F ( 2 ) = 1

n ipoteza c adoptm cozi egale, se obine: P F = 1 Fn1 1, n2 1 F n1 1, n2 1 ;1 n1 1, n2 1 ; 2 2

Cum evenimentul: 2 s12 2 F F 2 2 n1 1, n2 1 ;1 n1 1, n2 1 ; 2 1 s2 2 este echivalent cu evenimentul:

s1 s2 F

n1 1, n2 1;1

s 1 1 1 2 s2 F

n1 1, n2 1;

rezult c am obinut intervalul de ncredere: 2 2 s1 1 1 s1 ; , s2 F s2 F n1 1, n2 1;1 n1 1, n2 1; 2 2


care, cu probabilitatea , acoper valoarea parametrului: 1 2 1 Observaie. ntruct Fk1 ,k2 = , rezult c intervalul de ncredere pentru raportul Fk2 ,k1
2 12 / 2 mai poate fi scris sub forma: 2 s 2 s1 1 F F ; s s n 2 1, n1 1;1 n2 1, n1 1; 2 2 2 2 n problemele privind durata de funcionare a unui produs, adesea se utilizeaz o repartiie exponenial. x0 0, x f ( x, ) = 1 e , x > 0, > 0 Ne propunem s determinm un interval de ncredere pentru parametrul , care are semnificaie de durat medie de funcionare. Dup cum tim, funcia caracteristic a unei variabile exponenial negative de parametrul este: X ( t ) = (1 i t)-1 S efectum o selecie de volum n:x1, x2, , xn, din populaia caracterizat de aceast variabil aleatoare i s considerm statistica: 2 n U ( X 1 , X 2 ,..., X n ; ) = X j 2

j =1

Funcia ei caracteristic este: n 2it n n n X i 2t X j 2t 2t j =1 j itU u (t ) = M ( e ) = M e M e = X j =1 i = j =1 j =1

Deci: U ( t ) = (1 2it )

care este funcia de repartiie a unei variabile (22 n ) (cu 2n

grade de libertate). Urmeaz c funcia de selecie: 2 n U ( X 1 , X 2 ,..., X n ; ) = X j

j =1

urmeaz o lege de repartiie

2 ( 2n )

cu 2n grade de libertate.

2 Atunci, pentru = 1 - dat, putem determina dou numere: 12 i 2 astfel nct:

2 2 n 1 2 P 12 X j 2 x n 1e x / 2 dx = = 1 = n 2 n ( ) j=1 12

Adoptnd ipoteza construirii unui interval cu cozi egale, se obine intervalul de ncredere: n n 2 X 2 Xj j j=1 j=1 ; 2 2 ;2 n 1 2; 2 n 2 care, cu probabilitatea = 1 - , acoper valoarea parametrului . 7.9 Intervale de ncredere pentru parametri n cazul seleciilor de volum mare Am vzut c determinarea unui interval de ncredere pentru parametrul care apare n legea de repartiie f(x; ) se baza pe construirea unei funcii de selecie care s depind de datele de selecie x1, x2, , xn, de volumul de selecie n i de parametrul de estimat . Pentru a putea determina efectiv intervalul de ncredere se fceau ipoteze suplimentare asupra funciei de repartiie a statisticii, printre care i faptul c aceast funcie de repartiie nu depinde de parametrul de estimat. n cazul unei legi normale N(m; ) se puteau obine relativ simplu intervale de ncredere pentru m sau/i , indiferent dac n (volumul seleciei) era mic sau nu. n multe alte situaii, aflarea funciei de repartiie a statisticii este o problem dificil, ns putem determina repartiia asimptotic a unei statistici care conine parametrul necunoscut i, deci, dac n este suficient de mare, erorile pe care le comitem utiliznd repartiia asimptotic sunt cu totul neglijabile. Fie variabila aleatoare X cu densitatea de repartiie f(x; ) ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n; x1, x2, , xn . n ipoteza c valorile de selecie sunt independente, se obine funcia de verosimilitate: L(x1, x2, , xn,n; ) =

f ( x ; )
j j =1

De aici urmeaz c: ln L n ln f ( x j ; ) =

j =1

Notnd: y j = se obine:

ln f ( x j ; ) ,

1 j n,

ln f ( x; ) M(Yj) = M = Presupunem c:
ln f ( x; ) 0 < M2 =

ln f ( x; ) f ( x; )dx = 0

ln f ( x; ) f ( x; )dx <

Atunci: ln f ( x; ) ln f ( x; ) D2 = M2 , iar variabila:

ln L ln L M = ln L D

ln f ( x j ; ) n ln f ( x j ; ) M j =1 j =1 = n ln f ( x ; ) j D2 j =1
n

Y
j =1

nD

ln f ( x; ) 2 unde am notat D2 = D , n baza teoremei lui Liapunov, este asimptotic N(0; 1). Deci: n Yj b 2 j=1 = 1 P a < < b e x / 2 dx lim 2 a nD n i, prin urmare, pentru n suficient de mare, statistica:
1 ln L( x1 ,.., x n ; ) nD nD ln L( x1 ,..., x n ; ) Dac, n plus
j j =1

urmeaz aproximativ o lege de repartiie N(0; 1).


este strict monoton n raport cu , atunci,

urmnd calea obinuit, putem construi un interval de ncredere pentru oricare ar fi nivelul de semnificaie (0; 1). Vom aprecia metoda intervalelor de ncredere pentru selecii de volum mare n cazul repartiiei binomiale i Poisson, apoi vom arta c n cazul legii normale obinem rezultatele cunoscute anterior, ceea ce este natural.
Repartiia binomial

S considerm variabila aleatoare: 1 0 X: , p + q = 1 (p > 0) p q Atunci: f(x; p) = px(1-p)1-x x = 0, 1;p (0; 1) Pe baza unei selecii x1, x2, , xn din populaia C caracterizate de variabila aleatoare X, obinem: L(x1, x2, , xn; p) = Dac punem:

f ( x ; p) = p
j j=1

xj
j=1

(1 p ) j=1

(1 x j )

x
j=1

= k , atunci ln L(x1, x2, , xn, n;p) = k ln p + (n-k) ln(1-p) i, deci:

ln L k n k k np = = p 1 p p(1 p ) p x p ln f ( x; p ) x 1 x Cum: Y = = , = p 1 p p(1 p ) p


M (Y ) = M( X ) p =0 p(1 p )

avem imediat:

Xp p(1 p ) 1 1 D 2 (Y ) = D 2 D 2 ( X p) = 2 = = D2 = 2 2 2 p (1 p ) p(1 p ) p(1 p ) p (1 p )

Atunci variabila: k p 1 ln P 1 k np j =1 n = = = 1 p(1 p ) nD nD p p(1 p ) n p(1 p ) n are o lege de repartiie N(0; 1) i, deci, pentru n suficient de mare: k p n P < z z z = 1 1 p(1 p ) 1 2 1 2 2 n ns, inegalitatea:
j

k p $ 2 2 pp $ + p2 ) n( p n < z2 , este echivalent cu: <z 1 1 p ( 1 p ) p(1 p ) 2 2 n k $= estimaia probabilitii p (care este tocmai frecvena relativ) unde am notat p n Inegalitatea poate fi scris: $ + z2)p + n p $2<0 (n + z2)p2 (2n p Dac punem:

$ + z 2 z 4np $ (1 p $) + z2 2np p1 = 2( n + z 2 ) $ + z 2 + 2 4np $ (1 p $ ) + z2 2np p2 = 2( n + z 2 ) adic rdcinile ecuaiei: $ + z2) + n p $ 2 = 0 , atunci: (n + z2)p2 (2n p

$p p P < z = P( p1 < p < p2 ) = 1 , sau: 1 p(1 p ) 2 n 2np $ + z 2 z 4np $ (1 p $ ) + z2 $ + z 2 + z 4np $ (1 p $ ) + z2 2np P p < < 2(n + z 2 ) 2( n + z 2 )

$ (1 p $ ) z2 $ (1 p $ ) z2 z2 z2 4p 4p 2p $+ z $+ +z + 2 + 2 2p n n n n n n = P < p< 2 2 z z 21 + 21 + n n Deci, un interval pentru parametrul p, cu nivelul de ncredere 1 - este dat de: $ (1 p $ ) z12 / 2 z12 / 2 4p $ (1 p $ ) z12 / 2 z12 / 2 4p 2 $ 2 p z + + 2 $ 2 p z + + + 2 1 1 2 n n n n n n 2 ; 2 2 z z 21 + 1 / 2 21 + 1 / 2 n n

Cum n este suficient de mare, termenii z12 / 2 z12 / 2 , pot fi neglijai, i atunci: n n2 $ (1 p $) $ (1 p $) p p $z $+z P p <p<p 1 1 1 n n 2 2

Repartiia Poisson

Fie variabila aleatoare: x X: x , x = 0, 1, 2, ... e x!

; x = 0,1,2,... Atunci, dac x1, x2, , xn este o x! selecie de volum n, efectuat din populaia caracterizat de variabila aleatoare X, se obine funcia de verosimilitate:
e n j =1 xj !
n

repartizat Poisson, deci f(x; ) = e

L( x1 , x 2 ,... x n , n; ) = f ( x j ; ) =
j =1

x
j =1

De aici urmeaz:

n lnL ln L( x1 , x 2 ,..., x n , n; ) = n + x j ln ln x j ! ; = n + j=1 j=1


n

x
j=1

Totodat: ln f(x; ) = - + x ln - ln x!

i:

ln f ( x; ) x x = 1 + = =Y 1 1 M( X) = 0; D 2 (Y ) = 2 D 2 ( X ) = = D 2 M (Y ) =

Yj
Deci:
j=1

X
j=1

nD

i, prin urmare:
X < z = P lim n n

1 2

x2 / 2

dx

Atunci pentru un nivel de ncredere 1 - dat, putem determina z n suficient de mare: X P z < < z z z = 1 1 1 2 1 2 1 2 2 n Din inegalitatea
X <z

astfel nct, pentru

care este echivalent cu:

z 2 sau n2 ( 2nX + z 2 ) + X 2 < 0 n rezult c putem determina 1, 2 astfel nct: X P z < < z = P( 1 < < 2 ) z z , 1 1 2 1 2 1 2 2 n cu 1, 2 rdcinile ecuaiei: n2 ( 2nX + z 2 ) + nX 2 = 0 Cum:

X 2 2 X + 2 <

1, 2 =

2nX + z ( 2nX + z ) 4n X = 2n
2 2 2 2 2

2nX + z 2 2nz 2n

X z2 + 4 n2 ,

z2 z2 z2 z2 1 1 1 1 X X P X + 2 z + 22 < < X + 2 + z + 22 1 , 1 1 2n n n 2n n n 2 2 sau, dac lum n consideraie faptul c n este suficient de mare, putem neglija termenul 1 2 z1 / 2 , iar intervalul de ncredere pentru se obine din: 2n X X 1 P X z < < x + z 1 1 n n 2 2

Repartiia normal N(m; )

Vom considera mai nti cazul cnd se cunoate . Atunci, dac x1, x2, , xn este o selecie de volum n din populaia C caracterizat de variabila aleatoare X repartizat N(m; ), funcia de verosimilitate va fi:
L( x1 , x 2 ,..., x n , n; m, ) = f ( x j ; m, ) =
j =1 n

1 2

1 2 2

( x j m )2
j =1

din care rezult:

ln L 1 = 2 m

( x j m) =
j =1

1 n x nm 2 j j =1

Totodat: ln f ( x; m, ) X m = =Y, m 2 de unde rezult: 1 2 1 X m 2 M (Y ) = 0, D 2 (Y ) = D 2 = 4 D (X m) = 2 = D 2 Rezult c: n 1 n X nm Xj m X m j n j =1 1 n j =1 = Yj = n 2 = D n j =1 n n are o repartiie N(0; 1) (exact, nu numai asimptotic), deci: Xm P z < < z = 1 1 1 2 2 n sau P X z <m<x+z = 1 1 1 n n 2 2 obinnd astfel din nou un interval de ncredere pentru m, cnd este cunoscut. Dac este necunoscut, atunci: z Xm 2/ 2 1 = P z e x dx < lim s 2 n n deci, dac n este suficient de mare: Xm < z z z = 1 P z < 1 s 1 2 1 2 1 2 2 n Deci: s s <m<X+z P X z 1 1 1 n n 2 2

S-ar putea să vă placă și