Sunteți pe pagina 1din 7

MA Curs 3 Statistică 1

II Metoda verosimilității maxime


Definiție. Fie X1 , X 2 ,..., X n o selecție de volum n
Fie X variabila aleatoare teoretică asociată selecţiei, cu densitatea de repartiție
f : IR  IR , f  f x, 1 ,...,  p 

1 ,..., p sunt parametrii necunoscuți ce trebuie aflați.

Definim funcția de verosimilitate


L : IR n  IR p  IR ,

L x1 , x 2 ,..., x n , 1 ,  2 ,..,  p    f x j , 1 ,  2 ,..,  p 


n

j1

ce reprezintă probabilitatea de a obține valorile x 1 , x 2 ,..., x n .


Teoremă. În condiţiile de mai sus, cea mai bună estimație a parametrilor 1 ,..., p sunt

valorile pentru care funcția de verosimilitate are valoarea maximă.


Observație. Punctele de extrem ale funcției L coincid cu cele ale funcției ln L .
Practic
Găsim punctele critice ale funcției ln L rezolvând sistemul

 ln L x 1 , x 2 ,..., x n , 1 ,  2 ,..,  p 0 ,
j  1, p
j

apoi verificăm dacă soluția găsită reprezintă un punct de maxim pentru ln L .


Exemplu. Să se estimeze parametrul  al repartiției Poisson pe baza unei selecții de
volum n care a dat rezultatele x1 , x 2 ,..., x n  0 .
Rezolvare. Repartiția Poisson este
 0 1 ... x ... x 
Po   :  x e   , f x,     e
 
e e ... ... x!
 x! 
Formăm funcția de verosimilitate

x1  x 2 ... x n e  n
   xe!
xj


n n
L x 1 , x 2 ,..., x n ,    f x j,   .
j1 j1 j x 1! x 2 !...x n !

Atunci ln L x1 , x 2 ,..., x n ,   n  x1  x 2  ...  x n ln   ln x1!x 2 !...x n ! .


 ln L x  x 2  ...  x n
 n  1
 

 ln L x  x 2  ...  x n
Rezolvăm 0   1 X
 n
MA Curs 3 Statistică 2

 2 ln L x  x 2  ...  x n
Pentru   X avem  1 0,
 2
2

deci ln L are un punct de maxim. Atunci media de selecție X este un estimator de


maximă verosimilitate pentru  .
Estimare prin intervale de încredere
Chestiuni pregătitoare
1. Să se afle soluţia ecuaţiei x   0,98 , unde  este funcţia lui Laplace.
Rez.
Mathcad Excel
x   1 0,98  Z0,98 x  qnorm0.98,0,1 x  NORMSINV0.98
not

qnorm( 0.980 1)  2.054

2. Să se afle soluţia ecuaţiei Fx   0,98 unde F este funcţia de repartiţie a repartiţiei
Student cu n  1 grade de libertate, n=20.
qt( 0.9819)  2.205

x  t 0,98,19  qt 0.98,19  2,205


not

Excel x  TINV2  1  0.98,20  1  TINV0.04,19


x= TINV(0.04,19) 2.205

3. Să se afle soluţia ecuaţiei Fx   0,98 , unde F este funcţia de repartiţie a repartiţiei  2
cu n grade de libertate, n=20.

Mathcad Excel
qchisq 0.98,20 CHIINV1  0.98,20
not
x  h 0.98, 20
qchisq ( 0.9820)  35.02

Teoremă. Dacă X1 ,..., X n e o selecţie de volum n dintr-o populaţie normală N m,  2 ,  


atunci
Xm
a) Y  are o repartiție normală standard N0,1 .
/ n
Xm
b) variabila aleatoare t  are o repartiţie Student cu n  1 grade de libertate,
ŝ / n
unde ŝ 2 este dispersia modificată de selecție.

ESTIMARE PRIN INTERVALE DE ÎNCREDERE

- Presupunem că asociem unor date variabila aleatoare X


- X are densitatea de repartiţie f x,  , cu  =parametru ce trebuie aflat
- ̂ =estimator al parametrului.
MA Curs 3 Statistică 3

-  
Dorim să găsim un interval ˆ  , ˆ   astfel încât

P ˆ      ˆ    1   
- Numărul 1   se numeşte nivel de încredere (sau coeficient de încredere)
- În practică se consideră nivele de încredere de 95% ,98% sau 99%, deci   0,05 ,
  0,02 sau   0,01 .

Repartiţia normală

I. Interval de încredere pentru parametrul m, dispersia  2 cunoscută:



m X   , X   unde   Z 
n 1 2
   
adică P  X  Z  mX Z    1  
 n 1 2 n 1 2 
unde  2 este dispersia teoretică,

Z  este soluţia ecuaţiei x   1  ,
1 2
2

 
 este funcţia lui Laplace, Z    1 1  
1
2  2

Mathcad EXCEL
 α  
Z α  qnorm1  ,0,1  Z   CONFIDENCE(, , n )
1
2  2  n 1 2

Z0,9  1,282 Z0,95  1,645 Z0,975  1,96 Z0,98  2,054 Z0,99  2,326 Z0,995  2,58

Observații.
 Intervalul se poate utiliza şi pentru media teoretică a altor repartiţii, dacă se cunoaşte  2
(dispersia teoretică) și n este mare.
 Intervalul are lungimea mai mică dacă σ este mic şi n este mare.
 Z1α  Zα .
 Se observă că dacă nivelul de încredere creşte (  scade) atunci Z creşte, deci şi lungimea
intervalului.
Exemplul 1. Se consideră o selecţie de volum n  100 cu media de selecţie X  27,5 .
Presupunem că asociem datelor repartiţia normală Nm,4 . Să se determine pentru media m un
interval de încredere a) 95% , b) 99%.
Rezolvare. a) 2  4    2 ; 1    0,95    0,05 
Z   Z 0,975 =  1,96 . Atunci intervalul cerut este
1
2

 
 27,5  1,96 ; 27,5  1,96   27,108 ; 27,892
2 2
 10 10 
adică m 27,108 ; 27,892 cu probabilitatea 95%.
MA Curs 3 Statistică 4


sau Z   CONFIDENCE(, , n )  CONFIDENCE(0.05,2,100)  0,392
n 1 2
b) 1    0,99    0,01 
Z   Z 0,995 =  1 0,995  qnorm(0.995,0,1)  2,58 . Atunci intervalul cerut este
1
2

 
 27,5   2,58 ; 27,5   2,58   26,984 ; 28,016
2 2
 10 10 
II. Interval de încredere pentru parametrul m, dispersia  2 necunoscută
X   , X   unde   ŝ t1  ,n1
n 2
 ŝ ŝ 
adică P  X  t  mX t    1   ,
 n 1 2 ,n 1 n 1 2 ,n 1 
unde ŝ 2 este dispersia modificată de selecţie

t  este soluţia ecuaţiei F x   1 
1 , n 1 2
2
F este funcţia de repartiţie a repartiţiei Student cu n  1 grade de libertate
Mathcad Excel
  
t 
1 , n 1 qt 1  , n  1 TINV, n  1
2  2 

Observaţie. F x   1  Fx 

Exemplul 2. Considerăm o populație normală de parametrii m și  2 . Pe baza selecției care a dat


următoarele rezultate să se determine un interval de încredere pentru m
a) 95%; b) 98%.
xj 3 3,5 4 4,5 5
nj 2 5 7 4 3
Rezolvare. Deoarece dispersia este necunoscută, intervalul este de forma ,
 ŝ ŝ 
X  t  ,X  t   , X  4,02 , ŝ  0,59 , n  21
 n 1 2 ,n 1 n 1 2 ,n 1 

xj nj xj*nj
3 2 6 2 2.10
3.5 5 17.5 1.25 1.37
4 7 28 0 0.00
4.5 4 18 1 0.91
5 3 15 3 2.86
sume 21 84.5 7.25 7.238

media 4.02 disp mod 0.345 s^ 0.59

ŝ 0.59
a) 1    0,95 ,   0,05 , t   t 0,975, 20  2,086 ,   t    2,086  0,268
1 , n 1
2 n 1 2 ,n 1 21
MA Curs 3 Statistică 5

Intervalul cerut este


4,02  0,268; 4,02  0,268  3,752 ; 4,288
adică m 3,752 ; 4,288 cu probabilitatea 95%.
ŝ 0.59
b) 1    0,98    0,02 , t   t 0,99, 20  2,528 ,   t    2,528  0,325
1 ,n 1 n 21 , n 1 21
2

Intervalul cerut este


4,02  0,325 ; 4,02  0,325  3,695 ; 4,345
adică m 3,695 ;4,345 cu probabilitatea 98%.
qt( 0.97520)  2.086 qt( 0.9920)  2.528

III. Interval de încredere pentru medie (orice repartiţie), când dispersia este necunoscută, iar n
este mare, n  30 :
 ŝ ŝ 
X  Z , X  Z 
 1

1 

 n 2 n 2 

Exemplul 3. Pentru a studia o caracteristică a unei populații statistice s-a făcut o selecție și s-au
obținut următoarele rezultate:

valori 0 1 2 3 4 5 6 7 8
Frecv 1 1 4 10 5 5 2 1 1
abs
a) Să se reprezinte datele grafic; b) Presupunând că datele urmează o repartiție Poisson, să se
estimeze parametrul  ; c) Să se determine un interval de încredere 98% pentru  .
Rezolvare.a)

10
8

6
y
4

0 2 4 6 8
x
b) X  3,7 , ŝ  1,696 . Se știe că un estimator pentru parametrul  este media de selecție, deci
  3,7 .
c) Un interval de încredere pentru media populației, când dispersia este necunoscută, iar n  30 ,
este
 ŝ ŝ 
X  Z , X  Z 
 
n 1 2 n 1 2 


MA Curs 3 Statistică 6

ŝ 1,696
  0,02 , Z   Z 0,99  2,326 , n  30 , X Z   3,7   2,326  2,98 ,
1 n 1 2 30
2

Z   4,42 . Atunci   2,98; 4,42 .



X
n 1 2
IV. Interval de încredere pentru  2 , când parametrul m este cunoscut:
 k 
  x j  m    j  x j  m    j 
k
2 2

 j1 j1 
 h 
,
h  adică
 1 , n ,n 
 
2 2


  x j  m    j x j  m2   j 
k k


2

 j1 j1 
P  2    1 
h  h
 1 , n ,n 
 
2 2


unde h α este soluţia ecuaţiei F x   1 
1 , n 2
2

F este funcţia de repartiţie a repartiţiei 2 cu n grade de libertate,


    
h   qchisq 1  , n  = CHIINV , n 
1 ,n
2  2  2 
V. Interval de încredere pentru  2 , când parametrul m este necunoscut:
   
 n  1  ŝ 2 n  1  ŝ 2   n  s2 n  s2 
 ,   , 
 h 1  , n 1 h
, n 1
  h 1  ,n 1 h  ,n 1 
 2 2   2 2 
 
 n  s2 n  s 2 
adică P   2   1 
 h 1  , n 1 h 
, n 1
 2 2 

Exemplul 4. Considerăm o populație normală de parametrii m și  2 . Să se determine un interval


de încredere 95% pentru dispersia  2 , pe baza selecției care a dat următoarele rezultate, în
cazurile
b) m  4 ; b) m necunoscut.
xj 3 3,5 4 4,5 5
nj 2 5 7 4 3
Rezolvare.
a) Intervalul de încredere pentru  2 , când parametrul m este cunoscut este:
 k 
  x j  m    j  x  m   j 
k
2 2
j
 j1 j1 
 , 
h  h
 1 , n ,n 
 
2 2
MA Curs 3 Statistică 7

xj nj xj*nj
3 2 6 2 2.10
3.5 5 17.5 1.25 1.37
4 7 28 0 0.00
4.5 4 18 1 0.91
5 3 15 3 2.86
sume 21 84.5 7.25 7.238

media 4.02 disp mod 0.345 s^ 0.59

 x  m    j  7,25 ,
5
unde m  4 ,
2
j
j1

h   h 0.975, 21  qchisq 0.975,21  35,479 = CHIINV(0.025,21)


1 ,n
2

 x  m   j  x  m   j
5 5
2 2
j j

h   qchisq 0.025,21  10,283 ,


j1 j1
 0,204  0,705 . Atunci
2
,n h  h
1 , n ,n
2 2

 2   0,204 ; 0,705     0,45 ; 0,84 .

7.25 7.25
 0.204  0.705
qchisq ( 0.97521) qchisq ( 0.02521)

c) Intervalul de încredere 95% pentru  2 în cazul m necunoscut este


 
 n  1  ŝ 2 n  1 ŝ 2 
 , 
 h 1  , n 1 h
, n 1

 2 2 

unde   0,05 , X  4,02 este media de selecție, n  1  ŝ 2   x j  X    j  7,238


5
2

j1

h   h 0.975, 20  qchisq 0.975,20  34,17


1 , n 1
2

h  h 0.025, 20  qchisq 0,025;20  9,591


, n 1
2

7.238 7.238
 0.212  0.755
qchisq ( 0.97520) qchisq ( 0.02520)

n  1  ŝ 2  0,212
n  1  ŝ 2  0,755
h  h
1 , n 1 , n 1
2 2

Atunci  2   0,212 ; 0,755      0,46 ; 0,869 

S-ar putea să vă placă și