Sunteți pe pagina 1din 28

Cursul 8

Propoziia 1. Proprietile dispersiei sunt:


i) Dac ( ) X c
, atunci ( ) 0 D X
;
ii) Dac X este o variabil aleatoare cu dispersia ( ) D X
finit i aR
atunci ( ) ( )
2
D a X a D X
;
iii) Dac X i Y sunt variabile aleatoare independente definite pe acelai cmp
de probabilitate atunci ( ) ( ) ( ) D X Y D X D Y t +
.
Definiia 1. Numim abatere medie ptratic a variabilei aleatoare X,
notat
X

sau simplu , numrul: ( )


X
D X .
Definiia 2. Numim variabil aleatoare normat orice variabil aleatoare
cu media egal cu zero i dispersia egal cu unu.
Observaie: Dac X este o variabil aleatoare cu media m i dispersia ( ) D X

finite atunci variabila aleatoare:
( )
( )
( )
X m
Z
D X


, este variabil
aleatoare normat.
Definiia 3. Numim covariana variabilelor aleatoare X i Y (notat cov(X,Y))
media variabilei ( ) ( ) ( ) ( )
X M X Y M Y
, deci:
( ) ( ) ( ) ( ) ( )
cov , X Y M X M X Y M Y
1

]
Propoziia 2. Are loc egalitatea:
( ) ( ) ( ) ( ) cov , X Y M X Y M X M Y
Corolarul 1. Dac variabilele aleatoare X i Y sunt independente atunci
( ) cov , 0. X Y
Definiia 4. Numim coeficient de corelaie al variabilelor aleatoare X i Y
numrul:
( ) ( )
( ) ( )
,
cov , cov ,
X Y
X Y
X Y X Y
D X D Y


Definiia 5. Dac
,
0
X Y

spunem c variabilele aleatoare X i Y sunt
necorelate.
1
Propoziia 3. Oricare ar fi variabilele aleatoare X i Y coeficientul lor de
corelaie aparine intervalului [ ]
1,1
.
Propoziia 4. Dac X i Y sunt dou variabile aleatoare definite pe acelai
cmp de probabilitate atunci:
i) ( ) ( ) ( ) ( ) 2 cov , D X Y D X D Y X Y + + +
;
ii) ( ) ( ) ( ) ( ) 2 cov , D X Y D X D Y X Y +
.
Variabile aleatoare vectoriale
Definiia 6. Numim variabil aleatoare bidimensional (sau vector aleator
bidimensional) aplicaia: ( )
2
1 2
, : X X X R , ale crei componente
:
i
X R
, 1, 2 i sunt variabile aleatoare reale.
Definiia 7. Funcia
2
: F R R definit prin:
( ) ( )
1 2 1 1 2 2
, , F x x P X x X x < <
pentru orice ( )
2
1 2
, x x R se numete
funcia de repartiie a variabilei aleatoare ( )
2
1 2
, : X X X R .
Propoziia 5. Dac
2
: F R R este funcia de repartiie a vectorului
aleator ( )
2
1 2
, : X X X R atunci:
i)
( )
1 2
1,2
lim , 1
x
i
i
F x x

;
ii)
( )
1 2
lim , 0
x
i
F x x

, pentru orice 1, 2 i ;
iii) F este cresctoare n fiecare argument;
iv) F este continu la stnga n fiecare argument.
Fie ( )
2
1 2
, : X X X R o variabil aleatoare vectorial cu funcia de
repartiie ( ) ( )
1 2 1 1 2 2
, , F x x P X x X x < <
pentru orice ( )
2
1 2
, x x R .
Pentru orice { } 1, 2 i
,
:
i
X R
este o variabil real, numit
component a vectorului aleator ( )
1 2
, X X X
.
Notm ( )
i i
F x ,
i
x R funcia de repartiie a componentei X
i
adic
( ) ( )
i i i i
F x P X x <
pentru 1,2 i .
2
Propoziia 6. Au loc egalitile:
( ) ( )
2
1 1 1 2
lim ,
x
F x F x x

, pentru orice
1
x R
,
i
( ) ( )
1
2 2 1 2
lim ,
x
F x F x x

pentru orice
2
x R
.
Fie
:
i
X R
, 1, 2 i , variabile aleatoare.
Propoziia 7. Variabilele aleatoare X
i
,
1, 2 i
, sunt independente dac i
numai dac funcia de repartiie a vectorului aleator ( )
1 2
, X X X
este
produsul funciilor de repartiie marginale, adic:
( ) ( ) ( )
1 2 1 1 2 2
, F x x F x F x
, pentru orice ( )
2
1 2
, x x R .

Funcii generatoare de momente
Fie ( ) , ,P K
un cmp borelian de probabilitate i : X R o
variabil aleatoare.
Definiia 8. Aplicaia
: g D R
definit prin ( ) ( )
t X
g t M e

se numete
funcia generatoare de momente a variabilei aleatoare X, unde D este
domeniul maxim de definiie.
Aadar:
i) Dac
1
1
:
i n
i n
x x x
X
p p p
_

,
L L
L L
, atunci ( )
1
n
t x
i
i
i
g t e p


;
ii) Dac X are densitatea de repartiie ( ) f x
, atunci
( ) ( )
t x
g t e f x dx

R
dup cum variabila aleatoare X este discret (i) sau continu (ii).
Propoziia 8. Dac variabila aleatoare X admite momentul iniial de ordinul k
finit atunci: ( )
( )
( ) 0
k k
k
m M X g

Inegalitatea lui Cebev:
Dac variabila aleatoare : X R are media m i dispersia
2

finite
atunci, pentru orice 0 > , are loc inegalitatea
( )
2
2
1 P X m

<


3
Cursul 9
Funcia caracteristic
Definiia 1. Aplicaia
: R C
definit prin: ( ) ( )
i t X
t M e


, unde
2
1 i
, se numete funcia caracteristic a variabilei aleatoare X.
Propoziia 1. Funcia generatoare ( ) x
, t R a variabilei aleatoare X
verific urmtoarele proprieti:
i) ( ) 0 1
;
ii) ( ) 1 t
oricare ar fi t R;
iii) ( ) ( ) t t ;
Momentele variabilelor aleatoare vectoriale
Fie ( ) , ,P K
un cmp (borelian) de probabilitate. Vom considera
( )
2
, : X Y R
o variabil aleatoare bidimensional.
Definiia 2. Valoarea medie a produsului
r s
X Y
se numete moment iniial
de ordinul r n raport cu componenta X i de ordinul s n raport cu
componenta Y a variabilei aleatoare vectoriale (X,Y), , r s N, notat m
r,s
.
Conform acestei definiii avem: ( )
,
r s
r s
m M X Y
m
r,s
se poate exprima sub forma:
( )
( )
1 1
,
, Y , (i)
, , (ii)
m n
r s
i j i j
i j
r s
r s
x y P X x y
m
x y f x y dx dy

'


R R
dup cum (X,Y) este variabil aleatoare discret i) sau continu ii).
De aici pentru
*
r N i 0 s , obinem:
( )
( ) ( )
,0 1
,
r r r
r
m M X x f x dx x f x y dx dy

R R R

iar pentru
*
s N i 0 r avem:
( ) ( ) ( )
0, 2
,
s s s
s
m M Y y f y dy y f x y dx dy

R R R

4
adic momentul iniial de ordinul r al componentei X (m
r,0
) i momentul
iniial de ordinul s al componentei Y (m
0,s
).
Pentru 1 r i 0 s se obine media componentei X, iar pentru 0 r i
1 s se obine media componentei Y:
i) ( )
1,0
m M X
; ii) ( )
0,1
m M Y
.
Dac m
1,0
i m
0,1
sunt finite definim variabila aleatoare vectorial:
( )
2
1,0 0,1
, : X m Y m R
Definiia 3. Numim moment centrat al variabilei aleatoare (X,Y), de
ordinul r n raport cu componenta X i de ordinul s n raport cu componenta
Y, media produsului
( ) ( )

1,0 0,1
r s
X m Y m , notat
, r s

.
Prin urmare avem: ( ) ( )

, 1,0 0,1
r s
r s
M X m Y m
1

1
]


Repartiii clasice
Definiia 4: Variabila aleatoare X are repartiie Poisson de parametru
0 > dac:
( )
!
x
P X x e
x


,
x N
.
Notm cu Po() repartiia Poisson cu parametrul .
Propoziia 2. Dac ( ) ~ X Po
atunci:
i) ( ) M X
; ii) funcia generatoare de momente este
( )
( )
1
t
e
g t e

; iii)
( ) D X
.
Demonstraie. Se calculeaz:
i) ( )
( )
1
0 1 ! 1 !
x x
x x
M X x e e e e
x x


ii)
( ) ( )
( )

0 0
!
x
t
t
t x e
x x
e
g t e P X x e e e
x




iii)
( )
( )
1
' ,
t
e
t
g t e e


( ) ( ) ' 0 M X g
,
( )
( ) ( )
1 1
2
'' ,
t t
e e
t t
g t e e e e

_
+

,
( ) ( ) ( )
2
'' 0 1 , M X g +
de unde rezult ( ) ( ) ( )
2 2
D X M X M X
.
5
Definiia 5: Variabila aleatoare X are repartiia normal de parametrii m i
dac densitatea ei de repartiie este:

( )
2
1
2
1
2
x m
f x e
_


,


, xR , mR, 0 >
Notm ( ) ~ , X N m
Pentru 0 m i 1 se obine repartiia normal normat, (notat
N(0,1)), a crei densitate de repartiie este:
( )
2
2
1
2
x
f x e



, xR
Propoziia 3. Funcia generatoare de momente a variabilei aleatoare
( ) ~ 0,1 X N
este:
( )
2
2
t
g t e
,
t R

Demonstraie. Avem:
( ) ( )
( )
2 2
2 1
2 2 2
1 1
2 2
x t
x t
t X t x
g t M e e e dx e e dx





R R

2 2 2
2 2 2
1
2
t y t
e e dy e

R

Repartiia gama
Densitatea de repartiie gama de parametrii 0 a > i 0 b > este:
( )
( )
1
1
x
a
b
a
f x x e
a b



, 0 x > .
Notm ( ) ~ , X a b
dac variabila aleatoare X are repartiia ( ) , a b
.
Propoziia 4. Dac ( ) ~ , X a b
, atunci:
i) ( ) M X a b
;
ii) ( )
2
D X a b

iii) funcia generatoare de momente este
( )
( )
1
1
a
g t
b t


.
Demonstraie.
i) Conform definiiei avem:
( ) ( )
( )
-
-1
0
1
x
a
b
a
M X x f x dx x x e dx
a b




R
6
Se face schimbarea de variabil
x
t
b
. Se obine:
( )
( )
( )
( )
( )
( )
-1 -
0
1
a t
a a a
b
M X t e dt b b a b
a a a

ii) ( ) ( )
( )
-
2 2 1
0
1
x
a
b
a
M X x f x dx x e dx
a b

+



R

( )
( )
( )
( ) ( )
( )
2
1 - 2 2 2 2 2
0
2 1
a t
a a a a
b
t e dt b b a b a b
a a a

+
+ +
+


iii) Avem:
( ) ( )
( )
1
0
1
x
t X a t x
b
a
g t M e x e e dx
a b





( )
( ) 1
1
0
1
x
t b
a
b
a
x e dx
a b




Se face schimbarea de variabil
( ) 1 x t b
y
b

. Se obine
( )
( )
( ) ( )
1
0
1 1 1
1 1
a a y
a a a
g t b y e dy
a b
t b t b

Cazuri particulare de repartiii gama:


1) Pentru
2
n
a , unde
n
*
N
i 2 b se obine repartiia hi-ptrat cu n
grade de libertate (este notat cu
2
n
).
2) Pentru 1 a i 0 b > se obine repartiia exponenial de parametru


(o notm ( ) Exp
).
7
Cursul 10
Repartiia Student cu n grade de libertate
Variabila aleatoare X urmeaz legea de repartiie Student cu n grade de
libertate, unde
*
nN , dac are densitatea de repartiie:
( )
( )
1
2 2
1
2 2
1
1
,
n
n
t
f t
n n
+

_
+

,
,
t R
.
Notm repartiia Student cu n grade de libertate cu ( ) S n
.
Propoziia 1. Dac variabilele aleatoare ( ) 0,1 Z N
i
2
n
Y sunt
independente, atunci variabila aleatoare:
( )
Z
T S n
Y
n

.
Elemente de statistic matematic
Populaie. Selecie. Momente de selecie.
O cercetare statistic pornete de la o colectivitate (sau populaie)
alctuit din elemente (numite uniti) care au o caracteristic general
comun. Vom presupune c aceast caracteristic este descris de o variabil
aleatoare X.
Se numete selecie sau eantion o colectivitate parial finit format din
elemente alese la ntmplare. Numrul acestor elemente se numete volumul
seleciei. Selecia este repetat dac elementul ales la ntmplare este
reintrodus n colectivitatea general naintea efecturii urmtoarei alegeri i
este nerepetat dac elementele alese nu se mai introduc n colectivitatea
general.
Vom nota cu
1 2
, , ,
n
X X X K
valorile observate ale variabilei aleatoare X
i le vom numi date (sau valori) de selecie. Privite apriori, n cazul unei
selecii repetate, ele sunt variabile aleatoare independente, identic repartizate
cu variabila aleatoare X (se numesc variabile de selecie). Cnd volumul
colectivitii generale este suficient de mare (comparat cu volumul seleciei),
deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ.
Definiie. Orice funcie de datele de selecie se numete funcie de
selecie sau statistic.
S considerm c valorile de selecie sunt aranjate n ordine cresctoare
:
1 2 n
x x x L
. Dac sunt distincte, atunci construim variabila aleatoare
8
X

(numit variabila aleatoare de selecie) :


1 2
:
1 1 1
n
x x x
X
n n n

_



,
K
K
. Funcia
de repartiie a acestei variabile se numete funcia de repartiie empiric (sau
funcia de repartiie de selecie) i o vom nota cu
n
F
. Avem
( ) ,
x
n
n
F x x
n
R, unde
x
n
reprezint numrul valorilor de selecie mai
mici dect x. Dac valorile de selecie nu sunt distincte, atunci notnd cu
1 2 k
x x x < < < L
valorile de selecie distincte, ordonate cresctor, avem :
1 2
1 2
: ,
k
k
x x x
X
n n n
n n n

_



,
K
K
unde
,
i
k n n <
este numrul valorilor de selecie
egale cu , 1,
i
x i k i
1
.
k
i
i
n n

Fie F funcia de repartiie a lui X (numit i


funcia de repartiie teoretic).
Teorema lui Glivenko (teorema fundamental a statisticii matematice).

( ) ( ) limsup 0 1
n
n
x
P F x F x

_


, R
adic, supremul diferenei absolute dintre funcia de repartiie empiric i
funcia de repartiie teoretic converge aproape sigur la zero.
Definiii. Fie selecia
1 2
, , ,
n
X X X K
. Momentele variabilei aleatoare de
selecie
X

se numesc momente de selecie (sau momente empirice).


Numim moment iniial de selecie de ordin r variabila aleatoare

1
1
n
r
r i
i
m X
n


.
n cazul particular 1 r , el se numete media de selecie i se noteaz cu
X

(sau cu
n X ), deci
1
1
1
n
i
i
X m X
n


.
Numim moment centrat de selecie de ordin r variabila aleatoare
( )
1
1
n
r
r i
i
X X
n


.
Pentru 2 r el se numete dispersia de selecie (se mai noteaz cu
2

sau
cu
2
n
), deci ( )
2 2
2
1
1
n
i
i
X X
n


. Avem
( )
( )
2 1 n
M D X
n


.
Numim dispersia de selecie modificat (sau corectat) variabila aleatoare
9
( )
2
2
1
1
1
n
n i
i
s X X
n

. Avem ( ) ( )
2
n
M s D X
.
Propoziia 1. Cnd momentul teoretic de ordin r (notat ( )
r
m X
) exist,
avem :
( )
( )
lim 1, 0
r r
n
P m m X

< >
, adic, momentele iniiale de
selecie converg n probabilitate ctre momentele iniiale teoretice de acelai
ordin.
Propoziia 2. Avem ( ) ( )
r r
M m m X

, adic, media momentului iniial


de selecie de ordin r este egal cu momentul iniial de ordin r al variabilei
aleatoare X.
Cu ajutorul momentelor de selecie definim i ali indicatori de
selecie :
- asimetria de selecie (sau asimetria empiric) :
( )
3
1
3
2
2

- excesul de selecie (sau excesul empiric) :


( )
4
2
2
2
3


- coeficientul de corelaie de selecie (sau coeficientul de corelaie
empiric) :

( ) ( )
1
,
2 2
1
n
i i
i
X Y
X Y
X X Y Y
n

Propoziia 3 (Selecia din populaia normal).


Dac X are repartiia normal ( ) , , N m
atunci:
a) media de selecie
n X are repartiia normal
, N m
n
_

,
;
b) variabilele aleatoare
n X i
2
n
(media de selecie i dispersia de selecie)
sunt independente.

1). La o staie meteorologic temperaturile (n grade Celsius) nregistrate n
ultimii 8 ani, la ora 12 din data de 1 august, au fost : 30, 24, 35, 36, 32, 23,
31, 37. S se scrie funcia de repartiie empiric i s se calculeze media de
selecie (temperatura medie multianual a locului), dispersia de selecie i
dispersia de selecie modificat.
10
Rezolvare. Avem :
23 24 30 31 32 35 36 37
: ,
1 1 1 1 1 1 1 1
8 8 8 8 8 8 8 8
X

_



,

( )
( )
8
0, 23
1 8, 23 24
1 4, 24 30
3 8, 30 31
1 2, 31 32
5 8, 32 35
3 4, 35 36
7 8, 36 37
1, 37
x
x
x
x
F x P X x x
x
x
x
x

<

<

<

< <
'

<

<

<

>

,
( ) 30 24 35 36 32 23 31 37 8 31 , X + + + + + + +
o
( )
8
2 2
1
1
8
i
i
X X



( ) ( ) ( ) ( ) ( )
2 2 2 2 2
30 31 24 31 35 31 36 31 32 31

+ + + + +

( )
2
23 31 +
( ) ( )
2 2 1 192
31 31 37 31 24
8 8
1
+
]
, ( )
8
2
2
8
1
1 192
27, 4286
7 7
i
i
s X X

11
2). Se consider o colectivitate de oameni a cror nlime are repartiia
normal cu media 170 cm. Probabilitatea ca media de selecie
corespunztoare unei selecii de volum 36 s depeasc 175 cm este 0,1977.
S se determine probabilitatea ca lund la ntmplare un membru al
colectivitii, el s aib nlimea peste 190 cm.
Rezolvare. Avem ( )
( )
170, 6 , 175 0,1977, X N P X > :
( )
175 P X >

( )
170 5 30
1 175 1 1 0,1977
6 6
X
P X P

_

_



,
,
, unde este
funcia de repartiie a normalei ( ) 0,1 N
. Rezult ( )
1
30
0,8023 0,85,


30
35, 29411765
0,85

, probabilitatea cerut este ( ) 190 P X >
1
( ) 190 P X
170 20
1
X
P

_


,
1 ( ) 0, 56666 1 0, 714567 0, 285433

Elemente de teoria estimaiei
Adesea funcia de repartiie a caracteristicii studiate depinde de un
parametru necunoscut (vector n cazul mai multor parametri) ce trebuie
estimat pe baza unei selecii
1 2
, , ,
n
X X X K
cu o statistic ( )
1 2
, , ,
n n
X X X K

numit estimator sau funcie de estimaie (o notm simplificat cu
*
n
). O
realizare a estimatorului se numete estimaie.
Definiie. Spunem c
*
n
este un estimator consistent al lui dac
*
n

converge n probabilitate la atunci cnd volumul seleciei tinde la infinit,
adic ( )
*
lim 1,
n
n
P

<

0 >
(notm
* p
n
n

).
Definiie. Spunem c statistica
*
n
este un estimator nedeplasat al
parametrului dac ( )
*
n
M
.
Definiie. Statistica
*
n
este un estimator asimptotic nedeplasat
(estimator deplasat) al parametrului dac ( ) ( )
*
n
M h n +
, unde
( ) lim 0
n
h n

, funcia ( ) h n
este numit deplasare.
Evident, deplasarea estimatorului difer de eroarea de estimaie
(eroarea estimatorului) care este
*
n
, deci o variabil aleatoare.
12
Definiie. Spunem c statistica
*
n
este un estimator absolut corect al
lui dac ( )
*
n
M
i ( )
*
lim 0.
n
n
D

Definiie. Spunem c statistica


*
n
este un estimator corect pentru
dac ( ) ( )
*
n
M h n +
, cu
( ) lim 0
n
h n

i ( )
*
lim 0.
n
n
D

Teorema Rao-Cramer. Dac


*
n
este un estimator absolut corect
pentru parametrul din densitatea de repartiie ( ) ; f x
a variabilei aleatoare
X, atunci
( )
( )
*
1
n
D
n I

, unde
( )
( )
2
ln , f X
I M

1
_
1

1
,
]

( )
2
2
ln , f X
M

,
este numit cantitatea de informaie pe o observaie.

Definiie. Spunem c estimatorul nedeplasat
*
n
este eficient dac are cea
mai mic dispersie, adic
( )
( )
*
1
.
n
D
n I

Definiie. Pentru estimatorul absolut corect


*
n
raportul
( )
( )
( )
*
*
1
n
n
n I
e
D

se
numete eficiena estimatorului.
Observaie. Estimaia fiind o realizare (valoare) a estimatorului, pe
cale de consecin, vorbim de estimaie nedeplasat, estimaie corect,
estimaie absolut corect, estimaie eficient etc.
13
Cursul 11
Metode de estimare a parametrilor:
1). Metoda momentelor const n formarea unui sistem de ecuaii
prin egalarea primelor r momente teoretice cu primele r momente de selecie,
unde r reprezint numrul parametrilor de estimat.
2). Metoda verosimilitii maxime const n determinarea valorii
parametrului care maximizeaz probabilitatea
( ) ( )
1 2
1
, , , ; ;
n
n i
i
P X X X f X

K
(sau echivalent funcia
( ) ( ) ( )
1 2 1 2
1
, , , ; ln , , , ; ln ;
n
n n i
i
L X X X P X X X f X

K K
).
Funciile ( )
1 2
, , , ;
n
P X X X K
i ( )
1 2
, , , ;
n
L X X X K
se numesc funcii de
verosimilitate, iar ecuaia
( )
1 2
, , , ;
0
n
L X X X

K
se numete ecuaia de
verosimilitate.
14
Exemple:
1. Pe baza seleciei
1 2
, , ,
n
X X X K
s se estimeze parametrul al repartiiei
Poisson: ( ) , 0,1, 2,
!
k
e
P X k k
k

K i s se arate c estimatorul obinut


este absolut corect.
Rezolvare: i) Utiliznd metoda momentelor avem ecuaia ( ) M X X . Cum
( ) M X
se obine estimatorul
*
1
1
n
n i
i
X X
n


.
ii) Utiliznd metoda verosimilitii maxime avem funciile de verosimilitate
( ) ( )
( ) ( )
1 2
1 1 1
, , , ; ;
! !
X X
n n n i i
n
n i
i i i i i
e
P X X X P X X e
X X



K
,
( ) ( ) ( ) ( )
1 2 1 2
1
, , , ; ln , , , ; ln ln !
n
n n i i
i
L X X X P X X X n X X

K K
i
ecuaia de verosimilitate
( )
1 2
, , , ;
0
n
L X X X

K
, deci
1
1
0
n
i
i
n X

+
se
obine estimatorul
*
1
1
n
n i
i
X X
n


(acelai ca i la metoda momentelor,
totui nu este obligatoriu ca ambele metode s dea acelai estimator).
15
Pentru analiza estimatorului vom folosi faptul c ( ) M X
i ( ) D X
.
Avem:
( )
*
1
1
n
n i
i
M M X
n

_


,
( ) ( )
1 1
1 1
n n
i
i i
M X M X
n n


1
1 1
n
i
n
n n

,
deci este nedeplasat;
cum i ( )
( )
*
2
1
1
n
n i
i
D D X
n

2
0
n
n
n n


rezult c este
estimator absolut corect.
16
2. Pe baza seleciei
1 2
, , ,
n
X X X K
s se estimeze parametrul 0 > din
densitatea de repartiie:
( ) ( )
1
; , 0,1 f x x x



.
Rezolvare: Avem ( )
1
1 1 1
1
0 0
0
1 1
x
M X x x dx x dx





+


+ +

.
i) Folosind metoda momentelor obinem ecuaia:
1
X


+
, de unde rezult
estimatorul
*
1
n
X
X

.
ii) Folosind metoda verosimilitii maxime avem ecuaia
( )
1
ln ; 0,
n
i
i
f X


( )
( ) ( )
1
1 1
ln ln 1 ln
n n
i i
i i
X X



+


1
1
ln
n
i
i
X

_
+

,

1
ln 0
n
i
i
n
X

,
de unde rezult estimatorul
*
1
ln
n
n
i
i
n
X


(n acest caz cele dou metode au dat estimatori diferii).

17
Cursul 12
Intervale de ncredere
Uneori se pune problema ca pe baza unei selecii s gsim un interval care
s conin parametru cu o anumit probabilitate (numit nivel de ncredere,
coeficient de ncredere etc.), pe care o notm cu (este apropiat de 1).
Valoarea 1 se numete nivel sau prag de semnificaie. O modalitate de
obinere a unui interval de ncredere pentru parametrul este urmtoarea:
1). Se determin o funcie (statistic) ( )
1 2
, , , ;
n
U X X X K
(notat mai simplu
cu ( ) U
) cu proprietile:
i) este continu i strict monoton n raport cu (este inversabil n );
ii) funcia de repartiie a variabilei aleatoare ( ) U
nu depinde de sau de
ali parametri necunoscui.
2). Pentru orice fixat se determin dou numere reale
1
t
i 2
t
astfel nct
( ) ( )
1 2
P t U t
. Cnd U este strict cresctoare, evenimentul
( )
1 2
t U t
este totuna cu ( ) ( )
1 1
1 2
U t U t

. Atunci lund ( )
1
1 1
U t

i
( )
1
2 2
U t

se obine intervalul de ncredere (sau de estimaie) [ ]
1 2
;

pentru parametrul .
18
Estimarea prin intervale de ncredere a parametrilor repartiiei
normale ( ) , N m
1). Estimarea mediei m cnd

este cunoscut
Folosim statistica
( ) ( ) ~ 0,1
X m
U m N
n

. Pentru simplificare notm aceast


variabil aleatoare cu Z, deci ( ) Z U m
. Cutm numerele
1

i
2

astfel
nct ( )
1 2
1 P Z
. Dar ( )
1 2
P Z ( ) ( )
2 1
F F
. Alegnd
intervalul simetric
1 2

(acesta este i intervalul de lungime minim
pentru nivelul de ncredere dat) avem

( ) ( ) ( ) ( ) ( ) ( )
1 2 2 2 2 2
1 P Z F F F F
( )
2
2 1 1 F
,
Rezult ( )
2
1
2
F

,
1
2
1
2
1
2
F z

_


,
(cuantila de ordin 1
2

a
repartiiei ( ) 0,1 N
). Aadar
1 1
2 2
X m
z Z z
n


, de unde obinem
intervalul cutat
1 1
2 2
X z m X z
n n



+
.
19
2). Estimarea mediei m cnd

este necunoscut
Folosim statistica
( ) ( ) ~ 1
X m
U m S n
s n


, unde
2
s
este dispersia de selecie
modificat. Pentru simplificare notm aceast variabil aleatoare cu T, deci
( ) T U m
. Cutm numerele
1

i
2

astfel nct ( )
1 2
1 P T
.
Dar ( )
1 2
P T ( ) ( )
2 1
F F
, unde F este funcia de repartiie Student
cu 1 n grade de libertate. Alegnd intervalul simetric
1 2

(acesta este
i intervalul de lungime minim pentru nivelul de ncredere dat) avem
( ) ( ) ( ) ( ) ( ) ( )
1 2 2 2 2 2
1 P T F F F F
( )
2
2 1 1 F
,
Rezult ( )
2
1
2
F

,
1
2
1, 1
2
1
2
n
F t



_


,
(cuantila de ordin 1
2

a
repartiiei ( ) 1 S n
). Aadar
1, 1 1, 1
2 2
n n
X m
t T t
s n


, de unde obinem
intervalul cutat
1, 1 1, 1
2 2
n n
s s
X t m X t
n n


+
.
20
Interval de ncredere pentru parametrul
2
Se consider statistica
( )
( )
2
2
2
1 n s
U

care are o lege de repartiie


( )
2
1 n


(hi-ptrat cu 1 n grade de libertate). Atunci, pentru ( ) 1 0,1

fixat, se pot determina dou numere
1
h
i
2
h
astfel nct:
( )
2
1 2 2
1 n s
P h h
_

,
Cum funcia de repartiie a variabilei
( )
2
2
1 n s

nu depinde de
2
i
( )
2
2
1 n s

este continu i strict descresctoare n raport cu


2
, nseamn c
statistica aleas ndeplinete condiiile pentru a putea construi un interval de
ncredere pentru
2
.
Evenimentele
( )
2
1 2 2
1 n s
h h

_


,
i
( ) ( )
2 2
2
2 1
1 1 n s n s
h h
_




,

fiind echivalente, au aceeai probabilitate i deci, am determinat intervalul

( ) ( )
2 2
2 1
1 1
;
n s n s
h h
1

1
1
]
care, cu o probabilitate fixat, acoper
parametrul
2
.
21
Densitatea de repartiie a unei variabile
2
, nemaifiind simetric i lund
numai valori pozitive, nu vom mai putea alege intervalul simetric. Vom
adopta n acest caz regula: ( )
2
1
2
P h

< ; ( )
2
2
2
P h

> , numit regula
cozilor egale.
x
f ( x )
1
2

Avnd n vedere modul cum sunt construite tabelele pentru funcia de


repartiie a unei variabile
( )
2
1 n


, obinem:
( )
2
1
1 ,
2
n
h


;
( )
2
2
1 ,1
2
n
h



i cu
acestea intervalul
( )
( )
( )
( )
2 2
2 2
1 ,1 1 ,
2 2
1 1
,
n n
n s n s



1
1
1
1
]
care, cu o probabilitate , acoper
parametrul
2
.
22
Cursul 13
Verificarea ipotezelor statistice. Ipotezele pe care le facem se refer
la valorile parametrilor repartiiei. Ipoteza pe care vrem s o verificm se
numete ipoteza nul i o vom nota cu H
0
. Ipoteza alternativ o vom nota cu
H
1
. Dac vrem s verificm apartenena parametrului la o submulime A
din spaiul parametrului, deci H
0
: A , vom determina o regiune critic
n
W R
cu ( ) ( )
1 2 0
, , , H
n
P X X X W K
, unde nivelul sau pragul de
semnificaie ( ) 0,1
este apropiat de zero. Regula de verificare (testul)
const n acceptarea ipotezei nule (i respingerea alternativei) cnd eantionul
nu aparine regiunii critice i n acceptarea ipotezei alternative (i respingerea
ipotezei nule) cnd eantionul aparine regiunii critice. Nivelul de
semnificaie

se mai numete i probabilitatea erorii de genul nti sau


riscul de prima spe, adic probabilitatea de a respinge o ipotez adevrat.
Eroarea de genul al doilea este eroarea de a accepta o ipotez fals.
Probabilitatea erorii de genul al doilea, numit i risc de spea a doua o vom
nota cu

, deci ( ) ( )
1 2 1
, , , H
n
P X X X W K
Probabilitatea de a respinge o ipotez fals se numete puterea testului
i o notm cu ( ) W
, deci ( ) ( ) ( )
1 2 1
, , , H 1
n
W P X X X W K
.
23
Verificarea ipotezei privind media repartiiei normale ( ) , N m
,
H
0
:
0
m m
a). Dac

este cunoscut se utilizeaz statistica


X m
Z
n

i testul Z.
Testul Z bilateral: pentru alternativa H
1
:
1 0
m m m
.
Dac H
0
este adevrat atunci ( )
0
0,1
X m
Z N
n


i regiunea critic
este format n exteriorul intervalului de ncredere cu nivelul de ncredere
1 , deci
( )
1 2 0 0
1 1
2 2
, , , sau
n
W X X X X m z X m z
n n





< > +
' ;


K
,
unde
1
2
z

este cuantila de ordin 1


2

a repartiiei normale standard.


Testul Z unilateral dreapta: pentru alternativa H
1
:
1 0
m m m >
.
Regiunea critic este ( )
1 2 0 1
, , ,
n
W X X X X m z
n


> +
' ;

K
Testul Z unilateral stnga: pentru alternativa H
1
:
1 0
m m m <
.
Regiunea critic este ( )
1 2 0 1
, , ,
n
W X X X X m z
n


<
' ;

K
24
b). Dac

este necunoscut se utilizeaz statistica


X m
T
s n

i testul T.
Testul T bilateral: pentru alternativa H
1
:
1 0
m m m
.
Dac H
0
este adevrat atunci ( )
0
1
X m
T S n
s n


, repartiia
Student cu 1 n grade de libertate, i regiunea critic este

( )
1 2 0 0
1,1 1,1
2 2
, , , sau
n
n n
s s
W X X X X m t X m t
n n




< > +
' ;


K
,
unde
1,1
2
n
t


este cuantila de ordin 1
2

a repartiiei Student cu 1 n
grade de libertate.
Testul T unilateral dreapta: pentru alternativa H
1
:
1 0
m m m >
.
Regiunea critic este ( )
1 2 0 1,1
, , ,
n n
s
W X X X X m t
n


> +
' ;

K
Testul T unilateral stnga: pentru alternativa H
1
:
1 0
m m m <
.
Regiunea critic este ( )
1 2 0 1,1
, , ,
n n
s
W X X X X m t
n


<
' ;

K
.
25
Verificarea ipotezei privind dispersia repartiiei normale ( ) , N m
:
H
0
:
2 2
0
, fa de alternativa H
1
:
2 2 2
1 0

Folosim testul
2
(hi-ptrat) bilateral. Cnd H
0
este adevrat statistica
( )
2
2
1
2
0
1
n
n s


are repartiia hi-ptrat cu 1 n grade de libertate. Regiunea
critic este
( )
2 2
2 2 2 2 0 0
1 2
1, 1,1
2 2
, , , sau
1 1
n
n n
W X X X s s
n n






< >
' ;



K
unde
2
1,1
2
n


i
2
1,
2
n

sunt cuantilele de ordin 1


2

, respectiv
2

,
ale repartiiei hi ptrat cu 1 n grade de libertate.
Analog cazului mediei avem i test
2
unilateral dreapta i unilateral
stnga.


26
Exerciiu. Pe baza seleciei
1 2
, , ,
n
X X X K
s se estimeze parametrul ,
0, >
din densitatea de repartiie: ( )
2
; , 0
x
x
f x e x

> i s se analizeze
estimatorul obinut. Precizai estimaia n cazul seleciei de volum 15 i de
valori: 4, 5, 5, 2, 3, 4, 5, 3, 4, 2, 3, 2, 5, 4, 3.
Rezolvare: i) Folosind metoda momentelor avem:
( ) ( )
0
M X x f x dx

( )
2
2
2
0 0
3 2
x
y
x
e dx y e dy



, deci
ecuaia ( ) M X X ne d estimatorul
*
1
1 1
2 2
n
n i
i
X X
n

.
ii) Folosind metoda verosimilitii maxime avem:
( )
1
ln ; 0,
n
i
i
f X


2
1
ln
i
X
n
i
i
X
e

2
1 1
2
ln 2 ln
n n
i i
i
i i
X X
X


_ _
+

, ,

2
1
2 1
0
n
i
i
n
X


+
, se obine
ecuaia
1
2 0
n
i
i
n X

+
, de unde rezult estimatorul
*
1
1
2 2
n
n i
i
X
X
n


.
27
Analiza estimatorului:
Avem ( )
( )
*
1
1
2
n
n i
i
M M X
n

( )
1 1
2
2 2
M X ,
deci estimatorul este nedeplasat.
Cum ( )
( )
2 2
0
M X x f x dx


3
2
0
x
x
e dx

( )
2 3 2 2 2
0
4 3! 6
y
y e dy

obinem
( )
( )
( )
2 2
D X M X M X

2 2 2
6 4 2 i
( )
( ) ( )
*
2 2
1
1 1
4 4
n
n i
i
D D X n D X
n n



2
2
1
2 0
4 2
n
n n

,
deci estimatorul este absolut corect.
Pentru a calcula eficiena estimatorului,
( )
( ) ( )
( )
*
*
1
,
n
n
n I
e
D

procedm
astfel: ( ) ln ; ln 2ln
X
f X X


_



,
2
2
,
X

+
( )
2
2
ln ; f X


2 2 3
2 2 2 X X

_
+

,
,
( )
( )
2
2 2 3
ln , 2 2 f X X
I M M


_
_




,
,

( )
2 3 2 3 2
2 2 2 2 2
2 M X

+ +
,
( )
( )
( )
2
*
2
2
1,
2
n
n
e
n


aadar, estimatorul este eficient.
Pentru selecia dat estimaia este
*
1
1 54
1,8
2 30
n
n i
i
X
n



28

S-ar putea să vă placă și