Documente Academic
Documente Profesional
Documente Cultură
MATEMTICA-UNITATEA DE NVATARE 6
Verificarea ipotezelor statistice
Dr.Liana Manu Iosifescu
Octombrie 2012
CUPRINS
Erori posibile n testrile ipotezelor statistice ..53
Teorema Neyman-Pearson.Teste bazate pe teorema Neyman-Pearson.54
Metoda intervalelor de ncredere pentru verificarea ipotezelor statistice.....56
Exerciii rezolvate59
Exerciii propuse..62
Ipotezele pe care le vom face se refer la valorile parametrilor care intervin n legea
de repartiie. Pentru o repartiie unidimensional, a crei densitate de repartiie depinde de
k parametrii
k
,..., ,
2 1
,
( )
k
x f ,..., , ,
2 1
, acetia pot fi interpretai ca fiind coordonatele
unui punct
( )
k
,..., ,
2 1
n
i
i n
x f x x x P
1
2 1
; ; ,..., ,
prininegalitatea
( ) ( )
0 2 1 1 2 1
; ,..., , ; ,..., ,
n n
x x x cP x x x P
,
cu c rezultnd din egalitatea
( ) ( )
0 0 2 1
,..., , H W X X X P
n
exist unul cu propritatea c
( ) ( ) 1 ,..., ,
1 2 1
H W X X X P
n
este maxim.
Metodologia de elaborare a testelor bazate pe metoda Neyman-Pearson const n a
acorda ipotezei nule
0 0
: H
o situaie privilegiat fixnd apriori nivelul testului
(nivel de semnificaie)
0
- valoarea riscului de spea nti, apoi alegnd dintre toate
testele pe acela care minimizeaz valoarea riscului de spea a doua. Practic, se definete
regiunea critic
n
R W a.. dac
( ) W X X X
n
,..., ,
2 1
se accept
( )
0 1 1 1
: H
, adic
prin:
( )
( )
'
W
n
j
n j
W
n
j
n j
dx dx x f
dx dx x f
1
1 1 ;
1
0 1 0 ;
... ...
... ...
( )
( )
( )
( )
'
'
W
n
j
n j
n
j
j
n
j
j
n
TNP
dx dx x f
c
x f
x f
x x x W
1
0 1 0 ; 0
1
0
1
1
2 1
... ...
;
;
,... ,
.
Exemplu: Verificarea ipotezei asupra mediei unei populaii normale cu dispersie cunoscut
1 1 0 0
: ; : m m H m m H
conduce la determinarea mulimii punctelor
( )
n
X X X ,..., ,
2 1
a..
( )
( )
( ) ( ) [ ]
c e c
m x f
m x f
n
k
k k
m X m X
n
k
k
n
k
k
1
2
0
2
1
2
2
1
1
0
1
1
, ;
, ;
( ) ( )
'
< +
> +
+
0 1 0
0 1 1 0
0 1 2
0 1
pentru
pentru
2
2
m m z
n
m X
m m z
n
m X
k m m X n
m m
.
54
ntr-adevr, dac
a
m m
k
m m
n
X m m
,
_
+ + >
0 1
2
0 1 0 1
2
2
1
0
, regiunea critic fiind
complet detrerminat de condiia:
( )
0
H a X P
.
( ) 1 , 0
/
,
0
0
N
n
m X
n
m N X
,
_
( )
n
z m a
n
m a
n
m a
n
m X
P a X P
,
_
,
_
1 0
0 0 0
1
/ /
.
Pentru calculul puterii acestui test:
( ) ( ) [ ] ( )
1 1 2 1 1
,..., , H a X P m m W X X X P m
n
( )
,
_
,
_
,
_
n
m a
n
m a
n
m X
P m
n
m N X
1 1 1
1 1
1 ,
test unilateral dreapta
Aplicaie: Durata de funcionare a unui tip de bec de 100 wai poate fi considerat ca v. a.
( ). 200 , 1500 N X O selecie de 25 astfel de becuri d o durat medie de funcionare de
1380 de ore. S se verifice la pragul
01 , 0
ipoteza
1500 :
0
m H
fa de 1500 :
1
< m H
Determinai:i). puterea testului pentru 1400
1
m ;ii).volumul seleciei a..
9 , 0
.
Rezolvare. Este cazul testului Z unilateral stnga , pentru care, explicitnd calculele fcute
n exemplul anterior (cazul testului Z unilateral dreapta) , avem succesiv:
( ) ( ) [ ]
( ) ( )
n
k
k
n
k
k
m X m X
X m m c m m X
m m
c e
n
k
k k
1
0 1
1
0 1 2
0 1
2
1
ln 2
2
1
2
0
2
1
2
( )
( )
a
m m n
c
m m X c m m n
not
m m
+ + +
<
0 1
2
0 1
2 2
0
2
1
ln
ln
0 1
( )
0
m m a X P
0
0 0 0 0
z
n
m a z n
m a
n
m a
n
m a
n
m X
P +
,
_
,
_
deci
regiunea critic este W:
z
n
m X +
0
. Cum
99 , 0 01 , 0
z z
, utiliznd tabelul funciei de
repartiie pentru N(0,1), din care ( ) 990097 , 0 33 , 2 , rezult
33 , 2
z
.
Astfel, marginea superioar a regiunii critice:
8 , 1406 33 , 2
5
200
1500
0
+
z
n
m
;
Se respinge ipoteza nul, cci 1380<
a
. Se putea calcula echivalent 3 5
200
1380 1500
<
,
_
+ < n
m X
P m m z
n
m X P m W
0
1 0 1
,
)
,
_
< 1
1 0 1 0
z n
m m
z n
m m
, deci
( )
,
_
z n
m m
1 0
1400
55
( ) 5675 , 0 17 , 0
5
200
1400 1500
33 , 2
,
_
+
, iar pentru ca testul s aib o putere dat,
din relaia dedus anterior,
z n
m m
z z n
m m
+
,
_
1 0
1
1 0
1
rezult
2
1 0
1 1
,
_
m m
z z
n , adic ( ) [ ] 52 24 , 7 33 , 2 29 , 1 2
1400 1500
200
2 2
2
99 , 0 9 , 0
+
,
_
+
z z
n .
Metoda intervalelor de ncredere pentru verificarea ipotezelor statistice
Teorema:Fie
( )
0
A
regiunea de acceptare la nivel
a testului
( )
0 0
H
. Dac pentru fiecare
observaie
( )
n
x x x x ,..., ,
2 1
pentru ( )
1
H din familia intervalelor de ncredere cu
probabilitate confidenial cel puin 1 .
Testul Z: verificarea ipotezei
0 0
: m m H
cu alternativa bilateral
0 1
: m m H
, la nivelul
de semnificaie
,
_
<
1
0
z
n
m X
P
regiunea critic fiind:
( ) ( )
1
]
1
+
1
]
1
n
z m X X X X
n
z m X X X X W
n n
2
1
0 2 1
2
1
0 2 1
: ,..., , : ,..., ,
, iar
puterea:
( )
,
_
,
_
2
1
1 0
2
1
1 0
1
1 ,
z n
m m
z n
m m
m W
Testul Z unilateral dreapta:
0 0
: m m H
,
0 1
: m m H <
( ) ( )
,
_
1
]
1
z n
m m
m W
n
z m X X X X W
n
0 1
1 1 0 2 1
, ; : ,..., ,
Testul Z unilateral stnga:
0 0
: m m H
,
0 1
: m m H >
( ) ( )
,
_
1
]
1
z n
m m
m W
n
z m X X X X W
n
1 0
1 1 0 2 1
, ; : ,..., ,
Testul Z relativ la mediile
2 1
, m m a dou populaii normale cu dispersii cunoscute
Pe baza seleciilor
1
1 12 11
,..., ,
n
X X X
din populaia ( )
1 1
, m N i
2
2 22 21
,..., ,
n
X X X
din populaia
( )
2 2
, m N se obin:
( )
l l
n
j
l lj
l
l
n
j
lj
l
l
X X
n
s X
n
X
1
2
2
1
1
1
;
1
,l=1,2.
56
Dac
2 1 0
: m m H
este adevrat, atunci
( ) 1 , 0
2
2
2
1
2
1
2 1
N
n n
X X
, pentru nivelul de
semnificaie
2
2
2
1
2
1
2
1
2 1 2 22 21 1 12 11
: ,..., , ; ,..., ,
2 1
n n
z X X X X X X X X W
n n
( )
1
1
]
1
2
2
2
1
2
1
2
1
2 1 2 22 21 1 12 11
: ,..., , ; ,..., ,
2 1
n n
z X X X X X X X X
n n
-test Z bilateral
testul Z unilateral dreapta:
2 1 0
: m m H
,
2 1 1
: m m H > are regiunea critic:
( )
1
1
]
1
+
2
2
2
1
2
1
1 2 1 2 22 21 1 12 11
: ,..., , ; ,..., ,
2 1
n n
z X X X X X X X X W
n n
+
2
2
2
1
2
1
1 2 1 2 22 21 1 12 11
: ,..., , ; ,..., ,
2 1
n n
z X X X X X X X X W
n n
,
_
<
1
1
0
t
n
m X
P
regiunea critic fiind:
( ) ( )
1
]
1
+
1
]
1
n
s
t m X X X X
n
s
t m X X X X W
n n
2
1
0 2 1
2
1
0 2 1
: ,..., , : ,..., ,
Testul T unilateral dreapta:
0 0
: m m H
,
0 1
: m m H <
are regiunea critic
( )
1
]
1
+
n
s
t m X X X X W
n 1 0 2 1
: ,..., ,
;Testul T unilateral stnga:
0 0
: m m H
,
0 1
: m m H >
are regiunea critic
( )
1
]
1
n
s
t m X X X X W
n 1 0 2 1
: ,..., ,
Testul T pentru verificarea ipotezei referitoare la egalitatea mediilor a dou populaii
normale cu dispersii egale, necunoscute: la nivelul de semnificaie
,
0 0
: m m H
Pe baza statisticii
( )
( ) ( )
2
2 1 2 1
2
2 2
2
1 1
2 1 2 1
2 1
1 1
2
1 1
+
,
_
+
+
+
n n
t
n n n n
s n s n
m m X X
, regiunea critic a
testului T bilateral: :
1
H
2 1
m m ; W
57
( )
( ) ( )
1
1
]
1
,
_
+
+
+
2 1 2 1
2
2 2
2
1 1
2
1
2 1 2 22 21 1 12 11
1 1
2
1 1
: ,..., , ; ,..., ,
2 1
n n n n
s n s n
t X X X X X X X X
n n
( )
( ) ( )
1
1
]
1
,
_
+
+
+
2 1 2 1
2
2 2
2
1 1
2
1
2 1 2 22 21 1 12 11
1 1
2
1 1
: ,..., , ; ,..., ,
2 1
n n n n
s n s n
t X X X X X X X X
n n
T unilateral dreapta:
2 1 1
: m m H >
( )
( ) ( )
1
1
]
1
,
_
+
+
+
2 1 2 1
2
2 2
2
1 1
1 2 1 2 22 21 1 12 11
1 1
2
1 1
: ,..., , ; ,..., ,
2 1
n n n n
s n s n
t X X X X X X X X W
n n
T unilateral stnga:
2 1 1
: m m H <
( )
( ) ( )
1
1
]
1
,
_
+
+
+
2 1 2 1
2
2 2
2
1 1
1 2 1 2 22 21 1 12 11
1 1
2
1 1
: ,..., , ; ,..., ,
2 1
n n n n
s n s n
t X X X X X X X X W
n n
Testul
2
referitor la dispersia repartiiei normale: testarea ipotezei
2
0
2
0
: H cu nivel
de semnificaie
utilizeaz statistica
( )
2
1 2
2
1
n
s n
2
1 ,
2
1
2
0
2
2 1
1 : ,..., ,
n
n
s n X X X W
( ) ( )
1
]
1
2
1 ,
2
2
0
2
2 1
1 : ,..., ,
n
n
s n X X X
unilateral dreapta:
2
0
2
1
: > H fiind
( ) ( ) [ ]
2
1 , 1
2
0
2
2 1
1 : ,..., ,
n n
s n X X X W
unilateral stnga:
2
0
2
1
: < H fiind
( ) ( ) [ ]
2
1 ,
2
0
2
2 1
1 : ,..., ,
n n
s n X X X W
Verificarea ipotezei referitoare la egalitatea dispersiilor a dou populaii normale
testul F bilateral:
2
2
2
1 1
2
2
2
1 0
: , : H H ;cum statistica
1 , 1 2
2
2
1
2
1
2
2
2 1
n n
F
s
s
, pentru
nivelul de semnificaie
,
_
,
_
2
1 ; 1 , 1
2
2
2
1
2
; 1 , 1
2
2
2
1
2 1 2 1 2
n n n n
F
s
s
P F
s
s
P , regiunea critic fiind W=
( )
'
2
; 1 , 1
2
2
2
1
2 22 21 1 12 11
2 1
2 1
: ,..., , ; ,..., ,
n n
n n
F
s
s
X X X X X X
( )
'
2
1 ; 1 , 1
2
2
2
1
2 22 21 1 12 11
2 1
2 1
: ,..., , ; ,..., ,
n n
n n
F
s
s
X X X X X X
testul F unilateral dreapta:
2
2
2
1 1
: > H are regiunea critic
( )
'
1 ; 1 , 1 2
2
2
1
2 22 21 1 12 11
2 1 2 1
: ,..., , ; ,..., ,
n n n n
F
s
s
X X X X X X W
58
testul F unilateral stnga:
2
2
2
1 1
: < H
( )
'
; 1 , 1 2
2
2
1
2 22 21 1 12 11
2 1 2 1
: ,..., , ; ,..., ,
n n n n
F
s
s
X X X X X X W
Pentru o valoare dat a raportului
k
2
2
2
1
>
,
_
,
_
1 ; 1 , 1 1 , 1 1 ; 1 , 1 2
2
2
1
2
1
2
2 2
2
2
1 1 ; 1 , 1 2
2
2
1
2 1 2 1 2 1 2 1
1
,
n n n n n n n n
F
k
F P F
s
s
P k F
s
s
P k W
Exerciii rezolvate
1. Determinai regiunea critic n cazul testului Z bilareral.
Soluie: Dac
0 1
m m
, regiunea critic va consta n toate valorile lui
X
pentru care
k m X >
0
i
,
_
,
_
,
_
>
,
_
<
n k n k n k
n
m X
P
n k
n
m X
P 1
0 0
2
1
2
1 1 2
,
_
,
_
,
_
z
n
k
n k n k
. Regiunea critic este:
2
1
0
2
1
0
:
>
> z n
m X
z
n
m X W
.
2. Fie
( ) 22 : , 20 : , 4 ,
1 0
m H m H m N X . Pentru o selecie de volum 25 extras
din populaia caracterizat de v.a.X, determinai regiunea de acceptare a celui mai puternic
test de nivel
05 , 0
i puterea acestuia.
Soluie: ( ) ( )
( )
( )
( )
( )
( )
25
1 25 1
25 1 32
20 ;
22 ;
20 , ,...,
22 , ,...,
2 4
1
, 4 ,
2
k k
k
m x
x f
x f
x x P
x x P
e m x f m N X
( ) ( ) [ ] ( )
,
_
25
1
25
1
25
1
2 2
2
25 21
8
1
21 2
16
1
22 20
4 2
1
k
k
k
k
k
k k
X X X X
e e e
. Conform lemei Neyman-Pearson,
regiunea de acceptare de nivel
pentru
0
H
este
( ) ( )
( )
'
c e R x x A
X 21
8
25
25
25 1
,...,
,
unde
( )
95 , 0
21
8
25
,
_
c e P
X
. Dar
( )
,
_
,
_
c X P c e P
X
ln
25
8
21
21
8
25
1125 , 1 ln 645 , 1 ln
5
2
4
5
95 , 0 ln
5
2
4
5
ln
5
2
4
5
5
4
20
+
,
_
,
_
c c c c
X
P
59
deci regiunea de acceptare va fi:
( ) ( ) { } 356 , 21 ,...,
25
25 1
X R x x A
, iar valoarea riscului
de spea a doua
( ) ( )
,
_
805 , 0
8 , 0
22 356 , 21
8 , 0
22
356 , 21
X
P X P
( ) 805 , 0 1 , deci puterea testului ( ) 79 , 0 805 , 0 1
3. S se verifice ipotezele
1 : , 1 :
1 0
> H H
pentru o selecie de volum n extras din
populaia caracterizat de v.a.
,
_
1
, 0 N X
i determinai funcia de putere a testului cu
ajutorul nivelului su de semnificaie.
Soluie: ncepem cu observaia c n cazul verificrii unei ipoteze referitoare la dispersia
unei legi normale pe baza unei selecii de volum n,
2
1
2
1
2
0
2
0
: , : H H cu nivelul de
semnificaie
,
_
,
_
1
2
2
0
2
1
1 1
2
1
1
0
1
0
1
1
, ;
, ;
, care, prin
logaritmare conduce la:
( )
,
_
k c m X n
n
k
k
ln
1 1
2
1
ln
1
2
2
0
2
1 1
0
( )
( )
( )
( )
( )
( )
'
,
_
,
_
<
,
_
,
_
>
a m X
n
k
n
m x
n
n
k
k
a m X
n
k
n
m x
n
n
k
k
n
k
k
k
n
k
k
k
dx dx e a
n k
m X
dx dx e a
n k
m X
1
2
2
0
2
0
2
1
2
2
0
2
0
2
1 1
1
2
2
0
1
0
0
1
2
0
1
2
0 1
1 1
1
2
2
0
1
0
0
1
2
0
1
2
0 1
...
2
1
,
1
ln 2
...
2
1
,
1
ln 2
innd cont c
0
H
este adevarat,
( )
2
2
0
1
2
n
n
k
k
m X
, ecuaia care determin valoarea
a
( )
( )
'
2
1 , 0
2
2
, 0
2
n n
n n
a H a P
a H a P
( ) ( )
( ) ( )
'
1
]
1
1
]
1
2
1 ,
2
0
1
2
1
2
,
2
0
1
2
1
: ,...,
: ,...,
n
n
k
k n s
n
n
k
k n d
m X X X W
m X X X W
Pentru verificarea alternativei bilaterale
( ) ( ) ( )
'
n
k
n
k
n
n
n
m X R x x A
1
2
2
,
2
0
2 2
2
1 ,
2
0 1
,...,
Utiliznd faptul c statistica
( )
2
1 2
2
1
n
s n
,
_
,
_
>
>
2
0
2
0
2
2
0
2
0
2
2
0
2 2
1 1
1
1 1
k n s n
P
k n s n
P k s P
( )
( )
'
>
2
1 ; 1
2
0 2
1
2
1 ; 1
2
0 2
1 ; 1 2
0
1
: ,...,
1
1
n n n n
n
s X X W
n
k
k n
a lui
0
H
contra
1
H este
( ) ( )
( )
( )
;
'
c
x x P
x x P
R x x A
n
n n
n
1 ; ,...,
; ,...,
,...,
1
1
1
, unde
( ) ( ) 1
0
H A P
. Cum
( )
( )
( )
n
k
k
x
n
n
n
x
e
x x P
x x P
e x f
1
2
2
2
1
2
1
1 2
1 ; ,...,
; ,...,
2
,
, deci,
,
_
2
ln
1
2
n
not
c k
la nivelul de
semnificaie
,
_
<
1
1
2
n
k
k
k X P
( ) ( )
'
n
k
k
n
n
k x R x x A
1
2
1
,...,
( ) ( ) ( ) ( )
,
_
1 , 0
1
, 0
2 2
2 2
N X e t t e t N X
t
X
X
t
X
( )
k F X Y
Y
n
k
n k
1
2 2
. Riscul de spea a doua
( )
,
_
n
k
k
k X P
1
2
( ) ( ) ( ) ( ) ( ) ( ) 1 , 1
1
>
Y Y Y Y
F F k F k F k Y P este funcia putere.
4. S se determine cel mai puternic test de nivel
al ipotezei nule
0 0
: H
contra
alternativei
0 1
: > H
consider pentru o selecie poissonian.
Soluie: Conform lemei Neyman-Pearson, determinarea formei regiunii critice revine la:
( )
( )
1 0
1
1 0
0
1
ln ln ln
!
!
0
1
1
1 0
0
1
1
0
1
1
<
,
_
k C X n C e
x
e
x
e
n
k
k
x
n
n
k k
x
n
k k
x
n
k
k
k
k
( )
a
n k
X
n
k
k
+
1
0
1
0 1
ln
, valoarea lui
a
determinndu-se cu ajutorul ecuaiei:
n
k
k
k
a x
k
x n
k
x
e
1
0
!
0
1
,ecuaie, care se transform n
( )
a y
k
k
n y Y P
0
unde:
( )
( )
,... 2 , 1 , 0 ,
!
0
0
0
k
k
y
n
k
y
y
n
e n y Y P
k
, ntruct
( ) ( )
n
k
k k
n Po X Y Po X
1
0 0
.
61
Regiunea critic este
( )
'
a X X X X W
n
k
k n
1
2 1
: ,..., ,
, regiunea de acceptare a celui mai
puternic test fiind
( ) ( ) ( ) 1 , 0 , ,...,
1
1
'
n
k
k
n
n
c x R x x A
cu
,
_
1
1
0
n
k
k
c X P
( )
1
!
0
1
1
0
k
n
e
k c
k
n
, de unde se afl
.
Exerciii propuse
1. Aflai riscurile asociate testului care pentru o selecie de volum 100 asupra v.a.
( ) 8 , m N X decide acceptarea ipotezei
12 :
0
m H
dac
14 < X
i a alternativei
15 :
1
m H ( dac
14 X
). R.
1056 , 0 ; 0062 , 0
2. Greutatea unor pachete marcat a fi de 900g este o v.a. normal cu
g 5
. Greutatea
medie observat a 10 pachete este de 898g. S se calculeze probabilitatea acceptrii
ipotezei
g m H 900 :
0
cu alternativa g m H 898 :
1
la pragul de semnificaie 0,05.
3. Masa (greutatea) medie a locuitorilor unui ora poate fi considerat ca o v.a.
( ) 5 , 70 N X . O selecie de 100 locuitori ai oraului, cu domiciliul n zona parcurilor, este
gsit ca avnd o mas medie de 80kg.
a). Acest rezultat indic faptul c locuitorii avnd domiciliul n zona parcurilor au o mas
mai mare dect a celorlali locuitori ( ) 05 , 0 ?
b). Care este puterea testului pentru 71
1
m ?
c). Pentru ce volum al seleciei testul are puterea 0,8849?
4. Dou maini sunt folosite pentru ambalarea unui produs n pachete de 1000g. Din
experiena trecut se tie c cantitaile ambalate pot fi considerate v.a. ( ) ( ) 4 , , 3 ,
2 1
m N m N
respectiv. n urma cntririi a 100 pachete din producia fiecrei maini s-au obinut:
g X g X 1002 , 1007
2 1
. La un prag de semnificaie
01 , 0
s se verifice:
a). ipoteza
2 1 0
: m m H
fa de ipoteza alternativ
2 1 1
: m m H > ;
b). ipoteza
2 1 0
: m m H
fa de ipoteza alternativ
2 1 1
: m m H .
5. Fie v.a. ( ) , 0 N X i o selecie de volum 25 extras din X. Se consider ipotezele
simple:
2 : , 1 :
1 0
H H
. S se determine regiunea de acceptare a celui mai puternic
test de nivel
01 , 0
a lui
0
H
contra
1
H .
6. Dou selecii indeprndente de volume 10 , 12
2 1
n n extrase din populaii normale
independenteau dat 4 , 0 , 84 , 0 ; 2 , 29 , 2 , 31
2
2
2
1 2 1
s s X X .Verificai ipoteza
2 1 0
: m m H
la pragul de semnificaie
05 , 0
fa de ipoteza alternativ
2 1 1
: m m H .
62