Sunteți pe pagina 1din 7

MA curs 4 Statistică 1

Verificarea ipotezelor statistice


Teste parametrice

Teste parametrice - verifică ipoteze statistice asupra valorilor parametrilor


 
Exemplu. O selecție de volum n dintr-o populație normală N m;  2 cu m=7 a dat media de selecţie
X  6,92 . Ştim că media de selecţie ar trebui să fie egală cu media teoretică, adică X  m . Mai putem
considera că m=7? Cu ce risc?
Testul ipotezei nule
X = variabilă aleatoare teoretică cu densitatea de repartiţie f x,  , unde   IR este parametru.
θ 0 = estimaţie a parametrului ( θ 0 = număr)
S = spaţiul de selecţie
Tn : S  IR - estimator pentru  ; Tn dă o altă valoare pt θ , pe baza unei selecţii de volum n
de exemplu X este estimator pentru m
s este estimator pentru 
Scopul verificării ipotezelor statistice este de a decide care dintre următoarele ipoteze este adevărată:
- ipoteza fundamentală sau ipoteza nulă H 0 :   0 (ea afirmă că diferenţa θ  θ 0 este nulă)

- ipoteza alternativă H1 : θ  θ 0

A accepta H 0 înseamnă că θ (estimat prin Tn ) şi θ 0 nu diferă semnificativ.


Definiţii.
1. Mulţimea W  IR se numeşte regiune critică dacă, atunci când estimatorul  W ipoteza H 0
se respinge şi se acceptă H1 .

2. Eroarea de tip  (de genul întâi) se comite atunci când resping H 0 , deşi este adevărată.

  Presping H 0 / H 0 e adevarata 
 = prag de semnificaţie sau risc de genul întâi.
3. Puterea testului = probabilitatea de a respinge ipoteza H 0 atunci când este falsă. Se notează
1    Presping H 0 / H 0 e falsa 

4. Risc de genul doi este probabilitatea de a accepta ipoteza H 0 , deşi este falsă.
  Paccept H 0 / H 0 e falsa 
Evident, pentru a lua decizii adecvate este bine ca riscurile să fie cât mai mici.
Observaţii. a) Z  este soluţia ecuaţiei x     Z   
b)  x   1  x 
c) Z1  Z
d) pentru  mic Z   0
Repartiţia normală
I Teste pt m ( σ 2 cunoscut)
1.Testul unilateral stânga pt m
Avem de ales între ipotezele
H 0 : m  m 0 şi H1 : m  m 0
σ
 dacă X  m 0  Z1α atunci respingem ipoteza H 0 : m  m 0 şi
n
acceptăm H1 : m  m 0
MA curs 4 Statistică 2

σ
 dacă X  m 0  Z1α atunci acceptăm ipoteza H 0 .
n
σ
Observaţie. De fapt noi aproximăm media m cu X . Dacă X  m 0  Z1α atunci nu mai
n
putem afirma că m  m 0 şi trebuie să respingem ipoteza H 0 .
Calcularea puterii testului
 m  m1  n 
1  β  Φ 0  Z1α 
 σ 
Calcularea volumului selecţiei când se cunoaşte β
2
 σ
n Z1β  Z1α  .
 m 0  m1 
Z0,9  1,282 Z0,95  1,645 Z0,975  1,96 Z0,98  2,054 Z0,99  2,326 Z0,995  2,58

Exemplu. Masa unor piese trebuie să fie 52 g. O selecție de volum 20 dintr-un lot de piese a dat
rezultatele 53 54 53 52 51 50 48 51 49 53 50 52 51 51 52 51 50 49 51 51. Presupunem că
datele urmează o repartiție normală Nm,2 .
a) Să se calculeze media de selecţie.
b) Să se verifice ipoteza H 0 : m  52 față de alternativa H1 : m  m1  52 la un prag de
semnificație   0,02 .
c) Să se calculeze puterea testului pentru m1  51.
d) Să se determine volumul selecției pentru ca puterea testului să fie 0,95.
Rezolvare. a) X  51,1 .
b) Folosim testul unilateral stânga. Avem   0,02  1    0,98 , ,   2 , n  20 , m 0  52 .
Calculăm

 qnorm0.98,0,1  52 
2 2,054
m0  Z1  52   51,35 .
n 20 10

Deoarece X  m 0  Z1  51,35 respingem ipoteza H 0 şi acceptăm H1 .
n
qnorm( 0.9801)  2.054 cnorm 5  2.054  0.572
2.054
 0.919
5
52  0.919  51.081

 m  m1  n   20 
c) Calculăm puterea testului cu formula 1  β  Φ 0  Z1α     Z 0.98 
 σ   2 

 cnorm 10  2,054  0,866 . 
c) Avem 1    0,95 . Volumul testului se calculează cu formula
2
 σ
n Z1β  Z1α   2 Z0.95  Z0.98 2  2  1,645  2,0542  27,359 deci n  27 .
 m 0  m1 
2
2  ( qnorm( 0.950 1)  qnorm( 0.980 1) )  27.359

2.Testul unilateral dreapta


Avem de ales între ipotezele
H 0 : m  m 0 şi H1 : m  m 0 .
MA curs 4 Statistică 3

σ
 dacă X  m 0  Z1α atunci respingem ipoteza H 0 şi acceptăm m  m 0
n
σ
 dacă X  m 0  Z1α atunci acceptăm ipoteza H 0 .
n
Exemplu. O selecție de volum n dintr-o populație normală Nm;0,4 a dat rezultatele
xj 3 3,5 4 4,5 5
nj 2 5 6 4 3
Să se verifice ipoteza H 0 : m  4 față de alternativa H1 : m  4 la un prag de semnificație de 0,05.
Rezolvare. Folosim testul unilateral dreapta. Avem m0  4 ,  2  0,4 , n  20 . Calculăm
3  2  3,5  5  4  6  4,5  4  5  3
X  4,025
20

qnorm0.95,0,1  4 
0,4 0,4 0,4
m0  Z1  4   Z 0,95  4  1,645  4  0,233  4,233.
n 20 20 20
σ
Deoarece X  m 0  Z1α acceptăm ipoteza H 0 , adică putem considera că media populației este 4.
n
qnorm( 0.9501)  1.645
0.4 1.645
 0.233
20
3.Testul bilateral
Avem de ales între ipotezele
H 0 : m  m 0 şi H1 : m  m 0
σ
 dacă X  m 0  Z α atunci respingem ipoteza H 0 şi acceptăm m  m 0
n 1 2

σ
 dacă X  m 0  Z α atunci acceptăm ipoteza H 0 .
n 1 2

II. Teste pentru m ( σ 2 necunoscut)


4. Test unilateral stânga
Aleg între ipoteza nulă H 0 : m  m 0 şi ipoteza alternativa H1 : m  m 0

 dacă X  m 0  t ,n 1 resping ipoteza H 0 şi accept H1
n
5. Test unilateral dreapta

Aleg între ipoteza nulă H 0 : m  m 0 şi ipoteza alternativa H1 : m  m 0



 dacă X  m 0  t 1α,n 1 resping ipoteza H 0 şi accept H1 .
n
6. Test bilateral


 dacă X  m 0  t α accept ipoteza H 0 : m  m 0 şi respingem H1 : m  m 0 .
n 1 2 ,n 1

unde ŝ 2 = dispersia modificată de selecție


MA curs 4 Statistică 4

α
t α = soluţia ecuaţiei Fx   1 
1 , n 1 2
2

F = funcţia de repartiţie a repartiţiei Student cu n  1 grade de libertate.


Exemplu. Durata de funcționare a unui tip de aparat poate fi considerată o variabilă aleatoare normală cu
media m  2000 de ore. O selecție de volum 50 a dat o medie de 1800 ore, cu dispersia modificată de
selecție ŝ  20 . Să se verifice la un prag de semnificație   0,05 ipoteza H 0 : m  2000

față de alternativa H1 : m  2000 .

Rezolvare. X  1800 , t ,n 1  t 0.05, 49  qt 0.05,49  1,677 , m 0 


ŝ 20
t ,n 1  2000  1,677 
n 50

1995,26. Deoarece 1800  1995,26  X  m 0  t ,n 1 deci respingem ipoteza H 0 și acceptăm H 1 .
n
III. Teste pentru σ 2
 02
 dacă ŝ 2  h  ,n 1 respingem ipoteza H 0 :  2   02 şi acceptăm H1 :  2   02
n 1

 02
 dacă ŝ 2  h 1,n 1 respingem ipoteza H 0 :  2   02 şi acceptăm H1 :  2   02 .
n 1

 02  02
 dacă h   ŝ 
2
h  acceptăm ipoteza H0 :  2   02 şi respingem
n  1 2 ,n 1 n  1 1 2 ,n 1
H1 :  2   02 .

ŝ 2 este dispersia modificată de selecție


h  ,n 1 este soluţia ecuaţiei Fx   
F = funcţia de repartiţie a repartiţiei  2 cu n  1 grade de libertate.
Exemplu. Pentru o selecție de volum n  101 dintr-o populație normală s-a calculat dispersia modificată
de selecție ŝ 2  3 . Să se verifice ipoteza H 0 :  2  4 față de alternativa H1 :  2  4 la un prag de
semnificație   0,1 .
 02 4 2
Rezolvare. Calculăm h ,n 1   qchisq (0.1,100)  3,294 . Deoarece ŝ 2  0 h  ,n 1 
n 1 100 n 1
3  3,294 , respingem ipoteza H 0 :   4 și acceptăm ipoteza H 1 :   4 .
2 2

qchisq ( 0.1100)  82.358


4
 82.358  3.294
100
Exemplu. Durata de execuție a unei piese poate fi considerată o variabilă aleatoare normală N30,4 . S-a
măsurat durata de execuție a unei piese la 50 muncitori şi s-au obţinut media de selecţie X  32 şi
dispersia modificată de selecţie ŝ  2,2 . Să se verifice
a) ipoteza H0 : m  30 față de alternativa H1 : m  30 la un prag de semnificație   0,02 .
b) ipoteza H 0 :  2  4 față de alternativa H1 : 2  4 la un prag de semnificație   0,02 .

Teste de concordanţă
Fie H 0 : X1 , X 2 ,..., X n o selecţie de volum n dintr-o populaţie statistică. Testele verifică ipoteza
H 0 : X1 , X 2 ,..., X n urmează o anumită repartiţie specificată
MA curs 4 Statistică 5

față de alternativa H1 : X1 , X 2 ,..., X n nu urmează repartiția specificată.


Testul Kolmogorov
Fie X variabila aleatoare teoretică cu care vrem să comparăm variabilă aleatoare de selecţie
F funcţia ei de repartiţie
F * funcţia empirică de repartiţie.
Se estimează mai întâi parametrii ce caracterizează repartiţia X, apoi se calculează
  
d n  max Fx   F * x  . Notăm   P  d n    , α mic,   Presping H0 / H0 ade var ata  .
x
 n
λ
 Dacă d n  α avem o concordanţă între F şi F * şi se acceptă H 0 la un prag de semnificație α .
n
λ
 Dacă d n  α se respinge H 0 .
n
Valorile lui λ α se găsesc în tabele. De exemplu, pentru n  45 valorile lui λ α sunt
α 10% 5% 1%
λα 1,224 1,358 1,627

Exemplu. S-a înregistrat timp de 100 de zile numărul de avarii la rețeaua electrică dintr-un oraș și s-au
obținut următoarele rezultate
Nr avarii 0 1 2 3 4 5
Frecvențe 6 24 31 21 10 8

Folosind testul Kolmogorov să se verifice dacă numărul de avarii urmează a) o repartiție Poisson la un
prag de semnificație 0,05; b) o repartiţie normală la un prag de semnificație 0,05.
Rezolvare. a) Trebuie să decidem care dintre următoarele ipoteze este adevărată
H 0 : datele urmează o repartiție Poisson
H1 : datele nu urmează o repartiție Poisson
Repartiția Poisson are forma
 0 1 ... k ...
 
Po    X :  e   e 
k

 e   ... ...
 k! 
k e   x
k e  
și are p k  , k  IN și funcția de repartiție F x    . Un estimator pentru parametrul 
k! k 0 k!
0.5
este media de selecție, deci   X  2,29 .
Y
0.4
100
0.3
dpois( X 2.29)

dnorm( X 2.291.31)0.2

dexp( X 0.436)
0.1

0 1 2 3 4 5
X

1    2 6  24
F* este funcția empirică de repartiție F * x1   , F * x 2   1
6
  , etc.
n 100 n 100
F este funcția de repartiție a repartiției Poisson, Fx j   ppoisx j ,   sau
Fx j   POISSON (x j ; ; TRUE)
MA curs 4 Statistică 6

xj j F* x j  F x j  F* x j   F x j 
0 6 0,06 0,101 0,041
1 24 0,3 0,333 0,033
2 31 0,61 0,599 0,011
3 21 0,82 0,801 0,019
4 10 0,92 0,917 0,003
5 8 1 0,971 0,029
100 0,041 dn

media 2,29

j1, 6
   
Calculăm d n  max F * x j  F x j  d n  0,041

 
Pentru   0,05 avem    1,358 ,  0,1358 . Deoarece d n   acceptăm ipoteza H 0 , adică
n n
datele urmează o repartiție Poisson.
b) Verificăm ipoteza H 0 : datele urmează o repartiție normală cu m  X  2,29

şi   s 2  1,31
faţă de H1 : datele nu urmează o repartiție normală

Se obţine d n  0,2   0,1358 , deci am respinge ipoteza H 0 , prin urmare datele nu urmează o
n
repartiţie normală.
Fx j   NORMDISTx j , 2.29 ,1.31, TRUE
xj j F* x j  F(xj) diferente
xF *
j

0 6 0.06 0.04 0.02


1 24 0.3 0.16 0.14
2 31 0.61 0.41 0.20 dn
3 21 0.82 0.71 0.11
4 10 0.92 0.90 0.02
5 8 1 1.00 0.00
100 dn

media 2.29

Testul  2
k   n  pj
2

- Se calculează Y  2
j1
j

n  pj
- k = numărul valorilor distincte
-  j = frecvențele
- n = volumul selecției
- p j = probabilități teoretice calculate cu densitatea sau cu funcția de repartiție a variabilei aleatoare
teoretice.
- p = numărul parametrilor determinați
- Variabila aleatoare Y 2 are o repartiție  2 cu k-1-p grade de libertate
-   Presping H 0 / H 0 adevarata 
MA curs 4 Statistică 7

- F = funcția de repartiție a repartiției  2 cu k-1-p grade de libertate


- h1,k1p  qchisq 1  , k  p  1 este soluția ecuației Fx   1  
 Dacă Y 2  h1,k 1p , se acceptă ipoteza nulă, la un prag de semnificație α .
 Dacă Y 2  h1,k 1p , se respinge ipoteza nulă, deci datele nu urmează repartiția teoretică
presupusă,

Exemplu. Să se verifice dacă datele din exemplul precedent urmează o repartiţie Poisson cu testul  2 .
 k 
 k  
Rezolvare. Repartiţia Poisson Po    X :  e

 k!  
  k 0
Calculăm p1  PX  x1   PX  0  e , p 2  PX  x 2   PX  1  e  , etc


p j  POISSON (x j ; ; FALSE) (Excel)


p j  ppois(x j ; ) (Mathcad)

dpois ( 0 2.29)  0.101

dpois ( 1 2.29)  0.232


qchisq ( 0.954)  9.488

dpois ( 2 2.29)  0.266

dpois ( 3 2.29)  0.203

xj j
 j  n pj
2

pj
n pj
0 6 0.101 1.682
1 24 0.232 0.028
2 31 0.266 0.745
3 21 0.203 0.026
4 10 0.116 0.222
5 8 0.053 1.357 h0.95,4
2
100 4.060 =Y 9.488

2.29

k  6 , p  1 (numărul parametrilor estimaţi) ,   0,05 ,


h1,k 1p  h 0.95, 4  qchisq (0.95,4)  CHIINV0.05,4  9,488
Y 2  4,06 . Deoarece Y 2  h 0.95, 4 se acceptă ipoteza H 0 , adică datele urmează o repartiţie
Poisson.

S-ar putea să vă placă și