Sunteți pe pagina 1din 23

MATEMATICI SPECIALE I E

si
I C
i i le
CURSUL 13 ser
.I .
T .T
a E.
at e
lt
IPOTEZE ŞI TESTE F a c u STATISTICE
a le
c i
pe
i s
ti c
ma
at e
e M
l d
rsu
Cu 1
Ipoteze statistice I E
s i
I C
Presupunem ca legea care guvernează o anumită i i l e
s e r
populație statistică depinde de un parametru . I . pe care dorim
să îl estimăm. În mod curent, estimarea.Tparametrului .T se
face prin prelucrarea datelor conținute a Eîntr-un eșantion de
t e
a de origine. Deoarece
sondaj prelevat din cadrul populației u lt
a c
această valoare depinde deleeșantionul extras, ea poate
F
diferi de la un sondaj laecaltul. ia Pentru verificarea
s p
corectitudii estimării i c i este nevoie deci să testăm rezultatul
a t
astfel obţinut, ecare m în contextul prezentat are valoare de
at
"ipoteză statistică".
M
d e
u l
r s
Cu 2
Ipoteza statistică este o presupunere care se face cusi I E
privire la parametrul unei repartiţii sau la legea de I C
repartiţie pe care o urmează anumite populațiiestatistice i i l e sau
s r
variabile aleatoare. . I .
T .T
O ipoteză statistică nu este neapărat E .
adevărată. Ea poate
t e a
fi corectă sau greşită. lt a
c u
Ipoteza statistică ce urmează F a a fi testată poartă numele
a le
de ipoteză nulă şi se notează c i în mod uzual prin H0.
pe
Respingerea ipotezei s
i care este testată implică acceptarea
ti c
unei alte ipoteze. maAceastă altă ipoteză este numită ipoteză
at e
alternativă.MIpoteza alternativă se notează de obicei prin
d e
Ha, sauul prin H1. Cele două ipoteze trebuie să reprezinte,
r s
Cu 3
pentru valorea parametrului populaţiei, sau legii de si I E
repartiţie care se analizează, variante mutual exclusive I C şi
exhaustive. i i l e
s e r
. I .
T .T
Verificarea ipotezelor statistice E .
t e a
t a
l ipoteze statistice se
Procedeul de verificare a unei c u
F a
numeşte test sau criteriu de a le semnificaţie. Testele de
verificare a ipotezelorpsatatistice c i au în componența lor
e
i s
patru elemente comune ti c și anume:
a
ipoteza nulă, t e m
a
ipotezae alternativă,
M
testul l dstatistic propriu-zis,
r s u
Cu 4
regiunea critică sau de respingere a testului. I E
si
I C
Procedurile de aplicare ale testelor statisticeeriau câteva i l e
etape comune: I . s
.T .
E . T
1) Stabilirea ipotezei nule (H0).atea
u lt
2) Stabilirea ipotezei alternative a c Ha.
3) Calculul estimativ alalevalorii F parametrului care trebuie
c i
determinat. pe
i s
4) Alegerea testului ti c de verificare a ipotezei nule și a
a
unui prag α detesemnificație.
m
a
5) Stabilireae M unei regiuni critice astfel încât
probabilitatea
l d ca rezultatul testului să aparțină acestei
r s u
C u 5
regiuni, atunci când ipoteza nulă este adevărată, să fiesi I E
egală cu α. I C
i i l e
s e r
Modul de utilizare al testului . I .
T .T
E .
Calculul estimatorului ca și procedeul t e a de verificare a
lt a
ipotezei nule se face pe baza unui a c eşantion de sondaj extras
u
din populaţia originală. Presupunem e F că eșantionul extras
ia l
are volumul n și că populația e c studiată are caracteristica x.
s p
Dacă punctul definit ti c de vectorul de sondaj  x1 , x2 ,.., xn 
i
a
m critică Rc, ipoteza H0 se respinge, iar dacă
cade în regiunea at e
acest punct e Mcade în afara regiunii critice Rc, ipoteza H0 se
l d
acceptă.
r s u
Cu 6
I E
si
Datorită valorii foarte mici a pragului de semnificație, I C
numai într-un număr redus de cazuri punctul (vectorul) i i l e de
e r
sondaj  x1 , x2 ,.., xn  va cădea în Rc, majoritatea . I . s acestor
T .T
puncte vor cădea în afara regiunii critice. E .
t e a
lt a
Erori statistice c u
F a
a le
i
Nu este exclus ca punctul s pe c de sondaj  x1 , x2 ,.., xn  să
i c i
cadă în regiunea acritică t chiar și atunci când ipoteza nulă
e m
este adevărată. a De asemenea nu este exclus ca punctul de
t
e M
l d
r s u
Cu 7
sondaj  x1 , x2 ,.., xn  să cadă în afara regiunii critice, iar si
I E
ipoteza nulă să fie în realitate falsă. I C
i l e
Atunci când, din cauza unui test satatistic,sse eri respinge o
ipoteză corectă se spune că s-a săvârșit o.Teroare .I. de genul
întâi, iar atunci când se acceptă ca valabilă E . T o ipoteză falsă
se spune că s-a săvârșit o eroare tde e a
t genul al doilea.
l a
Probabilitatea comiterii unei u
c erori de genul întâi este
F a
egală cu α şi se numeşte inivel a le sau prag de semnificaţie. În
cadrul unui test statistic e cprobabilitatea de garantare a
s p
c i
rezultatelor este (1 a t - α). Această probabilitate se numește
i
nivelul de încrederet e m al testului.
a
e M
l d
r s u
Cu 8
Probabilitatea comiterii unei erori de genul al doilea I E
si se
notează cu β. În această situație valoarea (1 - β) poartă I C
numele de putere a testului statistic. i i l e
s e r
. I .
.T
Observații: 1) Cu cât probabilităţile comiterii E . T erorilor de
genul întâi t e a
lt a
u
α = P(eroareacde gen I) =
e F
= P(se respingereialH0 deși H0 este corectă),
e c
s p
i c i
şi de genul al doilea a t
t e m
a
e M
l d β = P(eroare de gen II) =
r s u
Cu 9
= P(se acceptă H0 deși H0 este falsă), I E
s i
I C
i l e
i lucru se
sunt mai mici, cu atât testul este mai bun. Acest s e r
poate realiza în principiu prin mărirea volumului . I . n al
T .T
eşantionului. E .
t e a
2) Datorită legăturilor de condiționare lt a care pot apare
c u
între erorile de genul I și celeFade genul al II-lea, nu putem
face întotdeauna ca nivelul a leacestor erori să fie oricât de
c i
mici dorim decât separat, pe pentru fiecare dintre ele. Într-
i s
adevăr, dacă distribuțiile ti c testelor prin care se verifică
ma
e
valabilitatea aipotezelor H0 și Ha se întersectează între ele
t
ca în figura e M1 atunci se poate observa cu ușurință că
l d
r s u
micșorarea valorii lui  , adică a regiunii de sub graficul
Cu 10
distribuției corespunzătoare ipotezei H0 situate la dreapta I E
si
punctului critic x  c , conduce la mărirea valorii luiI C ,
i l e
adică a regiunii de sub graficul distribuției corespunzătoare e r i
s
ipotezei Ha situate la stânga punctului critic T . I . x  c .
. T .
a E
a t e
u lt
a c
e F
fH ia l fH
0
e c a

s p
i c i
a t
t e m
0 a
e M
Figura
l d 1. Legătura dintre probabilităţile α şi β.
r s u
Cu 11
3) Dacă ipoteza nulă are forma H0: h = h0, atunci ipoteza I E
si
alternativă poate avea una din următoarele trei forme: I C Ha:
h ≠ h0 (h < h0 sau h > h0), sau Ha: h > h0, sau eHria: h < h0. În i l e
primul caz vom spune că avem de a .face .I s cu un test
.T
bilateral, în cel de al doilea caz cu E . un test unilateral
T
dreapta, iar în cel de al treilea acaz t e a cu un test unilateral
lt
stânga. Regiunea critică pentru a c testul bilateral diferă de cea
u
pentru testele unilaterale. ale F
c i
pe
i s
ti c
ma
at e
e M
l d
r s u
Cu 12
I E
si
I C
i i le
ser
.I .
T .T
a) Ha: h ≠ h0 b) Ha: h > h0 a E. c) Ha: h < h0
a t e
u lt
Figura 2. Regiunea critică c
a pentru: a) testul bilateral;
e F
b) testul unilateral dreapta; ia l c) testul unilateral stânga.
e c
s p
i c i
Categorii de teste a t
e m
Testele pota fi clasificate după natura caracteristicilor
t
care intervin e M în problemele studiate, sau după scopul
l d
pentru
r s ucare sunt folosite.
Cu 13
După natura caracteristicilor care intervin în problemele I E
si
studiate, ele pot fi clasificate în teste pentru variabile I C
continue şi teste pentru variabile discrete, iar edupă l e
i scopul
i
s r
urmărit în teste de concordanța și în teste de . I . comparare.
T .T
E .
t e a
Teste de concordanţă lt a
c u
F a
Testele de concordanță a le
au menirea să stabilească gradul
c i
de legătură dintre valorile e
p calculate ale estimatorilor
i s
statistici pe baza adatelorti c din eşantioanele de sondaj şi
e m
valorile teoretice a ale parametrilor populației statistice pe
t
care îi estimează,
e M sau altfel zis "cât de mult poate să se
l d
abată r s u
valoarea unui estimator de la valoarea presupusă a
C u 14
parametrului estimat pentru a putea considera că între scele I E
i
două valori are loc o nepotrivire?". I C
i i l e
s e r
. I .
Teste de comparare .T
E . T
e a
Date fiind două eşantioane En1tașit En2 extrase din două
u l
populaţii diferite, P1 şi respectiv a c P , prin utilizarea testelor
e F 2
de verificare se doreşte de l
i fapt compararea celor două
a
e c
populaţii. s p
i c i
Cum testele m t
dea verificare a ipotezelor statistice se
ate
bazează pe folosirea datelor de sondaj care provin din
e M
eșantioane l d alcătuite la întâmplare, dificultatea realizării
r s u
Cu 15
acestei cerințe constă în aceea că diferenţele dintre cele I E
si
două eşantioane, ca şi similaritatea lor, se pot datora: I C
i i l e
s e r
- diferenţelor dintre populaţii, . I .
T .T
E .
şi /sau t e a
lt a
c u
a
- diferenţelor de sondajaldintre e F eşantioane.
c i
pe
i s
ti c
ma
at e
e M
l d
r s u
Cu 16
Testarea ipotezelor privind media unei populaţii I E
si
statistice I C
i i l e
s e r
a) Cazul eșantioanelor de volum mare . I .
T .T
E .
Utilizarea eşantioanelor de volum t e a mare (n > 30) face
lt a
posibilă aplicarea teoremei limită a c centrală.
u
e F
ia l
Testul bilateral. În pcazul e c acestui tip de test ipotezele au
i s
forma: ti c
a
t e m H0: μ = μ0 (μ - μ0 = 0),
a
e M
l d : μ ≠ μ (μ - μ ≠ 0) (adică μ < μ sau μ > μ ).
H
r s u a 0 0 0 0
Cu 17
I E
s i
Testarea ipotezei nule se face pe baza mediei xe IaC
i i l
eşantionului prelevat. Dacă volumul eşantionului s e r este
. I .
mare, media eşantionului x este distribuită .T aproape normal
(teorema limită centrală). Astfel, putem . T
E presupune că
t e a
variabila aleatoare lt a
c u
F a
e
ix  0 x  0
a l
zpec 
i c i s   n,
a t x

t e m
a
urmează e Mo distribuţie normală standard.
l d
r s u
Cu 18
Pentru un prag de semnificaţie    0,1 , prestabilit, si
I E
( se alege de obicei foarte mic) putem determinae Ivaloarea C
i i l
zα/2, pentru care s e r
. I .
.T
P  z  z /2   E.. T
t e a
lt a
c u
Aceasta înseamnă că regiunea F a critică Rc este dată de:
a le
c i
pe
Rc : i zs < - z α/2 , sau z > z α/2.
ti c
ma
at e
e M
l d
r s u
Cu 19
Observaţie: Regiunea critică R c este acea submulţimesi a I E
axei reale, în cazul nostru R c   ,  z /2   z /2 ,IC,
l e
pentru care avem asigurata relaţia P  z  R c  seri .
i
. I .
T .T
Regula de decizie are următorul E .
conținut: Acceptam
t e a
ipoteza H0, dacă u lt a
a c
e F
l
i x  0
a
c
spze /2   z /2 ,
ti c i x n
ma
at e
și o respingem
e M dacă
l d
r s u
Cu 20
E
x  0 x  0 i I
  z /2 , sau  z /2 . C s
x n x n l e I
r i i
s e
. I .
Această regulă este reprezentată grafic .T în figura 3.
E . T
e a
t din condiţia
Observaţie: Punctul z /2 se determină u lt a
a c
e F
a l 

2
1eci 
t

ti 
c
s p
i 2  e 2
dt 
2
,
ma z  /2

at e
sau din condiţia
e M
l d
r s u
Cu 21
 z /2 E
1 
t2
 i I
 2  e dt 
2
2
,
e I C
s

i i l
ser
.I .
sau din condiţia T .T
a E.
 z /2 2 e
at  t2
1 
t
1 lt 
 e
e 2
dt  c u 2
dt   .
a
F 2
 2 a le z /2
c i
pe
i s
t i c
ma
at e
e M
l d
rs u
Cu 22
I E
si
I C
i i le
ser
.I .
T .T
a E.
at e
u lt
a c
e F
ia l
e c
s p
i c i
unde c1 = –zα/2a,t iar c2 = z α/2.
t e m
a
Figura e M3. Reprezentarea grafică a regulei de decizie.
l d
r s u
Cu 23

S-ar putea să vă placă și