Sunteți pe pagina 1din 21

Testarea ipotezelor statistice

Etapele verificrii ipotezelor statistice


Identificarea ipotezelor (H
0
,H
1
) ce trebuie testate
Alegerea testului statistic
Specificarea nivelului de semnificaie
Stabilirea regiunii critice Rc
Stabilirea unor presupuneri referitoare la populaia ce va fi
eantionat (ex: normalitate)
Calcularea valorii testului pe baza datelor din eantion
Utilizarea valorii testului pentru a calcula p-value si respingerea
H
0
dac p-value
Luarea deciziei statistice si aplicarea ei


I. Teste pentru media populaiei:
dispersia
2
este cunoscut
Testul z
Se formuleaz ipoteza
Se extrage un eantion aleator din populaie
i se calculeaz media
Se calculeaz valoarea statisticii z:

Se stabilete pragul de semnificaie (de regul 0,05)
Se compar valoarea calculat z cu o valoare tabelat z
(valoare critic) i se ia decizia de acceptare/respingere
0
/
x
z
n

=
1
: ( ,..., )
n
x x x
x
TEST
Ipoteza
nul
H
0

Ipoteza
alternativ
H
A

Decizia
bilateral
=
0

0

unilateral
dreapta

0
>
0

unilateral
stnga

0
<
0

/ 2 0
0
z z resping H
altfel accept H
o
>

0
0
z z resping H
altfel accept H
o
>

0
0
z z resping H
altfel accept H
o
<

Regiunea critic

a) b) c)
Regiunea critic pentru:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga
/ 2
z
o

/ 2
z
o
z
o
z
o

Exemplu
Se tie c vnzrile medii zilnice ale unui magazin alimentar
sunt de 8000 lei, cu o abatere standard de 1200 lei.Magazinul
organizeaz mai multe campanii publicitare pentru creterea
vnzrilor.
Pentru a vedea dac a crescut volumul vnzrilor ca efect al
publicitii, se nregistreaz vnzrile zilnice pe o perioad de
64 zile i se obine un volum mediu zilnic de 8250 lei.
Se poate afirma, folosind o probabilitate de 95%, c volumul
mediu al vnzrilor este semnificativ mai mare n urma
campaniei publicitare?
Soluie-testul z
Variabila de interes: X volumul mediu al vnzrilor
presupunem o distribuie normal
Dispersia populaiei este cunoscut, deci aplicm testul z.


Ipotezele (test unilateral dreapta):
H
0
:
0
H
1
: >
0

Pragul de semnificaie:
Valoarea critic: z(0,05)=1,65
0.05 (5%) o =
1200
8250
8000
0
=
=
=
o

x
Valoarea testului:



Verificarea:
z=1,67 > z(0,05)= 1,65 => respingem H
0

=> acceptam H1 : putem afirma cu probabilitatea de 95% c
volumul mediu al vnzrilor n urma capaniei publicitare
este semnificativ mai mare dect volumul mediu nainte de
efectuarea campaniei publicitare.
67 , 1
64
1200
8000 8250
=

= z
Recomandri
Un volum mare al eantionului (n30) este adecvat cnd
utilizm procedura de testare utilizat n aceast seciune
(testul z)
Dac n< 30 trebuie avut n vedere distribuia populaiei
eantionate i anume:
Dac populaia e normal distribuit, procedura de testare e
cea pe care am descris-o i poate fi utilizat ptr orice volum
al eantionului
Dac populaia nu e normal distribuit, dar e aproape
simetric, pentru un volum mic al eantionului, procedura
de testare poate furniza rezultate acceptabile.
II. Teste pentru media populaiei () :
dispersia
2
este necunoscut
0
/
x
t
s n

=
Testul t
Se estimeaz dispersia populaiei cu dispersia de eantion:


Se aplic testul t. Se calculeaz valoarea statisticii:



Valorile critice se obtin din tabelele repartiiei t (Student), n funcie
de nivelul de semnificaie ales, cu n-1 grade de libertate

2
2
1
( )
1
n
i
i
x x
s
n
=

Regiunea critic-testul t

a) b) c)
Regiunea critic pentru
a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga
/ 2; 1 n
t
o

/ 2; 1 n
t
o ; 1 n
t
o ; 1 n
t
o

Exemplul 1 testul t
Un productor de bere afirm c volumul unei cutii
este de 0.33 litri. Inspectorii de calitate vor s verifice
acest lucru i selecteaz aleator un eantion de 16
cutii.
n urma prelucrrii datelor, s-au obinut urmtoarele
rezultate:





Confirm datele afirmaia productorului? Folosii un
nivel de ncredere de 95%.
1
2
1
5.25
( ) 23.04
n
i
i
n
i
i
x
x x
=
=

Variabila de interes: X volumul unei cutii de bere


presupunem o distribuie normal
Dispersia populaiei este necunoscut - va trebui
estimat:



Volumul mediu ipotetic:
Volumul mediu din eantion:

Pragul de semnificaie:
0
0.33 =
1
0.328
n
i
i
x
x
n
=
= =

0.05 (5%) o =
2
2
1
( )
23.04
1.536
1 15
n
i
i
x x
s
n
=

= = =

Ipotezele:


Valoarea critic:

Valoarea testului:

Verificarea:

Decizia : cu probabilitatea 95% nu sunt suficiente
motive pentru a respinge ipoteza nul.
0 0
0
:
:
A
H
H


=

/ 2; 1 0.05/ 2;15
2.48 ( , 1)
n
t t TINV n
o
o

= = =
0
0.382 0.33
0.00038
/ 1.24/ 16
x
t
s n

= = =
/ 2; 1
0.00038 2.48
n
t t
o
= < =
Ex. 2. Conducerea unei companii apeleaz la 5 experi pentru a
previziona profitul n anul curent. Valorile previzionate: 2,60; 3,32;
1,80; 3,43; 2,00 (mld lei, preurile anului anterior). tiind c profitul
companiei n anul anterior a fost de 2,01 mld. lei, media previziunilor
experilor este semnificativ mai mare dect profitul anului anterior
(pentru = 0,05)?

Rezolvare. Media previziunilor experilor este mld. lei,
cu dispersia:



i abaterea medie ptratic:


63 , 2 x =
5507 0
4
203 2
1
2
2
,
,
= =

=
n
x x
s
i
74 0
2
, = = s s

Testarea ipotezei statistice:
H
0
: = 2,01,
H
1
: > 2,01 (test unilateral dreapta).



t
,n-1
= t
0,05;4
= 2,132 => regiunea critic: t > t
,n-1

Cum t=1,874 < t
0,05;4
=2,132, nu putem respinge ipoteza c media
profitului previzionat de cei 5 experi pentru anul curent este mai
mic dect profitul anului trecut, de 2,01 mld. lei.

874 , 1
5 / 74 , 0
01 , 2 63 , 2
=

=
n s
x
t
x

Recomandri
Aplicabilitatea procedurii de testare n cazul n care
2
e necunoscut,
depinde de distribuia populaiei eantionate i de mrimea eantionului.
Cnd populaia e normal distribuit, procedura de testare furnizeaz acelai
rezultat pentru orice n.
Cnd populaia nu e normal distribuit, procedura de testare furnizeaz
rezultate aproximative:
Pentru n30 rezultatele furnizate sunt bune n majoritatea cazurilor
Dac n< 30 i populaia e aproximativ normal distribuit, rezultatele
furnizate sunt acceptabile
Dac populaia prezint asimetrie puternic, atunci este recomandat
utilizarea eantioanelor mai mari de 50 uniti.

Testarea ipotezei privind proporia populaiei
Pentru variabile alternative (variabile cu 2 variante: admis/respins,
DA/NU):
media p n colectivitatea general (proporia succeselor) este
raportul dintre nr. cazurilor afirmative (cele care ndeplinesc
condiia cerut) i numrul total de cazuri;
dispersia n colectivitatea general e p(1-p), iar abaterea medie
ptratic este

media pentru eantion e notat cu w, dispersia w(1-w), abaterea
medie ptratic

Pentru testarea ipotezelor statistice privind proporia este necesar ca
np5 i n(1-p)5 numai n acest caz distribuia proporiei este
aproximativ normal distribuit.

) 1 ( p p
) 1 ( w w

Ipoteza nul indic faptul c proporia este egal cu o valoare
specificat n timp ce ipoteza alternativ rspunde la una dintre
cele trei ntrebri:

dac proporia este diferit de valoarea specificat (test
bilateral):

dac proporia este mai mare dect valoarea specificat (test
unilateral dreapta):

dac proporia este mai mic dect valoarea specificat (test
unilateral stnga): .

0 1
: p p H =
0
:
1
p p H >
0 1
: p p H <
Testul statistic pentru proporia p este:



Regiunea critic (Rc) este dat de:

sau pentru testul bilateral;
pentru testul unilateral dreapta;
pentru testul unilateral stnga.

n p p
p w
z
/ )
0
1 (
0
0

=
2 / o
z z <
2 / o
z z>
o
z z>
o
z z <
Ex. Managerul unui lan de magazine consider (n urma unei analize
financiare) c pentru un nou produs comercializarea este profitabil dac
procentul cumprtorilor care ar dori s achiziioneze produsul este mai
mare de 12%. El selecteaz 400 de cumprtori poteniali i afl c 52
dintre acetia vor achiziiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care s conving managerul s comercializeze produsul?

Rezolvare
Ipotezele sunt: (test unilateral dreapta).

Testul statistic este:





Cum i z= 1,25 < 2,33,rezult c nu ne aflm n regiunea
critic (Rc), deci nu avem suficiente dovezi s respingem ipoteza nul
(procentul cumprtorilor 12%) recomandarea este s nu
comercializeze produsul.

12 , 0 :
0
= p H
12 , 0 :
1
> p H
25 , 1
016 , 0
02 , 0
400 / 88 , 0 12 , 0
12 , 0 14 , 0
/ )
0
1 (
0
12 , 0
= =

=
n p p
w
z
33 , 2
01 . 0
= = z z
o