Sunteți pe pagina 1din 26

Econometrie

CURS 2. Testarea ipotezelor statistice


Lect.univ.dr. Alexandru(Davidescu) Adriana AnaMaria
Departamentul de Statistica si Econometrie, CSIE
adrianaalexandru@yahoo.com
2
Structura curs 2
1. Concepte i notaii
2. Paii procesului de testare
3. Testarea ipotezei privind media populaiei generale () pentru
eantioane de volum mare n>30 (testul z)
4. Testarea ipotezei privind media () a unei populatii normale
N(,
2
), cand dispersia
2
populaiei generale nu este
cunoscuta (testul t)
5. Aplicaii
3
TESTAREA IPOTEZELOR STATISTICE
Testarea ipotezelor statistice reprezint o alt modalitate,
alturi de estimaia pe interval de ncredere, de a realiza
inferena statistic.
Scopul acestui tip de inferen este s determinm dac exist
suficiente dovezi statistice care s ne permit s concluzionm
c o afirmaie (sau o ipotez) despre un parametru este
adevrat.
n urma prelevrii unui eantion dintr-o populaie statistic, prin
prelucrarea datelor provenite din sondaj se obine un estimator
(estimatie) al parametrului urmrit n populaia de origine.
Se pune atunci problema n ce msur parametrul estimat pe
baza rezultatelor sondajului asigur credibilitatea aprecierilor
fcute asupra ntregii colectiviti.
Estimatorul reprezint o presupunere asupra parametrului,
deci o ipotez statistic.
4
Notaii
COLECTIVITATEA
GENERAL
(POPULAIA TOTAL)
COLECTIVITATEA DE
SELECIE
(EANTION)
INDICATORUL

PARAMETRII ESTIMATORI
MEDIA
N
x
N
i
i
=
=
1

n
x
x
n
i
i
=
=
1

DISPERSIA
(VARIANA)
( )
N
x
N
i
i
=

=
1
2
2

o

( )
1
1
2
2

=
n
x x
s
n
i
i

ABATEREA MEDIE
PTRATIC
(ABATEREA
STANDARD)
( )
N
x
N
i
i
=

= =
1
2
2

o o

( )
1
1
2
2

= =

=
n
x x
s s
n
i
i


5
Concepte(1/4)
Ipotez statistic = o afirmatie cu privire la parametrul repartiiei
unei variabile aleatoare.
Ipoteza nul (H
0
) = const ntotdeauna n admiterea caracterului
ntmpltor al deosebirilor, adic n presupunerea c nu exist deosebiri
eseniale;
= afirmatie in care se specifica valori ipotetice
pentru parametrul populatiei totale.
Ipoteza alternativ (H
1
) = o teorie care contrazice ipoteza nul. Ea
va fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a se
stabili c este adevrat.
= o afirmatie despre acelasi parametru al
populatiei totale ca si cel la care se refera H
0
, dar care
contrazice ipoteza nula.

Procedeul de verificare a unei ipoteze statistice se numete test sau
criteriu de semnificaie.

6
Concepte(2/4)
Exist cinci componente principale ce se precizeaz in testarea unei
ipoteze statistice:
ipoteza nul;
ipoteza alternativ;
statistica testului;
pragul de semnificatie;
regiunea critic (de respingere).
Statistica testului este utilizata drept criteriu de acceptare sau de
respingere a ipotezei nule






7
Concepte(3/4)
Regiunea critic (de respingere a lui H
0
), Rc
=valorile numerice ale statisticii testului pentru care
ipoteza nul va fi respins.
este astfel aleas nct probabilitatea ca ea s conin
testul statistic, cnd ipoteza nul este adevrat s fie ,
cu mic (=0.01 etc).
dac valoarea testului cade n regiunea critic Rc, ipoteza
H
0
se respinge, iar dac punctul cade n afara regiunii
critice Rc, ipoteza H
0
se accept (sau nu avem motive sa o
respingem).
regiunea critic este delimitat de valoarea critic, C
punctul de tietur n stabilirea acesteia.
8
Concepte(4/4)
Eroare de genul nti = eroarea pe
care o facem respingand o ipotez
nul, dei este adevrat.
Riscul de genul nti () =
probabilitatea comiterii unei erori de
genul nti; se numete nivel sau prag
de semnificaie.
Nivelul de ncredere al unui test
statistic este (1-) iar n expresie
procentual, (1-)100 reprezint
probabilitatea ca rezultatele s fie
adevrate.
Decizia de Ipoteza adevrat
acceptare H
0
H
1

H
0
Decizie corect
(probabilitate 1-)
Eroare de tip II
(risc )
H
1
Eroare de tip I
(risc )
Decizie corect
(probabilitate 1-)
= P(respingere H
0
H
0
este
adevrat)=P(eroare de tip I)

= P(acceptare H
0
H
0
este
fals)=P(eroare de tip II)

Eroare de genul al doilea = eroarea
pe cere o facem acceptnd o ipotez
nul, dei este fals.
Probabilitatea (riscul) comiterii unei erori
de genul al doilea este .
Puterea testului statistic este (1-).
P-value=cel mai mic nivel de
semnificaie la care poate fi respins
ipoteza nul.
9
Paii procesului de testare
1) Se identific ipoteza statistic special despre parametrul
populaiei -ipoteza nul (H
0
)
2) Se formuleaz ipoteza alternativ H
1
. Ea va fi acceptat doar
cnd exist suficiente dovezi, evidene, pentru a se stabili c
este adevrat.
Ipoteza alternativ poate cpta trei forme, care rspund la trei tipuri
de ntrebri referitoare la parametrul studiat:
- dac parametrul este diferit fa de valoarea specificat n ipoteza
nul (test bilateral);
- dac parametrul este mai mic sau mai mare fa de valoarea
specificat n ipoteza nul (test unilateral stanga, respectiv unilateral
dreapta).
3) Identificarea statisticii testului si a repartitiei acestuia dupa
presupunerile despre populatia ce este esantionata.
4) Se specifica pragul de semnificatie al testului.
10
Paii procesului de testare
5) Se culeg datele si se calculeaz indicatorii statistici n eantion.
6) In ipoteza ca H
0
este adevarata si pe baza datelor culese de la
unitatile esantionului, se calculeaza valoarea statisticii testului.
7) Se stabilete regiunea critic-Rc si valoarea critica a testului in
functie de repartitia statisticii testului si a pragului de semnificatie.
Regiunea critic reprezint valorile numerice ale testului statistic
pentru care ipoteza nul va fi respins.
8) Se desprind concluziile:
a) dac valoarea numeric a testului statistic cade n regiunea critic
(Rc), respingem ipoteza nul i concluzionm c ipoteza alternativ
este adevrat.
b) dac valoarea numeric a testului nu cade n regiunea critic (Rc),
se accept ipoteza nul H
0
.
11
Formularea ipotezelor
Daca se doreste testarea ipotezei privind media a unei populatii
de caracteristica X, atunci
Ipoteza alternativ poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalitii parametrului media colectivitii
generale, cu valoarea
0
)
test bilateral:
H
0
: =
0
H
1
:
0
( <
0
sau >
0
)
test unilateral dreapta:
H
0
: =
0
H
1
: >
0
test unilateral stnga:
H
0
: =
0
H
1
: <
0

12
Regiunea critic

a) b) c)
Regiunea critic pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga
13
Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare n>30- este cunoscut
(testul z)-(1/4)
In verificarea ipotezelor statistice referitoare la media unei populatii,
putem relaxa conditia ca variabila de interes X s urmeze o repartiie
normal prin utilizarea eantioanelor de volum mare ce face posibil
aplicarea teoremei limit central. Aceasta teorem d posibilitatea
folosirii repartiiei normale drept lege practic de aproximare.
Se consider o populaie statistic de caracteristica X, cu media si
dispersia
2
, din care se extrage un esantion de volum mare n (n>30),
valorile obtinute in urma selectiei sunt x
1
,x
2
,,x
n
.
Se stabilete pragul de semnificaie , de regul 0.05.

Se calculeaz statistica testului


Se compar valoarea calculat cu o valoare tabelat(valoare critic) i se
ia decizia




2
o
o
n
s
x
z
x
calc
0

=
14
Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare n>30 (testul z)-(2/4)
15
Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare n>30 (testul z)-(3/4)
16
Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare n>30 (testul z)-(4/4)
17
Aplicaia 1(1/2)
Un fond de investiii a obinut n anul 2005 un profit mediu lunar de 12%.
Rezultatele pentru primele 9 luni ale anului 2006 arat un profit mediu lunar de
11.5%.
Din cercetri anterioare, se cunoate c riscul mediu al fondului de investiii,
msurat prin abaterea standard, este =2%.
Se poate afirma, folosind o probabilitate de 95%, ca profitul mediu lunar n anul
2006 este semnificativ diferit ce profitul mediu lunar obinut n anul 2005?
Variabila de interes: X profitul lunar presupunem o distribuie normal


Dispersia populaiei este cunoscut:
Profitul mediu lunar n anul 2005:
Profitul mediu lunar n cele n=9 luni din 2006:
Pragul de semnificaie:
2
( , ) X N o
2
0.02 0.0004 o o = =
0
0.12 =
0.115 x =
0.05 (5%) o =
Ipotezele:
0 0
: = H
0 1
: = H
18
Aplicaia 1(2/2)
Valoarea testului:
0
0.115 0.12
0.083
/ 0.02/ 9
x
z
n

o

= = =
Valoarea critic:
/ 2
1.96 z
o
=
Verificarea:
/ 2
0.083 1.96 z z
o
= < =
Decizia: accept cu probabilitatea de 95% putem afirma c profitul
mediu lunar obinut n cele 9 luni ale anului 2006 nu este semnificativ
diferit de valoarea de 12% obinut n anul 2005.
0
H
Tipul testului: deoarece , i utilizm test Z bilateral; se
ncepe construirea graficului.
30 > n
0 1
: = H
n funcie de nivelul de ncredere al testului statistic:
05 . 0 % 95 ) 1 ( = = o o
i se stabilete :
Z tabelar (teoretic) , iar valorile se trec pe grafic
Regiunea de respingere (critic): dac at ipoteza
nula se respinge.
2 / o
z
2 / 2 /
sau :
o o
z z z z R
c
> <
19
Aplicaia 2
2. Un fabricant de materiale de construcii comercializeaz ciment n pungi, care
trebuie s conin 12 kg/pung. Pentru a detecta eventuale abateri n ambele
sensuri de la aceast cantitate, selecteaz 100 de pungi, pentru care calculeaz
kg, s
x
= 0,5 kg. Pentru = 0,01 (grad de ncredere (1- )100=99%) s se determine dac se
accept ipoteza nul, aceea c greutatea pungilor este n medie de 12 kg.
H
0
: = 12
H
1
: 12 ( < 12 sau > 12);
z
/2
=z
0,005
=2,575



Regiunea critic: z< - z
/2
sau z> z
/2
Cum z = - 3,0 < - 2,575 se respinge ipoteza nul H
0
i se accept ipoteza
alternativ, aceea c greutatea pungilor difer semnificativ de 12 kg.
85 , 11 = x
0 , 3
10 5 , 0
12 85 , 11
n s
12 x
n
12 x 12 x
z
x
=

=
o
o
20
Testarea ipotezei privind media () a unei populatii normale N(,
2
),
cand dispersia
2
populaiei generale nu este cunoscut (testul t)
Ipotezele statistice sunt
21
Testarea ipotezei privind media () a unei populatii normale N(,
2
),
cnd dispersia
2
populaiei generale nu este cunoscut (testul t)
Aplicatia 1-(1/3)
Un productor de bere afirm c volumul unei cutii este de 0.33 litri.
Inspectorii de calitate vor s verifice acest lucru i selecteaz aeator
un eantion de 16 cutii care snt gata de comercializare.
n urma prelucrrii datelor, s-au obinut urmtoarele rezultate:





Confirm datele afirmaia productorului? Folosii un nivel de ncredere
de 95%.
1
2
1
5.25
( ) 23.04
n
i
i
n
i
i
x
x x
=
=

Aplicatia 1-(2/3)
Variabila de interes: X volumul unei cutii de bere presupunem o distribuie
normal

Dispersia populaiei este necunoscut - va trebui estimat:

Volumul mediu ipotetic:

Volumul mediu din eantion:

Pragul de semnificaie:

Ipotezele:


Valoarea critica:
2
( , ) X N o
0
0.33 =
1
0.328
n
i
i
x
x
n
=
= =

0.05 (5%) o =
2
2 1
( )
23.04
1.536
1 15
n
i
i
x x
s
n
=

= = =

/ 2; 1 0.05/ 2;15
2.48 ( , 1)
n
t t TINV n
o
o

= = =
0 0
: = H
0 1
: = H

Valoarea testului:

Verificarea:

Decizia : cu probabilitatea 95% nu snt suficiente motive pentru a respinge
ipoteza nul.

0
0.382 0.33
0.00038
/ 1.24/ 16
x
t
s n

= = =
/ 2; 1
0.00038 2.48
n
t t
o
= < =
Aplicatia 1-(3/3)
25
Aplicaia 2
1. Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei
n anul curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei,
preurile anului anterior). tiind c profitul companiei n anul anterior a fost de 2,01
mld. lei, sunt suficiente dovezi pentru a concluziona c media previziunilor experilor
este semnificativ mai mare dect cifra anului anterior (pentru = 0,05)? Presupunem
ca profitul este o variabila cu repartitie normala.

Media previziunilor experilor este mld. lei,

Dispersia

Abaterea standard mld. lei.
Elementele procesului de testare a ipotezei statistice sunt:
H0: = 2,01,
H1: > 2,01 (test unilateral dreapta).
Cum t
,n-1
= t
0,05;4
= 2,132, regiunea critic este dat de t>t,n-1.
Dar tcalc=1,874< t0,05;4=2,132, nu putem trage concluzia c media profitului previzionat de cei
5 experi pentru anul curent este semnificativ mai mare dect profitul anului trecut, de 2,01 mld. lei.
63 , 2 x =
( )
5507 , 0
4
203 , 2
1 n
x x
s
2
i 2
x
= =

74 , 0 s s
2
x x
= =
874 , 1
5 / 74 , 0
01 , 2 63 , 2
n s
x
s
x
t
x x
=

=

26