Sunteți pe pagina 1din 26

Econometrie

CURS 2. Testarea ipotezelor statistice


Lect.univ.dr. Alexandru(Davidescu) Adriana AnaMaria Departamentul de Statistica si Econometrie, CSIE adrianaalexandru@yahoo.com

Structura curs 2
1. 2. 3. 4. Concepte i notaii Paii procesului de testare Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z) Testarea ipotezei privind media () a unei populatii normale N(,2), cand dispersia 2 populaiei generale nu este cunoscuta (testul t) Aplicaii

5.

TESTAREA IPOTEZELOR STATISTICE


Testarea ipotezelor statistice reprezint o alt modalitate, alturi de estimaia pe interval de ncredere, de a realiza inferena statistic. Scopul acestui tip de inferen este s determinm dac exist suficiente dovezi statistice care s ne permit s concluzionm c o afirmaie (sau o ipotez) despre un parametru este adevrat. n urma prelevrii unui eantion dintr-o populaie statistic, prin prelucrarea datelor provenite din sondaj se obine un estimator (estimatie) al parametrului urmrit n populaia de origine. Se pune atunci problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur credibilitatea aprecierilor fcute asupra ntregii colectiviti. Estimatorul reprezint o presupunere asupra parametrului, deci o ipotez statistic.

Notaii
INDICATORUL COLECTIVITATEA GENERAL (POPULAIA TOTAL) PARAMETRII
=
N

COLECTIVITATEA DE SELECIE (EANTION) ESTIMATORI


x=

MEDIA DISPERSIA (VARIANA) ABATEREA MEDIE PTRATIC (ABATEREA STANDARD)

x
i =1

x
i =1

N
i 2

n
2 i

2 =

( x )
i =1

s2 =

( x x)
n i =1

n 1

= 2 =

( x
i =1

s = s2 =

( x x)
n i i =1

n 1

Concepte(1/4)
Ipotez statistic = o afirmatie cu privire la parametrul repartiiei unei variabile aleatoare. Ipoteza nul (H0) = const ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu exist deosebiri eseniale; = afirmatie in care se specifica valori ipotetice pentru parametrul populatiei totale. Ipoteza alternativ (H1) = o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a se stabili c este adevrat. = o afirmatie despre acelasi parametru al populatiei totale ca si cel la care se refera H0 , dar care contrazice ipoteza nula. Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de semnificaie.

Concepte(2/4)
Exist cinci componente principale ce se precizeaz in testarea unei ipoteze statistice: ipoteza nul; ipoteza alternativ; statistica testului; pragul de semnificatie; regiunea critic (de respingere). Statistica testului este utilizata drept criteriu de acceptare sau de respingere a ipotezei nule

Concepte(3/4)
Regiunea critic (de respingere a lui H0), Rc =valorile numerice ale statisticii testului pentru care ipoteza nul va fi respins. este astfel aleas nct probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrat s fie , cu mic (=0.01 etc). dac valoarea testului cade n regiunea critic Rc, ipoteza H0 se respinge, iar dac punctul cade n afara regiunii critice Rc, ipoteza H0 se accept (sau nu avem motive sa o respingem). regiunea critic este delimitat de valoarea critic, C punctul de tietur n stabilirea acesteia.

Concepte(4/4)
Eroare de genul nti = eroarea pe care o facem respingand o ipotez nul, dei este adevrat. Riscul de genul nti () = probabilitatea comiterii unei erori de genul nti; se numete nivel sau prag de semnificaie. Nivelul de ncredere al unui test statistic este (1-) iar n expresie procentual, (1-)100 reprezint probabilitatea ca rezultatele s fie adevrate.
Decizia de acceptare H0 H1 H0 Decizie corect (probabilitate 1-) Eroare de tip I (risc ) Ipoteza adevrat H1 Eroare de tip II (risc ) Decizie corect (probabilitate 1-)

= P(respingere H0 H0 adevrat)=P(eroare de tip I) H0

este

= P(acceptare H0 Eroare de genul al doilea = eroarea fals)=P(eroare de tip II) pe cere o facem acceptnd o ipotez nul, dei este fals. Probabilitatea (riscul) comiterii unei erori de genul al doilea este . Puterea testului statistic este (1-). P-value=cel mai mic nivel de semnificaie la care poate fi respins ipoteza nul.

este

Paii procesului de testare


1) 2) Se identific ipoteza statistic special despre parametrul populaiei -ipoteza nul (H0) Se formuleaz ipoteza alternativ H1. Ea va fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a se stabili c este adevrat. Ipoteza alternativ poate cpta trei forme, care rspund la trei tipuri de ntrebri referitoare la parametrul studiat: - dac parametrul este diferit fa de valoarea specificat n ipoteza nul (test bilateral); - dac parametrul este mai mic sau mai mare fa de valoarea specificat n ipoteza nul (test unilateral stanga, respectiv unilateral dreapta). 3) 4) Identificarea statisticii testului si a repartitiei presupunerile despre populatia ce este esantionata. Se specifica pragul de semnificatie al testului.
9

acestuia

dupa

Paii procesului de testare


5) 6) 7) Se culeg datele si se calculeaz indicatorii statistici n eantion. In ipoteza ca H0 este adevarata si pe baza datelor culese de la unitatile esantionului, se calculeaza valoarea statisticii testului. Se stabilete regiunea critic-Rc si valoarea critica a testului in functie de repartitia statisticii testului si a pragului de semnificatie. Regiunea critic reprezint valorile numerice ale testului statistic pentru care ipoteza nul va fi respins. 8) Se desprind concluziile: a) dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem ipoteza nul i concluzionm c ipoteza alternativ este adevrat. b) dac valoarea numeric a testului nu cade n regiunea critic (Rc), se accept ipoteza nul H0.

10

Formularea ipotezelor
Daca se doreste testarea ipotezei privind media a unei populatii de caracteristica X, atunci
Ipoteza alternativ poate avea una din trei forme (pe care le vom exemplifica pentru testarea egalitii parametrului media colectivitii generale, cu valoarea 0)

test bilateral:

H0: = 0 H1: 0 ( < 0 sau > 0)


test unilateral dreapta:

H0: = 0 H1: > 0


test unilateral stnga:

H0: = 0 H1: < 0

11

Regiunea critic

a) c)

b)

Regiunea critic pentru a) test bilateral; b) test unilateral dreapta;

c) test unilateral stnga

12

Testarea ipotezei privind media populaiei generale () 2 pentru eantioane de volum mare n>30este cunoscut (testul z)-(1/4)

In verificarea ipotezelor statistice referitoare la media unei populatii, putem relaxa conditia ca variabila de interes X s urmeze o repartiie normal prin utilizarea eantioanelor de volum mare ce face posibil aplicarea teoremei limit central. Aceasta teorem d posibilitatea folosirii repartiiei normale drept lege practic de aproximare. Se consider o populaie statistic de caracteristica X, cu media si dispersia 2, din care se extrage un esantion de volum mare n (n>30), valorile obtinute in urma selectiei sunt x1,x2,,xn. Se stabilete pragul de semnificaie , de regul 0.05. Se calculeaz statistica testului

z calc =

x 0 sx n

Se compar valoarea calculat cu o valoare tabelat(valoare critic) i se ia decizia


13

Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(2/4)

14

Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(3/4)

15

Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(4/4)

16

Aplicaia 1(1/2)
Un fond de investiii a obinut n anul 2005 un profit mediu lunar de 12%. Rezultatele pentru primele 9 luni ale anului 2006 arat un profit mediu lunar de 11.5%. Din cercetri anterioare, se cunoate c riscul mediu al fondului de investiii, msurat prin abaterea standard, este =2%. Se poate afirma, folosind o probabilitate de 95%, ca profitul mediu lunar n anul 2006 este semnificativ diferit ce profitul mediu lunar obinut n anul 2005? Variabila de interes: X profitul lunar presupunem o distribuie normal

X : N ( , 2 ) = 0.02 2 = 0.0004 0 = 0.12 Dispersia populaiei este cunoscut: x = 0.115 Profitul mediu lunar n anul 2005:
Profitul mediu lunar n cele n=9 = 0.05 (5%)luni din 2006: Pragul de semnificaie: H 0 : = 0 Ipotezele:

H 1 : 0

17

Aplicaia 1(2/2)
Tipul testului: deoarece n > 30 , i H 1 : 0 utilizm test Z bilateral; se ncepe construirea graficului. n funcie de nivelul de ncredere al testului statistic: (1 ) = 95% = 0.05 i se stabilete : Z tabelar (teoretic) z/ 2 , iar valorile se trec pe grafic Regiunea de respingere (critic): dac Rc : z < z / 2 sau z > z / 2 at ipoteza nula se respinge. Valoarea testului: Valoarea critic: Verificarea:

z=

x 0 0.115 0.12 = = 0.083 / n 0.02 / 9

z / 2 = 1.96

z = 0.083 < z / 2 = 1.96

Decizia: accept H 0 cu probabilitatea de 95% putem afirma c profitul mediu lunar obinut n cele 9 luni ale anului 2006 nu este semnificativ diferit de valoarea de 12% obinut n anul 2005.
18

Aplicaia 2
2. Un fabricant de materiale de construcii comercializeaz ciment n pungi, care trebuie s conin 12 kg/pung. Pentru a detecta eventuale abateri n ambele sensuri de la aceast cantitate, selecteaz 100 de pungi, pentru care calculeaz kg, sx= 0,5 kg. Pentru = 0,01 (grad de ncredere (1- )100=99%) s se determine dac se accept ipoteza nul, aceea c greutatea pungilor este n medie de 12 kg. x =11,85 H0: = 12 H1: 12 ( < 12 sau > 12); z /2=z0,005=2,575

z=

x 12 x 12 x 12 11,85 12 = = = 3,0 x 0 , 5 10 n s n

Regiunea critic: z< - z

/2

sau

z> z

/2

Cum z = - 3,0 < - 2,575 se respinge ipoteza nul H0 i se accept ipoteza alternativ, aceea c greutatea pungilor difer semnificativ de 12 kg.
19

Testarea ipotezei privind media () a unei populatii normale N(,2), cand dispersia 2 populaiei generale nu este cunoscut (testul t) Ipotezele statistice sunt

20

Testarea ipotezei privind media () a unei populatii normale N(,2), cnd dispersia 2 populaiei generale nu este cunoscut (testul t)

21

Aplicatia 1-(1/3)
Un productor de bere afirm c volumul unei cutii este de 0.33 litri. Inspectorii de calitate vor s verifice acest lucru i selecteaz aeator un eantion de 16 cutii care snt gata de comercializare. n urma prelucrrii datelor, s-au obinut urmtoarele rezultate:

Confirm datele afirmaia productorului? Folosii un nivel de ncredere de 95%.

n xi = 5.25 i =1 n ( x x ) 2 = 23.04 i i =1

Aplicatia 1-(2/3)
Variabila de interes: X volumul unei cutii de bere presupunem o distribuie normal X : N ( , 2 ) Dispersia populaiei este necunoscut - va trebui estimat: Volumul mediu ipotetic: 0 = 0.33 Volumul mediu din eantion: x =
s2 =

( x x)
i=1 i

n1

23.04 = 1.536 15

x
i =1

= 0.328

Pragul de semnificaie: = 0.05 (5%) Ipotezele:

H 0 : = 0 H 1 : 0

Valoarea critica: t / 2;n 1

= t0.05/ 2;15 = 2.48 = TINV ( , n 1)

Aplicatia 1-(3/3)
x 0 0.382 0.33 = = 0.00038 s/ n 1.24 / 16

Valoarea testului:

t=

Verificarea:

t = 0.00038 < t / 2;n 1 = 2.48

Decizia : cu probabilitatea 95% nu snt suficiente motive pentru a respinge ipoteza nul.

Aplicaia 2
1.

Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n anul curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preurile anului anterior). tiind c profitul companiei n anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi pentru a concluziona c media previziunilor experilor este semnificativ mai mare dect cifra anului anterior (pentru = 0,05)? Presupunem ca profitul este o variabila cu repartitie normala. Media previziunilor experilor este Dispersia

x = 2,63

mld. lei,

( x x) s =
2 x i

n1

2,203 = 0,5507 4

x x 2,63 2,01 t = = = = 1,874 Elementele procesului de testare a ipotezei statistice sunt: sx sx n 0,74 / 5 H0: = 2,01,
H1: > 2,01 (test unilateral dreapta). Cum t,n-1 = t0,05;4 = 2,132, regiunea critic este dat de t>t,n-1. Dar tcalc=1,874< t0,05;4=2,132, nu putem trage concluzia c media profitului previzionat de cei
5 experi pentru anul curent este semnificativ mai mare dect profitul anului trecut, de 2,01 mld. lei . 25

Abaterea standard

sx = s2 x = 0,74 mld. lei.

26

S-ar putea să vă placă și