Documente Academic
Documente Profesional
Documente Cultură
Structura curs 2
1. 2. 3. 4. Concepte i notaii Paii procesului de testare Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z) Testarea ipotezei privind media () a unei populatii normale N(,2), cand dispersia 2 populaiei generale nu este cunoscuta (testul t) Aplicaii
5.
Notaii
INDICATORUL COLECTIVITATEA GENERAL (POPULAIA TOTAL) PARAMETRII
=
N
x
i =1
x
i =1
N
i 2
n
2 i
2 =
( x )
i =1
s2 =
( x x)
n i =1
n 1
= 2 =
( x
i =1
s = s2 =
( x x)
n i i =1
n 1
Concepte(1/4)
Ipotez statistic = o afirmatie cu privire la parametrul repartiiei unei variabile aleatoare. Ipoteza nul (H0) = const ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu exist deosebiri eseniale; = afirmatie in care se specifica valori ipotetice pentru parametrul populatiei totale. Ipoteza alternativ (H1) = o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a se stabili c este adevrat. = o afirmatie despre acelasi parametru al populatiei totale ca si cel la care se refera H0 , dar care contrazice ipoteza nula. Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de semnificaie.
Concepte(2/4)
Exist cinci componente principale ce se precizeaz in testarea unei ipoteze statistice: ipoteza nul; ipoteza alternativ; statistica testului; pragul de semnificatie; regiunea critic (de respingere). Statistica testului este utilizata drept criteriu de acceptare sau de respingere a ipotezei nule
Concepte(3/4)
Regiunea critic (de respingere a lui H0), Rc =valorile numerice ale statisticii testului pentru care ipoteza nul va fi respins. este astfel aleas nct probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrat s fie , cu mic (=0.01 etc). dac valoarea testului cade n regiunea critic Rc, ipoteza H0 se respinge, iar dac punctul cade n afara regiunii critice Rc, ipoteza H0 se accept (sau nu avem motive sa o respingem). regiunea critic este delimitat de valoarea critic, C punctul de tietur n stabilirea acesteia.
Concepte(4/4)
Eroare de genul nti = eroarea pe care o facem respingand o ipotez nul, dei este adevrat. Riscul de genul nti () = probabilitatea comiterii unei erori de genul nti; se numete nivel sau prag de semnificaie. Nivelul de ncredere al unui test statistic este (1-) iar n expresie procentual, (1-)100 reprezint probabilitatea ca rezultatele s fie adevrate.
Decizia de acceptare H0 H1 H0 Decizie corect (probabilitate 1-) Eroare de tip I (risc ) Ipoteza adevrat H1 Eroare de tip II (risc ) Decizie corect (probabilitate 1-)
este
= P(acceptare H0 Eroare de genul al doilea = eroarea fals)=P(eroare de tip II) pe cere o facem acceptnd o ipotez nul, dei este fals. Probabilitatea (riscul) comiterii unei erori de genul al doilea este . Puterea testului statistic este (1-). P-value=cel mai mic nivel de semnificaie la care poate fi respins ipoteza nul.
este
acestuia
dupa
10
Formularea ipotezelor
Daca se doreste testarea ipotezei privind media a unei populatii de caracteristica X, atunci
Ipoteza alternativ poate avea una din trei forme (pe care le vom exemplifica pentru testarea egalitii parametrului media colectivitii generale, cu valoarea 0)
test bilateral:
11
Regiunea critic
a) c)
b)
12
Testarea ipotezei privind media populaiei generale () 2 pentru eantioane de volum mare n>30este cunoscut (testul z)-(1/4)
In verificarea ipotezelor statistice referitoare la media unei populatii, putem relaxa conditia ca variabila de interes X s urmeze o repartiie normal prin utilizarea eantioanelor de volum mare ce face posibil aplicarea teoremei limit central. Aceasta teorem d posibilitatea folosirii repartiiei normale drept lege practic de aproximare. Se consider o populaie statistic de caracteristica X, cu media si dispersia 2, din care se extrage un esantion de volum mare n (n>30), valorile obtinute in urma selectiei sunt x1,x2,,xn. Se stabilete pragul de semnificaie , de regul 0.05. Se calculeaz statistica testului
z calc =
x 0 sx n
Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(2/4)
14
Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(3/4)
15
Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare n>30 (testul z)-(4/4)
16
Aplicaia 1(1/2)
Un fond de investiii a obinut n anul 2005 un profit mediu lunar de 12%. Rezultatele pentru primele 9 luni ale anului 2006 arat un profit mediu lunar de 11.5%. Din cercetri anterioare, se cunoate c riscul mediu al fondului de investiii, msurat prin abaterea standard, este =2%. Se poate afirma, folosind o probabilitate de 95%, ca profitul mediu lunar n anul 2006 este semnificativ diferit ce profitul mediu lunar obinut n anul 2005? Variabila de interes: X profitul lunar presupunem o distribuie normal
X : N ( , 2 ) = 0.02 2 = 0.0004 0 = 0.12 Dispersia populaiei este cunoscut: x = 0.115 Profitul mediu lunar n anul 2005:
Profitul mediu lunar n cele n=9 = 0.05 (5%)luni din 2006: Pragul de semnificaie: H 0 : = 0 Ipotezele:
H 1 : 0
17
Aplicaia 1(2/2)
Tipul testului: deoarece n > 30 , i H 1 : 0 utilizm test Z bilateral; se ncepe construirea graficului. n funcie de nivelul de ncredere al testului statistic: (1 ) = 95% = 0.05 i se stabilete : Z tabelar (teoretic) z/ 2 , iar valorile se trec pe grafic Regiunea de respingere (critic): dac Rc : z < z / 2 sau z > z / 2 at ipoteza nula se respinge. Valoarea testului: Valoarea critic: Verificarea:
z=
z / 2 = 1.96
Decizia: accept H 0 cu probabilitatea de 95% putem afirma c profitul mediu lunar obinut n cele 9 luni ale anului 2006 nu este semnificativ diferit de valoarea de 12% obinut n anul 2005.
18
Aplicaia 2
2. Un fabricant de materiale de construcii comercializeaz ciment n pungi, care trebuie s conin 12 kg/pung. Pentru a detecta eventuale abateri n ambele sensuri de la aceast cantitate, selecteaz 100 de pungi, pentru care calculeaz kg, sx= 0,5 kg. Pentru = 0,01 (grad de ncredere (1- )100=99%) s se determine dac se accept ipoteza nul, aceea c greutatea pungilor este n medie de 12 kg. x =11,85 H0: = 12 H1: 12 ( < 12 sau > 12); z /2=z0,005=2,575
z=
x 12 x 12 x 12 11,85 12 = = = 3,0 x 0 , 5 10 n s n
/2
sau
z> z
/2
Cum z = - 3,0 < - 2,575 se respinge ipoteza nul H0 i se accept ipoteza alternativ, aceea c greutatea pungilor difer semnificativ de 12 kg.
19
Testarea ipotezei privind media () a unei populatii normale N(,2), cand dispersia 2 populaiei generale nu este cunoscut (testul t) Ipotezele statistice sunt
20
Testarea ipotezei privind media () a unei populatii normale N(,2), cnd dispersia 2 populaiei generale nu este cunoscut (testul t)
21
Aplicatia 1-(1/3)
Un productor de bere afirm c volumul unei cutii este de 0.33 litri. Inspectorii de calitate vor s verifice acest lucru i selecteaz aeator un eantion de 16 cutii care snt gata de comercializare. n urma prelucrrii datelor, s-au obinut urmtoarele rezultate:
n xi = 5.25 i =1 n ( x x ) 2 = 23.04 i i =1
Aplicatia 1-(2/3)
Variabila de interes: X volumul unei cutii de bere presupunem o distribuie normal X : N ( , 2 ) Dispersia populaiei este necunoscut - va trebui estimat: Volumul mediu ipotetic: 0 = 0.33 Volumul mediu din eantion: x =
s2 =
( x x)
i=1 i
n1
23.04 = 1.536 15
x
i =1
= 0.328
H 0 : = 0 H 1 : 0
Aplicatia 1-(3/3)
x 0 0.382 0.33 = = 0.00038 s/ n 1.24 / 16
Valoarea testului:
t=
Verificarea:
Decizia : cu probabilitatea 95% nu snt suficiente motive pentru a respinge ipoteza nul.
Aplicaia 2
1.
Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n anul curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preurile anului anterior). tiind c profitul companiei n anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi pentru a concluziona c media previziunilor experilor este semnificativ mai mare dect cifra anului anterior (pentru = 0,05)? Presupunem ca profitul este o variabila cu repartitie normala. Media previziunilor experilor este Dispersia
x = 2,63
mld. lei,
( x x) s =
2 x i
n1
2,203 = 0,5507 4
x x 2,63 2,01 t = = = = 1,874 Elementele procesului de testare a ipotezei statistice sunt: sx sx n 0,74 / 5 H0: = 2,01,
H1: > 2,01 (test unilateral dreapta). Cum t,n-1 = t0,05;4 = 2,132, regiunea critic este dat de t>t,n-1. Dar tcalc=1,874< t0,05;4=2,132, nu putem trage concluzia c media profitului previzionat de cei
5 experi pentru anul curent este semnificativ mai mare dect profitul anului trecut, de 2,01 mld. lei . 25
Abaterea standard
26