Sunteți pe pagina 1din 65

Statistica inferentiala

Cursul nr. 4
Distributia empirica
Distributia empirica
distributia datelor masurate
experimental
Abaterea standard este o
msur a variabilitii sau
rspndirii fata de centru a
datelor fata de medie.
Regula empirica: datele
se aproximeaza cu
distributia normala daca:
68% din date sunt intre 1 si 1 s.
95% din date sunt intre 1 si 1 2s.
99,7% din date sunt intre 1 si 1 3s.
Un student se intereseaza de distribuia punctajelor la examen dup ce a
obtinut 87 din 100. A aflat ca distribuia punctajelor se aproximeaza
cu forma de clopot, cu media 75 i abaterea standard de 10. Se
constata ca studentul a luat un punctaj mai mare decat media, dar nu
se stie cat de bun este punctajul.

Se aplica regula empiric:

68% din studenti au punctajul intre 65 si 85.
95% din studenti au punctajul intre 55 si 95.
99.7% din studenti au punctajul intre 45 si 105.

Studentul cu punctajul 87 apartine unui grup de 16% de studenti din
clasa, care au avut cel mai bun punctaj.

Se aminteste: (100-68)/2 = 16%
Distributia empirica
Teorema limit central
Se consider un eantion aleatoriu format din n variabilele
aleatoare: X
1
, X
2
, ..., X
n
;
X
i
au aceeai distribuie de probabiliti i sunt reciproc
independente.
Media eantionului este o variabil aleatoare.
Ce funcie de distribuie a probabilitilor i corespunde mediei
eantionului?

Pentru a rspunde la aceast ntrebare, se efectueaz urmtorul
experiment:

Se arunc de n ori zarurile i se determin media aruncarilor; se
creaz FDP pentru diferite valori ale lui n.
x
Teorema limit central
n = 30
n = 1
n = 2
n = 10
Teorema limit central
Concluzii experiment:
Cu cresterea lui m:
Media rmne aceeai.
Abaterea standard se reduce.
FDP a x se apropie de distribuia normal.
Teorema limit central
Dac X
1
, X
2
, ..., X
n
aparin unui eantion aleatoriu prelevat dintr-
o populaie cu media i abaterea standard o i n este
sufucuent de mare atunci:
=
x
n
x
o
o =
3. Distribuia mediei x este aproximativ normal
1. 2.
Teorema limit central
Dac se combin cele trei observaii ntr-o singur formul se
obine: reprezint distribuia normal standard.
n
x
Z
/ o

=
Z reprezint distribuia normal standard.

Acest rezultat permite s se utilizeze media eantionului ca
estimator al mediei populaiei .

Estimatori punctuali
populatie
esantion
Studiu inferential
1. Din populatie se preleveaza un esantion
2. Se analizeaza esantionul
3. Se face o predictie pentru populatie pe baza esantionului.
4. Se masoara justetea predictiei.
Estimatori punctuali
x
p

eantion populaie
statistic parametru
media
abaterea standard s o
proportia p
Estimarea punctual - cea mai bun estimare a unui parametru
al populaiei, dar cel mai probabil nu este egal cu parametrul.

Intervalul de estimare
Intervalul de estimare - interval de valori care include valoarea
parametrului populaiei.

Dac intervalul de estimare este simetric, distanta de la
estimatorul punctual la marginea intervalul de estimare se
numeste marj de eroare.
Intervalul de estimare
Maria vrea s-i vnd casa i are nevoie de valoarea de pia a
casei.
Populaia - casele similare din cartier.

Agentul imobiliar alege ca eantion, casele similare din cartier
care s-au vndut n ultimele ase luni si apoi le ajusteaz
preurile de vnzare pentru a ine seama de diferenele dintre
casa Mariei i casele vndute
420.000 440.000 470.000
430.000 450.000 470.000
430.000 460.000 480.000
Esantion preturi ajustate de case
Agent imobiliar calculeaz media
eantionului i o recomand ca
valoarea de pia a casei de 450.000
dolari.
Agentul imobiliar a fcut o inferen
a valorii medii a populaiei.
Intervalul de estimare
Media populaiei este, probabil, intre 425.000$ i 475.000$,
Marja de eroare este de 25.000$ fa de estimarea iniial de
450.000$. Estimarea este: 450.000$ 25.000$
Marja de eroare
25.000$
Estimator punctual
450.000$
Intervalul de estimare
425.000$ - 475.000$
Intervale de ncredere
Interval de ncredere - intervalul a carui probabilitate de a
conine valoarea adevrat a parametrului populaiei este
cunoscut

Intervalul de ncredere pentru media populaiei dac :
abaterea standard a populaiei o este cunoscut,
n este suficient de mare pentru a utiliza funcia Z la calculul
valorilor critice ale intervalului de incredere.
n
Z x
o
o

o nivel de
ncredere
Z
o
valoare
critic

90% 1,645
95% 1,960
99% 2,578
Aria = nivelul
de incredere
Intervale de ncredere
Exemplu: Decanul vrea s estimeze numrul mediu de ore pe
sptmna lucrate de studeni. Un eantion de 49 de
studeni lucreaza in medie 24 ore, cu o abatere standard de
4 ore. Estimatorul punctual: media eantionului = 24 h.

Care este intervalul de ncredere pentru un nivel de ncredere
de 95% pentru numrul mediu de ore lucrate de studeni
sptmnal?
Intervale de ncredere
( ) 12 , 25 , 88 , 22 12 , 1 24
49
4 960 , 1
24 = =

h/spt
Marja de eroare este de 1.12 h/spt.
Se afirm cu un nivel de ncredere de 95% c numrul mediu de
ore lucrate de studeni este ntre 22.88 i 25.12 h/spt.
Daca nivelul de ncredere crete, crete i marja de eroare.
De exemplu, dac crete nivelul de ncredere creste la 99%
atunci:
Intervale de ncredere
( ) 47 , 25 , 53 , 22 47 , 1 24
49
4 578 , 2
24 = =

h/spt
Observatii:
1. Intervalul de ncredere este alcatuit din variabile aleatoare
calculate pe un eantion i se prezice un parametru necunoscut
al populaiei, cu valoare fix, cu un anumit nivel de ncredere.

2. Creterea nivelului de ncredere crete marja de eroare.

3. Intervalul de ncredere cu un nivel de ncredere 100%, este
imposibil de realizat fr a face recensmntul ntregii populaii.
Intervale de ncredere
Media populaiei este ca o o sgeat care ntotdeauna atinge
centrul tabelei de Darts

Intervalul de ncredere este spatiul descris de inta n micare
pentru a prinde sgeata in centru.
Interval de ncredere pentru
Interval de ncredere pentru cand secunoaste abaterea
standard a esantionului se calculeaza cu distributia t Student:
n
s
t x
c

cu n -1 grade de libertate
Exemplu
Sally aparinea unei organizaii de sanatatie (OS), care a avut
ratingul de 62. Sally a trecut la o nou OS. Pentru a evalua
ratingul mediu al noii OS, 20 de membri au fost chestionai i a
rezultat un rating mediu de 65, cu o abatere standard de 10.
Care este intervalul de ncredere cu un nivel de ncredere de
95% pentru media noii OS.
( ) 69,68 , 32 , 60 68 , 4 65
20
10 093 , 2
65 =

Distribuia t are n-1 = 20 -1 = 19 grade de libertate.


Valoarea critic pentru intervalul de ncredere de 95%, este
t
c
= 2.093
Interval de ncredere pentru
Cu un grad de ncredere de 95%, se afirm c rating-ul noii OIS
este ntre 60.32 i 69.68.
Valoarea de 62 aparine intervalului de ncredere si nu se poate
spune cu certitudine de 95% c noua OS este mai bun sau
mai rea dect OS precedent.
Interval de ncredere pentru p
In distribuia binomiala, p este proporia de succese a
populaiei.
n practic, se utilizeaza statisticile eantionului pentru a estima
proporia populaiei p.
Proporia eantionului de dimensiune n este estimatorul
punctual pentru p.
Din teorema limitei centrale, dac np > 5 i n(1-p) > 5, distribuia
proporiei eantionului are o distribuie aproximativ normal.
( )
n
p p
p
p

= =
1

p

o
Interval de ncredere pentru proporia populaiei, p.
( ) ( )
n
p p
Z p
n
p p
Z p


~

1 1
Exemplu
200 de oferi din California au fost inclui ntr-un eantion aleatoriu i s-
a descoperit c 25 dintre ei au vorbit la telefonul mobil, fr hands-
free. S se calculeze estimatorul punctual al proporiei de
conductori auto care utilizeaz telefoanele mobile ilegal i s se
construiasc interval de ncredere pentru 99%.

Estimatorul punctual pentru p este = 25/200 = 0,125 sau 12,5%

Pentru un nivel de ncredere de 99% p este:
Interval de ncredere pentru p
( )
060 , 0 125 , 0
200
125 , 0 1 125 , 0
576 , 2 125 , 0 =

Marja de eroare pentru sondaj este de 6%, i se afirma cu o ncredere


de 99% c procentul de oferi care folosesc ilegal telefoanele mobile este
ntre 6,5% i 18,5%
Estimatorul punctual pentru o
Pentru a estima variaia sau volatilitatea unui set de date,
se utilizeaz abaterea standard, s ca estimator
punctual al abaterii standard a populaiei o.

Exemplu
Investiiile A i B au rata rentabilitii de 6% pe an. In
ultimele 24 de luni, investiia A a avut abaterea standard
a eantionului de 3% pe lun, n timp ce pentru investitia
B, abaterea standard a eantionului a fost de 5% pe
lun. Se poate afirma c investiia B este mai volatil i
mai riscant dect investiia A din cauza valorii mai mari
a abaterii standard estimate.
Pentru a crea un interval de ncredere pentru estimarea
abaterii standard, se utilizeaza distribuia _
2
.
Intervalul de ncredere o
2
Intervalul de ncredere nu este simetric deoarece distribuia _
2

este asimetric.
( ) ( )
|
|
.
|

\
|

2
2
2
2
1
,
1
L R
s n s n
_ _
Aria =
nivelul de
incredere
Aria = nivelul
de incredere
Intervalul de incredere:
Exemplu
n msurarea performanei investiilor, abaterea standard este o
msur a volatilitii sau a riscului. Douzeci de randamente
lunare ale unui fond mutual indic un randament mediu lunar
de 1% i o abatere standard a eantionului de 5%. S se
calculeze intervalul de ncredere corespunztor nivelului de
ncredere de 95% pentru abaterea standard lunar a fondului
mutual.
Valori critice pentru
Distribuia _
2
are 20 -1 = 19 grade de libertate
9,90655
2
=
L
_ 32,8523
2
=
R
_
Intervalul de ncredere pentru o
2
Se poate spune cu ncrederea de 95% c abaterea
standard lunar pentru fondul mutual este ntre 3,8% i
7,3%
( ) 7,3 , 8 , 3
90655 , 8
5 19
,
8523 , 32
5 19
2 2
=
|
|
.
|

\
|

Intervalul de ncredere pentru o

Formula intervalului de ncredere pentru o este:
Testarea ipotezelor unei populaii
Statistica inferenial se utilizeaz:

pentru a estima un parametru al populaiei i a msura
fiabilitatea estimrii pe un interval de ncredere.

la testarea unei ipoteze cu privire la un parametru al
populaiei, aplicaie care constituie elementul central al
metodei tiinifice de cercetare.
Formularea problemelor
generale ale cercetarii
Formularea ipotezelor
si proiectarea
experimentului
Formularea
concluziilor in limbaj
nestatistic
Colectarea si analiza
datelor experimentale
Testarea ipotezelor unei populaii
Formularea ntrebrilor generale de
cercetare
Cele mai multe ntrebri pornesc de la o surs de inspiraie sau
o idee despre subiectul sau fenomenul de interes.

Cteva exemple de ntrebri generale:

Sntate: Poate un sistem public de ngrijire al sanatate s
fie mai eficient dect sistemul privat de asigurri?
Munc: Care este efectul imigraiei ilegale i externalizarea
locurilor de munc asupra ratei omajului.?
Economie: Este pachetul de stimulare economic al
guvernului eficient n diminuarea recesiunii?
Educaie: Este prea scump invatamantul universitar pentru
studenii?
Ipotezele sunt declaratii despre parametri populaiei. Cteva
exemple:

Cel puin 20% din infractorii minori sunt prini i condamnai
p > 0,2
Venitul mediu lunar al absolvenilor de facultate este de cel
putin 500 euro > 500
Punctajul mediu al grupei 1 este acelasi cu al grupei 2

1
=
2
Procentul bolnavilor de cancer pulmonar din Franta este mai
mic dect decat cel din Albania p
1
< p
2
Abaterea standard a bursei de valori din New York este cu de
10 % mai mare in acet an o > 10

Testarea ipotezelor unei populaii
Testarea ipotezelor este o procedur, bazat pe evidene ale
eantionului i pe teoria probabilitii, pentru a determina dac
ipoteza :
este o declaraie rezonabil i nu trebuie respins,
este nerezonabil i trebuie respins.

Ipoteza testat se numete ipoteza nul, H
0
. Dac ipoteza nul este
nerezonabila se testeaza ipoteza alternativa, H
a


Ipoteza nul, H
0
: declaraie cu privire la valoarea unui parametru
al populaiei, care se presupune adevrat pentru scopul testrii.
Ipoteza alternativ, H
a
: declaraie cu privire la valoarea unui
parametru al populaiei care se presupune adevrat, dac
ipoteza nul este respins prin testare.
Testarea ipotezelor unei populaii
Observatii:

1. Ipoteza alternativ contrazice n mod necesar ipoteza
nul; ambele ipoteze nu pot fi adevrate n acelai timp.

2. Ipotezele trebuie s fie declaraii despre parametri
populaiei, i despre statisticile eantionului.

3. Ipoteza nul testeaza egalitatea (=, , ), iar ipoteza
alternativ inegalitate (<. >, ).

4. Prin testare se ncearc ca ipoteza nul s se
respinge i s se susin ipoteza alternativ.
Testarea ipotezelor unei populaii
Exemple de ipoteze nule si alternative:

H
0
: p s 0,20 H
a
: p > 0,20
H
0
: s 5000 H
a
: > 5000
H
0
:
1
=
2
H
a
:
1

2
H
0
: p
1
> p
2
H
a
: p
1
< p
2
H
0
: o s 10 H
a
: o > 10
Testarea ipotezelor unei populaii
Pentru a testa o ipoteza este necesar un model statistic care descrie
comportamentul datelor i parametrul populaiei care este testat.
Modele statistice sunt din familia normal, cele mai importante
distribuii sunt:
2
Z, T si F.

Fiecare model se formuleaz pe baza unor ipoteze a cror oportunitate
se verifica.

De exemplu: multe modele consider c media eantionului are o
distribuie aproximativ normal, ipotez care nu se aplica dac
seturile de date sunt mici sau distribuite asimetric.

Se alege un test statistic care este utilizat pentru a decide dac ipoteza
nul se respinge sau nu se respinge.
Testarea ipotezelor unei populaii
Formularea ipotezelor
Ipoteza nul Ipoteza alternativ
Determinarea modelului adecvat
Test statistic Testarea intervalului cu una
sau doua limite
Stabilirea criterilor de decizii
Nivelul de semnificaie o | i puterea testului
Testarea ipotezelor unei populaii
Erori n luarea deciziilor
Luarea unei decizii implica o probabilitate de a face o alegere greit.

Testarea ipotezelor cere:
s se resping ipoteza nul i s se susin ipoteza alternativ
s nu se resping ipoteza nul.

Se pot face dou tipuri de erori:
Eroare de tip I se respinge ipoteza nula cnd aceasta este
adevrat.
Eroare de tip II nu se respinge ipoteza nula cnd acesta este
fals.

La testarea ipotezelor, se ia n considerare probabilitatea de a face una
din aceste erori
H
0
este acceptat H
0
este respins
H
0
este adevarat Decizie corecta Eroare de tip I
H
0
este fals Eroare de tip II Decizie corecta
Erori n luarea deciziilor
Exemplu de eroare de tip I
O companie de medicaminte comercializeaz un sirop, care s-a dovedit
a fi ineficient n tratamentul tusei. nainte de comercializare,
compania a cercetat i stabilit c medicamentul este eficient n
tratamentul tusei, ceea ce nseamn s-a respins ipoteza nul c
siropul nu are nici un efect asupra bolii.

O companie care testa utilizarea Interferonului la tratamentul unei boli
pulmonare, a abandonat cercetarea cnd testarea a artat c
Interferonul este ineficient. Compania nu a reuit s resping
ipoteza nul c medicamentul este ineficient. Ce se ntmpl
dac medicamentul ar fi fost cu adevrat eficient? Dac compania
face eroare de tip II? Posibil, dar din moment ce medicamentul nu a
fost comercializat, nu se cunoate adevrul.

Probabilitatea maxim de a face o eroare de tip I se numete nivel
de semnificaie al testului i se noteaz cu .
Probabilitatea de a face o eroare de tip II se noteaz cu .

Valoarea critic i zona de respingere
Daca nivelul de semnificatie al testului este aleas, se
determina din funcia de distribuie de probabilitate a
testului statistic o zon n care ipoteza nul este
respins - zon de respinge

Valoarea critic - limita dintre zona de respingere i de
nerespingere.

Pentru o situaie dat, exist o valoare critic i o zon de
respingere.

Suprafaa total a zonei de respingere este egal cu
nivelului de semnificaie .
Valoare critica
Se respinge H
0
Nu se respinge H
0
Aria zonei de
respingere = o
Aria zonei in care
nu se respinge = 1-o

0
Testarea unilaterala a ipotezei
Un test este unilateral
dac ipoteza alternativ,
H
a
, afirm o situatie, cum
ar fi:
H
0
: Venitul mediu al
femeilor este cu cel al
brbailor.
H
a
: Venitul mediu al
femeilor > dect
brbailor.

Deoarece egalitatea este
specific ipotezei nule,
ipoteza alternativ va
determina care margine
a intervalului se va testa.

0
Aria zonei de
respingere = o/2

Aria zonei de
respingere = o/2

Valoare critica Valoare critica
Se respinge H
0

Se respinge H
0

Nu se respinge H
0
Aria zonei in care
nu se respinge = 1-o
Testarea bilaterala a ipotezei
Un test este bilateral
daca ipotezei alternative
H
a
nu afirma o situatie,
cum ar fi:

H
0
: Venitul mediu al
femeilor este egal cu
cel al brbailor.
H
a
: Venitul mediu al
femeilor nu este egal
cu venitul mediu al
brbailor.

n testul bilateral, o se
mparte n dou pri,
deoarece exist dou
zone de respingere.
Exemple de testare a medie fa de o valoare
presupus
0
:

H
a
: >
0
testul mediei pentru limita superioar
i este denumit testul limitei din drepta.

H
a
: <
0
testul mediei pentru limita inferioar i
este denumit testul limitei din stnga.

Ha:
0
testul mediei pentru ambele limite.
Testarea ipotezelor unei populaii
Colectarea i analiza datelor
experimentale
Colectarea si verificarea datelor
Efectuarea experimentului Verificarea valorilor aberante
Stabilirea testului statistic i /sau valoarea lui p
Comparare cu valorile critice Comparare cu o
Se ia o decizie pentru H
0

Respingerea H
0
si susinerea H
a
Nu se respingeH
0

Tratarea valorilor aberante
O valoare aberant este data care difer foarte mult de
celelalte date din set.

Valorile aberante pot fi determinare de:
greeli la nregistrarea datelor,
date care nu fac parte din populaie,
evenimente rare reale.

Exemplu
Vnzrile trimestriale de case a 10 ageni sunt: 2, 2, 3, 4, 5,
5, 6, 6, 7, 50
Cu valori aberante Fr valori aberante
Media 9,00 4,44
Mediana 5,00 5,00
Abaterea standard 14,51 1,81
La calcularea statisticilor, se observ c media i abaterea standard
sunt afectate de valoarea aberant, n timp ce mediana nu se schimb.
O soluie pentru populaia cu valorile extreme este utilizarea statisticii
infereniale.

Diagrama Box se utilizeaz pentru a determinarea valorilor aberante.
Tratarea valorilor aberante
Logica testarii ipotezelor
La testarea ipotezelor se ia decizia dee respinge sau de nerespingere a
ipotezei nule. Procesul decizional similar cu cel din matematic de "a
dovedi prin contradicie este:

Se presupune c H
0
este adevrat i H
a
este complementar lui H
0
.
Se analizeaz dac datele corespund cu H
0

Dac datele nu corespund, se dovedete c H
0
este fals: se
respinge H
0
i se propune Ha - declaraie puternic.
Dac analiza datelor nu este concludent pentru respingerea H
0
se afirm c datele sunt neconcludente - declaraia slaba.

Observatie:

1. Declaratie slaba - nu s-a demonstrat H
0
, doar a fost infirmata.
2. In statistic a demonstra o ipoteza nseamn c ipoteza este
susinut cu certitudinea de (1-)100%.
Exemplu
Un cercettor dorete s sutina afirmaia c, n medie, studentii trimit mai
mult de 1000 de SMS-uri pe lun.
Ipotezele de cercetare sunt:

H
0
: = 1000 vs H
a
: > 1000.

Decizia prin care H
0
este respins: numrul mediu de SMS trimise de
studeni depete 1000.

Decizia prin care H
0
nu este respins: nu exist dovezi suficiente
pentru a susine afirmaia c numrul mediu de SMS-uri trimise de
studeni depete 1000.

Observatie: Decizia se limiteaz la populaia din care s-a prelevat
eantionul
Comparea valorii p cu o
Test statistic - valoare calculat din date n conformitate cu
modelul statistic al datelor.

Se calculeaza valoarea critic p pentru nivelul de
semnificaie ales, .

Testul statistic se compar cu valoarea critic a testului
ipotezei.

Dac valoarea p < o, H
0
este respins
Dac valoarea p > o, H
0
nu este respins.
Valoare critica
Se respinge H
0 Nu se respinge H
0

Test
statistic
Decizia de respingerea a H
0

H
0
: = 10
H
a
: > 10

Se alege si se calculeaza
valoarea critic p = test
statistic.

Testul statistic se ncadreaz
n zona de respingere: p <

Decizie - se respinge H
0
.

Declaraie puternic: Datele
susin ipoteza alternativ.
Valoare critica
Se respinge H
0
Nu se respinge H
0
Decizie - nu se respinge H
0

H
0
: = 10
H
a
: > 10

Se alege si se calculeaza
valoarea critic p = test
statistic..

Testul statistic nu se
ncadreaz n zona de
respingere: p >

Decizie nu se respinge H
0
.

Declaraie slab: Datele sunt
neconcludente i nu sprijin
ipoteza alternativ.
Test al valorii medii vs valoarea ipotetic
Exemplu: O companie de produse alimentare aplic politica n care
coninutul declarat al unui produs este identic cu al produsului
fabricat.

Intrebare: Greutatea declarat a produsului corespunde cu greutatea
real?

Un statistician n controlul calitii decide s testeze sticla cu sos de soia
de 16 uncii. In acest sens proiecteaz experimentul.

Statisticianul este autorizat sa preleveze 36 de sticle timp de o ora, de la
o singura masina de imbuteliat; din date anterioare o = 0,5 oz.

Se testeaza media populaiei vs valoarea ipotetic de 16 uncii.

Se alege un test cu dou limitri, deoarece compania este preocupat
att supraumplerea ct i de subumplerea sticlelor.

Ipoteze de cercetare:
H
0
: = 16 - masina de umplere funcioneaz corect
H
a
: 16 - masina de umplere nu funcioneaz corect.
Deoarece o este cunoscut testul statistic este:
Test al valorii medii vs valoarea ipotetic
Modelul se aplica daca dimensiunea eantionului asigur distribuia
normal a mediei eantionului.
Eroarea de tip I - se respinge ipoteza nul i se afirma c masina de
imbuteliat nu funcioneaz corect atunci cnd ea funcioneaz corect.
ntruct societatea nu vrea s se opreasc inutil producia i s
recalibreze masina, statisticianul alege s limiteze probabilitatea erorii
de tip I prin stabilirea la 5%.

Statisticianul a prelevat 36 de sticle de sos de soia din care o singur
valoare este neobinuit de 17,56 uncii. Valoarea este acceptat n setul
de date.
n
x
Z
/ o

=
Se calculeaz valoarea medie a eantionului i a testului statistic.

44 , 1
36 0,5/
16 - 16,12
Z 12 , 16 = = = uncii x
Medoda 1: Ipoteza nul se respinge daca Z este n zona de respingere,
-1.96 < Z > 1.96. Decizia este de a nu respinge H
0
, deoarece Z nu se
ncadreaz n zona de respingere.

Metoda 2: metoda valorii p pentru luarea deciziei. Valoarea p pentru un
test bilateral include toate valorile, mai mari decat valorile extreme ale
testului statistic.
Se calculeaz probabilitatea ca -1.44 < Z > 1.44 ; p = 0.1498. Deoarece
valoarea p > , decizia este de a nu respinge H
0
.
Test al valorii medii vs valoarea ipotetic
Valoare critica
Valoare
critica
Se respinge H
0
Se respinge H
0
Nu se respinge H
0

Metoda Z
Test al valorii medii vs valoarea ipotetic
p
Test al valorii medii vs valoarea ipotetic
Metoda p
Concluziile i recomandarile statisticianului pentru
conducerea companiei:

"Nu exist dovezi suficiente pentru a concluziona c
maina care umple sticle de sos soia de 16 uncii
funcioneaz necorespunztor. Aceast concluzie se
bazeaz pe msurtori efectuate pe 36 de sticle pe durata
unei singure ore de producie.

V recomand monitorizarea continu a mainii pe
diferite schimburi, deoarece este posibil o eroare uman
n apariia variaiilor de greutate."
Test al valorii medii vs valoarea ipotetic
Eroare de tip II i puterea statistic
n exemplul anterior, statisticianul nu a reuit s resping ipoteza nul,
deoarece probabilitatea de a face erori de tip I (de respingere a unei
ipoteza nul adevrat) a depit nivelul de semnificaie de 5%.

Statisticianul ar fi putut face o eroare de tip II, daca maina funciona
necorespunztor.

Una din sarcinil este de a analiza probabilitatea de a face eroarea de
tip II - .

| - probabilitatea ca s nu fie respins ipoteza nul dac este fals

Statisticieni utilizeaz puterea statistic, care este complementul lui .
Ipotez
Iporeza nul Ipoteza alternativ
Determinarea modelului corespunztor
Test statistic Limitare uni sau bilaterala
Criterii pentru luarea decizilor
Nivelul de semnificaie o | i analiza puterii
Eroare de tip II i puterea statistic
Nu se respinge H
0
Se respinge H
0

H
0
este adevrat 1-o o
Eroare de tip I
H
0
este fals |
Eroare de tip II
1-|
putere
Eroare de tip II i puterea statistic
Dac testul ipotezei are putere mic, este dificil s se resping H
0
, chiar
dac H
0
este fals; cercetarea ar fi o pierdere de timp si bani.

n exemplul anterior, ipoteza alternativ a fost c 16 uncii, adic
maina umple sticlele
a
= 16.0001 uncii, iar H
a
este practic adevrat.

Dac se analizeaz putere i eroarea de tip II se alege o valoare pentru
media populaiei pentru ipoteza alternativ (
a
), care este "practic diferit"
de media ipotezei nule (
0
).

Aceast diferen practic se numete dimensiunea efectului.
Diferenadintre mediile ipotezelor se numete
dimensiunea efectului


0
: valoarea mediei a populaiei pentru ipoteza nul

a
: valoarea mediei a populaiei pentru ipoteza
alternativ
Dimensiunea efectului: "diferen practic" ntre
0
i
a

= |
0
-
a
|.

Eroare de tip II i puterea statistic
S presupunem c se efectueaz un test unilateral al mediei
populaiei:

H
0
: =
0
Ha: >
0

Se iau n considerare cele dou grafice:

Graficul de sus este distribuia mediei eantionului pentru
ipoteza nul. Zona din dreapta a valorii critice este zona
de respingere.

Graficul de jos este distribuia mediei eantionului pentru
ipoteza alternativ pentru valoarea specific a
a
. Pe
acest grafic se poate masura | si puterea testului

Eroare de tip II i puterea statistic
Valoare critica
Se respinge H
0
Nu se respinge H
0
o este asociata cu
probabilitatea erorii de tip I,
se respinge H
0
cand este

adevarata
| este asociata cu
probabilitatea erorii
de tip II, nu se
respinge H
0
cand este
falsa

Puterea este
asociata cu
probabilitatea de a
respinge ipoteza H
0
falsa
Metode de cretere a puterii statistice
Modaliti de cretere a puterii Realizare
Creterea dimensiunii eantionului Crete costul i se reduce
variabilitatea datelor
Creterea nivelului de
semnificaie, o
Crete probabilitatea de respingere
a ipotezei H
0
adevrate eroare de
tip I
Alegerea valorii
a
diferit de
0
Rezultatele pot fi mai puin
semnificative
Redefinirea populaiei pentru a
micora abaterea standard
Rezultatele pot fi prea limitate
Se recomand efectuarea unui
test unilateral i nu bilateral
Pot produce rezultate prtinitoare
Exemplu puterea testului
Plcuele de frn ale autobuzelor sunt proiectate s dureze n
medie, cel puin 60.000 de km i o companie vrea s testeze
aceast afirmaie.
Compania de autobuze vrea s determine valoare "practic" cu
scopul de mririi sigurana autobuzul, deoarece ultimele
tamponri s-au produs la cel puin 58,000 km. Dac abaterea
standard este de 5.000, iar dimensiunea eantionului de 50,
care este puterea testului dac media practica este de 58,000
km. (se presupune = 0.05)

Se determina valoarea critic a testului.
H
0
se respinge dac Z < -1.645
Se calculeaza valoarea care corespunde valorii critice:
588837 50 / 5000 645 , 1 60000
0
= = + =
n
Z
x
o

x
H
0
se respinge dac < 58837
Se calculeaza probabilitatea de respingere a H
0
, dac H
a
este
adevrat:
x
( ) ( ) 881 , 0 18 , 1
50 / 5000
58000 58837
/
58837
58837
0
= < = |
.
|

\
|
< = |
.
|

\
|
< = < Z P Z P
n
Z P x P
o

Puterea acestui test este de 88% i este de 12%.
Valori iniiale

0
= 60.000 km

a
= 58.000 km
o = 0,05
n = 50
o = 5000 km
Valori calculate
Efectul mrimii = 2.000 km
Valoarea critic = 58.837 km
| = 0,1190 sau ~ 12%
Puterea = 0.8810 sau ~ 88%
Exemplu: puterea testului
Puterea = 88%
Valoare critica
Se respinge H
0
Nu se respinge H0