Documente Academic
Documente Profesional
Documente Cultură
Unitatea de nvare 3:
FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR
STATISTICE II
Cuprins:
Eroarea de genul al doilea este eroarea pe cere o facem acceptnd o ipotez nul, dei este
fals.
Test bilateral
H0: = 0,
H1: 0 ( < 0 sau > 0)
H0: = 0,
H1: > 0,
H0: = 0,
H1: < 0,
/2
a)
b)
Testul de concordan 2 :
2 =
i =1
Regiunea critic:
c)
( ni n ' i ) 2
n' i
2 > (2s 1) k ;
Utilizarea eantioanelor de volum mare (n > 30) face posibil aplicarea teoremei limit
central. Dup cum am vzut, putem ntlni teste unilaterale sau bilaterale.
Test bilateral
n cazul testului bilateral, ipotezele sunt:
H0: = 0 ( - 0=0),
H1: 0 ( - 00) (adic < 0 sau > 0).
z=
x 0
x 0
x 0
sx
Dac pragul de semnificaie () este stabilit, putem determina valoarea z/2, pentru care P(z>z
/2)=
z > z /2.
Regula de decizie:
Regiune de
acceptare
z<c1
z>c 2
c 1<z<c2
c1
c2
Regiune de
respingere
c1 = z/2;
c2 = z /2.
Regula de decizie este, deci:
Respingem H0, dac
x 0
< z / 2 sau
x 0
> z / 2 .
Exemplu
Patronul unei firme de prestri servicii dorete s fluidizeze servirea clienilor i, pn n
prezent, el presupunea c timpul de servire a clienilor este normal distribuit, de medie 130 de
minute i abatere medie ptratic 15 minute. El este de acord cu abaterea medie ptratic, dar
se ndoiete de faptul c durata medie de servire a unui client este 130 minute. Pentru a studia
aceast problem, nregistreaz timpii de servire pentru 100 de clieni. Timpul mediu obinut
n eantion este 120 minute. Poate patronul s concluzioneze, la o probabilitate de 99%, c
timpul mediu este diferit de 130 minute.
n aceast problem, parametrul ce ne intereseaz este timpul mediu n colectivitatea
general i ipotezele de testat sunt:
H 0 : = 130,
H 1 : 130.
Trebuie, aadar, s rspundem la ntrebarea: Este media de 120 minute suficient de
diferit de valoarea 130, pentru a ne permite s concluzionm c media populaiei nu este
egal cu 130 minute?
Vom putea s respingem ipoteza nul dac media eantionului este suficient de diferit,
relativ la valoarea 130. Dar, interpretrile nu sunt evidente. Dac n eantion obineam media
1300 sau 1,3 atunci diferenele erau clare. De asemenea, dac media eantionului era 130,1
atunci egalitatea era i ea evident.
Distribuia de eantionare a mediei x este normal sau aproximativ normal, cu media
i abaterea medie ptratic
z=
x 130
x 130
=
.
1,5
15 / 100
120 130
= 6,67 .
1,5
i calcula
Cum z = 6,67 < 2,575 = z 0.005 , rezult c sunt suficiente dovezi pentru a respinge
ipoteza nul H0 i a accepta ipoteza alternativ, aceea c timpul mediu de servire a unui client
este diferit de 130 minute.
Test unilateral
Pentru testul unilateral dreapta, ipotezele sunt:
H0: = 0 ( - 0=0),
H1: > 0 ( - 0>0).
Testul statistic calculat este:
x 0
z=
x 0
x 0
s
z<c
Regiune de
acceptare
z>c
Regiune de
respingere
c = z.
respingem ipoteza H0, dac
x 0
> z .
z=
x 0
x 0
x 0
s
Regiune de
respingere
z>c
Regiune de
acceptare
c = z.
Regula de decizie este: respingem ipoteza H0, dac
x 0
< z .
Test de autoevaluare 1
1. Presupunem c pentru 100 de observaii asupra unei variabile aleatoare X s-a obinut media
3. ntr-o cercetare prin sondaj aleator privitoare la transportul n comun, au fost selectate 100
de persoane pentru care s-a calculat valoarea medie a biletelor cumprate ntr-o lun pentru
transport n comun urban de 110 u.m, cu o abatere medie ptratic de 60 u.m.
a) Testai ipoteza nul, aceea conform creia valoarea medie a biletelor cumprate ntr-o lun,
n colectivitatea general, este = 0 = 100 u.m, cu ipoteza alternativ > 0 = 100 u.m,
utiliznd un nivel de ncredere 1 - = 0,95 (probabilitatea (1-)100 = 95%).
b) Testai ipoteza nul = 0 = 100 u.m, cu ipoteza alternativ 0 = 100 u.m, cu aceeai
probabilitate. Interpretai rezultatele.
n afaceri, multe decizii trebuie luate pe baza unor informaii foarte limitate, adic pe
baza datelor provenite din eantioane mici (de volum redus, n30). n aceste situaii, efectul
imediat este acela c forma distribuiei de eantionare a mediei x depinde, acum, de forma
populaiei generale din care a fost extras eantionul. Distribuia de eantionare a lui x va fi
normal (sau aproximativ normal), n cazul eantioanelor de volum redus, doar dac
colectivitatea general este distribuit normal (sau aproximativ normal).
Pe de alt parte, dac nu se cunoate dispersia din colectivitatea general ( 2x ), atunci
dispersia eantionului ( s x2 ), poate s nu ofere o aproximare foarte bun a lui 2x (n cazul
eantioanelor mici). Ca atare, n locul statisticii z care necesit cunoaterea (sau o bun
aproximare) a lui x , vom folosi statistica:
t=
x 0 x 0
=
,
sx
sx n
unde:
s
2
x
(x
=
n 1
t=
x 0 x 0
=
.
sx
sx n
Presupunerea special ce trebuie fcut este aceea c populaia general este normal sau
aproximativ normal distribuit.
Exemplu
Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n
anul curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preurile anului
anterior).
tiind c profitul companiei n anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi
pentru a concluziona c media previziunilor experilor este semnificativ mai mare dect cifra
anului anterior (pentru = 0,05)?
Media previziunilor experilor este x = 2,63 mld. lei, cu dispersia:
s
2
x
(x
=
n 1
2,203
= 0,5507 i abaterea medie ptratic: s x = s x2 = 0,74 mld. lei.
4
x
x
2,63 2,01
=
=
= 1,874 .
sx
sx n
0,74 / 5
n scopul folosirii statisticii t, vom face presupunerea c populaia general din care s-a
extras eantionul este normal distribuit. Cum t,n-1 = t0,05;4 = 2,132, regiunea critic este dat de
t>t,n-1. Cum t=1,874< t0,05;4=2,132, nu putem trage concluzia c media profitului previzionat de
cei 5 experi pentru anul curent este semnificativ mai mare dect profitul anului trecut, de 2,01
mld. lei.
Test de autoevaluare 2
1. n testarea ipotezei statistice privind media populaiei, cnd datele provin de la un eantion
de volum redus (n) i:
H0 : = 0 ,
H1 : 0 ,
datele provin dintr-un eantion de volum redus i se efectueaz test unilateral stnga;
b.
datele provin dintr-un eantion de volum redus i se efectueaz test unilateral dreapta;
c.
datele provin dintr-un eantion de volum redus i s-a efectuat test bilateral;
e.
datele provin dintr-un eantion de volum normal i s-a efectuat test bilateral.
b) S se testeze ipoteza nul = 1,00 milioane, cu ipoteza alternativ > 1,00 milioane
caractere, utiliznd o probabilitate de 95%, n ipoteza distribuiei normale a numrului de
caractere n colectivitatea general.
f (1 f ) .
( np5 i n(1 p) 5 ):
f = p i s f =
p(1 p)
f (1 f )
.
n
z=
f p
f (1 f ) / n
Precizare:
Dac volumul eantionului este mic, distribuia de eantionare a proporiei nu este o
distribuie t i orice inferen asupra lui p trebuie s se bazeze pe distribuia lui f, care este o
distribuie binomial. Pentru testarea ipotezelor statistice privind proporia este necesar s
10
H 0 : p = p0
f p0
p (1 p / n)
f p0
f (1 f ) / n
Regula de decizie este: se respinge ipoteza nul i se accept ipoteza alternativ, dac z
se situeaz n regiunea critic (Rc) stabilit n funcie de probabilitatea dorit de garantare a
rezultatelor 100(1 )% .
Exemplu
Managerul unui lan de magazine consider n urma unei analize financiare c, pentru un
nou produs, comercializarea este profitabil, dac procentul cumprtorilor care ar dori s
achiziioneze produsul este mai mare de 12%. El selecteaz 400 de cumprtori poteniali i
afl c 56 dintre acetia vor achiziiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care s conving managerul s comercializeze produsul?
11
Ipotezele sunt:
H 0 : p = 0,12
H 1 : p > 0,12
f 0,12
0,14 0,12
0,02
=
=
= 1,15 .
f (1 f ) / n
0,14 0,86 / 400 0,017
Cum z = z 0.01 = 2,33 i z < z , rezult c nu ne aflm n regiunea critic (Rc), nu avem
suficiente dovezi s respingem ipoteza nul, deci procentul nu este mai mare de 12%.
Test de autoevaluare 3
1. Un productor de baterii dorete s verifice dac procentul bateriilor defecte este mai mic
de 5%. Presupunem c sunt selectate aleator 300 de baterii, fiecare dintre acestea este testat
i c sunt gsite 10 baterii defecte. Ofer aceste informaii suficiente dovezi c procentul
bateriilor defecte este mai mic de 5%? Utilizai o probabilitate de 99% de garantare a rezultatelor.
2. Un eantion aleator de 50 de persoane a fost testat cu privire la un nou produs de snackfood. Rspunsurile au fost codificate (0: nu-mi place; 1: mi place) i listate: 1, 0, 0, 1, 1, 0, 1,
0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1,
1, 0, 0, 0, 1.
a) Utilizai o probabilitate de 90% pentru a estima intervalul n care se va ncadra
proporia celor crora le place produsul, n colectivitatea general.
b) Testai ipoteza nul H0: p = 0,5 cu ipoteza alternativ H1: p > 0,05, unde p este
proporia celor crora le place produsul, utiliznd o probabilitate de 95%.
6. Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum
mare
Multe cazuri de analiz statistic implic o comparaie ntre mediile a dou colectiviti
generale. Spre exemplu, un patron al unui restaurant dorete s vad dac exist diferene
12
x21
(x x ) =
1
n1
x22
n2
(x
1 x 2 z / 2
x21 x22
+
.
n1
n2
(x
1 x 2
1
1
) = n + n
1
2
13
H1: (1- 2) D
- pentru test unilateral dreapta
H0: (1- 2) = D
H1: (1- 2) > D
- pentru test unilateral stnga
H0: (1- 2) = D
H1: (1- 2) < D
unde D reprezint diferena ipotetic dintre mediile populaiilor, deseori egal cu 0.
(x
x2 D
(x
1 x2
Exemplu
Managerul unui restaurant dorete s determine dac o campanie de publicitate a dus la creterea
veniturilor medii zilnice. Au fost nregistrate veniturile pentru 50 de zile nainte de desfurarea
campaniei. Dup desfurarea campaniei i trecerea unei perioade de 20 de zile pentru ca aceast
campanie s i fac efectul, se nregistreaz veniturile pentru 30 de zile. Aceste dou eantioane
vor permite testarea ipotezei privind efectul campaniei asupra veniturilor. Din prelucrarea datelor
pentru cele dou eantioane, rezult:
nainte de campanie
Dup campanie
n1=50
x 1 = 12,55 mil.
n2=30
x 2 = 13,30 mil.
lei
lei
14
Dorim s vedem dac veniturile au crescut (2> 1), aadar, vom efectua un test unilateral
stnga:
H0: 1 = 2
(1 - 2 = 0),
H1: 1 < 2
(1 - 2 < 0).
(x1 x2 ) 0 =
(x x )
1
2
x1 x 2
2x1 2x2
+
n1 n 2
x1 x 2
s2x1 s2x2
+
n1 n 2
0,75
= 1,41
0,5305
Cum valoarea calculat nu este mai mic dect z0,05 = 1,645, rezult c nu ne aflm n
regiunea critic. Eantioanele nu ofer, aadar, suficiente dovezi (la = 0,05) pentru ca
managerul restaurantului s concluzioneze c veniturile au crescut n urma campaniei de
publicitate.
Test de autoevaluare 4
1. O companie dorete s introduc o nou metod de realizare a unui produs. Se selecteaz
50 de produse pentru care se nregistreaz timpii de realizare cu vechea metod i 50 de
produse pentru noua metod. Rezultatele sunt:
Metoda actual:
Noua metod:
n1 = 50
n2 = 50
x1 = 27,3 minute
x 2 = 25,4 minute
s1 = 3,7 minute
s 2 = 3,1 minute
7. Exersai n EXCEL
15
Identificarea metodei:
Datele sunt calitative i alternative iar obiectivul experimentului este de a compara dou
proporii: proporia fumtorilor cu boli cardiovasculare i proporia nefumtorilor cu boli
cardiovasculare. Deci ipoteza care trebuie testat este H0: p1= p2 cu alternativa H1: p1 > p2.
Pentru aceasta se va aplica un test z deoarece dispersiile sunt cunoscute.
Instruciuni n EXCEL:
1. Introducei datele pe dou coloane. n A1 tastai Fumtori iar n B1 Nefumtori.
2. Apsai Tools/Data Analysis i apoi z-Test: Two-Sample for Means
3. Specificai variabila 1: A1:A21
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels.
6. Introducei varianele (Variable 1 Variance (known): 0,2 i Variable 2 Variance
(known): 0,15). Apsai OK.
Se obin rezultatele:
z-Test: Two Sample for Means
Mean
Known Variance
Observations
Hypothesized Mean Difference
z
P(Z<=z) one-tail
16
Fumtori
0.25
0.2
20
0
0.377964
0.352729
Nefumtori
0.2
0.15
20
z Critical one-tail
P(Z<=z) two-tail
z Critical two-tail
1.644853
0.705457
1.959961
Sunt calculate cele dou proporii: 25% dintre fumtori i 20% dintre nefumtori au o
afeciune cardiovascular. Valoarea statisticii z este 0,378 cu o valoare p de 0,35 (one-tail
test unilateral). Deoarece valoarea p nu este apropiat de zero (p>0,05), ipoteza nul se
accept. Pentru un nivel de semnificaie de 5%, cele dou proporii sunt egale, deci, nu se
poate spune c incidena afeciunilor cardiovasculare este mai mare la fumtori ca la
nefumtori.
x = 110 ;
sx = 60;
= 0,05.
Considerm:
H0: = 0=100,
H1: > 0=100.
Se aplic testul z unilateral dreapta:
x 0
P
z = 1
s / n
sx
n
z 0,05 = 1,645
0 + z
sx
n
= 100 +
60
100
1,645 = 109,870
17
Cum x = 110 > 109,870, suntem n regiunea critic deci se respinge H0.
b) H0: = 100;
H1: 100.
x 0
P z
z = 1 ;
2
2 sx / n
z 0, 05 = 1,96 .
2
0 z
2
sx
n
z =
2
sx
n
x 0 + z
60
100
sx
1,96 = 11,76 ;
2.
H0: = 0 = 12 kg;
H1: 12 kg ( < 12 kg sau > 12 kg).
Testul statistic: z =
x 0
x 0 11,85 12
=
=
= 3,0 .
sx
0,5 / 10
sx / n
18
Testul statistic: z =
x 0
x 0 110 100
=
=
= 1,67
sx
60 / 10
sx / n
Cum z calc > z , rezult c ipoteza nul este respins ( = 0 = 100 u.m.) i se accept
ipoteza alternativ ( > 0 = 100 u.m.).
b) H0: = 0 = 100 u.m.;
H1: 0 = 100 u.m.
Test statistic: z =
x 0
x 0 110 100
=
=
= 1,67 .
sx
60 / 10
sx / n
19
Cum z calc < z / 2 , (1,67 < 1,96), rezult c se accept ipoteza nul (valoarea medie a biletelor
cumprate nu este semnificativ diferit de 100 u.m.).
Test de autoevaluare 2
1. e)
2. a)
Test de autoevaluare 3
1. Ipotezele:
H0: p = 0,05
H1: p < 0,05
Testul statistic:
z=
f p0
=
sf
f p0
f (1 f )
n
f = 10 / 300 = 0,03;
sf =
z=
f (1 f )
=
n
0,03 0,97
= 0,0098 0,01 ;
300
0,03 0,05
= 2
0,01
Regula de decizie:
Cum z calc < z , (2 < 2,33), rezult c ipoteza nul nu se respinge, aadar nu avem suficiente
dovezi pentru a afirma c procentul bateriilor defecte este mai mic de 5%.
Test de autoevaluare 4
Dorim s vedem dac noua metod duce la un consum de timp semnificativ mai mic, aadar,
vom efectua un test unilateral dreapta:
20
H0: 1 = 2
(1 - 2 = 0),
H1: 1 > 2
(1 - 2 > 0).
z=
(x
x2 0
(x
1 x2
x1 x2
s12 s22
+
n1 n2
27,3 25,4
3,7 2 3,12
+
50
50
= 2,78
Cum valoarea calculat este mai mare dect z0,05 = 1,645, rezult c ne aflm n regiunea
critic. Deci noua metod duce la un consum de timp semnificativ mai mic, cu o probabilitate
de garantare a rezultatelor de 95%.
1.
Un reporter se documenteaz pentru un articol privind costurile tot mai ridicate ale
= 550,22 u.m.;
(x
= 1617,984 . Se cere:
gsii media i abaterea medie ptratic a costului unui manual n semestrul n curs, la
21
2. Un lot de 200 de sticle de buturi rcoritare este supus unui control de calitate. Lotul este
declarat necorespunztor dac mai mult de 3% dintre sticle nu respecta compoziia prestabilit
de productor. n urma verificrii, 7 sticle sunt gsite ca necorespunztoare. Ofer aceste
informaii suficiente dovezi ca ntregul lot s fie declarat necorespunztor ? Utilizai o
probabilitate de 99% de garantare a rezultatelor.
3. Pentru dou eantioane de studeni, unul de fete i altul de biei, a fost nregistrat
nlimea persoanelor care au participat la un program sportiv (xi) i s-au obinut urmtoarele
rezultate:
2
Suma greutilor (xi)
xi x
(inch)
Femei
30
1952
74,2
Brbai
40
2757
284,3
Ofer aceste date suficiente informaii pentru a respinge ipoteza conform creia nlimea
Eantion
Nr. studeni
medie a unui student participant la programul sportiv este cu cel mult 2,5 inch mai mare dect
cea a unei studente? (nivel de semnificaie de 2%).
22