Sunteți pe pagina 1din 22

CURS ECONOMETRIE

Unitatea de învățare 3:
FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR
STATISTICE II

Cuprins:

1. Ce am învățat în Unitatea de învățare 2


2. Obiectivele Unității de învățare 3
3. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare
4. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum redus
5. Testarea ipotezei privind proporţia populaţiei pentru eşantioane mari
6. Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum mare
7. Exersați în EXCEL
8. Răspunsuri și comentarii la testele de autoevaluare
9. Bibliografia Unității de învățare 3
10. Lucrare de verificare 3

1. Ce am învățat în Unitatea de învățare 2

Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea
de repartiţie pe care o urmează anumite variabile aleatoare.
Ipoteză nulă (H0) este ipoteza statistică ce urmează a fi testată.
Ipoteză alternativă (H1) reprezintă o teorie care contrazice ipoteza nulă.
Testul sau criteriul de semnificaţie reprezintă procedeul de verificare a unei ipoteze
statistice.
Testul statistic se calculează pe baza indicatorii statistici în eşantion și este utilizat drept
criteriu de acceptare sau de respingere a ipotezei nule.
Regiunea critică, Rc reprezintă valorile numerice ale testului statistic pentru care ipoteza nulă
va fi respinsă.
Eroarea de genul întâi este eroarea pe care o facem eliminând o ipoteză nulă, deşi este
adevărată.

1
Eroarea de genul al doilea este eroarea pe cere o facem acceptând o ipoteză nulă, deşi este
falsă.

Test bilateral H0: μ = μ0,


H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)

Test unilateral dreapta H0: μ = μ0,


H1: μ > μ0,
Test unilateral stânga H0: μ = μ0,
H1: μ < μ0,

Regiunea critică pentru:


a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga

μ μ μ
a) b) c)

k
( ni  n ' i ) 2
Testul de concordanţă  2 : 2  
i 1 n'i

Regiunea critică:  2   (2s 1)  k ;

Testul de concordanţă al lui Kolmogorov: d n  max Fn ( x )  F ( x )


Regiunea critică: d n 
n

2. Obiectivele Unității de învățare 3

După studiul acestei unități de învățare vei avea cunostințe despre:


 modalitatea prin care pot fi testate ipoteze privind mediei populaţiei generale
 modalitatea prin care poate fi testă diferența dintre mediile a două populații atunci
când avem eşantioane de volum mare extrase din cele două populații
 cum poate fi utilizat EXCEL în procesul de prelucrare și analiză a datelor

2
3. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum
mare

Utilizarea eşantioanelor de volum mare (n > 30) face posibilă aplicarea teoremei limită
centrală. După cum am văzut, putem întâlni teste unilaterale sau bilaterale.

Test bilateral
În cazul testului bilateral, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0),
H1: μ ≠ μ0 (μ - μ0≠0) (adică μ < μ0 sau μ > μ0).

Testarea se face pe baza mediei eşantionului x şi, pentru a o efectua, este nevoie să
construim un test cu un nivel de semnificaţie α prestabilit. Utilizând teorema limită centrală,
am văzut că dacă volumul eşantionului este mare, media eşantionului x este aproximativ
normal distribuită. De aceea, variabila aleatoare z urmează o distribuţie normală standard.
x  0 x  0 x  0
z   .
x x n sx n

Dacă pragul de semnificaţie (α) este stabilit, putem determina valoarea zα/2, pentru care P(z>z
α/2)= α/2. Aceasta înseamnă că regiunea critică Rc este dată de:
Rc: z< - z α/2 sau z > z α/2.

Regula de decizie:
Regiunede
acceptare

z<c1 c1<z<c2 z>c2


c1 c2
Regiunede
respingere

c1 = –zα/2;
c2 = z α/2.

Regula de decizie este, deci:


x  0 x  0
Respingem H0, dacă   z / 2 sau  z / 2 .
x n x n

3
☺ Exemplu
Patronul unei firme de prestări servicii doreşte să fluidizeze servirea clienţilor şi, până în
prezent, el presupunea că timpul de servire a clienţilor este normal distribuit, de medie 130 de
minute şi abatere medie pătratică 15 minute. El este de acord cu abaterea medie pătratică, dar
se îndoieşte de faptul că durata medie de servire a unui client este 130 minute. Pentru a studia
această problemă, înregistrează timpii de servire pentru 100 de clienţi. Timpul mediu obţinut
în eşantion este 120 minute. Poate patronul să concluzioneze, la o probabilitate de 99%, că
timpul mediu este diferit de 130 minute.
În această problemă, parametrul ce ne interesează este timpul mediu în colectivitatea
generală şi ipotezele de testat sunt:
H 0 :   130,
H 1 :   130.

Trebuie, aşadar, să răspundem la întrebarea: “Este media de 120 minute suficient de


diferită de valoarea 130, pentru a ne permite să concluzionăm că media populaţiei nu este
egală cu 130 minute?”
Vom putea să respingem ipoteza nulă dacă media eşantionului este suficient de diferită,
relativ la valoarea 130. Dar, interpretările nu sunt evidente. Dacă în eşantion obţineam media
1300 sau 1,3 atunci diferenţele erau clare. De asemenea, dacă media eşantionului era 130,1
atunci egalitatea era şi ea evidentă.
Distribuţia de eşantionare a mediei x este normală sau aproximativ normală, cu media 

şi abaterea medie pătratică s / n . Ca rezultat, putem standardiza x şi calcula


x  130 x  130
z  .
15 / 100 1,5
Regiunea de respingere (critică) o putem specifica astfel:
Se respinge H0, dacă z   z 0.005 sau z  z 0.005 .

În exemplul nostru, z / 2  z 0.005  2,575


120  130
z  6,67 .
1,5

4
Cum z  6,67  2,575  z 0.005 , rezultă că sunt suficiente dovezi pentru a respinge
ipoteza nulă H0 şi a accepta ipoteza alternativă, aceea că timpul mediu de servire a unui client
este diferit de 130 minute.

Test unilateral
Pentru testul unilateral dreapta, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0),
H1: μ > μ0 (μ - μ0>0).

Testul statistic calculat este:

x  0 x  0 x  0
z   .
x  n s n

Regiunea critică este dată de: Rc: z > zα.


z
<c cz
>c
R
eg
i
u n
e d
e R
egi
u n
ede
a
cc
ept
are r
esp
ing
er
e

c = zα.
x  0
Regula de decizie este: respingem ipoteza H0, dacă  z .
 n
Pentru testul unilateral stânga, ipotezele sunt:
H0: μ = μ0 (μ - μ0=0),
H1: μ < μ0 (μ - μ0<0).

Testul statistic calculat este:

x  0 x  0 x  0
z   .
x  n s n

Regiunea critică este dată de: Rc: z < –zα.


z
<cc z
>c

Reg
i
u n
ede R
eg
i
u n
e d
e
r
esp
ing
er
e a
cc
ept
are

c = –zα.
x  0
Regula de decizie este: respingem ipoteza H0, dacă   z .
 n

5
Să remarcăm că în nici una dintre aceste situaţii nu trebuie făcută o presupunere
specială, deoarece teorema limită centrală ne asigură că testul statistic va fi aproximativ normal
distribuit, indiferent de forma distribuţiei din colectivitate.

Test de autoevaluare 1
1. Presupunem că pentru 100 de observaţii asupra unei variabile aleatoare X s-a obţinut media

x  110 şi abaterea standard 60.


a) Testaţi ipoteza nulă că µ=100, cu alternativa µ>100, utilizând  = 0,05.
b) Testaţi ipoteza nulă că µ = 100, cu alternativa µ  100, utilizând  = 0,05. Comparaţi
rezultatele celor două teste.

2. Un producător de detergenţi industriali preambalează produsul la cutii ce trebuie să aibă, în


medie, 12 kg. El doreşte să verifice corectitudinea ambalării şi hotărăşte să organizeze un
sondaj de n=100 observaţii (cutii), pentru care obţine greutatea medie x  11,85 kg, cu o
abatere medie pătratică sx=0,5 kg. Să se testeze ipoteza conform căreia în medie cutiile au
câte 12 kg, cu alternativa că greutatea este diferită de 12 kg. (<12 kg sau >12 kg), pentru o
probabilitate de 95%.

3. Într-o cercetare prin sondaj aleator privitoare la transportul în comun, au fost selectate 100
de persoane pentru care s-a calculat valoarea medie a biletelor cumpărate într-o lună pentru
transport în comun urban de 110 u.m, cu o abatere medie pătratică de 60 u.m.
a) Testaţi ipoteza nulă, aceea conform căreia valoarea medie a biletelor cumpărate într-o lună,
în colectivitatea generală, este    0  100 u.m, cu ipoteza alternativă    0  100 u.m,

utilizând un nivel de încredere 1 -  = 0,95 (probabilitatea (1-)100 = 95%).


b) Testaţi ipoteza nulă    0  100 u.m, cu ipoteza alternativă    0  100 u.m, cu aceeaşi
probabilitate. Interpretaţi rezultatele.

4. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum
redus

6
În afaceri, multe decizii trebuie luate pe baza unor informaţii foarte limitate, adică pe
baza datelor provenite din eşantioane mici (de volum redus, n≤30). În aceste situaţii, efectul
imediat este acela că forma distribuţiei de eşantionare a mediei x depinde, acum, de forma
populaţiei generale din care a fost extras eşantionul. Distribuţia de eşantionare a lui x va fi
normală (sau aproximativ normală), în cazul eşantioanelor de volum redus, doar dacă
colectivitatea generală este distribuită normal (sau aproximativ normal).
Pe de altă parte, dacă nu se cunoaşte dispersia din colectivitatea generală (  2x ), atunci

dispersia eşantionului ( s x2 ), poate să nu ofere o aproximare foarte bună a lui  2x (în cazul

eşantioanelor mici). Ca atare, în locul statisticii z care necesită cunoaşterea (sau o bună
aproximare) a lui  x , vom folosi statistica:

x  0 x  0
t  ,
sx sx n

unde:

 x 
2
x

2 i
s
n 1
x

Ipotezele statistice privind media colectivităţii generale (μ) pe baza datelor din
eşantioane de volum redus, devin atunci:
- pentru test bilateral
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
- pentru test unilateral dreapta
H0: μ = μ0
H1: μ > μ0
- pentru test unilateral stânga
H0: μ = μ0
H1: μ < μ0

Testul statistic utilizat:

7
x  0 x  0
t  .
sx sx n

Presupunerea specială ce trebuie făcută este aceea că populaţia generală este normal sau
aproximativ normal distribuită.

Regiunea critică este dată de:


i) pentru test bilateral
t > t α/2,n-1 sau t < - t α/2,n-1
ii) pentru test unilateral dreapta
t > t α,n-1
iii) pentru test unilateral stânga
t < - t α,n-1

Exemplu

Conducerea unei companii apelează la 5 experţi pentru a previziona profitul companiei în


anul curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preţurile anului
anterior).
Ştiind că profitul companiei în anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi
pentru a concluziona că media previziunilor experţilor este semnificativ mai mare decât cifra
anului anterior (pentru α = 0,05)?

Media previziunilor experţilor este x  2,63 mld. lei, cu dispersia:

 x 
2
x 2,203
   0,5507 şi abaterea medie pătratică: s x  s x2  0,74 mld. lei.
2 i
s
n 1
x
4
Elementele procesului de testare a ipotezei statistice sunt:
H0: μ = 2,01,
H1: μ > 2,01 (test unilateral dreapta).
x x 2,63  2,01
t    1,874 .
sx sx n 0,74 / 5
În scopul folosirii statisticii t, vom face presupunerea că populaţia generală din care s-a
extras eşantionul este normal distribuită. Cum tα,n-1 = t0,05;4 = 2,132, regiunea critică este dată de
t>tα,n-1. Cum t=1,874< t0,05;4=2,132, nu putem trage concluzia că media profitului previzionată de

8
cei 5 experţi pentru anul curent este semnificativ mai mare decât profitul anului trecut, de 2,01
mld. lei.

Test de autoevaluare 2
1. În testarea ipotezei statistice privind media populaţiei, când datele provin de la un eşantion
de volum redus (n) şi:
H 0 :   0 ,
H1 :    0 ,

regiunea critică este dată de:


a) z   z sau z  z ;
b) z   z / 2 sau z  z / 2 ;
c) t  t / 2,n sau t  t / 2,n ;

d) t  t , n 1 sau t  t , n 1 ;

e) t  t / 2,n1 sau t  t / 2,n1

2. În testarea ipotezei statistice privitoare la parametrul „media populaţiei“, regiunea critică


este dată de: t  t ; n 1 când:

a. datele provin dintr-un eşantion de volum redus şi se efectuează test unilateral stânga;
b. datele provin dintr-un eşantion de volum redus şi se efectuează test unilateral dreapta;
c. datele provin dintr-un eşantion de volum normal, se cunoaşte dispersia populaţiei şi s-
a efectuat test unilateral stânga;
d. datele provin dintr-un eşantion de volum redus şi s-a efectuat test bilateral;
e. datele provin dintr-un eşantion de volum normal şi s-a efectuat test bilateral.

3. Un producător de imprimante pentru calculatoare personale doreşte să estimeze media


numărului de caractere tipărite până când se consumă cerneala. Costul crescut al unei astfel de
anchete impune utilizarea unui eşantion de volum redus. Presupunem că au fost testate n = 15
imprimante şi s-au calculat: x  1,13 milioane caractere, s = 0,27 milioane caractere.
a) Să se testeze cu o probabilitate de 90% intervalul de încredere pentru numărul mediu
de caractere.

9
b) Să se testeze ipoteza nulă   1,00 milioane, cu ipoteza alternativă   1,00 milioane
caractere, utilizând o probabilitate de 95%, în ipoteza distribuţiei normale a numărului de
caractere în colectivitatea generală.

5. Testarea ipotezei privind proporţia populaţiei pentru eşantioane mari

Pentru variabile alternative, media în eşantion se notează cu f (proporţia succeselor),


dispersia f(1-f), iar abaterea medie pătratică f (1  f ) .

Despre distribuţia de eşantionare a proporţiei ştim că proporţia succeselor în eşantion (f)


este aproximativ normal distribuită, de medie p şi eroare standard p(1  p) / n , pentru n mare
( np  5 şi n(1  p )  5 ):

p(1  p) f (1  f )
 f  p şi s f   .
n n

Cum proporţia f este aproximativ normal distribuită, rezultă că variabila standardizată

f p
z
f (1  f ) / n

este aproximativ normal standardizat distribuită.

Precizare:
Dacă volumul eşantionului este mic, distribuţia de eşantionare a proporţiei nu este o
distribuţie t şi orice inferenţă asupra lui p trebuie să se bazeze pe distribuţia lui f, care este o
distribuţie binomială. Pentru testarea ipotezelor statistice privind proporţia este necesar să
lucrăm cu eşantioane mari (n>100).

Ipotezele nule şi alternative pentru testarea proporţiei se construiesc în aceeaşi manieră cu


ipotezele pentru testarea mediei  .

Ipoteza nulă indică faptul că p este egală cu o valoare specificată:

10
H 0 : p  p0

Ipoteza alternativă răspunde la una dintre cele trei întrebări:


- Test bilateral: proporţia este diferită de valoarea specificată
H 1 : p  p0
- Test unilateral dreapta: proporţia este mai mare decât valoarea specificată
H 1 : p  p0

- Test unilateral stânga: proporţia este mai mică decât valoarea specificată
H 1 : p  p0

Testul statistic pentru proporţia p este:


f  p0 f  p0
z  .
p(1  p / n) f (1  f ) / n

Regiunea critică (Rc) este dată de:


i) pentru test bilateral
z   z / 2 sau z  z / 2

ii) pentru test unilateral dreapta


z  z
iii) pentru test unilateral stânga
z   z

Regula de decizie este: se respinge ipoteza nulă şi se acceptă ipoteza alternativă, dacă z
se situează în regiunea critică (Rc) stabilită în funcţie de probabilitatea dorită de garantare a
rezultatelor 100(1   )% .

Exemplu

Managerul unui lanţ de magazine consideră în urma unei analize financiare că, pentru un
nou produs, comercializarea este profitabilă, dacă procentul cumpărătorilor care ar dori să
achiziţioneze produsul este mai mare de 12%. El selectează 400 de cumpărători potenţiali şi
află că 56 dintre aceştia vor achiziţiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care să convingă managerul să comercializeze produsul?

11
Ipotezele sunt:
H 0 : p  0,12

H1 : p  0,12 (test unilateral dreapta).


Testul statistic este:
f  0,12 0,14  0,12 0,02
z    1,15 .
f (1  f ) / n 0,14  0,86 / 400 0,017

Cum z  z 0.01  2,33 şi z  z , rezultă că nu ne aflăm în regiunea critică (Rc), nu avem


suficiente dovezi să respingem ipoteza nulă, deci procentul nu este mai mare de 12%.

Test de autoevaluare 3
1. Un producător de baterii doreşte să verifice dacă procentul bateriilor defecte este mai mic
de 5%. Presupunem că sunt selectate aleator 300 de baterii, fiecare dintre acestea este testată
şi că sunt găsite 10 baterii defecte. Oferă aceste informaţii suficiente dovezi că procentul
bateriilor defecte este mai mic de 5%? Utilizaţi o probabilitate de 99% de garantare a rezul-
tatelor.
2. Un eşantion aleator de 50 de persoane a fost testat cu privire la un nou produs de snack-
food. Răspunsurile au fost codificate (0: nu-mi place; 1: îmi place) şi listate: 1, 0, 0, 1, 1, 0, 1,
0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1,
1, 0, 0, 0, 1.
a) Utilizaţi o probabilitate de 90% pentru a estima intervalul în care se va încadra
proporţia celor cărora le place produsul, în colectivitatea generală.
b) Testaţi ipoteza nulă H0: p = 0,5 cu ipoteza alternativă H1: p > 0,05, unde p este
proporţia celor cărora le place produsul, utilizând o probabilitate de 95%.

6. Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum
mare

Multe cazuri de analiză statistică implică o comparaţie între mediile a două colectivităţi
generale. Spre exemplu, un patron al unui restaurant doreşte să vadă dacă există diferenţe

12
între vânzările realizate înainte şi după o campanie de publicitate, un grup de consumatori
doreşte să vadă dacă există o diferenţă semnificativă între consumul electric pentru două tipuri
de cuptoare cu microunde etc.

În aceste situaţii, un estimator al diferenţei (μ1- μ2) este diferenţa dintre mediile
eşantioanelor ( x1  x 2 ).
Proprietăţile distribuţiei de eşantionare a diferenţei ( x1  x 2 ) sunt:

a) distribuţia de eşantionare pentru ( x1  x 2 ) este aproximativ normală pentru eşantioane


de volum mare (n1 > 30 şi n2 > 30);
b) media distribuţiei de eşantionare a lui ( x1  x 2 ) este (μ1 – μ2);
c) Caz 1: Dacă dispersiile celor două populaţii eşantionate sunt diferite, abaterea medie
pătratică a distribuţiei de eşantionare este:

 x21  x22
 x   ,
1 x 2
n1 n2

unde: -  x21 şi  x22 sunt dispersiile celor două populaţii eşantionate


- n1 şi n2 sunt volumele eşantioanelor respective.
Intervalul de încredere pentru (μ1 – μ2) este:

x 
1  x 2  z α/ 2
σ x21 σ x22
n1

n2
.

Mărimea lui  x  x  indică variabilitatea în valorile x1  x 2 , aşteptată în distribuţia de


1 2

eşantionare, datorită întâmplării.

Caz 2: Dacă dispersiile celor două populaţii eşantionate sunt egale,  x21 =  x22 =  2 ,
abaterea medie pătratică a distribuţiei de eşantionare va avea forma:

1 1
 x   n  n
1 x 2
1 2

Ipotezele statistice ce urmează a fi testate vor fi:


- pentru test bilateral
H0: (μ1- μ2) = D

13
H1: (μ1- μ2) ≠ D
- pentru test unilateral dreapta
H0: (μ1- μ2) = D
H1: (μ1- μ2) > D
- pentru test unilateral stânga
H0: (μ1- μ2) = D
H1: (μ1- μ2) < D
unde D reprezintă diferenţa ipotetică dintre mediile populaţiilor, deseori egală cu 0.

Testul statistic utilizat are forma:

z
x 1
 x2  D  .
 x 
1  x2

Regiunea critică este dată de:


- pentru test bilateral
z   z / 2 sau z  z / 2
- pentru test unilateral dreapta
z  z
- pentru test unilateral stânga
z   z

Exemplu
Managerul unui restaurant doreşte să determine dacă o campanie de publicitate a dus la creşterea
veniturilor medii zilnice. Au fost înregistrate veniturile pentru 50 de zile înainte de desfăşurarea
campaniei. După desfăşurarea campaniei şi trecerea unei perioade de 20 de zile pentru ca această
campanie să îşi facă efectul, se înregistrează veniturile pentru 30 de zile. Aceste două eşantioane
vor permite testarea ipotezei privind efectul campaniei asupra veniturilor. Din prelucrarea datelor
pentru cele două eşantioane, rezultă:
Înainte de campanie După campanie
n1=50 n2=30
x 1  12,55 mil. lei x 2  13,30 mil. lei
sx1=2,15 mil. lei sx2=2,38 mil. lei

14
Dorim să vedem dacă veniturile au crescut (μ2> μ1), aşadar, vom efectua un test unilateral
stânga:
H0: μ1 = μ2 (μ1 - μ2 = 0),
H1: μ1 < μ2 (μ1 - μ2 < 0).

Pentru un prag de semnificaţie α = 0,05 (probabilitate de garantare a rezultatelor (1-


α)100=95%, zα=z0,05=1,645.

Presupunând că cele două eşantioane (înainte şi după campanie) sunt independente, vom
calcula testul z:

z
x1  x 2   0  x1  x 2

x1  x 2

 0,75
 1,41
 x  x   2x1  2x 2 s 2x1 s 2x 2 0,5305
1 2
 
n1 n2 n1 n 2

Cum valoarea calculată nu este mai mică decât –z0,05 = –1,645, rezultă că nu ne aflăm în
regiunea critică. Eşantioanele nu oferă, aşadar, suficiente dovezi (la α = 0,05) pentru ca
managerul restaurantului să concluzioneze că veniturile au crescut în urma campaniei de
publicitate.

Test de autoevaluare 4
1. O companie doreşte să introducă o nouă metodă de realizare a unui produs. Se selectează
50 de produse pentru care se înregistrează timpii de realizare cu vechea metodă şi 50 de
produse pentru noua metodă. Rezultatele sunt:
Metoda actuală: Noua metodă:
n1 = 50 n2 = 50
x1  27,3 minute x 2  25,4 minute
s1  3,7 minute s 2  3,1 minute

Să se arate, utilizând o probabilitate de 95%, dacă rezultatele oferă suficiente informaţii


pentru a indica faptul că noua metodă duce la un consum de timp semnificativ mai mic.

7. Exersați în EXCEL

15
O companie de asigurări de viaţă se gândeşte a oferi discount-uri nefumătorilor. De aceea
organizează un sondaj prin care sunt selectate 40 de persoane: 20 fumătoare şi 20
nefumătoare. Persoanele sunt întrebate dacă au sau nu boli cardiovasculare (codificarea este
1- persoană cu afecţiuni cardiovasculare; 0 - persoană fără afecţiuni cardiovasculare).
Datele obţinute sunt:
Fumători 1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0
Nefumători 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1
Se poate spune, cu un nivel de semnificaţie de 5% că incidenţa bolilor cardiovasculare este
mai mare la fumători ca la nefumători? Din cercetări anterioare au rezultat următoarele
dispersii în populaţia totală: 0,2 pentru fumători, respectiv 0,15 pentru nefumători.

Identificarea metodei:
Datele sunt calitative şi alternative iar obiectivul experimentului este de a compara două
proporţii: proporţia fumătorilor cu boli cardiovasculare şi proporţia nefumătorilor cu boli
cardiovasculare. Deci ipoteza care trebuie testată este H0: p1= p2 cu alternativa H1: p1 > p2.
Pentru aceasta se va aplica un test z deoarece dispersiile sunt cunoscute.

Instrucțiuni în EXCEL:
1. Introduceţi datele pe două coloane. În A1 tastaţi „Fumători“ iar în B1 „Nefumători“.
2. Apăsaţi Tools/Data Analysis şi apoi z-Test: Two-Sample for Means
3. Specificaţi variabila 1: A1:A21
4. Specificaţi variabila 2: B1:B21
5. Specificaţi Hypothesized Mean Difference: 0, apăsaţi Labels.
6. Introduceţi varianţele (Variable 1 Variance (known): 0,2 şi Variable 2 Variance
(known): 0,15). Apăsaţi OK.

Se obţin rezultatele:
z-Test: Two Sample for Means

Fumători Nefumători
Mean 0.25 0.2
Known Variance 0.2 0.15
Observations 20 20
Hypothesized Mean Difference 0
z 0.377964
P(Z<=z) one-tail 0.352729

16
z Critical one-tail 1.644853
P(Z<=z) two-tail 0.705457
z Critical two-tail 1.959961

Sunt calculate cele două proporţii: 25% dintre fumători şi 20% dintre nefumători au o
afecţiune cardiovasculară. Valoarea statisticii z este 0,378 cu o valoare p de 0,35 (one-tail –
test unilateral). Deoarece valoarea p nu este apropiată de zero (p>0,05), ipoteza nulă se
acceptă. Pentru un nivel de semnificaţie de 5%, cele două proporţii sunt egale, deci, nu se
poate spune că incidenţa afecţiunilor cardiovasculare este mai mare la fumători ca la
nefumători.

8. Răspunsuri și comentarii la testele de autoevaluare

Test de autoevaluare 3
1. a) n = 100;
x  110 ;
sx = 60;
 = 0,05.

Considerăm:
H0: µ = µ0=100,
H1: µ > µ0=100.

Se aplică testul z unilateral dreapta:


 x  0 
P  z   1  
s / n 
 x 

Regiunea critică va fi dată de:


sx
x   0  z 
n
z 0, 05  1,645

sx 60
 0  z   100   1,645  109,870
n 100

17
Cum x  110 > 109,870, suntem în regiunea critică deci se respinge H0.

b) H0: µ = 100;
H1: µ  100.

Se aplică testul z bilateral.


 x  0 
P  z    z   1   ;
 
 2 sx / n 2 

z 0,05  1,96 .
2

Limitele intervalului de încredere sunt:


sx sx
 0  z   x   0  z  ;
2 n 2 n

sx 60
 z   1,96  11,76 ;
n 2 100

100  11,76  x  100  11,76;


88,24  x  111,76 .

Întrucât ne aflăm în intervalul de încredere, se acceptă ipoteza H0.

2. H0:    0  12 kg;

H1:   12 kg (   12 kg sau   12 kg).

x  0 x   0 11,85  12
Testul statistic: z     3,0 .
sx sx / n 0,5 / 10

Nivelul de încredere: 1 -  = 0,95.

Pragul de semnificaţie:  = 0,05, din care rezultă /2 = 0,025 (deoarece avem test
bilateral).
z / 2  z 0,025  1,96 .

18
Regiunea de respingere: z / 2  1,96 sau z / 2  1,96 .

Cum z calc  z / 2 , rezultă că ipoteza nulă este respinsă şi se acceptă ipoteza alternativă, aceea
că în cutii se află o cantitate de detergenţi semnificativ diferită de 12 kg.

3. a) H0:    0  100 u.m

H1:    0  100 u.m.

x  0 x   0 110  100
Testul statistic: z     1,67
sx sx / n 60 / 10

Nivelul de încredere: 1 -  = 0,95.

Pragul de semnificaţie:  = 0,05 (test unilateral dreapta)


z  z 0,05  1,645

Cum z calc  z , rezultă că ipoteza nulă este respinsă (    0  100 u.m.) şi se acceptă

ipoteza alternativă (    0  100 u.m.).

b) H0:    0  100 u.m.;

H1:    0  100 u.m.

x  0 x   0 110  100
Test statistic: z     1,67 .
sx sx / n 60 / 10

Nivelul de încredere 1 -  = 0,95.


Pragul de semnificaţie  = 0,05, din care rezultă /2 = 0,025 (deoarece avem test bilateral).
z / 2  z 0,025  1,96

19
Cum z calc  z / 2 , (1,67 < 1,96), rezultă că se acceptă ipoteza nulă (valoarea medie a biletelor
cumpărate nu este semnificativ diferită de 100 u.m.).

Test de autoevaluare 2
1. e)
2. a)

Test de autoevaluare 3
1. Ipotezele:
H0: p  0,05
H1: p < 0,05
Testul statistic:
f  p0 f  p0
z 
sf f 1  f 
n
f = 10 / 300 = 0,03;

f 1  f  0,03  0,97
sf    0,0098  0,01 ;
n 300
0,03  0,05
z  2
0,01

Nivelul de încredere 1 -  = 0,99.


Pragul de semnificaţie  = 0,01 (test unilateral stânga).
z  z 0,01  2,33

Regula de decizie:
Cum z calc  z , (2 < 2,33), rezultă că ipoteza nulă nu se respinge, aşadar nu avem suficiente

dovezi pentru a afirma că procentul bateriilor defecte este mai mic de 5%.

Test de autoevaluare 4
Dorim să vedem dacă noua metodă duce la un consum de timp semnificativ mai mic, aşadar,
vom efectua un test unilateral dreapta:

20
H0: μ1 = μ2 (μ1 - μ2 = 0),
H1: μ1 > μ2 (μ1 - μ2 > 0).

Pentru un prag de semnificaţie α = 0,05 (probabilitate de garantare a rezultatelor (1-


α)100=95%, zα=z0,05=1,645.

Presupunând că cele două eşantioane (înainte şi după campanie) sunt independente, vom
calcula testul z:

z
x 1

 x2  0

x1  x2

27,3  25,4
 2,78
 x  s12 s22 3,7 2 3,12
1  x2
 
n1 n2 50 50

Cum valoarea calculată este mai mare decât z0,05 = 1,645, rezultă că ne aflăm în regiunea
critică. Deci noua metodă duce la un consum de timp semnificativ mai mic, cu o probabilitate
de garantare a rezultatelor de 95%.

9. Bibliografia Unității de învățare 3

 V.Voineagu, E.Ţiţan, R.Şerban, S.Ghiţă, D.Todose, C.Boboc, D.Pele – Teorie şi


practică econometrică, Ed. Meteor Press, 2007
 T. Andrei, Statistică şi econometrie, Ed. Economică, 2003

10. Lucrare de verificare 3

1. Un reporter se documentează pentru un articol privind costurile tot mai ridicate ale
educaţiei primite în învăţământul superior. Pentru aceasta, el a luat în considerare variabila
„costul unui manual” în semestrul în curs (variabila x). În urma considerării unui eşantion de

x  x 
2
41 de manuale, el a găsit că: i  550,22 u.m.; i x  1617,984 . Se cere:

a) găsiţi media şi abaterea medie pătratică a costului unui manual în semestrul în curs, la
nivelul eşantionului considerat;
b) testaţi ipoteza conform căreia valoarea medie a unui manual este mai mică de 15 u.m.,
pentru un nivel de semnificaţie de 1%.

21
2. Un lot de 200 de sticle de băuturi răcoritare este supus unui control de calitate. Lotul este
declarat necorespunzător dacă mai mult de 3% dintre sticle nu respecta compoziţia prestabilită
de producător. În urma verificării, 7 sticle sunt găsite ca necorespunzătoare. Oferă aceste
informaţii suficiente dovezi ca întregul lot să fie declarat “necorespunzător“ ? Utilizaţi o
probabilitate de 99% de garantare a rezultatelor.
3. Pentru două eşantioane de studenţi, unul de fete şi altul de băieţi, a fost înregistrată
înălţimea persoanelor care au participat la un program sportiv (xi) şi s-au obţinut următoarele
rezultate:
Eşantion Nr. studenţi Suma greutăţilor (∑xi)
(inch)  
xi  x
2

Femei 30 1952 74,2
Bărbaţi 40 2757 284,3
Oferă aceste date suficiente informaţii pentru a respinge ipoteza conform căreia înălţimea
medie a unui student participant la programul sportiv este cu cel mult 2,5 inch mai mare decât
cea a unei studente? (nivel de semnificaţie de 2%).

22

S-ar putea să vă placă și