Sunteți pe pagina 1din 15

CURS ECONOMETRIE

Unitatea de nvare 4:
FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR
STATISTICE III

Cuprins:

1. Ce am nvat n Unitatea de nvare 3


2. Obiectivele Unitii de nvare 4
3. Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum redus
4. Testarea ipotezei privind dispersia unei populaii
5. Testarea ipotezei privind raportul dintre dou dispersii
6. Exersai n EXCEL
7. Rspunsuri i comentarii la testele de autoevaluare
8. Bibliografia Unitii de nvare 4
9. Lucrare de verificare 4

1. Ce am nvat n Unitatea de nvare 3

Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare

Ipotezele statistice: H0: = 0 ( - 0=0),


- test bilateral: H1: 0 ( - 00) (adic < 0 sau > 0).
- test unilateral stnga: H1: < 0 ( - 0<0)
- test unilateral dreapta: H1: > 0 ( - 0>0)

x 0 x 0 x 0
Testul statistic: z .
x x n sx n

Regiunea critic Rc:


- pentru test bilateral: z< - z /2 sau z > z /2
- pentru test unilateral stnga: z < z
- pentru test unilateral dreapta: z > z

Testarea ipotezei privind media populaiei generale () pentru eantioane de volum redus

1
Ipotezele statistice: H0: = 0 ( - 0=0),
- test bilateral: H1: 0 ( - 00) (adic < 0 sau > 0).
- test unilateral dreapta: H1: > 0 ( - 0>0)
- test unilateral stnga: H1: < 0 ( - 0<0)

x 0 x 0
Testul statistic: t .
sx sx n

Regiunea critic Rc:


- pentru test bilateral: t > t /2,n-1 sau t < - t /2,n-1
- pentru test unilateral dreapta:t > t ,n-1
- pentru test unilateral stnga: t < - t ,n-1

Testarea ipotezei privind proporia populaiei pentru eantioane mari

Ipotezele statistice: H 0 : p p0

- test bilateral: H 1 : p p0

- test unilateral stnga: H 1 : p p0

- test unilateral dreapta: H 1 : p p0


f p0 f p0
Testul statistic: z .
p (1 p / n) f (1 f ) / n

Regiunea critic Rc:


- pentru test bilateral: z< - z /2 sau z > z /2
- pentru test unilateral stnga: z < z
- pentru test unilateral dreapta: z > z

Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum mare

Ipotezele statistice: H0: (1- 2) = D


- test bilateral: H1: (1- 2) D
- test unilateral stnga: H1: (1- 2) < D
- test unilateral dreapta: H1: (1- 2) > D

Testul statistic: z
x 1

x2 D
x x2
1

2
x21 x22
unde x , dac dispersiile celor dou populaii sunt diferite
1 x 2
n1 n2

1 1
sau x , dac dispersiile celor dou populaii sunt egale
1 x 2
n1 n 2

Regiunea critic Rc:


- pentru test bilateral: z< - z /2 sau z > z /2
- pentru test unilateral stnga: z < z
- pentru test unilateral dreapta: z > z

2. Obiectivele Unitii de nvare 4

Dup studiul acestei uniti de nvare vei avea cunostine despre:


modalitatea prin care poate fi test diferena dintre mediile a dou populaii atunci
cnd avem eantioane de volum mic extrase din cele dou populaii
modalitatea prin care pot fi testate ipoteze privind dispersiile populaiilor generale
cum poate fi utilizat EXCEL n procesul de prelucrare i analiz a datelor

3. Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum
redus

n cazul n care dorim s testm semnificaia diferenei dintre mediile a dou eantioane
de volum redus, va trebui s construim, ca i n cazul anterior, o statistic t, Student. Pentru
aceasta vom presupune c:
- ambele colectiviti generale din care s-au extras eantioanele sunt normal sau
aproximativ normal distribuite;
- eantioanele aleatoare sunt selectate independent unul de cellalt.

Cazul 1: Cele dou colectiviti generale au dispersii egale: x21 = x22 = x2


n acest caz, un estimator al dispersiei (variabilitii) totale din cele dou populaii
combinate este:

3
x x x x
n1 n2
2 2
i 1 i 2

sc2 i 1 i 1

n1 n2 2

sau

s 2

n1 1 s x21 n2 1 s x22 n1 1 s x21 n2 1 s x22

c
n1 1 n2 1 n1 n2 2

2
Aadar, dispersia combinat sc este media aritmetic ponderat a dispersiilor celor dou
2 2
eantioane, s x1 i s x 2 .

Testul statistic:

t
x 1

x2 D

x 1
x2 D
n1n2 n1 n2 2
1 1 s x21 n1 1 s x22 n2 1 n1 n2
sc2
n1 n2

cu gradele de libertate: n1+n2-2

Cazul 2: Dac dispersiile nu sunt egale (2x1 2x2)

Testul statistic:

t
( x1 x2 ) D /n1 s22 /n2 s
2
1 2

s12 s22 , cu gradele de libertate (s12 /n1 )2 (s22 /n2 )2 .



n1 n2 n1 1 n2 1

Ipotezele statistice:
- pentru test bilateral
H0: 1 = 2 (1- 2 = D)
H1: 1 2 (1- 2 D)
- pentru test unilateral dreapta
H0: 1 = 2 (1- 2 = D)
H1: 1 > 2 (1- 2 > D)
- pentru test unilateral stnga

4
H0: 1 = 2 (1- 2 = D)
H1: 1 < 2 (1- 2 < D)
unde D reprezint diferena ipotetic dintre mediile populaiilor, deseori egal cu 0.

Regiunea critic este dat de:


- pentru test bilateral:

t< t / 2 , n 1 n2 2
sau t> t / 2 ,n n
1 2 2

- pentru test unilateral dreapta:

t> t , n1 n 2 2
- pentru test unilateral stnga:

t< t , n 1 n2 2

Exemplu
Exemplu

Presupunem c dorim s testm ipoteza conform creia ntre dou mrci de autoturisme
nu exist diferene semni-ficative privind cheltuielile de funcionare. Pentru aceasta 20 de
posesori de autoturisme (8 posesori ai primei mrci i 12 po-sesori ai celei de-a doua) sunt
rugai s in, cu acuratee, evidena cheltuielilor de funcionare pe o perioad de un an de
zile. Pentru =0,1 (probabilitate de garantare a rezultatelor (1-)100 = 90%) s se testeze
aceast ipotez, dac rezultatele prelucrrii datelor n eantioane sunt:

Marca 1 Marca 2
n1=8 n2=12
x 1 5,696 mil. lei x 2 5,273 mil. lei
sx1=0,485 mil. lei sx2=0,635 mil. lei

s c2
8 1 0,4852 12 1 0,6352 0,3379
8 12 2

Ipotezele statistice sunt:


H0: 1 = 2 (1- 2 = 0),
H1: 1 2 (1- 2 0) [1> 2 sau 1< 2].

Testul statistic este:

5
t
5,696 5,273 0 0,423
1,5943
1 1 0,2653
0,3379
8 12

Cum t/2,n1+n2-2= t0,05;18 = 1,734, se observ c t < t/2,n1+n2-2, aadar nu ne aflm n regiunea
critic.

Rezult, deci, c nu exist suficiente dovezi pentru a concluziona c sunt diferene


semnificative ntre cheltuielile de funcionare ale celor dou mrci de autoturisme.

n cazul n care, dup testarea ipotezei privind normalitatea distribuiei n colectivitatea


general cu ajutorul testelor prezentate anterior, ipoteza nul nu este acceptat, se poate apela
la teste statistice neparametrice, n cadrul crora nu se fac presupuneri speciale asupra
formei distribuiei.

Test de autoevaluare 1

1. Un mecanic de ntreinere analizeaz funcionarea a dou linii de productie. El afirm c


linia A de productie se defecteaz de mai multe ori ntr-o sptaman dect linia B. Pentru a
testa aceasta afirmaie, este urmarit functionarea celor dou linii timp de 12 sptmni i se
nregistreaz numrul sptmnal de defeciuni (xi). Rezultatele sistematizate sunt:

x x 2
Linia Nr. sptmni i i x

A 12 129 69,52
B 12 111 42,35

Justificai, cu o probabilitate de 90%, dac este adevarat afirmaia mecanicului de ntreinere


(valoarea critic a testului: 1,321)

4. Testarea ipotezei privind dispersia unei populaii

6
Se tie c:
- suma ptratelor diferenelor ( x i x ) 2 (care este, de fapt, egal cu n s 2 sau

( n 1) s 2 pentru eantioane mici), mprit la dispersia colectivitii generale, are o


distribuie hi-ptrat ( 2 ) (dac populaia eantionat este normal distribuit)
- trebuie precizat c valoarea lui 2 pentru care aria de sub curb (situat la dreapta ei)

este egal cu , se noteaz . Nu putem folosi notaia pentru a reprezenta punctul la


2 2

care aria din stnga este , deoarece statistica este ntotdeauna mai mare dect zero. Dar
2

21 reprezint punctul pentru care aria de sub curb situat la stnga lui este .

Exemplu
2 16 ,92 i 2 3,33.
0 ,05;9 0 ,95;9

Factorii ce identific testul 2 privind dispersia unei populaii:


obiectiv: caracterizarea unei colectivitii;
aspectul vizat: variabilitatea;
tipul datelor: cantitative.

Testul statistic utilizat n testarea ipotezei privind 2 este:

( n 1) s 2

2

2
care are o distribuie cu (n-1) grade de libertate, cnd populaia eantionat este normal
2

distribuit, cu dispersia 2 .

Ipotezele statistice:
- pentru test bilateral
H 0 : 2 02

H 0 : 2 02

- pentru test unilateral dreapta


H 0 : 2 02

H 0 : 2 02

7
- pentru test unilateral stnga
H 0 : 2 02

H 0 : 2 02

unde D reprezint diferena ipotetic dintre mediile populaiilor, deseori egal cu 0.

Regiunea critic este dat de:


- pentru test bilateral:
2 12 / 2 ,n 1 sau 2 2 / 2 ,n 1

- pentru test unilateral dreapta:


2 2 ,n 1

- pentru test unilateral stnga:


2 12 ,n 1

Exemplu

Pentru urmtoarele date privind cererea unui produs (selectate dintr-o colectivitate normal
distribuit), s se testeze (pentru o probabilitate de 95%), ipotezele:
H 0 : 2 100 ,

H 1 : 2 100 .

Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
n eantion: s 13,85 , s 2 191,8 .

s 2

(x i x)2

1726
191,8 .
n 1 9
Testul statistic este:
(n 1) s 2 1726
2
17,26 .
2 100
Cum , n 1 0.05, 9 16,92 ,
2 2

i ,n 1 vom respinge ipoteza nul i vom accepta ipoteza alternativ, 2 100 .


2 2

Test de autoevaluare 2

8
1. Abaterea medie ptratic a nlimii fetelor dintr-o clas de boboci (clasa a 9-a) ai unui
liceu este de 6,9 centimetri. Este vreun motiv s credem c a avut loc o schimbare n variaia
nlimii fetelor dac a fost selectat un eantion aleator de 30 de fete din clasa a 9-a a liceului
i s-a obinut o dispersie de 49 cm2. Se presupune un nivel de semnificaie de 0,02.

5. Testarea ipotezei privind raportul dintre dou dispersii

Am vzut c testarea ipotezei privind dispersia poate fi utilizat pentru a trage concluzii
privitoare la consistena unor procese economice ori privitoare la riscurile asociate. n acest
subcapitol vom compara dou dispersii, ceea ce ne va permite s comparm consistena a
dou procese sau riscurile a dou portofolii de investiii etc.
Statisticienii testeaz, adesea, egalitatea dintre dou dispersii nainte de a decide ce
procedeu s foloseasc n verificarea ipotezei privind diferena dintre dou medii.
Vom compara dispersiile a dou populaii, determinnd raportul dintre ele. n consecin,

parametrul ce ne intereseaz este 12 / 22 . Dac dispersia eantionului este (aa cum am vzut)
un estimator nedeplasat i consistent al dispersiei colectivitii generale, s notm c raportul
s 12 / s 22 este estimator punctual al raportului de dispersii 12 / 22 .

Distribuia de eantionare a raportului s12 / s 22 este o distribuie F, dac eantioanele au


fost extrase independent din populaii normal distribuite.

Se cunoate c raportul dintre dou variabile hi-ptrat independente mprite la gradele lor
de libertate are o distribuie Fisher (distribuie F). Gradele de libertate ale distribuiei F sunt
identice cu gradele de libertate ale celor dou distribuii hi-ptrat. Atunci:

(n1 1) s12 / 12 (n 2 1) s 22 / 22 s12 / 12


F : 2 2 , cu ( n1 1) i (n2 1) grade de libertate.
(n1 1) (n 2 1) s2 / 2

Valoarea lui F pentru care aria de sub curb (situat la dreapta ei) este , se noteaz F (cu
gradele de libertate gl1 i gl2, unde gl1 = n1 1 i gl2 = n2 1).

Ipotezele statistice:

9
- pentru test bilateral
H 0 : 12 / 22 1

H 0 : 12 / 22 1

- pentru test unilateral dreapta


H 0 : 12 / 22 1

H 0 : 12 / 22 1

- pentru test unilateral stnga


H 0 : 12 / 22 1

H 0 : 12 / 22 1

Testul statistic:

s12
F
s 22

care urmeaz o distribuie F cu ( n1 1) i (n2 1) grade de libertate.

Regiunea critic este dat de:


- pentru test bilateral:
F F / 2 ,n 1,n1 2 1
sau F F1 / 2 ,n 1,n
1 2 1

- pentru test unilateral dreapta:


F F , n 1, n
1 2 1

- pentru test unilateral stnga:


F F1 , n
1 1, n2 1

Exemplu
Un analist dorete s compare mprtierea veniturilor pe familie, pentru colectivitatea
turitilor ce prefer turismul litoral, cu mprtierea veniturilor, pentru colectivitatea turitilor ce
prefer turismul balnear. Presupunnd c distribuiile veniturilor (mil. lei), n cele dou
colectiviti sunt aproximativ normale au fost selectate dou eantioane, de volum 60 i 50 de
persoane, iar abaterile medii ptratice (mil. lei) sunt: s1 2,84 i s 2 1,86 . Se utilizeaz o
probabilitate de garantare a rezultatelor de 95%.
Ipotezele statistice sunt:

10
H 0 : 12 / 22 1 ,

H 1 : 12 / 22 1 .

Testul statistic are valoarea:


s12 2,84 2 8,0686
F 2,3314 .
s 22 1,86 2 3,4596
Regiunea critic (pentru 0,05 ) este dat de:
F F0.05; 59; 49 1,64 .

Cum F F0.05; 59; 49 ipoteza nul se respinge (aceea c raportul dintre dispersii este 1) i
se accept ipoteza alternativ. Acest lucru nseamn c se accept ipoteza conform creia
mprtierea veniturilor pentru turitii din zona litoral este semnificativ mai mare dect cea a
turitilor din zona balnear.

n general, dac la numrtor se trece dispersia cea mai mare testul F este un test
unilateral dreapta.

6. Exersai n EXCEL

Un specialist afirm c persoanele care mnnc cereale la micul dejun vor consuma la masa de prnz,
n medie, mai puine calorii ca aceia care nu mnnc cereale la micul dejun. Pentru a testa aceast
afirmaie, au fost selectai aleator 30 de persoane i au fost ntrebate ce mnnc n mod regulat la
micul dejun i la masa de prnz. Fiecare persoan a fost identificat ca un consumator sau
nonconsumator de cereale la micul dejun i fiecrei persoane i-au fost calculate numrul de calorii
consumate la masa de prnz.
Rezultatele obinute sunt urmtoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529, 632, 951, 744, 632, 593, 847
(calorii)
Se poate spune cu un nivel de semnificaie de 5% c specialistul are dreptate?

Identificarea metodei:
Specialistul trebuie s compare media consumului de calorii pentru populaia consumatorilor de
cereale cu cea a nonconsumatorilor de cereale. Datele sunt cantitative.

11
Ipoteza care trebuie testat este: H 0: 1= 2 cu alternativa H1: 1< 2, deoarece trebuie observat
dac numrul mediu al caloriilor consumate de consumatorii de cereale la masa de prnz este mai mic
dect al neconsumatorilor de cereale.

I. Pentru a putea identifica testul ce trebuie aplicat se va testa dac dispersiile (variaiile) celor dou
populaii sunt egale folosind testul F.
Ipotezele sunt:
H0: 12/22=1 cu alternativa H1: 12/221
Expresia testului este:
F= s12/s22

Instruciuni n EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi F-Test Two-Sample for Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Apsai Labels i apoi OK.

Se obin rezultatele:
F-Test Two-Sample for Variances

Consumatori Nonconsumatori
Mean 595.8 661.1
Variance 1273.51 13375.25
Observations 10 20
df 9 19
F 0.0952
P(F<=f) one-tail 0.00053
F Critical one-tail 0.3392

Excel calculeaz statistica F ca raportul ntre dispersia cea mai mare i dispersia cea mai mic.
Statistica F n cazul nostru este 0,095 iar valoarea p asociat testului unilateral este 0,00053. Valoarea
p corespunztoare testului bilateral (pragul de semnificaie) este 2 0,00053 = 0,00106. Deoarece
aceast valoare este foarte apropiat de zero, ipoteza nul se respinge, deci cele dou dispersii difer
semnificativ.

II. Deoarece sunt complet diferite va fi aplicat testul t pentru variaii inegale.

Instruciuni n EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.

12
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Unequal Variances
3. Specificai variabila 1: A1:A11
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK

Se obin rezultatele:
t-Test: Two-Sample Assuming Unequal Variances

Variable 1 Variable 2
Mean 595.8 661.1
Variance 1273.511 13375.25
Observations 10 20
Hypothesized Mean Difference 0
Df 25
t Stat -2.31433
P(T<=t) one-tail 0.014576
t Critical one-tail 1.70814
P(T<=t) two-tail 0.029153
t Critical two-tail 2.059537

EXCEL listeaz mediile, dispersiile i dimensiunile eantioanelor. De asemenea listeaz rezultatele


statistice legate de testarea de ipoteze.
Valoarea statisticii t este -2,31433.
Valoarea p pentru test unilateral este 0,014576 (pragul de semnificaie = 1 probabilitatea de
garantare a rezultatelor).
Valoarea p pentru test bilateral este 0,029153.
EXCEL mai listeaz i valorile critice pentru cele dou cazuri, pentru un nivel de semnificaie de
5%.
Deoarece valoarea p pentru testul unilateral este mic putem spune c aceste date dovedesc c cei
care consum cereale la micul dejun consum mai puine calorii la masa de prnz (se accept ipoteza
alternativ, c exist diferene semnificative), cu o probabilitate de 98,54%.

7. Rspunsuri i comentarii la testele de autoevaluare

Test de autoevaluare 1
1. Ipotezele statistice sunt:
H0: 1 = 2 (1- 2 = 0),
H1: 1 > 2 (1- 2 > 0)

13
Testul ce se va aplicate este testul pentru diferena dintre dou medii pentru eantioane de
volum redus (deoarece n=12).
Caz 1: Dispersiile sunt egale

n1 1 s x21 n2 1 s x22 69,52 42,35


s 2
5,085
c
n1 1 n2 1 11 11

Testul statistic este:

t
x 1 x2 D
129 / 12 11 / 12

11,66
12,67
1 1 5,0851 / 12 1 / 12 0,92
s c2
n1 n 2

Cum t/2,n1+n2-2= t0,05;20 = 1,725, se observ c t > t/2,n1+n2-2, aadar ne aflm n regiunea
critic.

Rezult c afirmaia mecanicului este adevrat.

Caz 2: Dispersiile sunt diferite

Testul statistic este:

t
x 1

x2 D

129 / 12 11 / 12

11,66
12,67
s12 s 22 69,52 42,35 0.92

n1 n 2 12 * 11 12 * 11

Numrul gradelor de libertate:


2
69,52 42,35


s1 /n1 s 2 /n 2
2 2

2
12 *11 12 *11

0,72
21
GL= (s1 /n1 ) (s 2 /n 2 )
2 2 2 2
69,52
2
42,35
2
0,025 0,009

n1 1 n2 1 12 *11 12 *11

11 11
Cum t/2,GL= t0,05;21 = 1,72, se observ c t > t/2,GL, aadar ne aflm n regiunea critic.

Rezult c afirmaia mecanicului este adevrat.

14
Test de autoevaluare 2

1. Ipotezele: H 0 : 2 47,61 ,

H 1 : 2 47,61 .
n eantion: s 2 49 , n=30 .
Testul statistic este:
(n 1) s 2 29 49
2 29,84 .
2 47,61

Cum , n 1 0.02, 29 46,69


2 2

i , n 1 vom accepta ipoteza nulm deci nu exist suficiente dovezi pentru a


2 2

afirma c s-a produs o modificare n nlimea fetelor.

8. Bibliografia Unitii de nvare 3

V.Voineagu, E.ian, R.erban, S.Ghi, D.Todose, C.Boboc, D.Pele Teorie i


practic econometric, Ed. Meteor Press, 2007
T. Andrei, Statistic i econometrie, Ed. Economic, 2003

9. Lucrare de verificare 4

1. Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n
cazul eantioanelor de volum redus?
2. O companie producatoare de hrana pentru bebelui susine c noul su produs este superior
fa de cel al principalului su concurent, prin aceea c bebeluii care consum acest produs
ctig mai repede i mai mult n greutate. Pentru a verifica aceasta afirmaie, au fost selectai
aleator 10 bebelui; timp de 2 luni, 5 bebelui au fost hrnii cu produsul creat de compania
productoare, iar ceilali 5 bebelui cu produsul creat de firma concurent. Surplusul de
greutate (zeci grame) ctigat de bebelui n urma consumrii celor dou produse a fost:
Produsul companiei 85 102 79 105 113
Produsul concurentului 91 68 85 82 76
Putem concluziona, cu o probabilitate de 95%, c bebeluii hrnii cu produsul companiei au
luat mai mult n greutate dect cei hranii cu produsul concurentului? (tcritic= 2,306)

15

S-ar putea să vă placă și