Documente Academic
Documente Profesional
Documente Cultură
Curs - 4-5 Econometrie PDF
Curs - 4-5 Econometrie PDF
Unitatea de învățare 4:
FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR
STATISTICE III
Cuprins:
Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare
x 0 x 0 x 0
Testul statistic: z .
x x n sx n
1
Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum redus
x 0 x 0
Testul statistic: t .
sx sx n
Regiunea critică Rc:
- pentru test bilateral: t > t α/2,n-1 sau t < - t α/2,n-1
- pentru test unilateral dreapta:t > t α,n-1
- pentru test unilateral stânga: t < - t α,n-1
Ipotezele statistice: H 0 : p p0
- test bilateral: H 1 : p p0
f p0 f p0
Testul statistic: z .
p(1 p / n) f (1 f ) / n
Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum mare
2
Testul statistic: z
x 1
x2 D
x
1 x2
x21 x22
unde x , dacă dispersiile celor două populații sunt diferite
1 x 2
n1 n2
1 1
sau x n n , dacă dispersiile celor două populații sunt egale
1 x 2
1 2
3. Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum
redus
În cazul în care dorim să testăm semnificaţia diferenţei dintre mediile a două eşantioane
de volum redus, va trebui să construim, ca şi în cazul anterior, o statistică t, Student. Pentru
aceasta vom presupune că:
- ambele colectivităţi generale din care s-au extras eşantioanele sunt normal sau
aproximativ normal distribuite;
- eşantioanele aleatoare sunt selectate independent unul de celălalt.
3
x x x x
n1 n2
2 2
i 1 i 2
sc2 i 1 i 1
n1 n2 2
sau
sc2
n1 1s x21 n2 1s x22
n1 1s x21 n2 1s x22
n1 1 n2 1 n1 n2 2
Aşadar, dispersia combinată sc2 este media aritmetică ponderată a dispersiilor celor două
Testul statistic:
t
x 1
x2 D
x 1
x2 D
n1n2 n1 n2 2
1 1 s n1 1 s
2 2
n2 1 n1 n2
sc2 x1 x2
n1 n2
Testul statistic:
t
( x1 x2 ) D , cu gradele de libertate s2
1
/n1 s22 /n2
2
.
s12 s 22 (s12 /n1 )2 (s 22 /n2 )2
n1 n2 n1 1 n2 1
Ipotezele statistice:
- pentru test bilateral
H0: μ1 = μ2 (μ1- μ2 = D)
H1: μ1 ≠ μ2 (μ1- μ2 ≠ D)
- pentru test unilateral dreapta
H0: μ1 = μ2 (μ1- μ2 = D)
H1: μ1 > μ2 (μ1- μ2 > D)
4
- pentru test unilateral stânga
H0: μ1 = μ2 (μ1- μ2 = D)
H1: μ1 < μ2 (μ1- μ2 < D)
unde D reprezintă diferenţa ipotetică dintre mediile populaţiilor, deseori egală cu 0.
Exemplu
Presupunem că dorim să testăm ipoteza conform căreia între două mărci de autoturisme
nu există diferenţe semni-ficative privind cheltuielile de funcţionare. Pentru aceasta 20 de
posesori de autoturisme (8 posesori ai primei mărci şi 12 po-sesori ai celei de-a doua) sunt
rugaţi să ţină, cu acurateţe, evidenţa cheltuielilor de funcţionare pe o perioadă de un an de
zile. Pentru α=0,1 (probabilitate de garantare a rezultatelor (1-α)100 = 90%) să se testeze
această ipoteză, dacă rezultatele prelucrării datelor în eşantioane sunt:
Marca 1 Marca 2
n1=8 n2=12
x 1 5,696 mil. lei x 2 5,273 mil. lei
sx1=0,485 mil. lei sx2=0,635 mil. lei
s c2
8 10,4852 12 10,6352 0,3379
8 12 2
5
Testul statistic este:
t
5,696 5,273 0 0,423
1,5943
1 1 0,2653
0,3379
8 12
Cum tα/2,n1+n2-2= t0,05;18 = 1,734, se observă că t < tα/2,n1+n2-2, aşadar nu ne aflăm în regiunea
critică.
Test de autoevaluare 1
x x
2
Linia Nr. săptămâni i i x
A 12 129 69,52
B 12 111 42,35
6
4. Testarea ipotezei privind dispersia unei populaţii
Se știe că:
- suma pătratelor diferenţelor ( x i x )2 (care este, de fapt, egală cu n s 2 sau (n 1) s 2
pentru eşantioane mici), împărţită la dispersia colectivităţii generale, are o distribuţie hi-pătrat
( 2 ) (dacă populaţia eşantionată este normal distribuită)
- trebuie precizat că valoarea lui χ 2 pentru care aria de sub curbă (situată la dreapta ei)
care aria din stânga este α, deoarece statistica este întotdeauna mai mare decât zero. Dar
2
2 reprezintă punctul pentru care aria de sub curbă situată la stânga lui este α.
1
Exemplu
χ2 16,92 şi χ2 3,33.
0,05;9 0,95;9
(n 1) s 2
2
2
care are o distribuţie 2 cu (n-1) grade de libertate, când populaţia eşantionată este normal
distribuită, cu dispersia 2 .
Ipotezele statistice:
- pentru test bilateral
H 0 : 2 02
H 0 : 2 02
7
H 0 : 2 02
H 0 : 2 02
H 0 : 2 02
Exemplu
Pentru următoarele date privind cererea unui produs (selectate dintr-o colectivitate
normal distribuită), să se testeze (pentru o probabilitate de 95%), ipotezele:
H 0 : 2 100 ,
H 1 : 2 100 .
Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
În eşantion: s 13,85 , s 2 191,8 .
s2
(x i
x)2
1726
191,8 .
n 1 9
şi ,n1 vom respinge ipoteza nulă şi vom accepta ipoteza alternativă, 2 100 .
2 2
8
Test de autoevaluare 2
1. Abaterea medie pătratică a înălţimii fetelor dintr-o clasă de boboci (clasa a 9-a) ai unui
liceu este de 6,9 centimetri. Este vreun motiv să credem că a avut loc o schimbare în variaţia
înălţimii fetelor dacă a fost selectat un eşantion aleator de 30 de fete din clasa a 9-a a liceului
şi s-a obţinut o dispersie de 49 cm2. Se presupune un nivel de semnificaţie de 0,02.
Am văzut că testarea ipotezei privind dispersia poate fi utilizată pentru a trage concluzii
privitoare la consistenţa unor procese economice ori privitoare la riscurile asociate. În acest
subcapitol vom compara două dispersii, ceea ce ne va permite să comparăm consistenţa a
două procese sau riscurile a două portofolii de investiţii etc.
Statisticienii testează, adesea, egalitatea dintre două dispersii înainte de a decide ce
procedeu să folosească în verificarea ipotezei privind diferenţa dintre două medii.
Vom compara dispersiile a două populaţii, determinând raportul dintre ele. În consecinţă,
parametrul ce ne interesează este 12 / 22 . Dacă dispersia eşantionului este (aşa cum am văzut)
un estimator nedeplasat şi consistent al dispersiei colectivităţii generale, să notăm că raportul
s 12 / s 22 este estimator punctual al raportului de dispersii 12 / 22 .
Distribuţia de eşantionare a raportului s12 / s 22 este o distribuţie F, dacă eşantioanele au fost
extrase independent din populaţii normal distribuite.
Se cunoaşte că raportul dintre două variabile hi-pătrat independente împărţite la gradele lor
de libertate are o distribuţie Fisher (distribuţie F). Gradele de libertate ale distribuţiei F sunt
identice cu gradele de libertate ale celor două distribuţii hi-pătrat. Atunci:
Valoarea lui F pentru care aria de sub curbă (situată la dreapta ei) este α, se notează Fα (cu
gradele de libertate gl1 şi gl2, unde gl1 = n1 –1 şi gl2 = n2 –1).
9
Ipotezele statistice:
- pentru test bilateral
H 0 : 12 / 22 1
H 0 : 12 / 22 1
- pentru test unilateral dreapta
H 0 : 12 / 22 1
H 0 : 12 / 22 1
- pentru test unilateral stânga
H 0 : 12 / 22 1
H 0 : 12 / 22 1
Testul statistic:
s12
F 2
s2
Exemplu
Un analist doreşte să compare împrăştierea veniturilor pe familie, pentru colectivitatea
turiştilor ce preferă turismul litoral, cu împrăştierea veniturilor, pentru colectivitatea turiştilor ce
preferă turismul balnear. Presupunând că distribuţiile veniturilor (mil. lei), în cele două
colectivităţi sunt aproximativ normale au fost selectate două eşantioane, de volum 60 şi 50 de
persoane, iar abaterile medii pătratice (mil. lei) sunt: s1 2,84 şi s2 1,86 . Se utilizează o
probabilitate de garantare a rezultatelor de 95%.
10
Ipotezele statistice sunt:
H 0 : 12 / 22 1 ,
H 1 : 12 / 22 1 .
Cum F F0.05;59; 49 ipoteza nulă se respinge (aceea că raportul dintre dispersii este 1) şi se
acceptă ipoteza alternativă. Acest lucru înseamnă că se acceptă ipoteza conform căreia
împrăştierea veniturilor pentru turiştii din zona litorală este semnificativ mai mare decât cea a
turiştilor din zona balneară.
În general, dacă la numărător se trece dispersia cea mai mare testul F este un test
unilateral dreapta.
6. Exersați în EXCEL
Un specialist afirmă că persoanele care mănâncă cereale la micul dejun vor consuma la masa de prânz,
în medie, mai puţine calorii ca aceia care nu mănâncă cereale la micul dejun. Pentru a testa această
afirmaţie, au fost selectaţi aleator 30 de persoane şi au fost întrebate ce mănâncă în mod regulat la
micul dejun şi la masa de prânz. Fiecare persoană a fost identificată ca un consumator sau
nonconsumator de cereale la micul dejun şi fiecărei persoane i-au fost calculate numărul de calorii
consumate la masa de prânz.
Rezultatele obţinute sunt următoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529, 632, 951, 744, 632, 593, 847
(calorii)
Se poate spune cu un nivel de semnificaţie de 5% că specialistul are dreptate?
Identificarea metodei:
Specialistul trebuie să compare media consumului de calorii pentru populaţia consumatorilor de
cereale cu cea a nonconsumatorilor de cereale. Datele sunt cantitative.
11
Ipoteza care trebuie testată este: H0: μ1= μ2 cu alternativa H1: μ1< μ2, deoarece trebuie observat
dacă numărul mediu al caloriilor consumate de consumatorii de cereale la masa de prânz este mai mic
decât al neconsumatorilor de cereale.
I. Pentru a putea identifica testul ce trebuie aplicat se va testa dacă dispersiile (variaţiile) celor două
populaţii sunt egale folosind testul F.
Ipotezele sunt:
H0: σ12/σ22=1 cu alternativa H1: σ12/σ22≠1
Expresia testului este:
F= s12/s22
Instrucțiuni în EXCEL:
1. Introduceţi datele pe două coloane. În A1 se scrie „Consumatori“ iar în B1 „Nonconsumatori“.
2. Apăsaţi Tools/Data Analysis şi apoi F-Test Two-Sample for Variances
3. Specificaţi variabila 1: A1:A26
4. Specificaţi variabila 2: B1:B26
5. Apăsaţi Labels şi apoi OK.
Se obţin rezultatele:
F-Test Two-Sample for Variances
Consumatori Nonconsumatori
Mean 595.8 661.1
Variance 1273.51 13375.25
Observations 10 20
df 9 19
F 0.0952
P(F<=f) one-tail 0.00053
F Critical one-tail 0.3392
Excel calculează statistica F ca raportul între dispersia cea mai mare şi dispersia cea mai mică.
Statistica F în cazul nostru este 0,095 iar valoarea p asociată testului unilateral este 0,00053. Valoarea
p corespunzătoare testului bilateral (pragul de semnificaţie) este 2 × 0,00053 = 0,00106. Deoarece
această valoare este foarte apropiată de zero, ipoteza nulă se respinge, deci cele două dispersii diferă
semnificativ.
II. Deoarece sunt complet diferite va fi aplicat testul t pentru variaţii inegale.
Instrucțiuni în EXCEL:
1. Introduceţi datele pe două coloane. În A1 se scrie „Consumatori“ iar în B1 „Nonconsumatori“.
12
2. Apăsaţi Tools/Data Analysis şi apoi t-Test: Two-Sample Assuming Unequal Variances
3. Specificaţi variabila 1: A1:A11
4. Specificaţi variabila 2: B1:B21
5. Specificaţi Hypothesized Mean Difference: 0, apăsaţi Labels. Apăsaţi OK
Se obţin rezultatele:
t-Test: Two-Sample Assuming Unequal Variances
Variable 1 Variable 2
Mean 595.8 661.1
Variance 1273.511 13375.25
Observations 10 20
Hypothesized Mean Difference 0
Df 25
t Stat -2.31433
P(T<=t) one-tail 0.014576
t Critical one-tail 1.70814
P(T<=t) two-tail 0.029153
t Critical two-tail 2.059537
Test de autoevaluare 1
1. Ipotezele statistice sunt:
H0: μ1 = μ2 (μ1- μ2 = 0),
H1: μ1 > μ2 (μ1- μ2 > 0)
13
Testul ce se va aplicate este testul pentru diferența dintre două medii pentru eșantioane de
volum redus (deoarece n=12).
Caz 1: Dispersiile sunt egale
t
x 1
x2 D
129 / 12 11 / 12
11,66
12,67
1 1 5,0851 / 12 1 / 12 0,92
s c2
n1 n 2
Cum tα/2,n1+n2-2= t0,05;20 = 1,725, se observă că t > tα/2,n1+n2-2, aşadar ne aflăm în regiunea
critică.
t
x 1
x2 D
129 / 12 11 / 12
11,66
12,67
s12 s 22 69,52 42,35 0.92
n1 n 2 12 * 11 12 * 11
12 *11 12 *11
0,72
21
(s /n1 )2
(s /n 2 ) 2 2 2
69,52
2
42,35
2
0,025 0,009
1
2
n1 1 n2 1 12 *11 12 *11
11 11
Cum tα/2,GL= t0,05;21 = 1,72, se observă că t > tα/2,GL, aşadar ne aflăm în regiunea critică.
14
Test de autoevaluare 2
1. Ipotezele: H 0 : 2 47,61 ,
H 1 : 2 47,61.
În eşantion: s 2 49 , n=30 .
Testul statistic este:
(n 1) s 2 29 49
2 29,84 .
2
47,61
şi 2 2,n1 vom accepta ipoteza nulăm deci nu există suficiente dovezi pentru a afirma
9. Lucrare de verificare 4
1. Cum se testează ipoteza privind diferenţa dintre mediile a două colectivităţi generale, în
cazul eşantioanelor de volum redus?
2. O companie producatoare de hrana pentru bebeluşi susţine că noul său produs este superior
faţă de cel al principalului său concurent, prin aceea că bebeluşii care consumă acest produs
câştigă mai repede şi mai mult în greutate. Pentru a verifica aceasta afirmaţie, au fost selectaţi
aleator 10 bebeluşi; timp de 2 luni, 5 bebeluşi au fost hrăniţi cu produsul creat de compania
producătoare, iar ceilalţi 5 bebeluşi – cu produsul creat de firma concurentă. Surplusul de
greutate (zeci grame) câştigat de bebeluşi în urma consumării celor două produse a fost:
Produsul companiei 85 102 79 105 113
Produsul concurentului 91 68 85 82 76
Putem concluziona, cu o probabilitate de 95%, că bebeluşii hrăniţi cu produsul companiei au
luat mai mult în greutate decât cei hraniţi cu produsul concurentului? (tcritic= 2,306)
15
3. Managerul unei fabrici crede că productivitatea muncitorilor depinde, printre alți factori, de
design-ul jobului, adică de succesiunea operațiilor necesare pentru realizarea unui produs.
Sunt luate în considerare două design-uri pentru realizarea unui produs. Într-un experiment
sunt implicați 6 muncitori ce folosesc design-ul A și 8 muncitori ce utilizează design-ul B,
înregistrându-se timpii de asamblare necesari fiecarui muncitor pentru a realiza produsul (xi).
Rezultatele prelucrărilor se prezintă astfel (primul tabel):
Design A Design B
x x
2 2
Sum of squares i x 27,76 Sum of squares i x 12,7
Count 6 Count 8
Design A Design B
Mean …. …..
Variance …… …..
Observations ….. …..
Pooled Variance ….
a) Putem
Hypothesized Mean Difference 0
concluziona
df …..
cu un nivel
t Stat ……
de
P(T<=t) one-tail 0,06631
semnificati
t Critical one-tail 1,782288
e de 5% ca
P(T<=t) two-tail 0,13262
timpul
t Critical two-tail …
mediu de
asamblare pentru design-ul A este mai mic decat cel pentru design-ul B?
b) Daca rezultatele rularii testului in Excel sunt cele prezentate in al doilea tabel, determinati
informatiile lipsa si interpretati toate valorile din acest tabel.
16