Documente Academic
Documente Profesional
Documente Cultură
Testarea ipotezelor
Primul pas în testarea ipotezelor este de a formula ipotezele care trebuie testate.
Acest lucru trebuie să se facă înainte de a estima ecuația, deoarece ipotezele dezvoltate după
estimare riscă să fie mai degrabă justificări ale unor rezultate particulare decât teste de
validitate a acestor rezultate. Ipoteza nulă reprezintă, de obicei, o afirmație privind valorile
pe care economistul nu le așteaptă pentru coeficientul testat. Notația folosită pentru a
specifica ipoteza nulă este „H0 :” urmată de o enunțare a intervalului de valori ale
coeficientului, în care acesta este de așteptat să nu se situeze. De exemplu, dacă se așteaptă
ca un coeficient să fie pozitiv, atunci înseamnă că este de așteptat ca acel coeficient să nu fie
zero sau negativ, iar ipoteza nulă se scrie în felul următor:
Ipoteza alternativă este de obicei o afirmație privind valorile pe care coeficientul este
de așteptat să le ia. Notația folosită pentru a specifica ipoteza alternativă este „HA :” urmată
5. Testarea ipotezelor 2
La fel, când valorile așteptate pentru β sunt negative, ipotezele nulă și alternativă se scriu în
felul următor:
H0 : 𝛽 ≥ 0
HA : 𝛽 < 0
Există câteva cazuri rare în care este încălcată regula conform căreia valorile
așteptate ale coeficientului se includ în ipoteza alternativă. Se întâmplă acest lucru deoarece
testarea ipotezelor presupune ca ipoteza nulă să conțină semnul egal într-o anumită formă
(fie că este =, ≤ sau ≥). Această cerință îi obligă pe economiști să pună valoarea pe care o
așteaptă în ipoteza nulă dacă așteptarea lor include un semn egal. Acest lucru se întâmplă de
obicei atunci când economistul specifică o anumită valoare, mai degrabă decât un interval,
pentru un coeficient. Din fericire, astfel de excepții sunt neobișnuite în aplicațiile curente.
Cu excepția cazurilor menționate mai sus, economiștii pun întotdeauna ceea ce
așteaptă în ipoteza alternativă. Acest lucru le permite efectuarea unor afirmații destul de
puternice atunci când se respinge o ipoteză nulă. Cu toate acestea, niciodată nu se poate
spune că se acceptă ipoteza nulă. Afirmațiile făcute prin testarea ipotezelor pot fi
următoarele:
- se respinge ipoteza nulă, H0 ; implicit, se acceptă ipoteza alternativă, HA ;
- nu se poate respinge ipoteza nulă, H0 ;
În justiție, de exemplu, prezumția de „nevinovat până la dovedirea vinovăției”
presupune formularea ipotezelor în felul următor:
O instanță nu poate stabili că pârâtul este nevinovat, ci doar, pe baza probelor administrate,
decide că nu poate respinge prezumția de nevinovăție. Aceasta deoarece, este de datoria
acuzării de a aduce probele care să dovedească că inculpatul este vinovat, probe pe baza
cărora instanța decide respingerea ipotezei nule și declară inculpatul vinovat. Dacă acuzarea
5. Testarea ipotezelor 3
nu poate aduce probe concludente, instanța nu poate decât să constate că, pe baza lor, nu
poate exclude prezumția de nevinovăție, chiar dacă, în fapt, inculpatul este vinovat de
comiterea faptelor incriminate.
Testarea unei ipoteze privind semnul unui coeficient de regresie sau privind o valoare
a sa, cu excepția termenului liber, reprezintă o preocupare curentă în Econometrie. Deoarece
valorile estimate ale coeficienților de regresie se obțin pe baza unui eșantion de date, nu
pentru întreaga populației, concluziile analizei de regresie pe baza acestor estimări nu sunt
întotdeauna corecte. Astfel, unele ipoteze pot fi adevărate, altele pot fi false. În testarea
ipotezelor pot apărea două tipuri de erori:
- respingerea ipotezei nule, H0 , care, în fapt, este adevărată - erori de tipul I;
- nerespingerea ipotezei nule, H0 , care, în fapt, este falsă - erori de tipul II.
Erorile de tipul I și de tipul II pot apărea deoarece, pe baza unor eșantioane de date
particulare, se pot obține valori atipice ale parametrilor. Fie următoarele ipoteze cu privire
la coeficientul 𝛽:
H0: β ≤ 0
HA: β > 0
inculpați nevinovați este mai pregnantă, cu atât mulți inculpați vinovați vor scăpa
nepedepsiți.
O regulă de decizie este o procedură prin care se decide dacă ipoteza nulă se respinge
sau nu se poate respinge. De obicei, o regulă de decizie implică compararea unei statistici
determinate pe baza unui eșantion cu o valoare critică preselectată, ce poate fi găsită în
tabelele statistice. O regulă de decizie trebuie formulată înainte de obținerea valorilor
estimate ale parametrilor. Gama de valori posibile ale lui 𝛽̂ este împărțită în două regiuni, o
regiune de „acceptare” și o regiune de respingere, unde termenii sunt exprimați în raport cu
ipoteza nulă. Pentru a defini aceste regiuni, trebuie determinată o valoare critică (sau, pentru
un test bilateral, două valori critice) ale lui 𝛽̂ . Astfel, o valoare critică este o valoare care
separă regiunea „de acceptare” de regiunea de respingere la testarea ipotezei nule. Graficele
acestor regiuni de „acceptare” și regiunii de respingere sunt prezentate în figurile 1 și 2.
De exemplu, când valoarea critică este egală cu 1.8, iar 𝛽̂ calculat este mai mare decât
această valoare critică, se poate respinge ipoteza nulă H0 : 𝛽 ≤ 0. Acest lucru este ilustrat în
figura 1. Orice 𝛽̂ mai mare decât 1.8 este situat în regiunea de respingere, în timp ce orice 𝛽̂
mai mic decât 1.8 este situat în regiunea „de acceptare”.
Distribuția de eșantionare, 𝛽̂
Probabilitatea erorii
de tipul I
𝛽̂
0 1.8
Regiune de
Regiune de "acceptare" respingere
Distribuția de eșantionare, 𝛽̂
Probabilitatea erorii
de tipul I
𝛽̂
0
Regiune de Regiune de
Regiune de "acceptare"
respingere respingere
Figura 2. Regiunile de “acceptare” și de respingere pentru un test bilateral asupra lui β
Pentru un test bilateral H0 : 𝛽 = 0 , HA : 𝛽 ≠ 0, se divide distribuția lui 𝛽̂ într-o regiune de “acceptare” și două
regiuni de respingere
Regiunea de respingere măsoară probabilitatea unei erori de tipul I, când ipoteza nulă
este adevărată. Pentru a evita o astfel de eroare, regiunea de respingere poate fi făcută cât
mai mică. Scăderea șansei unei erori de tipul I - respingerea ipotezei nule adevărată,
înseamnă creșterea șansei unei erori de tipul II - nerespingerea unei ipoteze nule falsă. Când
regiunea de respingere este atât de mică încât aproape niciodată nu se respinge o ipoteză
nulă adevărată, atunci nu se va putea respinge nici atunci când aceasta este falsă. Ca urmare,
probabilitatea unei erori de tipul II va crește.
Având în vedere acest lucru, cum se alege între erorile de tipul I și cele de tipul II?
Răspunsul este ușor de dat dacă se cunoaște costul, pentru societate sau pentru factorul de
decizie, al fiecărui tip de eroare. Dacă costul unui tip de eroare este mult mai mare decât
costul celuilalt tip, atunci, evident, se va urmări diminuarea riscului producerii tipului de
eroare mai costisitor.
Testul 𝒕 (Student)
când termenul de eroare stocastică este distribuit normal și când varianța acestei distribuții
rămâne constantă. Întrucât acesta este cazul care se întâlnește de obicei, utilizarea testului
𝑡 pentru testarea ipotezelor individuale a devenit o practică standard în econometrie.
Pentru o ecuație de regresie multiplă tipică:
se pot calcula rații (statistici) 𝑡 pentru fiecare dintre coeficienții estimați în ecuație. În
general, testele 𝑡 sunt efectuate numai pentru coeficienții pantă. Pentru un coeficient pantă,
relația de calcul a rației (scorului) 𝑡 este următoarea:
(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
(𝛽̂𝑗 − 0)
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
𝛽̂𝑗
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
Altfel spus, rația Student a unui coeficient este egală cu estimatorul coeficientului
respectiv împărțit la eroarea sa standard. Aceasta este formula de calcul a scorului sau
rației 𝑡 utilizată de majoritatea programelor software specializate. Pentru a ușura
înțelegerea acestui calcul, rezultatele regresiei sunt prezentate într-o formă standard. De
exemplu, pentru regresia Woody, rezultatele obținute sunt:
Numerele din parantezele de sub coeficienții de regresie estimați sunt abaterile sau
erorile standard estimate ale coeficienților, iar numerele de sub ele sunt valorile rațiilor sau
scorurilor 𝑡, calculate prin divizarea valorilor estimate ale coeficienților la abaterile lor
standard. Acest format de prezentare a rezultatelor regresiei este folosit pentru
documentarea proiectului. Pe cât posibil, el va fi folosit de fiecare dată. Se observă că semnul
rațiilor 𝑡 este întotdeauna același cu cel al coeficienților de regresie estimați, iar eroarea
standard este întotdeauna pozitivă. De exemplu, rația 𝑡 pentru variabila 𝑃 se calculează în
felul următor:
𝛽̂𝑝 0.3547
𝑡𝑝 = = = 4.88
𝑆𝐸(𝛽̂𝑝 ) 0.727
Cu cât valoarea absolută a lui 𝑡 este mai mare, cu atât este mai mare probabilitatea ca
parametrul de regresie estimat să fie semnificativ diferit de zero.
Pentru a decide pe baza unui scor 𝑡 calculat că o ipoteză nulă se respinge sau nu, este
necesară o valoare de referință numită valoare critică, 𝑡𝑐 .
5. Testarea ipotezelor 8
Distribuția estimatorilor, 𝛽̂
𝑡𝑐
𝛽̂
0
Regiune de
Regiune de "acceptare" respingere
𝐻0 : 𝛽 ≥ 0 respectiv 𝐻0 : 𝛽 ≤ 0
𝐻𝐴 : 𝛽 < 0 𝐻𝐴 : 𝛽 > 0
𝐻0 : 𝛽 = 0
𝐻𝐴 : 𝛽 ≠ 0
De asemenea, testul se aplică pentru teste unilaterale bazate pe valori, altele decât zero:
H0 : 𝛽 ≥ 𝑆 respectiv H0 : 𝛽 ≤ 𝑆
HA : 𝛽 < 𝑆 HA : 𝛽 > 𝑆
H0 : 𝛽 = 𝑆
HA : 𝛽 ≠ 𝑆
Regula de decizie este aceeași: se respinge ipoteza nulă dacă valoarea calculată a lui
𝑡 este mai mare în valoare absolută decât valoarea critică, atât timp cât semnul valorii
calculate pentru 𝑡 este același ca semnul coeficientului implicat în HA . În caz contrar, ipoteza
H0 nu se poate respinge. Tabelul statistic 𝑡 conține valorile critice 𝑡𝑐 , pentru diferite grade
de libertate și niveluri de semnificație. Coloanele indică nivelurile de semnificație în funcție
de tipul testului: unilateral sau bilateral, iar liniile indică gradele de libertate.
Pentru exemplificarea utilizare acestui tabel și a regulii de decizie, se reia exemplul
Woody. Valoarea lui 𝑡 pentru 𝛽̂𝑃 calculată mai sus este egală cu 4.88. Cum ipoteza conform
căreia coeficientul lui P este pozitiv s-a stabilit deja, ipotezele de testat au următoarea formă:
H0 : 𝛽𝑃 ≤ 0
HA : 𝛽𝑃 > 0
Numărul gradelor de libertate pentru această regresie este egal cu 29, egal cu 𝑛 − 𝑘 − 1,
adică 33 - 3 - 1, deci valoarea cu care se compară valoarea calculată a lui 𝑡 este o valoare 𝑡
critică unică, pentru 29 de grade de libertate. Pentru a găsi această valoare, se alege un nivel
de semnificație. Cel mai adesea, nivelul de semnificație se alege 5% . Se caută în tabelul cu
valorile critice ale lui 𝑡. În Tabelul 1, se poate observa că valoarea critică a lui 𝑡, pentru 29
grade de libertate și pentru un prag de semnificație de 5% este egală cu 1.699. Deoarece
semnul implicat de HA este pozitiv, regula de decizie pentru acest caz specific devine:
α = 5% test
Aria = 0.05 unilateral
𝛽̂
−1.669 0 1.699
α = 10% test bilateral
Cum 𝑡𝑃 = +4.88 > 1.699, se poate trage concluzia că variabila 𝑃 tinde într-adevăr să fie
corelată pozitiv cu volumul vânzărilor Woody, păstrând celelalte variabile din ecuație
constante.
Valoarea critică 𝑡 pentru un test unilateral, la un nivel de semnificație dat, este exact
egală cu valoarea critică 𝑡 pentru un test bilateral, la un nivel de semnificație de două ori mai
mare. Această relație între testele unilaterale și bilaterale este ilustrată în Tabelul 1. Astfel,
de exemplu, valoarea critică 𝑡𝑐 = 1.699 pentru un test unilateral, la un nivel de semnificație
de 5%, este egală cu valoarea critică pentru un test bilateral, la un nivel de semnificație de
10%. Acest lucru este ilustrat în Figura 4.
În Tabelul 1, valorile critice pentru testul unilateral, pentru un anumit nivel de
semnificație, și valorile critice, pentru testul bilateral, pentru un nivel de semnificație dublu,
sunt puse pe aceeași coloană.
Pentru a completa exemplul dat, a fost necesară alegerea unui nivel de semnificație
înainte ca o valoare critică a lui 𝑡 să fie căutată în tabelul 𝑡-statistic. Cuvintele „semnificativ
pozitiv” poartă, de obicei, interpretarea statistică conform căreia H0 : 𝛽 ≤ 0 a fost respinsă
în favoarea HA : 𝛽 > 0, în conformitate cu regula de decizie prestabilită, pentru un nivel de
semnificație dat. Nivelul de semnificație indică probabilitatea de a observa o valoare
𝑡 estimată mai mare decât valoarea 𝑡 critică, dacă ipoteza nulă ar fi corectă.
5. Testarea ipotezelor 11
p-Values
Există o alternativă la testul clasic 𝑡, pe baza unei măsuri numite p-value sau nivelul
de semnificație marginal. O valoare p-value pentru un scor 𝑡 reprezintă probabilitatea de a
observa un scor 𝑡 de această mărime sau mai mare (în valoare absolută), dacă ipoteza nulă
ar fi adevărată. Grafic, este de două ori zona aflată sub curba distribuției 𝑡, între valoarea
absolută a rației (scorului) 𝑡 și infinit. O valoare p-value este o probabilitate, de aceea ia
5. Testarea ipotezelor 13
valori de la 0 la 1. P-value arată cel mai mic nivel de semnificație la care se poate respinge
ipoteza nulă (presupunând că estimarea corespunde așteptării incluse în HA ). O valoare mică
a lui p-value pune un semn de întrebare asupra ipotezei nule. Altfel spus, pentru a respinge
o ipoteză nulă, valoarea p-value trebuie să fie cât mai mică.
Cum se calculează un p-value? O opțiune ar fi scotocirea prin pagini și pagini a
tabelelor statistice, în căutarea nivelului de semnificație care să corespundă exact
rezultatului regresiei. Asta ar putea dura zile! Din fericire, pachetele software de regresie
standard calculează automat p-values și le imprimă pentru fiecare coeficient estimat. Astfel,
p-values se pot citi în rezultatele regresie la fel ca valorile estimate ale coeficienților. Cu toate
acestea trebuie procedat cu mare atenție, deoarece pachetele de regresie afișează p-values
pentru ipoteze alternative bilaterale. Ca urmare, p-values includ zonele din ambele „cozi”
ale distribuției, astfel încât p-values bilaterale sunt de două ori mai mari decât cele
unilaterale. Dacă testul efectuat este unilateral, valorile p-value din rezultatele regresiei
trebuie împărțite la 2 înainte de efectuarea oricărui test. Cum se folosește un p-value pentru
a efectua testul 𝑡? Dacă nivelul de semnificație ales este de 5% și p-value este mai mic de
0.05, atunci ipoteza nulă se poate respinge, atât timp cât semnul este în direcția așteptată
(implicat în HA ). Astfel, regula de decizie pe baza lui p-value este: se respinge H0 dacă p-
value < nivelul de semnificație și dacă 𝛽̂𝑘 are semnul implicat de HA . În caz contrar, H0 nu se
poate respinge.
De exemplu, în modelul Woody, utilizarea mărimii p-value pentru a efectua un test 𝑡,
unilateral, pe coeficientul lui 𝐼 (variabila de venit), presupune stabilirea ipotezei nule și a
ipotezei alternative în felul următor:
H0 : 𝛽𝐼 ≤ 0
HA : 𝛽𝐼 > 0
În rezultatele regresiei Woody, prezentate mai sus, p-value pentru 𝛽̂𝐼 este egal cu 0.25.
Aceasta este p-value bilateral. Deoarece testul ales este unilateral, valoarea lui p-value
trebuie împărțită la 2. Se obține 0.25:2 = 0.0125. Această valoare este mai mică decât nivelul
ales de semnificație, de 0.05. Deoarece semnul lui 𝛽̂𝐼 este pozitiv și este cel implicat de HA , se
poate respinge H0 . Rezultatul nu este unul surprinzător, fiind același cu rezultatul obținut
prin efectuarea unui test 𝑡 convențional.
Folosirea valorilor p-values prezintă o serie de avantaje. Sunt ușor de utilizat și
permit celor care citesc rezultatele studiilor să își aleagă propriile niveluri de semnificație în
loc să fie obligați să utilizeze nivelul de semnificație ales de economistul care a făcut
cercetarea inițială. În plus, p-values transmite cititorilor informații despre puterea relativă
cu care se poate respinge o ipoteză nulă. Aceste avantaje îi determină pe mulți economiști să
folosească p-values în mod constant.
În ciuda acestor avantaje, pentru început, efectuarea testului 𝑡 prin utilizarea
valorilor p-values se va folosi mai rar deoarece pregătirea inițială presupune învățarea
5. Testarea ipotezelor 14
Scopul în care se utilizează cel mai adesea un test 𝑡 unilateral este acela de a
determina dacă un coeficient de regresie este semnificativ diferit de zero, în direcția
prevăzută de teorie (sau așteptată). Dacă pentru un coeficient 𝛽, de exemplu, se așteaptă un
semn pozitiv și se obține un 𝛽̂ negativ, este greu să se respingă posibilitatea ca adevăratul β
să fie negativ (sau zero). Pe de altă parte, dacă se așteaptă un semn pozitiv pentru 𝛽 și se
obține un 𝛽̂ pozitiv, lucrurile devin un pic mai complicate. Dacă 𝛽̂ este pozitiv, dar destul de
aproape de zero, atunci trebuie utilizat un test 𝑡 unilateral pentru a determina dacă 𝛽̂ este
suficient de diferit de zero pentru a permite respingerea ipotezei nule. Reamintim că pentru
a se putea controla probabilitatea erorii de tip 1, este necesară formularea unei ipoteze
alternative, HA : 𝛽 > 0 (semnul așteptat) și a unei ipoteze nule, H0 : 𝛽 ≤ 0.
Se vor parcurge, în continuare, câteva exemple complete de utilizare a unui test 𝑡
unilateral. Se consideră un model simplu al vânzărilor anuale agregate de autoturisme noi,
care specifică faptul că vânzările de autoturisme (CARS) sunt o funcție de venitul real mediu
disponibil (YD) și de prețului mediu cu amănuntul al unui autoturism (PRICE), ajustat de
indicele prețurilor de consum (preț real). Se urmărește testarea unei noi ipoteze: vânzările
de autoturisme noi sunt corelate cu vânzările de vehicule utilitare sportive (Sport Utility
Vehicles = SUV-uri), considerându-se că un număr mai mare de SUV-uri vândute înseamnă
un număr mai mic de autoturisme cumpărate de cumpărători. Prin urmare, se construiește
următorul model de regresie (deasupra parametrilor sunt scrise ipotezele privind semnelor
acestora):
+ – –
5. Testarea ipotezelor 15
1. H0 : 𝛽1 ≤ 0 2. H0 : 𝛽2 ≥ 0 3. H0 : 𝛽3 ≥ 0
HA : 𝛽1 > 0 HA : 𝛽2 < 0 HA : 𝛽3 < 0
2. Alegerea nivelului de semnificație și, prin urmare, a unei valori critice 𝑡𝑐 . Se presupune
că s-au luat în considerare diversele costuri implicate de erorile de tip 1 și de tip 2. De
regulă, se alege un nivel de semnificație de 5%. Pentru un număr de 10 observări în setul
de date utilizat pentru a testa aceste ipoteze, numărul gradelor de libertate este: n – k –
1 = 10 – 3 – 1 = 6. La un nivel de semnificație de 5%, valoarea critică a lui 𝑡, notată 𝑡𝑐 ,
poate fi găsită în tabelul 𝑡 statistic. Aceasta este egală cu 1.943. Nivelul de semnificație
nu trebuie să fie, în mod necesar, același pentru toți coeficienții din aceeași ecuația de
regresie. Costurile implicate de o ipoteză nulă respinsă incorect pentru un coeficient pot
fi mult mai mari decât pentru un alt coeficient, astfel încât utilizarea unor niveluri de
semnificație diferite să fie chiar necesară. În această exemplu, pentru toți cei trei
coeficienți, se utilizează același nivel de semnificație, astfel încât, pentru toți:
𝑡𝑐 = 1.943
5. Testarea ipotezelor 16
3. Se efectuează regresia și se obțin valorile calculate sau estimate ale lui 𝑡. Pentru aceasta
se utilizează datele observate (anuale, din 2000 până în 2009). Se rulează regresia cu un
software specializat ( EViews, Stata, …). Se obțin următoarele rezultate OLS:
unde:
𝐶𝐴𝑅𝑆𝑡 = numărul de autoturisme noi (în sute de mii de unități), vândute în anul 𝑡;
𝑌𝐷𝑡 = venitul disponibil mediu real, în România, în mii euro, în anul 𝑡;
𝑃𝑅𝐼𝐶𝐸𝑡 = prețul real al unui autoturism nou, în euro, în anul 𝑡;
𝑆𝑈𝑉𝑡 = numărul de SUVuri (Sport Utility Vehicles), în mii unități, vândute în anul 𝑡;
Pentru documentare, se utilizează forma standard, astfel încât cifrele din paranteze
sunt erorile standard estimate ale estimatorilor parametrilor. Valorile 𝑡 care se utilizează în
testarea ipotezelor sunt calculate conform relației:
𝛽̂𝑗
𝑡𝑗 = (𝑗 = 1,2, … , 𝑘)
𝑆𝐸(𝛽̂𝑗 )
Pentru cele trei ipoteze, având în vedere valoarea critică 𝑡𝑐 relevantă (1.943) și valorile 𝑡
calculate, se obțin următoarele rezultat:
- pentru 𝛽1: Se respinge H0 dacă |2.1| > 1.943 și dacă 2.1 este pozitiv.
Pentru venitul disponibil, 𝑌𝐷, se respinge ipoteza nulă, conform căreia 𝛽1 ≤ 0, din
moment ce 2.1 este într-adevăr mai mare decât 1.943 și este, evident, pozitiv. Rezultatul
(care înseamnă că se acceptă HA : 𝛽1 > 0) corespunde așteptărilor formulate pe baza
teoriei, venituri mai mari determinând creșterea numărului de autoturisme noi vândute.
- pentru 𝛽2: Se respinge H0 dacă |2.8| > 1.943 și dacă 2.8 este negativ.
5. Testarea ipotezelor 17
Distribuția estimatorilor, 𝛽̂
H0 : 𝛽1 ≤ 0
HA : 𝛽1 > 0
Valoarea 𝑡𝛽1
critică, 𝑡 𝑐
𝑡
0 1.943 2.1
Regiune de
Regiune de "acceptare" respingere
Distribuția estimatorilor, 𝛽̂
H0 : 𝛽2 ≥ 0 𝑡𝛽3
HA : 𝛽2 < 0
H0 : 𝛽3 ≥ 0
HA : 𝛽3 < 0
Valoarea
𝑡𝛽2
critică, 𝑡 𝑐
𝑡
−1.943 − 0.1 0 2.8
Regiune de
Regiune de "acceptare"
respingere
Pentru prețul real al autoturismelor, 𝑃𝑅𝐼𝐶𝐸, statistica 𝑡 este mare în valoare absolută
decât 1.943, dar are un semn contrar așteptărilor, deoarece ipoteza alternativă implică
un semn negativ. Deoarece ambele condiții din regula de decizie trebuie îndeplinite, se
trage concluzia că nu se poate respinge ipoteza nulă conform căreia prețurile au un efect
zero sau pozitiv asupra vânzărilor de mașini noi! În ciuda surprizei, variabila 𝑃𝑅𝐼𝐶𝐸 se
va păstra în ecuație, iar impactul său așteptat ar trebui să fie negativ. Se observă că
estimatorul coeficientului variabilei 𝑃𝑅𝐼𝐶𝐸 este destul de mic, 0.00123, dar această
valoare este implicată în calculul lui 𝑡 prin raportarea la eroarea standard a coeficientului
estimat.
5. Testarea ipotezelor 18
- pentru 𝛽3: Se respinge H0 dacă |−0.1| > 1.943 și dacă –0.1 este negativ.
Pentru vânzările de vehicule utilitare sportive, 𝑆𝑈𝑉, coeficientul 𝛽3 nu este statistic
semnificativ diferit de zero, deoarece |−0.1| < 1.943 astfel încât nu se poate respinge
ipoteza nulă conform căreia 𝛽3 ≥ 0, chiar dacă coeficientul estimat are semnul implicat
de ipoteza alternativă. După o reevaluare a acestui model, se va putea trage concluzia că
adăugarea variabilei 𝑆𝑈𝑉 nu a fost oportună.
Figura 5 ilustrează toate cele trei rezultate prin reprezentarea valorilor critice 𝑡𝑐 și a
valorilor 𝑡 calculate, pentru toate cele trei ipoteze nule pentru o distribuție 𝑡 care este
centrată în jurul valorii zero (valoarea din ipoteza nulă cea mai apropiată de granița dintre
regiunile de “acceptare” și de respingere).
Se pot analiza rezultatele testelor unilaterale pentru toți coeficienții estimați. Se pot face
și alte încercări, utilizând un număr diferit de observări și diferite niveluri de semnificație.
Este util, ca exercițiu, de a analiza toate aspectele privind testul 𝑡 unilateral de semnificație
individuală. În testele săptămânale se vor regăsi întrebări referitoare la aceste aspecte.
Deși majoritatea ipotezelor din analiza de regresie ar trebui să fie testate prin teste
unilaterale, testele bilaterale sunt adecvate în anumite situații. Economiștii se confruntă
uneori cu ipoteze care ar trebui respinse dacă coeficienții estimați sunt diferiți semnificativ
de zero sau de o valoare diferită de zero, în ambele direcții. Această situație necesită un test
𝑡 bilateral. Situațiile în care este necesară efectuarea unui test bilateral se încadrează în două
categorii:
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de zero;
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de o valoare, alta
decât zero.
În continuare se vor analiza cu atenție aceste două categorii.
Prima situație care necesită un test bilateral al pentru un coeficient apare atunci când
există două sau mai multe ipoteze contradictorii cu privire la semnul preconizat al
coeficientului respectiv. De exemplu, în ecuația restaurantului Woody, impactul venitului
mediu al unei zone asupra numărului preconizat de clienți Woody din acea zonă este
ambiguu. Un restaurant Woody situat într-un cartier cu un nivel ridicat al veniturilor
locuitorilor săi ar putea avea mulți clienți la cină, dar, la fel de bine, acești clienți ar putea
decide să mănânce la un restaurant mai formal decât Woody.
5. Testarea ipotezelor 19
𝐻0 : 𝛽𝐼 = 0 Regiune de
𝐻𝐴 : 𝛽𝐼 ≠ 0 "acceptare"
𝑡𝛽𝐼
Regiune de
Regiune de
respingere
respingere
𝑡
−2.045 0 + 2.045 2.37
Ca urmare, este nevoie de efectuarea unui test 𝑡 bilateral în jurul valorii zero pentru a
determina dacă coeficientul estimat al venitului este semnificativ diferit de zero în ambele
direcții. Cu alte cuvinte, întrucât există motive rezonabile de a aștepta fie un coeficient
pozitiv, fie unul negativ, este necesar să se testeze coeficientul variabilei I, 𝛽𝐼 , cu un
test 𝑡 bilateral:
H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0
Un test bilateral implică, așa cum se poate observa în Figura 6, două regiuni diferite
de respingere (una pozitivă și una negativă) care înconjoară regiunea de “acceptare”.
Valoarea critică, 𝑡𝑐 , trebuie să fie mai mare în cazul testului bilateral pentru a obține același
nivel de semnificație ca în cazul unui test unilateral. Drept urmare, există un avantaj la
testarea ipotezelor cu un test unilateral, dacă teoria de bază permite acest lucru, deoarece,
pentru aceleași valori ale lui 𝑡, probabilitatea erorii de tip 1 este la jumătate față de un test
bilateral. Cu toate acestea, în cazurile în care există argumente teoretice puternice,
economistul nu are nicio alternativă la utilizarea unui test 𝑡 bilateral în jurul valorii zero. Cei
patru pași ai testului 𝑡 bilateral, pe exemplul Woody, sunt următorii:
H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0
5. Testarea ipotezelor 20
b. Alegerea nivelului de semnificație și, prin urmare, a valorii critice, 𝑡𝑐 . Se păstrează nivelul
de semnificație la 5%, dar acum această sumă trebuie distribuită între două regiuni de
respingere, pentru 29 de grade de libertate. Prin urmare, valoarea critică corectă este
𝑡𝑐 = 2.045, extrasă din tabelul statistic t pentru 29 de grade de libertate și un test
bilateral cu nivelul de semnificație de 5%. Din punct de vedere tehnic, există acum două
valori critice, +2.045 și -2.045.
c. Se execută regresia și se obține o valoare 𝑡 calculată, a lui 𝛽̂𝐼 . Deoarece valoarea implicată
de ipoteza nulă este zero, valoarea 𝑡 calculată este egală cu +2.37 = 1.288 : 0.5432.
În acest caz, ipoteza nulă, conform căreia 𝛽𝐼 este egal cu zero, se respinge, deoarece 2,37 este
mai mare decât 2.045. Se reține că semnul pozitiv pentru 𝑡𝛽𝐼 implică, cel puțin pentru
restaurantele Woody, faptul că venitul disponibil reprezintă un factor de creștere a
numărului clienților, considerând populația și concurența ca fiind constante. Având în
vedere acest rezultat, se poate alege efectuarea unui test unilateral pe setul de date Woody
al anului viitor.
2. Test bilateral dacă un 𝛽̂ este semnificativ diferit de o valoare dată, alta decât zero
Al doilea caz de test 𝑡 bilateral apare atunci când există un motiv pentru a se aștepta
o valoare diferită de zero pentru un coeficient estimat. De exemplu, dacă un cercetător
anterior a afirmat că adevărata valoare a unui anumit coeficient este aproape sigur egală cu
un anumit număr, 𝛽H0 , atunci acest număr va fi cel luat în considerate într-un test 𝑡 bilateral.
În acest caz, ipotezele nulă și alternativă devin:
H0 : 𝛽𝑘 = 𝛽H0
HA : 𝛽𝑘 ≠ 𝛽H0
unde 𝛽H0 este, prin ipoteză, o valoare diferită de zero. Ca urmare, formula cu care se
calculează scorul 𝑡 pentru un coeficient este:
5. Testarea ipotezelor 21
(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
Această statistică 𝑡 este încă distribuită în jurul valorii zero dacă ipoteza nulă este corectă,
deoarece se scade 𝛽H0 din coeficientul de regresie estimat, a cărui valoare așteptată este
presupusă a fi 𝛽H0 atunci când H0 este adevărată. Deoarece statistica 𝑡 este încă centrată în
jurul valorii zero, regula de decizie menționată anterior este încă aplicabilă.
O problemă cu testul 𝑡 este aceea se poate greși cu ușurință în utilizarea sa. Scorurile
𝑡 sunt calculate și afișate de pachete software de regresie, iar testul 𝑡 pare ușor de efectuat,
astfel încât economiștii începători încearcă uneori să folosească testul 𝑡 pentru a
„demonstra” lucruri pe care acest test nu a intenționat niciodată să le demonstreze. Din acest
motiv, este probabil la fel de important ca limitele testului 𝑡 să fie cunoscute, precum este de
importantă cunoașterea aplicării acestui test. Poate că cea mai importantă dintre aceste
limitări, aceea că utilitatea testului 𝑡 se diminuează rapid pe măsură ce din ce în ce mai multe
specificații sunt estimate și testate. Acest lucru se va discuta însă într-o secțiune viitoare.
Scopul prezentei secțiuni este de a oferi câteva exemple despre modul în care testul 𝑡 nu
trebuie utilizat.
Scopul testului 𝑡 este acela de a ajuta cercetătorul să facă inferențe despre un anumit
coeficient al populației pe baza unei estimări obținute dintr-un eșantion din acea populație.
Unii cercetători începători trag concluzia că orice rezultat semnificativ statistic este, de
asemenea, unul corect teoretic. Acest lucru este periculos deoarece o astfel de concluzie
confundă semnificația statistică cu validitatea teoretică. Ca exemplu, fie următoarea regresie
estimată, care explică indicele prețurilor de consum din Regatul Unit:
Se aplică testul 𝑡 la aceste estimări. Se poate observa cu ușurință că cei doi coeficienți pantă
sunt statistic semnificativi. Surpriza apare în definirea variabilelor, 𝑃 reprezentând indicele
5. Testarea ipotezelor 22
prețurilor de consum, iar 𝐶 cantitatea anuală cumulată de precipitații din Regatul Unit!
Astfel, utilizând testul 𝑡 s-a demonstrat că ploaia este statistic semnificativă în explicarea
prețurilor de consum, dar aceasta arată, de asemenea, că teoria de bază este valabilă?
Desigur că nu. De ce este atât de semnificativ rezultatul statistic? Răspunsul este că,
întâmplător, există o tendință comună pe ambele părți ale ecuației. Această tendință comună
nu are însă nicio semnificație.
Morala ar trebui să fie clară: niciodată nu trebuie trasă concluzia că semnificația
statistică, așa cum este arătată de testul 𝑡, este aceeași cu validitatea teoretică. Ocazional,
coeficienții estimați vor fi semnificativi în direcția opusă celei stabilite la formularea
ipotezelor, iar unii cercetători începători pot fi tentați să schimbe ipotezele. De exemplu, un
student ar putea rula o regresie în care semnul așteptat al unui coeficient pantă este pozitiv,
să obțină un semn negativ „semnificativ statistic” și să fie tentat să schimbe așteptările
teoretice pentru a „aștepta” un semn negativ după „regândirea” problemei. Deși este
admirabilă reexaminarea teoriile incorecte pe baza unor noi dovezi, aceste dovezi ar trebui
să fie, în cea mai mare parte, de natură teoretică. Dacă dovezile determină un cercetător să
se întoarcă la bazele teoretice ale unui model și să găsească o greșeală, atunci ipoteza nulă ar
trebui modificată, dar atunci această nouă ipoteză ar trebui testată folosind un set de date
complet diferit. La urma urmei, se știe deja care va fi rezultatul dacă ipoteza va fi testată
folosind vechiul set de date.
Testul 𝑡 ajută la realizarea inferenței privind valoarea reală a unui parametru pe baza
unei estimări calculată dintr-un eșantion al populației (grupul din care este prelevat
eșantionul). Dacă un coeficient este calculat din întreaga populație, atunci o estimare
nedeplasată măsoară deja valoarea populației și un test 𝑡 semnificativ nu adaugă nimic
acestei cunoștințe. Nu trebuie acordată prea multă importanță scorurilor 𝑡 care au fost
obținute din eșantioane care au aproximativ dimensiunea populației. Acest aspect poate fi
cel mai bine înțeles amintind că scorul 𝑡 este coeficientul de regresie estimat împărțit la
eroarea standard a coeficientului de regresie estimat. Dacă dimensiunea eșantionului este
suficient de mare pentru a se apropia de populație, atunci eroarea standard se va apropia de
zero și scorul 𝑡 va deveni în cele din urmă:
𝛽̂
𝑡= =∞
0
Astfel, simpla existență a unui scor 𝑡 mare pentru un eșantion imens nu are nicio
semnificație reală.
Intervale de încredere
unde 𝑡𝑐 este valoarea critică bilaterală a statisticii 𝑡 pentru nivelul de semnificație ales. Dacă
interval de încredere dorit de 90%, se alege valoarea critică 𝑡𝑐 pentru nivelul de semnificație
de 10%. Pentru un interval de încredere de 95%, se va alege valoarea critică 𝑡𝑐 pentru un
nivel de semnificație de 5%. Pentru a vedea cum pot fi utilizate intervalele de încredere
pentru testarea unor ipoteze, se revene la ecuația Woody pentru a testa semnificația
coeficientului variabilei independente 𝐼( venitul):
0.365 ≤ 𝛽𝐼 ≤ 2.211
Care este semnificația acestui interval? Dacă ipotezele clasice sunt valabile, formula
de calcul a intervalului de încredere produce intervale care conțin adevărata valoare a lui 𝛽
90% din timp. În cazul analizat, există șanse de 90% ca adevărata valoare a lui 𝛽𝐼 să fie între
0,365 și 2,211. Dacă 𝛽𝐼 nu se află în acest interval, acest lucru se datorează unui eșantion
nefericit construit.
Cum se poate folosi un interval de încredere pentru un test de ipoteză bilateral? Dacă
ipoteza nulă este H0 : 𝛽𝐼 = 0, aceasta se poate respinge la nivelul de semnificație de 10%,
deoarece 0 nu se află în intervalul de încredere. Dacă ipoteza nulă ar fi H0 : 𝛽𝐼 = 1, nu s-ar
5. Testarea ipotezelor 25
Rezultatele obținute pentru 𝛽̂𝑏𝑎𝑖𝑒 când 𝑛 = 1000 sunt prezentate în Tabelul 2, chiar
sub cele pentru 𝑛 = 100. Se poate observa că 𝛽̂𝑏𝑎𝑖𝑒 a scăzut de la aproape 22000 $ la mai
puțin de 13000 $. Asta înseamnă că Grace nu ar mai trebui să adauge o baie? Nu este deloc
așa! Dacă se analizează intervalul de încredere de 90%, se poate constată că limita inferioră
a crescut la 8346,29 dolari, ceva mai mult decât costul marginal de 8.000 dolari.
Deși Grace ar putea pierde în continuare bani din adăugarea unei băi, cîștigul pare
mult mai sigur decât sugerează rezultatele obținute folosind un volum mic al eșantionului.
De ce un interval de încredere devine mai restrâns când se folosește un eșantion mai mare?
Cum se poate observa în ecuația de calcul a intervalului de încredere, mărimea acestuia
depinde în totalitate de produsul dintre 𝑡𝑐 și 𝑆𝐸(𝛽̂ ). Ce se întâmplă cu 𝑡𝑐 și 𝑆𝐸(𝛽̂ ) pe măsură
ce mărimea eșantionului crește? Din Tabelul 1, se poate observa că pe măsură ce
dimensiunea eșantionului crește, 𝑡𝑐 scade. În același timp, pe măsură ce dimensiunea
eșantionului crește, varianța distribuției de eșantionare scade, astfel încât 𝑆𝐸(𝛽̂ ), care este
rădăcina pătrată a varianței estimate, scade și ea. Dacă atât 𝑡𝑐 cât și 𝑆𝐸(𝛽̂ ) scad, atunci
produsul lor trebuie să scadă, iar un eșantion mai mare va duce într-adevăr la un interval de
încredere mai restrâns. Acest exemplu ilustrează modul în care intervalele de încredere
oferă informații despre cât de precis este un coeficient estimat. În plus, intervalele de
încredere sunt extrem de utile în prognoză. Acest subiect se va aborda într-un capitol viitor.
Testul F
Deși testul 𝑡 este de neînlocuit pentru testarea unor ipoteze individuale puse asupra
unor coeficienții de regresie, acesta nu poate fi folosit pentru a testa mai multe ipoteze
simultan. O astfel de limitare este nefericită, deoarece multe idei interesante implică mai
multe ipoteze sau implică o ipoteză despre mai mulți coeficienți simultan. De exemplu, se
poate cere testarea ipotezei nule că nu există nicio variație sezonieră într-o ecuație de
regresie trimestrială, care are variabile dummy pentru anotimpuri. Pentru a testa o astfel de
ipoteză, majoritatea cercetătorilor folosesc testul 𝐹.
Testul F este un test formal care este conceput pentru a testa o ipoteză nulă care
conține multiple ipoteze sau o singură ipoteză despre un grup de coeficienți. Astfel de ipoteze
nule „comune” sau „compuse” sunt adecvate ori de câte ori teoria economică de bază
5. Testarea ipotezelor 27
specifică anumite valori sau condiții simultane pentru mai mulți coeficienți. Modul în care
funcționează testul 𝐹 este destul de ingenios. Primul pas este de a transpune în ipoteza nulă
condițiile sau restricțiile care vor fi puse asupra coeficienților din ecuația de regresie. Se
analizează apoi ecuația de regresie ca și cum ipoteza nulă ar fi corectă. Astfel, se substituie
în ecuația de regresie valorile coeficienților cu cele din ipoteze pentru a vedea ce s-ar
întâmpla cu ecuația dacă ipoteza nulă ar fi corectă. Ca urmare, în testul 𝐹 ipoteza nulă
conduce întotdeauna la o ecuație restrânsă sau constrânsă, chiar dacă aceasta încalcă
practica standard conform căreia ipoteza alternativă conține ceea ce se așteaptă să fie
adevărat.
Al doilea pas în efectuarea unui test 𝐹 este estimarea cu OLS a ecuației restrânse sau
constrânse și compararea gradului de potrivire (ajustare) al acestei ecuații cu gradul de
potrivire al ecuației inițiale. Dacă gradele de potrivire ale ecuației constrânse și ale ecuației
neconstrânse nu sunt substanțial diferite, ipoteza nulă nu ar trebui respinsă. Dacă gradul de
ajustare al ecuației neconstrânse este substanțial mai bun decât cel al ecuației constrânse,
atunci se respinge ipoteza nulă. Gradul de ajustare al ecuației constrânse nu este niciodată
superior gradului de ajustare al ecuației neconstrânse, așa cum se va explica în continuare.
Gradele de ajustare ale ecuațiilor, constrânsă și neconstrânsă, sunt incluse în calculul
statisticii generale 𝐹:
(𝑅𝑆𝑆𝑀 − 𝑅𝑆𝑆)/𝑚
𝐹=
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1)
unde:
𝑅𝑆𝑆 = suma de pătrate de reziduuri din ecuația fără condiții;
𝑅𝑆𝑆𝑀 =suma de pătrate de reziduuri din ecuația cu condiții;
𝑚 = nr. de condiții impuse în ecuație, uzual, egal cu numărul de coeficienți 𝛽 eliminați din
ecuația fără condiții;
𝑛 − 𝑘 − 1 = numărul gradele de libertate în ecuația fără condiții.
𝑅𝑆𝑆𝑀 este întotdeauna mai mare sau egal cu 𝑅𝑆𝑆. Impunerea condițiilor pentru
coeficienți nu permite 𝑂𝐿𝑆 să-și selecteze valorile care să scadă suma de pătrate de
reziduuri, așa cum ar face în lipsa acestor condiții. (𝑂𝐿𝑆 selectează acea combinație de valori
ale coeficienților care minimizează 𝑅𝑆𝑆.) La extremă, dacă regresia neconstrânsă produce
exact aceiași coeficienți estimați ca și regresia constrânsă, atunci 𝑅𝑆𝑆 este egală cu 𝑅𝑆𝑆𝑀 , iar
statistica 𝐹 este zero. În acest caz, H0 nu poate fi respinsă, deoarece datele indică faptul că
restricțiile par a fi corecte. Pe măsură ce diferența dintre coeficienții asupra cărora s-au pus
condiții și coeficienții fără condiții crește, datele indică faptul că ipoteza nulă este mai puțin
probabilă să fie adevărată. Astfel, atunci când 𝐹 devine mai mare decât valoarea critică, 𝐹𝑐 ,
condițiile specificate în ipoteza nulă sunt respinse.
5. Testarea ipotezelor 28
H0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 = 0
HA : H0 nu este adevărată.
2
𝐸𝑆𝑆/𝑘 ∑(𝑌̂𝑖 − 𝑌̅) /𝑘
𝐹= =
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1) ∑(𝑒𝑖2 )/(𝑛 − 𝑘 − 1)
Acesta este raportul dintre variabilitatea explicativă (𝑆𝑆𝐸) și variabilitatea reziduală (𝑅𝑆𝑆),
ajustate cu numărul de variabile independente (𝑘) și numărul de observări din eșantion (𝑛).
5. Testarea ipotezelor 29
În acest caz, ecuația restrânsă, cea care se obține prin înlocuirea coeficienților cu valorile lor
din ipoteza nulă, este:
𝑌𝑖 = 𝛽0 + 𝜀𝑖
ceea ce nu spune altceva decât că 𝑌̂𝑖 = 𝑌̅. Astfel, testul 𝐹 de semnificație globală testează cu
adevărat ipoteza nulă potrivit căreia gradul de ajustare realizat de ecuație nu este mai bun
decât cel obținut folosind doar media valorilor observate.
Pentru a vedea cum se aplică testul 𝐹, se reia modelul Woody, pentru testarea
semnificației globale. Deoarece există trei variabile independente, ipotezele nulă și
alternativă sunt:
H0 : 𝛽𝑁 = 𝛽𝑃 = 𝛽𝐼 = 0
HA : H0 nu este adevărată
Pentru a decide dacă se respinge sau nu ipoteza nulă, se calculează mai întâi statistica
𝐹. Există trei condiții în ipoteza nulă (trei semne de egalitate), deci 𝑘 = 3. Numărul de
observări este 𝑛 = 33. Se estimează ecuația fără condiții și se obține variabilitatea reziduală,
𝑅𝑆𝑆 = 6133300000 și variabilitatea explicativă 𝐸𝑆𝑆 = 9928900000. Astfel, valoarea lui
𝐹 este egală cu:
𝐸𝑆𝑆/𝑘 9928900000/3
𝐹= = = 15.65
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1) 6133300000/29
În practică, acest calcul nu este necesar deoarece fiecare pachet de regresie oferă, în
mod obișnuit, raportul 𝐹 calculat în scopul efectuării testului de semnificație globală. În cazul
în care pentru estimare se folosește EViews, valoarea statisticii F poate fi găsită în partea de
jos a tabelului rezultatelor.
Regula de decizie spune că ipoteza nulă se respinge dacă valoarea 𝐹 calculată este mai
mare decât valoarea critică 𝐹𝑐 . Pentru a determina valoarea 𝐹 critică, trebuie ales nivelul de
semnificație și, de asemenea, trebuie cunoscut numărul gradelor de libertate. Dacă nivelul
de semnificație ales este de 5%, numărul gradelor de libertate de la numărător, 𝑘, este egal
cu 3, iar numărul de grade de libertate de la numitor, 𝑛 – 𝑘 – 1, este egal cu 29, atunci 𝐹𝑐 este
egal cu 2.93, mult sub valoarea calculată a lui 𝐹, de 15,65. Astfel, ipoteza nulă se respinge. Se
trage concluzia că, ecuația Woody are într-adevăr un grad de ajustare global semnificativ.
La fel cum p-value oferă o abordare alternativă la testul 𝑡, există o abordare
alternativă la testul 𝐹 de semnificație globală. Majoritatea programelor de estimare
raportează nu numai valoarea F pentru testul de semnificație globală, ci și valoarea p-value
asociată testului respectiv (în EViews aceasta este denumită “Prob(F-statistic)”). Pentru
exemplificare, se caută „Prob( F-statistic)” în partea de jos a tabelului rezultatelor regresiei
5. Testarea ipotezelor 30
Woody, coloana din stânga. Dacă mărimea Prob( F-statistic) este mai mică decât nivelul de
semnificație ales, ipoteza nulă se respinge.
Există multe alte utilizări ale testului 𝐹 pe lângă testul de semnificație globală. De
exemplu, se poate utiliza testul 𝐹 pentru testarea semnificației variabilelor sezoniere
dummy. Variabilele sezoniere dummy sunt variabile dummy care sunt utilizate pentru ca în
ecuația de regresie să se țină cont de variația sezonieră a datelor din modelele specificate în
serii de timp. Într-un model trimestrial, de exemplu, dacă se notează variabilele dummy cu:
1 î𝑛 trimestrul 1
𝑋1𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul I
0 altfel
1 în trimestrul 2
𝑋2𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul II
0 altfel
1 în trimestrul 3
𝑋3𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul III
0 altfel
unde 𝑋4 este o variabilă independentă non dummy, iar 𝑡 este trimestrul. Se observă că doar
trei variabile dummy sunt necesare pentru a reprezenta patru trimestre (de ce?). În această
formulare 𝛽1 arată măsura în care valoarea așteptată a lui 𝑌 din primul trimestru diferă de
valoarea așteptată din cel de-al patrulea trimestru (condiția omisă). Coeficienții 𝛽2 ș𝑖 𝛽3 pot
fi interpretați în mod similar.
Includerea unui set de variabile dummy sezoniere va determina „desezonalizarea”
lui 𝑌. Această procedură poate fi utilizată atât timp cât 𝑌 și 𝑋4 nu sunt „ajustate sezonier”
înainte de estimare. Mulți cercetători evită tipul de ajustare sezonieră efectuată înainte de
estimare deoarece consideră că distorsionează datele în moduri necunoscute și arbitrare. Pe
de altă parte, variabilele dummy sezoniere au propriile limitări, cum ar fi faptul că rămân
constante pentru întreaga perioadă de timp. Ca urmare, nu există o abordare fără echivoc în
ceea ce privește desezonalizarea datelor. Totuși, unele date sunt desezonalizate (Eurostat),
și trebuie folosite ca atare.
Pentru a testa ipoteza privind semnificația datelor pentru un anotimp, trebuie testată
ipoteza că toate variabilele dummy sunt egale cu zero simultan, mai degrabă decât să se
testeze ipotezele că variabilele dummy sunt, pe rând, egale cu zero. Cu alte cuvinte, testul
5. Testarea ipotezelor 31
adecvat pentru testarea sezonalității într-un model de regresie folosind variabile dummy
sezoniere este testul 𝐹, nu testul 𝑡.
În acest caz, ipoteza nulă că nu există sezonalitate și ipoteza alternativă sunt:
H0 : 𝛽1 = 𝛽2 = 𝛽3 = 0
HA : H0 nu este adevărată
1. Se execută aceeași regresie pe cele două eșantioane de date și se reține 𝑅𝑆𝑆 pentru fiecare
eșantion: 𝑅𝑆𝑆1 , respectiv 𝑅𝑆𝑆2.
2. Se pun datele din cele două eșantioane împreună și se execută regresia pe întregul set de
date. Se reține mărimea lui 𝑅𝑆𝑆.
3. Se calculează:
5. Testarea ipotezelor 32
unde:
𝑘 = numărul de variabile independente;
𝑛1 = numărul de observări în eșantionul 1;
𝑛2 = numărul de observări în eșantionul 2.
4. Se respinge ipoteza nulă conform căreia cele două seturi de coeficienți de regresie sunt
echivalenți dacă 𝐹 > 𝐹𝑐 , unde 𝐹𝑐 este valoarea 𝐹 critică pentru (𝑘 + 1) grade de libertate
la numărător și (𝑛1 + 𝑛2 − 2𝑘 − 2) la numitor.
Sumar
2. Ipoteza nulă menționează gama de valori pe care coeficientul de regresie este de așteptat
să nu le ia, în cazul în care așteptările cercetătorului sunt corecte. Ipoteza alternativă este
o afirmație a gamei de valori pe care coeficientul de regresie este de așteptat să le ia, în
cazul în care teoria din spatele așteptărilor cercetătorului este corectă.
3. Cele două tipuri de erori care pot fi făcute în testarea acestor ipoteze sunt:
Tipul I: Se respinge o ipoteză nulă care este adevărată.
Tipul II: Nu se respinge o ipoteză nulă care este falsă.
(𝛽̂𝑘 − 𝛽H0 )
𝑡𝑘 = (𝑘 = 1,2, … , 𝐾)
𝑆𝐸(𝛽̂𝑘 )
În multe aplicații de regresie, 𝛽H0 este egal cu zero. Odată ce s-a calculat o valoare 𝑡 și s-a
ales o valoare critică 𝑡𝑐 , se respinge ipoteza nulă dacă valoarea 𝑡 este mai mare în valoare
absolută decât valoarea critică 𝑡𝑐 și dacă valoarea 𝑡 are semnul implicat de ipoteza
alternativă.
5. Testul 𝑡 este ușor de efectuat, dar trebuie evitate greșelile generate de confuzia
semnificației statistice cu validitatea teoretică sau interpretarea greșită a importanței
variabilelor independente.
6. Testul 𝐹 este un test formal de ipoteză conceput pentru a testa o ipoteză nulă care conține
mai multe ipoteze sau o singură ipoteză despre un grup de coeficienți. Cea mai obișnuită
utilizare a testului 𝐹 este testarea semnificației globale a unei ecuații de regresie
estimată.
5. Testarea ipotezelor 34
Testul 5.1
TI1. Înainte de a fi testate, ipotezele trebuie formulate. Acest lucru trebuie să se facă înainte de
a estima ecuația, deoarece ipotezele dezvoltate după estimare riscă să fie mai degrabă
justificări ale unor rezultate particulare decât teste de validitate a acestor rezultate. Ipoteza
nulă H0 reprezintă, de obicei, o afirmație privind valorile pe care un coeficient este de
așteptat să nu le ia. Ipoteza alternativă HA este, de obicei, o afirmație privind valorile pe
care coeficientul respectiv este de așteptat să la ia. Testarea se referă la ipoteza nulă, iar
concluziile pot fi: ipoteza nulă se respinge (implicit se acceptă ipoteza alternativă), sau
ipoteza nulă nu se poate respinge. Niciodată nu se spune că ipoteza nulă "se acceptă". În
justiție, de exemplu, un inculpat are dreptul la prezumția de nevinovăție, formulată prin
expresia "nevinovat până la dovedirea vinovăției", prezumție exprimată de ipoteza nulă
H0: nevinovat. Astfel, un inculpat vinovat poate fi declarat nevinovat dacă:
TI2. În justiție, prezumția de nevinovăție, formulată prin expresia "nevinovat până la dovedirea
vinovăției", presupune formularea următoarelor ipoteze: H0 : nevinovat; HA : vinovat. Când
un inculpat vinovat este declarat de judecător nevinovat, înseamnă că:
Cei mai mulți dintre noi ar dori ca erorile în justiție să fie destul de
mici, dar o astfel de certitudine este aproape imposibilă. Greșelile pot
apărea, pot exista martori mincinoși, anumite probe pot fi compromise, unii
inculpați pot avea imunitate, unele fapte se pot prescrie etc. În lumea reală,
scăderea probabilității unei erori de tipul I-pedepsirea unui inculpat
nevinovat, înseamnă creșterea probabilității unei erori de tipul II-
nepedepsirea unui inculpat vinovat.
Modificarea legilor justiției în timpul unei anumite guvernări a avut ca
scop declarat reducerea riscului ca persoane nevinovate să fie declarate
vinovate și condamnate pe nedrept. Dar, cu cât preocuparea de a nu
pedepsi inculpați nevinovați a fost mai pregnantă, cu atât mulți inculpați cu
adevărat vinovați aveau șanse mai mari de a scăpa nepedepsiți. Marii
vinovați au sperat să scape nepedepsiți, inducând publicului larg ideea că
sunt foarte preocupați ca nici un nevinovat să nu fie condamnat pe nedrept.
TI4. O regulă de decizie este o procedură prin care se decide dacă ipoteza nulă se respinge sau
nu se poate respinge. Pentru un test unilateral, o regulă de decizie implică compararea
unei statistici determinate pe baza unui eșantion cu o valoare critică preselectată, ce poate
fi găsită în tabelele statistice. Cum se poate observa în figura alăturată, gama de valori
posibile ale lui valorilor estimate ale lui β este împărțită în două regiuni, o regiune de
„acceptare” și o regiune de respingere, unde termenii de acceptare și de respingere au
semnificația dată prin raportarea la ipoteza nulă. Pentru a defini aceste regiuni, trebuie
determinată o valoare critică. Astfel, o valoare critică este o valoare care separă regiunea
de „acceptare” de regiunea de respingere. De ce termenul acceptare este pus între
ghilimele?
Distribuția de eșantionare, 𝛽̂
Valoarea critică, 𝑡𝑐
𝛽̂
0
Regiune de
Regiune de "acceptare" respingere
c. pentru că, prin convenție, numele regiunilor trebuie pus între ghilimele;
TI5. În cazul unui test bilateral, regiunile de respingere, situate în stânga și în dreapta regiunii
de "acceptare", măsoară probabilitatea erorii de tipul I, când ipoteza nulă este adevărată.
Se poate observa în figura alăturată că suprafața totală a acestor regiuni este de două ori
mai mare decât suprafața regiunii de respingere în cazul unui test unilateral, pentru aceeași
mărime a pragului critic. Ca urmare, în cazul unui test bilateral, pentru a avea aceeași
probabilitate de apariție a erorii de tipul I ca în cazul unui test unilateral:
Distribuția de eșantionare, 𝛽̂
Probabilitatea erorii
de tipul I
𝛽̂
0
Regiune de
Regiune de Regiune de "acceptare"
respingere
TI6. Cum se poate observa în figura alăturată, gama de valori posibile ale coeficientului 𝛽 al
unei variabile independente este împărțită în două regiuni, o regiune de „acceptare” și o
regiune de respingere. Pentru a defini aceste regiuni, trebuie determinată o valoare critică
(sau, pentru un test bilateral, două valori critice) ale lui β estimat . Astfel, o valoare critică
este o valoare care separă regiunea „de acceptare” de regiunea de respingere. Valoarea
critică poate fi găsită în tabelele statistice. Odată stabilită valoarea critică, aceasta se
compară cu o statistică calculată pe baza unui eșantion. Regiunea de respingere măsoară
probabilitatea erorii de tipul I. Întreaga procedură prin care se decide dacă ipoteza nulă se
respinge sau nu se poate respinge este denumită:
Distribuția de eșantionare, 𝛽̂
Valoarea
𝛽̂
0 𝑡𝑐
Regiune de
Regiune de "acceptare" respingere
b. regulă de decizie;
c. eroare stohastică
d. nivel de semnificație;
e. estimare;
5. Testarea ipotezelor 40
TI7. În ecuația Woody, impactul venitului mediu al gospodăriilor din zona restaurantului asupra
numărului preconizat de clienți Woody din acea zonă este ambiguu. Un restaurant Woody
situat într-un cartier cu un nivel ridicat al veniturilor gospodăriilor ar putea avea mulți
clienți la cină, dar, la fel de bine, acești clienți ar putea decide să mănânce la un restaurant
mai elevat decât Woody. În acest caz, care este forma corectă a ipotezei nule pentru
coeficientul variabilei independente I și ce fel de test trebuie efectuat?
− + ?
𝑌̂𝑖 = 𝛽̂0 + 𝛽̂𝑁 𝑁𝑖 + 𝛽̂P 𝑃𝑖 + 𝛽̂I 𝐼𝑖
unde:
b. H0 : 𝛽I ≤ 0; test unilateral;
c. H0 : 𝛽I ≠ 0; test bilateral;
d. H0 : 𝛽I ≥ 0; test bilateral;
e. H0 : 𝛽I = 0; test bilateral;
5. Testarea ipotezelor 41
TI8. În figura alăturată sunt ilustrate regiunile de "acceptare" și de respingere, pentru un test
unilateral și pentru un test bilateral. Se observă faptul că, pentru testul unilateral cu un
nivel de semnificație de 5%, valoarea critică este de 1.699. Aceeași valoare critică se obține
pentru testul bilateral cu un nivel de semnificație de:
α = 5%
Aria = 0.05 test unilateral
𝛽̂
−1.669 0 1.699
α = 10% test bilateral
b. 2.5%
c. 10%
d. 5%
e. 1%
5. Testarea ipotezelor 42
TI9. Ipoteza alternativă este de obicei o afirmație privind valorile pe care coeficientul unei
variabile independente este de așteptat să le ia. Notația folosită pentru a specifica ipoteza
alternativă este „HA:” urmată de o enunțare a gamei de valori așteptată pentru coeficientul
respectiv. Cum trebuie formulată ipoteza alternativă pentru coeficientul a cărui distribuție
de eșantionare este ilustrată în figura alăturată?
0 𝐸 𝛽̂
b. HA : 𝛽 = 0
c. HA : 𝛽 < 0
d. HA : 𝛽 ≤ 0
e. HA : 𝛽 > 0
5. Testarea ipotezelor 43
TI10. Există câteva cazuri rare în care este încălcată regula conform căreia valorile așteptate ale
coeficientului unei variabile independente se includ în ipoteza alternativă. Se întâmplă
acest lucru deoarece testarea ipotezelor presupune ca ipoteza nulă să conțină semnul egal
într-o anumită formă (fie că este =, ≤ sau ≥). Această cerință îi obligă pe economiști să
pună valoarea pe care o așteaptă în ipoteza nulă dacă așteptarea lor include un semn
egal. Dacă acesta este cazul ilustrat în figura alăturată, care dintre expresiile ipotezei nule
de mai jos este cea corectă?
𝐸 𝛽̂ 0
b. H0 : β ≥ 0
c. H0 : β = 0
d. H0 : β > 0
e. H0 : β ≠ 0
5. Testarea ipotezelor 44