Sunteți pe pagina 1din 15

Testul t (Student)

Testul t se utilizează pentru a testa diferite ipoteze individuale privind coeficienții


pantă ai regresiei. Testarea unei ipotezele care se referă simultan la mai mult de un coeficient
(ipoteze multiple) este, de obicei, efectuată cu testul F. Testul t este ușor de utilizat, deoarece
contabilizează diferențele dintre unitățile de măsură ale variabilelor și abaterile standard ale
coeficienților estimați. Mai important, statistica t este testul adecvat de utilizat atunci când
termenul de eroare stocastică este distribuit normal și când variația acestei distribuții
trebuie estimată. Întrucât acesta este cazul care se întâlnește de obicei, utilizarea testului t
pentru testarea ipotezelor individuale a devenit o practică standard în econometrie.
Pentru o ecuație de regresie multiplă tipică:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 + ⋯ + 𝛽𝑗 𝑥𝑗𝑖 + ⋯ + 𝛽𝑘 𝑥𝑘𝑖 + 𝜀𝑖

se pot calcula rații (statistici) t pentru fiecare dintre coeficienții estimați în ecuație. În
general, testele t sunt efectuate numai pentru coeficienții pantă. Pentru un coeficient pantă,
relația de calcul a rației (scorului) t este următoarea:
(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )

unde: 𝛽̂𝑗 = coeficientul de regresie estimat al variabilei j;


𝛽H0 = valoarea de graniță (de obicei zero) implicată de ipoteza nulă pentru 𝛽𝑗 ;
𝑆𝐸(𝛽𝑗 ) = eroarea standard estimată a 𝛽̂𝑗 (adică rădăcina pătrată a variației
̂
estimate a distribuției 𝛽̂𝑗 ; rețineți că nu există „căciulă” deasupra lui SE,
deoarece SE este deja definit ca o estimare.
Cum se alege valoarea de graniță care este implicată de ipoteza nulă? Unele ipoteze
nule specifică o anumită valoare. În aceste cazuri, 𝛽H0 este pur și simplu acea valoare. Dacă,
de exemplu, H0 : 𝛽 = 𝑆, atunci 𝛽H0 = 𝑆. Alte ipoteze nule implică intervale, dar prezintă
interes doar valoarea din ipoteza nulă care este cea mai apropiată de granița dintre regiunea
„acceptare” și regiunea de respingere. Această valoare de graniță devine apoi 𝛽H0 . De
exemplu, dacă H0 : 𝛽 ≥ 0 și HA : 𝛽 > 0, atunci valoarea din ipoteza nulă cea mai apropiată
de graniță este zero, și 𝛽H0 = 0. Deoarece majoritatea ipotezelor de regresie testează dacă
un coeficient de regresie particular este semnificativ diferit de zero , valoarea lui 𝛽H0 este de
obicei zero. Cifra zero este deosebit de importantă, deoarece dacă adevăratul 𝛽 este egal cu
zero, atunci variabila nu aparține ecuației. Înainte de a elimina variabila din ecuație și de a
forța coeficientul să fie zero, totuși, trebuie testată ipoteza nulă conform căreia 𝛽 = 0. Astfel,
forma cea mai folosită a statisticii t devine:

(𝛽̂𝑗 − 0)
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
care, simplificată, devine:

𝛽̂𝑗
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )

Altfel spus, rația Student a unui coeficient este egală cu estimatorul coeficientului respectiv
împărțit la eroarea sa standard. Aceasta este formula de calcul a scorului (rației) t utilizată
de majoritatea software-rilor. Pentru a ușura înțelegerea acestui calcul, rezultatele regresiei
sunt prezentate într-o formă standard. De exemplu, pentru regresia Woody (vezi
Studenmund, Using Econometrics), rezultatele obținute sunt:
𝑦̂𝑖 = 102.192 − 9075 ∙ 𝑁𝑖 + 0.3547 ∙ 𝑃𝑖 + 1.288 ∙ 𝐼𝑖
(2053) (0.0727) (0.5432)
t= –4.42 4.88 2.37
̅ 2
n = 33 R = 0.579

Numerele din parantezele de sub coeficienții de regresie estimați sunt abaterile (erorile)
standard estimate ale coeficienților, iar numerele de sub ele sunt valorile rațiilor (scorurile)
t , calculate prin divizarea estimatorilor la abaterile lor standard. Acest format de prezentare
a rezultatelor regresiei este folosit pentru documentarea proiectului. Pe cât posibil, el va fi
folosit de fiecare dată. De reținut, semnul rațiilor t este întotdeauna același cu cel al
coeficienților de regresie estimați, iar eroarea standard este întotdeauna pozitivă. De
exemplu, rația t pentru variabila 𝑃 se calculează în felul următor:

𝛽̂𝑃 = 0.3547, 𝑆𝐸(𝛽̂𝑃 ) = 0.727

Dat fiind că H0 : 𝛽𝑃 ≤ 0, valoarea lui 𝑡𝑃 este:

𝛽̂𝑝 0.3547
𝑡𝑝 = = = 4.88
𝑆𝐸(𝛽̂𝑝 ) 0.727

Cu cât valoarea absolută a lui t este mai mare, cu atât este mai mare probabilitatea ca
parametrul de regresie estimat să fie semnificativ diferit de zero.

Valoarea critică, 𝒕𝒄 , și regula de decizie

Pentru a decide dacă, pe baza unui scor t calculat, o ipoteză nulă se respinge sau nu,
este necesară o valoare de referință numită valoare critică, 𝑡𝑐 . O valoare t critică este
valoarea care separă regiunea „de acceptare” de regiunea de respingere. Valoarea critică,
notată 𝑡𝑐 , este selectată dintr-un tabel t (Tabelul statistic t), după cum testul este unilateral
sau bilateral, la nivelul de eroare de tip 1 specificat și în funcție de numărul gradelor de
libertate. Acestea sunt definite ca fiind numărul de observări minus numărul de coeficienți
estimați (inclusiv constanta), adică n - k - 1. Nivelul de eroare de tip 1 în testarea unei ipoteze
se mai numește nivelul de semnificație.
Figura 1. Valoarea critică, 𝑡𝑐

Tabelul statistic t a fost creat pentru a economisi timp în perioada cercetării. Acest
tabel constă din valori t critice date pentru anumite zone sub curba distribuției, cum este
ilustrat Figura1, pentru erorile de tip 1. O valoare critică t este astfel o funcție a probabilității
erorii de tip 1 pe care cercetătorul dorește să o specifice. După ce se calculează o valoare t și
se extrage din tabel o valoare critică, 𝑡𝑐 , se respinge ipoteza nulă dacă valoarea calculată t
este mai mare în valoare absolută decât valoarea critică și dacă valoarea calculată t are
semnul implicat de HA . Astfel, regula care se aplică la testarea individuală a unui coeficient
de regresie 𝛽𝑗 este următoarea:

Se respinge H0 dacă |𝑡𝑗 | > 𝑡𝑐 și 𝑡𝑗 are semnul implicat de HA . Altfel, H0 nu se


poate respinge.

Această regulă de decizie se aplică pentru teste unilaterale în jurul valorii zero:
𝐻0 : 𝛽 ≥ 0 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣 𝐻0 : 𝛽 ≤ 0
𝐻𝐴 : 𝛽 < 0 𝐻𝐴 : 𝛽 > 0

sau pentru un test bilateral în jurul aceleiași valori:


𝐻0 : 𝛽 = 0
𝐻𝐴 : 𝛽 ≠ 0

De asemenea, testul se aplică pentru teste unilaterale bazate pe valori, altele decât zero:
H0 : 𝛽 ≥ 𝑆 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣 H0 : 𝛽 ≤ 𝑆
HA : 𝛽 < 𝑆 HA : 𝛽 > 𝑆

sau pentru un test bilateral, bazat pe valori, altele decât zero:


H0 : 𝛽 = 𝑆
HA : 𝛽 ≠ 𝑆

Regula de decizie este aceeași: se respinge ipoteza nulă dacă valoarea calculată a lui t
este mai mare în valoare absolută decât valoarea critică, atât timp cât semnul valorii
calculate este același ca semnul coeficientului implicat în HA . În caz contrar, ipoteza H0 nu se
poate respinge. Tabelul statistic t conține valorile critice 𝑡𝑐 , pentru diferite grade de libertate
și niveluri de semnificație. Coloanele indică nivelurile de semnificație în funcție de tipul
testului: unilateral sau bilateral, iar liniile indică gradele de libertate.
Pentru un exemplu de utilizare a acestui tabel și a regulii decizionale, se reia exemplul
Woody. Valorarea t pentru 𝛽̂𝑃 calculată mai sus este egală cu 4.88. Cum s-a stabilit ipoteza
conform căreia coeficientul lui P este pozitiv, ipotezele au următoarea formă:
H0 : 𝛽𝑃 ≤ 0
HA : 𝛽𝑃 > 0

Numărul gradelor de libertate în această regresie este egal cu 29 (egal cu n - k - 1, sau


33 - 3 - 1), deci valoarea cu care se compară valoarea calculată a lui t este o valoare t critică
unică, cu 29 de grade de libertate. Pentru a găsi această valoare, se alege un nivel de
semnificație. Cel mai adesea, nivelul de semnificație se alege 5% . Se caută în tabelul cu
valorile critice ale lui t. În Tabelul 1, se poate observa că valoarea critică a lui t, pentru 29
grade de libertate și pentru un prag de semnificație de 5% este egală cu 1.699. Deoarece
semnul implicat de HA este pozitiv, regula de decizie (pentru acest caz specific) devine:

se respinge H0 dacă |𝑡𝑝 >|1.699 și dacă 𝑡𝑃 este pozitiv

sau, combinând cele două condiții:


se respinge H0 dacă 𝑡𝑃 > 1.699
Cum 𝑡𝑃 = +4.88 > 1.699, se poate trage concluzia că variabila P tinde într-adevăr să fie
corelată pozitiv cu volumul vânzărilor Woody (păstrând celelalte variabile în ecuația
constantă). Valoarea critică t pentru un test unilateral, la un nivel de semnificație dat, este
exact egală cu valoarea critică t pentru un test bilateral la un nivel de semnificație de două
ori mai mare. Această relație între testele unilaterale și bilaterale este ilustrată în Tabelul 1.
Astfel, de exemplu, valoarea critică 𝑡𝑐 = 1.699 pentru un test unilateral, pentru un nivel de
semnificație de 5%, este egală cu valoarea critică pentru un test bilateral, pentru un nivel de
semnificație de 10% (vezi Figura 2). În Tabelul 1, valorile critice pentru testul unilateral,
pentru un anumit nivel de semnificație, și valorile critice, pentru testul bilateral, pentru un
nivel de semnificație dublu, sunt puse pe aceeași coloană.
Tabelul 1. Valorile critice ale lui t
Figura 2. Teste unilaterale și teste bilaterale

Alegerea unui nivel de semnificație


Pentru a completa exemplul dat, a fost necesară alegerea unui nivel de semnificație
înainte ca o valoare critică a lui t să fie căutată în tabelul t-statistic. Cuvintele „semnificativ
pozitive” poartă, de obicei, interpretarea statistică conform căreia H0 : 𝛽 ≤ 0 a fost respinsă
în favoarea HA : 𝛽 > 0, în conformitate cu regula de decizie prestabilită, pentru un nivel de
semnificație dat. Nivelul de semnificație indică probabilitatea de a observa o valoare t
estimată mai mare decât valoarea t critică, dacă ipoteza nulă ar fi corectă. Astfel, nivelul de
semnificație măsoară cantitatea de eroare de tip 1 implicată de o anumită valoare t critică.
De exemplu, dacă nivelul de semnificație ales este de 10% și la acest nivel se respinge ipoteza
nulă, atunci există 10% șanse ca ipoteza nulă să fi fost greșit respinsă. Nivelul de semnificație
se notează, de regulă, cu α.
Cum ar trebui ales nivelul de semnificație? Majoritatea economiștilor consideră că, cu
cât nivelul de semnificație este mai mic, cu atât este mai bine. Un nivel scăzut de semnificație
garantează o probabilitate scăzută de a face o eroare de tip 1. Din păcate, un nivel scăzut de
semnificație scăzut crește în mod dramatic probabilitatea de a face o eroare de tip 2. În
justiție, de exemplu, preocuparea excesivă de a nu pedepsi persoane nevinovate poate
însemna, în același timp, șansa mărită ca unii infractori să nu fie pedepsiți. Prin urmare, în
afara unor situații neobișnuite, când nu este importantă „acceptarea” greșită a unei ipoteze
nule falsă, minimizarea nivelului de semnificație nu este o bună practică.
În general, se recomandă utilizarea unui nivel de semnificație de 5%, cu excepția
cazurilor în care se cunoaște ceva neobișnuit despre costurile relative ale erorilor de tip 1 și
de tip 2. Dacă se cunoaște că o eroare de tip 2 va fi extrem de costisitoare, de exemplu, atunci
are sens utilizarea unui nivel de semnificație de 10% pentru determinarea valorii critice.
Totuși, astfel de judecăți sunt dificile, astfel încât este bine, la început, să se utilizeze, ca
standard, un nivel de semnificație de 5%.
Dacă se poate respinge ipoteza nulă la un nivel de semnificație de 5%, se poate trage
concluzia că parametrul sau coeficientul respectiv este „statistic semnificativ” la nivelul de
5%. Deoarece nivelul de 5% este arbitrar ales, nu ar trebui trase concluzii privind
semnificația unei variabile doar pentru că coeficientul său este statistic semnificativ, pentru
un nivel de semnificație redus. Dacă s-ar fi ales un alt nivel de semnificație, rezultatul ar fi
putut fi diferit. Unii cercetători realizează tabele cu rezultate de regresie, de obicei fără să
facă ipoteze asupra semnelor coeficienților, și apoi marchează coeficienții „semnificativi” cu
asteriscuri. Asteriscurile indică momentul în care rația t este mai mare în valoare absolută
decât valoarea critică pentru un test bilateral cu α =10% (care merită un asterisc,*), valoarea
critică pentru un test bilateral cu α = 5% (**) sau test bilateral cu α = 1%(***). O astfel de
utilizare a valorii t ar trebui considerată ca o descriere mai degrabă decât o utilizare a
statisticilor t pentru testarea ipotezelor
Uneori se folosește expresia „grad de încredere” sau „nivel de încredere” atunci când
se testează diferite ipoteze. Nivelul de încredere nu este altceva decât 100% minus nivelul
semnificației. Astfel, într-un test t , nivelul de semnificație este 5% poate fi, de asemenea,
exprimat prin nivel de încredere de 95%. Deoarece cei doi termeni au semnificații identice,
se va folosi în continuare expresia nivel de semnificație , pentru a evita orice posibilă
confuzie cu conceptul de intervale de încredere, care vor fi discutate în alt context. În
contrast, unii economiști evită să folosească noțiunea de nivel de semnificație, calculând pur
și simplu cel mai scăzut nivel de semnificație posibil pentru fiecare coeficient de regresie
estimat. Nivelurile de semnificație rezultate sunt denumite p-values.

p-Values

Există o alternativă la testul clasic t, pe baza unei măsuri numite p-value sau nivelul
de semnificație marginal. O valoare p-value pentru un scor t reprezintă probabilitatea de a
observa un scor t de această mărime sau mai mare (în valoare absolută), dacă ipoteza nulă
ar fi adevărată. Grafic, este de două ori zona aflată sub curba distribuției t, între valoarea
absolută a rației (scorului) t și infinit. O valoare p-value este o probabilitate, de aceea ia
valori de la 0 la 1. Ea arată cel mai mic nivel de semnificație la care se poate respinge ipoteza
nulă (presupunând că estimarea corespunde așteptării incluse în HA ) . O valoare mică a lui
p-value pune la îndoială ipoteza nulă, deci pentru a respinge o ipoteză nulă, avem nevoie de
o valoare scăzută a lui p-value.
Cum se calculează un p-value? O opțiune ar fi scotocirea prin pagini și pagini a
tabelelor statistice, în căutarea nivelului de semnificație care să corespundă exact
rezultatului regresiei. Asta ar putea dura zile! Din fericire, pachetele software de regresie
standard calculează automat p-values și le imprimă pentru fiecare coeficient estimat. Astfel,
p-values se pot citi în rezultatele regresie la fel ca și estimatorii parametrilor. Cu toate
acestea trebuie procedat cu mare atenție, deoarece pachetele de regresie afișează p-values
pentru ipoteze alternative bilaterale. Ca urmare, p-values includ zonele din ambele „cozi”
ale distribuției, astfel încât p-values bilaterale sunt de două ori mai mari decât cele
unilaterale. Dacă testul efectuat este unilateral, valorile p-value din rezultatele regresiei
trebuie împărțite la 2 înainte de efectuarea oricărui test. Cum se folosește un p-value pentru
a efectua testul t? Dacă nivelul de semnificație ales este de 5% și p-value este mai mic de 0.05,
atunci ipoteza nulă se poate respinge, atât timp cât semnul este în direcția așteptată (implicat
în HA ). Astfel, regula de decizie pe baza lui p-value este:

Se respinge H0 dacă p-value < nivelul de semnificație și dacă 𝛽̂𝑘 are semnul
implicat de HA . În caz contrar, H0 nu se poate respinge.

De exemplu, în modelul Woody, utilizarea mărimii p-value pentru a efectua un test t ,


unilateral, pe coeficientul lui I (variabila de venit), presupune stabilirea ipotezei nule și a
ipotezei alternative în felul următor:
H0 : 𝛽𝐼 ≤ 0
HA : 𝛽𝐼 > 0

În rezultatele regresiei ecuației Woody, prezentate mai sus, p-value pentru 𝛽̂𝐼 este
egal cu 0.25. Aceasta este p-value bilaterală. Deoarece testul ales este unilateral, valoarea lui
p-value trebuie împărțită la 2. Se obține 0.25:2 = 0.0125. Această valoare este mai mică decât
nivelul ales de semnificație, de 0.05. Deoarece semnul lui 𝛽̂𝐼 este pozitiv și este cel implicat de
HA , se poate respinge H0 . Rezultatul nu este unul surprinzător, fiind același cu rezultatul
obținut prin efectuarea unui test t convențional.
Folosirea valorilor p-values prezintă o serie de avantaje. Sunt ușor de utilizat și
permit celor care citesc rezultatele studiilor să își aleagă propriile niveluri de semnificație în
loc să fie obligați să utilizeze nivelul de semnificație ales de economistul care a făcut
cercetarea inițială. În plus, p-values transmite cititorilor informații despre puterea relativă
cu care se poate respinge o ipoteză nulă. Aceste avantaje îi determină pe mulți economiști să
folosească p-values în mod constant.
În ciuda acestor avantaje, pentru început, testul t prin utilizarea p-values, se va folosi
mai rar deoarece pregătirea inițială presupune învățarea procedurii standard de efectuare a
testului t, fiind mai probabil să se creeze obișnuința de a face ipoteze asupra semnului unui
coeficient (când un anumit semn poate fi intuit) și de aplica un test unilateral. În plus,
cunoașterea procedurii standard de efectuare a testului t, implică ușurința de a trece la
folosirea lui p-value, reciproca nefiind neapărat adevărată.
Cu toate acestea, economiștii practicieni din zilele noastre depun mai multă energie
pentru a construi modele și pentru a estima valorile coeficienților decât pentru a formula
diferite ipoteze și a le testa. Acest lucru se datorează faptului că majoritatea economiștilor
sunt mai încrezători în teoriile lor (verificate de atâtea ori) decât în calitatea datelor sau în
metodele de regresie. În astfel de situații, în care instrumentele statistice sunt utilizate mai
mult în scopuri descriptive decât în scopuri de testare a ipotezelor, utilizarea p-values
economisește timp și transmite mai multe informații decât procedura standard pentru testul
t.
5.3. Exemple de utilizare a testului t

Exemple de teste unilaterale

Scopul în care se utilizează cel mai adesea un test t unilateral este acela de a
determina dacă un coeficient de regresie este semnificativ diferit de zero, în direcția
prevăzută de teorie (sau așteptată). Dacă pentru un coeficient, de exemplu, se așteaptă un
semn pozitiv și se obține un 𝛽̂ negativ, este greu să se respingă posibilitatea ca adevăratul β
să fie negativ (sau zero). Pe de altă parte, dacă se așteaptă un semn pozitiv și se obține un 𝛽̂
pozitiv, lucrurile devin un pic mai complicate. Dacă 𝛽̂ este pozitiv, dar destul de aproape de
zero, atunci trebuie utilizat un test t unilateral pentru a determina dacă 𝛽̂ este suficient de
diferit de zero pentru a permite respingerea ipotezei nule. Reamintim că pentru a se putea
controla cantitatea de eroare de tip 1, este necesară formularea unei ipoteze alternative,
HA : 𝛽 > 0 (semnul așteptat) și a unei ipoteze nule, H0 : 𝛽 ≤ 0.
Se parcurg, în continuare, câteva exemple complete de utilizare a unui test t
unilateral. Se consideră un model simplu al vânzărilor anuale agregate de autoturisme noi,
care specifică faptul că vânzările de autoturisme (CARS) sunt o funcție de venitul real mediu
disponibil (YD) și de prețului mediu cu amănuntul al unui autoturism, ajustat de indicele
prețurilor de consum (PRICE). Se dorește testarea unei noi ipoteze: vânzările de
autoturisme noi sunt corelate cu vânzările de vehicule utilitare sportive (SUV-uri),
considerându-se că un număr mai mare de SUV-uri vândute înseamnă un număr mai mic de
autoturisme cumpărate de cumpărători. Prin urmare, se construiește următorul model de
regresie (deasupra parametrilor sunt scrise ipotezele asupra semnelor acestora):

+ – –
𝐶𝐴𝑅𝑆 = 𝛽0 + 𝛽1 𝑌𝐷 + 𝛽2 𝑃𝑅𝐼𝐶𝐸 + 𝛽3 𝑆𝑈𝑉 + 𝜀

Semnele de deasupra coeficienților arată că este de așteptat ca 𝛽1 să fie pozitiv, iar 𝛽2


și 𝛽3 să fie negative. Acest lucru are sens, deoarece este de așteptat ca la venituri disponibile
în creștere vânzările de autoturisme noi să crească, iar la prețuri mai mari ale acestora
vânzările de autoturisme noi să scadă. În ceea ce privește relația dintre vânzările de SUV-uri
și vânzările de autoturisme noi, este de așteptat ca vânzări mai mici SUV-uri să însemne
vânzări mai mari de autoturisme noi, menținând constante celelalte variabile din ecuație.
Pentru efectuarea testului t se parcurg următorii patru pași:
1. Se formulează ipotezele, nulă și alternativă, pentru fiecare coeficient;
2. Se alege un nivel de semnificație și, prin urmare, o valoare critică t;
3. Se execută regresia și se obține valorile calculate t (rațiile sau scorurile t);
4. Se aplică regula de decizie, comparând valoarea t calculată cu valoarea t critică pentru a
respinge sau a nu respinge ipoteza nulă.

În detaliu, cei patru pași presupun:


1. Formularea ipotezelor, nulă și alternativă, pentru 𝛽1 , 𝛽2 ș𝑖 𝛽3:

1. H0 : 𝛽1 ≤ 0 2. H0 : 𝛽2 ≥ 0 3. H0 : 𝛽3 ≥ 0
HA : 𝛽1 > 0 HA : 𝛽2 < 0 HA : 𝛽3 < 0

(testul t nu se aplică, de obicei, pentru intercept, 𝛽0).

2. Alegerea nivelului de semnificație și, prin urmare, a unei valori critice pentru t. Se
presupune că s-au luat în considerare diversele costuri implicate de erorile de tip 1 și de
tip 2. De regulă, se alege un nivel de semnificație de 5%. Pentru un număr de 10 observări
în setul de date utilizat pentru a testa aceste ipoteze, numărul gradelor de libertate este:
n – k – 1 = 10 – 3 – 1 = 6. La un nivel de semnificație de 5%, valoarea critică a lui t, notată
𝑡𝑐 , poate fi găsită în tabelul t statistic. Aceasta este egală cu 1.943. Nivelul de semnificație
nu trebuie să fie, în mod necesar, același pentru toți coeficienții din aceeași ecuație de
regresie. Costurile implicate de o ipoteză nulă respinsă incorect pentru un coeficient pot
fi mult mai mari decât pentru un alt coeficient, astfel încât utilizarea unor niveluri de
semnificație diferite să fie chiar necesară. În această ecuație, pentru toți cei trei
coeficienți, se utilizează același nivel de semnificație, astfel încât, pentru toți:

𝑡𝑐 = 1.943

3. Se efectuează regresia și se obțin valorile calculate (estimate) ale lui t. Pentru aceasta se
utilizează datele observate (anuale, din 2000 până în 2009). Se rulează regresia pe un
software specializat ( EViews, Stata, …). Se obțin următoarele rezultate OLS:

𝐶𝐴𝑅𝑆𝑡 = 1.30 + 4.91 ∙ 𝑌𝐷𝑡 + 0.00123 ∙ 𝑃𝑅𝐼𝐶𝐸𝑡 − 7.14 ∙ 𝑆𝑈𝑉𝑡


(2.38) (0.00044) (71.38)
t = 2.1 2.8 -0.1

unde:
𝐶𝐴𝑅𝑆𝑡 = numărul de autoturisme noi (în sute de mii de unități), vândute în anul t;
𝑌𝐷𝑡 = venitul disponibil mediu real, în România, în mii euro, în anul t;
𝑃𝑅𝐼𝐶𝐸𝑡 = prețul real al unui autoturism nou, în euro, în anul t;
𝑆𝑈𝑉𝑡 = numărul de SUVuri (Sport Utility Vehicles), mii unități, vândute în anul t;

Pentru documentare, se utilizează forma standard, astfel încât cifrele din paranteze
sunt erorile standard estimate ale estimatorilor parametrilor. Valorile t care se utilizează în
testarea ipotezelor sunt calculate conform relației:

𝛽̂𝑗
𝑡𝑗 = (𝑗 = 1,2, … , 𝑘)
𝑆𝐸(𝛽̂𝑗 )
Pentru variabila SUV, de exemplu, coeficientul estimat divizat la eroarea sa standard
estimată este egal cu: -7.14 / 71,38 = -0,1. Se poate observa că un coeficient estimat negativ
implică o valoare t negativă, deoarece erorile standard sunt întotdeauna pozitive.

4. Se aplică regula de decizie, comparând valoarea t calculată cu valoarea t critică, pentru a


respinge sau a nu respinge ipoteza nulă. După cum s-a menționat în anterior, regula de
decizie pentru testul t este:

Se respinge H0 dacă |𝑡𝑘 | > 𝑡𝑐 și dacă 𝑡𝑘 are și semnul implicat de HA .


Nu se respinge H0 altfel.

Pentru cele trei ipoteze, având în vedere valoarea critică t relevantă (1.943) și valorile t
calculate, se obțin următoarele rezultat:
- pentru 𝛽1: Se respinge H0 dacă |2.1| > 1.943 și dacă 2.1 este pozitiv.
În cazul venitului disponibil, YD, se respinge ipoteza nulă, conform
căreia 𝛽1 ≤ 0, din moment ce 2.1 este într-adevăr mai mare decât 1.943
și este, evident, pozitiv. Rezultatul (care înseamnă HA : 𝛽1 > 0)
corespunde așteptărilor formate pe baza teoriei, venituri mai mari
determinând creșterea numărului de autoturisme noi vândute.
- pentru 𝛽2: Se respinge H0 dacă |2.8| > 1.943 și dacă 2.8 este negativ.
Pentru prețuri, PRICE, statistica t este mare în valoare absolută decât
1.943, dar are un semn contrar așteptărilor, deoarece ipoteza
alternativă implică un semn negativ. Deoarece ambele condiții din
regula de decizie trebuie îndeplinite, nu se poate respinge ipoteza nulă
că prețurile au un efect zero sau pozitiv asupra vânzărilor de mașini noi!
În ciuda surprizei, variabila PRICE se va păstra în ecuație, iar impactul
său așteptat ar trebui să fie negativ. Se observă că estimatorul
coeficientului variabilei PRICE este destul de mic, 0.00123, dar această
valoare este implicată în calculul lui t prin raportarea la eroarea
standard a coeficientului estimat.
- pentru 𝛽3: Se respinge H0 dacă |−0.1| > 1.943 și dacă –0.1 este negativ.
Pentru vânzările de vehicule utilitare sportive, SUV, coeficientul 𝛽3 nu
este statistic semnificativ diferit de zero, deoarece |−0.1| < 1.943 astfel
încât nu se poate respinge ipoteza nulă conform căreia 𝛽3 ≥ 0, chiar
dacă coeficientul estimat are semnul implicat de ipoteza alternativă.
După o reevaluare a acestui model, se poate trage concluzia că
adăugarea variabilei SUV nu a fost oportună.
Figura 3. Testul t unilateral pentru coeficienții modelului CARS

Figura 3 ilustrează toate cele trei rezultate prin reprezentarea valorilor t critice și a
valorilor t calculate, pentru toate cele trei ipoteze nule pe o distribuție t care este centrată în
jurul valorii zero (valoarea din ipoteza nulă cea mai apropiată de granița dintre regiunile de
“acceptare” și de respingere).
Se pot analiza rezultatele testelor unilaterale pentru toți coeficienții estimați. Se pot
face și alte încercări, utilizând un număr diferit de observări și diferite niveluri de
semnificație. Este util, ca exercițiu, de a analiza toate aspectele privind testul t unilateral de
semnificație individuală. În testele săptămânale se regăsesc întrebări referitoare la aceste
aspecte.
Exemple de teste bilaterale

Deși majoritatea ipotezelor din analiza de regresie ar trebui să fie testate prin teste
unilaterale, testele bilaterale sunt adecvate în anumite situații. Economiștii se confruntă
uneori cu ipoteze care ar trebui respinse dacă coeficienții estimați sunt diferiți semnificativ
de zero sau de o valoare diferită de zero, în ambele direcții. Această situație necesită un test
t bilateral. Tipurile de circumstanțe care necesită un test bilateral se încadrează în două
categorii:
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de zero;
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de o valoare
diferită de zero.
În continuare se analizează cu atenție aceste două categorii.

1. Test bilateral dacă un 𝛽̂ este semnificativ diferit de zero

Prima situație care necesită un test bilateral al estimatorului 𝛽̂ al unui coeficient apare
atunci când există două sau mai multe ipoteze contradictorii cu privire la semnul preconizat
al coeficientului respectiv. De exemplu, în ecuația restaurantului Woody, impactul venitului
mediu al unei zone asupra numărului preconizat de clienți Woody din acea zonă este
ambiguu. Un restaurant Woody situat într-un cartier cu un nivel ridicat al veniturilor
locuitorilor săi ar putea avea mulți clienți la cină, dar, la fel de bine, acești clienți ar putea
decide să mănânce la un restaurant mai formal decât Woody. Drept urmare, este nevoie de
efectuarea unui test t bilateral în jurul valorii zero pentru a determina dacă coeficientul
estimat al venitului este semnificativ diferit de zero în ambele direcții. Cu alte cuvinte,
întrucât există motive rezonabile de a aștepta fie un coeficient pozitiv, fie unul negativ, este
necesar să se testeze coeficientul variabilei I, 𝛽𝐼 , cu un test t bilateral:

H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0

Un test bilateral implică, așa cum se poate observa în Figura 4, două regiuni diferite
de respingere (una pozitivă și una negativă) care înconjoară regiunea de “acceptare”.
Valoarea critică, 𝑡𝑐 , trebuie să fie mai mare în cazul testului bilateral pentru a obține același
nivel de semnificație ca în cazul unui test unilateral. Drept urmare, există un avantaj la
testarea ipotezelor cu un test unilateral, dacă teoria de bază permite acest lucru, deoarece,
pentru aceleași valori ale lui t, probabilitatea erorii de tip 1 este la jumătate față de un test
bilateral.
Cu toate acestea, în cazurile în care există argumente teoretice puternice,
economistul nu are nicio alternativă la utilizarea unui test t bilateral în jurul valorii zero. Cei
patru pași ai testului t bilateral, pe exemplul Woody, sunt următorii:
Figura 4. Testul t bilateral al coeficientului lui I din modelul Woody

a. Stabilirea ipotezei nule și a ipotezei alternative:

H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0

b. Alegerea nivelului de semnificație și, prin urmare, a valorii critice, 𝑡𝑐 . Se păstrează nivelul
de semnificație la 5%, dar acum această sumă trebuie distribuită între două regiuni de
respingere, pentru 29 de grade de libertate. Prin urmare, valoarea critică corectă este
𝑡𝑐 = 2.045 (găsită în tabelul statistic t pentru 29 de grade de libertate și un test bilateral
cu nivelul de semnificație de 5%). A se reține că, din punct de vedere tehnic, există acum
două valori critice, +2.045 și -2.045.

c. Se execută regresia și se obține o valoare t calculată, a lui 𝛽̂𝐼 . Deoarece valoarea implicată
de ipoteza nulă este zero, valoarea t calculată este egală cu +2.37 = 1.288 : 0.5432.

d. Se aplică regula de decizie, comparând valoarea t calculată cu valoarea t critică pentru a


respinge sau a nu respinge ipoteza nulă. Se folosește din nou regula de decizie menționată
mai sus, dar din moment ce ipoteza alternativă specifică oricare semn, regula de decizie
se simplifică:

Pentru 𝛽𝐼 : Se respinge H0 dacă |2.37| > 2.045


În acest caz, ipoteza nulă, conform căreia 𝛽𝐼 este egal cu zero, se respinge,
deoarece 2,37 este mai mare decât 2.045 (vezi Figura 4). Se reține că semnul pozitiv
pentru 𝑡𝛽̂𝐼 implică, cel puțin pentru restaurantele Woody, faptul că venitul disponibil
reprezintă un factor de creștere a numărului clienților (considerând populația și
concurența ca fiind constante). Având în vedere acest rezultat, se poate alege
efectuarea unui test unilateral pe setul de date Woody al anului viitor.

2. Test bilateral dacă un 𝛽̂ este semnificativ diferit de o valoare dată, alta decât zero

Al doilea caz de test t bilateral apare atunci când există un motiv pentru a se aștepta o
valoare diferită de zero pentru un coeficient estimat. De exemplu, dacă un cercetător anterior
a afirmat că adevărata valoare a unui anumit coeficient este aproape sigur egală cu un anumit
număr, 𝛽H0 , atunci acest număr va fi cel luat în considerate într-un test t bilateral. În acest
caz, ipotezele nulă și alternativă devin:

H0 : 𝛽𝑘 = 𝛽H0
HA : 𝛽𝑘 ≠ 𝛽H0

unde 𝛽H0 este, prin ipoteză, o valoare diferită de zero. Ca urmare, formula cu care se
calculează scorul t pentru un estimator este:

(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )

Această statistică t este încă distribuită în jurul valorii zero dacă ipoteza nulă este corectă,
deoarece se scade 𝛽H0 din coeficientul de regresie estimat, a cărui valoare așteptată este
presupusă a fi 𝛽H0 atunci când H0 este adevărată. Deoarece statistica t este încă centrată în
jurul valorii zero, regula de decizie menționată anterior este încă aplicabilă.

S-ar putea să vă placă și