Testarea Ipotezelor Și Inferența Statistică

5.
Testarea ipotezelor
Procedurile de testare a ipotezelor sunt explicate aici în termenii modelului de

regresie. Abordarea este de natură clasică, deoarece se presupune că datele din eșantioanele
folosite pentru estimarea parametrilor modelelor de regresie sunt cele mai bune și unicele
informații despre variabilele incluse în modelele respective.
Testarea ipotezelor se practică într-o diversitate de situații. De exemplu, Agenția
Națională a Medicamentului și a Dispozitivelor Medicale, ANMDM, testează noile
medicamente înainte de a permite vânzarea lor. Dacă eșantionul de persoane expuse la noul
medicament arată un efect secundar semnificativ, mai frecvent decât s-ar fi așteptat să apară
din întâmplare, ANMDM nu va permite, probabil, comercializarea acelui medicament. În mod
similar, de aproape un secol, economiștii testează statistic diferite relații între consum și
venituri. Teoriile dezvoltate de John Maynard Keynes și Milton Friedman, printre alții, au fost
testate pe seturi de date macroeconomice și microeconomice. Deși cercetătorii sunt
întotdeauna interesați să afle dacă teoria în cauză este susținută de estimări generate dintr-
un eșantion de observări din lumea reală, este aproape imposibil să demonstreze că o ipoteză
dată este corectă sută la sută. Tot ce se poate face este de a afirma că un anumit eșantion se
conformează unei anumite ipoteze. Chiar dacă nu se poate demonstra că o anumită teorie
este „corectă” folosind testarea ipotezelor, deseori, cu un anumit nivel de încredere, se poate
respinge o anumită ipoteză. Concluzia, într-un astfel de caz, este aceea că, este foarte puțin
probabil ca ipoteza să fie adevărată.
Ipoteza nulă și ipoteza alternativă
Primul pas în testarea ipotezelor este de a formula ipotezele care trebuie testate.
Acest lucru trebuie să se facă înainte de a estima ecuația, deoarece ipotezele dezvoltate după
estimare riscă să fie mai degrabă justificări ale unor rezultate particulare decât teste de
validitate a acestor rezultate. Ipoteza nulă reprezintă, de obicei, o afirmație privind valorile
pe care economistul nu le așteaptă pentru coeficientul testat. Notația folosită pentru a
specifica ipoteza nulă este „H0 :” urmată de o enunțare a intervalului de valori ale
coeficientului, în care acesta este de așteptat să nu se situeze. De exemplu, dacă se așteaptă
ca un coeficient să fie pozitiv, atunci înseamnă că este de așteptat ca acel coeficient să nu fie
zero sau negativ, iar ipoteza nulă se scrie în felul următor:
Ipoteza nulă H0 : 𝛽 ≤ 0 (valori neașteptate pentru coeficientul β)
Ipoteza alternativă este de obicei o afirmație privind valorile pe care coeficientul este
de așteptat să le ia. Notația folosită pentru a specifica ipoteza alternativă este „HA :” urmată
5. Testarea ipotezelor 2
de o enunțare a gamei de valori așteptată pentru un coeficient. Dacă, de exemplu, este de

așteptat ca un coeficient să fie pozitiv, atunci ipoteza alternativă se scrie în felul următor:
Ipoteză alternativă HA : 𝛽 > 0 (valorile așteptate pentru coeficientul β)
La fel, când valorile așteptate pentru β sunt negative, ipotezele nulă și alternativă se scriu în
felul următor:
H0 : 𝛽 ≥ 0
HA : 𝛽 < 0
Testarea acestor ipoteze implică un test unilateral, deoarece ipoteza alternativă

conține valori într-o singură parte (stânga sau dreapta) a ipotezei nule. Când ipoteza
alternativă conține valori în ambele părți ale ipotezei nule, testul este unul bilateral. De
exemplu, pentru un test bilateral în jurul valorii zero, ipotezele nulă și alternativă se scriu în
felul următor:
H0: β = 0
HA: β ≠ 0
Există câteva cazuri rare în care este încălcată regula conform căreia valorile
așteptate ale coeficientului se includ în ipoteza alternativă. Se întâmplă acest lucru deoarece
testarea ipotezelor presupune ca ipoteza nulă să conțină semnul egal într-o anumită formă
(fie că este =, ≤ sau ≥). Această cerință îi obligă pe economiști să pună valoarea pe care o
așteaptă în ipoteza nulă dacă așteptarea lor include un semn egal. Acest lucru se întâmplă de
obicei atunci când economistul specifică o anumită valoare, mai degrabă decât un interval,
pentru un coeficient. Din fericire, astfel de excepții sunt neobișnuite în aplicațiile curente.
Cu excepția cazurilor menționate mai sus, economiștii pun întotdeauna ceea ce
așteaptă în ipoteza alternativă. Acest lucru le permite efectuarea unor afirmații destul de
puternice atunci când se respinge o ipoteză nulă. Cu toate acestea, niciodată nu se poate
spune că se acceptă ipoteza nulă. Afirmațiile făcute prin testarea ipotezelor pot fi
următoarele:
- se respinge ipoteza nulă, H0 ; implicit, se acceptă ipoteza alternativă, HA ;
- nu se poate respinge ipoteza nulă, H0 ;
În justiție, de exemplu, prezumția de „nevinovat până la dovedirea vinovăției”
presupune formularea ipotezelor în felul următor:
H0: Pârâtul este nevinovat.

HA: Pârâtul este vinovat.
O instanță nu poate stabili că pârâtul este nevinovat, ci doar, pe baza probelor administrate,
decide că nu poate respinge prezumția de nevinovăție. Aceasta deoarece, este de datoria
acuzării de a aduce probele care să dovedească că inculpatul este vinovat, probe pe baza
cărora instanța decide respingerea ipotezei nule și declară inculpatul vinovat. Dacă acuzarea
nu poate aduce probe concludente, instanța nu poate decât să constate că, pe baza lor, nu
poate exclude prezumția de nevinovăție, chiar dacă, în fapt, inculpatul este vinovat de
comiterea faptelor incriminate.
Erori de tipul I și de tipul II în testarea ipotezelor
Testarea unei ipoteze privind semnul unui coeficient de regresie sau privind o valoare
a sa, cu excepția termenului liber, reprezintă o preocupare curentă în Econometrie. Deoarece
valorile estimate ale coeficienților de regresie se obțin pe baza unui eșantion de date, nu
pentru întreaga populației, concluziile analizei de regresie pe baza acestor estimări nu sunt
întotdeauna corecte. Astfel, unele ipoteze pot fi adevărate, altele pot fi false. În testarea
ipotezelor pot apărea două tipuri de erori:
- respingerea ipotezei nule, H0 , care, în fapt, este adevărată - erori de tipul I;
- nerespingerea ipotezei nule, H0 , care, în fapt, este falsă - erori de tipul II.
Erorile de tipul I și de tipul II pot apărea deoarece, pe baza unor eșantioane de date
particulare, se pot obține valori atipice ale parametrilor. Fie următoarele ipoteze cu privire
la coeficientul 𝛽:
H0: β ≤ 0
HA: β > 0
Chiar dacă în realitate β nu este pozitiv, estimarea sa particulară obținută pe baza

unui eșantion poate fi o valoare suficient de pozitivă pentru a duce la respingerea ipotezei
nule. Aceasta este o eroare de tip 1 - se respinge ipoteza nulă când este adevărată! Similar,
este posibil să se obțină o estimare a lui β care este suficient de aproape de zero sau negativă
pentru a fi considerat „nesemnificativ de pozitiv”. Un astfel de rezultat poate duce la
„acceptarea” ipotezei conform căreia β ≤ 0, când, în fapt, β > 0. Aceasta este o eroare de tip
2 – nu se respinge ipoteza nulă când este falsă!
Pentru exemplificarea modului în care se pot face erori de tip 1 și de tip 2, se reia
exemplul din justiție. O eroare de tip 1 înseamnă respingerea ipotezei nule, care în fapt, este
adevărată. Aceasta însemnă implicit acceptarea ipotezei alternative, adică declararea a
inculpatului ca fiind vinovat și pedepsirea sa pe nedrept. De-a lungul timpului, astfel de
greșeli s-au înregistrat în practica judiciară. În mod similar, eroarea de tip 2 înseamnă
nerespingerea ipotezei nule, care în fapt este falsă. Pârâtul este declarat nevinovat, rămâne
nepedepsit, el fiind, de fapt, vinovat.
Cei mai mulți dintre noi ar dori ca ambele niveluri de eroare să fie destul de mici, dar
o astfel de certitudine este aproape imposibilă. Greșelile pot apărea, pot exista martori
mincinoși, anumite probe pot fi compromise etc. În lumea reală, scăderea probabilității unei
erori de tip 1 (pedepsirea unui inculpat nevinovat) înseamnă creșterea probabilității unei
erori de tip 2 (nepedepsirea unui inculpat vinovat). Cu cât preocuparea de a nu pedepsi
inculpați nevinovați este mai pregnantă, cu atât mulți inculpați vinovați vor scăpa
nepedepsiți.
Regula de decizie privind testarea ipotezelor
O regulă de decizie este o procedură prin care se decide dacă ipoteza nulă se respinge
sau nu se poate respinge. De obicei, o regulă de decizie implică compararea unei statistici
determinate pe baza unui eșantion cu o valoare critică preselectată, ce poate fi găsită în
tabelele statistice. O regulă de decizie trebuie formulată înainte de obținerea valorilor
estimate ale parametrilor. Gama de valori posibile ale lui 𝛽̂ este împărțită în două regiuni, o
regiune de „acceptare” și o regiune de respingere, unde termenii sunt exprimați în raport cu
ipoteza nulă. Pentru a defini aceste regiuni, trebuie determinată o valoare critică (sau, pentru
un test bilateral, două valori critice) ale lui 𝛽̂ . Astfel, o valoare critică este o valoare care
separă regiunea „de acceptare” de regiunea de respingere la testarea ipotezei nule. Graficele
acestor regiuni de „acceptare” și regiunii de respingere sunt prezentate în figurile 1 și 2.
De exemplu, când valoarea critică este egală cu 1.8, iar 𝛽̂ calculat este mai mare decât
această valoare critică, se poate respinge ipoteza nulă H0 : 𝛽 ≤ 0. Acest lucru este ilustrat în
figura 1. Orice 𝛽̂ mai mare decât 1.8 este situat în regiunea de respingere, în timp ce orice 𝛽̂
mai mic decât 1.8 este situat în regiunea „de acceptare”.
Distribuția de eșantionare, 𝛽̂
Probabilitatea erorii
de tipul I
𝛽̂
0 1.8
Regiune de
Regiune de "acceptare" respingere
Figura 1. Regiunile de “acceptare” și de respingere pentru un test unilateral asupra lui 𝛽

Pentru un test unilateral H0 : 𝛽 ≤ 0 , HA : 𝛽 > 0, valoarea critică împarte distribuția lui 𝛽̂ , centrată în jurul valorii
zero, presupunând că H0 este adevărată, în regiuni de “acceptare” și de respingere
de tipul I
𝛽̂
0
Regiune de Regiune de
Regiune de "acceptare"
respingere respingere
Figura 2. Regiunile de “acceptare” și de respingere pentru un test bilateral asupra lui β
Pentru un test bilateral H0 : 𝛽 = 0 , HA : 𝛽 ≠ 0, se divide distribuția lui 𝛽̂ într-o regiune de “acceptare” și două
regiuni de respingere
Regiunea de respingere măsoară probabilitatea unei erori de tipul I, când ipoteza nulă
este adevărată. Pentru a evita o astfel de eroare, regiunea de respingere poate fi făcută cât
mai mică. Scăderea șansei unei erori de tipul I - respingerea ipotezei nule adevărată,
înseamnă creșterea șansei unei erori de tipul II - nerespingerea unei ipoteze nule falsă. Când
regiunea de respingere este atât de mică încât aproape niciodată nu se respinge o ipoteză
nulă adevărată, atunci nu se va putea respinge nici atunci când aceasta este falsă. Ca urmare,
probabilitatea unei erori de tipul II va crește.
Având în vedere acest lucru, cum se alege între erorile de tipul I și cele de tipul II?
Răspunsul este ușor de dat dacă se cunoaște costul, pentru societate sau pentru factorul de
decizie, al fiecărui tip de eroare. Dacă costul unui tip de eroare este mult mai mare decât
costul celuilalt tip, atunci, evident, se va urmări diminuarea riscului producerii tipului de
eroare mai costisitor.
Testul 𝒕 (Student)
Testul 𝑡 se utilizează pentru a testa diferite ipoteze individuale privind coeficienții

pantă ai regresiei. Testarea unor ipoteze care se referă simultan la mai mult de un coeficient
(ipoteze multiple) este, de obicei, efectuată cu testul 𝐹. Testul 𝑡 este ușor de utilizat, deoarece
contabilizează diferențele dintre unitățile de măsură ale variabilelor și abaterile standard ale
coeficienților estimați. Mai important, statistica 𝑡 este testul adecvat de a fi utilizat atunci
când termenul de eroare stocastică este distribuit normal și când varianța acestei distribuții
rămâne constantă. Întrucât acesta este cazul care se întâlnește de obicei, utilizarea testului
𝑡 pentru testarea ipotezelor individuale a devenit o practică standard în econometrie.
Pentru o ecuație de regresie multiplă tipică:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑗 𝑋𝑗𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝜀𝑖
se pot calcula rații (statistici) 𝑡 pentru fiecare dintre coeficienții estimați în ecuație. În
general, testele 𝑡 sunt efectuate numai pentru coeficienții pantă. Pentru un coeficient pantă,
relația de calcul a rației (scorului) 𝑡 este următoarea:
(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
𝑆𝐸(𝛽̂𝑗 )
unde: 𝛽̂𝑗 = coeficientul de regresie estimat al variabilei independente 𝑋𝑗 ;

𝛽H0 = valoarea de graniță, de obicei egală cu zero, implicată de ipoteza nulă
pentru 𝛽𝑗 ;
𝑆𝐸(𝛽̂𝑗 ) = eroarea standard estimată a lui 𝛽̂𝑗 , adică rădăcina pătrată a varianței
estimate a distribuției 𝛽̂𝑗 ; nu există „căciulă” deasupra lui SE, deoarece
SE este deja definit ca o estimare.
Cum se alege valoarea de graniță care este implicată de ipoteza nulă? Unele ipoteze
nule specifică o anumită valoare. În aceste cazuri, 𝛽H0 este pur și simplu acea valoare. Dacă,
de exemplu, H0 : 𝛽 = 𝑆, atunci 𝛽H0 = 𝑆. Alte ipoteze nule implică intervale, dar prezintă
interes doar valoarea din ipoteza nulă care este cea mai apropiată de granița dintre regiunea
„acceptare” și regiunea de respingere. Această valoare de graniță devine apoi 𝛽H0 . De
exemplu, dacă H0 : 𝛽 ≥ 0 și HA : 𝛽 > 0, atunci valoarea din ipoteza nulă cea mai apropiată
de graniță este zero, și 𝛽H0 = 0. Deoarece majoritatea ipotezelor de regresie testează dacă
un coeficient de regresie particular este semnificativ diferit de zero , valoarea lui 𝛽H0 este de
obicei zero. Cifra zero este deosebit de importantă, deoarece dacă adevăratul 𝛽 este egal cu
zero, atunci variabila independentă atașată lui nu aparține ecuației. Înainte de a elimina
variabila din ecuație și de a forța coeficientul să fie zero, totuși, trebuie testată ipoteza nulă
conform căreia 𝛽 = 0. Astfel, forma cea mai folosită a statisticii t devine:
(𝛽̂𝑗 − 0)
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
care, simplificată, devine:

𝛽̂𝑗
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
Altfel spus, rația Student a unui coeficient este egală cu estimatorul coeficientului
respectiv împărțit la eroarea sa standard. Aceasta este formula de calcul a scorului sau
rației 𝑡 utilizată de majoritatea programelor software specializate. Pentru a ușura
înțelegerea acestui calcul, rezultatele regresiei sunt prezentate într-o formă standard. De
exemplu, pentru regresia Woody, rezultatele obținute sunt:
𝑌̂𝑖 = 102.192 − 9075 ∙ 𝑁𝑖 + 0.3547 ∙ 𝑃𝑖 + 1.288 ∙ 𝐼𝑖

(2053) (0.0727) (0.5432)
t= –4.42 4.88 2.37
n = 33 R̅ = 0.579
2
Numerele din parantezele de sub coeficienții de regresie estimați sunt abaterile sau
erorile standard estimate ale coeficienților, iar numerele de sub ele sunt valorile rațiilor sau
scorurilor 𝑡, calculate prin divizarea valorilor estimate ale coeficienților la abaterile lor
standard. Acest format de prezentare a rezultatelor regresiei este folosit pentru
documentarea proiectului. Pe cât posibil, el va fi folosit de fiecare dată. Se observă că semnul
rațiilor 𝑡 este întotdeauna același cu cel al coeficienților de regresie estimați, iar eroarea
standard este întotdeauna pozitivă. De exemplu, rația 𝑡 pentru variabila 𝑃 se calculează în
felul următor:
𝛽̂𝑃 = 0.3547, 𝑆𝐸(𝛽̂𝑃 ) = 0.727
Dat fiind că H0 : 𝛽𝑃 ≤ 0, valoarea lui 𝑡𝑃 este:
𝛽̂𝑝 0.3547
𝑡𝑝 = = = 4.88
𝑆𝐸(𝛽̂𝑝 ) 0.727
Cu cât valoarea absolută a lui 𝑡 este mai mare, cu atât este mai mare probabilitatea ca
parametrul de regresie estimat să fie semnificativ diferit de zero.
Valoarea critică, 𝒕𝒄 , și regula de decizie
Pentru a decide pe baza unui scor 𝑡 calculat că o ipoteză nulă se respinge sau nu, este
necesară o valoare de referință numită valoare critică, 𝑡𝑐 .
Distribuția estimatorilor, 𝛽̂
𝑡𝑐
𝛽̂
0
Regiune de
Figura 3. Valoarea critică, 𝑡𝑐

Valoarea critică 𝑡𝑐 desparte regiunea de “acceptare” de regiunea de respingere
O valoare 𝑡 critică este valoarea care separă regiunea de „acceptare” de regiunea de

respingere. Valoarea critică, notată 𝑡𝑐 , este selectată dintr-un tabel 𝑡 - tabelul statistic 𝑡, după
cum testul este unilateral sau bilateral, la nivelul de eroare de tip 1 ales și în funcție de
numărul gradelor de libertate. Acestea sunt definite ca fiind numărul de observări minus
numărul de coeficienți estimați, inclusiv termenul liber, adică 𝑛 − 𝑘 − 1. Nivelul de eroare
de tip 1 în testarea unei ipoteze se mai numește nivelul de semnificație.
Tabelul statistic 𝑡 a fost creat pentru a economisi timp în perioada cercetării. Acest
tabel constă din valori 𝑡 critice, date pentru anumite zone sub curba distribuției, cum este
ilustrat în Figura 3, pentru erorile de tip 1. O valoare critică 𝑡 este astfel o funcție a
probabilității erorii de tip 1 pe care cercetătorul dorește să o specifice. După ce se calculează
o valoare 𝑡 și se extrage din tabel o valoare critică, 𝑡𝑐 , se respinge ipoteza nulă dacă valoarea
calculată 𝑡 este mai mare în valoare absolută decât valoarea critică și dacă valoarea calculată
𝑡 are semnul implicat de HA . Astfel, regula care se aplică la testarea individuală a unui
coeficient de regresie 𝛽𝑗 este următoarea:
Se respinge H0 dacă |𝑡𝑗 | > 𝑡𝑐 și 𝑡𝑗 are semnul implicat de HA . Altfel, H0 nu se poate
respinge. Această regulă de decizie se aplică pentru teste unilaterale în jurul valorii zero:
𝐻0 : 𝛽 ≥ 0 respectiv 𝐻0 : 𝛽 ≤ 0
𝐻𝐴 : 𝛽 < 0 𝐻𝐴 : 𝛽 > 0
sau pentru un test bilateral în jurul aceleiași valori:

𝐻0 : 𝛽 = 0
𝐻𝐴 : 𝛽 ≠ 0
De asemenea, testul se aplică pentru teste unilaterale bazate pe valori, altele decât zero:
H0 : 𝛽 ≥ 𝑆 respectiv H0 : 𝛽 ≤ 𝑆
HA : 𝛽 < 𝑆 HA : 𝛽 > 𝑆
sau pentru un test bilateral, bazat pe valori, altele decât zero:
H0 : 𝛽 = 𝑆
HA : 𝛽 ≠ 𝑆
Regula de decizie este aceeași: se respinge ipoteza nulă dacă valoarea calculată a lui
𝑡 este mai mare în valoare absolută decât valoarea critică, atât timp cât semnul valorii
calculate pentru 𝑡 este același ca semnul coeficientului implicat în HA . În caz contrar, ipoteza
H0 nu se poate respinge. Tabelul statistic 𝑡 conține valorile critice 𝑡𝑐 , pentru diferite grade
de libertate și niveluri de semnificație. Coloanele indică nivelurile de semnificație în funcție
de tipul testului: unilateral sau bilateral, iar liniile indică gradele de libertate.
Pentru exemplificarea utilizare acestui tabel și a regulii de decizie, se reia exemplul
Woody. Valoarea lui 𝑡 pentru 𝛽̂𝑃 calculată mai sus este egală cu 4.88. Cum ipoteza conform
căreia coeficientul lui P este pozitiv s-a stabilit deja, ipotezele de testat au următoarea formă:
H0 : 𝛽𝑃 ≤ 0
HA : 𝛽𝑃 > 0
Numărul gradelor de libertate pentru această regresie este egal cu 29, egal cu 𝑛 − 𝑘 − 1,
adică 33 - 3 - 1, deci valoarea cu care se compară valoarea calculată a lui 𝑡 este o valoare 𝑡
critică unică, pentru 29 de grade de libertate. Pentru a găsi această valoare, se alege un nivel
de semnificație. Cel mai adesea, nivelul de semnificație se alege 5% . Se caută în tabelul cu
valorile critice ale lui 𝑡. În Tabelul 1, se poate observa că valoarea critică a lui 𝑡, pentru 29
grade de libertate și pentru un prag de semnificație de 5% este egală cu 1.699. Deoarece
semnul implicat de HA este pozitiv, regula de decizie pentru acest caz specific devine:
se respinge H0 dacă |𝑡𝑝 | > 1.699 și dacă 𝑡𝑃 este pozitiv
sau, combinând cele două condiții:
se respinge H0 dacă 𝑡𝑃 > 1.699

α = 5% test
Aria = 0.05 unilateral
𝛽̂
−1.669 0 1.699
α = 10% test bilateral
Figura 4. Teste unilaterale și teste bilaterale
Cum 𝑡𝑃 = +4.88 > 1.699, se poate trage concluzia că variabila 𝑃 tinde într-adevăr să fie
corelată pozitiv cu volumul vânzărilor Woody, păstrând celelalte variabile din ecuație
constante.
Valoarea critică 𝑡 pentru un test unilateral, la un nivel de semnificație dat, este exact
egală cu valoarea critică 𝑡 pentru un test bilateral, la un nivel de semnificație de două ori mai
mare. Această relație între testele unilaterale și bilaterale este ilustrată în Tabelul 1. Astfel,
de exemplu, valoarea critică 𝑡𝑐 = 1.699 pentru un test unilateral, la un nivel de semnificație
de 5%, este egală cu valoarea critică pentru un test bilateral, la un nivel de semnificație de
10%. Acest lucru este ilustrat în Figura 4.
În Tabelul 1, valorile critice pentru testul unilateral, pentru un anumit nivel de
semnificație, și valorile critice, pentru testul bilateral, pentru un nivel de semnificație dublu,
sunt puse pe aceeași coloană.
Alegerea unui nivel de semnificație
Pentru a completa exemplul dat, a fost necesară alegerea unui nivel de semnificație
înainte ca o valoare critică a lui 𝑡 să fie căutată în tabelul 𝑡-statistic. Cuvintele „semnificativ
pozitiv” poartă, de obicei, interpretarea statistică conform căreia H0 : 𝛽 ≤ 0 a fost respinsă
în favoarea HA : 𝛽 > 0, în conformitate cu regula de decizie prestabilită, pentru un nivel de
semnificație dat. Nivelul de semnificație indică probabilitatea de a observa o valoare
𝑡 estimată mai mare decât valoarea 𝑡 critică, dacă ipoteza nulă ar fi corectă.
Tabelul 1. Valorile critice ale lui 𝑡
Astfel, nivelul de semnificație măsoară probabilitatea erorii de tip 1 implicată de o

anumită valoare 𝑡 critică. De exemplu, dacă nivelul de semnificație ales este de 10% și la acest
nivel se respinge ipoteza nulă, atunci există 10% șanse ca ipoteza nulă să fi fost greșit
respinsă. Nivelul de semnificație se notează, de regulă, cu α.
Cum ar trebui ales nivelul de semnificație? Majoritatea economiștilor consideră că, cu
cât nivelul de semnificație este mai mic, cu atât este mai bine. Un nivel scăzut de semnificație
garantează o probabilitate scăzută de a face o eroare de tip 1. Din păcate, un nivel scăzut de
semnificație crește în mod dramatic probabilitatea de a face o eroare de tip 2. În justiție, de
exemplu, preocuparea excesivă de a nu pedepsi persoane nevinovate poate însemna, în

același timp, șansa mărită ca unii infractori să nu fie pedepsiți. Prin urmare, în afara unor
situații neobișnuite, când nu este importantă „acceptarea” greșită a unei ipoteze nule falsă,
minimizarea nivelului de semnificație nu este o bună practică.
În general, se recomandă utilizarea unui nivel de semnificație de 5%, cu excepția
cazurilor în care se cunoaște ceva neobișnuit despre costurile relative ale erorilor de tip 1 și
de tip 2. Dacă se cunoaște că o eroare de tip 2 va fi extrem de costisitoare, de exemplu, atunci
are sens utilizarea unui nivel de semnificație de 10% pentru determinarea valorii critice.
Totuși, astfel de judecăți sunt dificile, încât este bine, la început, să se utilizeze, ca standard,
un nivel de semnificație de 5%.
Dacă se poate respinge ipoteza nulă la un nivel de semnificație de 5%, se poate trage
concluzia că parametrul sau coeficientul respectiv este „statistic semnificativ” la nivelul de
5%. Deoarece nivelul de 5% este arbitrar ales, nu ar trebui trase concluzii privind
semnificația unei variabile doar pentru că coeficientul său este statistic semnificativ, pentru
un nivel de semnificație redus. Dacă s-ar fi ales un alt nivel de semnificație, rezultatul ar fi
putut fi diferit. Unii cercetători realizează tabele cu rezultate de regresie, de obicei fără să
facă ipoteze asupra semnelor coeficienților, și apoi marchează coeficienții „semnificativi” cu
asteriscuri. Asteriscurile indică momentul în care rația 𝑡 este mai mare în valoare absolută
decât valoarea critică pentru un test bilateral cu α =10% (care merită un asterisc,*), valoarea
critică pentru un test bilateral cu α = 5% (**) sau test bilateral cu α = 1%(***). O astfel de
utilizare a valorii 𝑡 ar trebui considerată ca o descriere mai degrabă decât o utilizare a
statisticilor 𝑡 pentru testarea ipotezelor
Uneori se folosește expresia „grad de încredere” sau „nivel de încredere” atunci când
se testează diferite ipoteze. Nivelul de încredere nu este altceva decât 100% minus nivelul
semnificației. Astfel, într-un test 𝑡 , nivelul de semnificație este 5% poate fi, de asemenea,
exprimat prin nivel de încredere de 95%. Deoarece cei doi termeni au semnificații identice,
se va folosi în continuare expresia nivel de semnificație, pentru a evita orice posibilă confuzie
cu noțiunea de intervale de încredere, care va fi discutată într-un alt context. În contrast, unii
economiști evită să folosească noțiunea de nivel de semnificație, calculând pur și simplu cel
mai scăzut nivel de semnificație posibil pentru fiecare coeficient de regresie estimat.
Nivelurile de semnificație rezultate sunt denumite p-values.
p-Values
Există o alternativă la testul clasic 𝑡, pe baza unei măsuri numite p-value sau nivelul
de semnificație marginal. O valoare p-value pentru un scor 𝑡 reprezintă probabilitatea de a
observa un scor 𝑡 de această mărime sau mai mare (în valoare absolută), dacă ipoteza nulă
ar fi adevărată. Grafic, este de două ori zona aflată sub curba distribuției 𝑡, între valoarea
absolută a rației (scorului) 𝑡 și infinit. O valoare p-value este o probabilitate, de aceea ia
valori de la 0 la 1. P-value arată cel mai mic nivel de semnificație la care se poate respinge
ipoteza nulă (presupunând că estimarea corespunde așteptării incluse în HA ). O valoare mică
a lui p-value pune un semn de întrebare asupra ipotezei nule. Altfel spus, pentru a respinge
o ipoteză nulă, valoarea p-value trebuie să fie cât mai mică.
Cum se calculează un p-value? O opțiune ar fi scotocirea prin pagini și pagini a
tabelelor statistice, în căutarea nivelului de semnificație care să corespundă exact
rezultatului regresiei. Asta ar putea dura zile! Din fericire, pachetele software de regresie
standard calculează automat p-values și le imprimă pentru fiecare coeficient estimat. Astfel,
p-values se pot citi în rezultatele regresie la fel ca valorile estimate ale coeficienților. Cu toate
acestea trebuie procedat cu mare atenție, deoarece pachetele de regresie afișează p-values
pentru ipoteze alternative bilaterale. Ca urmare, p-values includ zonele din ambele „cozi”
ale distribuției, astfel încât p-values bilaterale sunt de două ori mai mari decât cele
unilaterale. Dacă testul efectuat este unilateral, valorile p-value din rezultatele regresiei
trebuie împărțite la 2 înainte de efectuarea oricărui test. Cum se folosește un p-value pentru
a efectua testul 𝑡? Dacă nivelul de semnificație ales este de 5% și p-value este mai mic de
0.05, atunci ipoteza nulă se poate respinge, atât timp cât semnul este în direcția așteptată
(implicat în HA ). Astfel, regula de decizie pe baza lui p-value este: se respinge H0 dacă p-
value < nivelul de semnificație și dacă 𝛽̂𝑘 are semnul implicat de HA . În caz contrar, H0 nu se
poate respinge.
De exemplu, în modelul Woody, utilizarea mărimii p-value pentru a efectua un test 𝑡,
unilateral, pe coeficientul lui 𝐼 (variabila de venit), presupune stabilirea ipotezei nule și a
ipotezei alternative în felul următor:
H0 : 𝛽𝐼 ≤ 0
HA : 𝛽𝐼 > 0
În rezultatele regresiei Woody, prezentate mai sus, p-value pentru 𝛽̂𝐼 este egal cu 0.25.
Aceasta este p-value bilateral. Deoarece testul ales este unilateral, valoarea lui p-value
trebuie împărțită la 2. Se obține 0.25:2 = 0.0125. Această valoare este mai mică decât nivelul
ales de semnificație, de 0.05. Deoarece semnul lui 𝛽̂𝐼 este pozitiv și este cel implicat de HA , se
poate respinge H0 . Rezultatul nu este unul surprinzător, fiind același cu rezultatul obținut
prin efectuarea unui test 𝑡 convențional.
Folosirea valorilor p-values prezintă o serie de avantaje. Sunt ușor de utilizat și
permit celor care citesc rezultatele studiilor să își aleagă propriile niveluri de semnificație în
loc să fie obligați să utilizeze nivelul de semnificație ales de economistul care a făcut
cercetarea inițială. În plus, p-values transmite cititorilor informații despre puterea relativă
cu care se poate respinge o ipoteză nulă. Aceste avantaje îi determină pe mulți economiști să
folosească p-values în mod constant.
În ciuda acestor avantaje, pentru început, efectuarea testului 𝑡 prin utilizarea
valorilor p-values se va folosi mai rar deoarece pregătirea inițială presupune învățarea
procedurii standard de efectuare a testului 𝑡, fiind mai probabil să se creeze obișnuința de a

face ipoteze asupra semnului unui coeficient atunci când un anumit semn poate fi intuit și de
aplica un test unilateral. În plus, cunoașterea procedurii standard de efectuare a testului 𝑡,
implică ușurința de a trece la folosirea lui p-value, reciproca nefiind neapărat adevărată.
Cu toate acestea, economiștii practicieni din zilele noastre depun mai multă energie
pentru a construi modele și pentru a estima valorile coeficienților decât pentru a formula
diferite ipoteze și a le testa. Acest lucru se datorează faptului că majoritatea economiștilor
sunt mai încrezători în teoriile lor (verificate de atâtea ori) decât în calitatea datelor sau în
metodele de regresie. În astfel de situații, în care instrumentele statistice sunt utilizate mai
mult în scopuri descriptive decât în scopul testării ipotezelor, utilizarea valorilor p-values
duce la economisirea timpului și oferă mai multe informații decât procedura standard pentru
testul 𝑡.
Exemple de utilizare a testului 𝐭
Exemple de teste unilaterale
Scopul în care se utilizează cel mai adesea un test 𝑡 unilateral este acela de a
determina dacă un coeficient de regresie este semnificativ diferit de zero, în direcția
prevăzută de teorie (sau așteptată). Dacă pentru un coeficient 𝛽, de exemplu, se așteaptă un
semn pozitiv și se obține un 𝛽̂ negativ, este greu să se respingă posibilitatea ca adevăratul β
să fie negativ (sau zero). Pe de altă parte, dacă se așteaptă un semn pozitiv pentru 𝛽 și se
obține un 𝛽̂ pozitiv, lucrurile devin un pic mai complicate. Dacă 𝛽̂ este pozitiv, dar destul de
aproape de zero, atunci trebuie utilizat un test 𝑡 unilateral pentru a determina dacă 𝛽̂ este
suficient de diferit de zero pentru a permite respingerea ipotezei nule. Reamintim că pentru
a se putea controla probabilitatea erorii de tip 1, este necesară formularea unei ipoteze
alternative, HA : 𝛽 > 0 (semnul așteptat) și a unei ipoteze nule, H0 : 𝛽 ≤ 0.
Se vor parcurge, în continuare, câteva exemple complete de utilizare a unui test 𝑡
unilateral. Se consideră un model simplu al vânzărilor anuale agregate de autoturisme noi,
care specifică faptul că vânzările de autoturisme (CARS) sunt o funcție de venitul real mediu
disponibil (YD) și de prețului mediu cu amănuntul al unui autoturism (PRICE), ajustat de
indicele prețurilor de consum (preț real). Se urmărește testarea unei noi ipoteze: vânzările
de autoturisme noi sunt corelate cu vânzările de vehicule utilitare sportive (Sport Utility
Vehicles = SUV-uri), considerându-se că un număr mai mare de SUV-uri vândute înseamnă
un număr mai mic de autoturisme cumpărate de cumpărători. Prin urmare, se construiește
următorul model de regresie (deasupra parametrilor sunt scrise ipotezele privind semnelor
acestora):
+ – –
𝐶𝐴𝑅𝑆 = 𝛽0 + 𝛽1 𝑌𝐷 + 𝛽2 𝑃𝑅𝐼𝐶𝐸 + 𝛽3 𝑆𝑈𝑉 + 𝜀
Semnele de deasupra coeficienților arată că este de așteptat ca 𝛽1 să fie pozitiv, iar 𝛽2

și 𝛽3 să fie negative. Acest lucru are sens, deoarece este de așteptat ca la venituri disponibile
în creștere vânzările de autoturisme noi să crească, iar la prețuri mai mari ale acestora
vânzările de autoturisme noi să scadă. În ceea ce privește relația dintre vânzările de SUV-uri
și vânzările de autoturisme noi, este de așteptat ca vânzări mai mici SUV-uri să însemne
vânzări mai mari de autoturisme noi, menținând constante celelalte variabile din ecuație.
Pentru efectuarea testului 𝑡 se parcurg următorii patru pași:
1. Se formulează ipotezele, nulă și alternativă, pentru fiecare coeficient;

2. Se alege un nivel de semnificație și, prin urmare, se determină valoarea critică 𝑡𝑐 ;
3. Se execută regresia și se obțin valorile calculate 𝑡 (rațiile sau scorurile 𝑡);
4. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoarea critică 𝑡𝑐 pentru a
respinge sau a nu respinge ipoteza nulă.
În detaliu, cei patru pași sunt următorii:
1. Formularea ipotezelor, nulă și alternativă, pentru 𝛽1 , 𝛽2 ș𝑖 𝛽3:
1. H0 : 𝛽1 ≤ 0 2. H0 : 𝛽2 ≥ 0 3. H0 : 𝛽3 ≥ 0
HA : 𝛽1 > 0 HA : 𝛽2 < 0 HA : 𝛽3 < 0
Testul 𝑡 nu se aplică, de obicei, pentru intercept, 𝛽0.
2. Alegerea nivelului de semnificație și, prin urmare, a unei valori critice 𝑡𝑐 . Se presupune
că s-au luat în considerare diversele costuri implicate de erorile de tip 1 și de tip 2. De
regulă, se alege un nivel de semnificație de 5%. Pentru un număr de 10 observări în setul
de date utilizat pentru a testa aceste ipoteze, numărul gradelor de libertate este: n – k –
1 = 10 – 3 – 1 = 6. La un nivel de semnificație de 5%, valoarea critică a lui 𝑡, notată 𝑡𝑐 ,
poate fi găsită în tabelul 𝑡 statistic. Aceasta este egală cu 1.943. Nivelul de semnificație
nu trebuie să fie, în mod necesar, același pentru toți coeficienții din aceeași ecuația de
regresie. Costurile implicate de o ipoteză nulă respinsă incorect pentru un coeficient pot
fi mult mai mari decât pentru un alt coeficient, astfel încât utilizarea unor niveluri de
semnificație diferite să fie chiar necesară. În această exemplu, pentru toți cei trei
coeficienți, se utilizează același nivel de semnificație, astfel încât, pentru toți:
𝑡𝑐 = 1.943
3. Se efectuează regresia și se obțin valorile calculate sau estimate ale lui 𝑡. Pentru aceasta
se utilizează datele observate (anuale, din 2000 până în 2009). Se rulează regresia cu un
software specializat ( EViews, Stata, …). Se obțin următoarele rezultate OLS:
𝐶𝐴𝑅𝑆𝑡 = 1.30 + 4.91 ∙ 𝑌𝐷𝑡 + 0.00123 ∙ 𝑃𝑅𝐼𝐶𝐸𝑡 − 7.14 ∙ 𝑆𝑈𝑉𝑡

(2.38) (0.00044) (71.38)
t = 2.1 2.8 -0.1
unde:
𝐶𝐴𝑅𝑆𝑡 = numărul de autoturisme noi (în sute de mii de unități), vândute în anul 𝑡;
𝑌𝐷𝑡 = venitul disponibil mediu real, în România, în mii euro, în anul 𝑡;
𝑃𝑅𝐼𝐶𝐸𝑡 = prețul real al unui autoturism nou, în euro, în anul 𝑡;
𝑆𝑈𝑉𝑡 = numărul de SUVuri (Sport Utility Vehicles), în mii unități, vândute în anul 𝑡;
Pentru documentare, se utilizează forma standard, astfel încât cifrele din paranteze
sunt erorile standard estimate ale estimatorilor parametrilor. Valorile 𝑡 care se utilizează în
testarea ipotezelor sunt calculate conform relației:
𝛽̂𝑗
𝑡𝑗 = (𝑗 = 1,2, … , 𝑘)
Pentru variabila 𝑆𝑈𝑉, de exemplu, coeficientul estimat divizat la eroarea sa standard

estimată este egal cu: -7.14 / 71,38 = -0,1. Se poate observa că un coeficient estimat negativ
implică o valoare 𝑡 negativă, deoarece erorile standard sunt întotdeauna pozitive.
4. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoarea critică 𝑡𝑐 , pentru

a respinge sau a nu respinge ipoteza nulă. După cum s-a menționat în anterior, regula de
decizie pentru testul 𝑡 este:
Se respinge H0 dacă |𝑡𝑘 | > 𝑡𝑐 și dacă 𝑡𝑘 are și semnul implicat de HA . Nu se respinge H0
altfel.
Pentru cele trei ipoteze, având în vedere valoarea critică 𝑡𝑐 relevantă (1.943) și valorile 𝑡
calculate, se obțin următoarele rezultat:
- pentru 𝛽1: Se respinge H0 dacă |2.1| > 1.943 și dacă 2.1 este pozitiv.
Pentru venitul disponibil, 𝑌𝐷, se respinge ipoteza nulă, conform căreia 𝛽1 ≤ 0, din
moment ce 2.1 este într-adevăr mai mare decât 1.943 și este, evident, pozitiv. Rezultatul
(care înseamnă că se acceptă HA : 𝛽1 > 0) corespunde așteptărilor formulate pe baza
teoriei, venituri mai mari determinând creșterea numărului de autoturisme noi vândute.
- pentru 𝛽2: Se respinge H0 dacă |2.8| > 1.943 și dacă 2.8 este negativ.
H0 : 𝛽1 ≤ 0
HA : 𝛽1 > 0
Valoarea 𝑡𝛽1
critică, 𝑡 𝑐
𝑡
0 1.943 2.1
Regiune de
H0 : 𝛽2 ≥ 0 𝑡𝛽3
HA : 𝛽2 < 0
H0 : 𝛽3 ≥ 0
HA : 𝛽3 < 0
Valoarea
𝑡𝛽2
critică, 𝑡 𝑐
𝑡
−1.943 − 0.1 0 2.8
Regiune de
Regiune de "acceptare"
respingere
Figura 5. Testul 𝑡 unilateral pentru coeficienții modelului 𝐶𝐴𝑅𝑆
Pentru prețul real al autoturismelor, 𝑃𝑅𝐼𝐶𝐸, statistica 𝑡 este mare în valoare absolută
decât 1.943, dar are un semn contrar așteptărilor, deoarece ipoteza alternativă implică
un semn negativ. Deoarece ambele condiții din regula de decizie trebuie îndeplinite, se
trage concluzia că nu se poate respinge ipoteza nulă conform căreia prețurile au un efect
zero sau pozitiv asupra vânzărilor de mașini noi! În ciuda surprizei, variabila 𝑃𝑅𝐼𝐶𝐸 se
va păstra în ecuație, iar impactul său așteptat ar trebui să fie negativ. Se observă că
estimatorul coeficientului variabilei 𝑃𝑅𝐼𝐶𝐸 este destul de mic, 0.00123, dar această
valoare este implicată în calculul lui 𝑡 prin raportarea la eroarea standard a coeficientului
estimat.
- pentru 𝛽3: Se respinge H0 dacă |−0.1| > 1.943 și dacă –0.1 este negativ.
Pentru vânzările de vehicule utilitare sportive, 𝑆𝑈𝑉, coeficientul 𝛽3 nu este statistic
semnificativ diferit de zero, deoarece |−0.1| < 1.943 astfel încât nu se poate respinge
ipoteza nulă conform căreia 𝛽3 ≥ 0, chiar dacă coeficientul estimat are semnul implicat
de ipoteza alternativă. După o reevaluare a acestui model, se va putea trage concluzia că
adăugarea variabilei 𝑆𝑈𝑉 nu a fost oportună.
Figura 5 ilustrează toate cele trei rezultate prin reprezentarea valorilor critice 𝑡𝑐 și a
valorilor 𝑡 calculate, pentru toate cele trei ipoteze nule pentru o distribuție 𝑡 care este
centrată în jurul valorii zero (valoarea din ipoteza nulă cea mai apropiată de granița dintre
regiunile de “acceptare” și de respingere).
Se pot analiza rezultatele testelor unilaterale pentru toți coeficienții estimați. Se pot face
și alte încercări, utilizând un număr diferit de observări și diferite niveluri de semnificație.
Este util, ca exercițiu, de a analiza toate aspectele privind testul 𝑡 unilateral de semnificație
individuală. În testele săptămânale se vor regăsi întrebări referitoare la aceste aspecte.
Exemple de teste bilaterale
Deși majoritatea ipotezelor din analiza de regresie ar trebui să fie testate prin teste
unilaterale, testele bilaterale sunt adecvate în anumite situații. Economiștii se confruntă
uneori cu ipoteze care ar trebui respinse dacă coeficienții estimați sunt diferiți semnificativ
de zero sau de o valoare diferită de zero, în ambele direcții. Această situație necesită un test
𝑡 bilateral. Situațiile în care este necesară efectuarea unui test bilateral se încadrează în două
categorii:
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de zero;
- teste bilaterale, dacă un coeficient estimat este semnificativ diferit de o valoare, alta
decât zero.
În continuare se vor analiza cu atenție aceste două categorii.
1. Test bilateral dacă un 𝛽 este semnificativ diferit de zero
Prima situație care necesită un test bilateral al pentru un coeficient apare atunci când
există două sau mai multe ipoteze contradictorii cu privire la semnul preconizat al
coeficientului respectiv. De exemplu, în ecuația restaurantului Woody, impactul venitului
mediu al unei zone asupra numărului preconizat de clienți Woody din acea zonă este
ambiguu. Un restaurant Woody situat într-un cartier cu un nivel ridicat al veniturilor
locuitorilor săi ar putea avea mulți clienți la cină, dar, la fel de bine, acești clienți ar putea
decide să mănânce la un restaurant mai formal decât Woody.
𝐻0 : 𝛽𝐼 = 0 Regiune de
𝐻𝐴 : 𝛽𝐼 ≠ 0 "acceptare"
𝑡𝛽𝐼
Regiune de
Regiune de
respingere
respingere
𝑡
−2.045 0 + 2.045 2.37
Valori critice Valoare estimată

a lui 𝑡
Figura 6. Testul 𝑡 bilateral al coeficientului lui 𝐼 din modelul Woody
Ca urmare, este nevoie de efectuarea unui test 𝑡 bilateral în jurul valorii zero pentru a
determina dacă coeficientul estimat al venitului este semnificativ diferit de zero în ambele
direcții. Cu alte cuvinte, întrucât există motive rezonabile de a aștepta fie un coeficient
pozitiv, fie unul negativ, este necesar să se testeze coeficientul variabilei I, 𝛽𝐼 , cu un
test 𝑡 bilateral:
H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0
Un test bilateral implică, așa cum se poate observa în Figura 6, două regiuni diferite
de respingere (una pozitivă și una negativă) care înconjoară regiunea de “acceptare”.
Valoarea critică, 𝑡𝑐 , trebuie să fie mai mare în cazul testului bilateral pentru a obține același
nivel de semnificație ca în cazul unui test unilateral. Drept urmare, există un avantaj la
testarea ipotezelor cu un test unilateral, dacă teoria de bază permite acest lucru, deoarece,
pentru aceleași valori ale lui 𝑡, probabilitatea erorii de tip 1 este la jumătate față de un test
bilateral. Cu toate acestea, în cazurile în care există argumente teoretice puternice,
economistul nu are nicio alternativă la utilizarea unui test 𝑡 bilateral în jurul valorii zero. Cei
patru pași ai testului 𝑡 bilateral, pe exemplul Woody, sunt următorii:
a. Stabilirea ipotezei nule și a ipotezei alternative:
H0 : 𝛽𝐼 = 0
HA : 𝛽𝐼 ≠ 0
b. Alegerea nivelului de semnificație și, prin urmare, a valorii critice, 𝑡𝑐 . Se păstrează nivelul
de semnificație la 5%, dar acum această sumă trebuie distribuită între două regiuni de
respingere, pentru 29 de grade de libertate. Prin urmare, valoarea critică corectă este
𝑡𝑐 = 2.045, extrasă din tabelul statistic t pentru 29 de grade de libertate și un test
bilateral cu nivelul de semnificație de 5%. Din punct de vedere tehnic, există acum două
valori critice, +2.045 și -2.045.
c. Se execută regresia și se obține o valoare 𝑡 calculată, a lui 𝛽̂𝐼 . Deoarece valoarea implicată
de ipoteza nulă este zero, valoarea 𝑡 calculată este egală cu +2.37 = 1.288 : 0.5432.
d. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoarea 𝑡 critică pentru a

respinge sau a nu respinge ipoteza nulă. Se folosește din nou regula de decizie menționată
mai sus, dar din moment ce ipoteza alternativă specifică oricare semn, regula de decizie
se simplifică:
Pentru 𝛽𝐼 : Se respinge H0 dacă |2.37| > 2.045
În acest caz, ipoteza nulă, conform căreia 𝛽𝐼 este egal cu zero, se respinge, deoarece 2,37 este
mai mare decât 2.045. Se reține că semnul pozitiv pentru 𝑡𝛽𝐼 implică, cel puțin pentru
restaurantele Woody, faptul că venitul disponibil reprezintă un factor de creștere a
numărului clienților, considerând populația și concurența ca fiind constante. Având în
vedere acest rezultat, se poate alege efectuarea unui test unilateral pe setul de date Woody
al anului viitor.
2. Test bilateral dacă un 𝛽̂ este semnificativ diferit de o valoare dată, alta decât zero
Al doilea caz de test 𝑡 bilateral apare atunci când există un motiv pentru a se aștepta
o valoare diferită de zero pentru un coeficient estimat. De exemplu, dacă un cercetător
anterior a afirmat că adevărata valoare a unui anumit coeficient este aproape sigur egală cu
un anumit număr, 𝛽H0 , atunci acest număr va fi cel luat în considerate într-un test 𝑡 bilateral.
În acest caz, ipotezele nulă și alternativă devin:
H0 : 𝛽𝑘 = 𝛽H0
HA : 𝛽𝑘 ≠ 𝛽H0
unde 𝛽H0 este, prin ipoteză, o valoare diferită de zero. Ca urmare, formula cu care se
calculează scorul 𝑡 pentru un coeficient este:
(𝛽̂𝑗 − 𝛽H0 )
𝑡𝑗 = 𝑗 = 1,2, … , 𝑘
Această statistică 𝑡 este încă distribuită în jurul valorii zero dacă ipoteza nulă este corectă,
deoarece se scade 𝛽H0 din coeficientul de regresie estimat, a cărui valoare așteptată este
presupusă a fi 𝛽H0 atunci când H0 este adevărată. Deoarece statistica 𝑡 este încă centrată în
jurul valorii zero, regula de decizie menționată anterior este încă aplicabilă.
Limite ale testului 𝒕
O problemă cu testul 𝑡 este aceea se poate greși cu ușurință în utilizarea sa. Scorurile
𝑡 sunt calculate și afișate de pachete software de regresie, iar testul 𝑡 pare ușor de efectuat,
astfel încât economiștii începători încearcă uneori să folosească testul 𝑡 pentru a
„demonstra” lucruri pe care acest test nu a intenționat niciodată să le demonstreze. Din acest
motiv, este probabil la fel de important ca limitele testului 𝑡 să fie cunoscute, precum este de
importantă cunoașterea aplicării acestui test. Poate că cea mai importantă dintre aceste
limitări, aceea că utilitatea testului 𝑡 se diminuează rapid pe măsură ce din ce în ce mai multe
specificații sunt estimate și testate. Acest lucru se va discuta însă într-o secțiune viitoare.
Scopul prezentei secțiuni este de a oferi câteva exemple despre modul în care testul 𝑡 nu
trebuie utilizat.
1. Testul 𝑡 nu testează validitatea teoretică
Scopul testului 𝑡 este acela de a ajuta cercetătorul să facă inferențe despre un anumit
coeficient al populației pe baza unei estimări obținute dintr-un eșantion din acea populație.
Unii cercetători începători trag concluzia că orice rezultat semnificativ statistic este, de
asemenea, unul corect teoretic. Acest lucru este periculos deoarece o astfel de concluzie
confundă semnificația statistică cu validitatea teoretică. Ca exemplu, fie următoarea regresie
estimată, care explică indicele prețurilor de consum din Regatul Unit:
𝑃̂ = 10.9 − 3.2𝐶 + 0.39𝐶 2

(0.23) (0.02)
𝑡 = −13.9 19.5
̅
𝑅 2 = 0.982 𝑛 = 21
Se aplică testul 𝑡 la aceste estimări. Se poate observa cu ușurință că cei doi coeficienți pantă
sunt statistic semnificativi. Surpriza apare în definirea variabilelor, 𝑃 reprezentând indicele
prețurilor de consum, iar 𝐶 cantitatea anuală cumulată de precipitații din Regatul Unit!
Astfel, utilizând testul 𝑡 s-a demonstrat că ploaia este statistic semnificativă în explicarea
prețurilor de consum, dar aceasta arată, de asemenea, că teoria de bază este valabilă?
Desigur că nu. De ce este atât de semnificativ rezultatul statistic? Răspunsul este că,
întâmplător, există o tendință comună pe ambele părți ale ecuației. Această tendință comună
nu are însă nicio semnificație.
Morala ar trebui să fie clară: niciodată nu trebuie trasă concluzia că semnificația
statistică, așa cum este arătată de testul 𝑡, este aceeași cu validitatea teoretică. Ocazional,
coeficienții estimați vor fi semnificativi în direcția opusă celei stabilite la formularea
ipotezelor, iar unii cercetători începători pot fi tentați să schimbe ipotezele. De exemplu, un
student ar putea rula o regresie în care semnul așteptat al unui coeficient pantă este pozitiv,
să obțină un semn negativ „semnificativ statistic” și să fie tentat să schimbe așteptările
teoretice pentru a „aștepta” un semn negativ după „regândirea” problemei. Deși este
admirabilă reexaminarea teoriile incorecte pe baza unor noi dovezi, aceste dovezi ar trebui
să fie, în cea mai mare parte, de natură teoretică. Dacă dovezile determină un cercetător să
se întoarcă la bazele teoretice ale unui model și să găsească o greșeală, atunci ipoteza nulă ar
trebui modificată, dar atunci această nouă ipoteză ar trebui testată folosind un set de date
complet diferit. La urma urmei, se știe deja care va fi rezultatul dacă ipoteza va fi testată
folosind vechiul set de date.
2. Testul 𝑡 nu testează „importanța”
O posibilă utilizare a unei ecuații de regresie este de a ajuta la determinarea variabile

independente care are cel mai mare efect relativ (importanță) asupra variabilei dependente.
Unii cercetători începători trag concluzia nejustificată că variabila cea mai semnificativă
statistic din regresia lor estimată este, de asemenea, cea mai importantă în ceea ce privește
explicarea celei mai mari porțiuni a mișcării variabilei dependente. Semnificația statistică
spune puțin - dacă spune ceva - despre variabilele care determină partea majoră a variației
variabilei dependente. Pentru a determina importanța, ar avea mai mult sens o măsură
precum mărimea coeficientului înmulțită cu media sau eroarea standard a variabilei
independente.
Pentru exemplificare, se consideră următoarea ecuație ipotetică:
𝑌̂ = 300.0 + 10.0𝑋1 + 200.0𝑋2

(1.0) (25.0)
𝑡 = 10.0 8.0
𝑅̅ = 0.90
2
𝑛 = 30
unde: 𝑌 = vânzări prin corespondență pe rețetele O’Henry’s Oyster Recipes;

𝑋1 = cheltuieli de publicitate, în sute de dolari, în revista Gourmets’ Magazine;

𝑋2 = cheltuieli de publicitate, în sute de dolari, pentru Julia Adult TV Cooking Show.
Se presupune că toți ceilalți factori, inclusiv prețurile, calitatea și concurența, rămân

constante în timpul perioadei de estimare. Unde ar trebui să-și cheltuiască banii pentru
publicitate O’Henry? Adică, ce variabilă independentă are cel mai mare impact pe dolar
asupra lui 𝑌? Având în vedere că coeficientul lui 𝑋2 este de 20 de ori mai mare decât
coeficientul lui 𝑋1, ar rezulta că 𝑋2, așa cum este definit, este mai important decât 𝑋1. Totuși,
care coeficient este mai semnificativ diferit de zero în sens statistic? Având un scor 𝑡 egal cu
10, 𝑋1 este mai semnificativ statistic decât 𝑋2, al cărui scor 𝑡 este egal cu 8. Tot ce ceea ce
înseamnă acest lucru însă este faptul că există mai multe dovezi că coeficientul lui 𝑋2 este
pozitiv, nu că variabila în sine este neapărat mai importantă în determinarea 𝑌.
3. Testul 𝑡 nu este destinat testelor la nivelul întregii populații
Testul 𝑡 ajută la realizarea inferenței privind valoarea reală a unui parametru pe baza
unei estimări calculată dintr-un eșantion al populației (grupul din care este prelevat
eșantionul). Dacă un coeficient este calculat din întreaga populație, atunci o estimare
nedeplasată măsoară deja valoarea populației și un test 𝑡 semnificativ nu adaugă nimic
acestei cunoștințe. Nu trebuie acordată prea multă importanță scorurilor 𝑡 care au fost
obținute din eșantioane care au aproximativ dimensiunea populației. Acest aspect poate fi
cel mai bine înțeles amintind că scorul 𝑡 este coeficientul de regresie estimat împărțit la
eroarea standard a coeficientului de regresie estimat. Dacă dimensiunea eșantionului este
suficient de mare pentru a se apropia de populație, atunci eroarea standard se va apropia de
zero și scorul 𝑡 va deveni în cele din urmă:
𝛽̂
𝑡= =∞
0
Astfel, simpla existență a unui scor 𝑡 mare pentru un eșantion imens nu are nicio
semnificație reală.
Intervale de încredere
Un interval de încredere este un interval de valori care va conține valoarea adevărată

a unui coeficient 𝛽, un anumit procent din timp, de exemplu 90 sau 95 la sută. Formula
pentru calculul unui interval de încredere este:
Intervalul de încredere al lui 𝛽 = 𝛽̂ ± 𝑡𝑐 𝑆𝐸(𝛽̂ )
unde 𝑡𝑐 este valoarea critică bilaterală a statisticii 𝑡 pentru nivelul de semnificație ales. Dacă
interval de încredere dorit de 90%, se alege valoarea critică 𝑡𝑐 pentru nivelul de semnificație
de 10%. Pentru un interval de încredere de 95%, se va alege valoarea critică 𝑡𝑐 pentru un
nivel de semnificație de 5%. Pentru a vedea cum pot fi utilizate intervalele de încredere
pentru testarea unor ipoteze, se revene la ecuația Woody pentru a testa semnificația
coeficientului variabilei independente 𝐼( venitul):
𝑌̂𝑖 = 102.192 − 9075𝑁𝑖 + 0.354𝑃𝑖 + 1.288𝐼𝑖

(2053) (0.0727) (0.543)
𝑡 = −4.42 4.88 2.37
̅ 2
𝑅 = 0.579 𝑛 = 33
De obicei, este de așteptat ca vânzările unui restaurant să crească odată cu creșterea

venitului populației (un bun normal), dar Woody este un lanț de restaurante de nivel destul
de scăzut, deci există șansa ca vânzările să se reducă dacă venitul devine prea mare (un bun
inferior). Ca urmare, mulți econometricieni ar alege ipoteza nulă H0 : 𝛽𝐼 = 0. Astfel, pentru
determinarea semnificației statistice se va efectua un test bilateral pentru 𝛽𝐼 . Într-o situație
în care un test bilateral este adecvat, calculul intervalului de încredere are sens.
Cum se procedează pentru calculul intervalului de încredere de 90% pentru 𝛽𝐼 ? Se
cunosc 𝛽̂𝐼 = 1,288 și 𝑆𝐸(𝛽̂𝐼 ) = 0.543. Se determină valoarea critică 𝑡𝑐 pentru un nivel de
semnificație de 10% test bilateral, pentru 29 de grade de libertate. Folosind Tabelul 1, se
obține 𝑡𝑐 = 1.6991. Înlocuind aceste valori în ecuația de calcul a intervalului de încredere se
obține:
Intervalul de încredere de 90% în jurul lui 𝛽̂𝐼 = 1.288 ± 1.699 ∙ 0.543 =
= 1.288 ± 0.923
de unde:
0.365 ≤ 𝛽𝐼 ≤ 2.211
Care este semnificația acestui interval? Dacă ipotezele clasice sunt valabile, formula
de calcul a intervalului de încredere produce intervale care conțin adevărata valoare a lui 𝛽
90% din timp. În cazul analizat, există șanse de 90% ca adevărata valoare a lui 𝛽𝐼 să fie între
0,365 și 2,211. Dacă 𝛽𝐼 nu se află în acest interval, acest lucru se datorează unui eșantion
nefericit construit.
Cum se poate folosi un interval de încredere pentru un test de ipoteză bilateral? Dacă
ipoteza nulă este H0 : 𝛽𝐼 = 0, aceasta se poate respinge la nivelul de semnificație de 10%,
deoarece 0 nu se află în intervalul de încredere. Dacă ipoteza nulă ar fi H0 : 𝛽𝐼 = 1, nu s-ar
putea respinge această ipoteză deoarece 1 se află în intervalul de încredere. În general, nu se

poate respinge ipoteza nulă dacă valoarea specificată de aceasta se află în intervalul de
încredere.
Astfel, intervalele de încredere pot fi utilizate pentru efectuarea testele bilaterale, dar
sunt mai complicate. Cu alte cuvinte, de ce este necesară calcularea lor, de vreme ce există o
modalitate mai simplă de efectuare a acestor teste? Intervalele de încredere sunt foarte utile
pentru că oferă o informație suplimentară despre cât de precisă este o estimare a
coeficientului unei variabile independente. Și pentru mulți oameni care utilizează
econometria în lumea reală, acest lucru poate fi mai important decât testarea ipotezelor. Un
exemplu va face mai ușor de înțeles acest lucru.
Grace este un antreprenor de construcții specializat în case pentru familii tinere. Este
o afacere cu adevărat competitivă, așa că, pentru a obține profit, Grace trebuie să
construiască case atrăgătoare, dar ieftine. Ca urmare, Grace ar vrea să știe ce caracteristici
poate adăuga la casele sale, care vor duce la creșterea prețului de vânzare mai mult decât îi
vor crește costurile. Întrucât a învățat econometrie la facultate, Grace decide să estimeze un
model al prețurilor caselor pentru familii tinere din orașul său folosind 13 variabile
independente, cum ar fi suprafața în metri pătrați, numărul de băi etc. Ea speră să folosească
rezultatele pentru a decide ce facilități trebuie adăugate caselor astfel încât profitul obținut
să fie cât mai mare.
Cât de mult ar putea crește prețul de vânzare o baie suplimentară? Grace știe costul
ei marginal pentru adăugarea unei noi băi, care este de aproximativ 8000 de dolari. Pentru a
estima modelul, ea colectează date despre 100 de case recent vândute din orașul său.
Rezultatele estimării sunt ilustrate în primul rând al tabelului 2. Valoarea estimată a
coeficientului numărului de băi este de aproximativ 21770 USD, cu mult peste costul
marginal de 8000 USD. Aceasta înseamnă că o nouă baie i-ar spori încasările cu 21770 USD,
în timp ce costurile ar crește doar cu 8000 USD. A adăuga o baie pare o afacere fantastică,
nu? Totuși, decizia nu trebuie luată așa de repede. Dacă se analizează intervalul de încredere
de 90% din primul rând al tabelului 2, se observă că acesta este imens, variind de la
aproximativ 187 $ la 43356 $. Dacă adevărata valoare a coeficientului se află în acest interval,
există șanse destul de mari să fie sub 8.000 USD, ceea ce înseamnă că Grace ar pierde bani
adăugând o baie unei locuințe. Tot așa de bine, ar putea obține un câștig foarte mare. Ce ar
trebui făcut pentru a micșora această varianță foarte mare? Așa cum s-a discutat în cursul
trecut, când s-a prezentat noțiunea de distribuție de eșantionare, creșterea volumului
eșantionului duce la scăderea varianței acesteia. Cu alte cuvinte, pe măsură ce mărimea
eșantionului crește, 𝛽̂ tinde să se apropie din ce în ce mai mult de adevărata valoare a lui 𝛽.
Ca urmare, intervalul de încredere pentru 𝛽 se micșorează. Cunoscând acest lucru, Grace
decide să mărească volumul eșantionul la 1000 de case observate.
Tabelul 2. Rezultate selective ale regresiei

Modelul include 13 variabile independente, astfel încât prima regresie are 86 de grade de libertate, iar a doua
are 986 grade de libertate.
obs variabile coeficienți eroarea standard 𝒕 𝒑 − 𝒗𝒂𝒍𝒖𝒆 [90% interval de încredere]

100 baie 21771.65 12981.100 1.68 0.097 187.1275 până la 43356.18
1000 baie 12935.06 2787.154 4.64 0.000 8346.288 până la 17523.83
Rezultatele obținute pentru 𝛽̂𝑏𝑎𝑖𝑒 când 𝑛 = 1000 sunt prezentate în Tabelul 2, chiar
sub cele pentru 𝑛 = 100. Se poate observa că 𝛽̂𝑏𝑎𝑖𝑒 a scăzut de la aproape 22000 $ la mai
puțin de 13000 $. Asta înseamnă că Grace nu ar mai trebui să adauge o baie? Nu este deloc
așa! Dacă se analizează intervalul de încredere de 90%, se poate constată că limita inferioră
a crescut la 8346,29 dolari, ceva mai mult decât costul marginal de 8.000 dolari.
Deși Grace ar putea pierde în continuare bani din adăugarea unei băi, cîștigul pare
mult mai sigur decât sugerează rezultatele obținute folosind un volum mic al eșantionului.
De ce un interval de încredere devine mai restrâns când se folosește un eșantion mai mare?
Cum se poate observa în ecuația de calcul a intervalului de încredere, mărimea acestuia
depinde în totalitate de produsul dintre 𝑡𝑐 și 𝑆𝐸(𝛽̂ ). Ce se întâmplă cu 𝑡𝑐 și 𝑆𝐸(𝛽̂ ) pe măsură
ce mărimea eșantionului crește? Din Tabelul 1, se poate observa că pe măsură ce
dimensiunea eșantionului crește, 𝑡𝑐 scade. În același timp, pe măsură ce dimensiunea
eșantionului crește, varianța distribuției de eșantionare scade, astfel încât 𝑆𝐸(𝛽̂ ), care este
rădăcina pătrată a varianței estimate, scade și ea. Dacă atât 𝑡𝑐 cât și 𝑆𝐸(𝛽̂ ) scad, atunci
produsul lor trebuie să scadă, iar un eșantion mai mare va duce într-adevăr la un interval de
încredere mai restrâns. Acest exemplu ilustrează modul în care intervalele de încredere
oferă informații despre cât de precis este un coeficient estimat. În plus, intervalele de
încredere sunt extrem de utile în prognoză. Acest subiect se va aborda într-un capitol viitor.
Testul F
Deși testul 𝑡 este de neînlocuit pentru testarea unor ipoteze individuale puse asupra
unor coeficienții de regresie, acesta nu poate fi folosit pentru a testa mai multe ipoteze
simultan. O astfel de limitare este nefericită, deoarece multe idei interesante implică mai
multe ipoteze sau implică o ipoteză despre mai mulți coeficienți simultan. De exemplu, se
poate cere testarea ipotezei nule că nu există nicio variație sezonieră într-o ecuație de
regresie trimestrială, care are variabile dummy pentru anotimpuri. Pentru a testa o astfel de
ipoteză, majoritatea cercetătorilor folosesc testul 𝐹.
Testul F este un test formal care este conceput pentru a testa o ipoteză nulă care
conține multiple ipoteze sau o singură ipoteză despre un grup de coeficienți. Astfel de ipoteze
nule „comune” sau „compuse” sunt adecvate ori de câte ori teoria economică de bază
specifică anumite valori sau condiții simultane pentru mai mulți coeficienți. Modul în care
funcționează testul 𝐹 este destul de ingenios. Primul pas este de a transpune în ipoteza nulă
condițiile sau restricțiile care vor fi puse asupra coeficienților din ecuația de regresie. Se
analizează apoi ecuația de regresie ca și cum ipoteza nulă ar fi corectă. Astfel, se substituie
în ecuația de regresie valorile coeficienților cu cele din ipoteze pentru a vedea ce s-ar
întâmpla cu ecuația dacă ipoteza nulă ar fi corectă. Ca urmare, în testul 𝐹 ipoteza nulă
conduce întotdeauna la o ecuație restrânsă sau constrânsă, chiar dacă aceasta încalcă
practica standard conform căreia ipoteza alternativă conține ceea ce se așteaptă să fie
adevărat.
Al doilea pas în efectuarea unui test 𝐹 este estimarea cu OLS a ecuației restrânse sau
constrânse și compararea gradului de potrivire (ajustare) al acestei ecuații cu gradul de
potrivire al ecuației inițiale. Dacă gradele de potrivire ale ecuației constrânse și ale ecuației
neconstrânse nu sunt substanțial diferite, ipoteza nulă nu ar trebui respinsă. Dacă gradul de
ajustare al ecuației neconstrânse este substanțial mai bun decât cel al ecuației constrânse,
atunci se respinge ipoteza nulă. Gradul de ajustare al ecuației constrânse nu este niciodată
superior gradului de ajustare al ecuației neconstrânse, așa cum se va explica în continuare.
Gradele de ajustare ale ecuațiilor, constrânsă și neconstrânsă, sunt incluse în calculul
statisticii generale 𝐹:
(𝑅𝑆𝑆𝑀 − 𝑅𝑆𝑆)/𝑚
𝐹=
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1)
unde:
𝑅𝑆𝑆 = suma de pătrate de reziduuri din ecuația fără condiții;
𝑅𝑆𝑆𝑀 =suma de pătrate de reziduuri din ecuația cu condiții;
𝑚 = nr. de condiții impuse în ecuație, uzual, egal cu numărul de coeficienți 𝛽 eliminați din
ecuația fără condiții;
𝑛 − 𝑘 − 1 = numărul gradele de libertate în ecuația fără condiții.
𝑅𝑆𝑆𝑀 este întotdeauna mai mare sau egal cu 𝑅𝑆𝑆. Impunerea condițiilor pentru
coeficienți nu permite 𝑂𝐿𝑆 să-și selecteze valorile care să scadă suma de pătrate de
reziduuri, așa cum ar face în lipsa acestor condiții. (𝑂𝐿𝑆 selectează acea combinație de valori
ale coeficienților care minimizează 𝑅𝑆𝑆.) La extremă, dacă regresia neconstrânsă produce
exact aceiași coeficienți estimați ca și regresia constrânsă, atunci 𝑅𝑆𝑆 este egală cu 𝑅𝑆𝑆𝑀 , iar
statistica 𝐹 este zero. În acest caz, H0 nu poate fi respinsă, deoarece datele indică faptul că
restricțiile par a fi corecte. Pe măsură ce diferența dintre coeficienții asupra cărora s-au pus
condiții și coeficienții fără condiții crește, datele indică faptul că ipoteza nulă este mai puțin
probabilă să fie adevărată. Astfel, atunci când 𝐹 devine mai mare decât valoarea critică, 𝐹𝑐 ,
condițiile specificate în ipoteza nulă sunt respinse.
Regula de decizie ce se utilizează la testul 𝐹 este de a respinge ipoteza nulă dacă

valoarea 𝐹 calculată este mai mare decât valoarea critică 𝐹𝑐 :
Se respinge 𝐻0 dacă 𝐹 > 𝐹𝑐

Nu se poate respinge 𝐻0 dacă 𝐹 ≤ 𝐹𝑐
Valoarea critică 𝐹𝑐 este determinată dintr-un tabel statistic, în funcție de nivelul de

semnificație ales și de gradele de libertate. Statistica 𝐹 are două tipuri de grade de libertate:
gradele de libertate pentru numărătorul ecuației, egal cu 𝑚, numărul de constrângeri
implicate de ipoteza nulă și gradele de libertate pentru numitorul ecuației ,(𝑛 − 𝑘 – 1),
adică gradele de libertate în ecuația de regresie fără condiții. Principiul de bază este că, dacă
valoarea 𝐹 calculată este mai mare decât valoarea critică, atunci gradul de ajustare realizat
de ecuația originală este substanțial mai bun decât gradul de ajustare al ecuației cu condiții,
iar ipoteza nulă se poate respinge.
Testul 𝑭 de semnificație globală
Deși 𝑅 2 și 𝑅̅ 2 măsoară gradul general de ajustare specific unei ecuații de regresie

(overall fit), acestea nu presupun un test formal al unei ipoteze privind ajustarea totală. Un
astfel de test este testul 𝐹 de semnificație globală (generală). Ipoteza nulă într-un test 𝐹 de
semnificație globală este aceea că toți coeficienții pantă din ecuația sunt simultan egali cu
zero. Cu alte cuvinte, cu testul 𝐹 se testează ipoteza conform căreia ansamblu variabilelor
explicative incluse în model determină o bună ajustare sau potrivire a modelului cu datele
observate. Pentru o ecuație cu 𝑘 variabile independente, ipotezele nule și alternative sunt:
H0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 = 0
HA : H0 nu este adevărată.
Pentru a arăta că ajustarea (potrivirea) generală a ecuației estimate este semnificativă

statistic, trebuie să se poată respinge această ipoteză nulă folosind testul 𝐹. Pentru testul de
semnificație globală, valoarea calculată pentru 𝐹 este cea rezultată din următoarea ecuație:
2
𝐸𝑆𝑆/𝑘 ∑(𝑌̂𝑖 − 𝑌̅) /𝑘
𝐹= =
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1) ∑(𝑒𝑖2 )/(𝑛 − 𝑘 − 1)
Acesta este raportul dintre variabilitatea explicativă (𝑆𝑆𝐸) și variabilitatea reziduală (𝑅𝑆𝑆),
ajustate cu numărul de variabile independente (𝑘) și numărul de observări din eșantion (𝑛).
În acest caz, ecuația restrânsă, cea care se obține prin înlocuirea coeficienților cu valorile lor
din ipoteza nulă, este:
𝑌𝑖 = 𝛽0 + 𝜀𝑖
ceea ce nu spune altceva decât că 𝑌̂𝑖 = 𝑌̅. Astfel, testul 𝐹 de semnificație globală testează cu
adevărat ipoteza nulă potrivit căreia gradul de ajustare realizat de ecuație nu este mai bun
decât cel obținut folosind doar media valorilor observate.
Pentru a vedea cum se aplică testul 𝐹, se reia modelul Woody, pentru testarea
semnificației globale. Deoarece există trei variabile independente, ipotezele nulă și
alternativă sunt:
H0 : 𝛽𝑁 = 𝛽𝑃 = 𝛽𝐼 = 0
HA : H0 nu este adevărată
Pentru a decide dacă se respinge sau nu ipoteza nulă, se calculează mai întâi statistica
𝐹. Există trei condiții în ipoteza nulă (trei semne de egalitate), deci 𝑘 = 3. Numărul de
observări este 𝑛 = 33. Se estimează ecuația fără condiții și se obține variabilitatea reziduală,
𝑅𝑆𝑆 = 6133300000 și variabilitatea explicativă 𝐸𝑆𝑆 = 9928900000. Astfel, valoarea lui
𝐹 este egală cu:
𝐸𝑆𝑆/𝑘 9928900000/3
𝐹= = = 15.65
𝑅𝑆𝑆/(𝑛 − 𝑘 − 1) 6133300000/29
În practică, acest calcul nu este necesar deoarece fiecare pachet de regresie oferă, în
mod obișnuit, raportul 𝐹 calculat în scopul efectuării testului de semnificație globală. În cazul
în care pentru estimare se folosește EViews, valoarea statisticii F poate fi găsită în partea de
jos a tabelului rezultatelor.
Regula de decizie spune că ipoteza nulă se respinge dacă valoarea 𝐹 calculată este mai
mare decât valoarea critică 𝐹𝑐 . Pentru a determina valoarea 𝐹 critică, trebuie ales nivelul de
semnificație și, de asemenea, trebuie cunoscut numărul gradelor de libertate. Dacă nivelul
de semnificație ales este de 5%, numărul gradelor de libertate de la numărător, 𝑘, este egal
cu 3, iar numărul de grade de libertate de la numitor, 𝑛 – 𝑘 – 1, este egal cu 29, atunci 𝐹𝑐 este
egal cu 2.93, mult sub valoarea calculată a lui 𝐹, de 15,65. Astfel, ipoteza nulă se respinge. Se
trage concluzia că, ecuația Woody are într-adevăr un grad de ajustare global semnificativ.
La fel cum p-value oferă o abordare alternativă la testul 𝑡, există o abordare
alternativă la testul 𝐹 de semnificație globală. Majoritatea programelor de estimare
raportează nu numai valoarea F pentru testul de semnificație globală, ci și valoarea p-value
asociată testului respectiv (în EViews aceasta este denumită “Prob(F-statistic)”). Pentru
exemplificare, se caută „Prob( F-statistic)” în partea de jos a tabelului rezultatelor regresiei
Woody, coloana din stânga. Dacă mărimea Prob( F-statistic) este mai mică decât nivelul de
semnificație ales, ipoteza nulă se respinge.
Alte utilizări ale testului 𝑭
Există multe alte utilizări ale testului 𝐹 pe lângă testul de semnificație globală. De
exemplu, se poate utiliza testul 𝐹 pentru testarea semnificației variabilelor sezoniere
dummy. Variabilele sezoniere dummy sunt variabile dummy care sunt utilizate pentru ca în
ecuația de regresie să se țină cont de variația sezonieră a datelor din modelele specificate în
serii de timp. Într-un model trimestrial, de exemplu, dacă se notează variabilele dummy cu:
1 î𝑛 trimestrul 1
𝑋1𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul I
0 altfel
1 în trimestrul 2
𝑋2𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul II
0 altfel
1 în trimestrul 3
𝑋3𝑡 = { = variabila 𝑑𝑢𝑚𝑚𝑦 pentru trimestrul III
0 altfel
atunci ecuația se scrie în felul următor:
𝑌𝑡 = 𝛽0 + 𝛽1 𝑋1𝑡 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝛽4 𝑋4𝑡 + 𝜀𝑡
unde 𝑋4 este o variabilă independentă non dummy, iar 𝑡 este trimestrul. Se observă că doar
trei variabile dummy sunt necesare pentru a reprezenta patru trimestre (de ce?). În această
formulare 𝛽1 arată măsura în care valoarea așteptată a lui 𝑌 din primul trimestru diferă de
valoarea așteptată din cel de-al patrulea trimestru (condiția omisă). Coeficienții 𝛽2 ș𝑖 𝛽3 pot
fi interpretați în mod similar.
Includerea unui set de variabile dummy sezoniere va determina „desezonalizarea”
lui 𝑌. Această procedură poate fi utilizată atât timp cât 𝑌 și 𝑋4 nu sunt „ajustate sezonier”
înainte de estimare. Mulți cercetători evită tipul de ajustare sezonieră efectuată înainte de
estimare deoarece consideră că distorsionează datele în moduri necunoscute și arbitrare. Pe
de altă parte, variabilele dummy sezoniere au propriile limitări, cum ar fi faptul că rămân
constante pentru întreaga perioadă de timp. Ca urmare, nu există o abordare fără echivoc în
ceea ce privește desezonalizarea datelor. Totuși, unele date sunt desezonalizate (Eurostat),
și trebuie folosite ca atare.
Pentru a testa ipoteza privind semnificația datelor pentru un anotimp, trebuie testată
ipoteza că toate variabilele dummy sunt egale cu zero simultan, mai degrabă decât să se
testeze ipotezele că variabilele dummy sunt, pe rând, egale cu zero. Cu alte cuvinte, testul
adecvat pentru testarea sezonalității într-un model de regresie folosind variabile dummy
sezoniere este testul 𝐹, nu testul 𝑡.
În acest caz, ipoteza nulă că nu există sezonalitate și ipoteza alternativă sunt:
H0 : 𝛽1 = 𝛽2 = 𝛽3 = 0
HA : H0 nu este adevărată
Ecuația în care condițiile ipotezei nule au fost înlocuite este 𝑌𝑖 = 𝛽0 + 𝛽4 𝑋4𝑖 + 𝜀𝑖 .

Pentru a determina dacă includerea în model a celor trei variabile dummy sezoniere este
indicată, gradul de ajustare al ecuației estimate restrânse se compară cu gradul de ajustare
al ecuației estimate fără condiții. Aceasta implică efectuarea unui test 𝐹 pentru a testa ipoteza
nulă care include doar un subset al coeficienților pantă. În acest caz m = 3, deoarece au fost
eliminați din ecuație doar trei coeficienți, 𝛽1 , 𝛽2 ș𝑖 𝛽3 , (pentru 𝛽4 nu s-a impus nici o
condiție).
Nu este recomandată excluderea unor variabile dummy imediat ce coeficienții lor
estimați au scoruri 𝑡 scăzute, sub pragul critic. Coeficienții variabilelor dummy sezoniere
trebuie testați cu testul 𝐹 în loc cu testul 𝑡 deoarece sezonalitatea implică, de obicei, o ipoteză
unică compusă, mai degrabă decât 3 ipoteze individuale (sau 11, în cazul datelor lunare) care
au legătură cu fiecare trimestru (sau lună). În măsura în care o ipoteză este una comună, ea
trebuie testată cu testul 𝐹. Dacă ipoteza variației sezoniere poate fi rezumată într-o singură
variabilă dummy, atunci utilizarea testului 𝑡 nu va crea probleme. Adesea, în cazul în care
variațiile sezoniere sunt evidențiate fără echivoc, nu se efectuează deloc testarea ipotezelor.
O altă utilizare obișnuită a testului 𝐹 este testarea echivalenței coeficienților de
regresie obținuți din două seturi de date diferite, adică dacă două seturi de date determină
coeficienți de regresie semnificativ diferiți, pentru aceeași ecuație teoretică. Aceasta poate fi
de ajutor atunci când se decide dacă este bine să se combine două seturi de date. De exemplu,
ipoteza nulă poate fi: coeficienții pantă sunt aceeași pentru două astfel de eșantioane, cum
ar fi, de exemplu, un eșantion de bărbați și un eșantion de femei. Se pune întrebarea dacă
există o diferență structurală semnificativă între seturile de date. Această aplicare a testului
𝐹 este adesea denumită ca fiind un test Chow, și poate fi efectuat prin utilizarea unor
variabile dummy care să facă distincția dintre cele două seturi de date. Un test Chow
presupune parcurgerea următorilor patru pași:
1. Se execută aceeași regresie pe cele două eșantioane de date și se reține 𝑅𝑆𝑆 pentru fiecare
eșantion: 𝑅𝑆𝑆1 , respectiv 𝑅𝑆𝑆2.
2. Se pun datele din cele două eșantioane împreună și se execută regresia pe întregul set de
date. Se reține mărimea lui 𝑅𝑆𝑆.
3. Se calculează:
(𝑅𝑆𝑆 − (𝑅𝑆𝑆1 + 𝑅𝑆𝑆2 ))/(𝑘 + 1)

𝐹=
(𝑅𝑆𝑆1 + 𝑅𝑆𝑆2 )/(𝑛1 + 𝑛2 − 2𝑘 − 2)
unde:
𝑘 = numărul de variabile independente;
𝑛1 = numărul de observări în eșantionul 1;
𝑛2 = numărul de observări în eșantionul 2.
4. Se respinge ipoteza nulă conform căreia cele două seturi de coeficienți de regresie sunt
echivalenți dacă 𝐹 > 𝐹𝑐 , unde 𝐹𝑐 este valoarea 𝐹 critică pentru (𝑘 + 1) grade de libertate
la numărător și (𝑛1 + 𝑛2 − 2𝑘 − 2) la numitor.
Sumar
1. Testarea ipotezelor presupune efectuarea unor inferențe statistice cu privire la

validitatea teoriilor economice specifice (sau a altora), plecând de la un eșantion al
populației pentru care se presupune că teoriile sunt adevărate. Cei patru pași de bază ai
testării ipotezelor (folosind un test 𝑡, de exemplu) sunt:
a. Se configurează ipoteza nulă și ipoteza alternativă;
b. Se alege un nivel de semnificație și, prin urmare, o valoare critică, 𝑡𝑐 ;
c. Se rulează regresia și se obține o valoare estimată a lui 𝑡;
d. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoare critică 𝑡𝑐 pentru
a respinge sau a nu respinge ipoteza nulă.
2. Ipoteza nulă menționează gama de valori pe care coeficientul de regresie este de așteptat
să nu le ia, în cazul în care așteptările cercetătorului sunt corecte. Ipoteza alternativă este
o afirmație a gamei de valori pe care coeficientul de regresie este de așteptat să le ia, în
cazul în care teoria din spatele așteptărilor cercetătorului este corectă.
3. Cele două tipuri de erori care pot fi făcute în testarea acestor ipoteze sunt:
Tipul I: Se respinge o ipoteză nulă care este adevărată.
Tipul II: Nu se respinge o ipoteză nulă care este falsă.
4. Cu ajutorul testului 𝑡 se testează ipotezele despre coeficienții pantă individuali din

ecuațiile de regresie. Formula de calcul pentru statistica 𝑡 este:
(𝛽̂𝑘 − 𝛽H0 )
𝑡𝑘 = (𝑘 = 1,2, … , 𝐾)
𝑆𝐸(𝛽̂𝑘 )
În multe aplicații de regresie, 𝛽H0 este egal cu zero. Odată ce s-a calculat o valoare 𝑡 și s-a
ales o valoare critică 𝑡𝑐 , se respinge ipoteza nulă dacă valoarea 𝑡 este mai mare în valoare
absolută decât valoarea critică 𝑡𝑐 și dacă valoarea 𝑡 are semnul implicat de ipoteza
alternativă.
5. Testul 𝑡 este ușor de efectuat, dar trebuie evitate greșelile generate de confuzia
semnificației statistice cu validitatea teoretică sau interpretarea greșită a importanței
variabilelor independente.
6. Testul 𝐹 este un test formal de ipoteză conceput pentru a testa o ipoteză nulă care conține
mai multe ipoteze sau o singură ipoteză despre un grup de coeficienți. Cea mai obișnuită
utilizare a testului 𝐹 este testarea semnificației globale a unei ecuații de regresie
estimată.
Testul 5.1
TI1. Înainte de a fi testate, ipotezele trebuie formulate. Acest lucru trebuie să se facă înainte de
a estima ecuația, deoarece ipotezele dezvoltate după estimare riscă să fie mai degrabă
justificări ale unor rezultate particulare decât teste de validitate a acestor rezultate. Ipoteza
nulă H0 reprezintă, de obicei, o afirmație privind valorile pe care un coeficient este de
așteptat să nu le ia. Ipoteza alternativă HA este, de obicei, o afirmație privind valorile pe
care coeficientul respectiv este de așteptat să la ia. Testarea se referă la ipoteza nulă, iar
concluziile pot fi: ipoteza nulă se respinge (implicit se acceptă ipoteza alternativă), sau
ipoteza nulă nu se poate respinge. Niciodată nu se spune că ipoteza nulă "se acceptă". În
justiție, de exemplu, un inculpat are dreptul la prezumția de nevinovăție, formulată prin
expresia "nevinovat până la dovedirea vinovăției", prezumție exprimată de ipoteza nulă
H0: nevinovat. Astfel, un inculpat vinovat poate fi declarat nevinovat dacă:
Selectați una dintre variantele următoare:

a. pe baza probelor administrate, se respinge ipoteza alternativă;
b. probele arată că ipoteza alternativă nu poate fi respinsă;
c. nu sunt suficiente probe pentru a respinge ipoteza nulă;
d. ipoteza nulă poate fi respinsă pe baza probelor administrate;
e. sunt suficiente probe astfel încât ipoteza nulă se acceptă;

TI2. În justiție, prezumția de nevinovăție, formulată prin expresia "nevinovat până la dovedirea
vinovăției", presupune formularea următoarelor ipoteze: H0 : nevinovat; HA : vinovat. Când
un inculpat vinovat este declarat de judecător nevinovat, înseamnă că:

a. s-a făcut o eroare de tipul I;
b. legile în justiție sunt greșite;
c. s-a făcut o eroare de tipul II;
d. s-au încălcat legile justiției;
e. acuzatul și-a dovedit nevinovăția;

TI3. Ipotezele H0 : nevinovat; HA : vinovat, ilustrează prezumția de nevinovăție, formulată prin

expresia "nevinovat până la dovedirea vinovăției". O eroare de tipul I înseamnă respingerea
ipotezei nule, care în fapt, este adevărată. Aceasta însemnă implicit acceptarea ipotezei
alternative, adică declararea inculpatului ca fiind vinovat și pedepsirea sa pe nedrept. De-a
lungul timpului, astfel de greșeli s-au înregistrat în practica judiciară. În mod similar, eroarea
de tipul II înseamnă nerespingerea ipotezei nule, care în fapt este falsă. Pârâtul este declarat
nevinovat, rămâne nepedepsit, el fiind, de fapt, vinovat. Alegerea probabilității erorii de tipul
I și implicit alegerea probabilității erorii de tipul II, trebuie făcută pe baza:
Cei mai mulți dintre noi ar dori ca erorile în justiție să fie destul de
mici, dar o astfel de certitudine este aproape imposibilă. Greșelile pot
apărea, pot exista martori mincinoși, anumite probe pot fi compromise, unii
inculpați pot avea imunitate, unele fapte se pot prescrie etc. În lumea reală,
scăderea probabilității unei erori de tipul I-pedepsirea unui inculpat
nevinovat, înseamnă creșterea probabilității unei erori de tipul II-
nepedepsirea unui inculpat vinovat.
Modificarea legilor justiției în timpul unei anumite guvernări a avut ca
scop declarat reducerea riscului ca persoane nevinovate să fie declarate
vinovate și condamnate pe nedrept. Dar, cu cât preocuparea de a nu
pedepsi inculpați nevinovați a fost mai pregnantă, cu atât mulți inculpați cu
adevărat vinovați aveau șanse mai mari de a scăpa nepedepsiți. Marii
vinovați au sperat să scape nepedepsiți, inducând publicului larg ideea că
sunt foarte preocupați ca nici un nevinovat să nu fie condamnat pe nedrept.

a. evidențierii cauzelor care generează astfel de erori;
b. analizei legilor care au generat astfel de erori;
c. identificării persoanelor care pot beneficia de aceste erori;
d. comparării costurilor celor două tipuri de erori;
e. evaluării revoltei sociale împotriva acestor erori;

TI4. O regulă de decizie este o procedură prin care se decide dacă ipoteza nulă se respinge sau
nu se poate respinge. Pentru un test unilateral, o regulă de decizie implică compararea
unei statistici determinate pe baza unui eșantion cu o valoare critică preselectată, ce poate
fi găsită în tabelele statistice. Cum se poate observa în figura alăturată, gama de valori
posibile ale lui valorilor estimate ale lui β este împărțită în două regiuni, o regiune de
„acceptare” și o regiune de respingere, unde termenii de acceptare și de respingere au
semnificația dată prin raportarea la ipoteza nulă. Pentru a defini aceste regiuni, trebuie
determinată o valoare critică. Astfel, o valoare critică este o valoare care separă regiunea
de „acceptare” de regiunea de respingere. De ce termenul acceptare este pus între
ghilimele?
Valoarea critică, 𝑡𝑐
𝛽̂
0
Regiune de

a. pentru a face diferența dintre a fi de acord și a accepta;
b. deoarece acceptarea se face în mod probabilistic;
c. pentru că, prin convenție, numele regiunilor trebuie pus între ghilimele;
d. deoarece ipoteza nulă nu se acceptă niciodată;
e. pentru că regiunea de acceptare este mai mare decât regiunea de respingere;

TI5. În cazul unui test bilateral, regiunile de respingere, situate în stânga și în dreapta regiunii
de "acceptare", măsoară probabilitatea erorii de tipul I, când ipoteza nulă este adevărată.
Se poate observa în figura alăturată că suprafața totală a acestor regiuni este de două ori
mai mare decât suprafața regiunii de respingere în cazul unui test unilateral, pentru aceeași
mărime a pragului critic. Ca urmare, în cazul unui test bilateral, pentru a avea aceeași
probabilitate de apariție a erorii de tipul I ca în cazul unui test unilateral:
de tipul I
𝛽̂
0
Regiune de
Regiune de Regiune de "acceptare"
respingere

a. eroarea standard a distribuției de eșantionare trebuie să fie de două ori mai mare;
b. nivelul de semnificație trebuie să fie de două ori mai mare;
c. varianța termenului de eroare stohastică trebuie să crească de două ori;
d. varianța distribuției de eșantionare trebuie să fie de două ori mai mică;
e. mărimea eșantionului trebuie să fie de două ori mai mare;

TI6. Cum se poate observa în figura alăturată, gama de valori posibile ale coeficientului 𝛽 al
unei variabile independente este împărțită în două regiuni, o regiune de „acceptare” și o
regiune de respingere. Pentru a defini aceste regiuni, trebuie determinată o valoare critică
(sau, pentru un test bilateral, două valori critice) ale lui β estimat . Astfel, o valoare critică
este o valoare care separă regiunea „de acceptare” de regiunea de respingere. Valoarea
critică poate fi găsită în tabelele statistice. Odată stabilită valoarea critică, aceasta se
compară cu o statistică calculată pe baza unui eșantion. Regiunea de respingere măsoară
probabilitatea erorii de tipul I. Întreaga procedură prin care se decide dacă ipoteza nulă se
respinge sau nu se poate respinge este denumită:
Valoarea
𝛽̂
0 𝑡𝑐
Regiune de

a. specificație;
b. regulă de decizie;
c. eroare stohastică
d. nivel de semnificație;
e. estimare;
TI7. În ecuația Woody, impactul venitului mediu al gospodăriilor din zona restaurantului asupra
numărului preconizat de clienți Woody din acea zonă este ambiguu. Un restaurant Woody
situat într-un cartier cu un nivel ridicat al veniturilor gospodăriilor ar putea avea mulți
clienți la cină, dar, la fel de bine, acești clienți ar putea decide să mănânce la un restaurant
mai elevat decât Woody. În acest caz, care este forma corectă a ipotezei nule pentru
coeficientul variabilei independente I și ce fel de test trebuie efectuat?
− + ?
𝑌̂𝑖 = 𝛽̂0 + 𝛽̂𝑁 𝑁𝑖 + 𝛽̂P 𝑃𝑖 + 𝛽̂I 𝐼𝑖
unde:
𝑌𝑖 = numărul de clienți ai restaurantului 𝑖 Woody;

𝑁𝑖 = numărul de concurenți ai restaurantului 𝑖 Woody;
𝑃𝑖 = populația din jurul restaurantului 𝑖 Woody;
𝐼𝑖 = venitul mediu al gospodăriilor din jurul restaurantului 𝑖 Woody;

a. H0 : 𝛽I = 0; test unilateral;
b. H0 : 𝛽I ≤ 0; test unilateral;
c. H0 : 𝛽I ≠ 0; test bilateral;
d. H0 : 𝛽I ≥ 0; test bilateral;
e. H0 : 𝛽I = 0; test bilateral;
TI8. În figura alăturată sunt ilustrate regiunile de "acceptare" și de respingere, pentru un test
unilateral și pentru un test bilateral. Se observă faptul că, pentru testul unilateral cu un
nivel de semnificație de 5%, valoarea critică este de 1.699. Aceeași valoare critică se obține
pentru testul bilateral cu un nivel de semnificație de:
α = 5%
Aria = 0.05 test unilateral
𝛽̂
−1.669 0 1.699
α = 10% test bilateral

a. 95%
b. 2.5%
c. 10%
d. 5%
e. 1%
TI9. Ipoteza alternativă este de obicei o afirmație privind valorile pe care coeficientul unei
variabile independente este de așteptat să le ia. Notația folosită pentru a specifica ipoteza
alternativă este „HA:” urmată de o enunțare a gamei de valori așteptată pentru coeficientul
respectiv. Cum trebuie formulată ipoteza alternativă pentru coeficientul a cărui distribuție
de eșantionare este ilustrată în figura alăturată?
Distribuția de eșantionare a lui 𝛽̂
0 𝐸 𝛽̂

a. HA : 𝛽 ≥ 0
b. HA : 𝛽 = 0
c. HA : 𝛽 < 0
d. HA : 𝛽 ≤ 0
e. HA : 𝛽 > 0
TI10. Există câteva cazuri rare în care este încălcată regula conform căreia valorile așteptate ale
coeficientului unei variabile independente se includ în ipoteza alternativă. Se întâmplă
acest lucru deoarece testarea ipotezelor presupune ca ipoteza nulă să conțină semnul egal
într-o anumită formă (fie că este =, ≤ sau ≥). Această cerință îi obligă pe economiști să
pună valoarea pe care o așteaptă în ipoteza nulă dacă așteptarea lor include un semn
egal. Dacă acesta este cazul ilustrat în figura alăturată, care dintre expresiile ipotezei nule
de mai jos este cea corectă?
Distribuția de eșantionare a lui 𝛽̂
𝐸 𝛽̂ 0

a. H0 : β ≤ 0
b. H0 : β ≥ 0
c. H0 : β = 0
d. H0 : β > 0
e. H0 : β ≠ 0

Testarea Ipotezelor Și Inferența Statistică

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Testarea Ipotezelor Și Inferența Statistică

Încărcat de

Drepturi de autor:

Formate disponibile

5.

Procedurile de testare a ipotezelor sunt explicate aici în termenii modelului de

Ipoteza nulă și ipoteza alternativă

Ipoteza nulă H0 : 𝛽 ≤ 0 (valori neașteptate pentru coeficientul β)

de o enunțare a gamei de valori așteptată pentru un coeficient. Dacă, de exemplu, este de

Ipoteză alternativă HA : 𝛽 > 0 (valorile așteptate pentru coeficientul β)

Testarea acestor ipoteze implică un test unilateral, deoarece ipoteza alternativă

H0: Pârâtul este nevinovat.

Erori de tipul I și de tipul II în testarea ipotezelor

Chiar dacă în realitate β nu este pozitiv, estimarea sa particulară obținută pe baza

Regula de decizie privind testarea ipotezelor

Figura 1. Regiunile de “acceptare” și de respingere pentru un test unilateral asupra lui 𝛽

Testul 𝑡 se utilizează pentru a testa diferite ipoteze individuale privind coeficienții

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑗 𝑋𝑗𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝜀𝑖

unde: 𝛽̂𝑗 = coeficientul de regresie estimat al variabilei independente 𝑋𝑗 ;

care, simplificată, devine:

𝑌̂𝑖 = 102.192 − 9075 ∙ 𝑁𝑖 + 0.3547 ∙ 𝑃𝑖 + 1.288 ∙ 𝐼𝑖

𝛽̂𝑃 = 0.3547, 𝑆𝐸(𝛽̂𝑃 ) = 0.727

Dat fiind că H0 : 𝛽𝑃 ≤ 0, valoarea lui 𝑡𝑃 este:

Valoarea critică, 𝒕𝒄 , și regula de decizie

Figura 3. Valoarea critică, 𝑡𝑐

O valoare 𝑡 critică este valoarea care separă regiunea de „acceptare” de regiunea de

sau pentru un test bilateral în jurul aceleiași valori:

sau pentru un test bilateral, bazat pe valori, altele decât zero:

se respinge H0 dacă |𝑡𝑝 | > 1.699 și dacă 𝑡𝑃 este pozitiv

sau, combinând cele două condiții:

se respinge H0 dacă 𝑡𝑃 > 1.699

Figura 4. Teste unilaterale și teste bilaterale

Alegerea unui nivel de semnificație

Tabelul 1. Valorile critice ale lui 𝑡

Astfel, nivelul de semnificație măsoară probabilitatea erorii de tip 1 implicată de o

exemplu, preocuparea excesivă de a nu pedepsi persoane nevinovate poate însemna, în

procedurii standard de efectuare a testului 𝑡, fiind mai probabil să se creeze obișnuința de a

Exemple de utilizare a testului 𝐭

Exemple de teste unilaterale

𝐶𝐴𝑅𝑆 = 𝛽0 + 𝛽1 𝑌𝐷 + 𝛽2 𝑃𝑅𝐼𝐶𝐸 + 𝛽3 𝑆𝑈𝑉 + 𝜀

Semnele de deasupra coeficienților arată că este de așteptat ca 𝛽1 să fie pozitiv, iar 𝛽2

1. Se formulează ipotezele, nulă și alternativă, pentru fiecare coeficient;

În detaliu, cei patru pași sunt următorii:

1. Formularea ipotezelor, nulă și alternativă, pentru 𝛽1 , 𝛽2 ș𝑖 𝛽3:

Testul 𝑡 nu se aplică, de obicei, pentru intercept, 𝛽0.

𝐶𝐴𝑅𝑆𝑡 = 1.30 + 4.91 ∙ 𝑌𝐷𝑡 + 0.00123 ∙ 𝑃𝑅𝐼𝐶𝐸𝑡 − 7.14 ∙ 𝑆𝑈𝑉𝑡

Pentru variabila 𝑆𝑈𝑉, de exemplu, coeficientul estimat divizat la eroarea sa standard

4. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoarea critică 𝑡𝑐 , pentru

Figura 5. Testul 𝑡 unilateral pentru coeficienții modelului 𝐶𝐴𝑅𝑆

Exemple de teste bilaterale

1. Test bilateral dacă un 𝛽 este semnificativ diferit de zero

Valori critice Valoare estimată

Figura 6. Testul 𝑡 bilateral al coeficientului lui 𝐼 din modelul Woody

a. Stabilirea ipotezei nule și a ipotezei alternative:

d. Se aplică regula de decizie, comparând valoarea 𝑡 calculată cu valoarea 𝑡 critică pentru a

Pentru 𝛽𝐼 : Se respinge H0 dacă |2.37| > 2.045

Limite ale testului 𝒕

1. Testul 𝑡 nu testează validitatea teoretică

𝑃̂ = 10.9 − 3.2𝐶 + 0.39𝐶 2

2. Testul 𝑡 nu testează „importanța”

O posibilă utilizare a unei ecuații de regresie este de a ajuta la determinarea variabile

𝑌̂ = 300.0 + 10.0𝑋1 + 200.0𝑋2

unde: 𝑌 = vânzări prin corespondență pe rețetele O’Henry’s Oyster Recipes;

𝑋1 = cheltuieli de publicitate, în sute de dolari, în revista Gourmets’ Magazine;

Se presupune că toți ceilalți factori, inclusiv prețurile, calitatea și concurența, rămân

3. Testul 𝑡 nu este destinat testelor la nivelul întregii populații

Un interval de încredere este un interval de valori care va conține valoarea adevărată