Sunteți pe pagina 1din 7

Modelul clasic de regresie (cu folosirea testelor t i F)

S presupunem c dispunem de informaii privind investitia i rata dobanzii.


Rata dobanzii % 3 4 5 2 6 2

Investitia mil 10 7 6 12 4 15

Tabelul 1. Date privind investitia i rata dobanzii Dorim s exprimm printr-un model econometric, folosind datele din tabelul 1, legtura dintre investitie i rata dobanzii; apoi, odat modelul validat, s putem s-l folosim pentru a face predicii la nivel macroeconomic. Avem doar o singur variabil independent. Este util s facem mai nti o reprezentare grafic de tip XY. Rezultatul cu aplicaia Excel, este prezentat n figura 1.

16 14 investitia mil.lei 12 10 8 6 4 2 0 0 1 2 3 4 5 6 7 rata dobanzii(%) y = -2,4x + 17,8 R2 = 0,9143

Toate indiciile sunt n direcia folosirii unui model clasic de regresie (dependena pare liniar, erorile par a avea dispersia constant, termenul liber pare a fi diferit de zero). Folosind un soft clasic, de exemplu modulul Regression din Excel obtinem urmtoarele rezultate:

SUMMARY OUTPUT Regression Statistics Multiple R 0,956183 R 2 R Square 0,914286 R Adjusted R Square Standard Error Observations

A.Bonitatea modelului

R2
su

0,892857 1,341641

n B.Descompunerea 6
varianei totale i testul F

ANOVA df Regression Residual SS 76,8 7,2 MS Fcalc

k 1 = 1 nk = 4

SSR = ( yi y) 2 i

76,8 1,8

MSR =

SST = ( yi y) n 1 = 5 i Total 84 k = numarul de parametrii din mod el

i )2 SSE = i ( y i y
2

SSR k 1 SSE MSE = n k

42,66667

Fcalc =

MSR SSR n k = * MSE k 1 SSE

Significanc eF 0,002838

C.Estimatii pentru parametrii modelului, erorile lor standard, testul t, intervalele de incredere pentru parametrii modelului
t Stat P-value
1 t calc =

Coefficients Intercept Rata dobanzii % 17,8 -2,4

Standard Error

Lower 95% 13,7622 -3,42013 t / 2 , n 2 a a


t b / 2 , n 2 b

Upper 95% 21,8378 -1,37987 + t / 2, n 2 a a


+t b / 2 , n 2 b

a
b

1,454304 0,367423

a
b

12,23953 -6,53197

a
b

0,000256 0,002838

2 t calc =

S analizm pe rnd rezultatele din casetele evideniate n tabelul 2. Caseta A ofer informaii despre indicatori ce ne relev bonitatea modelului sau ct de bun este modelul pe care l analizm.

i ajustate prin Aceti indicatori sunt:raportul de corelatie( Multiple R), coeficientul de corelaie dintre valorile yi observate i valorile y ecuaia de regresie (R Square), i coeficientul de determinaie ajustat R 2 (Adjusted R Square). Cu ct R 2 i R 2 au valori mai apropiate de 1 cu att regresia este mai bun. Interpretarea rezultatelor din tabelul SUMMARY OUTPUT: R= 0.956183 arat c ntre nivelul investitiilor si nivelul ratei dobanzii exist o legtur puternic. R2 =0.914286 arat c 91,42% din variaia investitiilor este explicat de nivelul ratei dobanzii, deci rata dobanzii reprezinta un factor determinant inclus in model. Abaterea medie patratica a erorilor s u =1,341641. n cazul n care acest indicator este zero nseamn c toate punctele sunt pe dreapta de regresie. Pentru aplicaia noastr, cum toi indicatorii de bonitate enumerai sunt apropiai de 1, putem concluziona c modelul de regresie liniar simpl este bun. Caseta B, se refer la descompunerea varianei totale (SST) a variabilei dependente n dou componente: variana explicat prin regresie (SSR) i variana neexplicat (SSE) sau variana rezidual.. Aici identificm i gradele de libertate asociate descompunerii, mai precis, dac avem k regresori n model i n observaii, avem egalitatea n 1 = (k 1) + (n k ) . n aceast caset exist dou celule importante la care trebuie s fim ateni, i anume: F i Significance F. Valorile din aceste celule ne dau elemente importante ce stau la baza validrii modelului de regresie (n totalitatea sa). Ele ne furnizeaz informaii privind valoarea calculat a statisticii test F i erorii pe care putem s-o facem cnd respingem modelului de regresie ca fiind neadecvat. Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test F i valori mici pentru Significance F. Significance F reprezinta valoarea erorii pe care o facem prin respingerea ipotezei nule cand de fapt ea este adevarata. Pe datele noastre, cum F = 42,66667 este o valoare mare i Significance F = 0,002838, deci o valoare foarte mic, acceptm c modelul ales ajusteaz bine datele din eantion.Significance F trebuie s fie in general mai mica de 5%(0.05). Caseta C ne ofer informaii despre valorile estimate ale coeficienilor modelului de regresie n coloana Coefficients, erorile standard ale coeficienilor n coloana Standard Error, elemente pentru aplicarea testului de semnificaie t-Student pentru fiecare coeficient (coloanele t Stat i P-value.). Deci, valoarea din coloana t-Stat se obtine impartind pentru fiecare estimator al modelului, valoarea estimatiei la eroarea standard a estimatorului i astfel obtinem valoarea calculata a testului t pentru fiecare estimator al modelului.Aceasta valoarea calculata se compara cu valoarea tabelara preluata din tabelul repartitiei Student.

este 17,8. Termenul liber este punctul n care variabila explicativ (factorial) este 0. Intercept este termenul liber, deci coeficientul a t Deci nivelul investitiilor, dac rata dobanzii este 0. Deoarece a = 12,2395 iar pragul de semnificaie P-value este 0,000256<0,05 nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este13,7622 21,8378
0

Coeficientul

este 2,4, ceea ce nsemn c la creterea ratei dobanzii cu un punct procentual, nivelul investitiilor va crete cu 2,4

Deoarece t a1 = -6,53197 iar pragul de semnificaie P-value este 0,002838<0,05 nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este -3,42013 -1,37987. Despre p-value naintea nceperii unui test statistic clasic, se pune problema alegerii unui nivel de semnificaie. Acesta exprim riscul maximal de a grei pe care suntem dispui s-l acceptm (de regul 5%, 1% sau chiar mai mic) atunci cnd lum decizia de respingere a ipotezei nule. Softul modern ofer posibilitatea invers. Anume, este evaluat riscul de a lua decizia greit, pe baza datelor de care dispunem, rmnnd la latitudinea fiecruia dac i asum sau nu acest risc. Acest risc evaluat pe baza datelor apare n tabele, la fiecare test de semnificaie, i se numete valoarea p (p-value). Tot aici avem informaii despre intervalele de ncredere calculate pentru fiecare parametru din modelul de regresie.
t / 2,n 2 a + t / 2, n 2 a a a a
t b b b +t / 2 , n / 2 , n 2 b 2 b

Cum analizm informaiile din aceast caset? 1) Pentru ca un coeficient s fie semnificativ diferit de zero, deci variabila regresor(var.independenta) asociat lui s influeneze variabila dependent, trebuie ca n coloana P-value s avem valori mici, de exemplu 5% sau sub 5% (evident n coloana t Stat avem atunci valori mari, n modul). Concret, pentru termenul liber al modelului (Intercept) avem P-value = 0.043, adic putem afirma c dac respingem ipoteza c interceptul este egal cu zero, facem o eroare doar de 4%. Respingem deci aceast afirmaie i acceptm ca adevrat ipoteza c interceptul este diferit de zero. (Analog, ajungem la concluzia c i panta dreptei de regresie este diferit statistic de zero). 2) Ultimele dou coloane ne dau informaii privind intervalele de ncredere 95% pentru fiecare coeficient al modelului. Astfel, pentru termenul liber (teoretic) al modelului obinem intervalul (-132.0474401, -2.5126). Analog, pentru panta ecuaiei de regresie avem intervalul de ncredere (0.905614, 1.052304). Este foarte important faptul c nici unul dintre aceste intervale de ncredere nu conine pe 0, suntem ncurajai astfel n a afirma c modelul este bun.