Sunteți pe pagina 1din 7

Modelul clasic de regresie (cu folosirea testelor t i F)

S presupunem c dispunem de informaii privind investitia i rata dobanzii.

Investitia mil
10
7
6
12
4
15

Rata
dobanzii %
3
4
5
2
6
2

Tabelul 1. Date privind investitia i rata dobanzii


Dorim s exprimm printr-un model econometric, folosind datele din tabelul 1, legtura dintre investitie i rata dobanzii; apoi, odat
modelul validat, s putem s-l folosim pentru a face predicii la nivel macroeconomic.
Avem doar o singur variabil independent. Este util s facem mai nti o reprezentare grafic de tip XY. Rezultatul cu aplicaia Excel,
este prezentat n figura 1.

Toate indiciile sunt n direcia folosirii unui model clasic de regresie (dependena pare liniar, erorile par a avea dispersia constant,
termenul liber pare a fi diferit de zero).
Folosind un soft clasic, de exemplu modulul Regression din Excel obtinem urmtoarele rezultate:

SUMMARY OUTPUT
Regression Statistics
Multiple R
0,956183
R
2
R Square
0,914286
R
Adjusted R Square
Standard Error
Observations

R2
s u

A.Bonitatea
modelului

0,892857
1,341641
6

B.Descompunerea
varianei totale i
testul F

ANOVA
df

SS

MS

i ( y i y ) 2

Regression

k 1 1

76,8

SSR

Residual

nk 4

7,2

SSU i ( y i y i ) 2

SST i ( y i y )
n 1 5
Total
84
k numarul de parametrii din mod el

Coefficients

Standard
Error

Intercept

a =-1.73

sa =2.046

Timpul mediu

b =0.549

sb =0.08

76,8
1,8

t Stat

a
1
t calc

=-0.846
s a
b
2
t calc

=6.804
sb

Significanc
eF

Fcalc

SSR
k 1
SSU
MSU
nk

MSR

42,66667

Fcalc

MSR SSR SSU


:
MSU k 1 n k

0,002838

C.Estimatii pentru parametrii modelului,


erorile lor standard, testul t, intervalele de
incredere pentru parametrii modelului

P-value

Lower 95%

Upper 95%

0.412

a t / 2,n 2 s a =-6.151

a t / 2, n 2 s a =2.689

1.25E-015

b t / 2,n 2 s b =0.374

b t / 2, n 2 sb =0.723

S analizm pe rnd rezultatele din casetele evideniate n tabelul 2.


Caseta A ofer informaii despre indicatori ce ne relev bonitatea modelului sau ct de bun este modelul pe care l analizm.

Aceti indicatori sunt:raportul de corelatie( Multiple R), coeficientul de corelaie dintre valorile yi observate i valorile yi ajustate prin
ecuaia de regresie (R Square), i coeficientul de determinaie ajustat R 2 (Adjusted R Square). Cu ct R 2 i R 2 au valori mai apropiate de 1 cu att
regresia este mai bun.
Interpretarea rezultatelor din tabelul SUMMARY OUTPUT:
R= 0.956183 arat c ntre nivelul investitiilor si nivelul ratei dobanzii exist o legtur puternic.
R2 =0.914286 arat c 91,42% din variaia investitiilor este explicat de nivelul ratei dobanzii, deci rata dobanzii reprezinta un factor
determinant inclus in model.
Abaterea medie patratica a erorilor s u =1,341641. n cazul n care acest indicator este zero nseamn c toate punctele sunt pe dreapta
de regresie.

Pentru aplicaia noastr, cum toi indicatorii de bonitate enumerai sunt apropiai de 1, putem concluziona c modelul de regresie liniar simpl
este bun.
Caseta B, se refer la descompunerea varianei totale (SST) a variabilei dependente n dou componente: variana explicat prin
regresie (SSR) i variana neexplicat (SSU) sau variana rezidual.. Aici identificm i gradele de libertate asociate descompunerii, mai
precis, dac avem k regresori n model i n observaii, avem egalitatea n 1 (k 1) ( n k ) . n aceast caset exist dou celule importante la
care trebuie s fim ateni, i anume: F i Significance F. Valorile din aceste celule ne dau elemente importante ce stau la baza validrii modelului
de regresie (n totalitatea sa). Ele ne furnizeaz informaii privind valoarea calculat a statisticii test F i erorii pe care putem s-o facem cnd
respingem modelului de regresie ca fiind neadecvat. Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test
F i valori mici pentru Significance F. Significance F reprezinta valoarea erorii pe care o facem prin respingerea ipotezei nule cand de fapt ea
este adevarata.
Pe datele noastre, cum F = 42,66667 este o valoare mare i Significance F = 0,002838, deci o valoare foarte mic, acceptm c modelul
ales ajusteaz bine datele din eantion.Significance F trebuie s fie in general mai mica de 5%(0.05).
Caseta C ne ofer informaii despre valorile estimate ale coeficienilor modelului de regresie n coloana Coefficients, erorile standard ale
coeficienilor n coloana Standard Error, elemente pentru aplicarea testului de semnificaie t-Student pentru fiecare coeficient (coloanele t Stat i Pvalue.). Deci, valoarea din coloana t-Stat se obtine impartind pentru fiecare estimator al modelului, valoarea estimatiei la eroarea standard a
estimatorului i astfel obtinem valoarea calculata a testului t pentru fiecare estimator al modelului.Aceasta valoarea calculata se compara cu
valoarea tabelara preluata din tabelul repartitiei Student.

Intercept este termenul liber, deci coeficientul a este 17,8. Termenul liber este punctul n care variabila explicativ (factorial) este 0.
t
Deci nivelul investitiilor, dac rata dobanzii este 0. Deoarece a = 12,2395 iar pragul de semnificaie P-value este 0,000256<0,05
nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este13,7622 21,8378
0

Coeficientul b este 2,4, ceea ce nsemn c la creterea ratei dobanzii cu un punct procentual, nivelul investitiilor va crete cu 2,4
Deoarece t a1 = -6,53197 iar pragul de semnificaie P-value este 0,002838<0,05 nseamn c acest coeficient este semnificativ. Intervalul
de ncredere pentru acest parametru este -3,42013 -1,37987.

Despre p-value
naintea nceperii unui test statistic clasic, se pune problema alegerii unui nivel de semnificaie. Acesta exprim riscul maximal de a grei pe
care suntem dispui s-l acceptm (de regul 5%, 1% sau chiar mai mic) atunci cnd lum decizia de respingere a ipotezei nule.
Softul modern ofer posibilitatea invers. Anume, este evaluat riscul de a lua decizia greit, pe baza datelor de care dispunem,
rmnnd la latitudinea fiecruia dac i asum sau nu acest risc. Acest risc evaluat pe baza datelor apare n tabele, la fiecare test de semnificaie,
i se numete valoarea p (p-value).
Tot aici avem informaii despre intervalele de ncredere calculate pentru fiecare parametru din modelul de regresie.
a t / 2 , n 2 a a a t / 2,n 2 a

b t / 2,n 2 b b b t / 2 ,n 2 b

Cum analizm informaiile din aceast caset?


1) Pentru ca un coeficient s fie semnificativ diferit de zero, deci variabila regresor(var.independenta) asociat lui s influeneze variabila
dependent, trebuie ca n coloana P-value s avem valori mici, de exemplu 5% sau sub 5% (evident n coloana t Stat avem atunci valori mari, n
modul). Concret, pentru termenul liber al modelului (Intercept) avem P-value = 0.043, adic putem afirma c dac respingem ipoteza c interceptul
este egal cu zero, facem o eroare doar de 4%. Respingem deci aceast afirmaie i acceptm ca adevrat ipoteza c interceptul este diferit de
zero. (Analog, ajungem la concluzia c i panta dreptei de regresie este diferit statistic de zero).
2) Ultimele dou coloane ne dau informaii privind intervalele de ncredere 95% pentru fiecare coeficient al modelului. Astfel, pentru
termenul liber (teoretic) al modelului obinem intervalul (-132.0474401, -2.5126). Analog, pentru panta ecuaiei de regresie avem intervalul de

ncredere (0.905614, 1.052304). Este foarte important faptul c nici unul dintre aceste intervale de ncredere nu conine pe 0, suntem ncurajai astfel
n a afirma c modelul este bun.

1.73 2.160 2.046 1.73 2.160 2.046

S-ar putea să vă placă și