Sunteți pe pagina 1din 30

Exemple de modele de regresie liniar n Excel i EViews 1

1. Regresia liniar simpl Vom folosi n cele ce urmeaz, spre exemplificare, datele din tabelul de mai jos:

a) Transformarea datelor obinerea PNB i Investiei n form real

b) Identificarea unei posibile dependene liniare Y = + X1 + e


1

SPIRCU LILIANA SEMINARII ECONOMETRIE 2012

2. Regresia liniar multipl Y = + X1 + X 2 + e

Regresia liniar n EViews (I) A) Crearea unui fiier n EViews

Se salveaz n directorul de lucru cu numele sem_2 (are extensia wf1). B) Importul de date dintr-un fiier Excel Numele fiierului Excel este sem_2.xls. Datele pe care dorim s le importm sunt n Sheetul cu denumirea DATE_REG iar coloanele sunt cele din figura de mai jos.

C) Transformri pe seriile de date, grafice

Grafice unidimensionale

Grafic X,Y

D) Estimaiile OLS n EViews

Sau cu linie de comand ls inv pnb

Regresia liniar n EViews (II) Etape n estimarea i evaluarea unui model liniar de regresie n EViews (pentru exemplificare am folosit estimarea dependenei liniare dintre: Investiie ca variabil dependent i PNB i Rata_dobnzii ca variabile de influen) 1) Citirea i interpretarea estimaiilor OLS i a primilor indicatori de bonitate (vezi outputul din figura 1). Rezult n urma succesiunii de comenzi: Quik Estimate Equation

Figura 1. Output cu rezultatele estimaiilor OLS 2) Analiza unor posibile dependene dintre valorile celor dou variabile de influen (vezi figura 2)

View Covariance Matrix

Figura 2. Matricea covarianelor 3) Testul de semnificaie a coeficienilor modelului de regresie liniar (exemplificare pentru un model de regresie simpl) Avem ecuaiile de regresie liniar yi = + xi + ei i = 1, 2,...., n pentru care dorim s evalum statistic valoarea parametrului . A) Enunul ipotezelor: a) Nul poate fi formulat astfel: H0 : = * n care * este o valoare particular pe care o poate lua parametrul modelului (de regul valoarea cea mai nefavorabil). b) alternativ poate s aib una dintre formele: H1 : * (ipoteza bilateral); H1 : < * sau H1 : > * (ipoteze unilaterale).

B) Nivelul de semnificaie S considerm cele dou decizii posibile:


Decizia Situaia real

H 0 nu este respins
(este acceptat?) Decizia corect Decizia incorect (Riscul de genul II)

H 0 este respins
Decizia incorect (Riscul de genul I, ) Decizia corect

H 0 este adevrat H1 este adevrat

Nivelul de semnificaie este riscul acceptat de genul I. Acesta este de regul mic, de ordinul 5%, 1% sau chiar mai mic. Dac alegem nivelul de semnificaie 5% , putem afirma c ncrederea acordat rezultatului statistic obinut este de 95% . C) Determinarea distribuiei folosite (alegerea statisticii test) Dac testm o ipotez statistic (aplicm un test de semnificaie) asupra parametrului din modelul de regresie, ne bazm pe cele cinci ipoteze cerute modelului i pe : urmtorul rezultat statistic asociat estimatorului OLS

1) variabila aleatoare

) Var (

are o distribuie normal standard N (0,1) ; 1 . ( xi x )2

) = s 2) eroarea standard a estimatorului este SE (

Din afirmaiile 1) i 2) se obine un rezultat statistic important i anume: Statistica test pe care putem s-o folosim este . Ea are o repartiie t cu ) SE ( t (n 2) (rezultat statistic important pe care nu l n-2 grade de libertate, adic ) SE ( demonstrm!) D) Determinarea regiunii critice Dac nivelul de semnificaie este fixat la 5%, pe baza statisticii test folosite, regiunile de respingere pentru cele trei situaii a) H1 : * b) H1 : < * ; c) H1 : > * sunt prezentate n figurile a-c).

a)

b)

c) Fi 1 Am notat cu tcrt valoarea critic a statisticii test, mai precis acea valoare (obinut din tabele) care marcheaz regiunea de respingere. (Aceast regiune de respingere este format din dou intervale, (, tcrt ) i (tcrt , +) , n prima situaie.) Etapele testului de semnificaie pentru Ipoteza nul H0 : = *

Ipoteza alternativ H1 : > * sunt prezentate n caseta urmtoare:

i eroarea sa standard SE ( ) ; 1. Obinem estimaii OLS pentru


= * unde * este valoarea 2. Calculm valoarea statisticii test t ) SE ( parametrului din ipoteza nul;
3. Fixm nivelul de semnificaie, de exemplu la 5% i gsim din tabelele repartiiei t (n 2) valoarea critic tcrt ; (putem folosi i funcia Excel TINV cu dou argumente: nr. grade de libertate i probabilitatea) 4. Regula de decizie:

> tcrt , atunci suntem n regiunea de dac valoarea statisticii test t respingere a ipotezei nule i, prin urmare, acceptm ipoteza alternativ; < tcrt , atunci nu putem respinge dac valoarea statisticii test t ipoteza nul i nu putem accepta ipoteza alternativ!

Testul de semnificaie i abordarea prin intervalele de ncredere Am vzut n testul de semnificaie pentru un parametru (la noi ) c ipoteza nul H 0 : = * nu poate fi respins dac valoarea statisticii test se afl n intervalul de nerespingere de forma (pentru cazul bilateral) * tcrt t ) crt SE ( Rearanjnd termenii, obinem: ) * t SE ( ) sau t SE ( ) * + t SE ( ) . tcrt SE ( crt crt crt Vom spune c t SE ( ), + t SE ( )) ( este un interval de ncredere pentru . Dac nivelul de semnificaie este 5%, atunci vom spune c avem un interval de ncredere 95% pentru parametrul modelului. Concluzie. Pentru un acelai nivel de semnificaie testul de semnificaie i abordarea prin intervale de ncredere va da acelai rezultat. Tem: a) se va aplica testul t pentru parametrii modelului de regresie multipl cu outputul n Figura 1 i seva decide asupra semnificaiei fiecruia; b) folosind formulele de mai sus scriei intervalele de ncredere 95% pentru fiecare dintre parametrii folosind aceleai informaii din figura 1. (cunoatem c tcrt ,2.5% = 2.17 ).
crt crt

4) Testul F (Snedecor-Fisher) pentru verificarea dependenei liniare yi = 0 + 1 xi ,1 + 2 xi ,2 + ei i = 1, 2,...., n A) Ipotezele testului pentru regresia de mai sus: H 0 : 1 = 2 = 0 (ipoteza nul); H 1 : nu toi parametrii sunt nuli, mcar unul este diferit de zero. B) Alegem nivelul de semnificaie (poate fi 5%); MSR C) Statistica folosit este (vezi notaiile de la curs) care are o repartiie, MSE cnd ipoteza nul este adevrat, Fk ,n ( k +1) grade de libertate (n exemplul nostru k=2). D) Se calculeaz F * =

MSR din datele modelului de regresie iar decizia se ia MSE folosind valoarea Fcrt , , astfel:
Dac F * Fcrt , atunci respingem ipoteza nul i acceptm existena unei dependene liniare; Dac F * < Fcrt , nu putem respinge ipoteza nul, o acceptm i n consecin, putem afirma c nu exist o dependen liniar ntre variabile.

Tem: Se va analiza dependena din outputul din figura 1 folosind testul F. 5) Analiza reziduurilor (vezi figurile 3 i 4) View Actual, Fitted, Residiual

Figura 3. Valori observate, valori ajustate i reziduuri

Figura 4. Graficul valorilor reziduale Validare ipotezelor modelului a) Homoscedasticitatea se verific folosind un test de reziduuri conform traseului din figurile 5 i 6.

Figura 5. Alegerea unui test residual (Heteroskedasticity Tests)

Figura 6. Specificarea folosirii testului White Se analizeaz rezultatul testului White avnd outputul din figura 7.

Figura 7. Output al testului White Modelul de regresie asociat n testul White este unul cu termeni ptratici n variabilele de influen dar i cu termeni micti (cross terms), a se vedea cursul. Se va analiza semnificaia fiecrui termen (din modelul auxiliar) pentru a verifica ipoteza nul:

H 0 : i2 = 2 (pentru orice indice i), cu alternativa H1 : i2 2 (pentru cel puin un indice i).

b) Independena erorilor I. Analiza autocorelrii (de ordinul I). Reamintim modelul de regresie simpl: yt = + xt + et t = 1, 2,...., T et = et 1 + vt pentru t = 2,..., T

unde vt N (0, v2 ) . Folosim reziduurile (din coloana RESID), pe care trebuie s le salvm:
genr R_EQ1=RESID

1. Verificm corelarea ntre reziduuri i reziduurile ntrziate:


scat R_EQ1(-1) R_EQ1

Apare graficul:

Corelarea nu este evident! Continum cu estimarea lui din model, cu comanda:


ls R_EQ1 R_EQ1(-1)

et = et 1 + vt

rezultatul fiind citit n tabelul urmtor.


este mic (0.34), dar i valoarea p este mare Concluzii: coeficientul de autocorelaie (0.286), deci suntem n zona de nedecizie privind semnificaia parametrului!

Verificarea valorii statisticii Durbin-Watson.

Comanda
genr DW=2*(1-C(1))

d rezultatul 1.307. Erori autocorelate. Detecia prin testul Durbin-Watson, relum ecuaiile yt = + xt + et t = 1, 2,...., T et = et 1 + vt pentru t = 2,..., T unde vt N (0, v2 ) . Testul statistic DW folosete perechea de ipoteze: H 0 : = 0 (ipoteza nul); H1 : 0 (ipoteza alternativ). Se folosete statistica DW =

(r r
t =2 t

t 1

)2 care este cunoscut ca statistica test

r
t =2

) unde = corr (rt , rt 1 ) Durbin-Watson. DW este aproximativ egal cu 2(1 (coeficientul de corelaie dintre reziduuri i reziduurile ntrziate cu o perioad de 1 , avem prin urmare 0 DW 4 . Statistica DW este tabelat, timp). i cum 1 valorile ei depinznd de nivelul de semnificaie precizat, de numrul de observaii n

eantion i de numrul variabilelor de influen din modelul de regresie. Statistica test DW, pentru un nivel de semnificaie precizat, are dou valori critice d L i dU ce se obin din tabelele DW. Regiunile de respingere a ipotezei nule sunt definite astfel: dac DW [0, d L ] respingem H 0 , autocorelaia de ordinul I fiind pozitiv; dac DW [4 d L , 4] respingem H 0 autocorelaia fiind negativ;

dac DW [dU , 4 dU ] nu se confirm prezena autocorelaei. Cum valoarea 2 aparine intervalului [dU , 4 dU ] , aceast situaie corespunde cazului n care valorile statisticii test DW sunt aproximativ egale cu 2. Dac ns DW ia valori n intervalul [d L , dU ] sau n [4 d L , 4 dU ] , testul nu este concludent. S presupunem acum c n modelul de regresie exist o autocorelaie de ordinul s, adic: et = 1et 1 + 2et 2 + ... + s et s + vt . Pentru testarea prezenei acestui tip de autocorelare se va folosi testul BreuchGodfrey (vezi cursul). Analiza autocorelrii de ordin superior a) Prin comanda
ls inv c pnb ar(1) ar(2) ar(3)

are ca efect ouputul EViews

sau putem folosi relaiile din tabelul de mai jos

b) Prin testul Breuch-Godfrey (a se vedea cursul). Mai jos avem exemplificat cazul n care se folosete testul Breuch-Godfrey pentru testarea unei autocorelaii de ordinul 2 n modelul de regresie dintre Investiie ca variabil dependent i dou variabile de influen PNB i Rata_dobnzii. Comenzile sunt:

Figura 8. Alegerea unui test Rezidual privind autocorelarea erorilor Outputul este cel prezentat n figura 9.

Figura 9. Output pentru tetsul Breusch-Godfrey c) Normalitatea (se va folosi cursul) Se utilizeaz un test de reziduuri urmnd secvena de comenzi View Residual Tests Histogram Normality Test Se interpreteaz rezultatele din figura 10 ( se vor folosi informaiile de la curs).

Figura 10. Output pentru testul de normalitate Jarque-Bera Regresia liniar n EViews (III)

A) Corectarea modelului, cnd este identificat o autocorelare a erorilor Revenim la modelul de regresie dintre variabila INVESTITIE ca variabil dependent i variabila PNB ca variabil independent (de influen). S revedem outputul de regresie

Observm c DW = 1.227 (valoare care ne situeaz mai degrab n zona de indecizie). Putem s ne considerm n situaia prezenei unei autocorelri de ordinul I, adic yt = + xt + et t = 1, 2,...., T et = et 1 + vt pentru t = 2,..., T unde vt N (0, v2 ) . Pentru corectarea modelului folosim un model dinamic de regresie, de forma: yt = 0 + 0 xt + 1 xt 1 + yt 1 + vt t = 2,...., T (verificai!). n EViews modelul se va estima prin folosirea comenzii:
ls INVESTITIA c PNB PNB(-1) INVESTITIA(-1)

Obinem outputul:

Pare un model mult mai bun! Coeficienii pot fi identificai cu mare precizie: am folosit comanda: View Representation

Salvm rezultatele n EQ_DINAMIC i reziduurile corespunztoare n R_DINAMIC (prin comanda genr R_DINAMIC=RESID). Redesenm graficul reziduurilor vs. Cele ntrziate:
scat R_DINAMIC(-1) R_DINAMIC

Analiznd graficul nu pare s avem o dependen ntre reziduuri i reziduuri ntrziate. Deci, nu se identific corelaie! S folosim i regresia simpl dintre vectorul reziduurilor i cel al reziduurilor ntrziate; comanda este:
ls R_DINAMIC R_DINAMIC(-1)

Analiznd outputul de mai sus (regresia este de forma rt = rt 1 + et t = 2,3,...., T ), observm c despre coeficientul nu putem afirma nimic, (folosind testul t), el poate fi considerat statistic zero (p-value este n zona de indecizie). Corectarea modelului: n EViews putem aplica direct procedura CochraneOrcutt de corecie, exploatnd noua regresie yt 1 = 0 + 0 ( xt xt 1 ) + vt t = 2,...., T yt

i folosind comanda
ls investitia c pnb ar(1)

Citim mai sus direct estimaii pentru coeficienii modelului-pereche yt = + xt + et et = et 1 + vt

B) Verificarea normalitii

se observ faptul c Skewness are valoare negativ ceea ce indic o asimetrie stng; Kurtosis este sub valoarea 3 ceea ce indic o repartiie platikurtic

Verificarea ipotezei de normalitate prin testul Jarque-Bera: H 0 : skewness = 0, kurtosis = 3 - repartiia normal H 1 : repartiia nu este normal Cum p-value = 0.7922, eroarea pe care o facem prin respingerea ipotezei nule este destul de mare, deci nu o putem respinge. Putem deci afirma c reziduurile sunt

repartizate normal dar, n aceeai msur am putea s spunem i c ne situm n zona de incertitudine! C) Modelul mai bun Pentru a ajusta mai bine modul n care investiia INV este influenat de variabila PNB, am putea considera modelul de forma: ln( INV )t = a + b ln(PNB) t + c ln(PNB)t 1 + d ln(INV)t 1 + vt '
c d (corespunztor dependenei INVt = A PNBb t PNBt -1 INVt -1 vt ) Aici coeficienii b,c,d au interpretare de elasticiti). Outputul EViews este cel din tabelul urmtor:

interpretai coeficienii modelului! analizai valoarea statisticii DW.

Pentru a decide asupra homoscedasticitii analizai outputul urmtor:

Nu este clar nclcarea ipotezei de homoscedasticitate.

Pentru a analiza ipoteza de normalitate folosim testul Jarque-Bera (vezi rezultatul EView de mai jos)

Am putea accepta c ipoteza de normalitate a erorilor nu poate fi respins avnd o valoare p =0.729.

S-ar putea să vă placă și