Sunteți pe pagina 1din 10

alina.zaharia00@gmail.com .

Alina Zaharia CDA Alina Zaharia


Conf.univ.dr. Roxana Ptrlgeanu

Seminar Econometrie EAM ASE

Programul informatic Eviews modelul regresiei simple

Ecuatia modelului liniar al regresiei simple: yt=a*xt+b+t, t=1...T

Pas 1: Descarcati programul Eviews accessand:


http://www.eviews.com/EViews9/EViews9SV/evstud9.html sau
http://register1.eviews.com/Lite/
- selectati versiunea va trebui sa completati un formular pentru a beneficia de gratuitate, versiunea
Eviews Student Version Lite
- veti primi pe email serial number pe care, dupa ce downloadati programul Eviews, va trebui sa-l
introduceti in prima fereastra aparuta in urma deschiderii programului, pentru a fi functionabil.
Pentru proiect la primul pas va trebui sa prezentati datele problemei!: un tabel cu perioada si
datele celor doi indicatori. Nu uitati de sursa.

Pas 2: Exportarea bazei de date realizata de dvs. in Microsoft Excel in programul Eviews:
Selectati meniul File -> Open -> Foreign data as workfile
Selectati fisierul excel din calculatorul dvs. si click stanga pe butonul Open al ferestrei afisate
Apare fereastra Excel Read -> Predefined range -> selectati tara -> Next
Dati click stanga pe coloana Tara si mergeti la sectiunea Data type -> selectati Character; Dati
click stanga pe coloana An si la sectiunea Data type -> selectati Date -> Next
Sectiunea Basic structure -> Dated specified by date series -> Finish
Apoi, apare un mesaj de la Eviews -> Yes fereastra cu indicatorii din baza de date

Pas 3: Formatarea indicatorilor


Redenumirea variabilelor: Selectati indicatorul -> click dreapta -> Rename -> denumiti
indicatorul cu un nume mai scurt -> ok
Generati o noua serie:

1
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

ex.1. transformati unitatea de masura a productiei de cereale (t) in mii tone: Quick -> Generate
series -> Enter equation: qcereale_um=qcereale/1000 -> OK
ex.2. calculati randamentul pentru cereale (productie/suprafata):Quick -> Generate series -> Enter
equation: rand_cereale_calculat=qcereale/suprafata_cultivata_cereale -> OK

Pas 4: Realizarea graficului fiecarei variabile in parte, statistica descriptive a acesteia i


normalitatea datelor
4.1. Realizarea graficului pentru 1 variabila:
Varianta 1. Selectati variabila -> click dreapta -> Open -> View -> Graph -> OK -> Graph type
alegeti tipul de graphic optim, precum si alte optiuni ale elementelor acestuia -> OK
Varianta 2. Selectati variabila -> meniul Quick -> Graph -> OK -> Graph type alegeti tipul de
graphic optim, precum si alte optiuni ale elementelor acestuia -> OK
Pentru proiect trebuie sa realizai graficul pentru ambele serii de timp (indicatori) si fcut
interpretarea.
4.2. Prezentarea statisticii descriptive i discutarea normalitii distribuiei:
Varianta 1. Selectati variabila -> meniul Quick -> Series statistics -> Histogram and stats -> inserati
numele seriei -> ok. Va sugerez alegerea acestei variante deoarece puteti observa i
graficul atribuit distribuiei.
Varianta 2. Selectati variabila -> click dreapta -> Open -> View -> Descriptive statistics&tests ->
Stats table (afiseaza informatii referitoare la medie, minim, maxim, abaterea standard,
testele Skewness, Kurtosis si Jarque-Bera, care indica distributia normala sau nu a
datelor, totalul per variabila, totalul abaterilor standard si, in final, numarul de observatii
ale variabilei).
! Normalitatea distributiei datelor unei variabile poate fi determinate si prin metoda
grafica realizarea histogramei !
Pentru proiect trebuie sa realizai graficul pentru ambele serii de timp (indicatori).
Interpretarea statisticii descriptive trebuie realizata pe modelul celor realizate la disciplina Statistica.
Interpretare teste:
Skewness-Kurtosis (mai bun):
Distributia normala este simetrica in ambele parti a graficului variabilei analizate si are valoarea 0
pentru Skewness (tendinta catre dreapta: Skewness este pozitiv si tendinta catre stanga: Skewness
este negativ) [-0.5-+0.5] interval moderat Skweness.

2
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

Kurtosis indica aplatizarea sau inaltimea ridicata a varfului graficului variabilei analizate si are
valoarea 3 pentru distributia normala.
! Aceste 2 teste trebuie interpretate diferit in functie de marimea observatiilor ( a se vedea
https://www.youtube.com/watch?v=yBchM_EeGfA pentru informatii suplimentare) !
Jarque-Bera:
H0. Distributie normala. H1. Nu prezinta distributie normala.
Daca p-value este mai mare decat 0.05, ipoteza nula este acceptata. Daca probabilitatea este mai
mica decat 0.05, ipoteza nula este respinsa si datele trebuie transformate pentru a prezenta o
distributie normala.
Transformarea datelor care nu prezinta o distributie normala: ex. logaritmare.

Dac datele nu devin normale nici dup logaritmare, va continua aplicaia cu seria iniial.

Pas 5: Realizarea graficului/corelogramei pentru mai mult de 2 variabile si statistica


descriptive a acestora.
5.1. Realizarea graficului pentru 2 sau mai multe variabile:
Varianta 1. Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Graph -> OK ->
Graph type alegeti tipul de grafic optim, precum si alte optiuni ale elementelor acestuia
-> OK.
! Pentru a realiza un grafic mai clar va sugerez sa selectati Basic graph -> Line&Symbol
-> selectati optiunea Axes & Scaling -> in dreapta ferestrei, optiunea Series axis
assignment selectati de ex. 1 left si 2 right -> in partea de jos a ferestrei, optiunea Dual
axis caling, selectati Overlap scales -> OK !
Varianta 2. Selectati variabilele -> meniul Quick -> Graph -> OK -> Graph type alegeti tipul de
graphic optim, precum si alte optiuni ale elementelor acestuia -> OK.
5.2. Prezentarea statisticii descriptive pentru 2 sau mai multe variabile:
Varianta 1. Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Descriptive stats -
> Individual Sample/Common sample.
Varianta 2. Selectati variabilele -> meniul Quick -> Group statistics -> Descriptive statistics ->
Individual Sample/Common sample -> ok
! Apar diferente in cazul celor 2 optiuni -Individual Sample/Common sample doar in cazul in care
variabilele au un numar diferit de observatii !

3
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

Normalitatea distributiei datelor unei variabile poate fi determinata si prin metoda grafica
realizarea histogramei.
Interpretarea statisticii descriptive trebuie realizata pe modelul celor realizate la disciplina Statistica.
5.3. Realizarea corelogramei pentru 2 sau mai multe variabile:
Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Graph -> Graph options ->
Specific: Scatter -> Details, Fit lines: selectati Regression line.
5.4. Discutarea corelogramei:
Varianta 1. Selectati variabilele -> dublu click stanga -> View -> Correlogram -> ok.
Interpretare: Corelograma indic trendul i sezonalitatea evoluiei datelor. Pentru a nu nregistra
sezonalitate coloanele indicate de corelogram nu trebuie s depeasc liniile punctate din stnga i
din dreapta. Astfel, dac se ncadreaz n limitele impuse de liniile punctate nu exist sezonalitate.
n plus, este indicat autocorelaia fa de 12 laguri (adic perioada de timp, ani n cazul vostru). n
exemplul de mai jos, se observ prezena autocorelrii fa de valoarea anterioar nregistrat pentru
seria considerat.
Exemplu:

Pas 6: Testarea stationaritatii variabilelor modelului ipoteza necesara a fi indeplinita pentru


validitatea modelului si transformarea variabilelor nestationare
6.1. Testarea stationaritatii fiecarei variabile in parte i transformarea variabilelor nestationare:
Selectati variabila -> click dreapta -> Open -> View -> Unit Root Test -> selectam optiunea
Augumented Dickey-Fuller -> testam existenta unei radacini unitate pentru cele 3 niveluri - Level,
4
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

1st difference, 2nd difference si includem in testare existenta unei constante (intercept) sau a unui
trend impreuna cu constanta (trend and intercept) sau inexistenta ambelor (none), pana identificam
nivelul la care apare stationaritatea -> OK.
Rezultatele testului si interpretarea lor:
H0. Variabila are o unitate radacina (ipoteza nula) si, deci, datele NU sunt stationare
H1. Datele sunt stationare
Daca probabilitatea aferenta testului t-statistics (Prob.) are o valoare sub 0.05 si valoarea in modul a
testului Dickey-Fuller este mai mare decat cele 3 valori critice in modul ale testului (Test critical
values) de pe coloana t-statistics, atunci ipoteza nula de existenta a unei radacini unitate poate fi
respinsa si, deci, datele sunt stationare.
In caz contrat, daca probabilitatea aferenta testului t-statistics (Prob.) are o valoare mai mare de 0.05
si/sau valoarea in modul a testului Dickey-Fuller este mai mica decat cele 3 valori critice in modul
ale testului (Test critical values) de pe coloana t-statistics, atunci ipoteza nula este confirmata si,
deci, datele NU sunt stationare. Astfel, in acest caz, trebuie testat nivelul diferentelor pana cand
stationaritatea este identificata.
Odata identificata stationaritatea, datele initiale trebuie transformate astfel incat sa devina
stationare: Selectati meniul Genr / Quick + Generate Series -> introduceti ecuatia pentru
diferentiere: denumirea_noii_seriei=d(denumirea_vechii_serii, n), unde n reprezinta nivelul de
diferenta: 1 sau 2.
6.2. Testarea stationaritatii pentru variabilele considerate ca grup in modelul ales:
Selectati variabilele -> click dreapta -> Open -> as Group -> View -> se aplica aceeasi pasi ca si in
cazul unei singure variabile.

Pas 7: Retestarea normalitatii prin realizarea de histograme aferente fiecarei variabile a


modelului
Selectati variabila -> click dreapta -> Open -> View -> Descriptive statistics&tests ->
Histogram&stats.
Interpretare teste:
Skewness-Kurtosis (mai bun):
Distributia normala este simetrica in ambele parti a graficului variabilei analizate si are valoarea 0
pentru Skewness (tendinta catre dreapta: Skewness este pozitiv si tendinta catre stanga: Skewness
este negativ) [-0.5-+0.5] interval moderat Skweness.
Kurtosis indica aplatizarea sau inaltimea ridicata a varfului graficului variabilei analizate si are
valoarea 3 pentru distributia normala.

5
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

! Aceste 2 teste trebuie interpretate diferit in functie de marimea observatiilor ( a se vedea


https://www.youtube.com/watch?v=yBchM_EeGfA pentru informatii suplimentare) !
Jarque-Bera:
H0. Distributie normala.
H1. Nu prezinta distributie normala.
Daca p-value este mai mare decat 0.05, ipoteza nula este acceptata. Daca probabilitatea este mai
mica decat 0.05, ipoteza nula este respinsa si datele trebuie transformate pentru a prezenta o
distributie normala.
Transformarea datelor care nu prezinta o distributie normala: ex. logaritmare.

Pas 8: Stabilirea modelului care va fi testat:


6.1.Stabilirea variabilei endogene (dependente) si a variabilei(-lor) exogena(-e)/independenta(-e).
yt= a*xt+b+
6.2. Selectarea acestor variabile din fereastra initiala cu baza de date.

Pas 9: Realizarea matricei de corelatie si interpretarea rezultatelor


Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Covariance analysis ->
selectati doar Correlation + Probability -> bifati Balanced sample -> OK
Interpretare rezultate:
Daca probabilitatea testului t este mai mica decat 0.05, atunci exista o corelatie semnificativa
statistic la un nivel de 5%. Altfel, nu exist corelaie semnificativ statistic ntre cele dou variabile
Interpretarea este similara pentru 0.01 si 0.10.
Pentru a aplica modelul regresiei, probabilitatea trebuie s fie peste 0,40-0,50, o limit acceptat n
literatura de specialitate, deoarece modelul nu ar trebui s introduc variabile corelate ntre ele
ntruct acestea ar trebui s fie independente.

Pas 10: Testarea cauzalitii dintre variabile:


Pentru testarea cauzalitii dintre variabile, adic a direciei de influen regsit ntre cele dou
variabile se aplic testul Granger.
Selectarea variabilelor modelului -> click dreapta -> Open -> View -> Granger causality -> lag
specification (ramane implicit 2) -> apare fereastra cu rezultate.
Interpretare rezultate:
6
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

Dac probabilitatea aferent lui F-statistic este mai MIC dect 0,05, atunci exist o relaie cauzal
ntre cele dou variabile, cu referire la faptul c prima variabil menionat influeneaz a doua
variabil. Contrar, dac probabilitatea aferent lui F-statistic este mai MARE dect 0,05, atunci NU
exist o relaie cauzal ntre cele dou variabile, adic prima variabil menionat NU influeneaz a
doua variabil.
!Atenie! Exist posibilitatea cauzalitii doar ntr-o singur direcie, adic doar o variabil poate
influena a doua variabil fr a exista situaia vicevers.

Pas 11: Aplicarea modelului liniar al regresiei simple si interpretarea rezultatelor


Selectarea variabilelor modelului -> Open -> as Equation -> se deschide fereastra Equation
Estimation -> verificati daca ecuatia apare sau daca trebuie sa o scrieti dvs. -> ok
Interpretare rezultate:
11.1. Parametri estimati ai modelului
Fereastra ce afiseaza rezultatele -> View -> Representation
Parametrul a arat relaia direct (+) sau indirect (-) ntre cele dou variabile estimate. n plus, la
interpretare trebuie adugat: Pentru un an adiional al xt, yt va crete cu a. Atenie la unitatea de
msur a parametrului a.
11.2. Interpretarea rezultatelor regresiei simple
Testul t-statistics:
Daca probabilitatea aferenta acestui test este mai mica decat 0.05, atunci variabila introdusa in
model este bine aleasa si produce efecte asupra variabilei endogene.
R-squared (R2) [0,1]:
-> 1 modelul indica o influenta puternica a variabilei independente/ exogene asupra variabilei
dependente/endogene.
-> 0 variabila dependenta/endogena este explicata foarte putin de variabila independent/
exogen, ceea ce nseamn c exist ali factori care contribuie la evoluia variabilei endogene.
F-statistics:
Daca probabilitatea aferenta acestui test este mai mica decat 0.05, atunci modelul este valid.
Durbin-Watson:
Acest test indica corelatia intre erorile modelului. Acesta ar trebui sa se situeaza in jurul valorii 2
pentru ca erorile sa NU fie corelate si una din ipotezele modelul sa fie valida.

7
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

Pas 12: Analiza parametrilor modelului:


12.1. Identificarea parametrilor modelului:
Fereastra Equation -> View -> Representation sau
Fereastra Equation -> View -> Coefficient diagnostics -> Scaled coefficients -> coloana Coefficient.
12.2. Stabilirea intervalului de incredere:
Fereastra Equation -> View -> Coefficient diagnostics -> Confidence intervals -> ok
Interpretare: Valoarea parametrului real a se gaseste in intervalul a[;] cu o probabilitate de
99%/95%/90%.
In practica, se prefera probabilitatea de peste 95%.
12.3. Verificarea daca modelul este unul complet
Fereastra Equation -> View -> Coefficient diagnostics -> omitted variables test / redundant variables
test
In acest caz, se poate testa daca unele variabile sunt redundante sau daca alte variabile s-au omis din
model, dar trebuie sa avem date la aceste variabile.
NU APLICATI IN PROIECT punctul 12.3!

Pas 13: Testarea validitii modelului (analiza reziduurilor):


Fereastra Equation -> View -> Actual, fitted, residual -> Actual, fitted, residual table/graph
Coloana Residual se afla prin diferenta dintre Actual si Fitted. Residual plot arata valorile valorilor
reziduurilor in functie de linia de regresie.
Pentru ca modelul sa fie valid, reziduurile trebuie sa fie homoscedastice, neliniare si distribuite
normal.
13.1. Testarea heteroscedasticitii reziduurilor si transformarea datelor
Fereastra Equation -> View -> Residual diagnostics -> Heteroskedasticity tests -> White test.
Interpretare: Probabilitatile Test White trebuie sa fie >=0,05 pentru a indica homoscedasticitatea
reziduurilor, care este una dintre ipotezele de validitate a reziduurilor si, implicit, a modelului.
H0. erorile sunt homoscedastice: prob.<=0,05 respingem H0, else >=0,05 acceptam ipoteza nula
H1. ipoteza alternativa, erorile sunt heteroscedastice
In caz de heteroscedasticitate, variabilele modelului trebuie transformate pentru ca erorile sa devina
homoscedastice.Acest lucru se poate realiza prin logaritmare:log(x). Acest log se va interpreta ca %!
13.2. Testarea autocorelaiei reziduurilor

8
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

Fereastra Equation -> View -> Residual diagnostics -> Serial correlation LM test -> 2 lags ->ok
Interpretare:
H0. NU exista corelatie intre reziduuri in timp. H1. exista corelatie intre reziduuri in timp.
Prob.Chi-sqare este <= 0,05, atunci ipoteza nula poate fi respinsa, deci exista corelatie intre seriile
de timp. In acest caz, corelatia trebuie corectata. Aceasta poate fi realizata prin prima diferenta a
seriilor de timp considerate (variabilel modelului) (first difference d(x) ). In cazul corectarii prin
prima diferenta, constanta (intercept) nu se introduce in model. Quick-> equation -> scriem modelul
cu prima diferenta aplicata modelului.
Altfel, Prob.Chi-sqare este >= 0,05, atunci reziduurile NU sunt correlate si modelul este valid.
13.3. Testarea normalitii reziduurilor
Fereastra Equation -> View -> Residual diagnostics -> Histogram normality test -> apare fereastra
cu histograma, care trebuie interpretata conform indicatiilor de la pasul 8.

Pas 14: Previziunea variabilei endogene:


In fereastra ce afiseaza rezultatele regresiei: Equation -> meniul Forecast -> stabilim intervalul de
timp -> ok
Se poate realiza o previziune ex-post pentru a vedea daca modelul ales este valid pentru forecasting.
De exemplu, alegem perioada 2000-2014 (care este in perioada seriilor de timp) si apoi facem grafic
pentru a vedea daca yt si yt previzionat sunt aproape similare, pentru a avea model valid, bun.
!Eviews nu poate estima o previzione daca variabila dependenta nu prezinta date pentru perioada
aleasa!
Pentru a estima previziunea pentru 2015, stabiliti valoarea lui x pentru 2015 si estimati y2015 dupa
modelul realizat in seminarul 2. Incercati sa fie o valoare apropiata de realitate uitandu-va la
valoarea inregistrata pentru 2014.
Root mean squaredaca prezinta o valoare mica atunci previziuna realizata este buna/satisfacatoare.

n final, pentru informatii suplimentare accesati youtube si cautati Eviews Regression pentru a
beneficia de videoclipuri care explica pas cu pas utilizarea Eviews-ului si interpretarea modelelor
aplicate.

Succes!
9
alina.zaharia00@gmail.com . Alina Zaharia CDA Alina Zaharia
Conf.univ.dr. Roxana Ptrlgeanu

10