Proiect Econometri

Tema pentru seminar econometrie
Profesor Indrumator: Gheorghe Ruxanda
Proiect la econometrie Modelul unifactorial de regresie ( regresia simpla)
Proiectul urmareste realizarea unui model econometric ( regresie simpla liniara) referitor la datele despre produsul intern brut (PIB) si exporturi, mai exact urmareste sa determine in ce masura este influentat sau explicat PIB-ul in de exporturi. Pentru realizarea studiului econometric am avut in vedere urmatoarele date: PIB-ul national, pe o perioada de 19 ani (1990-2008) exprimat in milioane euro (EUR), fig.nr.1; Exporturile nationale, luate pe aceeasi perioada, exprimate in milioane euro, fig.nr.2; o Sursa datelor: EUROSTAT.
Fig.nr.1: PIB-ul Romaniei 1990-2008
Fig.nr..2: exporturile Romaniei 1990-2008
Produsul intern brut este un indicator macroeconomic care reflecta suma valorii de piata a tuturor marfurilor si serviciilor destinate consumului final, produsein toate ramurile economieiin interiorul unui statin decurs de un an. Deoarece PIB-ul combina suma tuturor activitatilor care se
pot evalua in bani si nu a folosintei acestora (sau chiar a distrugerii acestora) este un mijloc conditionat de masurare a bunastarii si a calitatii vietii. Exporturile reprezinta exporturile brute ale unei tari, incluzand bunuri si servicii, destinate consumului intr-o alta tara. Pe baza datelor din fig.nr.1 si fig.nr.2 se poate construi un model econometric unifactorial de forma: y=f(x) unde: - y reprezint valorile reale ale variabilelor dependente (PIB-ul); - x reprezint valorile reale ale variabilelor independente (exportul); Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea specificare a variabilelor: -y PIB-ul reprezentnd variabila rezultativ -x exportul, factorul de influena asupra variabilei y. Formula de calcul a PIB-ului este insa urmatoarea:
Produs Intern Brut = Consum Privat + Consumul Guvernamental +Investitii + Exporturi Nete
Pe baza acestei formule putem afirma insa, ca Pib-ul nu depinde numai de exportui, de fapt observam ca in formule se afla indicatorul exporturi nete. Exporturile nete reprezinta diferenta dintre exporturi ( cele pe care le-am luat in considerare in acest studiu) si importuri. Asadar se poate afirma ca PIB-ul mai depinde de o serie de alti fcatori precum: - Consumul privat; - Consumul guvernamental; - Investitii; - Importuri Specificarea unui model econometric presupune alegerea unei funcii matematice cu ajutorul creia poate fi descris legtura dintre cele dou variabile. Pentru modelul unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic ( norul de puncte) cu ajutorul diagramei cu puncte ( scatter plot) realizata in Excel:
Norul de puncte
160000 140000 120000 100000 80000 60000 40000 20000 0 0 50000 100000 150000
PIB
EXPORT
Fig.nr.3 Graficul punctelor empirice arata ca exista o legatura intre cele doua variabile, avand o forma liniara, intrucat majoritatea punctelor din grafic se concentreaza in jurul unei linii imaginare. Exista insa si puncte care se abat intr-o masura mica de la forma liniara observata. Aceste abateri reprezinta tocmai factorii de care mai depinde PIB-ul la care am facut referire cand am specificat modelul. Tocmai din cauza acestor abateri vom introduce in model factorul aleatoriu . In concluzie putem sa presupunem ca modelul nostru este unul liniar, de forma: f (X ) =a +bX PIB= f( export, alti factori) Yi =a +bXi + pentru orice i =1,19 Semnificaia celor doi parametri a i b, innd cont de semnificaia celor dou variabile (Y-PIB i X-export) este: - a reprezint punctul de intersectie al dreptei de regresie cu axa 0y si este deci un parametru al ecuatiei de regresie; - b reprezint panta dreptei sau coeficientul de regresie al PIB-ului in funcie de export, care msoar creterea PIB-ului national dac exportul national se modific cu o unitate de masura. El reprezint n acelai timp coeficientul marginal al PIB-ului n funcie de export. - este variabila rezidual ( factorul aleatoriu), reprezentnd influenele celorlali factori ai variabilei y, nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra variabilei y.
4
Testarea validitatii modelului de regresie determinat implica formularea a doua ipoteze: H0: model nevalid statistic; H1: model valid statistic; Dupa importul datelor din Excel in Eviews, se poate defini ecuatia prin comanda: ls consum c venit . Rezultatul este dat in Fig. Nr. 2:
Fig.nr.4.
Presupunand ca se lucreaza la nivelul de relevanta de 5%, cum, in figura de mai sus probabilitatile atasate testul t-Statistic sunt inferioare acestui nivel, coeficientii sunt considerati semnificativi din punct de vedere statistic. Valoarea lui R-squared arata ca aproximativ 99% din variatia exportului este explicatie pentru variatia PIB-ului . Concluzia este ca regresia este bine specificata. In ceea ce priveste F-statistic, se observa ca probabilitatea asociata acestuia este 0, deci mai mica decat nivelul de relevanta. Conform acestui test, rezulta ca cel putin un coeficient de regresie este semnificativ din punct de vedere statistic. Si valoarea testului Durbin-Watson arata posibilitatea de a exista o autocorelare a erorilor, avand in vedere valoare sa mare de 0,571518 pentru numarul de observatii existente si ca exista numai o singura variabila dependenta.
5
Fig.nr.5: estimarea ecuatiei propriu-zise Din figura nr.5. reiese ca la o crestere a exportului cu o unitate, PIB-ul va creste cu 0,99227 * 1 unitate (1 mil euro) de unde reiese inca o data existenta legaturii derecte dintre cele doua variabile. Testele pentru ecuatia de regresie sunt disponibile cu meniul VIEW din ferestra ecuatiei de regresie. Cu optiunea VIEW/ACTUAL,FITTED,RESIDUALGRAPH se reprezinta grafic valoarea efectiva a variabilei dependente, valoarea sa estimata si erorile de regresie (a se vedea fig.nr.5)
Fig.nr.6
Fig.nr.7. In Fig.nr.7 s-au testat erorile ecuatiei de regresie ( WiewResidual testsCorrelogramQ-statistic) Autocorelarea erorilor ecuatiei de regresie. Dupa cum arata si imaginea de mai sus, pentru lag-urile( am ales un numar de 12 laguri) erorilor exista o corelatie seriala a erorilor intrucat valoarea coeficientului de autocorelatie depaseste intervalul punctat in grafic ( autocorrelation si partial correlation). Existenta autocorelatiei este confirmata si de testul Q-statistic si de probabilitatea asociata acestuia. In continuare am folosit si optiunea de autocorelarea a erorilor patratice, ca sa verific daca exista vreo indicatie asupra existentei heteroscedasticitatii. Am folosit WiewResidual testsCorrelogram Squared Residuals. Aceasta optiune se bazeaza pe aceleasi principii ca si autocorelatia erorilor si conform acestora, in fig.nr.8 se observa ca nu exista autocorelatie a erorilor patratice ,deci poate exista homoscedasticitate.
Fig.nr.8
In ceea ce priveste distributia erorilor rezultate din regresie ( optiune pentru care am folosit ViewResidual testsHistogram-Normality test), aceasta este reprezentata mai jos in fig.nr.9.
Fig.nr.9 Coeficientul de asimetrie ( Skewness) are o valoare de 1,500732, adica nesemnificativ diferit de 0, fapt ce implica ca o distributie normala. Un alt argument pentru faptul ca exista o distribuitie normala este egalitatea dintre cele doua cozi (dreapta si stanga). Coeficientul de aplatizare ( Kurtosis) ce are o valoare de 4,351688 arata faptul ca distributia este un pic mai inalta decat cea normala ( cea normala fiind de 3). Astfel, testul Jarque-Bera, care ia in considerare cei doi coeficienti comentati mai sus, are o valoare de 8,578381, in conditiile in care valoarea sa critica pentru pragul de semnificatie de 5% este de 5,99 , deci eorile au o distributie normala. Existenta corelatiei seriale, aratata de corelograma erorilor din fig.nr.8 se confirma cu ajutorul testului Serial Correlation LM test ( ViewResidual testsSerial Correlation LM test). Am ales 3 lag-uri, iar rezultatul este prezentat in fig.nr.10:
Fig.nr.10
Dupa cum se observa si in Fig.nr.10, testul prezinta alte doua teste statistice, F-statistic si R-squared, precum si probabilitatile acestora. Ipoteza nula a celor doua teste spune ca nu exista corelatie seriala a erorilor ecuatiei de egresie pana la lag-ul de n ( in cazul de fata pana la lag-ul de 3, pe care l-am specificat mai sus) . Asa cum arata si probabilitatile celor doua teste (sunt inferioare nivelului de relevanta) se va respinge ipoteza nula, deci se repinge inexistenta corelatiei. In concluzie exista corelatie seriala a erorilor pana la lag-ul de 3. Testul similar testului de mai sus, pentru testarea corelatiei seriale a erorilor patratice este ARCH LM TEST sau testul Breusch-Godfrey ( VIEW/RESIDUAL TESTS->ARCH LM TEST). Pentru acest test am ales tot 3 lag-uri. Rezultatul este reprezentat in fig.nr.10:
10
Fig.nr.11 Conform celor doua probabilitati asociate, este respinsa ipoteza nula adica inexistenta corelatiei seriale ale erorilor ale ecuatiei de regresie.
11
In continuare mi-am propus sa analizez varianta reziduurilor. Pentru aceasta, am aplicat testul WHITE din EVIEWS astfel: VIEW/RESIDUAL TESTS->WHITE HETEROKEDASTICITY. Rezultatul in urma aplicarii testului este prezentat in fig.nr.12:
Fig.nr.12
In urma aplicarii acestui test, pentru ca varianta erorilor sa fi fost constanta (homoscedasticitate) valoarea lui OBS*R_Squared ar fi trebuit sa fie 0 sau sa tinda la 0. In cazul de fata aceasta valoare este de 5,474949 adica( 19 * 0,288155) si deci este semnificativa defierita de 0, ceea ce implica existenta heteroscedasticitatii (erorile sunt heteroscedastice).
12
Concluziile modelului: In urma analizelor si testelor efectuate se constata ca PIB-ul este explicat de variabla exogena export in proportie de 99% si ca exista o legatura liniara intre cele doua variabile explicata atat de grficul norului de puncte cat si de valoarea atat de ridicata a lui R 2. Toate celelalte teste arata ca modelul este valid, asa cum rezulta din interpretarea fiecarei figuri ce reprezinta respectivele teste.
Proiect la econometrie Modelul de regresie multipla
Proiectul urmareste realizarea unui model econometric (regresie multipla liniara) referitor la datele despre cursul de schimb RON/EUR, rata inflatiei si rata dobanzii de referinta, mai precis urmareste sa explice influenta cursului de schimb si a ratei de dobanda de referinta asupra ratei inflatiei. Pentru realizarea acestui model am utilizat urmatoarele date: Cursul RON/EUR mediu lunar, pe perioada ian2008-dec2010; Rata inflatiei, pe aceeasi perioada; Rata dobanzii de referinta pe aceeasi perioada; Datele au fost preluate de pe site ul bancii nationale romane si sunt prezentate in fig.nr.1.
EUR Data mediu rata inflatie rata dob de ref
(RON/EUR)
CURSL_EURM 4,2848 4,2842 4,2664 4,2674 4,2597 4,2471 4,3688 4,1792 4,1276 4,0958 6,25 6,25 6,25 6,25 6,25 6,25 6,25 6,50 7,00 7,25
dec. 2010 nov. 2010 oct. 2010 sep. 2010 aug. 2010 iul. 2010 iun. 2010 mai. 2010 apr. 2010 mar. 2010
0,22 0,53 1,05 1,61 2,17 2,41 5,04 5,21 5,36 5,73
13
feb. 2010 ian. 2010 dec. 2009 nov. 2009 oct. 2009 sep. 2009 aug. 2009 iul. 2009 iun. 2009 mai. 2009 apr. 2009 mar. 2009 feb. 2009 ian. 2009 dec. 2008 nov. 2008 oct. 2008 sep. 2008 aug. 2008 iul. 2008 iun. 2008 mai. 2008 apr. 2008 mar. 2008 feb. 2008 ian. 2008
4,1073 4,1220 4,2282 4,2738 4,2955 4,1981 4,2231 4,2127 4,2067 4,1786 4,1835 4,2348 4,2909 4,2775 3,9497 3,7794 3,6610 3,7336 3,5330 3,5366 3,6475 3,6213 3,6759 3,7276 3,7269 3,7246
5,96 6,17 7,96 8,3 9,02 9,5 9,92 9,71 9,64 9,86 9,87 10,17 10,72 11,69 13,08 13,34 13,7 14,91 15,37 15,27 16,07 16,39 16,95 17,56 18,35 19,18
7,50 8,00 8,00 8,00 8,50 8,53 9,00 9,50 9,71 10,02 10,07 10,14 10,25 10,25 10,25 10,25 10,25 10,25 10,00 9,75 9,75 9,50 9,03 9,00 8,00 7,50
Fig.nr.1 Forma ecuatiei de regresie multipla: Yt=b0 + b1X1t + b2X2t + t adica CURS= b0 + b1R_DOBt + b2R_INFLt + t unde: t = 1,2,...,36 reprezinta observatiile din esantion (N=36); Yt observatia t a variabilei dependente ( a cursului ) ( variabila dependenta); X1t=R_DOB variabila independenta rata dobanzii; X2t=R_INFL variabila independenta rata inflatiei; b0= constanta( termenul liber, C din eviews);
14
b1 si b2 coeficientii variabilelor independente; t = termenul de eroare al ecuatiei ( intrucat variabila CURS mai depinde si de o serie de alti factori);
Coeficientul variabilei independente arata cu cat se modifica variabila dependenta ( curs), atunci cand variabila independenta R_DOB se modifica cu o unitate, in conditiile in care celelalte variabile independente raman constante. Pentru ca inferenta bazata pe rezultatele regresiei liniare multiple sa fie valida, trebuie indeplinite un set de ipoteze: 1. Legatura dintre variabila dependenta si variabilele independente este liniara. 2. Variabilele independente sunt aleatoare. De asemenea intre variabilele independente incluse intr-o regresie nu exista nici o relatie liniara. Dac variabilele independente sunt corelate atunci exista multicoliniaritate. 3. Valoarea ateptata a termenului de eroare, t , este zero, E(t)=0; 4. Variana termenului de eroare, , este aceeasi pentru toate observatiile, . Aceste erori se numesc homoscedastice. Daca, in schimb, varianta termenului de eroare este variabile, erorile se numesc heteroscedastice, si trebuie utilizate metode diferite de estimare a regresiei. 5. Termenul de eroare este necorelat intre observatii. 6. Termenul de eroare este normal distribuit. Impactul incalcarii uneia dintre ipotezele de mai sus asupra rezultatelor regresiei: Heteroscedasticitate- erorile standard ale regresiei sunt incorecte; Corelatie serial a erorilor- erorile standard ale ecuatiei de regresie sunt incorecte; Multicoliniaritate- valori mari ale lui R2 si valori mici ale testului statistic t ale coeficientilor variabilelor independente. Definirea ecuatiei modelului in EVIEWS este reprezentata in fig.nr.2:
15
Fig.nr.2 In medie observam ca rata dobanzii este mai mare decat rata inflatiei in 20 din 36 de observatii, daca ne uitam la fig.nr1 mai exact pe intervalele de timp feb2009-ian2008 si iul2009-nov2009. Acest lucru poate indica faptul ca influenta lui r_dob asupra var dependente curs este mai mare decat influenta var r_infl asupra var dependente curs. Deasemenea se observa ca pentru fiecare variabila independenta si contanta ( in fig nr 2) , eviews a raportat eroarea standard a coeficientilor, testul t-statistic, si probabilitatea acestuia. Presupunem ca se lucreaza la un nivel de relevanta de 5%. Astfel observam ca probabilitatile atasate testului t-statistic sunt inferioare acestui nivel, deci coeficienti sunt considerati semnificativi statistic intrucat se observa ca probabilitatea de a gresi ipoteza considerata este de 0% ( P> t in modul = 0,00) in cazul r_infl, iar in cazul r_dob este de 0,1232, dar nesemnificativ diferit de 0. Valuarea lui r_squared arata ca 69% din variatia ratei dobanzii respectiv a ratei inflatiei explica variatia cursului de schimb. Daca observam valoarea lui ajusted r_squared, atunci observam ca aceasta este mai mica decat valoarea lui r_squared, mai precis de 67%, acest lucru fiind explicat de faptul ca dupa introducerea celor 2 variabile independente si anume a r_dob si r_infl, ajusted r_squared a penalizat introducerea aceleia care are o relevanta mai mica asupra cursului de schimb, adica a variabilei dependente. Constanta c este semnificativa din punct de vedere statistic, fapt explicat in urma aplicarii testului t . in consecinta vom pastra aceasta constanta, iar ecuatia de regresie ajunge la urmatoarea forma ( a se vedea fig nr 3 ) :
16
Fig.nr.3
Gradul de semnificatie a modelului este aratat de testul F, in urma caruia probabilitatea de a gresi cand consideram ca modelul este semnificativ este de 0% ( prob(Fstatistic)=0,00). In concluze modelul este semnificativ statistic. Testele pentru ecuatia de regresie sunt disponibile cu meniul VIEW din ferestra ecuatiei de regresie. Cu optiunea VIEW/ACTUAL,FITTED,RESIDUALGRAPH se reprezinta grafic valoarea efectiva a variabilei dependente, valoarea sa estimata si erorile de regresie (a se vedea fig.nr.4).
17
Fig.nr.4
In Fig.nr.5 s-au testat erorile ecuatiei de regresie ( WiewResidual testsCorrelogramQ-statistic) Autocorelarea erorilor ecuatiei de regresie. Dupa cum arata si imaginea de mai jos, pentru lag-urile( am ales un numar de 16 laguri) erorilor exista o corelatie seriala a erorilor intrucat valoarea coeficientului de autocorelatie depaseste intervalul punctat in grafic ( autocorrelation si partial correlation). Existenta autocorelatiei este confirmata si de testul Q-statistic si de probabilitatea asociata acestuia.
18
Fig.nr.5
In continuare am folosit si optiunea de autocorelarea a erorilor patratice, ca sa verific daca exista vreo indicatie asupra existentei heteroscedasticitatii. Am folosit WiewResidual testsCorrelogram Squared Residuals. Aceasta optiune se bazeaza pe aceleasi principii ca si autocorelatia erorilor si conform acestora, in fig.nr.6 se observa (exact ca si in figura numarul 5) ca exista autocorelatie a erorilor patratice ,deci poate exista heteroscedasticitate. Valoarea coeficientului de autocorelatie atinge graficul punctat.
19
Fig.nr.6 In ceea ce priveste distributia erorilor rezultate din regresie ( optiune pentru care am folosit ViewResidual testsHistogram-Normality test), aceasta este reprezentata mai jos in fig.nr.7.
Fig.nr.7
20
Valoarea testului Jarque-Bera are o valoare inferioara valorii sale critice de 5,99 pentru pragul de relevanta de 5%, iar probabilitatea este mai mare de 5%. Ipoteza conform careia distribuita este normala se va accepta. Existenta corelatiei seriale, aratata de corelograma erorilor din fig.nr.8 se confirma cu ajutorul testului Serial Correlation LM test ( ViewResidual testsSerial Correlation LM test). Am ales 3 lag-uri, iar rezultatul este prezentat in fig.nr.8:
Fig.nr.8
Dupa cum se observa si in Fig.nr.8, testul prezinta alte doua teste statistice, F-statistic si R-squared, precum si probabilitatile acestora. Ipoteza nula a celor doua teste spune ca nu exista corelatie seriala a erorilor ecuatiei de egresie pana la lag-ul de n ( in cazul de fata pana la lag-ul de 3, pe care l-am specificat mai sus) . Asa cum arata si probabilitatile celor doua teste se va
21
respinge ipoteza nula, deci se repinge inexistenta corelatiei. In concluzie exista corelatie seriala a erorilor pana la lag-ul de 3. Testul similar testului de mai sus, pentru testarea corelatiei seriale a erorilor patratice este ARCH LM TEST sau testul Breusch-Godfrey ( VIEW/RESIDUAL TESTS->ARCH LM TEST). Pentru acest test am ales tot 3 lag-uri. Rezultatul este reprezentat in fig.nr.9:
Fig.nr.9
Conform celor doua probabilitati asociate, este respinsa ipoteza nula adica inexistenta corelatiei seriale ale erorilor ale ecuatiei de regresie. In continuare mi-am propus sa analizez varianta reziduurilor. Pentru aceasta, am aplicat testul WHITE din EVIEWS astfel: VIEW/RESIDUAL TESTS->WHITE HETEROKEDASTICITY. Rezultatul in urma aplicarii testului este prezentat in fig.nr.10:
22
Fig,nr.10
In urma aplicarii acestui test, pentru ca varianta erorilor sa fi fost constanta (homoscedasticitate) valoarea lui OBS*R_Squared ar fi trebuit sa fie 0 sau sa tinda la 0. In cazul de fata aceasta valoare este de 6.685509 adica( 36 * 0.185709) si deci este semnificativa defierita de 0, ceea ce implica existenta heteroscedasticitatii (erorile sunt heteroscedastice). In concluzie, modelul specificat in acest proiect, de regresia mulipla, este valid, asa cum reiese si din intepretarile rezultatelor de mai sus.
23
Proiect la econometrie Evolutia unui indice bursier- serii de timp

In acest proiect mi-am propus sa analizez evolutia indicelui bursier BET-C, cu frecventa zilnica, valoarea de inchidere, pentru o perioada de 20 de zile ( 12.27.2010-1.21.2011). Datele necesare au fost preluate de pe site-ul Bursei de Valori Bucuresti, www.bvb.ro. Pentru perioada analizata sunt disponibile 20 de observatii, insa pentru a putea prognoza, am considerat un numar de 30 de observatii. Seria ce am creat-o in Eviews am denumit-o BET_C, si se poate observa in figura ce urmeaza:
Fig.nr.1
24
PRELUCRAREA SERIEI: Logaritmarea si prima diferenta sunt operatiile matematice cele mai utilizate asupra seriilor. Logaritmarea faciliteaza interpretarea coeficientilor obtinuti din regresie, acestia reprezentand elasticitati. Prima diferenta ( xt xt-1) este utilizata pentru stationarea seriilor. In acest sens , voi crea alte doua serii ce urmeaza a fi analizate, si anume l_bet_c si dl_bet_c, serii ce le-am creat cu ajutorul optiunii GENR, generate, apoi am introdus ecutia l_bet_c= log (bet_c), serie care este reprezentata in fig.nr.2, si respectiv ecuatia dl_bet_c=d(l_bet_c) care va genera seria dl_bet_c, reprezentata in fig.nr 3, si care a fost creata aplicand operatorul prima diferenta asupra seriei l_bet_c.
Fig.nr.2
Fig.nr.3
25
Reprezentarea grafica a celor doua serii:
Fig.nr.4
Fig.nr.5
Din fig.nr.4. rezulta ca l_bet_c, seria indicelui bursier, ar trebui sa fie nestationara, iar seria dl_bet_c din fig.nr.5, variatia zilnica a indicelui bursier, ar trebui sa fie stationara. Aceste observatii vor trebui in contiunuare a fi confirmate de testele de stationaritate ADF ( Augmented Dickey-Fuller) si PP (Phillips-Perron).
26
Fig.nr.6
Daca ne uitam la valoarea testului ADF pentru seria l_bet_c, observam ca valoarea acestia este mai mare decat valorile critice astfel ca ipoteza nula conform careia seria are o radacina unitara ( este nestationara) nu este respinsa. Utilizand valoarea probabilitatii asociata testului, de 19%, se va accepta ipoteza nula, seria este nestationara-> aceeasi concluzie care a rezultat si din observatiile graficului. Pentru a determina ordinul de integrare al seriei ( de cate diferentieri este nevoie pentru a obtine o serie stationara) se va testa stationaritatea seriei de prime diferente, dl_bet_c.( fig.nr.7).
27
Fig.nr.7
Observam ca valoarea testului este mai mica decat valorile critice (-6.501241), deci se resp[inge ipoteza nula. La fel si probabilitatea, este mai mica decat nivelele de relevanta, deci se respinge ipoteza nula, seria este stationara. Alegand nivelul de relevanta de 1% care este cel mai restrictiv, se respinge ipoteza nula, si putem afirma ca ordinul de integrare al seriei este 1 sau seria este l(1). Mentionez ca pentru ambele serii am considerat la maximum lags un numar de 4.
28
Testul PP functioneaza pe aceleasi principii ca si ADF, deci rezultatele vor fi similare, si vom ajunge la aceleasi concluzii ca si in cazul testului ADF aplicat celor doua serii.(fig.nr.8, respectiv fig.nr.9).
Fig.nr.8
29
Fig.nr.9
30
DISTRIBUTIA SERIILOR: Momentele seriei pentru variatiile zilnice ale indicelui bursier, dl_bet_c, sun prezenytate in fig.nr.10 ce urmeaza:
Fig.nr.10
Output-ul din fig.nr.10 prezinta histograma distributiei, media, mediana, valorile minime si cele maxime, deviatia standard, coeficientul de asimetrie, kurtotica seriei si testul Jarque-Bera. In cazul de fata avem un coeficient de asimetrie nesemnificativ diferit de 0 ( 0.201507) ceea ce indica faptul ca exista o distributie normala si simetrica. Un alt argument ar fi egalitatea dintre cele doua cozi din grafic, dreapta si stanga, care indica si ele o simetrie a distributiei. Deasemenea asimetria este pozitiva, fapt ce indica ca indicele bursier BET-C a avut o tendinta de crestere in perioada analizata. Media deasemenea este nesemnificativa diferita de 0.
31
Coeficientul Kurtosis are o valoare mai mica de 3 (1,536091) , adica distributia este platikurtotica, mai joasa decat cea normala. Testul Jarque-Bera arata daca o distributie este normal distribuita si tine seama de cei doi indicatori specificati mai sus, cel de asimetrie si respectiv kurtotica. Ipoteza nula a acestui test este: seria este normal distribuita. Observam ca probabilitatea asociata acestui test este superioara celor 3 nivele de relevanta, deci putem afimra ca acceptam ipoteza nula, cum ca seria este normal distribuita.
Fig.nr.11
In fig.nr.11 am mai testat inca o data normalitatea distributiei, de data aceasta prin View/Distribution/Quantile-Quantile Graph Normal Distribution. Se observa ca distributia este normal distribuita intrucat nu se observa diferente intre cele doua feluri de quantile, ale distributiei si ale distribuitiei normale. Reprezentarea grafica a distributiei se observa in fig.nr.12.
32
Fig.nr.12 FUNCTIA DE AUTOCORELATIE A SERIEI DE TIMP: Analiza corficientilor de autocorelatie si a coeficientilor de corelatie partial este disponibila cu optiunea VIEW/CORRELOGRAM.
Fig.nr.13
Fig.nr.14
33
Dupa cum se observa din figurile de mai sus, exista autocorealatie a erorilor intrucat valorile coeficientilor de autocorelatie depasesc graficele puncatate.
TRENDUL SERIILOR DE TIMP Pentru estimarea unei component pe termen lung a seriei de timp cea mai simpla metoda este filtrul Hodrick-Prescot. Pentru seria indicelui BET-C , trendul si abaterea de la trend sunt prezentate in fig.nr.15:
Fig.nr.15
Modelul unifactorial de regresie. Regresia liniara
Proiectul urmareste realizarea unui model econometric referitor la datele despre veniturile totale ale gospodariilor si cheltuielile totale de consum ale gospodariilor, pe o perioada de 8 ani, respectiv 2001-2008.
34
Datele sunt preluate dupa site-ul www.insse.ro , din Anuarul Statistic 2009- Serii de timp 1990-2008, sectiunea Veniturile, Cheltuielile si Consumul Populatiei ( 4.1. Veniturile totale ale gospodariilor si 4.26. Structura cheltuielilor totale de consum ale gospodariilor). Datele pe baza caruia se face analiza econometrica sunt prezentate in urmatorul tabel: Anul Consumul (lei lunar pe o Venitul (lei lunar pe o gospodarie)
gospodarie) 2001 376,51 521,79 2002 467,47 658,51 2003 566,87 795,09 2004 752 1085,79 2005 863,89 1212,18 2006 962,5 1386,32 2007 1104,7 1686,74 2008 1365,36 2131,67 Tabelul nr. 1: Veniturile si consumul populatiei;
Se observa din tabelul de mai sus ca este vorba despre 8 observatii ( deci N=8 ). Pe baza datelor din tabelul nr. 1 se poate construi un model econometric unifactorial de forma: y=f(x) unde: - y reprezint valorile reale ale variabilelor dependente (consumul); - x reprezint valorile reale ale variabilelor independente (venitul); Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea specificare a variabilelor: -y consumul reprezentnd variabila rezultativ, ale crei valori depind de o serie de factori: alte obiective in functie de circumstante, alte nevoi subiective s.a.m.d.; -x venitul, factorul considerat cu influena cea mai puternic asupra variabilei y.
Specificarea unui model econometric presupune alegerea unei funcii matematice cu ajutorul creia poate fi descris legtura dintre cele dou variabile. Pentru modelul unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic ( norul de puncte) cu ajutorul diagramei cu puncte ( scatter plot) realizata in Excel:
35
Diferenta dintre Venit si Consum

1600 1400 1200
CONSUM
1000 800 600 400 200 0 0 500 1000 VENIT 1500 2000 2500
Fig.nr.1: ( graficul punctelor empirice)
Graficul punctelor empirice arata ca exista o legatura intre cele doua variabile, avand o forma liniara, intrucat majoritatea punctelor din grafic se concentreaza in jurul unei linii imaginare. Exista insa si puncte care se abat intr-o masura mica de la forma liniara observata. Aceste abateri reprezinta tocmai factorii de care mai depinde consumul la care am fcaut referire cand am specificat modelul. Tocmai din cauza acestor abateri vom introduce in model factorul aleatoriu . In concluzie putem sa presupunem ca modelul nostru este unul liniar, de forma: f (X ) =a +bX Consum= f( Venit, alti factori) Yi =a +bXi + pentru orice i =1,8 Semnificaia celor doi parametri a i b, innd cont de semnificaia celor dou variabile (Y-consumul mediu i X-venitul mediu) este: - a reprezint autoconsumul deoarece dac X = 0 atunci Y = a; mai reprezinta punctual de intersectie al dreptei de regresie cu axa 0y si este deci un parametru al ecuatiei de regresie; - b reprezint panta dreptei sau coeficientul de regresie al consumului n funcie de venit, care msoar creterea consumului unei familii dac venitul acesteia se modific cu o unitate de masura. El reprezint n acelai timp coeficientul marginal al consumului n funcie de venit. - este variabila rezidual ( factorul aleatoriu), reprezentnd influenele celorlali factori ai variabile y, nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra variabilei y.
36
Dupa importul datelor din Excel in Eviews, se poate defini ecuatia prin comanda: ls consum c venit . Rezultatul este dat in Fig. Nr. 2:
Fig. Nr. 2
Testarea validitatii modelului de regresie determinat implica formularea a doua ipoteze: H0: model nevalid statistic; H1: model valid statistic; Presupunand ca se lucreaza la nivelul de relevanta de 5%, cum, in figura de mai sus probabilitatile atasate testul t-Statistic sunt inferioare acestui nivel, coeficientii sunt considerati semnificativi din punct de vedere statistic. Valoarea lui R-squared arata ca aproximativ 99% din variatia venitului este explicatie pentru variatia consumului. Concluzia este ca regresia este bine specificata. In ceea ce priveste F-statistic, se observa ca probabilitatea asociata acestuia este 0, deci mai mica decat nivelul de relevanta. Conform acestui test, rezulta ca cel putin un coeficient de regresie este semnificativ din punct de vedere statistic.
37
Si valoarea testului Durbin-Watson arata posibilitatea de a exista o autocorelare a erorilor, avand in vedere valoare sa maricica pentru numarul de observatii existente si ca exista numai o singura variabila dependenta).
Fig.nr.3. Autocorelarea erorilor
In Fig.nr.3 s-au testat erorile ecuatiei de regresie ( WiewResidual testsCorrelogramQ-statistic) Autocorelarea erorilor ecuatiei de regresie. Dupa cum arata si imaginea de mai sus, pentru lag-urile erorilor exista o corelatie seriala a erorilor intrucat valoarea coeficientului de autocorelatie depaseste intervalul punctat in grafic ( autocorrelation si partial correlation) Existenta autocorelatiei este confirmata si de testul Q-statistic si de probabilitatea asociata acestuia. In continuare am folosit si optiunea de autocorelarea a erorilor patratice, ca sa verific daca exista vreo indicatie asupra existentei heteroscedasticitatii. Am folosit WiewResidual testsCorrelogram Squared Residuals. Aceasta optiune se bazeaza pe aceleasi principii ca si autocorelatia erorilor si conform acestora, in fig.nr.4 se observa (exact ca si in figura numarul 2) ca exista autocorelatie a erorilor patratice ,deci poate exista heteroscedasticitate.
38
Fig.nr.4
In ceea ce priveste distributia erorilor rezultate din regresie ( optiune pentru care am folosit ViewResidual testsHistogram-Normality test), aceasta este reprezentata mai jos in fig.nr.5 :
Fig.nr.5
39
Coeficientul de asimetrie ( Skewness) are o valoare de 0,622622, adica nesemnificativ diferita de 0, fapt ce implica o distributie normala. Un alt argument pentru o distribuitie normala este egalitatea dintre cele doua cozi (dreapta si stanga). Coeficientul de aplatizare ( Kurtosis) ce are o valoare de 2,024440 arata faptul ca distributia este un pic mai joasa decat cea normala ( cea normala fiind de 3). Astfel, testul Jarque-Bera, care ia in considerare cei doi coeficienti comentati mai sus, are o valoare care implica respingerea ipotezei nule, in conditiile in care valoarea sa critica pentru pragul de semnificatie de 5% este de 5,99. Existenta corelatiei seriale, aratata de corelograma erorilor se confirma cu ajutorul testului Serial Correlation LM test ( ViewResidual testsSerial Correlation LM test). Am ales 3 lag-uri, iar rezultatul este prezentat in Fig.nr.6:
Fig.nr.6 40
Dupa cum se observa si in Fig.nr.6, testul prezinta alte doua teste statistice, F-statistic si R-squared, precum si probabilitatile acestora. Ipoteza nula a celor doua teste spune ca nu exista corelatie seriala a erorilor ecuatiei de egresie pana la lag-ul de n ( in cazul de fata pana la lag-ul de 3, pe care l-am specificat mai sus) . Asa cum arata si probabilitatile celor doua teste (sunt inferiaore nivelului de relevanta) se va respinge ipoteza nula, deci se repinge inexistenta corelatiei.
41

Proiect Econometri

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Proiect Econometri

Încărcat de

Drepturi de autor:

Formate disponibile

Tema pentru seminar econometrie

Profesor Indrumator: Gheorghe Ruxanda

Proiect la econometrie Modelul unifactorial de regresie ( regresia simpla)

Fig.nr.1: PIB-ul Romaniei 1990-2008

Fig.nr..2: exporturile Romaniei 1990-2008

Proiect la econometrie Modelul de regresie multipla

Proiect la econometrie Evolutia unui indice bursier- serii de timp

Reprezentarea grafica a celor doua serii:

Modelul unifactorial de regresie. Regresia liniara

Diferenta dintre Venit si Consum

Fig.nr.1: ( graficul punctelor empirice)

Fig.nr.3. Autocorelarea erorilor

S-ar putea să vă placă și