Documente Academic
Documente Profesional
Documente Cultură
Dugan Diana
Dumitru Razvan
Ene Andreea
Profesor Coordonator: Lect. Univ. Dr. Adriana Ana Maria Davidescu
2021
Cuprins
1. Aplicația 1 - Modelarea ratei creditelor ipotecare din SUA utilizând Box-Jenkins................................3
1.1. Capitol teoretic.................................................................................................................................3
1.1.1. Literatura de specialitate..........................................................................................................3
1.1.1.1. Evoluția creditelor ipotecare în lume................................................................................5
1.1.2. Metodologia cercetării.............................................................................................................7
1.1.2.1. Modele de tip autoregresiv medie mobila (ARMA, ARIMA)..............................................7
1.1.2.2. Metodologia Box+Jenkins.................................................................................................8
1.1.2.3. Principalele concepte pe care se fundamentează metodologia Box-Jenkins....................8
1.1.2.4. Etapele elaborării unui model ARIMA (autoregresiv integrat medie mobila).................10
1.2. Capitol aplicativ..............................................................................................................................12
1.2.1. Date utilizate..........................................................................................................................12
1.2.1.1. Sursa datelor...................................................................................................................12
1.2.2. Rezultatele empirice ale cercetării.........................................................................................20
1.2.2.1. Analiza seriei de date la nivelul SUA...................................................................................20
1.2.2.1.1. Testarea staţionarităţii seriilor de timp..............................................................................21
1.2.2.1.2. Staționarizarea seriei ratei creditului ipotecar....................................................................23
1.2.2.2. Procedura Box-Jenkins........................................................................................................25
1.3. Concluzii.....................................................................................................................................31
2. Modelarea seriei indicelui bursier S&P 500 prin metode ARCH/GARCH............................................32
2.1. Capitol teoretic...........................................................................................................................32
2.1.1. Literatura de specialitate........................................................................................................32
2.1.2. Metodologia cercetarii...........................................................................................................33
2.2. Capitol aplicativ..........................................................................................................................34
2.2.1. Date utilizate..........................................................................................................................34
2.2.2. Rezultatele empirice ale cercetarii.........................................................................................35
2.3. Concluzii.....................................................................................................................................49
3. Aplicaţia 3 – Modelarea seriei de date privind numărul de turiști din SUA prin utilizarea modelelor
SARIMA, H-W. Previziune...........................................................................................................................50
3.1. Introducere.................................................................................................................................50
3.2. Capitol teoretic...........................................................................................................................50
1
3.2.1. Literatură de specialitate........................................................................................................50
3.2.2. Metodologia cercetării...........................................................................................................51
3.3. Capitol aplicativ..........................................................................................................................54
3.3.1. Datele utilizate și modul lor de obținere................................................................................54
3.3.2. Rezultatele empirice ale cercetării.........................................................................................55
3.3.2.1. Testarea validității modelelor estimate..........................................................................67
3.3.2.2. Testarea normalității erorilor..........................................................................................69
3.3.2.3. Metoda de netezire exponențială Holt Winters.............................................................70
3.3.2.4. Previziune.......................................................................................................................76
3.4. Concluzii.....................................................................................................................................78
4. Aplicaţia 4 – Analiza naturii relației dintre indicii bursieri S&P 500, Nikkei și KOSPY prin intermediul
cointegrării și modelelor VAR/VEC..............................................................................................................78
4.1. Capitol teoretic...........................................................................................................................78
4.1.1. Literatura de specialitate........................................................................................................78
4.1.2. Metodologia...........................................................................................................................81
4.2. Capitol aplicativ..........................................................................................................................85
4.2.1. Date utilizate..........................................................................................................................85
4.2.2. Rezultatele empirice ale cercetarii.........................................................................................86
4.2.2.1. Verificarea sezonalității seriilor.......................................................................................86
4.2.2.2. Verificarea non-staționarității seriilor.............................................................................87
4.2.2.3. Determinarea gradului de integrare a seriilor studiate...................................................97
4.2.2.4. Confirmarea/infirmarea prezenței cointegrării.............................................................103
4.2.2.5. Estimarea modelului VEC..............................................................................................110
4.2.2.6. Cauzalitatea Granger....................................................................................................119
4.2.2.7. Funcția de răspuns la impuls și descompunerea varianței............................................123
4.2.2.8. Limitările modelului......................................................................................................125
4.3. Concluzie..................................................................................................................................126
5. Bibliografie.......................................................................................................................................127
2
Aplicația 1 - Modelarea ratei creditelor ipotecare din SUA utilizând Box-
Jenkins
Capitol teoretic
Literatura de specialitate
Un credit ipotecar convențional este un tip de credit ipotecar, în care termenii și condițiile
de bază îndeplinesc criteriile de finanțare ale Fannie Mae și Freddie Mac. Aproximativ 35-50%
din creditele ipotecare, ce depind de condițiile de piață și de tendințele de consum, sunt ipoteci
convenționale. Rată fixă ipoteci convenționale pot fi sau reglabile pe rata ipoteci.
Având în vedere că piața imobiliară din SUA a început să scadă în al doilea trimestru al
anului 2010, rata implicită pentru rată ajustabilă a produselor ipotecare a crescut în mod constant
față de rată fixă ipoteci. Această diferență poate fi atribuită cel puțin două factori. În primul rând,
o teorie sugerează că rata ajustabilă a produselor ipotecare pot fi preferate în rândul debitorilor cu
risc ridicat1. Faptul că rata ajustabilă a produselor ipotecare tinde să fie mai populare în rândul
debitorilor este în concordanță cu această sugestie2. În al doilea rând, rata ajustabilă a produselor
ipotecare poate crește, de asemenea, riscul de nerambursare prin intermediul unui șoc de plată în
cazul în care ratele dobânzii cresc suficient pentru a omite constrângere lichidității împrumutate,
având în vedere venitul său. Din aceste motive, popularitatea rata ajustabilă a produselor
ipotecare înainte de 2009, a fost implicat ca un factor care contribuie la recenta criza creditelor
ipotecare3.
1
(Posey și Yavas, 2001)
2
(Pennington-Cross și Ho, 2010)
3
(Scanlon et al, 2008;. Pennington-Cross și Ho, 2010)
4
(Agarwal et al., 2012)
5
De exemplu, Makarov și Plantin (2009) arată că șocurile corelate cu venituri poate cauza valori implicite
sistemice.
6
(Immergluck și Smith, 2006; Schuetz et al, 2008;.. Harding și colab, 2009, Lin și colab, 2009;. Goodstein
et al, 2011;.. Guiso et al, 2011;. Campbell și colab, 2011),
7
(Goodman et al. , 2010).
Nivelurile net superioare ale acestor indicatori față de cele înregistrate în România reflectă faptul
că țara noastră se află pe unul dintre ultimele locuri între țările din centrul și estul Europei, în
ceea ce privește dezvoltarea pieței creditului ipotecar.
La nivelul SUA, media dobânzilor fixe la creditele ipotecare pe 30 de ani este de 5,33%,
extremele întâlnindu-se în statele Maine (5,19%) și New Mexico (5,59%). Creșterea
spectaculoasă a acestui tip de dobândă este cauzată de uriașul deficit federal, care va determina
Trezoreria SUA să lanseze noi emisiuni de titluri de stat, ceea ce va pune presiune pe mărirea
dobânzii. Această conjunctură a determinat micșorarea numărului de solicitări pentru credite
ipotecare noi şi refinanțări față de luna aprilie 2008, când rata medie a dobânzii era sub 5%.
În ciuda acestei creșteri, rata dobânzilor fixe la creditele ipotecare pe 30 de ani este mai
mică decât cea înregistrată pe piața americană în urmă cu an, când era de 6,08%.
În luna martie 2014, Bank of America a plătit 6,3 miliarde de dolari către autoritățile din
SUA pentru acordarea unor credite ipotecare care nu au respectat condițiile legale. Câteva luni
mai târziu, în august, banca achitat o amenda de 16,65 de miliarde de dolari într-o altă
investigație care a vizat tot acordarea de credite ipotecare.
Cererea pentru credite ipotecare în SUA a scăzut până la un nivel cât mic în ultimii, arata
datele publicate de Reuters.
Noile date, precum și alți indicatori ai economiei europene și asiatice, arata ca economia
va reîncepe sa crească dar cu un ritm temperat, în contextul în care activitate din industria
manufacturiera a scăzut în iunie, iar încrederea în mediul de afaceri japonez este dezamăgitoare.
Asociația bancherilor ipotecari a anunțat ca indicele care măsoară cererile pentru credite
ipotecare a scăzut cu 18,9% în 26 iunie 2009, la cel mai mic nivel din noiembrie, în ciuda
costului scăzut al creditării.
În Japonia, încrederea în mediul de afaceri a urcat sub așteptări în iunie, din cauza
îndoielilor privind economia globala, în timp ce încrederea consumatorilor americani în
economie a scăzut peste așteptări, indicând ca recesiunea care durează de 18 luni nu da semne de
temperare.
În Germania, comenzile din industria ingineriei au scăzut în mai cu 48% fata de aceeași
perioada a anului trecut, potrivit unor date publicate miercuri de asociația din sector, VDMA. în
perioada martie-mai, comenzile au scăzut cu un ritm anual 47%.
Angajatorii din sectorul privat american au concediat în iunie 473.000 de salariați, mai
mult decât estimaseră analiștii, însă în scădere fata de cele 485.000 de disponibilizări din mai,
conform datelor publicate miercuri de compania privată ADP Employer Services, conform
Reuters.
În luna mai 2010, în Statele Unite s-au pierdut 345.000 locuri de munca, cel mai mic
declin din ultimele opt luni ale anului 2011, după un număr de 504.000 disponibilizări în aprilie
2010, a anunțat vineri Ministerul Muncii. Rata şomajului a avansat la 9,4%, cel mai înalt nivel
din 1983.
Statele Unite au pierdut de la începutul recesiunii, în decembrie 2007, șase milioane locuri
de munca, cel mai mare declin înregistrat de la cel de-al doilea Război Mondial.
Metodologia cercetării
Box & Jenkins (1970) au propus o metodologie de previziune a unei variabile, utilizând
ca și baza de date doar trecutul și prezentul acesteia. Aceste modele se bucura de o larga
popularitate datorita:
,unde p este ordinul parții autoregresive, q ordinul mediei mobile iar este un proces de
tip zgomot alb (acesta fiind o succesiune de variabile aleatoare independente și identic
repartizate, cu medie zero)
8
Davidescu Adriana, „Modele autoregresive liniare”
Atunci când q=0 se obține modelul autoregresiv de
ordin p, notat AR(p): ,iar pentru p=0,
se obține modelul medie mobilă de ordin q:.
Metodologia Box+Jenkins
Procedura Box-Jenkins constă în parcurgerea mai multor etape pentru identificarea celui
mai potrivit model autoregresiv pentru analiza unei serii de timp:
1) Se calculează ACF și PACF pentru a stabili dacă seria este staționară. Dacă este
staționară se trece la etapa a treia, dacă nu se parcurg cerințele etapei următoare.
2) Se staţionarizează seria de date prin diverse transformări. De exemplu se
logaritmează valorile seriei sau se aplică o transformare Box-Cox, apoi se poate
diferenția seria de date astfel obținută.
3) Folosind caracteristicile funcțiilor ACF și PACF se determină modelele
autoregresive de start pentru analiza seriei de date.
4) Se estimează parametrii modelelor autoregresive.
5) Se testează caracteristicilor modelelor autoregresive ce au fost estimate în etapa
anterioară
6) Se alege cel mai potrivit model folosind diverse criterii de performanță.
7) Pe baza modelului selectat se fac diverse analize și prognoze.
- varianța
Definiție. Un proces staționar de ordinul doi dacă verifică următoarele trei condiții:
Un proces staționar se află într-o stare de echilibru (are proprietatea de a reveni la medie
ori de câte ori se îndepărtează prea mult de la aceasta).
Zgomot alb (White noise). Un caz particular de proces staționar, este cel de tip zgomot alb
(denumire luata din tehnica), acesta fiind o succesiune de variabile
-
- .
Un proces este nestaționar dacă nu verifică una sau mai multe din cerințele din definiția
procesului staționar. în economie majoritatea seriilor sunt nestaționare, media respectiv varianța
acestora nefiind constantă în timp.
Detectarea nestaționarității:
Din cronograma:
- seria este nestaționară în medie dacă media nu este constantă în timp. O serie ce
prezintă spre exemplu o tendința deterministă (ce poate fi modelată prin funcții
elementare) este nestaționară;
- seria este nestaționară în varianta dacă varianța nu este constantă în timp.
Modelele ARMA sunt adecvate seriilor staționare. Acestea au fost generalizate pentru
serii nestaționare ce devin staționare prin diferențiere, modelele rezultate fiind denumite modele
autoregresive-integrate-medie mobilă ARIMA(p, d, q) unde d este ordinul de diferențiere necesar
pentru staționarizarea seriei.
Date utilizate
Sursa datelor
Seria de timp considerată este rata creditelor ipotecare din SUA pentru perioada Ianuarie
2000 – martie 2021. Prognozele se vor realiza pentru anul 2017. Aceasta este exprimata
procentual(%). Datele au fost preluate de pe website-ul FRED Economic Data
(https://research.stlouisfed.org/).
Sursa datelor
Datele sunt preluate în format Excel(.xls) și importate în EViews, pentru asta trebuie să
creăm un nou fișier de tip EViews prin selectarea comenzii New->Workfile.
În Eviews pentru crearea unei noi serii de date pe baza unor transformări se realizează
prin comanda Quick->Generate series…. În urma aplicării acestei comenzi se deschide o
fereastră de dialog în care se definește relația de calcul a noii serii.
De exemplu, dacă seria rci este identificată prin rata creditului ipotecar, iar noua serie se
obține prin aplicarea primei diferențe, atunci în fereastra de dialog care se deschide se inserează
ecuația de calcul: d_rci=rci-rci(-1).
După cum se poate observa seria are o medie de 5,05 cu o valoare maxima de 8,54% și
implicit o cu valoare minimă de 2,65% ce indică o abatere standard de 1,35 procente. Skewness
cu o valoare ușor mai mare decât 0 are o distribuție ce tinde spre stânga, având mai multe valori
extreme spre dreapta, iar Kurtosis cu o valoarea de 2,29 indică faptul că avem o distribuție
platikurtică, mai plată decât o distribuție normal având valori dispersate pe un interval mai mare
în jurul mediei. Probabilitatea pentru valori extreme este mai mică decât în cazul unei distribuții
normale.
Analiza sezonalităţii serie de date
Corelația dintre seriile nestaționare este de obicei foarte ridicată (de obicei, în astfel de
cazuri, coeficienții R2 și R2 ajustat sunt foarte ridicați), dar aceasta nu este concludentă, deoarece
ea se poate datora unor trenduri comune (stohastice) existente în seriile respective. În esență,
seriile staționare sunt cele care nu își schimbă proprietățile în timp: au media, varianța și
autocovarianța pentru fiecare lag constante.
În această etapă vom verifica măsura în care procesul stohastic este staționar (medie și
dispersie constante), inclusiv eliminarea componentei sezoniere, în cazul în care se remarcă
prezența fluctuațiilor. În cazul în care seria nu este staționară, prin diferențiere, se obține o serie
staționară. Ordinul de integrare a seriei reprezintă numărul de diferențieri succesive necesare
pentru obținerea unei serii staționare (adică numărul de rădăcini unitare ale seriei).
Pentru analiza sezonalităţii se recurge la o reprezentare grafică adecvată selectând calea
View->Graph->Seasonal Graph.
Analiza staţionarităţii unei serii de timp, considerată realizare a unui proces stochastic,
presupune următoarea succesiune de operații:
- Se studiază dispersia seriei și, dacă e cazul, se aplică transformările Box-Cocs adecvate
pentru a obține o dispersie constantă în timp;
- Se testează și se elimină variațiile sezoniere
- Se studiază existența și natura tendinței de evoluție a observațiilor și se alege metoda
potrivită pentru staționarizarea ei.
Pentru a aplică unul din testele pentru depistarea prezentei rădăcinii unitare în EViews se
deschide seria pe care se aplică testul și se selectează din meniul View – Unit root test. Iar pentru
selectarea testului avem test type de unde putem selecta ce test dorim să aplicăm.
Analiza corelogramei
Valoarea lui d care asigură staționaritatea seriei, precum şi valorile inițiale ale lui p și q
determinate în cadrul etapei anterioare permit identificarea unei forme analitice a modelului
ARIMA, precum și a componentelor sale. În continuare se estimează prin metoda celor mai mici
pătrate (OLS) parametrii modelului analitic astfel specificat. În acest sens se selectează din
meniul principal comanda Quick – Estimate equation.
Method se utilizează opțiunea Least Squares (NLS and ARIMA) sau prin selectarea lui
Options se pot alege diferite metode de corectare a prezenței autocorelaţiei sau
heteroscedasticităţii termenului de eroare (Metodele Newey-West şi White).
În continuare, vom verifica staționaritatea seriei de timp a ratei creditului ipotecar și prin
aplicarea testului ADF (Augmented Dickey Fuller) pentru depistarea prezenței rădăcinii unitate.
Pe baza rezultatelor testului ADF ilustrat în Figura 4 am obținut următoarele rezultate:
Pentru modelul nostru, valorile critice sunt –3,456302, -2,872857 și -2,5728, corespunzătoare
nivelurilor de semnificație de 1%, 5% și 10%. Valoarea calculată pentru statistica t este -
1,728655, care în valoare absolută este mai mică decât valorile critice. Nu putem respinge ipoteza
nulă conform căreia seria are o rădăcină unitară (probabilitatea de a greși în respingerea ipotezei
nule este foarte mare deoarece Prob.*=0.2236), deci seria ratei creditelor ipotecare este într-
adevăr nestaționară. În acest caz, parametrul d din specificația ARIMA(p,q,d) este nul.
Test pentru depistarea rădăcinii unitare(ADF)
Seria de timp RCI devine serie staționară după aplicarea operatorului de diferențiere, care
se realizează în EViews astfel: series DRCI=D(RCI). Pentru seria transformată realizăm graficul
și comparăm graficul seriei RCI cu cel al seriei DRCI. Se observă că seria diferențiată DRCI nu
mai prezintă trend. Drept urmare, vom aplica procedura Box-Jenkins asupra seriei de date
staționarizată prin deferente de ordin1(seria fiind integrata de ordin 1) și vom determina procesul
ARMA(p,q) corespunzător.
Pentru modelul nostru, valoarea calculată pentru statistica t este -14,91513, care în valoare
absolută este mai mare decât valorile critice. Probabilitatea de a greși în respingerea ipotezei nule
este foarte mică, astfel că respingem ipoteza nulă potrivit căreia există o rădăcină unitară, deci
seria diferențiată DRCI este o serie staționară (adică a fost eliminate unitatea rădăcină) și
poate fi folosită în realizarea de prognoze.
Procedura Box-Jenkins
Vom aplica procedura Box-Jenkins asupra seriei de date staționarizată prin diferențe de
ordin 1 (seria fiind integrata de ordin 1) și vom determina procesul ARMA(p,q) corespunzător.
Procedura urmează 3 etape: identificarea, testarea modelului și previziunea.
TABEL 1
Parametrii modelului sunt semnificativ diferiți de zero, pentru modelul ARMA(1,1) estimat
se obțin cele mai bune valori ale celor două criterii informaționale şi, de asemenea, o valoare pentru
R-squared (0.0123 -> 1,23%). Criteriile informaționale Akaike și Schwarz au valori minime.
Testarea validității modelului
Testul Breusch-Godfrey LM
Întrucât probabilitatea este mai mare de 0.05, se va accepta ipoteza nulă conform căreia
erorile nu sunt autocorelate.
Testarea homoscedasticităţii/heteroscedasticităţii seriei de reziduuri
Erorile sunt hemoscedastice, deoarece prob. aferente coeficienților Q-stat sunt mai mari
de 5%.
Testarea distribuției normale a seriei de reziduuri
Erorile sunt nu normal distribuite, deoarece valoarea testului JB este mult mai mare decât
valoarea tabelata și în plus prob. tinde către zero.
Dorim să facem o prognoză privind evoluția ratei creditului ipotecar din SUA în perioada
mai 2022:
Creare Forecast
Previzionarea seriei
În cadrul acestei aplicații a fost propusă modelarea seriei de timp a ratei creditelor
ipotecare din SUA utilizând metodologia Box-Jenkins, cu analize descriptive preliminare asupra
seriei, astfel încât să facă previziuni pe modelul valid, sa se analizeze bonitatea previziunii și sa
se interpreteze economic rezultatele.
În urma unui efort de sinteză a concluziilor din capitolul aplicativ s-a constat că datele din
punct de vedere al posibilităților de măsurare, sezonalitatea se manifestă sub forma unor abateri
de la medie care revin sistematic fapt pentru care seriile de timp nu este afectată de sezonalitate.
Însă datele sunt staționare și pentru a verifica asta se aplică testarea testului ADF pentru
depistarea rădăcinii unitare, din care s-a constat că valoarea absolută calculată pentru statistica t
este mai mică decât valorile critice, dovedind că seria este nestaționară. Drept urmare, aplicarea
procedurii Box-Jenkins asupra seriei de date staționarizată prin deferențe de ordin1(seria fiind
integrata de ordin 1) și vom determina procesul ARMA(p,q) corespunzător..
Procedura Box-Jenkins urmat 3 etape: identificarea, testarea modelului și previziunea
seriei de timp. În prima parte s-au estimat succesiv mai multe modele autoregresive și în final am
ales cel mai bun model pe baza criteriilor informaționale Akaike şi Schwarz și anume modelul
ARMA(1,1). Pentru a valida modelul am aplicat Testarea autocorelării reziduurilor din care a
rezultat că erorile nu sunt autocorelate ceea ce înseamnă că seria de timp indică cu tărie prezența
corelații seriale în reziduuri. Iar din urma testării homoscedasticităţii/heteroscedasticităţii seriei
de reziduurilor și a distribuției normale a seriei de reziduuri s-a observat că erorile sunt mai mari
decât 5% și că sunt normal distribuite fapt pentru care modelul nu este valid. În urma generării
previziunilor s-a observat că funcția de pierdere root mean squared error este apropiată de 0, ea
reprezentând deviația previziunilor de la valorile înregistrate în realitate, prin urmare modelul de
previziune este bun.
????
3. Aplicaţia 2– Modelarea seriei de date privind numărul de turiști din
SUA prin utilizarea modelelor SARIMA, H-W. Previziune
3.1. Introducere
În zilele noastre, progresul tehnologic a făcut posibilă deplasarea populației dintr-un loc în
altul într-un timp foarte scurt, mai ales când se are în vedere faptul că persoanele respective
călătoresc. Tocmai din acest motiv cunoașterea și previziunea numărului de turiști dintr-o
anumită regiune sau țară este de o importanță majoră întrucât, pe baza acestora, se pot lua diverse
decizii la nivel social sau economic. Impactul pe care turismul îl are asupra investițiilor și asupra
dezvoltării infrastructurii aduce cu sine necesitatea planificării în avans întrucât deciziile de
investiție trebuie să fie eficiente nu numai pentru acest sector, turistic, ci pentru toate sectoarele
unei economii. Întrucât creșterea economică este o probroblemă tot mai mare pentru fiecare
dintre țări, prognozarea cererii turistice este cu atât mai importantă. În această lucrare am ales să
previzionăm numărul de vizitatori (după cu sunt prezentate datele în sursa de extragere a
acestora) din fiecare lună a ultimilor 17 ani din Statele Unite ale Americii. Întrucât acestea au
înregistrat fluctuații de-a lungul timpului, datele vor fi preluate lunar.
Datele referitoare la numărul lunar de turiști sosiți la hotelurile și pensiunile din România
în perioada decembrie 2000 – februarie 2017 au fost preluate de pe site-ul selecția fiind făcută
http://infoshare.stats.govt.nz/default.aspx?AspxAutoDetectCookieSupport=1 asfel încât să
cuprindă doar tutiștii de la nvel internațional.
3.3.2. Rezultatele empirice ale cercetării
S-a introdus seria de date în Eviews, prin importarea datelor dintr-un fișier Excel prin
utilizarea comenzii File -> Import -> Import from File, astfel încât s-a obținut seria de date a
vizitatorilor denumită vizitatori:
Conform graficului de mai sus, se poate observa că numărul de vizitatori ai SUA variază
semnificativ în fiecare an. Astfel, acesta are valori mari în perioada verii și valori mici în
perioada de iarnă. Totodată, se observă că seria nu pare a fi una staționară, deoarece la nivelul
mediei se remarcă un trend crescător (nonstaționaritate în medie), iar la nivelul dispersiei se
observă că varianța nu se menține constantă în perioada analizată (nonstaționaritate în dispersie).
Se poate observa că începând cu anul 2001 seria are un trend ascendant, evidențiindu-se şi
componenta sezonieră. Având în vedere aceste aspecte, dar și faptul că datele sunt importate
lunar, se va realiza și o analiză a sezonalității acestora printr-o analiză grafică.
Grafic sezonalitate
Din prezentată mai sus, reise faptul că seria este afectată de sezonalitate. Așadar, se poate
afirma că factorii sezonieri au avut o influență semnificativă asupra numărului de vizitatori ai
SUA în perioada Ianuarie 200-Iunie 2017. Seria de date urmează astfel a fi modelată cu ajutorul
unui proces de tip SARIMA (Seasonal Autoregressive Integrated Moving Average).
În realiazarea unei modelări a seriei de timp cu ajutorul unui model SARIMA,
metodoligia prevede aplicarea unui model de tip ARIMA pe procesul cu componenta sezonieră.
Astfel, trebuie să luăm în considerare prima regulă precizată în metodologie, referitoare la
componenta sezonieră: având în vedere că în cazul modelului nostru, numărul de vizitatori ai
SUA este mare în lunile Iulie și August și foarte mic în lunile Ianuarie și Februarie, se poate
afirma că , componenta sezonieră este prezentă atunci când se are în vedere numărul de vizitatori
ai SUA.
În cele ce urmează analiza staționaritatea seriei de date, cu ajutorul comenzilor View ->
Correlogram -> Lags to include box: 45 -> OK. Am ales să includem un număr de 45 de lag-uri,
datorită metodologiei Box Jenkins, potrivit căreia numărul de autocorelații pe care le putem
examina fără probleme sunt o pătrime din numărul total al datelor ((199 -12)/2 = 45). Rezultatul
acestor pași îl reprezintă corelograma, iar în partea stângă un table care conține informții cu
privire la valorile funcției de autocorelație (ACF), valorile funcției de autocorelație parțială
(PACF), valoarea statisticii Ljung-Box (Q-Stat), probabilitatea de a accepta că valoarea
coeficienților de autocorelație este nulă (Prob). O valoare mai mare de 0,05 a acestei probabilități
va duce la acceptarea ipotezei nule, deci a inexistenței unei autocorelări semnificative a
termenilor seriei.
Din analiza corelogramei reiese faptul că seria este nestaționară, deoarece funcția de
autocorelație descrește lent. Seria diferențiată la ordinul de sezonalitate s=12 indică o puternică
autocorelație pozitivă, ce ar putea indica o semnătură de tip AR sau nevoia unei noi diferențieri.
Prin urmare staționarizăm seria prin diferențe de ordin 1 și, potrivit metodologiei specifice
modelelor de tip SARIMA, nu avem voie să mai diferențiem în continuare seria de date.
series ddvizitatori = d(dvizitatori)
Totodată, dacă vom analiza corelograma vom observa dacă seria este staționară sau nu.
După cum se poate observa în figura de mai jos sunt cel puțin doi coeficienți care ies in afara
intervalului punctat. Însă dezavantajul major al corelogramei este legat de faptul că, valorile
funcţiei de autocorelaţie sunt determinate, atât de componenta sezonieră, cât şi de cea
nesezonieră.
Corelograma diferențelor
Trebuie menţionat faptul că, în cazul în care seria de date este integrată de ordinul 2,
atunci etapele care vor fi descrise în cele ce urmează se referă la seria de date staţionară
(diferenţiată de două ori). În urma parcurgerii acestei etape se determină: valoarea parametrului
d: egal cu ordinul de diferenţiere aplicat seriei iniţiale pentru a obţine o serie staţionară. De cele
mai multe ori p este 0, 1 sau cel mult 2 precum și o serie de recomandări pentru alegerea iniţială a
celorlalţi doi parametrii p şi q (Adriana, 2016).
Așadar, pentru verificarea staționarității vom aplica testul Augumented Dikey Fuller pe
seria diferențiată cu selecția testului Skhwartz. Pentru modelul nostru, după cum se poate
observa în figura de mai jos, valoarea calculată pentru statistica t este -10,34352, care în modul
este mai mare decât oricare dintre valorile critice. Prin urmare, probabilitatea de a greși în
respingerea ipotezei nule este foarte mica. Așadar, respingem ipoteza nulă potrivit căreia există o
rădăcină unitate, deci seria diferențiată ddvizitatori este o serie staționară (adică a fost eliminată
unitatea rădăcină) și, prin urmare poate fi folosită în realizarea de prognoze.
Așadar, se poate afirma că seria de date dvizitatori este integrată de ordin d=1, iar seria inițială de
date vizitatori este integrată de ordin d=2. Drept urmare, vom aplica procedura Box-Jenkins
asupra seriei de date staționarizată prin diferențe de ordin 1 și vom determina procesul SARIMA
(p,d,q) x (P,D,Q) corespunzător.
Procedura urmează 3 etape: identificarea, estimarea, testarea și previziunea modelului.
Identificarea modelului
Corelograma seriei ne va permite sa alegem p și q potrivite seriei de date.
Informaţii pentru determinarea parametrilor p şi q sunt obţinute prin calcularea valorilor
FAC şi FACP, precum şi pa baza întocmirii graficelor celor două funcţii. Pentru validarea
rezultatelor obţinute se folosesc diverse teste statistice. Astfel, dacă există o valoare a lui h egală
cu q începând de la care valoarea funcţiei de autocorelaţie scade brusc către zero, atunci pentru
prelucrarea seriei se foloseşte un proces MA(q) pur sau un proces ce cuprinde o componentă
MA(q) (Davidescu, 2016).
Potrivit regulii din metodologie, dacă lag-ul de ordinul 1 este 0 sau negativ, sau dacă
coeficienții de autocorelație au valori mici și nu urmează o anumită evoluție de creștere sau
descreștere lentă, atunci probabil că seria nu are nevoie de un ordin mai mare de diferențiere. Mai
mult, dacă lag-ul I de autocorelație este -0.5 sau mai mic, atunci seria este supra-diferențiată. În
cazul acestui model regula este îndeplinită deoarece atunci când diferențierea este de ordin d=2,
primul lag are valoarea negativă de -0,676 < -0.5. Așadar, un ordin de diferențiere mai mare nu
este permis și nu este nici necesar, iar în cazul unui ordin de diferențiere mai mic (d=1), am vazut
cum coeficienții de autocorelație descresc lent și prin urmare nu ar respecta această regulă.
Estimarea modelului se realizează prin metoda celor mai mici pătrate (OLS) parametrii modelului
analitic astfel specificat. În acest sens, pentru seria staționarizată se estimează următoarele trei
modele autoregresive, pe baza instrucțiunilor de mai jos:
series vizitatori_sarima=ddvizitatori
equation eq12.ls ddvizitatori ar(1) ar(2) sma(12)
equation eq22.ls ddvizitatori ar(1) sma(12)
equation eq13.ls ddvizitatori ar(1) s ma(12)
equation eq14.ls ddvizitatori ma(1) sma(12)
equation eq15.ls ddvizitatori ar(1) sma(12)
equation eq16.ls ddvizitatori sar(12)
equation eq17.ls ddvizitatori sma(12)
Tabel 2. Rularea modelelor
R^2 Criteriul
Model Criteriul Schwartz
Akaike
ar(1) ar(2) sma(12) 0.23 4,214 4,263
ar(1) sma(12) 0.22 4,2142 4,2632
ar(1) sar(12) 0,224564 4,2142 4,263210
ma(1) sma(12) 0.257756 4,170252 4,219215
ar(1) sma(12) 0.224654 4,214246 4,263210
sar(12) 0,098973 4,3560630 4,369269
sma(12) 0,108267 4,3469 4,379625
. ar(1) sma(12)
Figură 37. ma(1) sma(12)
Identificăm astfel două modele optime , respective ar(1)sma(12) și ma(1) sma(12) prin
alegerea valorilor cât mai mici pentru indicatorii ce au la bază teoria informației (criteriile Akaike
și Schwartz). Cum nu putem decide care dintre acestea două este mai bun, trecem la pasul
următor și testăm validitatea ambelor modele.
Metoda de netezire exponenţială simplă a fost extinsă de către Holt Winters pentru serii
ce prezintă tendinţă (şi componentă aleatoare). Ideea este legată de ajustarea seriei în vecinătatea
originii previziunii cu o dreaptă, tendinţa fiind presupusă liniară pe porţiuni. Această metodă
este
caracterizată prin faptul că este adecvată seriilor ce prezintă tendinţă şi componentă sezonieră,
implicând trei ecuaţii de recurenţă, şi prin urmare trei constante de netezire, una pentru nivelul
seriei, una pentru panta dreptei de tendinţă respectiv una pentru coeficienţii sezonalităţii
(Adriana, 2016).
No seasonal H-W
Rezultatele arată că metoda H-W cu caracter sezonier multiplicativ se potrivește mai bine
pe datele considerate. Acest lucru se reflectă, de asemenea că în cele două seturi de previziuni;
previziunile generate prin metoda multiplicativă evidențiază mai mare și o mai mare variație
sezonieră pe măsură ce nivelul de prognoze crește în comparație cu previziunile generate prin
metoda cu aditivă. Funcția de pierdere root mean squared error minimă se găsește în cazul Holt-
Winters Multiplicative, având valoarea de 21614,9, ea reprezentând deviația previziunilor de la
valorile înregistrate în realitate, prin urmare acest model de previziune este mai bun.
Se poate observa din graficul prezentat la începutul problemei că modelul este unul de tip
aditiv.
Figură 45. Exponential Smooting
Rezultatele sunt împărțite în patru părți. Prima parte a tabelului prezintă setările utilizate
în cadrul procedurii ETS, inclusiv eșantionul utilizat pentru estimarea și starea estimării. Aici
vedem că am estimat un model (M, A, M), în care unii parametri converg la valori limită.
Următoarea secțiune a tabelului prezintă parametrii de netezire (α, β, γ) și stări inițiale X0 = (L0,
b0, s0, s-1, ..., microsecunde-11). Trebuie remarcată prezența limitei zero valori p pentru și y,
care indică faptul că componentele de sezon și de trend nu se schimbă în funcție de valorile lor
inițiale. În ceea ce privește statisticile, cele mai multe dintre acestea sunt auto-explicative. A
raportat "Compact Log likehood" este pur și simplu valoarea sa, dar este furnizată pentru a
facilita comparația cu rezultatele obținute din alte surse.
Pentru comparații, poate fi util să se ia în considerare modelul ETS obținut folosind selecția
modelului. Pentru a efectua selecția modelului, vom completa dialogul ca înainte, dar selectăm
pentru fiecare dintre modelele ce trbuie specificate meniurile care se derulează la Auto. Output-ul
de mai jos arată că modelul ETS selectat confor criteriului Akaike (A, N, M), cu un nivel de
netezire dat de parametrul estimare α = 0,74, iar parametrul de sezonalitate y = 0 (este estimat la
limită).
Figură 46. Exponential
smooting Figură 47.Simple
Se poate observa că valoarea constantei de netezire este una relativ scăzută 0,87 (alpha),
iar valoarea lui beta =0 indifă faptul că componenta sezonieră și trendul nu se schimbă față de
valorile lor inițiale. La finalul perioadei analizate, valoarea trendului este de 23639,6 vizitatori. În
ceea ce privește R^2, această valoare generează o statistică care se comporta ca valoarea R-
Square în regresie multiplă. O valoare aproape de zero indică un model nevalid, în timp ce o
valoare aproape de unul indică un model bine-montaj
Figură 48. Cautarea modelului celui mai potrivit
După cum se poate observa, în sectiunea forecast comparison graph, cel mai potrivit
model este acela în care erorile sunt aditive, nu este stabilit tipul trendului, iar tipul sezonalității
este multiplicativ. Acest lucru se poate observa și din tabelul ce compară valorile pe baza long-
likehood (se alege valoarea cea mai mare-posibilitatea de a se ajunge la valorile dorite).
Graficul de mai sus ultimele observații de previziunie în eșantion și în afara eșantionului pentru
fiecare dintre posibilele specificații ETS. În plus, setările de afișare ETS ales au afișat tabelul de
probabilitate, care conține probabilitatea efectivă și valorile Akaike pentru fiecare specificație, iar
tabelul de comparație, prognoza, care prezintă un subset al valorilor afișate în grafic.
3.3.2.4. Previziune
Pentru aceasta, in vederea comparării celui mei bun model, am realizat un tabel în care sunt
cuprinse RMSE (trunchiate) pentru modelele analizate.
ma(1) sma(12) H-W aditiv H-W multiplicativ
Static: 335165 250430 216164
Dinamic : 252777
După cum se poate observa se așteaptă ca în luna a șaptea să aibă loc o creștere a numărului de
vizitatori ai SUA în luna a saptea va înregistra o creștere a numărului de vizitatori la 637419166 vizitatori
apoi, în luna următoare acesta va creste, după cum se poate observa în tabelul de mai jos.
Plecând de la setul de date referitor la numărul de vizitatori în SUA în perioada ianuarie 1999,
iunie 2015, s-a constat că date datele prezintă sezonalitate, respectiv în lunile iunie și august există
tendinta ca numărul de vizitatori șă fie mai mare, iar în lunile ianuarie și februarie acesta este mai mic.
Din primul grafic se poate observa că datele prezintă o nestaționaritate în medie. Asupra acestora s-au
aplicat operațiunile de staționalizare desesezonalizare. Odată obținută seria este staționară în timp și nu
prezintă trend. Ulterior s-a identificat un model ARIMA(0,1) de lag 12, deci un model ma(1) sma(12). În
urma analizei forecat cu Holt Winters s-a constat că modelul multiplicative are RMSE cel mai mic, prin
urmare acesta este cel mai bun. Totodată s-a efectuat o previziune ETS Exponential smooting, iar
modelul rezultat este unul de tip ANM, (aditiv none multiplicativ). Previziunea pe luna a șaptea arată un
număr de vizitatori în SUA de 6396922.
Capitol teoretic
Literatura de specialitate
Aplicația de față își propune să analizeze natura relației dintre trei indici bursieri
internaționali, aparținând piețelor din SUA (Standard and Poor’s 500), Japonia (Nikkei 225) și
respectiv Coreea de Sud (Kospi).
Indicele Standard and Poor’s 500 este un indice format pe baza a 500 acţiuni selectate
de Corporaţia Standard and Poor’s fiind cotate în fiecare minut al zilei de tranzacţionare.
Valoarea de piaţă totală a acţiunilor ce compun indicele reprezintă 80% din valoarea titlurilor
tranzacţionate la NYSE. Indicele S&P 500 la fel ca toţi indicii din acest grup sunt ponderaţi cu
capitalizarea bursieră şi cuprinde în ordinea capitalizării următoarele acţiuni: Microsoft, General
Electric, Intel, Wal-Mart, Cisco Systems, Lucent Tehnologies etc. Este utilizat ca suport în
contractele futures la Bursa din Chicago şi contracte pe opţiuni la NYSE.
Nikkei 225 este indicele cel mai des cotat de pe bursa de la Tokyo, comparabil cu Media
Industrială Dow Jones din SUA. A fost numit dupa ziarul Nikkei care a început calcularea
indicelui în 1950. Indicele Nikkei este format din 225 de companii japoneze din diverse industrii.
Companii remarcabile care includ Toyota, Bridgestone, Kikkoman și Panasonic. Nikkei
reacționează la evenimentele internaționale cum ar fi dezastrele naturale, razboaiele, framântările
politice și noutățile economice.
Kospi este un indice al tutoror acțiunilor comune tranzacționate pe piața bursieră din
Coreea de Sud și constituie un indicele bursier reprezentativ pentru aceasta, fiind introdus în anul
1983. În prezent, el în cuprinde în ordinea capitalizării următoarele acţiuni: Samsung Electronics,
Hyunda Motor, SK Hynix, Korea Electric Power, SK telecom, Naver etc.
Pentru studiul relației dintre variabile descrise anterior, vom folosi analiza de cointegrare
și în funcție de prezența sau absența acesteia (în sens Johansen) vom estima un model VAR sau
VECM, care să pună în evidență dinamica pe termen scurt și/sau lung (după caz).
Studii despre interdependența piețelor de capital au fost realizate începând cu anii 1970.
Autori precum Granger și Morgenstern (1970), Ripley (1973) sau Panto (1976) au cercetat
relațiile pe termen scurt dintre piețele de capital, utilizând analiza de corelație. Odată cu apariția
conceptului de cointegrare, sugerat de către Granger (1981) și dezvoltat ulterior de același autor
împreună cu alți cercetători precum Weiss(1983) și Engel (1987), metodologia referitoare la
analiza relațiilor dintre piețele de capital s-a îmbunătățit semnificativ. Alături de abordarea
ARCH, dezvoltată de Engle (1982) și extinsă de Bollerslev (1986), cointegrarea a devenit în
prezent principalul instrument în analiza relației dintre bursele de valori. Îmbunătățiri ulterioare
ale metodologiei îi aparțin lui Johansen (1988, 1991), acesta simplificând analiza cointegrării
multivariate și propunând în acest sens o abordare integrată de estimare și testare.
Kasa (1992) a utilizat pentru prima dată testul de cointegrare Johansen pentru a studia
relațiile între bursele de valori. Folosind un model VAR, autorul a determinat prezența unui trend
comun puternic în piețele din SUA, Japonia, Germania, Marea Britanie și Canada pentru perioada
1974-1990. Corhay (1993) a cercetat piețele bursiere din Europa între anii 1975-1991 și a obținut
dovezi empirice care susțin echilibrele pe termen lung. Cu toate acestea, studiul realizat de către
Koop (1994) folosind metode Bayesiene a contrazis prezența unui trend stochastic comun în
piețele bursiere din cele cinci țări mai sus menționate. Fu și Pagani (2010) au revizuit rezultatele
cercetării lui Kasa folosind în acest sens mici corectări ale eșantionului utilizat în cercetare, care
să crescă gradul de acuratețe al modelului. Deși, în acest caz, dovada cointegrării este mai puțin
pronunțată decât în lucrarea originală, autorii au găsit totuși o relație de cointegrare.
Dezvoltarea piețelor bursiere din mai multe țări sud sau est-asiatice a condus la sporirea
interesului cercetătorilor pentru studiul cointegrării acestor piețe. Masih și Masih (1997) au
cercetat relațiile dintre bursele din Taiwan, Hong Kong, Singapore și Coreea de Sud cu cele din
Japonia, SUA, UK și Germania și au descoperit prezența cointegrării. Maysami și Koh (2000) au
observat o relație de cointegrare între piețele din Singapore, Japonia și SUA. În opoziție,
rezultatele cercetării Sheng and Tu (2000) nu sugerează un vector de cointegrare semnificativ
statistic pentru piețele bursiere din Asia. Yang, Kolari și Min (2002) au cercetat criza financiară
asiatică și au descoperit influența acesteia asupra gradelor de integrare. Estimând VECM pentru
diferite perioade, cei trei autori au observat că piețele urmează o mișcare comună („co-
movement”) mai pronunțată în perioada post-criză . Același rezultat este descoperit și de Wong
(2004), care a concluzionat că relațiile dintre piețele bursiere din Asia s-au intensificat odată cu
criza din 1997. Analiza relațiilor dintre piețele bursiere s-a îmbunătățit odată cu apariția altor
tehnici metodologice.Gregory and Hansen (1996) au dezvoltat un test, bazat pe seria reziduurilor,
prin care se verifică cointegrarea seriilor de date, atunci când acestea prezintă un singur șoc
macroeconomic. (structural break). Fernandez și Sosvilla (2001) nu au reușit să determine
prezența cointegrării între piețele asiatice, prin utilizarea testelor convenționale, însă au
descoperit o relație pe termen lung între anumite țări. Voronkova (2004) a observat legături între
piețele bursiere din Europa Centrală și principalii parteneri din Europa și SUA, utilizând testul de
cointegrare Gregory și Hansen.
Toate referințele de mai sus sunt însă doar câteva din multiplele studii și cercetări ce
abordează tema cointegrării piețelor bursiere. Deși acestea au condus adesea la rezultate distincte,
este cert faptul că subiectul cointegrării piețelor bursiere prezintă un mare interes datorită
informațiilor oferite despre echilibrul pe termen scurt și lung al burselor de valori.
4.1.1. Metodologia21
c) Seriile să fie nestaționare dar neintegrate de același ordin(în general atunci o variabilă este
I(1) și cealaltă este I(0)).
21
Davidescu Adriana, „Schema logică a modelelor multivariate”
Pasul 3. Având în vedere primele două situații la pasul următor se va estima un model
VAR, astfel:
a) Daca seriile sunt staționare, I(0) atunci ele sunt implicit cointegrate și prin urmare se va
rula un model VAR în nivel(pe variabilele originale). Primul pas în estimarea unui model VAR
este stabilirea lagului optim pe baza pe baza criteriilor informationale Akaike și Schwarz astfel
încât să asigure verificarea ipotezei de non-autocorelare a reziduurilor modelului VAR. Estimarea
modelului VAR se va face prin metoda metoda celor mai mici patrate(MCMMP) urmârindu-se
verificarea performanței modelului (semnificația parametrilor modelului, validitatea modelului,
bonitatea modelului, verificarea ipotezelor modelului de regresie).
decalate ale celor n variabile dependente care sunt I(1) în cadrul modelului; A1,….,Ap sunt
utilizat pentru a testa relația de cauzalitate dintre două variabile staționare X t Yt implică într-o
și
primă etapă estimarea următorului model VAR:
n ec orelate.
unde: erorile u1t u2t su
și
nt
zg
o
m
ot
e
al
be
Cauzalitatea Granger presupune că variabilele X cu laguri influențează în mod semnificativ
variabila Y în ecuația prima ecuație de mai sus și variabilele Y cu laguri influențează variabila X
în ecuația secundă. Cu alte cuvinte, se poate testa ipoteza comună potrivit căreia coeficienții i și
j
sunt semnificativ diferiți de zero în sensul testului Fisher(F). Dacă ipoteza este respinsă,
atunci relația cauzală dintre X și Y este verificată.
În plus, utilizând rezultatele unui model VAR, se poate determina funcția de răspuns la
impuls (impulse response function-IRF) și analiza de descompunere a varianței (variance
decomposition-VDC), ce servesc ca instrumente de evaluare a interacțiunilor dinamice și a puterii
relațiilor cauzale dintre variabilele sistemului. Analiza de descompunere a varianței indică
procentul din varianța erorii de previziune a unei variabile ce este atribuit propriilor inovații dar și
inovațiilor în alte variabile. În plus, funcția de răspuns la impuls evidențiază răspunsul unei
variabile la un șoc de o abatere standard în altă variabilă, cuantificând direcția, magnitudinea și
persistența variabilei dependente la variațiile variabilei independente. Astfel pe baza funcției de
răspuns la impuls se va cuantifica impactului unui șoc pozitiv sau negativ.
b) Dacă seriile nu sunt staționare, atunci alte două situații pot fi posibile:
b1) Daca nu sunt integrate de același ordin I(1), atunci o variabilă este I(1) și cealaltă este
I(0), atunci variabila I(1) ar trebui să fie diferențiată și prin urmare în acest caz se va estima un
model VAR (ce va conține doar rezultate pe termen scurt) pentru care se analizează performanța
modelului(semnificația parametrilor modelului, validitatea modelului, bonitatea modelului,
verificarea ipotezelor modelului de regresie). De asemenea în acest caz se va realiza testul de
cauzalitate Granger pe termen scurt, pentru care test F trebuie să fie semnificativ statistic. De
asemenea se pot aplica functia de raspuns la impuls și analiza de descompunere a varianței.
b2) Dacă variabilele sunt integrate de ordin I(1). În acest caz se trece la pasul 4, se verifică
existența cointegrării în date cu ajutorul testului de cointegrare multivariată Johansen.
b2.1) Dacă variabilele sunt integrate de ordin I(1), dar nu sunt cointegrate în sensul
procedurii Johansen, modelul VAR ar trebui rulat în prima diferență (se vor obține rezultate pe
termen scurt) și pentru care se analizează performanța modelului(semnificația parametrilor
modelului, validitatea modelului, bonitatea modelului, verificarea ipotezelor modelului de
regresie). De asemenea in acest caz se va realiza testul de cauzalitate Granger pe termen scurt,
pentru care test F trebuie să fie semnificativ statistic. De asemenea se pot aplica funcția de
raspuns la impuls și analiza de descompunere a varianței.
b2.2) Dacă ambele variabile sunt I(1) și cointegrate, se va estima un model VECM pentru
datele în nivel în care testul t al coeficientului ECM și testul F al modelului trebuie să fie
semnificative statistic. În cadrul acestui model se verifică cauzalitatea Granger pe termen scurt
dar și pe termen lung și de asemenea se pot aplica functia de răspuns la impuls și analiza de
descompunere a varianței.
unde:
este operatorul de diferențiere, X este vectorul celor n variabile I(1); este termenul
i (I Aj
cointegrare; ( i 1,..., p 1) reprezintă matricea coeficienților de dimensiune
)
j 1
(n
ce conține informații referitoare la relațiile pe termen scurt dintre variabile (ajustarea pe
n)
termen scrut).
În cadrul unui model VECM parametrii pe termen lung și cei pe termen scurt sunt separați.
În conformitate cu reprezentarea teoremei Granger, rezultatele cointegrării implică ca X și Y să
aibă următoarele specificații (Katircioglu, 2007, 2009):
p p
p p
p
unde : Y , X sunt variabilele I(1), , sunt coeficienții de ajustare, ECTt reprezintă
1
termenul de corecție a erorilor derivat din reziduurile relației de cointegrare.
,
În ecuația (1) X cauzează Granger pe Y, dacă i
pi sunt semnificativ diferite de zero. În
O modalitate simplă oferită de Eviews pentru a verifica dacă o serie prezintă sau nu
sezonalitate constă în realizarea graficului de tip Seasonal Graph. Din punct de vedere al
posibilităților de măsurare, sezonalitatea se manifestă sub forma unor abateri de la medie care
revin sistematic. Putem remarca pe baza figurilor 1, 2 și 3 corespunzătoare celor trei serii
analizate că niciuna dintre acestea nu a fost afectată de sezonalitate pe parcursul intervalului de
timp ales pentru analiză, întrucât nu prezintă devieri semnificative de la medie (linia roșie ce
reprezintă media sezonului ( în cazul de față fiecare lună a anului) se situează aproximativ pe
același nivel indiferent de lună)
Pentru fiecare dintre cele trei serii logaritmate (lsp, lnikkei și lkospi) vom realiza
corelograma și vom verifica testul Augmented Dickey-Fuller, în toate cele trei forme ale acestuia
(Trend and Intercept, Intercept și None). În acest sens, pentru realizarea corelogramei se folosesc
opțiunile: View Correlogram... și bifăm varianta Level, în urma cărei vom obține corelograma
datelor originale (în nivel).
Pentru Testul Unit Root, se selectează opțiunile View Unit Root Test și obținem:
sunt:
Opţiunile disponibile
Figură 58. Testul ADF
Test type: tipul testului de rădăcină unitară (Augmented Dickey-Fuller, PhillipsPerron);
Test unit root in:
• Level – seria nivel (seria efectivă);
• 1st difference – prima diferenţă a seriei (de obicei în cazul în care testul aplicat
asupra seriei nivel a arătat că seria este nestaţionară);
• 2nd difference – a doua diferenţă a seriei (atunci când şi testul aplicat primei
diferenţe a arătat că seria de prime diferenţe este nestaţionară.
Include in test equation
• Intercept – dacă testul să includă şi un termen constat. Opțiunea se alege atunci când
din graficul seriei se observă că aceasta fluctuează în jurul unei anumite valori sau
porneşte dintr-o anumită valoare.
• Trend and intercept – în cazul în care seria prezintă un trend.
• None – in cazul în care seria fluctuează în jurul valorii 0.
a) Seria LSP
Din corelograma corespunzătoare seriei lsp, ilustrată în Figura 6, remarcăm faptul că începe
cu valori foarte mari (0,972 la lag-ul 1) şi scade treptat. Chiar la lag-ul 14, coeficientul de
autocorelație are o valoare destul de mare (0,510), ceea ce consituie un prim indiciu că seria este
nestaționară.Totuși, pentru a avea certitudinea că seria este nestaționară, vom aplica în continuare
testul Augmented Dickey-Fuller.
În figura 7 este prezentat rezultatul testului ADF atunci când modelul de testare include atât
trend cât și termen liber. Remarcăm faptul că Testul ADF este = – 1,369511 şi este mai mic, în
valoare absolută, decât valorile critice pentru nivele de semnificaţie uzuale (de 1%, 5% ş 10%),
ceea ce ne arată că seria lsp are o probabilitate de 86,69% să fie nestaţionară şi să posede rădăcină
unitară. Figurile 8, 9 reprezentând testul ADF varianta Intercept și respectiv ADF varianta None
confirmă faptul că seria este nestaționară, chiar și pentru un nivel de semnificație de 1%.
Figură 59. Corelogramă S&P
Din corelograma corespunzătoare seriei lnikkei, remarcăm faptul că începe cu valori foarte
mari (0,971 la lag-ul 1) şi scade treptat. Chiar la lag-ul 12, coeficientul de autocorelație are o
valoare destul de mare (0,503), ceea ce consituie un prim indiciu că seria este nestaționară.
Totuși, pentru a avea certitudinea că seria este nestaționară, vom aplica în continuare testul
Augmented Dickey-Fuller.
În figura 11, este prezentat cazul în care ecuația de testare ADF include trend și termen
liber.
Putem remarca că valoarea lui tcalc = -2.159925 este mai mică în modul decât valorile critice
absolute ale lui t, pentru un nivel de încredere de 10%, 5%, respectiv 1%. Prin urmare acceptăm
ipoteza nulă, conform căreia seria este nestaționară.
Figură 64. ADF - Trend and Intercept
În cazul în care ecuaţia de testare ADF nu include nici trend, nici termen liber, obținem
outuputul din Figura 13, care confirmă rezultatele testelor anterioare. Probabilitatea de a greși în
respingerea ipotezei nule este foarte mare, aproape de unitate (=0,9418) și prin urmare seria în
nivel este nestaționară.
În continuare, aplicăm testul Augmented Dickey-Fuller pentru toatele cele trei forme ale
ecuației de testare și remarcăm faptul că rezultatele sunt similare cu cele din cazul precedent, în
care am testat non-staționaritatea seriei lnikkei. Interpretările se realizează analog cu cele
anterioare și pun în evidență nestaționaritatea ultimei serii din cele analizate.
Figură 68. ADF - Trend and Intercept
În urma verificării corelogramei și testelor ADF, am obținut că toate cele trei serii sunt
nestaționare.
Chiar dacă testul ADF oferă opțiunea de a selecta seria în prima diferență pentru verificarea
staționarității, crearea unui nou set de date care să rețină seria diferențiată de ordinul I, este utilă
pentru realizarea de grafice, pe care le putem compara cu cele corespunzătoare seriei în nivel
(nestaționară).
a) Seria LSP
Graficul corespunzător seriei LSP pune în evidență o tendință crescătoare, dar trendul nu
este neted. De altfel în anul 2009 se înregistrează o scădere semnificativă, care poate fi pusă pe
seama crizei financiare din acel an, care a fost resimțită la nivel mondial. Pe de altă parte, după
prima diferență, se remarcă o netezire a trendului, care constituie un prim indiciu pentru prezența
staționarității în serie, după aplicarea operatorului de diferențiere.
Figurile 19 și 20 pun în evidență faptul că pentru cele trei ipoteze ale modelului ADF,
seria DLSP (seria LSP dupa aplicarea operatorului de diferență) este staționară, întrucât valoarea
calculată a testului t este superioară, în valoare absolută, valorilor critice absolute, asociate unor
nivele de semnificație de 1%, 5% și respectiv 10%. (Prob=.000)
Figură 72. ADF Pentru seria DLSP (Ipotezele Trend and Intercept și Intercept)
Toate observațiile făcute în cazul precedent se mențin și în cazul seriei indicilor Nikkei, iar
interpretările se fac analog.
Figură 75. ADF Pentru seria DLNIKKEI (Ipotezele Trend and Intercept și Intercept)
Figură 76. ADF Pentru seria DLNIKKEI (Ipoteza None)
c) Seria LKospi
Ultima serie prezintă rezultate similare cu celelelalte două serii, fiind și ea staționară după
aplicarea operatorului de diferență. Interpretările se realizează analog.
Dacă variabilele sunt integrate de același ordin, procedura Johansen este aplicată pentru
verificarea cointegrării datelor. În literatura de specialitate există două abordări referitoare la
cointegrare: metodologia Engle-Granger și procedura Johansen. Dacă procedura Engle-Granger
este adecvată doar pentru cazul bivariat și nu poate depista decât existența unei singure relații de
cointegrare, în cazul abordării multivariate a lui Johansen există posibilitatea de a a avea mai
multe relații de cointegrare, evidențiind faptul că variabilele pot forma mai multe relații de
echilibru ce guvernează evoluția comună a variabilelor.
Folosim în Eviews comenzile: Selectăm cele trei serii Open As VAR Bifăm
Unrestricted VAR OK---ViewLag structure-Lag length criteria. Obținem:
Figură 80. Criterii de alegere a lagului optim
Remarcăm din Figura 27, că patru dintre teste propun ca lag-ul optim să fie 2. Cu toate
acestea, întrucât beneficiem de un număr relativ mare de observații și avem date lunare, vom
verifica existența cointegrării pornind de la lag-ul optim până la lagul maxim de 12.
Primul și ultimul model nu sunt realiste și sunt neplauzibile în termenii teoriei economice și
problema se reduce la alegerea unuia dintre cele trei modele alternative (2, 3 și 4). În cadrul
procedurii de selecție a modelului se pornește de la cel mai restrictiv model (modelul 2) către cel
mai puțin restrictiv(modelul 4) și în fiecare etapă se compară valoarea testului “trace” cu valoarea
critică, procedura oprindu-se atunci când pentru prima dată ipoteza nulă a non-cointegrării este
acceptată.
În strânsă legătură cu acest pas al procedurii este ultima etapa a metodologiei Johansen și
ea constă în:
În continuare, vom parcurge pașii 3&4 din metodologia Johansen, începând cu lag-ul optim
2. Observăm că un model pune în evidență următoarele elemente: Prima parte a tabelului cu
rezultate prezintă numărul de relaţii de cointegrare, iar mai jos două tipuri de teste statistice sunt
raportate. Primul bloc prezintă aşa - numitele statistici trace şi al doilea bloc prezintă statisticile
maximum eigenvalue. Pentru a determina numărul de relaţii de cointegrare, condiţionat de
ipotezele făcute cu privire la trend, se analizează succesiv rezultatele prezentate în coloana
Hypothesized No of CE(s), acestea reprezentând ipoteza nulă, fiecare având asociată o
probabilitate Prob., care pune în evidență probabilitatea de a greși în respingerea ipotezei nule.
Totodată, rezultatul acestei proceduri de testare secvenţială este prezentat în partea de jos a
fiecărui tabel cu rezultate.
Figurile 30 și 31, care surprind rezultatele testului de cointegrare în cazul celorlalte două
tipuri de modele, pun de asemenea în evidență lipsa cointegrării pentru un nivel de semnificație
de 5%. Prin urmare, alegerea unui lag egal cu 2 nu indică prezența cointegrării în seriile de date
analizate. Astfel, prin încercări succesive am obținut pentru lag-ul 11 (care se înscrie în limita de
12 lag-uri) există o relație de cointegrare, indiferent de tipul modelului utilizat, așa cum reiese din
Figurile 32, 33 și 34.
Astfel, remarcăm că în toate cele trei modele și în fiecare din cele 2 teste, prima ipoteză
nulă, care indică lipsa cointegrării poate fi respinsă pentru un prag de semnificație 5%. Prin
urmare există o relație de cointegrare între variabilele studiate.
Cum seriile sunt integrate de același ordin și cointegrate în sens Johanes, putem trece la
pasul următor, care constă în estimarea unui model VEC. (Vector Error Correction).
Un model de tip VEC (Vector Error Correction) este un model VAR restricţionat conceput
pentru a fi utilizat în cazul seriilor nestaţionare despre care se cunoaşte că sunt cointegrate. Un
model VEC are încorporat în cadrul structurii sale relaţii de cointegrare, astfel încât urmăreşte să
limiteze dinamica pe termen lung a variabilelor endogene astfel încât să conveargă către relaţiile
lor de cointegrare, permiţând în acelaşi timp ajustări dinamice pe termen scurt. Termenul care
cuantifică relaţia de cointegrare este cunoscut ca termenul de corectare a erorilor (error
correction), deoarece o eventuală abatere de la echilibrul pe termen lung este corectata treptat
printr-o serie de ajustări parţiale pe termen scurt. Pentru a configura un model VEC, se face clic
pe butonul Estimate din bara de instrumente şi se alege opţiunea Vector Error Correction din
fila VAR/VEC Specification, ca în figura 35.
Obținem:
Figură 89. Modelul VEC
Fereastra care conţine rezultatele estimării modelului VEC se compun din două părţi. Prima
parte raportează rezultatele procedurii Johansen, efectuată în prima etapă. Dacă nu există restricţii
impuse, Eviews va utiliza o normalizare implicită. Această normalizare implicită exprimă primele
variabilele r din VEC, ca funcţii de restul de K-r variabile rămase, unde r este numărul
relaţiilor de cointegrare şi K este numărul de variabile endogene. Pentru parametrii care sunt
identificaţi în cadrul restricţiilor sunt raportate erorile standard asimptotice.
Totuși, ne interesează ecuațiile rezultate pentru fiecare variabilă din cele studiate pentru a
putea determina efectele pe termen lung și pe termen scurt. Vum piețele busriere sunt
interconectate nu putem țti cu siguranță care este variabila endogenă, prin urmare studiem toate
cele trei cazuri. Înainte de testarea cauzalității Granger, trebuie să verificăm dacă modelele sunt
valide statistic.
Cu ajutorul opțiunilor Proc Make system Order by variable obținem ecuațiile celor
trei variabile, iar pentru fiecare ecuație obținută, determinăm modelul corespunzător, selectând
Quick Estimate Equation.
Remarcăm faptul că Prob asociată testului F, de validare a modelului este de 0.125 care
depășește chiar și pragul uzual de semnificație de 10%. prin urmare, modelul nu este valid și
nu poate fi folosit mai departe.
În figura 38, este prezentat modelul statistic în care Lkospi este variabila dependentă.
103
Figură 91. LKospi - Variabilă dependentă
În acest caz, este evident că modelul nu este valid, întrucât probabilitatea Prob de a greși
în respingerea a ipotezei nule (conform căreia modelul este valid) depășeste cu mult chiar și
pragul de 10%.
Ne-a rămas un singur caz, cel în care Lnikkei este variabila dependentă.Obținem:
Figură 92. LNikkei - Variabilă dependentă
Putem afirma că modelul este semnificativ statistic în urma testului F dacă acceptăm
un nivel de semnificație de 10%. În acest caz, Prob. (F-statistic)=0,08, mai mică față de 10%,
iar model este valid.
Întrucât modelul este valid statistic pentru un prag de semnificație de 8%, pe care ni-l
asumăm, putem continua cu studiul validității modelului pe seria reziduurilor.
Probabilitatea asociată acestui test este de 0,456, deci se va accepta ipoteza H 0, erorile
aleatoare având distribuție normală. Se observă totodată că media erorilor aleatoare este -
1,93e-18, fiind foarte aproape de zero.
În figura 41, este ilustrat testul pentru verificarea autocorelării erorilor. Pentru
detectarea erorilor aleatoare de ordin superior, folosim testul Breusch-Godfrey, cu ipotezele:
aleatoare
Cum Prob. F = 0,3307 > 5%, deci trebuie să respingem H1 și să acceptăm H0,
neexistând autocorelare de ordin superior.
Figură 94. Testul Breusch-Godfrey
Pentru a observa dacă erorile aleatoare sunt homoscedastice sau nu, vom aplica testul
Glejser, prezentat în figura 42.
heteroscedasticitate).
Odată stabilit faptul că modelul este valid, putem determina cauzalitatea Granger,
funcția de răspuns la impuls (impulse response function-IRF) și analiza de descompunere a
varianței (variance decomposition-VDC), ce servesc ca instrumente de evaluare a
interacțiunilor dinamice și a puterii relațiilor cauzale dintre variabilele sistemului.
H1 : C(37)≠C(38)≠C(39)≠C(40)≠C(41)≠C(42)≠C(43)≠C(44)≠C(45)≠C(46)≠C(47)≠0
(Coeficienții sunt semnificativi statistic și există astfel cauzalitate petermen scurt între cele
două variabile analizate)
Obținem outputul din Figura 44. Intrucât probabilitățile ambelor teste sunt
nesemnificative din punct de vedere statistic 0.16 și 0.14 (>5%), acceptăm ipoteza nulă și
anume nu există o relație de cauzalitate pe termen scurt între cele două variabile analizate.
Întrucât probabilitățile ambelor teste sunt semnificative din punct de vedere statistic
0.0329 și 0.0226 (<5%), acceptăm ipoteza nulă și anume că există o relație de cauzalitate pe
termen scurt între cele două variabile analizate (de la Lkospi la Lnikkei). Acest rezultat este
previzibil, întrucât ambii indici bursieri fac parte din piața bursieră est-asiatică și pe termen
scurt, o modificare a unuia determină adesea un impact semnficativ asupra celorlalți indici
bursieri din aceeași zonă, mai ales a celor reprezentativi, cum este și cazul lui Nikkei.
4.2.2.7. Funcția de răspuns la impuls și descompunerea varianței
Astfel pe baza funcției de răspuns la impuls se va cuantifica impactul unui șoc pozitiv
sau negativ.
Figură 101. Funcția de răspuns a indicelui Nikkei la variabilele
exogene
Astfel, pentru un orizont de 10 luni, variația erorii de previziune a Lnikkei ajunge să fie
explicată în proporție de 95,61% de inovațiile proprii. Restul variației este pus pe seama
celorlalte variabile analizate, dintre care, Lkospi explică 2,41% iar LSP doar 1,97%, rezultat
ce confirmă relația de cauzalitate pe termen scurt determinată între Lnikkei și Lkospi.
Numărul redus al variabilelor analizate, întrucât la nivelul fiecărui stat există mai mulți
indici bursieri semnificativi, care ar putea ilustra mai bine relația de cointegrare;
Utilizarea monedei locale ca unitate de măsură pentru prețurile de închidere. S-a
remarcat faptul că se obțin rezultate mai robuste dacă toate prețurile sunt exprimate în
dolari americani. În lipsa unor date exprimate în dolari, am folosit ca unitate de
măsură moneda locală.
În literatura de specialitate, s-a remarcat faptul că o perioadă sugestivă pentru pentru
examinarea cointegrării piețelor de capital din Asia este dată de criza financiară
asiatică din 1997-1998. Setul de date ales nu include însă și acest interval, din cauza
indisponibilității prețurilor de închidere lunare din această perioadă, corespunzătoare
indecelui Kospi. Astfel, excluderea unor date importante, ce poate reflecta o mișcare
de tip co-movement poate conduce la rezultate nesemnificative. De altfel, au fost
estimate modele care să pună în evidență interacțiunea piețelor de capital pornind de la
impactul crizei asiatice menționată anterior.
Alegerea prețurilor lunare. Este cunoscut faptul că alegerea frecvenței datelor are un
rol important în obținerea rezultatelor analizei de cointegrare. Vorbind despre o piață
bursieră, schimbarea este omniprezentă, iar în prezent, există numeroase platforme
electronice comerciale și financiare (de ex. DataStream), care oferă informații despre
prețuri în timp real. Studiile anterioare au arătat că există în general trei abordări ale
frecvenței de înregistrare a datelor utilizate în cercetări și anume: prețuri zilnice,
săptămânale și lunare. Alte unități de măsură a timpului mai mici sau mai mari în acest
context nu sunt plauzibile economic. Dintre acestea, s-a remarcat faptul că datele
săptămânale oferă cele mai bune rezultate, întrucât ajută la obținerea unui volum mai
mare al eșantionului și oferă suficient timp investitorilor de a procesa noile informații
apărute pe piață.
Asumarea unui prag de semnificație de 10% pentru a valida modelul VECM obținut.
Alegerea unui lag egal cu 11 pentru confirmarea cointegrării seriilor de date alese, în
condițiile în care lag-ul optim determinat este egal cu 2.
4.3. Concluzie
Ultima aplicație din cadrul proiectului și-a propus să analizeze cointegrarea a trei serii
de date, reprezentând indici bursieri reprezentativi pentru bursa de valori americană, respectiv
est-asiatică. Pentru un lag egal cu 11, am obținut că există o relație de cointegrare între seriile
de timp analizate și prin urmare am estimat un model VEC. Întrucât piețele bursiere sunt
interactive, nu putem ști cu exactitate care variabilă este endogenă și prin urmare am analizat
toate cele trei posibilități, obținând valid doar modelul în care Nikkei este variabilă
dependentă. În acest caz, am remarcat prezența cauzalității Granger pe termen scurt de la
indicele Kospi la indicele Nikkei, rezultat ce ilustrează faptul că inter-dependența piețelor
bursiere este mai pronunțată în cadrul zonei est-asiatice comparativ cu relația acestora față de
piața bursieră americană.
5. Bibliografie
BuHamra, S., Smaoui, N. & Gabr, M., 2003. The Box–Jenkins analysis and neural networks:
prediction. Applied Mathematical Modelling, pp. 805-806.
Gagea, M., 2016. Identificarea transformărilor necesare staționarizării unei serii de timp.
[Online]
Available at: http://anale.feaa.uaic.ro/anale/resurse/61%20Gagea%20M- Identificarea
%20transformarilor%20necesare%20stationarii%20unei%20serii%20de%20timp. pdf
Mues, C. & Fitzpatrick, T., 2015. An empirical comparison of classification algorithms for
mortgage default prediction: evidence from a distressed mortgage market. European
Journal of Operational Research, pp. 427-429.
Nau, R., 2014. Notes on nonseasonal ARIMA models. Fuqua School of Business,
Duke University, pp. 1-6.
Nau, R., 2014. The mathematical structure of ARIMA models. Fuqua School of Business,
Duke University , pp. 7-8.
NewsIn, 2009. Cererile pentru credite ipotecare din SUA au scazut pana la minimul ultimelor
sapte luni. NewsIn.
Scritube.ro, 2016. Modele de tip autoregresiv medie mobila (ARMA, ARIMA). [Online]
Available at: http://www.scritub.com/tehnica-mecanica/Modele-de-tip-autoregresiv-
med52943.php
Shi, X. & Riley, S. F., 2014. Mortgage choice, house price externalities, and the default rate.
Journal of Housing Economics, pp. 140-142.
Wall-street.ro, 2016. Bancile din Europa și SUA au platit în 2014 amenzi de 65 MLD.
dolari, valoare record. [Online]
Available at: http://www.wall-street.ro/articol/Finante-Banci/177600/bancile-din-europa-si-
sua-au-platit-in-2014-amenzi-de-65-mld-dolari-valoare-record.html
http://www.fin.ase.ro/ABC/fisiere/ABC1_2013/Lucrari/3.8.pdf
Andrawis, R., 2011. Combination of long term and short term forecasts with application to
tourist demand forecasting. International Journal of forecasting, pp. 870-886.
Chan F., L. C., 2011. Spectral analiysis of seasonality in tourism demand. Matematics
and Computers in simulation, pp. 1409-1418.
Gounopouls, P., 2012. Forecasting tourist arrivals in Grece and the impact on
macreoeconomic stocks. Tourism and Research, pp. 641-646.