Documente Academic
Documente Profesional
Documente Cultură
Cuprins
Aplicatia 1..............................................................................................................................................3
1.1. LITERATURA EVIEW.............................................................................................................3
1.2 METODOLOGIA BOX-JENKINS..................................................................................................5
2.1 DATE UTILIZATE .DESCRIEREA VARIABILEI ANALIZATE.................................................7
2.2 REZULTATELE EMPIRICE ALE CERCETĂRII........................................................................10
2.2.1.ANALIZE DESCRIPTIVE PRELIMINARE ASUPRA SERIEI(STATISTICI
ELEMENTARE,GRAFICE)............................................................................................................10
2.2.1.1 GRAFICUL SERIEI.........................................................................................................10
2.2.1.2 STATISTICI DESCRIPTIVE...........................................................................................11
Aplicatia 2............................................................................................................................................37
2.1. LITERATURE REVIEW.............................................................................................................37
2.2.METODOLOGIA CERCETARII..............................................................................................38
2.3.APLICAȚIE...................................................................................................................................41
2.3.1 DESCRIEREA DATELOR.....................................................................................................41
2.3.2 STATISTICI DESCRIPTIVE..................................................................................................44
2.3.3 CORELOGRAMA SI TESTUL ADF.....................................................................................45
2.3.4 STATIONALIZARE...............................................................................................................46
2.3.5 ALEGEREA CELUI MAI BUN SARIMA.............................................................................49
2.3.6 TESTAREA VALIDITATII MODELULUI...........................................................................51
2.3.7 TEST HOMODESCEDASTICITATE....................................................................................51
2.4. MODELAREA SERIEI DE DATE UTILIZAND MODELE DE NETEZIRE
EXPONENTIALA...........................................................................................................................53
2.4.1 ALEGEREA CELUI MAI BUN MODEL...............................................................................54
2.4.2 PREVIZIUNE.........................................................................................................................54
Aplicația 3............................................................................................................................................57
3.1. LITERATURE REVIEW..............................................................................................................57
3.2. METODOLOGIA CERCETARII.................................................................................................61
3.3. DATELE UTILIZATE..................................................................................................................64
3.4. REZULTATELE EMPIRICE ALE CERCETARII.......................................................................65
Bibliografie:.........................................................................................................................................83
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Aplicatia 1
Cea de-a doua diferență se scrie: z t= ( y t− y t−1 )−( y t−1− y t −2) ,unde t=3,4,..,n(numărul de
observații).
În lucrarea 2principalul obiectiv urmărit este compararea unor modele de regresie multiplă cu
modele autoregresive integrate de medie mobilă(ARIMA).Realizarea de previziuni este un
1
Theresa Hoang Diem Ngo,Warner Bros. Entertaiment Group,Burbank,CA,The Box-Jenkins Methodology for
Time Series Models,Paper 454-2013
2
S Nanda,Forecasting: Does the Box-Jenkins Method Work Better than Regression?
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
aspect important în cadrul unei afaceri, deoarece ajută managerul în procesul de luare a
deciziei.Regresia multiplă presupune că există o asociere între variabilele dependente și cele
independente.Pe baza modelului de regresie estimat se pot face previziuni viitoare ale unor
indicatori.
-Identificare
-Estimare
-Verificarea diagnosticului
În lucrarea 4 se utilizează prețul zilnic al aurului,ce a fost colectat de pe site-ul USA GOLD
pentru realizarea de previziuni.Datele zilnice colectate cuprind perioada 02 ianuarie 2014-02
iulie 2015.Concluzia lucrării a fost că cele mai bune modele sunt ARIMA(0,1,1) și
3
Ion D.,Adriana AnaMaria A., MODELLING UNEMPLOYMENT RATE USING BOX-JENKINS PROCEDURE,2008
4
Ali, A., Ch, M. I., Qamar, S., Akhtar, N., Mahmood, T., Hyder, M., & Jamshed, M. T. (2016). Forecasting of daily
gold price by using Box-Jenkins methodology. International Journal of Asian Social Science, 6(11), 614-624.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Metodologia Box Jenkins presupune parcurgerea mai multor etape pentru identificarea celui
mai bun model autoregresiv.Aceste etape sunt5:
ETAPA III:Se identifică mai multe tipuri de modele,folosind caracteristicile funcțiilor ACF
și PACF.
ETAPA V:Se testează caracteristicile modelelor autoregresive folosint teste pentru a testa
semnificația coeficienților și autocorelarea rezidurilor.
ETAPA VI: Se alege cel mai bun model pe baza unor criterii de performața ca Akaike și
Schwarz.
5
Andrei T,Ion P.,METODOLOGIA APLICĂRII PROCEDURII BOX-JENKINS LA ESTIMAREA INFLAŢIEI ÎN R. MOLDOVA
ŞI ROMÂNIA,2007
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
y t =α y t −2 + ε t
În genereal putem identifica un proces de medie mobilă dacă coeficienții din funcția de
autocorelație se anulează după lag-ul q+1 sau mai mare.
y t =ε t +θ ε t −1
Generalizat se va scrie:
γk
ρk =
VAR yt
6
Frain, J. (1992). Lecture Notes on Univariate Time Series Analysis and Box Jenkins Forecasting.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Link sursă:https://finance.yahoo.com/quote/KO/history?p=KO
Preţul acţiunilor pe bursă se formează în funcţie de cerere şi ofertă, preţul unei tranzacţii se
realizează acolo unde cererea întâlneşte oferta.
Cu cât cererea este mai mare decât oferta, adică cei care vor să cumpere o acţiune sunt mai
mulţi decât cei care vor să o vândă, cu atât preţul va creşte şi invers, dacă pentru o acţiune
oferta este mai mare decât cererea, adică cei care vor să vândă sunt mai mulţi decât cei care
vor să cumpere, atunci preţul va scădea.
Prețul de închidere este prețul final la care se tranzacționează un titlu de valoare într-o
anumită zi de tranzacționare. Prețul de închidere reprezintă cea mai actualizată evaluare a
unui titlu de valoare până când tranzacția începe din nou în următoarea zi de tranzacționare.
Cele mai multe instrumente financiare sunt tranzacționate după ore (deși cu niveluri de volum
și lichiditate semnificativ mai reduse), astfel încât prețul de închidere a unui titlu de valoare
poate să nu corespundă prețului său după ore.
The Coca-Cola Company (NYSE: KO) este cea mai mare companie producătoare de băuturi
răcoritoare din lume, cel mai mare producător, distribuitor și comercializant de băuturi ne-
alcolice și siropuri din lume, și una dintre cele mai mari corporații din SUA. Compania este
cunoscută în special datorită produsului ei cel mai renumit Coca-Cola, inventat de John Stith
Pemberton în 1886.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
2.Datele inițiale
În graficul de mai sus pe axa ox avem lunile pentru perioada 2008-2018,iar pe axa oy prețul
de închidere al acțiunilor Coca Cola scalate între 20 și 52 $/acțiune.Observăm că în timpul
crizei începând cu luna martie a anului 2008 ,prețul de închidere al acțiunilor scade de la
30.4$/acțiune la 20.4$/acțiune în luna februarie a anului 2009,atingând un minim istoric.Din
2009 și până în 2018 seria are un trend crescător,însă mai apar și mici fluctuații.Prețul maxim
înregistrat este în luna noiembrie a anului 2018 și a atins valoarea de 50.4Din grafic putem
concluziona că seria nu este staționară.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
În medie prețul mediu de închidere al acțiunilor Coca Cola este de 36.86 $/acțiune.Prețul
maxim înregistrat este de 50.4 $/acțiune în luna noiembrie a anului 2018.Prețul minim
înregistrat este de 20.42$/acțiune în luna februarie a anului 2009.Mediana împarte seria în
două părți egale,50% din prețurile de închidere al acțiunilor Coca Cola sunt sub
39.16$/acțiune,iar 50% din acestea sunt peste 39.16$/acțiune.Abaterea standard este 7.45 este
destul de mică comparativ cu media,deci valorile nu se abat așa mult de la medie.
Jaque-Bera, ipoteze:
Pentru ca o serie să fie staționară momentele de orice ordin trebuie să fie constate în timp.
O serie este nestaționară când media nu este constantă în timp, valorile având destul de multe
fluctuații de-a lungul timpului în jurul mediei și varianța nu e constantă în timp.
Analiza corelogramei
Testul Bartlett,Ljung-Box
Testele rădăcină unitate-Augmented Dicky Fuller(ADF)
Analiza corelogramei
Testul Bartlett
1
Pentru n suficient de mare: ρk ∼ N (0 ; )
n
Ipotezele testului :
Testul Ljung-Box
Ipoteze:
H1:ⱻ ρi ≠ 0 ,i=1 , m
m
Statistica testului:Q*=n(n+2)*∑ ^ρk /n-k∼χ2,m
k =1
m=15
Q*15=1385.5
potezele Unit-Root:
Statistica τ(tau):
τ =δ/Se(δ)
|-2.400485|<|-4.030157|
|-2.400485|<|-3.444756|
|-2.400485|<|-3.147221|
|-0.672373|<|-3.481217|
|-0.672373|<|-2.883753|
|-0.672373|<|-2.578694|
|1.194018|<|-2.582872|
|1.194018|<|-1.943304|
|1.194018 |<|-1.615087|
Utilizând cele trei forme ale lui Dickey Fuller(unit root) pentru testarea staționarității
seriei de timp a rezultat că seria este nestaționară și trebuie staționarizată.
Datele diferențiate
Din graficul de mai sus putem observa că valorile oscilează în jurul valorii 0,nu se mai
poate identifica un trend,oscilațiile fiind destul de apropiate între ele.Media și varianța
fiind constante, graficul de mai sus ne indică faptul că seria este staționară.
Pentru a verifica dacă seria diferențiată este staționară aplicăm testele rădăcină unitate.
potezele Unit-Root:
|-14.29029|>|-2.582872|
|-14.29029|>|-1.943304|
|-14.29029|>|-1.615087|
Aplicând testul ADF seriei diferențiate ,seria close_dif1 a devenit staționară în urma aplicării
operatorului de diferențiere.
Dintre aceste modele, il vom alege pe cel care indeplineste urmatoarele conditii:
Figură 14 AR(1)
Figură 15 MA(1)
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figură 16 ARMA(1,1)
Figură 17 ARMA(7,7)
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figură 18AR(7)
Figură 19 MA(7)
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Ipoteze
Prob
c 0.2160
AR(1) 0.0057
Prob
c 0.2163
MA(1) 0.0162
Prob
c 0.3308
AR(1) 0.000
MA(1) 0.000
Prob(c)=0.3308>0.05=>se acceptă H0=>constanta nu este semnificativ statistic
Prob
C 0.0013
AR(1) 0.1272
AR(7) 0.3735
MA(1) 0.7499
MA(7) 0.0009
Prob
C 0.0658
AR(1) 0.0053
AR(7) 0.0041
Prob
C 0.0031
MA(1) 0.0253
MA(7) 0.0000
Conform criteriilor informaționale AIC și SC a rezultat faptul că cel mai bun model pe
seria în cauză este MA(1).Coeficientul lui MA(1) este semnificativ statistic,iar interceptul
nu este semnificativ statistic.
Pe baza probabilităților rezidurilor putem observa că avem reziduri care sunt atât
semnificative cât și nesemnificative ,asta înseamnă că rezidurile nu sunt autocorelate ,iar
modelul este valid.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Din figura de mai sus putem observa faptul că valoarea actuală se apropie destul de mult de
valoarea teoretică.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Rădăcina lui MA(1) este în interiorul cerucului unitate,deci seria este staționară.
Mean Abs. Error este 0.033 și de această dată valoare este mică.
Theil îmi arată calitatea previziunii,iar în cazul de față valoare acestuia este de 0.0059,care
este foarte aproape de 0,deci calitatea previziunii este destul de bună.
Bias proportion este 0 și reprezintă diferența dintre media valorii previzionate și media valorii
actuale.
Variance Proportion este 0.0017,valoare ce este destul de apropiată de 1 și arată cât de departe
este ecartul dintre varianța previzionată și cea actuală.
Covariance proportion este 0.9982,valoare ce este foarte apropiată de 1 și arată influența altor
factori nesistematici care determină eroarea de previziune.
Thail este încă aproape de 0,deci calitatea previziunii este destul de bună.
Bias-ul este apropiat de 0,deci diferența dintre media valorilor previzionate și media valorilor
actuale este încă destul de mică.
Rezultatele prin previziunea dinamică sunt mai slabe decât cele prin previziunea statică.
Observăm că prognozând prețurile de închidere ale companiei Coca Cola pe anul 2019 trendul
ascendent al acestuia se menține în continuare.Compania a avut din anul 2008 și până în
prezent o creștere a prețurilor continuuă cu mici fluctuații în unele perioade.
Aplicatia 2
Iar in cadrul articolului “Time series SARIMA models for average monthly solar
radiation in Malaysia”8 s-a urmărit prognoza pentru radiațiile solare necesare pentru
producerea de energie în două orașe din Malaysia. Rezultatele obtinute fiind adecvate s-a
continuat prognoza verificandu-le si astfel, s-a demonstrat ca modelul SARIMA a fost
eficient si pentru obtinerea acestor progrnoze.
7
Xujun Zhang; “Forecasting mortality of road traffic injuries in China using seasonal autoregressive integrated
moving average model”; Chine; Annals of Epidemiology, Volume 25, Issue 2, p 101-106
8
Mira Syahirah Kamil, “Time series SARIMA models for average monthly solar radiation in Malaysia”;
Malaysia;
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
1) Staționarizarea seriei de timp prin diferențiere (în cazul în care este nestaționară)
2) Studiul tiparelor din funcțiile de autocorelație și autocorelație parțială pentru adetermina
dacă lag-urile seriei staționarizate și/sau lag-urile erorilor de previziune ar trebui incluse în
ecuația de previziune
3) Testarea validității modelului estimat
4) Generarea de previziuni
Analiza stationarității seriei de date se realizează în EViews prin una dintre următoarele
metode:
2.2.METODOLOGIA CERCETARII
Sezonalitatea într-o serie de timp este un model regulat de modificări care se repetă pe
perioade de timp S, unde S definește numărul de perioade de timp, până când modelul se
repetă. De exemplu, există sezonalitate pentru date lunare pentru care valori ridicate tind
întotdeauna să apară în unele anumite luni ale anului și valori scăzute tind să apară in alte
luni. În acest caz, S = 12 (luni pe an) este durata de comportament sezonier periodic. Pentru
datele trimestriale, S = 4 perioade de timp pe an.
Cu datele lunare (și S = 12), un model sezonier autoregresiv de ordinal 1 ar folosi x t−12
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
SARIMA sau ARIMA sezoniera, este o extensie a ARIMA care acceptă în mod explicit
serii de timp univariabile cu o componentă sezonieră. Aceasta adaugă trei noi parametrii
pentru a specifica: autoregresie (AR), diferenierea (I) și media mobilă (MA) pentru
componenta sezonieră a seriei, precum și un parametru suplimentar pentru perioada de
caracterul sezonier.
Modelul sezonier ARIMA10 încorporează atât factori non-sezonieri și sezonieri într-un model
multiplicativ. O notație prescurtare pentru modelul este:
ARIMA (p,d,q)×(P,D,Q)S
unde P = numărul de termeni sezonieri autoregresivi (SAR), D = numărul de diferențe
sezoniere, Q = numărul de termeni sezonieri de medie mobilă (SMA).
În identificarea unui model de tip SARIMA, primul pas este determinarea necesității
unei diferențieri sezoniere (de la sezon la sezon sau de tipul Yt – Yt-12), pe lângă sau în locul
unei diferențieri non-sezoniere. Prin urmare, vom analiza graficele modelelor, funcția de
autocorelație și funcția de autocorelație parțială pentru a determina toate combinațiile posibile
de diferențieri non-sezoniere de ordin 0 și 1 și de diferențieri sezoniere de ordin 0 și 1.
9
newonlinecourses.science.psu.edu
10
computer-trading.com/a-gentle-introduction-to-sarima-for-time-series-forecasting
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Semnătura unui comportament de tip pur SAR sau pur SMA este similar cu semnătura
unui comportament pur AR sau pur MA, cu excepția faptului că acest tipar apare la multiplii
de lag s în funcția de autocorelație ACF și în funcția de autocorelație parțială PACF. De
exemplu, un proces SAR (1) pur are valorile extreme ale funcției de autocorelație ACF la
lagurile s, 2s, 3s, etc., în timp ce PACF doar va descrește după lag-ul s.
În schimb, un proces SMA (1) pur are valorile extreme ale funcției de
autocorelație parțială PACF la lagurile s, 2s, 3s, etc., în timp ce ACF doar va descrește după
lag-ul s.
O semnătură SAR apare de obicei atunci cand autocorelația la perioada sezonieră este
pozitivă, în timp ce o semnătură SMA apare de obicei atunci când autocorelația la perioada
sezonieră este negativă, de aici fiind derivată o nouă regulă:
De obicei, este suficient un singur termen de tip SAR (1) sau SMA (1). Foarte rar se poate
întâlni un proces SAR(2) sau SMA(2) real, și, și mai rar aceste modele au suficiente date
pentru a estima 2 sau mai mulți coeficienți sezonieri fără ca algoritmul de estimare să intre
într-o buclă de feedback.
Deși un model SARIMA pare a avea doar câțiva parametri, modelul de previziune necesită
estimarea parametrilor impliciți din unul sau din două sezoane pentru a putea fi inițializat.
Prin urmare, ar trebui să avem cel puțin 4 sau 5 sezoane de date pentru a putea modela un
model SARIMA.
Probabil cel mai frecvent utilizat model de tip SARIMA este modelul (0,1,1) x (0,1,1), adică
modelul MA(1) x SMA (1) care conține o diferențiere sezonieră și una non-sezonieră. Aceasta
este, în esență, un model de „netezire exponențială cu sezonalitate”.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Modelul SARIMA este extrem de folosit în predicțiile recente ce doresc a oferi soluții pentru
problemele reale cu care ne confruntăm zilnic.
2.3.APLICAȚIE
două unități de lapte cu aproximativ 6750 de vaci de muls din Argentina si peste 10 plante de
cereale și orez condiționat și de depozitare din Argentina
Analizând graficul de mai sus putem observa că există o tendință crescătoare, iar
trendul nu este neted, el având fluctuații. Acest lucru se traduce prin faptul că volumul
tranzacționat al companiei a crescut major în ultimii 5 ani. Graficul din figura 3 ne prezintă
faptul că seria este nestaționara.
Abaterea standard are valoarea 1472623, ceea ce implică faptul că volumul de producție se
abate, în medie cu aceasta valoare față de indicatorii tendinței central/
Putem întâlni valori cu asimetrie la dreapta sau la stanga, în funcție de pozitivitate sau
negativitate. Valoarea coeficientului de asimetrie, skewness este de -0.76, o valoare negativă,
asta înseamnă asimetrie la stanga. Prin acest coeficient intelegem că volumele de producție
înregistrează in general valori mari.
Indicatorul kurtosis-ul este utilizat în analiza distribuției unei serii pentru a înregistra gradul
de aplatizare sau boltire al acesteia. Valoarea coeficientului de boltire este 2.61, o valoare
mai mică decât 3, aşadar plaja de valori specifice numărului de produse comandate este una
destul de mare, fapt ce se observă şi între diferenţa mare dintre minim şi maxim.
Din corelograma de mai sus putem observa fluctuațiile seriei, valorile descresc astfel
destul de slab, acest lucru indică nestaționaritatea seriei.
Vom verifica staționaritatea seriei de date prin aplicarea testului Unit-Root, forma
corectă fiind cea fără trend, cu termen liber.
Ipoteze:
H0: | τcalc| < | τcrit| (serie nestaționară)
H1: | τcalc| > | τcrit| (serie staționară)
Valorile critice înregistrate în modelul nostru sunt -3,55, -2,91 și -2,59 iar valoarea lui t calculat este
de -2,025.
Putem observa că pentru toate pragurile de semnificație 1%, 5% și 10% valoarea absolută
a lui t critic este mai mare decât valoarea absolută a lui t calculat , ceea ce indică o serie nestaționară.
2.3.4 STATIONALIZARE
Conform graficului de mai sus seria noastră pare a fi staționară, însă pentru a ne
asigura vom folosim de testul Unit Root, în urma căruia urmărim să avem coeficientul
nesemnificativ statistic.
Ipoteze:
Conform Unit Root test, probabilitatea (Prob*) este 0 < 0.05, ceea ce înseamnă ca
avem o serie de date staționară. De asemenea, valoarea absolută a t calculat este mai mare decât
valorile absolute din dreptul pragurilor 1%, 5% și 10% , fapt ce implică staționaritatea.
Fluctuațiile de valori din dreptul lagurilor sunt mai lente, înseamnă că seria a devenit
staționară și putem să continuam prin alegerea celui mai bun model SARIMA.
Pentru alegerea celui mai bun SARIMA am identificat cel mai mare lag după valorea
lagului 1 din corelograma seriei de date diferențiate. Aceasta este lagul 4 pe care îl vom folosi
pentru următoarele 3 modele :
Pentru cele 3 modele am ales sa reţinem valorile Adjusted R-squared si Akaike Info
criterion (AIC) pentru alegerea celui mai bun model.
Dintre modelele anterioare vom alege doar unul singur pe care îl vom folosi ulterior în
previzionare. Pentru a compara modelele și pentru a stabili care este cel mai bun, vom utiliza
drept criterii maximizarea lui Adjusted R-squared și minimizarea lui AIC. Practic, vom
verifica fiecare model și vom reține pentru fiecare valorile Adjusted R-squared și AIC. La
sfârșit vom alege acel model pentru care Adjusted R-squared este cel mai mare, iar AIC este
cel mai mic.
Modelul ales este acela pentru care avem AR(1) SAR(4) MA(1) deoarece Adj. R
squared are valoarea cea mai mare(0.698) si AIC valoarea cea mai mica(27.79).
Normalitatea erorilor
Cum Probability este 0.21, este mai mare decât 0,05, se accepta ipoteza nula și rezultă că
erorile sunt distribuite normal.
Vom estima două modele diferite, cu scopul de a alege un cel mai bun model iar apoi
îl vom compara cu modelul obținut prin metodologia de la Pasul I, scopul final este acela de a
efectua prognoze.
Pentru metoda Holt-Winters de netezire exponențială, varianta multiplicativă estimăm
următorul model:
Vom estima încă un model prin metoda Holt-Winters de netezire exponențială, varianta
aditivă:
Pentru a alege cel mai bun model generat de metoda H-W compăram valorile Root
Mean Sqared Error (RMSE) şi o vom alege pe cea mai mare. Pentru modelul multiplicativ
avem o valoare RMSE de 208089.4, iar pentru modelul aditiv valoarea este de 232839.2.
Modelul preferat este cel multiplicativ.
Model SSR
Model Holt-Winters multiplicativ 5.36E+12
Model AR(1) SAR(4) MA(1) 2.26E+12
Conform acestui tabel, modelul cel mai bun este cel Holt-Winters deoarece valoarea SSR este
cea mai mica.
2.4.2 PREVIZIUNE
Previziunea a fost realizata pentru urmatorul an. Pentru a realiza aceasta previziune am
selectat optiunea dynamic forecast. Graficul obtinut este reprezentat mai jos:
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Valoarea lui Mean Abs. Percent Error trebuie să aibă o valoare cât mai mică, în acest
caz aceasta este de 5.50.
Valoarea Coficientul Theil trebuie să aibă valori cuprinse în intervalul (0, 1), valorile
apropiate de 0 indică o ajustare bună, în acest caz acest coeficient are valoarea 0.0377
si se incadreaza in intervalul(0,1).
Indicatorul Bias Proportion trebuie să aibă valori cât mai mici. Putem observa că în
cazul nostru valoarea acestuia este de 0,36, fiind o valoare suficient de mica.
Indicatorul Variance Proportion trebuie să aibă valori cât mai mici. Putem observa că
în cazul nostru valoarea acestuia este de 0,025.
Indicatorul Covariance Proportion trebuie să aibă o valoare cât mai mare, apropiată
de 1. Putem observa că în cazul nostru valoarea acestuia este de 0,61, apropiindu-se de
1.
Valoarea lui Mean Abs. Percent Error trebuie să aibă o valoare cât mai mică, în acest
caz aceasta este de 5.50.
Valoarea Coficientul Theil trebuie să aibă valori cuprinse în intervalul (0, 1), valorile
apropiate de 0 indică o ajustare bună, în acest caz acest coeficient are valoarea 0.033.
Indicatorul Bias Proportion trebuie să aibă valori cât mai mici, in cazul nostrum fiind
0.
Indicatorul Variance Proportion trebuie să aibă valori cât mai mici. Putem observa că
în cazul nostru valoarea acestuia este de 0,040.
Indicatorul Covariance Proportion trebuie să aibă o valoare cât mai mare, apropiată de
1. Putem observa că în cazul nostru valoarea acestuia este de 0,959.
Comparând cele doua tipuri de previziune (Dynamic si Static) observăm că se
înregistrează valori adecvate pentru cele două tipuri de previziune.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Aplicația 3
Să se realizeze un model multivariat în care să se investigheze natura relației dintre
variabile pe baza:
Analizei de cointegrare (dacă este cazul)
Teste de cauzalitate Granger
Estimare modele VAR / VECM.
este stationar.
(1) nu exista nici o relatie de echilibru (sau de cointegrare) intre elementele lui , caz in
care modelul costituie un sistem de regresii false,
(2) exista una sau mai multe relatii de echilibru (sau de cointegrare) intre elementele lui,
cand se are in vedere reprezentarea VECM a modelui (aceasta fiind o reprezentare VAR cu
restrictii).
Abordarea Johansen consta in identificarea a r combinatii liniare de cointegrare,
printre cele k variabile integrate, si incorporarea lor intr-un model dinamic.
Daca sunt cointegrate atunci reprezentarea VAR nu este prea adecvata pentru
analiza deoarece relatiile de cointegrare nu apar explicit. Relatiile de cointegrare devin
vizibile in reprezentarea VECM, reprezentare echivalenta cu VAR, aceasta fiind:
unde:.
iar:
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
In sensul abordarii propuse de Granger (1969) X este cauza pentru Y, sau X explica pe
Y, daca X ajuta la predictia lui Y. Procedura presupune a se cuantifica cat din nivelul curent al
variabilei Y poate fi explicat prin valorile sale istorice iar apoi a se vedea daca adaugand
variabile de tipul variatia explicata creste.
Analiza cauzalitatii intre doua variabile presupune parcurgerea etapelor de mai jos.
ETAPA 1) Pentru a testa daca X este cauza pentru Y, in sens Granger, se estimeaza ecuatia
de regresie:
(u)
unde k este fixat astfel incat erorile sa fie zgomot alb. Relativ la aceasta ecuatie,
ipoteza nula respectiv alternativa sunt:
determinatie in ecuatia fara restrictii (u) iar si sunt aceleasi elemente dar in ecuatia
. (r)
Se respinge ipoteza nula daca valoarea calculata pentru statistica F este mai mare
decat valoarea critica.
, (u)
. (r)
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
ETAPA 3) In urma aplicarii celor doua teste sunt posibile patru concluzii:
ii) cauzalitate unidirectionala: Y este cauza pentru X (Y X) daca ipoteza nula se respinge la
2) si se accepta la 1);
iii) cauzalitate bidirectionala: X Y daca ipoteza nula se respinge atat la 1) cat si la 2).
iv) cele doua variabile sunt independente daca ipoteza nula se accepta la 1) si la 2).
Serii staționare/nestaționare:
O serie de timp staționară este o serie de timp ale cărei proprietăți statistice precum
media, varianță, autocorelație sunt constante în timp. Cele mai multe metode de estimare
statistică se bazează pe presupunerea că seriile de timp sunt redate aproximativ staționare,
adică ”standardizate”, prin utilizarea unor transformări matematice.
varianța pentru perioadele viitoare. Iar dacă media și varianța unei serii nu sunt bine-definite,
atunci nu sunt nici corelațiile cu alte variabile. Din acest motiv trebuie multă atenție în
încercarea exploatării modelelor de regresie montate pe serii de date nestaționare. Cele mai
multe dintre afaceri și seriile de timp economice sunt departe de staționaritate atunci când sunt
exprimate în unitățile lor inițale de măsură, și chiar după deflaționare sau ajustare sezionieră
încă prezintă trenuri, cicluri, sau alte comportamente non-staționare.
O astfel de serie este numită serie trend-staționară. Cu toate acestea, uneori ”de-
trenduirea” nu este suficientă pentru a face seria staționară, caz în care s-ar putea să fie
necesară transformarea seriei în serii de la perioadă la perioadă și/sau diferențe de la sezon la
sezon. Dacă media, varianța și autocorelațiile seriei originale nu sunt constate în timp, chiar și
după ”de-trenduire”, probabil statisticile schimbărilor în serii între perioade sau între sezoane
vor fi constante. Prima diferențială a unei serii de timp reprezintă seria de schimbări de la o
perioadă la alta. Dacă Yt denotă valoarea seriei cronologice în perioada t, atunci prima
diferențială a lui Y la sfârșitul perioadei t este egală cu Yt-Yt-1. Dacă prima diferențială de Y
este staționară, adică dacă valorile sale în perioada t sunt corelate cu valorile din perioada
anterioară, atunci este recomandat un model de previziune mai sofisticat de netezire
exponențială, sau utilizarea metodei ARIMA.
Analiza de cointegrare:
Granger între cele două variabile analizate, trebuie să verificăm înainte de toate existenţa
cointegrării între seriile de timp. Practic, cele două serii de timp sunt cointegrate dacă au
acelaşi ordin de integrare, dar o combinaţie liniară a lor are un ordin de integrare mai mic. De
exemplu, putem avea două serii integrate de ordinul unu, astfel încât diferenţele de ordinul
unu sunt staţionare, dar poate exista o combinaţie liniară a celor două serii care să fie
staţionară, adică integrată de ordinul 0.
Numărul optim de laguri folosit la testul ADF se poate alege pe baza maximizării
criteriului informaţional Schwarz(SIC).
H0: ρ=1
Fie Yt=(ln yt ln xt) vectorul seriilor de timp astfel încât ln ytϵ I(1 ) și ln xt ϵ I(1).
Atunci ln yt şi ln xt sunt cointegrate dacă există o matrice β astfel încât β’Yt ϵ I(0). Astfel, fie
un model VAR de ordinul p: Yt= AtYt-1 + ... + ApYt-p + εt , unde Yt = (ln yt ln xt)’ este
vectorul celor două variabile studiate, integrate de ordinul 1, iar εt este vectorul inovațiilor.
Modelul VAR de mai sus poate fi rescris:
αβ’ și β’Yt ϵ I(0). Rangul r reprezintă de fapt numărul relațiilor de cointegrare, iar fiecare
coloană a matricei β conține coeficienții ecuației de cointegrare.
Metoda lui Johansen constă în estimarea matricei Π dintr-un model VAR fără
restricții și apoi testarea restricțiilor ce rezultă din asumarea unui rang r < k.
Cauzalitatea Granger:
Cauzalitatea Granger între două variabile se referă la felul în care valorile anterioare
ale unei variabile pot fi folosite pentru a explica valorile celeilalte variabile. În cazul nostru, a
testa cauzalitatea Granger se reduce la a estima următoarele modele de regresie:
Ipoteza nulă căreia i se testează validitatea este H0: β0=β1=...=βl=0, cu alte cuvinte,
testăm pentru prima ecuație faptul că ln x nu cauzează Granger pe ln y, iar în a doua ecuație
testăm faptul că ln y nu cauzează Granger pe ln x. În absența unei relații pe termen lung între
variabile, este interesant de studiat relația pe termen scurt.
Din graficul de mai sus putem observa ca exista un trend crescator spre finalul anului
2018 si inceputul anului 2019. Analizand cu atentie graficul putem afirma faptul ca seria nu
este stationara.
|-0.856|<|-3.454| TRUE
|-0.856|<|-2.572| TRUE
Din graficul de mai sus putem observa ca trendul seriei este unul descrescator.
Analizand doar graficul putem presupune ca seria analizata este nestationara.
|-1.959|<|-3.454| TRUE
|-1.959|<|-2.872| TRUE
|-1.959|<|-2.572| TRUE
Verificam dacă ambele serii au același ordin de integrare, în caz contrar nu se poate
vorbi de cointegrare.
Cele doua serii au acelasi ordin de integrare I(1).La noi, seriile sunt integrate de ordin 1, se
verifică existența cointegrării în date, cu ajutorul testului de cointegrare Johansen.
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 27 VAR
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 28 VAR
Figure 29 VAR
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 30 VAR
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Se observa faptul ca probabilitatea este: 0.8576 >0.05 => se accepta H 0 si exista cel
mult 0 relatii de cointegrare.
Figure 32 VAR
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 33 VAR
Figure 34VECM
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 35 VECM
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figura 23 – VECM
Figura 24 – VECM
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figura 25 – VECM
Figura 26 – VECM
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Figure 37 Responses
Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Variance Decomposition:
Bibliografie:
1.Theresa Hoang Diem Ngo,Warner Bros. Entertaiment Group,Burbank,CA,The Box-Jenkins Methodology for
Time Series Models,Paper 454-2013(http://support.sas.com/resources/papers/proceedings13/454-2013.pdf)
2.Nanda, S. Forecasting: Does the Box-Jenkins Method Work Better than Regression?.
(http://www.vikalpa.com/pdf/articles/1988/1988_jan_mar_53_62.pdf)
3.Ion D.,Adriana AnaMaria A., MODELLING UNEMPLOYMENT RATE USING BOX-JENKINS
PROCEDURE,2008(http://www.jaqm.ro/issues/volume-3,issue-2/pdfs/dobre_alexandru.pdf)
4. Frain, J. (1992). Lecture Notes on Univariate Time Series Analysis and Box Jenkins
Forecasting.https://www.tcd.ie/Economics/staff/frainj/main/MSc%20Material/Session_notes/UNIVAR4.pdf
5.Andrei T,Ion P.,METODOLOGIA APLICĂRII PROCEDURII BOX-JENKINS LA ESTIMAREA
INFLAŢIEI ÎN R. MOLDOVA ŞI ROMÂNIA,2007 https://ibn.idsi.md/sites/default/files/imag_file/Metoda
%20aplicarii%20procedurii%20box_jenkins.pdf
6.Ali, A., Ch, M. I., Qamar, S., Akhtar, N., Mahmood, T., Hyder, M., & Jamshed, M. T. (2016). Forecasting of
daily gold price by using Box-Jenkins methodology. International Journal of Asian Social Science, 6(11), 614-
624.https://ideas.repec.org/a/asi/ijoass/2016p614-624.html
7. newonlinecourses.science.psu.edu
8. computer-trading.com/a-gentle-introduction-to-sarima-for-time-series-forecasting
9. Xujun Zhang; “Forecasting mortality of road traffic injuries in China using seasonal autoregressive integrated
moving average model”; Chine; Annals of Epidemiology, Volume 25, Issue 2, p 101-106
10. Mira Syahirah Kamil, “Time series SARIMA models for average monthly solar radiation in Malaysia”;
Malaysia