Proiect SDT PDF

Facultatea de Cibernetică, Statistică și Informatică Economică
Academia de Studii Economice din București
Specializarea: Cibernetică Economică
Proiect Serii de Timp
Student(e):Maria Elena Adelina

Mazilu Andreea Raluca
Mitroi Ana Alina
Profesori coordonatori: Smaranda Cimpoeru
Silvia Spataru
Seria: B
An: III
Cuprins
Aplicatia 1..............................................................................................................................................3
1.1. LITERATURA EVIEW.............................................................................................................3
1.2 METODOLOGIA BOX-JENKINS..................................................................................................5
2.1 DATE UTILIZATE .DESCRIEREA VARIABILEI ANALIZATE.................................................7
2.2 REZULTATELE EMPIRICE ALE CERCETĂRII........................................................................10
2.2.1.ANALIZE DESCRIPTIVE PRELIMINARE ASUPRA SERIEI(STATISTICI
ELEMENTARE,GRAFICE)............................................................................................................10
2.2.1.1 GRAFICUL SERIEI.........................................................................................................10
2.2.1.2 STATISTICI DESCRIPTIVE...........................................................................................11
Aplicatia 2............................................................................................................................................37
2.1. LITERATURE REVIEW.............................................................................................................37
2.2.METODOLOGIA CERCETARII..............................................................................................38
2.3.APLICAȚIE...................................................................................................................................41
2.3.1 DESCRIEREA DATELOR.....................................................................................................41
2.3.2 STATISTICI DESCRIPTIVE..................................................................................................44
2.3.3 CORELOGRAMA SI TESTUL ADF.....................................................................................45
2.3.4 STATIONALIZARE...............................................................................................................46
2.3.5 ALEGEREA CELUI MAI BUN SARIMA.............................................................................49
2.3.6 TESTAREA VALIDITATII MODELULUI...........................................................................51
2.3.7 TEST HOMODESCEDASTICITATE....................................................................................51
2.4. MODELAREA SERIEI DE DATE UTILIZAND MODELE DE NETEZIRE
EXPONENTIALA...........................................................................................................................53
2.4.1 ALEGEREA CELUI MAI BUN MODEL...............................................................................54
2.4.2 PREVIZIUNE.........................................................................................................................54
Aplicația 3............................................................................................................................................57
3.1. LITERATURE REVIEW..............................................................................................................57
3.2. METODOLOGIA CERCETARII.................................................................................................61
3.3. DATELE UTILIZATE..................................................................................................................64
3.4. REZULTATELE EMPIRICE ALE CERCETARII.......................................................................65
Bibliografie:.........................................................................................................................................83
Aplicatia 1
1.1. LITERATURA EVIEW

O serie de date este un set de valori în care odata cu trecerea timpului putem identifica diferite
tipare în date. Aceste tipare au legătură cu creșteri sau descreșteri ale trendului și sezonalitatea
seriilor.
În lucrarea scrisă de Theresa Hoang Diem Ngo și Warner Bros1autorii încearcă să

prezinte provocările pe care le aduce modelarea unei serii și cum poți aduce rezultatele
analizei cât mai aproape de realitate.De asemenea, în lucrare se prezintă: modele nesezoniere
de tip Box-Jenkins, modele sezoniere, estimarea modelelor și realizarea de previziuni.Un
aspect important al acestei lucrări este acela că pentru a putea identifica diferite tipare în seria
noastră media și varianța ar trebui să fie constante în timp.Pentru a putea identifica
staționaritatea seriei o metodă foarte utilizată este funcția de autocorelație(ACF).Atunci când
coeficienții funcției de autocorelație scad foarte repede către 0, înseamnă că seria este una
staționară, însă dacă coeficienții au o scădere foarte lentă,seria este una nestaționară.Pentru a
rezolva problema seriilor nestaționare se aplică prima și a doua diferențiere,care de obicei
conduce la o serie staționară.
Matematic, prima diferență se poate scrie: z t= y t− y t −1,unde t=2,3...n(numărul de observații

ale seriei).
Cea de-a doua diferență se scrie: z t= ( y t− y t−1 )−( y t−1− y t −2) ,unde t=3,4,..,n(numărul de
observații).
După ce s-a făcut staționarizarea,estimare,diagnosticarea seriei se realizează previziuni.Pentru

a realiza aceste previziuni se împarte seria studiată în două părți:prima parte a eșantionului
este utilizată pentru modelare,iar cea de-a doua pentru previziune.
În lucrarea 2principalul obiectiv urmărit este compararea unor modele de regresie multiplă cu
modele autoregresive integrate de medie mobilă(ARIMA).Realizarea de previziuni este un
1
Theresa Hoang Diem Ngo,Warner Bros. Entertaiment Group,Burbank,CA,The Box-Jenkins Methodology for
Time Series Models,Paper 454-2013
2
S Nanda,Forecasting: Does the Box-Jenkins Method Work Better than Regression?
aspect important în cadrul unei afaceri, deoarece ajută managerul în procesul de luare a
deciziei.Regresia multiplă presupune că există o asociere între variabilele dependente și cele
independente.Pe baza modelului de regresie estimat se pot face previziuni viitoare ale unor
indicatori.
Conform acestei lucrări metodologia Box-Jenkins implică 3 pași:
-Identificare
-Estimare
-Verificarea diagnosticului
În etapa de identificare se verifică dacă seria este staționară și în caz de nestaționaritate se

trece la staționarizarea seriei.Dacă la finalul etapei de identificare este posibil să ne dăm
seama de tiparul din date atunci se poate formula un model ARIMA,care poate fi scris în felul
următor:
y t =ф y t−1 +ф 2 y t −2 +…+ ф p y t −p + et−ф 1 e t−1−ф 2 e t−2 … ф q et −q,unde y1,y2 ..yp sunt

valorile seriei,e1.e2...eq sunt erorile de previziune.Prima parte a modelului este partea
autoregresivă și cea de-a doua este cea de medie mobilă și se numește ARIMA de ordin p și q.
În etapa de estimare se identifică modelele potențiale, se estimează parametrii, iar pe baza

unui criteriu de comparație se alege modelul cel mai bun.
În etapa de diagnosticare se verifică acuratețea estimării pe baza coeficienților de

autocorelație și coeficienților de autocorelație parțială a rezidurilor modelului și apoi se
reîncearcă alte modele de previziune pentru a vedea dacă previziunea s-a îmbunătățit.
În lucrarea 3 se modelează rata șomajului în perioada 1998-2007,date lunare.În urma utilizării

metodologiei a rezultat că cel mai bun model care descrie seria este ARIMA(2,1,2).
În lucrarea 4 se utilizează prețul zilnic al aurului,ce a fost colectat de pe site-ul USA GOLD
pentru realizarea de previziuni.Datele zilnice colectate cuprind perioada 02 ianuarie 2014-02
iulie 2015.Concluzia lucrării a fost că cele mai bune modele sunt ARIMA(0,1,1) și
3
Ion D.,Adriana AnaMaria A., MODELLING UNEMPLOYMENT RATE USING BOX-JENKINS PROCEDURE,2008
4
Ali, A., Ch, M. I., Qamar, S., Akhtar, N., Mahmood, T., Hyder, M., & Jamshed, M. T. (2016). Forecasting of daily
gold price by using Box-Jenkins methodology. International Journal of Asian Social Science, 6(11), 614-624.
ARIMA(1,1,0) și analizând acuratețea modelului cu ajutorul MAE,MAPE și RMSE s-a ajuns

la concluzia ca ARIMA(0,1,1) este mult mai bun decât ARIMA(1,1,0).
1.2 Metodologia Box-Jenkins

În aplicația ce o vom prezenta în cele ce urmează s-a folosit metodologia Box
Jenkins.Procesele principale ce vor fi urilizate sunt:AR(p),MA(q),ARMA(p,q).Ca analiză
preliminară s-au folosit statisticile descriptive ca:medie, mediană, asimetrie,boltire și
altele.Pentru identificarea staționarității s-a folosit analiza corelogramei,testele Bartlett,Ljung
Box și testele rădăcină unitate Dickie Fuller.De asemenea,în cazul în care seria nu este
staționară se aplică operatorul de diferențiere de ordinal 1 sau 2.
Metodologia Box Jenkins presupune parcurgerea mai multor etape pentru identificarea celui
mai bun model autoregresiv.Aceste etape sunt5:
ETAPA I.Se calculează coeficienții funcției de autocorelație și autocorelație parțială pentru a

stabili staționaritatea seriei.În caz că seria este staționară se trece la etapa a treia,iar în caz
contrar se trece la etapa următoare.
ETAPA II:Staționarizarea seriei.Se logaritmează valorile seriei,se aplică o transformare Box

Cox și apoi se diferențiază seria.
ETAPA III:Se identifică mai multe tipuri de modele,folosind caracteristicile funcțiilor ACF
și PACF.
ETAPA IV:Se estimează parametrii modelelor autoregresive.
ETAPA V:Se testează caracteristicile modelelor autoregresive folosint teste pentru a testa
semnificația coeficienților și autocorelarea rezidurilor.
ETAPA VI: Se alege cel mai bun model pe baza unor criterii de performața ca Akaike și
Schwarz.
ETAPA VII: Efectuarea de prognoze.
5
Andrei T,Ion P.,METODOLOGIA APLICĂRII PROCEDURII BOX-JENKINS LA ESTIMAREA INFLAŢIEI ÎN R. MOLDOVA
ŞI ROMÂNIA,2007
În etapa de identificare după ce s-a realizat staționarizarea seriei se identifică procesele

autoregresive și de medie mobilă de ordin p,respectiv q.
Procesele autoregresive de ordin p AR(p)
În general procesele autoregresive au un aspect exponențial descrescător.Pentru procesele de

ordin superior este necesar analizarea funcției de autocorelație parțială, care ar trebui să se
anuleze după lag-ul p+1.Așadar, putem identifica un proces autoregresiv în datele noastre
doar dacă AC are o scădere constantă,iar PAC se anulează dupa p lag-uri.
Considerăm6 un proces AR(1), undeε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)
y t =α y t −2 + ε t
Generalizarea procesului este:
ρk −ф 1 ρ k−1 −ф 2 ρ k−2 =0 ,k=1,2,...
Procesele de medie mobilă de ordin q MA(q)
În genereal putem identifica un proces de medie mobilă dacă coeficienții din funcția de
autocorelație se anulează după lag-ul q+1 sau mai mare.
Considerăm un proces MA(1),undeε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)
y t =ε t +θ ε t −1
Generalizat se va scrie:
y t =ε t +θ1 ε t−1 +…+θ q ε t −q
γk
ρk =
VAR yt
Procesul ARMA(p,q)-procese autoregresive de medie mobilă
Considerăm ε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)
6
Frain, J. (1992). Lecture Notes on Univariate Time Series Analysis and Box Jenkins Forecasting.
y t =ф 1 y t −1+ …+ф p y i− p+ ε t +θ 1 ε t−1 +..+ θq ε t −q
Modelarea unei serii de timp utilizând metodologia Box-Jenkins
2.1 Date utilizate .Descrierea variabilei analizate

Am ales ca variabilă de interes prețul de închidere al acțiunilor la bursă ale companiei Coca
Cola.Datele au fost colectate de pe Yahoo Finance.Seria conține date lunare din anul 2008
până în anul 2018,având 132 de observații.
Link sursă:https://finance.yahoo.com/quote/KO/history?p=KO
Unitatea de măsură este dolar/acțiune.
Preţul acţiunilor pe bursă se formează în funcţie de cerere şi ofertă, preţul unei tranzacţii se
realizează acolo unde cererea întâlneşte oferta.
Cu cât cererea este mai mare decât oferta, adică cei care vor să cumpere o acţiune sunt mai
mulţi decât cei care vor să o vândă, cu atât preţul va creşte şi invers, dacă pentru o acţiune
oferta este mai mare decât cererea, adică cei care vor să vândă sunt mai mulţi decât cei care
vor să cumpere, atunci preţul va scădea.
Prețul de închidere este prețul final la care se tranzacționează un titlu de valoare într-o
anumită zi de tranzacționare. Prețul de închidere reprezintă cea mai actualizată evaluare a
unui titlu de valoare până când tranzacția începe din nou în următoarea zi de tranzacționare.
Cele mai multe instrumente financiare sunt tranzacționate după ore (deși cu niveluri de volum
și lichiditate semnificativ mai reduse), astfel încât prețul de închidere a unui titlu de valoare
poate să nu corespundă prețului său după ore.
Scurtă descriere a companiei
The Coca-Cola Company (NYSE: KO) este cea mai mare companie producătoare de băuturi
răcoritoare din lume, cel mai mare producător, distribuitor și comercializant de băuturi ne-
alcolice și siropuri din lume, și una dintre cele mai mari corporații din SUA. Compania este
cunoscută în special datorită produsului ei cel mai renumit Coca-Cola, inventat de John Stith
Pemberton în 1886.
2.Datele inițiale
Figură 1Datele inițiale

2.2 Rezultatele empirice ale cercetării
2.2.1.Analize descriptive preliminare asupra seriei(statistici

elementare,Grafice)
2.2.1.1 Graficul seriei
Figură 2Reprezentarea grafică a seriei inițiale
În graficul de mai sus pe axa ox avem lunile pentru perioada 2008-2018,iar pe axa oy prețul
de închidere al acțiunilor Coca Cola scalate între 20 și 52 $/acțiune.Observăm că în timpul
crizei începând cu luna martie a anului 2008 ,prețul de închidere al acțiunilor scade de la
30.4$/acțiune la 20.4$/acțiune în luna februarie a anului 2009,atingând un minim istoric.Din
2009 și până în 2018 seria are un trend crescător,însă mai apar și mici fluctuații.Prețul maxim
înregistrat este în luna noiembrie a anului 2018 și a atins valoarea de 50.4Din grafic putem
concluziona că seria nu este staționară.
2.2.1.2 Statistici descriptive
Figură 3Statistici elementare
În medie prețul mediu de închidere al acțiunilor Coca Cola este de 36.86 $/acțiune.Prețul
maxim înregistrat este de 50.4 $/acțiune în luna noiembrie a anului 2018.Prețul minim
înregistrat este de 20.42$/acțiune în luna februarie a anului 2009.Mediana împarte seria în
două părți egale,50% din prețurile de închidere al acțiunilor Coca Cola sunt sub
39.16$/acțiune,iar 50% din acestea sunt peste 39.16$/acțiune.Abaterea standard este 7.45 este
destul de mică comparativ cu media,deci valorile nu se abat așa mult de la medie.
Coeficientul de asimetrie este -0.53<0,asta înseamnă că avem o asimetrie la stânga a

seriei,adică predomină prețurile de închidere mari cu frecvențe ridicate.
Coeficientul de aplatizare este 2.11<3,asta înseamnă că distribuția este una

platicurtică,valorile fiind destul de eterogene și împrăștiate față de medie.
Jaque-Bera, ipoteze:
H0:seria are distribuție normală
H1:seria nu are distribuție normală
Jaque-Bera urmează o distribuție chi pătrat cu 2 grade de liberate.
Valoarea statisticii testului este: JB=10.50.

Probabilitatea(JB)=0.005<0.05,asta înseamnă că resping H0 și accept H1, seria nu are o

distribuție normală.
Etapele metodologiei Box-Jenkins:
Etapa 0:Testarea staționarității seriei și staționarizarea dacă este cazul
Pentru ca o serie să fie staționară momentele de orice ordin trebuie să fie constate în timp.
O serie este nestaționară când media nu este constantă în timp, valorile având destul de multe
fluctuații de-a lungul timpului în jurul mediei și varianța nu e constantă în timp.
Analiza staționarității presupune:
 Analiza corelogramei
 Testul Bartlett,Ljung-Box
 Testele rădăcină unitate-Augmented Dicky Fuller(ADF)
 Analiza corelogramei
Figură 4Corelograma seriei inițiale

Forma corelogramei ne oferă informații cu privire la staționaritatea seriei.Coeficienții de

autocorelație,notați în Eviews cu AC, pornesc de la valori foarte mari, la lag-ul 1 valoarea
acestuia fiind ρ1=0.968, iar la lag-ul 5 ρ5=0.871,care încă e mai mare decât 0.7.Valorile
coeficienților scad destul de lent ,asta înseamnă că seria este nestaționară.Coeficienții de
corelație parțială(PAC) se anulează după lag-ul 1.
Pentru acuratețe seriile financiare se logaritmează.În continuare vom lucra pe seria

logaritmată.
Pentru logaritmare parcurgem următorii pași:
Pas 1.Accesăm seria de date
Pas 2.Accesăm butonul proc,din bara de instrumente
Pas 3.Accesăm Generate Series by Equation
Pas 4.Enter equation:close=log(close)
Figură 5 Logaritmare serie

Figură 6Corelogramă serie logaritmată
Forma corelogramei ne oferă informații cu privire la staționaritatea seriei.Coeficienții de

autocorelație,notați în Eviews cu AC, pornesc de la valori foarte mari, la lag-ul 1 valoarea
acestuia fiind ρ1=0.971, iar la lag-ul 5 ρ5=0.875,care încă e mai mare decât 0.7.Valorile
coeficienților scad destul de lent ,asta înseamnă că seria este nestaționară.Coeficienții de
corelație parțială(PAC) se anulează după lag-ul 1.
 Testul Bartlett
Se utilizează pentru a vedea dacă coeficienții de autocorelație sunt semnificativi statistic
1
Pentru n suficient de mare: ρk ∼ N (0 ; )
n
 Dacă ρk ϵ (−1.96∗1 / √ n ; 1.96∗1/ √ n),asta înseamnă că ρk coeficientul de

autocorelațienu e statistic semnificativ diferit de 0.
 Dacă ρk ϶(−1.96∗1/ √ n ; 1.96∗1 / √n),asta înseamnă că ρk coeficientul de
autocorelație este statistic semnificativ diferit de 0 și se respinde H0 în
favoarea lui H1.
Ipotezele testului :
H0: ρk =0−nu e semnificativ statistic
H1: ρk ≠ 0−e semnificativ statistic
Calcului intervalului:(−1.96∗1/ √ 132; 1.96∗1/ √ 132)-(−0.1706 , 0.1706)
Coeficienții de autocorelație ρ33=0.168 , ρ34=144, ρ35=0.128, ρ36 =0.110 aparțin intrvalului

(−0.1706 , 0.1706),deci sunt semnificativi statistic,însă restul coeficiențiilor ρ1până la ρ32 nu
aparțin acestui interval,deci coeficienții sunt semnificativi diferiți de 0.Se va respinge ipoteza
H0 și se acceptă H1,asta înseamnă că seria nu este staționară.
 Testul Ljung-Box
Ipoteze:
H0: ρ1= ρ2=…=¿ ρ =0− seriaeste sta ț ionar ă ¿

m
H1:ⱻ ρi ≠ 0 ,i=1 , m
m
Statistica testului:Q*=n(n+2)*∑ ^ρk /n-k∼χ2,m
k =1
m=15
Q*15=1385.5
Prob=0.000<0.05=>Se respinge H0 și se accepta H1,ceea ce înseamnă că coeficientul este

semnificativ statistic și seria este nestaționară.
 Testele rădăcină unitate-Dickey-Fuller
Pornind de la un proces Random Walk, se estimează modelul: y t =¿𝜌 y t −1 + ε t /− y t −1(Dacă

𝜌=1-yt ARE RĂDĂCINĂ UNITATE și yt este NESTAȚIONARĂ).
Dyt =( ρ−1 ) ¿ y t −1+ ε t =¿ y t −1 + ε t
potezele Unit-Root:
H0:δ=0( ρ=1¿ =>seria yt ARE RĂDĂCINĂ UNITARĂ-ESTE NESTAȚIONARĂ

H1: δ<0( ρ<1 ¿=>Seria yt este STAȚIONARĂ
Testele Dickey-Fuller -3 forme:
1. Fără trend și fără termen liber : Dyt = δ* y t −1 + ε t
2. Fără trend, dar cu termen liber: Dyt =μ+δ* y t −1 + ε t
3. Cu trend și cu termen liber: : Dyt =μ+λ*t+δ* y t −1 + ε t
Statistica τ(tau):
τ =δ/Se(δ)
 ADF(Augmented Dickey Fuller) fără trend și termen liber
Figură 7 ADF serie inițială-NONE
Ecuația modelului: DCLOSEt=0.001267*CLOSE-0.243725* DCLOSE t−1
 ADF(Augmented Dickey Fuller) fără trend dar cu termen liber

Figură 8ADF(Augmented Dickey Fuller) fără trend dar cu termen liber
DCLOSEt=0.046576-0.011690*CLOSE-0.235657* DCLOSE t−1
 ADF(Augmented Dickey Fuller) cu trend și cu termen liber

Figură 9ADF(Augmented Dickey Fuller) cu trend și cu termen liber
DCLOSEt=0.322018+0.000559*t-0.098958*CLOSE-0.199337* DCLOSE t−1
Tabel 1 Sinteză rezultate teste ADF
Teste ADF cu ADF cu ADF fără trend și

trend+intercept constantă(intercept) constantă
Statistica τ(tau) -2.400485 -0.672373 1.194018
Valoar 1% -4.030157 -3.481217 -2.582872
5% -3.444756 -2.883753 -1.943304
e
10% -3.147221 -2.578694 -1.615087
critică
P-value-Prob* 0.3776 0.8489 0.9400
Probabilitatea ADF cu trend și constantă este 0.3776>0.05=>se acceptă H0 și nu avem

suficiente dovezi statistice să respingem H1.De aici rezultă că seria are rădăcină unitate și
este nestaționară
Dacă | τcalc |<|τcrit|=>acceptăm H0,seria e nestaționară

Dacă |τcalc|>|τcrit|=>respingem H0,acceptăm H1 ,serie staționară
Pentru ADF cu trend+intercept:
|-2.400485|<|-4.030157|
|-2.400485|<|-3.444756|
|-2.400485|<|-3.147221|
=>din toate 3 că se acceptă H0 și seria este nestaționară.
Probabilitatea ADF cu constantă(intercept) este 0.8489>0.05=>se acceptă H0 și nu avem

suficiente dovezi statistice să respingem H1.De aici rezultă că seria are rădăcină unitate și
este nestaționară
|-0.672373|<|-3.481217|
|-0.672373|<|-2.883753|
|-0.672373|<|-2.578694|
Probabilitatea ADF fără trend și constantă(intercept) este 0.9400>0.05=>se acceptă H0 și

nu avem suficiente dovezi statistice să respingem H1.De aici rezultă că seria are rădăcină
unitate și este nestaționară
|1.194018|<|-2.582872|
|1.194018|<|-1.943304|
|1.194018 |<|-1.615087|
Utilizând cele trei forme ale lui Dickey Fuller(unit root) pentru testarea staționarității
seriei de timp a rezultat că seria este nestaționară și trebuie staționarizată.
Staționarizarea seriei prin aplicarea operatorului de diferențiere.
Formula de diferențiere a seriei în Eviews este: series CLOSE_dif1=CLOSE-CLOSE(-1)

Am aplicat diferențierea tot pe seria logaritmată.
Datele diferențiate
Figură 10Datele diferențiate

Figură 11Graficul seriei diferențiate
Din graficul de mai sus putem observa că valorile oscilează în jurul valorii 0,nu se mai
poate identifica un trend,oscilațiile fiind destul de apropiate între ele.Media și varianța
fiind constante, graficul de mai sus ne indică faptul că seria este staționară.
Pentru a verifica dacă seria diferențiată este staționară aplicăm testele rădăcină unitate.
 Testele rădăcină unitate-Dickey-Fuller
potezele Unit-Root:
H0: δ=0( ρ=1¿ =>seria close_dif1t ARE RĂDĂCINĂ UNITARĂ-ESTE NESTAȚIONARĂ
H1: δ<0( ρ<1 ¿=>Seria close_dif1t este STAȚIONARĂ
 ADF(Augmented Dickey Fuller) fără trend și termen liber

Figură 12 ADF serie diferențiată
Probabilitatea ADF fără trend și constantă(intercept) este 0.0000<0.05=>se respinge H0 și se

acceptă H1.De aici rezultă că seria este staționară.
|-14.29029|>|-2.582872|
|-14.29029|>|-1.943304|
|-14.29029|>|-1.615087|
=>din toate 3 că se respinge H0 și se acceptă H1,iar seria este nestaționară.
Ordinul se integrare al seriei CLOSE este 1 ∼I(1).
Aplicând testul ADF seriei diferențiate ,seria close_dif1 a devenit staționară în urma aplicării
operatorului de diferențiere.
ETAPA 1.Identificarea modelelor posibile AR,MA,ARMA care se potrivesc pe

corelograma seriei staționare.
Figură 13Corelograma seriei staționare
Pe baza corelogramei de mai sus, putem estima următoarele modele:
AR(1), MA(1), AR(7), MA(7), ARMA(1,1),ARMA(7,7),AR(1,7),MA(1,7)
Dintre aceste modele, il vom alege pe cel care indeplineste urmatoarele conditii:
a. Parametrii modelului sunt semnificativ diferiti de zero;

b. Criteriile informationale Akaike si Schwarz au valori minime.
ETAPA 2.Estimarea(Estimarea parametrilor modelelor AR,MA,ARMA identificate pe

baza ACF/PACF)
Figură 14 AR(1)
Figură 15 MA(1)
Figură 16 ARMA(1,1)
Figură 17 ARMA(7,7)
Figură 18AR(7)
Figură 19 MA(7)
Tabel 2 Ecuațiile proceselor
Proces Ecuația proceselor estimate

AR(1) ^z t=0.003791−0.243270 z t−1
MA(1) ^z t=0.003713−0.210491 ε^ t −1
ARMA(1,1 ^z t=0.003574−0.950395 z t −1−0.926660 ε^ t −1
)
ARMA(7,7 ^z t=0.005669−0.309959 z t−1 +0.156904 z t−7 +0.058558 ε^ t−1−0 .542937 ε^ t−7
)
AR(7) z^ t=0.004622−0.2443189 z t−1−0.249703 z t−7
MA(7) ^z t=0.004654−0.172470 ε^ t−1−0.431421 ^ε t−7
Etapa 3.Diagnosticarea modelelor și alegerea celui mai bun model
Testarea semnificației coeficienților :
Ipoteze
H0: β j =0 nu e semnificativ statistic
H1: β j ≠ 0 e semnificativ statistic
Prob
c 0.2160
AR(1) 0.0057
Prob(c)=0.2160>0.05=>se acceptă H0=>constanta nu este semnificativ statistic
Prob(AR(1))=0.0057<0.05=>se respinge H0,se acceptă H1 =>AR(1) este semnificativ

statistic
Tabel 3 Coeficienți MA(1)
Prob
c 0.2163
MA(1) 0.0162

Prob(MA(1))=0.0162<0.05=>se respinge H0,se acceptă H1 =>MA(1) este semnificativ

statistic
Prob
c 0.3308
AR(1) 0.000
MA(1) 0.000
Prob(AR(1))=0.0000<0.05=>se respinge H0,se acceptă H1 =>AR(1) este semnificativ

statistic
Prob(MA(1))=0.000<0.05=>se respinge H0,se acceptă H1 =>MA(1) este semnificativ statistic
Prob
C 0.0013
AR(1) 0.1272
AR(7) 0.3735
MA(1) 0.7499
MA(7) 0.0009
Prob(AR(1))=0.1272>0.05=>se acceptă H0=>AR(1) nu este semnificativ statistic
Prob(AR(7))=0.3735>0.05=>se acceptă H0=>AR(7) nu este semnificativ statistic
Prob(MA(1))=0.7499>0.05=>se acceptă H0=>MA(1) nu este semnificativ statistic
Prob(MA(7))=0.0009<0.05=>se respinge H0,se acceptă H1=>MA(7) este semnificativ

statistic
Prob
C 0.0658
AR(1) 0.0053
AR(7) 0.0041
Prob(AR(1))=0.0053<0.05=>se respinge H0,se acceptă H1=>AR(1) este semnificativ statistic

Prob(AR(7))=0.0041<0.05=>se respinge H0,se acceptă H1=>AR(7) este semnificativ statistic
Prob
C 0.0031
MA(1) 0.0253
MA(7) 0.0000
Prob(c)=0.0031<0.05=>se respinge H0,se acceptă H1=>constanta este semnificativ statistic

statistic

statistic
Tabel 4 Criterii informaționale
Proces Akaike(AIC) Schwarz(SC)

AR(1) -3.430119 -3.386003
MA(1) -3.429347 -3.385451
ARMA(1,1) -3.466968 -3.400794
ARMA(7,7) -3.568794 -3.455073
AR(7) -3.508415 -3.440182
MA(7) -3.508381 -3.442537
Conform criteriilor informaționale AIC și SC a rezultat faptul că cel mai bun model pe
seria în cauză este MA(1).Coeficientul lui MA(1) este semnificativ statistic,iar interceptul
nu este semnificativ statistic.
Pe baza modelului MA(1) vom realiza previziunile.
Testarea validității modeluluiestimat pe baza autocorelării reziduurilor cu ajutorul

corelogramei reziduurilor Q-statistics
Figură 20 Corelograma rezidurilor pentru un MA(1)
Pe baza probabilităților rezidurilor putem observa că avem reziduri care sunt atât
semnificative cât și nesemnificative ,asta înseamnă că rezidurile nu sunt autocorelate ,iar
modelul este valid.
Figură 21 Histograma rezidurilor
Media rezidurilor este zero.
Figură 22 Valoare actuala VS Teoretica
Din figura de mai sus putem observa faptul că valoarea actuală se apropie destul de mult de
valoarea teoretică.
Figură 23 Radăcina MA(1)
Rădăcina lui MA(1) este în interiorul cerucului unitate,deci seria este staționară.
Etapa 4.Efectuarea de prognoze
Previziunea se va realiza pe baza modelului MA(1),valid.Prognozele se vor realiza pentru

anul 2019.
Figură 24 Prognoza statică

Root Mean Squared Error este 0.042 ,o valoare destul de mică.
Mean Abs. Error este 0.033 și de această dată valoare este mică.
Mean Abs. Percent Error este 0.94 este foarte mare.
Theil îmi arată calitatea previziunii,iar în cazul de față valoare acestuia este de 0.0059,care
este foarte aproape de 0,deci calitatea previziunii este destul de bună.
Bias proportion este 0 și reprezintă diferența dintre media valorii previzionate și media valorii
actuale.
Variance Proportion este 0.0017,valoare ce este destul de apropiată de 1 și arată cât de departe
este ecartul dintre varianța previzionată și cea actuală.
Covariance proportion este 0.9982,valoare ce este foarte apropiată de 1 și arată influența altor
factori nesistematici care determină eroarea de previziune.
Suma celor 3 măsuri amintite mai sus este 1.
Figură 25 Previziune dinamică

În cazul previziunii dinamic erorile sunt încă destul de mici.
Thail este încă aproape de 0,deci calitatea previziunii este destul de bună.
Bias-ul este apropiat de 0,deci diferența dintre media valorilor previzionate și media valorilor
actuale este încă destul de mică.
Variance proportion crește destul de mult și depășește chiar varianța.
Rezultatele prin previziunea dinamică sunt mai slabe decât cele prin previziunea statică.
Observăm că prognozând prețurile de închidere ale companiei Coca Cola pe anul 2019 trendul
ascendent al acestuia se menține în continuare.Compania a avut din anul 2008 și până în
prezent o creștere a prețurilor continuuă cu mici fluctuații în unele perioade.
Figură 26 Valorile previzionate pe 2019 aplicate seriei logaritmate

Aplicatia 2
Să se modeleze o serie caracterizată de sezonalitate utilizând modele din categoriile

medii mobile, modele de netezire exponentiala (H-W, seasonal H-W) sau SARIMA. Efectuați
previziuni pe baza modelului optim.
2.1. LITERATURE REVIEW
Un studiu de caz, realizat cu ajutorul modelului SARIMA a fost gasit în articolul

“Forecasting mortality of road traffic injuries in China using seasonal autoregressive
integrated moving average model”7 elaborat în februarie 2015, are ca scop dezvoltarea unor
modele statistce pentru realizarea prognozelor deceselor cauzate de traficul rutier și să
analizeze sezonalitatea deceselor înregistrate din China. Modelul SARIMA a fost folosit
pentru obținerea unor date relevante pentru perioada 2000-2011, iar coeficienții criteriilor
Akaike și Bayesian au fost folosiți pentru a evalua modelele construite, iar ulterior s-au
obținut date pentru a previziona decesele anului 2012.
Iar in cadrul articolului “Time series SARIMA models for average monthly solar
radiation in Malaysia”8 s-a urmărit prognoza pentru radiațiile solare necesare pentru
producerea de energie în două orașe din Malaysia. Rezultatele obtinute fiind adecvate s-a
continuat prognoza verificandu-le si astfel, s-a demonstrat ca modelul SARIMA a fost
eficient si pentru obtinerea acestor progrnoze.
In continuare vom modela seria de timp referitoare la numărul de acțiuni

tranzactionate de firma Adecoagro, din perioada iunie 2015-mai 2019, ce conține un număr
de 59 observații , utilizând modele SARIMA și modele de netezire exponențială (H-W,
seasonal H-W). De asemenea, se vor compara modelele și pe baza modelului validat, se vor
face previzuni privind interpretarea economică a rezultatelor.
7
Xujun Zhang; “Forecasting mortality of road traffic injuries in China using seasonal autoregressive integrated
moving average model”; Chine; Annals of Epidemiology, Volume 25, Issue 2, p 101-106
8
Mira Syahirah Kamil, “Time series SARIMA models for average monthly solar radiation in Malaysia”;
Malaysia;
In cele ce urmeaza se va aplica procedeul Box – Jenkins pentru determinarea specificației

ARIMA cu sezonalitate (SARIMA). Astfel, construirea unui model de tip SARIMA
presupune următoarele etape:
1) Staționarizarea seriei de timp prin diferențiere (în cazul în care este nestaționară)
2) Studiul tiparelor din funcțiile de autocorelație și autocorelație parțială pentru adetermina
dacă lag-urile seriei staționarizate și/sau lag-urile erorilor de previziune ar trebui incluse în
ecuația de previziune
3) Testarea validității modelului estimat
4) Generarea de previziuni
Analiza stationarității seriei de date se realizează în EViews prin una dintre următoarele
metode:
1) Analiza corelogramei seriei de date cu ajutorul funcției de autocorelație ACF și

autocorelație parțială PACF
2) Teste pentru depistarea prezenței rădăcinii unitate – Augmented Dickey Fuller.
2.2.METODOLOGIA CERCETARII
Sezonalitatea într-o serie de timp este un model regulat de modificări care se repetă pe
perioade de timp S, unde S definește numărul de perioade de timp, până când modelul se
repetă. De exemplu, există sezonalitate pentru date lunare pentru care valori ridicate tind
întotdeauna să apară în unele anumite luni ale anului și valori scăzute tind să apară in alte
luni. În acest caz, S = 12 (luni pe an) este durata de comportament sezonier periodic. Pentru
datele trimestriale, S = 4 perioade de timp pe an.
Exploatarea seturilor mari de date sezoniere este un domeniu de cercetare extrem de

utilizat in ultima perioada. Pe baza seriilor de timp au fost identificate oportunități de a
detecta și pentru a prezice evenimente viitoare pe baza celor observate anterior.
Într-un model ARIMA sezonier, AR sezoniera si termenii MA previzioneaza x t folosind

valori date și erori uneori cu lag-uri care sunt multipli de S.
 Cu datele lunare (și S = 12), un model sezonier autoregresiv de ordinal 1 ar folosi x t−12
pentru a prezice x t . De exemplu, dacă am vinde ventilatoare am putea prezice

vanzarile in luna august folosind vânzările din august ale anului trecut.
 Un model sezonier autoregresiv de ordinal 2 ar folosi x t−12 si x t−24 pentru a previziona
x t . In acest caz am previziona vanzarile din luna august folosind date despre vanzarile
din luna august pentru ultimii doi ani.
 Un model de ordinul 1 MA(1) cu S=12 ar folosi x t−12 ca un predictor. Un model de
ordinul 2 MA(2) ar folosi x t−12 si x t−24 .
Aproape prin definiție, ar fi necesar să se examineze datele diferentiate atunci când avem
caracter sezonier. Sezonalitatea, de obicei, face ca seria sa fie nestaționară, deoarece valorile
medii la anumite momente particulare în intervalul sezonier (luni, de exemplu) pot fi diferite
de valorile medii la alte momente. De exemplu, vânzările de inghetata sau de ventilatoare vor
fi întotdeauna mai mare în lunile de vară.9
SARIMA sau ARIMA sezoniera, este o extensie a ARIMA care acceptă în mod explicit
serii de timp univariabile cu o componentă sezonieră. Aceasta adaugă trei noi parametrii
pentru a specifica: autoregresie (AR), diferenierea (I) și media mobilă (MA) pentru
componenta sezonieră a seriei, precum și un parametru suplimentar pentru perioada de
caracterul sezonier.
Modelul sezonier ARIMA10 încorporează atât factori non-sezonieri și sezonieri într-un model
multiplicativ. O notație prescurtare pentru modelul este:
ARIMA (p,d,q)×(P,D,Q)S
unde P = numărul de termeni sezonieri autoregresivi (SAR), D = numărul de diferențe
sezoniere, Q = numărul de termeni sezonieri de medie mobilă (SMA).
În identificarea unui model de tip SARIMA, primul pas este determinarea necesității
unei diferențieri sezoniere (de la sezon la sezon sau de tipul Yt – Yt-12), pe lângă sau în locul
unei diferențieri non-sezoniere. Prin urmare, vom analiza graficele modelelor, funcția de
autocorelație și funcția de autocorelație parțială pentru a determina toate combinațiile posibile
de diferențieri non-sezoniere de ordin 0 și 1 și de diferențieri sezoniere de ordin 0 și 1.
9
newonlinecourses.science.psu.edu
10
computer-trading.com/a-gentle-introduction-to-sarima-for-time-series-forecasting
Semnătura unui comportament de tip pur SAR sau pur SMA este similar cu semnătura
unui comportament pur AR sau pur MA, cu excepția faptului că acest tipar apare la multiplii
de lag s în funcția de autocorelație ACF și în funcția de autocorelație parțială PACF. De
exemplu, un proces SAR (1) pur are valorile extreme ale funcției de autocorelație ACF la
lagurile s, 2s, 3s, etc., în timp ce PACF doar va descrește după lag-ul s.
În schimb, un proces SMA (1) pur are valorile extreme ale funcției de
autocorelație parțială PACF la lagurile s, 2s, 3s, etc., în timp ce ACF doar va descrește după
lag-ul s.
O semnătură SAR apare de obicei atunci cand autocorelația la perioada sezonieră este
pozitivă, în timp ce o semnătură SMA apare de obicei atunci când autocorelația la perioada
sezonieră este negativă, de aici fiind derivată o nouă regulă:
Dacă autocorelația la perioada sezonieră este pozitivă, se ia în considerare adăugarea la model

a unui termen SAR. Dacă autocorelația la perioada sezonieră este negativă, se ia în
considerare adăugarea la model a unui termen SMA. Se încearcă evitarea amestecării
termenilor SAR și SMA în același model, precum și evitarea folosirii a mai mult de un
termen.
De obicei, este suficient un singur termen de tip SAR (1) sau SMA (1). Foarte rar se poate
întâlni un proces SAR(2) sau SMA(2) real, și, și mai rar aceste modele au suficiente date
pentru a estima 2 sau mai mulți coeficienți sezonieri fără ca algoritmul de estimare să intre
într-o buclă de feedback.
Deși un model SARIMA pare a avea doar câțiva parametri, modelul de previziune necesită
estimarea parametrilor impliciți din unul sau din două sezoane pentru a putea fi inițializat.
Prin urmare, ar trebui să avem cel puțin 4 sau 5 sezoane de date pentru a putea modela un
model SARIMA.
Probabil cel mai frecvent utilizat model de tip SARIMA este modelul (0,1,1) x (0,1,1), adică
modelul MA(1) x SMA (1) care conține o diferențiere sezonieră și una non-sezonieră. Aceasta
este, în esență, un model de „netezire exponențială cu sezonalitate”.
Modelul SARIMA este extrem de folosit în predicțiile recente ce doresc a oferi soluții pentru
problemele reale cu care ne confruntăm zilnic.
2.3.APLICAȚIE
2.3.1 DESCRIEREA DATELOR
Pentru cercetare am ales să modelăm seria de timp referitoare la volumul tranzacționat

de compania din domeniul agriculturii, Adecoagro SA. Perioada analizată 1.06.2014 și până
în prezent, avand astfel 59 de observații.
Adecoagro SA, înființată la 17 iunie 2010, este o societate holding si funcționeaza în

activitățile agricole și agro-industriale. Compania este implicată într-o serie de întreprinderi,
inclusiv culturile agricole și alte produse agricole, operațiuni de producere zahăr, etanol și
producția de energie și de transformare a terenurilor. Compania este organizată în trei linii
principale de afaceri: agricultura, transformarea terenurilor și operatiuni de producer zahăr,
etanol și energie.
Activitățile sale agricole constau din anumite produse agricole de recoltare, inclusiv
culturile (soia, porumb și grâu), orez dur și trestie de zahăr, de vânzare către terți și pentru uz
intern ca intrări în diferite procese de fabricație, și care produc lapte crud. Activitățile de
producție ale companiei constau în vânzarea de produse fabricate, inclusiv orezul prelucrat,
zahăr, etanol și energie, printre altele, și furnizarea de servicii, cum ar fi depozitarea de
cereale, condiționarea și servicii de manipulare și uscare.
Activitățile sale de transformare a terenurilor constau în achiziționarea de terenuri
agricole sau întreprinderi cu terenuri agricole subdezvoltate sau insuficient utilizate dupa care
pun in aplicare tehnologia de producție și anumite practici agricole pentru a spori
randamentele și de a crește valoarea terenului. Compania detine un total de aproximativ
246130 de hectare, constând din peste 20 de ferme din Argentina, 10 ferme în Brazilia și o
fermă din Uruguay. In plus, compania deține și operează facilități de producție agro-
industriale, inclusiv peste trei instalații de prelucrare a orezului din Argentina, aproximativ
două unități de lapte cu aproximativ 6750 de vaci de muls din Argentina si peste 10 plante de
cereale și orez condiționat și de depozitare din Argentina
Introducem datele în EVIEWS :
Figure 1 Primele observatii
Figure 2 Ultimele observatii

Figure 3 Grafic volume
Analizând graficul de mai sus putem observa că există o tendință crescătoare, iar
trendul nu este neted, el având fluctuații. Acest lucru se traduce prin faptul că volumul
tranzacționat al companiei a crescut major în ultimii 5 ani. Graficul din figura 3 ne prezintă
faptul că seria este nestaționara.
2.3.2 STATISTICI DESCRIPTIVE
In continuare, realizam histograma și statisticile descriptive:
Figure 4 Histograma statistici descriptive

Valoarea minimă a volumul de produse AGRO a fost de 1273200, iar valoarea

maximă este de 6468800. Compania are, în medie, volumul producției de 4456969. Valoarea
medie a volumului de producție este apropiată de cea mediană 4827100 ceea ce îndică că
volumul mediu de producție al companiei este reprezentativ.
Abaterea standard are valoarea 1472623, ceea ce implică faptul că volumul de producție se
abate, în medie cu aceasta valoare față de indicatorii tendinței central/
Putem întâlni valori cu asimetrie la dreapta sau la stanga, în funcție de pozitivitate sau
negativitate. Valoarea coeficientului de asimetrie, skewness este de -0.76, o valoare negativă,
asta înseamnă asimetrie la stanga. Prin acest coeficient intelegem că volumele de producție
înregistrează in general valori mari.
Indicatorul kurtosis-ul este utilizat în analiza distribuției unei serii pentru a înregistra gradul
de aplatizare sau boltire al acesteia. Valoarea coeficientului de boltire este 2.61, o valoare
mai mică decât 3, aşadar plaja de valori specifice numărului de produse comandate este una
destul de mare, fapt ce se observă şi între diferenţa mare dintre minim şi maxim.
2.3.3 CORELOGRAMA SI TESTUL ADF

Figure 5 Corelograma volum
Din corelograma de mai sus putem observa fluctuațiile seriei, valorile descresc astfel
destul de slab, acest lucru indică nestaționaritatea seriei.
Vom verifica staționaritatea seriei de date prin aplicarea testului Unit-Root, forma
corectă fiind cea fără trend, cu termen liber.
Ipotezele testului sunt:
H0: Volumul are rădăcină unitate
H1: Volumul nu are rădăcină unitate

Figure 6 Unit Root Test
Aplicăm testul Augmented Dickey-Fuller unde avem o probabilitate (Prob*) de 0,27, o

valoare mai mare decât 0,05, ceea ce indică acceptarea ipotezei nule , seria fiind nestaționară.
Ipoteze:
H0: | τcalc| < | τcrit| (serie nestaționară)
H1: | τcalc| > | τcrit| (serie staționară)
Valorile critice înregistrate în modelul nostru sunt -3,55, -2,91 și -2,59 iar valoarea lui t calculat este
de -2,025.
Putem observa că pentru toate pragurile de semnificație 1%, 5% și 10% valoarea absolută
a lui t critic este mai mare decât valoarea absolută a lui t calculat , ceea ce indică o serie nestaționară.
2.3.4 STATIONALIZARE
Staționalizăm seria de date folosind formula: series y=d(volume,1,12).

Figure 7 Grafic serie stationara
Conform graficului de mai sus seria noastră pare a fi staționară, însă pentru a ne
asigura vom folosim de testul Unit Root, în urma căruia urmărim să avem coeficientul
nesemnificativ statistic.
Ipoteze:
H0: y are rădăcină unitate
H1: y nu are rădăcină unitate

Figure 8 Test Unit Root pentru datele stationare
Conform Unit Root test, probabilitatea (Prob*) este 0 < 0.05, ceea ce înseamnă ca
avem o serie de date staționară. De asemenea, valoarea absolută a t calculat este mai mare decât
valorile absolute din dreptul pragurilor 1%, 5% și 10% , fapt ce implică staționaritatea.
Figure 9 Corelograma serie stationara

Fluctuațiile de valori din dreptul lagurilor sunt mai lente, înseamnă că seria a devenit
staționară și putem să continuam prin alegerea celui mai bun model SARIMA.
2.3.5 ALEGEREA CELUI MAI BUN SARIMA
Pentru alegerea celui mai bun SARIMA am identificat cel mai mare lag după valorea
lagului 1 din corelograma seriei de date diferențiate. Aceasta este lagul 4 pe care îl vom folosi
pentru următoarele 3 modele :
Figure 10 AR(1) SAR4) MA(1)
Figure 11 AR(1) AR(4) SAR(4) MA(1)

Figure 12 AR(1) AR(4) SAR(4) MA(1) MA(4)
Pentru cele 3 modele am ales sa reţinem valorile Adjusted R-squared si Akaike Info
criterion (AIC) pentru alegerea celui mai bun model.
Dintre modelele anterioare vom alege doar unul singur pe care îl vom folosi ulterior în
previzionare. Pentru a compara modelele și pentru a stabili care este cel mai bun, vom utiliza
drept criterii maximizarea lui Adjusted R-squared și minimizarea lui AIC. Practic, vom
verifica fiecare model și vom reține pentru fiecare valorile Adjusted R-squared și AIC. La
sfârșit vom alege acel model pentru care Adjusted R-squared este cel mai mare, iar AIC este
cel mai mic.
MODEL Adjusted R-squared AIC

AR(1) SAR(4) MA(1) 0.698 27.79
AR(1) AR(4) SAR(4) MA(1) 0.556 28.22

AR(1) AR(4) SAR(4) MA(1) 0.475 28.41
MA(4)
Modelul ales este acela pentru care avem AR(1) SAR(4) MA(1) deoarece Adj. R
squared are valoarea cea mai mare(0.698) si AIC valoarea cea mai mica(27.79).
2.3.6 TESTAREA VALIDITATII MODELULUI

Testarea autocorelării reziduurilor se realizeaza cu ajutorul corelogramei reziduurilor Q-
statistics.
Figure 13 Corelograma reziduurilor
Reziduurile Q-statistics sunt nesemnificative pentru toate lag-urile neindicând

corelație semnificativă între reziduri, ceea ce înseamnă că avem zgomot alb. Pentru toate
lagurile putem observa ca avem probabilitățile mai mari de 0.05 și, de asemenea valorile lui
Q-stat sunt mai mari decât probabilitățile, ceea ce ne asigură validitatea modelului.
2.3.7 TEST HOMODESCEDASTICITATE
Ipoteza de homoscedasticitate se testează prin intermediul testului ARCH- LM.

Conform testului ARCH LM, probabilitatea Chi-Square este 0,7343 > 0.05, ceea ce înseamnă
că se acceptă ipoteza nulă, așadar erorile sunt homoscedastice.
Figure 14 Test homoscedasticitate reziduuri
Normalitatea erorilor
Normalitatea erorilor se testează cu ajutorul testului Jarque Berra.

Ipotezele testului sunt:
H0: Erorile sunt normal distribuite
H1: Erorile nu sunt normal distribuite
Cum Probability este 0.21, este mai mare decât 0,05, se accepta ipoteza nula și rezultă că
erorile sunt distribuite normal.
Figure 15 Test Jarque Berra

2.4. MODELAREA SERIEI DE DATE UTILIZAND MODELE DE NETEZIRE

EXPONENTIALA
Vom estima două modele diferite, cu scopul de a alege un cel mai bun model iar apoi
îl vom compara cu modelul obținut prin metodologia de la Pasul I, scopul final este acela de a
efectua prognoze.
Pentru metoda Holt-Winters de netezire exponențială, varianta multiplicativă estimăm
următorul model:
Figure 16 Model prin metoda H-W multiplicativ
Vom estima încă un model prin metoda Holt-Winters de netezire exponențială, varianta
aditivă:
Figure 17 Model prin metoda H-W aditiv

2.4.1 ALEGEREA CELUI MAI BUN MODEL
Pentru a alege cel mai bun model generat de metoda H-W compăram valorile Root
Mean Sqared Error (RMSE) şi o vom alege pe cea mai mare. Pentru modelul multiplicativ
avem o valoare RMSE de 208089.4, iar pentru modelul aditiv valoarea este de 232839.2.
Modelul preferat este cel multiplicativ.
Comparam modelul multiplicativ cu cel obtinut anterior AR(1) SAR(4) MA(1):
Model SSR
Model Holt-Winters multiplicativ 5.36E+12
Model AR(1) SAR(4) MA(1) 2.26E+12
Conform acestui tabel, modelul cel mai bun este cel Holt-Winters deoarece valoarea SSR este
cea mai mica.
Figure 18 H-W multiplicativ
2.4.2 PREVIZIUNE
Previziunea a fost realizata pentru urmatorul an. Pentru a realiza aceasta previziune am
selectat optiunea dynamic forecast. Graficul obtinut este reprezentat mai jos:
Figure 19 Dynamic Forecast
 Valoarea lui Mean Abs. Percent Error trebuie să aibă o valoare cât mai mică, în acest
caz aceasta este de 5.50.
 Valoarea Coficientul Theil trebuie să aibă valori cuprinse în intervalul (0, 1), valorile
apropiate de 0 indică o ajustare bună, în acest caz acest coeficient are valoarea 0.0377
si se incadreaza in intervalul(0,1).
 Indicatorul Bias Proportion trebuie să aibă valori cât mai mici. Putem observa că în
cazul nostru valoarea acestuia este de 0,36, fiind o valoare suficient de mica.
 Indicatorul Variance Proportion trebuie să aibă valori cât mai mici. Putem observa că
în cazul nostru valoarea acestuia este de 0,025.
 Indicatorul Covariance Proportion trebuie să aibă o valoare cât mai mare, apropiată
de 1. Putem observa că în cazul nostru valoarea acestuia este de 0,61, apropiindu-se de
1.
Vom încerca să realizăm previziunea pentru următorul an utilizând Static forecast.

 Valoarea lui Mean Abs. Percent Error trebuie să aibă o valoare cât mai mică, în acest
caz aceasta este de 5.50.
 Valoarea Coficientul Theil trebuie să aibă valori cuprinse în intervalul (0, 1), valorile
apropiate de 0 indică o ajustare bună, în acest caz acest coeficient are valoarea 0.033.
 Indicatorul Bias Proportion trebuie să aibă valori cât mai mici, in cazul nostrum fiind
0.
 Indicatorul Variance Proportion trebuie să aibă valori cât mai mici. Putem observa că
în cazul nostru valoarea acestuia este de 0,040.
 Indicatorul Covariance Proportion trebuie să aibă o valoare cât mai mare, apropiată de
1. Putem observa că în cazul nostru valoarea acestuia este de 0,959.
Comparând cele doua tipuri de previziune (Dynamic si Static) observăm că se
înregistrează valori adecvate pentru cele două tipuri de previziune.
Aplicația 3
Să se realizeze un model multivariat în care să se investigheze natura relației dintre
variabile pe baza:
 Analizei de cointegrare (dacă este cazul)
 Teste de cauzalitate Granger
 Estimare modele VAR / VECM.
3.1. LITERATURE REVIEW
Testul Johansen pentru verificarea cointegrării. Etapele metodologiei Johansen,

destinata elaborarii modelelor dinamice, sunt:
1) testarea ordinului de integrare pentru fiecare variabila;
2) legatura dintre rangul matricii si determinarea numarului relatiilor de cointegrare
3) testarea numarului relatiilor de cointegrare si estimarea acestora.
Pentru un vector (kx1) de k potențiale variabile endogene specificăm un model

autoregresiv VAR(p):
Atunci când ecuația:
are radacini in interiorul

cercului unitate, atunci unele sau toate variabilele din vectorul sunt nestationare I(1),
iar intre ele pot exista relatii de cointegrare.
Un vector de variabile integrate de acelasi ordin I(d) este cointegrat CI(d,b) cu

vectorul de cointegrare daca este integrat de ordin mai mic I(d-b). Astfel,
exista anumite combinatii liniare ale variabilelor din vector ce sunt
integrate de un ordin mai mic.
Pentru un vector ce contine doua variabile integrate I(1)
=( pentru care reziduul din regresia este stationar I(0),
vectorul de cointegrare este ; adica reziduul
este stationar.
Daca toate variabilele din vectorul =( sunt stationare I(0), atunci

se aplica metodologia clasica VAR, pentru elaborarea acestui model. Daca cel putin una din
variabile este nestationara I(1) atunci exista doua posibilitati:
(1) nu exista nici o relatie de echilibru (sau de cointegrare) intre elementele lui , caz in
care modelul costituie un sistem de regresii false,
(2) exista una sau mai multe relatii de echilibru (sau de cointegrare) intre elementele lui,
cand se are in vedere reprezentarea VECM a modelui (aceasta fiind o reprezentare VAR cu
restrictii).
Abordarea Johansen consta in identificarea a r combinatii liniare de cointegrare,
printre cele k variabile integrate, si incorporarea lor intr-un model dinamic.
Cum pot fi identificate aceste relatii de cointegrare?
Daca sunt cointegrate atunci reprezentarea VAR nu este prea adecvata pentru
analiza deoarece relatiile de cointegrare nu apar explicit. Relatiile de cointegrare devin
vizibile in reprezentarea VECM, reprezentare echivalenta cu VAR, aceasta fiind:
unde:.
iar:
Testul de cauzalitate Granger: inainte de a specifica un model pentru investitii este

important sa testam natura relatiilor existente intre variabile. Ne vom referi in continuare,
pentru simplitatea expunerii, la doua variabile Y respectiv X.
In sensul abordarii propuse de Granger (1969) X este cauza pentru Y, sau X explica pe
Y, daca X ajuta la predictia lui Y. Procedura presupune a se cuantifica cat din nivelul curent al
variabilei Y poate fi explicat prin valorile sale istorice iar apoi a se vedea daca adaugand
variabile de tipul variatia explicata creste.
Analiza cauzalitatii intre doua variabile presupune parcurgerea etapelor de mai jos.
ETAPA 1) Pentru a testa daca X este cauza pentru Y, in sens Granger, se estimeaza ecuatia
de regresie:
(u)
unde k este fixat astfel incat erorile sa fie zgomot alb. Relativ la aceasta ecuatie,
ipoteza nula respectiv alternativa sunt:
, X nu este cauza pentru Y,
Testarea ipotezei precedente se realizeaza utilizand un test de tip Fisher-Snedecor

construit astfel:
unde si reprezinta suma patratelor reziduurilor respectiv coeficientul de
determinatie in ecuatia fara restrictii (u) iar si sunt aceleasi elemente dar in ecuatia
de regresie cu restrictii (r) ce include doar termenii de tip :
. (r)
Se respinge ipoteza nula daca valoarea calculata pentru statistica F este mai mare
decat valoarea critica.
ETAPA 2) Analog, se testeaza daca Y este cauza pentru X pornind de la regresia:
, (u)
Ipoteza nula respectiv alternativa sunt:
,Y nu este cauza pentru X
Testul F are aceeasi forma:
si referindu-se la ecuatia de regresie cu restrictii (r):
. (r)
ETAPA 3) In urma aplicarii celor doua teste sunt posibile patru concluzii:
i) cauzalitate unidirectionala: X este cauza pentru Y (X Y) daca ipoteza nula se respinge la

1) si se accepta la 2);
ii) cauzalitate unidirectionala: Y este cauza pentru X (Y X) daca ipoteza nula se respinge la
2) si se accepta la 1);
iii) cauzalitate bidirectionala: X Y daca ipoteza nula se respinge atat la 1) cat si la 2).
iv) cele doua variabile sunt independente daca ipoteza nula se accepta la 1) si la 2).
3.2. METODOLOGIA CERCETARII:
Serii staționare/nestaționare:
O serie de timp staționară este o serie de timp ale cărei proprietăți statistice precum
media, varianță, autocorelație sunt constante în timp. Cele mai multe metode de estimare
statistică se bazează pe presupunerea că seriile de timp sunt redate aproximativ staționare,
adică ”standardizate”, prin utilizarea unor transformări matematice.
O serie standardizată este relativ ușor de previzionat: pur și simplu se prezice că

proprietățile sale statistice vor fi aceleași în viitor ca în trecut. Predicțiile pentru seria
standardizată pot fi apoi ”detransformate”, prin inversarea oricăror transformări matematice
folosite anterior, pentru a obține previziuni pentru seria originală. Astfel, găsirea succesiunii
transformărilor necesare staționarizării unei serii de timp oferă adesea indicii importante în
căutarea unui model de prognoză corespunzătoare. Un alt motiv pentru a staționariza o serie
de timp este pentru a obține statistici semnificative prin sondaj, cum ar fi medii, varianțe și
corelații cu alte variabile.
Astfel de statistici sunt utile ca descriptori ai comportamentului viitor numai în cazul

în care seria este staționară. De exemplu, dacă seria crește în mod constant în timp, media și
varianța vor crește odată cu mărimea eșantionului și vor subestima întotdeauna media și
varianța pentru perioadele viitoare. Iar dacă media și varianța unei serii nu sunt bine-definite,
atunci nu sunt nici corelațiile cu alte variabile. Din acest motiv trebuie multă atenție în
încercarea exploatării modelelor de regresie montate pe serii de date nestaționare. Cele mai
multe dintre afaceri și seriile de timp economice sunt departe de staționaritate atunci când sunt
exprimate în unitățile lor inițale de măsură, și chiar după deflaționare sau ajustare sezionieră
încă prezintă trenuri, cicluri, sau alte comportamente non-staționare.
O astfel de serie este numită serie trend-staționară. Cu toate acestea, uneori ”de-
trenduirea” nu este suficientă pentru a face seria staționară, caz în care s-ar putea să fie
necesară transformarea seriei în serii de la perioadă la perioadă și/sau diferențe de la sezon la
sezon. Dacă media, varianța și autocorelațiile seriei originale nu sunt constate în timp, chiar și
după ”de-trenduire”, probabil statisticile schimbărilor în serii între perioade sau între sezoane
vor fi constante. Prima diferențială a unei serii de timp reprezintă seria de schimbări de la o
perioadă la alta. Dacă Yt denotă valoarea seriei cronologice în perioada t, atunci prima
diferențială a lui Y la sfârșitul perioadei t este egală cu Yt-Yt-1. Dacă prima diferențială de Y
este staționară, adică dacă valorile sale în perioada t sunt corelate cu valorile din perioada
anterioară, atunci este recomandat un model de previziune mai sofisticat de netezire
exponențială, sau utilizarea metodei ARIMA.
Analiza de cointegrare:
Cointegrarea este o proprietate statistică a unei colecții (X1,X2,..,Xk) a variabilelor

unei serii de timp. În primul rând, toate seriile trebuie să fie integrate de ordinul 1. În cazul în
care o combinație liniară a acestei colecții este integrată de ordin zero, atunci colecția se
numește cointegrată. Formal, în cazul în care (X,Y,Z) sunt fiecare integrate de ordinul 1 și
există coeficienții a,b,c astfel încât aX+bY+cZ este integrată de ordin zero, atunci X,Y și Z
sunt cointegrate.
Cointegrarea a devenit o proprietate importantă în analiza seriilor de timp

contemporane. Seriile de timp au în general tendințe – fie deterministe, fie stocastice.
Cointegrarea este cea mai consistentă dintre ipotezele lui Wagner, care încearcă să identifice
existenţa unei conexiuni pe termen lung între variabile, care nu poate fi evidenţiată prin
metoda regresiei multiple. Pentru a putea depista existenţa unei eventuale cauzalităţi de tip
Granger între cele două variabile analizate, trebuie să verificăm înainte de toate existenţa
cointegrării între seriile de timp. Practic, cele două serii de timp sunt cointegrate dacă au
acelaşi ordin de integrare, dar o combinaţie liniară a lor are un ordin de integrare mai mic. De
exemplu, putem avea două serii integrate de ordinul unu, astfel încât diferenţele de ordinul
unu sunt staţionare, dar poate exista o combinaţie liniară a celor două serii care să fie
staţionară, adică integrată de ordinul 0.
Testarea staţionarităţii a fost realizată folosind procedura generală Augmented

DickeyFuller unde yt este variabila care se verifică staţionaritatea, iar p este numărul optim de
lag-uri utilizat pentru a verifica posibile autocorelaţii de ordin superior, prin estimarea
următorului model de regresie:
Numărul optim de laguri folosit la testul ADF se poate alege pe baza maximizării
criteriului informaţional Schwarz(SIC).
Ipotezele testului sunt următoarele :
H0: ρ=1
H1: ρ< k, respingerea ipotezei nule echivaland cu acceptarea stationaritatii
Fie Yt=(ln yt ln xt) vectorul seriilor de timp astfel încât ln ytϵ I(1 ) și ln xt ϵ I(1).
Atunci ln yt şi ln xt sunt cointegrate dacă există o matrice β astfel încât β’Yt ϵ I(0). Astfel, fie
un model VAR de ordinul p: Yt= AtYt-1 + ... + ApYt-p + εt , unde Yt = (ln yt ln xt)’ este
vectorul celor două variabile studiate, integrate de ordinul 1, iar εt este vectorul inovațiilor.
Modelul VAR de mai sus poate fi rescris:
Teorema de reprezentare a lui Granger spune că dacă matricea coeficienților Π are

rangul r < k, atunci există matricele α, β ϵ M(k x r), fiecare având rangul k, astfel încât Π =
αβ’ și β’Yt ϵ I(0). Rangul r reprezintă de fapt numărul relațiilor de cointegrare, iar fiecare
coloană a matricei β conține coeficienții ecuației de cointegrare.
Metoda lui Johansen constă în estimarea matricei Π dintr-un model VAR fără
restricții și apoi testarea restricțiilor ce rezultă din asumarea unui rang r < k.
Cauzalitatea Granger:
Cauzalitatea Granger între două variabile se referă la felul în care valorile anterioare
ale unei variabile pot fi folosite pentru a explica valorile celeilalte variabile. În cazul nostru, a
testa cauzalitatea Granger se reduce la a estima următoarele modele de regresie:
Ipoteza nulă căreia i se testează validitatea este H0: β0=β1=...=βl=0, cu alte cuvinte,
testăm pentru prima ecuație faptul că ln x nu cauzează Granger pe ln y, iar în a doua ecuație
testăm faptul că ln y nu cauzează Granger pe ln x. În absența unei relații pe termen lung între
variabile, este interesant de studiat relația pe termen scurt.
Fără evidența cointegrării, un model de corecție a erorilor nu poate fi utilizat. Înaintea

aplicării testului trebuie determinat modelul VAR corect. Între un model VAR cu variabile
dummy și unul cu perioade ”trucate”, cel de-al doilea pare să fie un model cu specificații mai
bune. În testarea cauzalității, rezultatele sunt sensibile a numărul de lag-uri în analiză.
3.3. DATELE UTILIZATE
Pentru Aplicația 3, am ales sa analizăm evoluția zilnică a cursului valutar EUR/RON

și USD/EUR, reprezentând echivalentul în RON a unui EUR, respectiv echivalentului în EUR
a unui USD, în intervalul de timp 01 februarie 2018 – 01 februarie 2019, având un număr de
267 de observații.
Sursa datelor folosite în analiză este site-ul: www.investing.com, iar datele le găsim în
link-ul următor: https://www.investing.com/currencies/eur-ron-historical-data.
3.4. REZULTATELE EMPIRICE ALE CERCETARII:

Analiza non-staționarității:
 Analiza seriei EUR/RON:
Figure 20 Analiza seriei EUR/RON
Din graficul de mai sus putem observa ca exista un trend crescator spre finalul anului
2018 si inceputul anului 2019. Analizand cu atentie graficul putem afirma faptul ca seria nu
este stationara.
Figure 21 Corelograma seriei EUR/RON

Lagul 1 al coeficientului de autocorelatie indica o valoare de 0,929, aceasta fiind o

valoarea foarte mare. Coeficientii de autocorelatie descresc relativ lent; acest lucru
confirmand ca seria este nestationara.
Figure 22 ADF aferent seriei EUR/RON
Din Figura 3 se observa faptul ca seria este nestationara.
|-0.856|<|-3.454| TRUE
|-0.856|< |-2.872| TRUE
|-0.856|<|-2.572| TRUE
Prob= 0.8 > 0.05
Seria de date are radacina unitara si seria este nestationara.
 Analiza seriei USD/EUR:

Figure 23 Analiza seriei USD/EUR
Din graficul de mai sus putem observa ca trendul seriei este unul descrescator.
Analizand doar graficul putem presupune ca seria analizata este nestationara.
Figure 24 Corelograma seriei USD/EUR
Lagul 1 al coeficientului de autocorelatie indica o valoare de 0,981, aceasta fiind o

valoarea foarte mare. La lagul 19 identificam valoarea de 0,752, o valoare mare, coeficientii
de autocorelatie descrescand lent; acest lucru confirmand ca seria este nestationara.
Figure 25 ADF aferent seriei USD/EUR
|-1.959|<|-3.454| TRUE
|-1.959|<|-2.872| TRUE
|-1.959|<|-2.572| TRUE
Seria de date are radacina unitara si seria este nestationara.
Astfel, ambele serii sunt nestationare.
 Verificam dacă ambele serii au același ordin de integrare, în caz contrar nu se poate
vorbi de cointegrare.
Figure 26 ADF aferent seriei EUR/RON

Probabilitatea = 0 => stationara

Prima diferenta nu mai are radacina unitate si este stationara.
Figura 8- ADF aferent seriei USD/EUR
Probabilitate = 0 => stationara
Prima diferenta nu mai are radacina unitate si este stationara I(1).
Cele doua serii au acelasi ordin de integrare I(1).La noi, seriile sunt integrate de ordin 1, se
verifică existența cointegrării în date, cu ajutorul testului de cointegrare Johansen.
Figura 9 – Johansen Cointegration Test
Figura 10 – Johansen Cointegration Test
Din Figurile 9 & 10 putem obsera faptul ca seriile nu sunt cointegrate.

 Estimare model VAR:
Figure 27 VAR
Figure 28 VAR
Figure 29 VAR
Figure 30 VAR
H0: r = 0 (0 relatii de cointegrare).
Se observa faptul ca probabilitatea este: 0.8576 >0.05 => se accepta H 0 si exista cel
mult 0 relatii de cointegrare.
Figure 32 VAR
Figure 33 VAR
Figure 34VECM
Figure 35 VECM
Figura 23 – VECM
Figura 24 – VECM
Figura 25 – VECM
Figura 26 – VECM
Figura 27 – Granger Causality Test
Figura 28 – Impulse Responses

Functia de raspuns la impuls:
Figura 29 – Functia de raspuns la impuls

Figure 36 Functia de raspuns la impuls
Figure 37 Responses
Graficul 1 “Response of EUR to EUR” reprezinta modul in care va reactiona moneda

euro la aplicarea unui soc egal cu o abatere standard asupra acestia.
Graficul 2 “Response of EUR to USD” reprezinta modul in care va reactiona moneda
euro la aplicarea unui soc asupra USD.
Graficul 3 “Response of USD to EUR” reprezinta modul in care va reactiona moneda

USD la aplicarea unui soc asupra EUR.
Graficul 4 “Response of USD to USD” reprezinta modul in care va reactiona moneda

USD la aplicarea unui soc egal cu o abatere standard asupra acestia.
 Variance Decomposition:
Figure 38 Variance Decomposition

Figura 33 – Variance Decomposition

Figure 1 Primele observatii..................................................................................................................42

Figure 2 Ultimele observatii.................................................................................................................43
Figure 3 Grafic volume........................................................................................................................43
Figure 4 Histograma statistici descriptive.............................................................................................44
Figure 5 Corelograma volum................................................................................................................45
Figure 6 Unit Root Test........................................................................................................................46
Figure 7 Grafic serie stationara............................................................................................................47
Figure 8 Test Unit Root pentru datele stationare..................................................................................48
Figure 9 Corelograma serie stationara..................................................................................................48
Figure 10 AR(1) SAR4) MA(1)...........................................................................................................49
Figure 11 AR(1) AR(4) SAR(4) MA(1)...............................................................................................49
Figure 12 AR(1) AR(4) SAR(4) MA(1) MA(4)...................................................................................50
Figure 13 Corelograma reziduurilor.....................................................................................................51
Figure 14 Test homoscedasticitate reziduuri........................................................................................52
Figure 15 Test Jarque Berra.................................................................................................................52
Figure 16 Model prin metoda H-W multiplicativ.................................................................................53
Figure 17 Model prin metoda H-W aditiv............................................................................................53
Figure 18 H-W multiplicativ................................................................................................................54
Figure 19 Dynamic Forecast................................................................................................................55
Figure 20 Analiza seriei EUR/RON........................................................................................................65
Figure 21 Corelograma seriei EUR/RON...............................................................................................65
Figure 22 ADF aferent seriei EUR/RON.................................................................................................66
Figure 23 Analiza seriei USD/EUR.........................................................................................................67
Figure 24 Corelograma seriei USD/EUR................................................................................................67
Figure 25 ADF aferent seriei USD/EUR.................................................................................................68
Figure 26 ADF aferent seriei EUR/RON.................................................................................................68
Figure 27 VAR.......................................................................................................................................70
Figure 28 VAR.......................................................................................................................................71
Figure 29 VAR.......................................................................................................................................71
Figure 30 VAR.......................................................................................................................................72
Figure 31 VAR.......................................................................................................................................72
Figure 32 VAR.......................................................................................................................................73
Figure 33 VAR.......................................................................................................................................74
Figure 34VECM.....................................................................................................................................74
Figure 35 VECM....................................................................................................................................75
Figure 36 Functia de raspuns la impuls................................................................................................80
Figure 37 Responses.............................................................................................................................80
Figure 38 Variance Decomposition.......................................................................................................81
Bibliografie:
1.Theresa Hoang Diem Ngo,Warner Bros. Entertaiment Group,Burbank,CA,The Box-Jenkins Methodology for
Time Series Models,Paper 454-2013(http://support.sas.com/resources/papers/proceedings13/454-2013.pdf)
2.Nanda, S. Forecasting: Does the Box-Jenkins Method Work Better than Regression?.
(http://www.vikalpa.com/pdf/articles/1988/1988_jan_mar_53_62.pdf)
3.Ion D.,Adriana AnaMaria A., MODELLING UNEMPLOYMENT RATE USING BOX-JENKINS
PROCEDURE,2008(http://www.jaqm.ro/issues/volume-3,issue-2/pdfs/dobre_alexandru.pdf)
4. Frain, J. (1992). Lecture Notes on Univariate Time Series Analysis and Box Jenkins
Forecasting.https://www.tcd.ie/Economics/staff/frainj/main/MSc%20Material/Session_notes/UNIVAR4.pdf
5.Andrei T,Ion P.,METODOLOGIA APLICĂRII PROCEDURII BOX-JENKINS LA ESTIMAREA
INFLAŢIEI ÎN R. MOLDOVA ŞI ROMÂNIA,2007 https://ibn.idsi.md/sites/default/files/imag_file/Metoda
%20aplicarii%20procedurii%20box_jenkins.pdf
6.Ali, A., Ch, M. I., Qamar, S., Akhtar, N., Mahmood, T., Hyder, M., & Jamshed, M. T. (2016). Forecasting of
daily gold price by using Box-Jenkins methodology. International Journal of Asian Social Science, 6(11), 614-
624.https://ideas.repec.org/a/asi/ijoass/2016p614-624.html
7. newonlinecourses.science.psu.edu
8. computer-trading.com/a-gentle-introduction-to-sarima-for-time-series-forecasting
9. Xujun Zhang; “Forecasting mortality of road traffic injuries in China using seasonal autoregressive integrated
moving average model”; Chine; Annals of Epidemiology, Volume 25, Issue 2, p 101-106
10. Mira Syahirah Kamil, “Time series SARIMA models for average monthly solar radiation in Malaysia”;
Malaysia

Proiect SDT PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Proiect SDT PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Facultatea de Cibernetică, Statistică și Informatică Economică

Academia de Studii Economice din București

Specializarea: Cibernetică Economică

Proiect Serii de Timp

Student(e):Maria Elena Adelina

Specializarea: Cibernetică Economică

Specializarea: Cibernetică Economică

1.1. LITERATURA EVIEW

În lucrarea scrisă de Theresa Hoang Diem Ngo și Warner Bros1autorii încearcă să

Matematic, prima diferență se poate scrie: z t= y t− y t −1,unde t=2,3...n(numărul de observații

După ce s-a făcut staționarizarea,estimare,diagnosticarea seriei se realizează previziuni.Pentru

Specializarea: Cibernetică Economică

Conform acestei lucrări metodologia Box-Jenkins implică 3 pași:

În etapa de identificare se verifică dacă seria este staționară și în caz de nestaționaritate se

y t =ф y t−1 +ф 2 y t −2 +…+ ф p y t −p + et−ф 1 e t−1−ф 2 e t−2 … ф q et −q,unde y1,y2 ..yp sunt

În etapa de estimare se identifică modelele potențiale, se estimează parametrii, iar pe baza

În etapa de diagnosticare se verifică acuratețea estimării pe baza coeficienților de

În lucrarea 3 se modelează rata șomajului în perioada 1998-2007,date lunare.În urma utilizării

Specializarea: Cibernetică Economică

ARIMA(1,1,0) și analizând acuratețea modelului cu ajutorul MAE,MAPE și RMSE s-a ajuns

1.2 Metodologia Box-Jenkins

ETAPA I.Se calculează coeficienții funcției de autocorelație și autocorelație parțială pentru a

ETAPA II:Staționarizarea seriei.Se logaritmează valorile seriei,se aplică o transformare Box

ETAPA IV:Se estimează parametrii modelelor autoregresive.

ETAPA VII: Efectuarea de prognoze.

Specializarea: Cibernetică Economică

În etapa de identificare după ce s-a realizat staționarizarea seriei se identifică procesele

Procesele autoregresive de ordin p AR(p)

În general procesele autoregresive au un aspect exponențial descrescător.Pentru procesele de

Considerăm6 un proces AR(1), undeε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)

Generalizarea procesului este:

ρk −ф 1 ρ k−1 −ф 2 ρ k−2 =0 ,k=1,2,...

Procesele de medie mobilă de ordin q MA(q)

Considerăm un proces MA(1),undeε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)

y t =ε t +θ1 ε t−1 +…+θ q ε t −q

Procesul ARMA(p,q)-procese autoregresive de medie mobilă

Considerăm ε t este un zgomot alb(ZA∼(0 , σ ¿ ¿ ε 2) ¿)

Specializarea: Cibernetică Economică

y t =ф 1 y t −1+ …+ф p y i− p+ ε t +θ 1 ε t−1 +..+ θq ε t −q

Modelarea unei serii de timp utilizând metodologia Box-Jenkins

2.1 Date utilizate .Descrierea variabilei analizate

Unitatea de măsură este dolar/acțiune.

Scurtă descriere a companiei

Specializarea: Cibernetică Economică

Figură 1Datele inițiale

Specializarea: Cibernetică Economică

2.2 Rezultatele empirice ale cercetării

2.2.1.Analize descriptive preliminare asupra seriei(statistici

2.2.1.1 Graficul seriei

Figură 2Reprezentarea grafică a seriei inițiale

Specializarea: Cibernetică Economică

2.2.1.2 Statistici descriptive

Figură 3Statistici elementare

Coeficientul de asimetrie este -0.53<0,asta înseamnă că avem o asimetrie la stânga a

Coeficientul de aplatizare este 2.11<3,asta înseamnă că distribuția este una

H0:seria are distribuție normală

H1:seria nu are distribuție normală

Jaque-Bera urmează o distribuție chi pătrat cu 2 grade de liberate.

Valoarea statisticii testului este: JB=10.50.

Specializarea: Cibernetică Economică

Probabilitatea(JB)=0.005<0.05,asta înseamnă că resping H0 și accept H1, seria nu are o

Etapele metodologiei Box-Jenkins:

Etapa 0:Testarea staționarității seriei și staționarizarea dacă este cazul

3. Cu trend și cu termen liber: : Dyt =μ+λt+δ y t −1 + ε t

Ecuația modelului: DCLOSEt=0.001267CLOSE-0.243725 DCLOSE t−1

DCLOSEt=0.046576-0.011690CLOSE-0.235657 DCLOSE t−1

DCLOSEt=0.322018+0.000559t-0.098958CLOSE-0.199337* DCLOSE t−1