Sunteți pe pagina 1din 249

CURS 6

IDENTIFICAREA SI ESTIMAREA PARAMETRILOR MODELELOR ARIMA


2023
Curs Serii de timp – Prof.univ.dr. Cristina BOBOC

Problema 1

Fie seriile de timp : PIB si Consumul final al populației, date trimestriale, înregistrate în perioada trim 1 – 1995 – trim
4 – 2014.

a. Să se analizeze staționaritatea seriei Consumul final al populației folosind corelograma și graficul seriei de timp.
Precizati si condiția teoretică sau metoda pe care o folosiți pentru testare.

Final consumption expenditure of general government


8,000

7,000

6,000

5,000

4,000

3,000

2,000

1,000

0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80

Analizând graficul seriei de timp se observă că seria de timp are o tendință crescătoare, acesta fiind un indicator de
nestationaritate. Din corelogramă putem trage aceeași concluzie, având în vedere că funcția de autocorelație descrește
lent către zero.

Deci, pentru a determina un model ARMA potrivit acestei serii de timp, trebuie mai întâi staționarizată seria.

b. Sa se precizeze pe baza ACF si PACF ale diferențelor de ordinul 1 ale seriei de timp, ce modele ar fi potrivite
datelor – folosind metodologia Box Jenkins (se vor folosi output-urile de eviews).
În primul rând putem observa că prin prima diferențiere a seriei de timp se obține o serie de timp ce descrește rapid
către zero. Deci ordinul d=1.

În al doilea rând observăm că doar prima și a treia valoare ale funcției parțiale de autocorelație sunt semnificativ
diferite de zero. Deci un model AR(1) (dacă presupnn că a treia corelație parțială este aproximativ zero) sau AR(3) ar
putea fi potrivite pentru seria de timp diferențiată odată.

Deci modelele de regresie sugerate a fi potrivite acetei serii de timp conform metodologiei Box Jenkins sunt
ARIMA(1,1,0) sau ARIMA(3,1,0).

c. Precizați ce model a fost estimat în eviews si dacă acesta poate fi validat.

20
Series: Residuals
Sample 3 80
16 Observations 78

Mean -2.40e-06
12 Median -106.6936
Maximum 3563.418
Minimum -1385.782
Std. Dev. 708.1832
8
Skewness 1.986348
Kurtosis 10.63546
4
Jarque-Bera 240.7685
Probability 0.000000
0
-1000 0 1000 2000 3000
Modelul estimat in eviews este ARIMA(1,1,0). Constanta din acest model nu este semnificativ diferită de zero, insa
coeficientul termenului yt-1 este semnificativ diferit de zero.

̂ t=64,4-0,65Yt-1+ t
𝒀

R2=0,42 sugerează un model estimat bun iar Durbin Watson (2,15) sugerează că erorile nu sunt autocorelate.

Repartiția erorilor nu este însă normală :

Testul Jarque Bera :

H0 : Repartiția erorilor este normală, cu alternativa

H1 : Repartiția erorilor nu este normală

JB= 240,77 cu o valoare p=0,0000 0,01, deci se respinge H0, deci repartiția nu este normal

Homoscedasticitatea erorilor: erorile sunt homoscedastice

Testul ARCH:

H0 : Nu exista effect ARCH

H1 : Exista effect ARCH

Statistica F a testului ARCH este 0,006599 cu o valoare p=0,93  0,05 ceea ce implică acceptarea ipotezei H0 conform
căreia nu există effect ARCH deci erorile sunt homoscedastice.

Deci indicat este să se estimeze un nou model, deoarece ipoteza de normalitate a erorilor nu este verificata. Eventual
poate fi estimat AR(3), cel rezultat din metodologia Box Jenkins a fi cel mai potrivit a descrie seria de timp dată.
ARIMA(3,1,0) :
PROBLEMA 2

Fie seriile de timp : Cursul EURO/LEU și valoarea gramului de aur, date zilnice înregistrate 5 zile pe săptămână în
perioada 2 decembrie 2014 – 27 aprilie 2015.

a. Sa se analizeze staționaritatea seriei de timp Curs Euro/leu folosing următoarele output-uri din EXCEL. Precizați
metoda pe care o aplicați și condițiile de staționaritate.

Din analiza graficului seriei de timp se observă că aceasta are o tendință descrescătoare și variabilitatea acesteia în
timp nu este contantă. Deci putem spune că seria de timp nu este probabil staționară.

Folosind testul Dickey Fuller cu ipotezele:

H0: Seria de timp are o rădăcină unitate

H1: Seria de timp nu are nici o rădăcină unitate

Se obține statistica testului t=1,577 cu o valoare p=0,49, ceea ce implică acceptarea ipotezei H0, deci seria are o
rădăcină unitară, deci seria de timp nu este staționară.

b. Sa se precizeze pe baza ACF si PACF ce model ar fi potrivit seriei de timp staționare, pentru perioada 10.04.2014-
21.05.2014– folosind metodologia Box Jenkins (se va folosi output-ul din eviews).
Analizând funcțiile de autocorelație și de autocorelație parțială, se poate observa că :

- autocorelația de ordin 1 este semnificativ diferită de zero, restul fiind zero


- autocorelația parțială de ordin 1 este semnificativ diferită de zero, restul fiind zero

Coeficienții funcției de autocorelație și autocorelație parțială sunt atât pozitivi cât și negativi.

Deci conform metodologiei Box Jenkins, modelele ce pot fi potrivite acestei serii de timp diferențiate odată sunt :
ARMA(0,0), AR(1), MA(1) sau ARMA(1,1).

c. Precizați ce model a fost estimat în eviews si dacă acesta poate fi validat.

Modelul estimat in eviews este ARMA(1,1) fără termen liber. Coeficienții modelului sunt ambii semnificativi diferiți
de zero, pentru un nivel de semnificație de 0,01.

̂ t=0,99Yt-1-0,53t-1+ t
𝒀

R2=0,06 sugerează un model estimat slab iar Durbin Watson (1,67) sugerează indecizie în privința autocorelării
erorilor.
Repartiția erorilor conform testului Jarque Bera este normală :

Testul Jarque Bera :

H0 : Repartiția erorilor este normală, cu alternativa

H1 : Repartiția erorilor nu este normală

JB= 0,35 cu o valoare p=0,83  0,1, deci se acceptă H0, deci repartiția este normală

Homoscedasticitatea erorilor: erorile sunt homoscedastice

Testul ARCH:

H0 : Erorile sunt homoscedastice

H1 : Erorile sunt heteroscedastice

Statistica F a testului ARCH este 0,217 cu o valoare p=0,64  0,05 ceea ce implică acceptarea ipotezei H0 conform
căreia erorile sunt homoscedastice.

Deci indicat este să se estimeze și modelele AR(1) și MA(1), deoarece acesta este slab și apoi în funcție de
coeficientul Akaike să se decidă care este cel mai bun model potrivit seriei de timp.
MODEL SUBIECT EXAMEN 2023

(0.5p) 1. Una din întrebările importante care trebuie luate în considerare atunci când priviți graficul unei serii de timp este :
« Există o tendință ? ».
a. Dacă răspunsul este da, în medie, măsurătorile tind să crească (sau să scadă) în timp
b. Dacă răspunsul este nu, seria de timp este nestaționară
c. Dacă răspunsul este da, putem aplica un model de regresie liniară pentru estimarea seriei de timp
d. Dacă răspunsul este da, putem aplica un model ARMA pentru estimarea seriei de timp (Justificati raspunsul)

(0.5p) 2. Presupunem că vedeți doi bețivi rătăcind în jur. Bețivii nu se cunosc între ei.
a. Traiectoria celor doi betivi este un proces stationar.
b. Există o relație de cointegrare între între căile lor
c. Traiectoria celor doi betivi este un ”mers la întâmplare”
d. Există o relatie de dependență semnificativă între căile lor (Justificati raspunsul)

(0.5p) 3. Tendința unei serii cronologice (T)


a. reda modificări care se repetă în mod previzibil pe perioade de sub un an, în jurul componentei de tendință sau a componentei ciclice
b. redă evoluţia fenomenului pe termen lung
c. se manifestă sub forma unor oscilaţii cu perioadă şi amplitudine ce variază de regulă în timp, un ciclu acoperind câţiva ani de zile
d. se manifestă prin fluctuaţii aparent aleatoare în jurul componentelor deterministe
(0.5p) 4. Definiți un process AR(p) si dati un exemplu de astfel de proces.
(0.75) 5. Fie o serie de timp Yt cu 25 de observatii anuale, numarul elevilor din Romania din perioada 1990-2014. Se estimeaza un
model MA(1) pentru seria diferentiata.

Care din urmatoarele afirmatii sunt adevarate?


a. Rezidualurile nu sunt autocorelate
b. Rezidualurile sunt normal repartizate
c. Modelul estimat este Yt estimat= 0.94*εt -1+εt
d. Parametrul MA(1) este semnificativ

6. Presupunem că dispunem de un eșantion de 100 de observații pentru care s-au obținut următoarele valori ale funcției de
autocorelație de selecție :
K 1 2 3 4 5
rk 0,5 0,25 0,2 0,05 0,01

a. (0,75p) Să se testeze semnificația coeficienților de autocorelație folosind testele Bartlett și Ljung-Box. Ce puteți spune
despre staționaritatea seriei?
b. (0.25p) Definiți funcția de autocorelaţie parţială de selecţie si procedura de calcul a acesteia.
c. (0.5p) Să se calculeze coeficienţii de autocorelaţie parţială de selecţie pentru lag-urile 1, 2 şi 3.
7. Următorul grafic este o reprezentare grafică a funcțiilor de autocorelație și parțială de autocorelație pentru seria de timp:
numărul anual de cutremure din lume cu o magnitudine seismică de peste 7 grade, timp de 99 de ani consecutivi.
MODEL SUBIECT EXAMEN 2023

a) (0,75 p) Seria este staţionară ? Justificaţi răspunsul.


b) (0,75 p) Ce model/modele ar fi potrivit a fi folosit(e) conform metodologiei Box Jenkins ? Justificaţi răspunsul.
c) (1,0 p) In urma estimarii unui model ARMA s-au obtinut urmatoarele rezidualuri. Este verificata ipoteza de
nonautocorelare a reziduurilor si cea de normalitate a acestora?

8. Fie seriile de timp : Rata dobânzii de politică monetară și Rata dobânzii la facilitatea de creditare. Rezultatele obtinute prin
aplicarea unui model linear de regresie in E-views sunt urmatoarele:
Dependent Variable: RATA_DOB_NZII_LA_FACI01
Method: Least Squares
Date: 05/16/17 Time: 20:21
Sample: 2017M02 2031M03
Included observations: 170

Variable Coefficient Std. Error t-Statistic Prob.

C 0.089138 0.161975 0.550321 0.5828


RATA_DOB_NZII_DE_POLITIC 0.283201 0.016511 17.15193 0.0000

R-squared 0.636512 Mean dependent var 2.392647


Adjusted R-squared 0.634348 S.D. dependent var 1.952435
S.E. of regression 1.180620 Akaike info criterion 3.181652
Sum squared resid 234.1692 Schwarz criterion 3.218544
Log likelihood -268.4404 Hannan-Quinn criter. 3.196622
F-statistic 294.1886 Durbin-Watson stat 0.115189
Prob(F-statistic) 0.000000

a) (0,75) Există vreun indiciu conform căruia cele două serii de timp ar putea fi cointegrate?
b) (0,5) Există o relatie pe termen scurt intre ele ?
c) (1,0) Fie următoarele output-uri obținute în eviews. Ce puteți spune despre aceste output-uri și despre cele două serii de
timp? Exista o relatie pe termen lung intre ele ?

Null Hypothesis: RATA_DOB_NZII_DE_POLITIC has a unit root


Exogenous: Constant
Lag Length: 4 (Automatic - based on SIC, maxlag=13)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -0.688219 0.8456


Test critical values: 1% level -3.470179
5% level -2.878937
10% level -2.576124
MODEL SUBIECT EXAMEN 2023

Corelograma : Rata dobânzii la facilitatea de creditare Corelograma : Rezidualuri model liniar de regresie
Date: 05/16/17 Time: 21:13
Date: 05/16/17 Time: 21:10
Sample: 2017M02 2031M03
Sample: 2017M02 2031M03
Included observations: 170
Included observations: 170
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
1 0.942 0.942 153.38 0.000
1 0.969 0.969 162.36 0.000
2 0.889 0.022 290.93 0.000
2 0.934 -0.074 314.13 0.000
3 0.836 -0.032 413.22 0.000
3 0.897 -0.040 455.12 0.000
4 0.783 -0.027 521.15 0.000
4 0.859 -0.050 585.07 0.000
5 0.732 -0.012 616.06 0.000
5 0.819 -0.037 703.98 0.000
6 0.671 -0.120 696.22 0.000
6 0.774 -0.108 810.79 0.000
7 0.614 0.001 763.95 0.000
7 0.728 -0.036 905.74 0.000 8 0.558 -0.031 820.20 0.000
8 0.680 -0.041 989.19 0.000 9 0.503 -0.024 866.24 0.000
9 0.632 -0.030 1061.7 0.000 10 0.437 -0.143 901.14 0.000
10 0.579 -0.100 1123.0 0.000 11 0.372 -0.031 926.64 0.000
11 0.526 -0.038 1173.9 0.000 12 0.308 -0.051 944.17 0.000
12 0.472 -0.028 1215.1 0.000 13 0.246 -0.021 955.48 0.000
13 0.421 0.004 1248.2 0.000 14 0.189 -0.015 962.18 0.000
14 0.370 -0.036 1273.8 0.000 15 0.139 0.039 965.82 0.000
15 0.322 0.032 1293.4 0.000 16 0.095 0.010 967.53 0.000
16 0.278 0.024 1308.1 0.000 17 0.058 0.029 968.17 0.000
17 0.238 0.015 1318.8 0.000 18 0.022 -0.022 968.26 0.000
18 0.197 -0.048 1326.3 0.000 19 -0.011 -0.004 968.29 0.000
19 0.156 -0.023 1331.0 0.000 20 -0.044 -0.042 968.66 0.000
20 0.116 -0.046 1333.7 0.000 21 -0.072 0.005 969.68 0.000
21 0.079 -0.005 1334.9 0.000 22 -0.093 0.026 971.38 0.000
22 0.044 -0.000 1335.3 0.000 23 -0.110 -0.001 973.80 0.000
23 0.012 -0.003 1335.3 0.000 24 -0.118 0.043 976.61 0.000
24 -0.015 0.032 1335.4 0.000 25 -0.128 -0.038 979.94 0.000
25 -0.041 -0.024 1335.7 0.000 26 -0.141 -0.070 983.98 0.000
26 -0.066 -0.045 1336.6 0.000 27 -0.156 -0.056 988.93 0.000
27 -0.092 -0.047 1338.3 0.000 28 -0.168 -0.007 994.71 0.000
28 -0.115 0.026 1341.0 0.000 29 -0.179 -0.031 1001.4 0.000
29 -0.136 -0.023 1344.9 0.000 30 -0.195 -0.055 1009.3 0.000
30 -0.157 -0.032 1350.0 0.000 31 -0.210 -0.032 1018.6 0.000
31 -0.178 -0.037 1356.6 0.000 32 -0.221 0.011 1029.0 0.000
32 -0.197 -0.015 1364.9 0.000 33 -0.197 0.285 1037.3 0.000
33 -0.188 0.449 1372.4 0.000 34 -0.190 -0.122 1045.1 0.000
34 -0.177 -0.043 1379.2 0.000 35 -0.184 -0.017 1052.4 0.000
35 -0.167 -0.028 1385.2 0.000 36 -0.174 0.033 1059.0 0.000
36 -0.156 -0.005 1390.5 0.000
COINTEGRARE
(exemple in Eviews)
Mai 2023
Curs Serii de timp – Prof.univ.dr. Cristina BOBOC

Sursa informatiilor : Conf. univ. dr. Mihaela Covrig, Time series, part 9, lecture and exercises,
2018-2019, draft

Example. Let us consider two time series, quarterly data between 1985 and 2006, on
Real Personal Consumption Expenditure, in billion dollars, denoted Y_PCE and
Real Disposable Personal Income, in billion dollars, denoted X_DPI.
The time series consist of 88 observed values each.

Discuss the evolution of the two time series.


They both exhibit an increasing trend, so they are not stationary.

1
Step 1.1. Are the two time series ( X t )t and (Yt )t integrated of order 1, ( X t )t ~ I (1) , (Yt )t ~ I (1) ?

Let us test for the existence of a unit root in both time series, we will use ADF unit root test.

Write down the hypotheses and comment the results.


H0: X_DPI has a unit root, H0: Y_PCE has a unit root,
that is, the time series X_DPI is nonstationary, that is, the time series Y_PCE is nonstationary,
or (𝑋_𝐷𝑃𝐼𝑡 )𝑡 ~𝐼(1), 𝛿 = 0, or (𝑌_𝑃𝐶𝐸𝑡 )𝑡 ~𝐼(1), 𝛿 = 0,
H1: Y_PCE does not have a unit root,
H1: X_DPI does not have a unit root,
that is, the time series Y_PCE is stationary,
that is, the time series X_DPI is stationary,
or (𝑌_𝑃𝐶𝐸𝑡 )𝑡 ~𝐼(0), 𝛿 < 0,
or (𝑋_𝐷𝑃𝐼𝑡 )𝑡 ~𝐼(0), 𝛿 < 0,
The test equation is
The test equation is Δ𝑌_𝑃𝐶𝐸𝑡 = 𝛽0 + 𝛽1 𝑡 + 𝛿 · 𝑌_𝑃𝐶𝐸𝑡−1
Δ𝑋_𝐷𝑃𝐼𝑡 = 𝛽0 + 𝛽1 𝑡 + 𝛿 · 𝑋_𝐷𝑃𝐼𝑡−1 + 𝛼1 · Δ𝑋_𝐷𝑃𝐼𝑡−1 + 𝑢𝑡 +𝛼1 · Δ𝑌_𝑃𝐶𝐸𝑡−1 + 𝛼2 · Δ𝑌_𝑃𝐶𝐸𝑡−2 + 𝛼3 · Δ𝑌_𝑃𝐶𝐸𝑡−3 + 𝑢𝑡
where D(X_DPI) means Δ𝑋_𝐷𝑃𝐼𝑡 , where D(Y_PCE) means Δ𝑌_𝑃𝐶𝐸𝑡 ,
X_DPI(-1) means 𝑋_𝐷𝑃𝐼𝑡−1 and Y_PCE (-1) means 𝑌_𝑃𝐶𝐸𝑡−1 and
D(X_DPI(-1)) means Δ𝑋_𝐷𝑃𝐼𝑡−1 D(Y_PCE(-1)) means Δ𝑌_𝑃𝐶𝐸𝑡−1
D(Y_PCE(-2)) means Δ𝑌_𝑃𝐶𝐸𝑡−2
and it is estimated by D(Y_PCE(-3)) means Δ𝑌_𝑃𝐶𝐸𝑡−3
̂ 𝑡 = 329.5080 + 2.8751 ∙ 𝑡 − 0.1569 ∙ 𝑋_𝐷𝑃𝐼𝑡−1
Δ𝑋_𝐷𝑃𝐼
and it is estimated by
̂ 𝑡 = 144.8592 + 1.3904𝑡 − 0.0786 ∙ 𝑌_𝑃𝐶𝐸𝑡−1
Δ𝑌_𝑃𝐶𝐸
The calculated value of the test statistic is
̂
𝜹 −𝟎.𝟏𝟓𝟔𝟗 +0.1356 ∙ Δ𝑌_𝑃𝐶𝐸𝑡−1 + 0.1631 ∙ Δ𝑌_𝑃𝐶𝐸𝑡−2 + 0.2855 ∙ Δ𝑌_𝑃𝐶𝐸𝑡−3
𝝉𝒄𝒂𝒍𝒄 = 𝒔𝒆(𝜹̂ = 𝟎.𝟎𝟔𝟎𝟔
= –2.588254
) The calculated value of the test statistic is
and is larger than the critical values -4.066981, -3.462292, and ̂
𝜹 −𝟎.𝟎𝟕𝟖𝟔
-3.157475, respectively, at 1%, 5%, and 10% significance level, 𝝉𝒄𝒂𝒍𝒄 = 𝒔𝒆(𝜹̂ = 𝟎.𝟎𝟑𝟐𝟒
= –2.425572
)
so we fail to reject the null hypothesis H0, and is larger than the critical values -4.071006, -3.464198, and
as there is insufficient evidence to reject the hypothesis that the time -3.158586, respectively, at 1%, 5%, and 10% significance level,
series X_DPI is nonstationary (X_DPI has a unit root). so we fail to reject the null hypothesis H0,
as there is insufficient evidence to reject the hypothesis that the time
series Y_PCE is nonstationary (Y_PCE has a unit root).

2
Remark: The same conclusion can be reached if we compare Prob or p-
value to the significance level of the test, 𝜶. Alternatively, we can reach the same decision using Prob.
• If Prob or p-value < 𝜶, then we reject H0, there is insufficient evidence to In our case, Prob = 0.3640 ≥ 𝜶=0.05, then we do not reject H0, so the
reject H0. time series Y_PCE is nonstationary, as it has a unit root.
• If Prob or p-value ≥ 𝜶, then we do not reject H0, concluding that the
data are in favor of the alternative hypothesis H1

In our case, Prob = 0.2867 ≥ 𝜶=0.05, then we do not reject H0, so the
time series X_DPI is nonstationary, as it has a unit root.

Both time series are non stationary as we haven’t rejected the null hypothesis H 0.
Let us test if the first order difference of each time series is stationary.

Write down the hypotheses and comment the results.

H0: D(X_DPI) has a unit root,


that is, the time series D(X_DPI) is nonstationary,
or (𝐷(𝑋_𝐷𝑃𝐼𝑡 )) ~𝐼(1), 𝛿 = 0,
𝑡

H1: D(X_DPI) does not have a unit root,


that is, the time series D(X_DPI) is stationary,
or (𝐷(𝑋_𝐷𝑃𝐼𝑡 )) ~𝐼(0), 𝛿 < 0,
𝑡

The calculated value of the test statistic is


𝝉𝒄𝒂𝒍𝒄 =–9.636167
and is smaller than the critical values -3.508326, -2.895512,
and -2.584952, respectively, at 1%, 5%, and 10% significance
level,
so we reject the null hypothesis H0, at 1%, 5%, and 10%
significance level, concluding that the time series D(X_DPI) is
stationary.

In our case, Prob = 0.0000 < 𝜶=0.05, then we reject H0, so


the time series D(X_DPI) is stationary.

We conclude that ( X t )t ~ I (1)


because ( X t )t is non-stationary, but (X t )t is stationary, that is (X t )t ~ I (0) ,
where the first order difference is X t = X t − X t −1 .

Similarly, (Yt )t ~ I (1)


because (Yt )t is non-stationary, but (Yt )t is stationary, that is (Yt )t ~ I (0) ,
where the first order difference is Yt = Yt − Yt −1 .

The time series ( X t )t and (Yt )t are integrated of order 1.

3
Step 1.2. Estimate a regression model of Personal Consumption Expenditure (Y_PCE) on
Disposable Personal Income (X_DPI): Yt =  0 + 1 X t +  t .
EQ_01: Y_PCE C X_DPI

The estimated regression model is


yˆ t = ˆ0 + ˆ1 xt ,
where ˆ =-171.4412 and ˆ =0.9672,
0 1

yˆ t = −171 .4412 + 0.9672  xt

R 2 =0.9941 very close to 1.


The slope parameter  1 is statistically
significant and positive.

DW=0.5316, so we may suppose that


the regression is spurious,
as DW<R2.

Step 1.3. One tests if the residuals series ˆt is stationary, where ˆt = yt − yˆ t .
Save the residuals of EQ_01: open the equation EQ_01 in the workfile, click Proc,
then select Make Residual Series… and then type the name of the series resid_eq_01
Apply a unit root test to the series resid_eq_01 to check for stationarity.

The hypotheses are:


H0:

H1:

The calculated value of the test statistic  is


 calculated =-3.75825 and it is smaller than any of the
critical values -3.507394, -2.895109, -2.584738
that corresponds to the significance levels of 1%,
5%, and 10%, respectively.

As Prob. = 0.0048 <0.05, we reject H0 (the time


series ˆt has a unit root, that is ˆt is not
stationary) and conclude that the data are in favor
of H1, the time series ˆt is stationary, (ˆt )t ~ I (0) .

4
As the time series of the residuals ˆt is stationary, the time series ( X t )t and (Yt )t are cointegrated,
that is, there is a long-run, or equilibrium, relationship between the two.
The long-run relationship between the two variables, X t and Yt , is estimated as
yˆ t = −171 .4412 + 0.9672  xt , called the estimated cointegrating regression
and ˆ =0.9672 is the estimate of the slope parameter  , known as the cointegrating parameter.
1 1

Interpret ˆ1 =0.9672:

The two time series,


X_Disposable personal Income
and Y_Personal Consumption
Expenditure, have both a
stochastic increasing trend (as
they are I(1)) and seem to move
toghether, with almost the same
rithm.

They are cointegrated.

Step 2. The Error Correction Mechanism (ECM)


We will consider now a model of error corection, known as the Error Correction Mechanism (ECM),
which combines the long term equilibrium (behavior) and the short term equilibrium (behavior) of
the variables of interest. In the long runthere is equilibrium between the two variables, as they are
cointegrated, but in the short run, there may be disequilibrium.

Step 2.1. Estimate, using OLS, the cointegration regression model Yt =  0 + 1 X t +  t


and save the residuals ˆt .
In the long –run there is equilibrium given by the cointegration regression model,
but in the short-run there may be disequilibrium.
The “equilibrium error” is  t = yt −  0 − 1 xt .
The error correction mechanism (ECM) corrects for disequilibrium.

Step 2.2. Estimate, using OLS, the dynamic regression model Yt =  0 +  1ˆt −1 +  2 X t + t ,
called the ECM equation, where (t )t is a white noise
EQ_02: d(y_pce) c resid_eq_01(-1) d(x_dpi)

5
The ECM equation Y _ PCE t =  0 +  1ˆt −1 +  2 X _ DPI t + t
states that Y _ PCE t depends on X _ DPI t and on the equilibrium error term  t −1 ,
the error correction coefficient  1 is the parameter corresponding to the equilibrium error term  t −1 .

The estimated ECM equation is Δ𝑌 ̂𝑃𝐶𝐸 𝑡 = 11.6918 − 0.0867 ∙ 𝜀̂𝑡−1 + 0.2906 ∙ Δ𝑋_𝐷𝑃𝐼𝑡 ,
with ˆ1 = −0.0867  0 , the error correction coefficient  1 being statistically significant at 12%
significance level, suggesting that the real personal consumption expenditure (Y_PCE) adjusts to
real disposable personal income (X_DPI) within a lag, that means within a quarter,
and more, only 8.67% percent of the discrepancy between long-term and short-term real personal
consumption expenditure (Y_PCE) is corrected within a quarter.

6
Serii de timp
MODELE MULTIVARIATE
Curs 10 - Mai 2023
Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Serii cointegrate
 Conceptul de cointegrare a fost introdus de Granger (1983), Granger and Weiss
(1983), Engle si Granger (1987).
 Intuitiv, două serii de timp sunt în relație de cointegrare dacă nu sunt neapărat
corelate dar ele sunt într-o relație de echilibru relativ pe termen lung.
 Noţiunea de cointegrare este strâns legată de cea de „regresii false” cu serii de
timp. Atunci când se estimează regresii cu serii de timp în economie deseori R2 este
mare (R → 1) iar statistica Durbin-Watson este mică DW → 0 (erorile sunt
corelate). Dacă în plus R2 > DWcalc acesta ar putea fi un semnal ca regresia este
falsă; dependenţa este exagerată iar estimatorii sunt suspecţi. Aceasta se întâmplă
deoarece variabilele din economie sunt deseori nestaţionare şi se comportă ca şi un
proces de tip mers aleator (au rădăcină unitate).
 Observație: Pentru a exista o relaţie pe termen lung între variabile, acestea trebuie să
fie cointegrate.
Serii cointegrate
 Cointegrarea este o proprietate a seriilor de timp nestationare.

 Definiţie:
 1. Spunem că două serii de timp Yt , X t integrate de ordin 1 sunt cointegrate de
ordin CI(1,1) dacă o combinaţie liniară a celor două  t = Yt −  X t este staţionară
(integrată de ordin 0), deşi fiecare din ele nu este stationară.
 2. Dacă două serii Yt , X t sunt integrate de acelaşi ordin d şi există  astfel încât
rezidu-ul din regresie  t = Yt − X tare un ordin mai mic de integrare I(d-b) atunci,
conform definitiei Engle-Granger (1987), cele doua serii sunt cointegrate de ordin
CI(d,b).
Serii cointegrate
 Fie două serii de timp Yt , X t integrate de ordin 1, I(1), pentru care există o
combinație liniară, notată t :
 t = Yt − a 0 − a1 X t care este staționară I(0)
 Seriile Yt , X t se numesc serii cointegrate de ordinul 1
 Vectorul (1-a1) se numește vector de cointegrare
 Relația Yt = a0 + a1 X t +  t se numește relație de cointegrare

 Diferenţa Yt − a1 X t rămâne stabilă în jurul unei medii fixe a0 (media lui este zero).
 Dacă constanta este zero, relaţia ce le menţine legate pe termen lung este una de proporţionalitate
Yt = a1 X t
 Variabilele rămân legate pe termen lung prin relaţia de echilibru Yt = a0 + a1 X t iar deviaţiile de la aceasta
au loc doar pe termen scurt; această relaţie de echilibru poate fi interpretată ca o relaţie echilibru pe
termen lung, „deranjată” doar de şocuri aleatoare () cu efect pe termen scurt.
 Relația de echilibru pe termen lung este înţeleasă în sensul de stabilitate a relaţiei de dependentă.
 Două serii cointegrate au o tendinţă stochastică comună (tendinţe de evoluţie similare), adică „hoinăresc”
împreună (analogie în evoluţie). Relaţia de dependenţă dintre ele este stabilă.
Serii cointegrate
 Posibile relaţii de cointegrare sugerate de teoria economică, variabilele fiind de
regulă considerate în formă logaritmată:
 între venit PIB şi consum C. Raportul C/PIB este constant pe termen lung, astfel ln(C)-
ln(PIB) este staţionar iar ln(C) şi ln(PIB) sunt cointegrate. In mod similar PIB şi investiţiile;
 cererea de monedă, preţuri, venit
 între cursul valutar, preţurile domestice respectiv preţurile din ţara străină, cursul real
având comportament staţionar (conform teoriei parităţii de cumpărare);
 cursul diferitelor acţiuni;
 rentabilitatea activelor şi rata inflaţiei, diferenţa acestora adică rata reală a rentabilităţii, ce
are comportament staţionar;
 ratele dobânzii pentru diferite maturităţi, diferenţa faţă de rata activului fără risc (rata pe
termen scurt) reflectând prima de risc a investitorilor;
 logaritmul indicelui preţului acţiunilor respectiv al dividendelor diferenţa reprezentând
logaritmul randamentului .
 logaritmul indicelui preţurilor respectiv al salariului , diferenţa reprezentând logaritmul
indicelui salariului real;
 cursurile acţiunilor (de regulă în formă logaritmată) etc.
Serii cointegrate
 Abordări în teoria cointegrării:

 abordări bazate pe o singură ecuaţie, cea mai cunoscută fiind metoda în


două etape propusă de Engle şi Granger;

 abordarea multivariată de tip VAR respectiv VECM; în acest caz ne


așteptăm la existenţa mai multor relaţii de cointegrare. În cazul general,
dat fiind un grup de mai multe variabile nestaţionare suntem interesaţi
dacă acestea sunt cointegrate, şi dacă sunt, care este relaţia de echilibru
pe termen lung dintre ele. Pentru analiza cointegrării între mai multe
procese nestaţionare, cu rădăcină unitate, se apelează la metodologia
dezvoltată de Johansen şi Juseliu (1990), implementată în softurile de
statistică.
Metodologia Engle-Granger
 Etapa 1:Testarea existenței unei relații de cointegrare între cele două
variabile
 a) se testează dacă ambele variabile sunt integrate de ordin 1, Yt , X t  I(1) , utilizând teste
de tip unit root, precum testul ADF

 b) se estimează regresia liniară Yt = a 0 + a 1X t +  t prin MCMMP pentru a obţine o



estimație a relaţiei (vectorului) de cointegrare. Interesant este că estimatorii obţinuţi pentru a 0
şi a 1 sunt superconsistenţi (în acest caz, când ambele variabile sunt I(1)), chiar dacă erorile sunt
corelate. Erorile standard nu sunt însă de încredere, astfel nu se pot realiza inferenţe privind
modelul pe termen lung. Dacă există o relaţie de cointegrare atunci MMP o va depista, iar dacă
nu există atunci regresia este falsă. Se extrag apoi estimaţiile pentru reziduuri:
  
 t = Yt − a 0 − a 1X t
Metodologia Engle-Granger

 c) se testează dacă reziduurile t sunt staţionare. Dacă ipoteza existenţei rădăcinii
unitate în seria reziduurilor este respinsă, atunci între cele două procese există relaţia de
cointegrare. Dacă reziduurile sunt staţionare cele două serii sunt cointegrate, relaţia de
cointegrare fiind cea estimată: Yt = aˆ 0 + aˆ1 X t +  t iar relaţia de echilibru pe termen
lung este: Yt = aˆ0 + aˆ1 X t

 Valorile critice adecvate testului ADF de cointegrare au fost obţinute de către MacKinnon
de asemenea prin simulare şi pot fi găsite în Johnston şi DiNardo (1994):

 T=50  ttab = - 3,29; T=100  ttab = -3,17; T=200  ttab = -3,25

 dacă tcalc < ttab  H0 se respinge  t sunt staţionare  Xt, Yt cointegrate


Metodologia Engle-Granger
 Etapa 2. Elaborarea unui model de tip ECM
 Relaţia pe termen scurt dintre două variabile cointegrate, cu relaţia de cointegrare:
Yt = a 0 + a1 X t +  t

poate fi descrisă printr-un model de corecţie a erorilor (“error correction model”), forma
simplă a acestuia fiind:

Yt =  + 1 X t +  (Yt −1 − aˆ 0 − aˆ1 X t −1 ) +  t sau

Yt =  + 1 X t + ˆt −1 +  t
  
 Reziduurile din ecuaţia de cointegrare  t −1 = Yt −1 − a0 − a1 X t −1 (ce surprind dezechilibrele pe
termen lung) sunt luate în considerare în modelul dinamic, fiind introduse ca un factor. Astfel,
modificările variabilei Y pe termen scurt depind de cele ale variabilei X şi de abaterea lui Y de la
valoarea sa de echilibru pe termen lung a + bX t −1 din perioada precedentă.
Metodologia Engle-Granger
 O altă modalitate de a detecta existenta unei relaţii de cointegrare constă
în testarea semnificației coeficientului  (cu alternativa mai mic decât zero)
în modelul ECM; dacă acesta este semnificativ atunci nu există o relaţie de
cointegrare între variabile.
Estimarea unui model de regresie între
două serii de timp
 1. Dacă variabilele sunt staţionare sau staţionare relativ la tendinţă
(deterministă) modelul este specificat pentru variabilele observate. Forma
generală a modelului dinamic adecvat în acest scop este:
p q
Yt =  + t +   i Yt −i +   j X t − j +  t
i =1 j =o

 Termenul t se include doar dacă una din variabile este staţionară relativ la tendinţă. In
acest caz testele clasice din regresie, bazate pe metoda celor mai mici pătrate sunt
asimptotic valide (dacă numărul datelor e suficient de mare).

 2. Dacă variabilele sunt nestaţionare, staţionare după o singură diferenţiere


şi nu sunt cointegrate, atunci, regresia se va estima pentru variabilele
diferenţiate. Modelul dinamic are forma:
p q
Yt =  +   i Yt −i +   j X t − j +  t
i =1 j =o
Estimarea unui model de regresie între
două serii de timp
 3. Dacă variabilele sunt nestaţionare şi cu rădăcină unitate, staţionare după prima
diferenţiere şi cointegrate, atunci regresia: Yt = a0 + a1 X t +  t furnizează un
estimator (super)consistent pentru relaţia de cointegrare pe termen lung dintre
variabile (Johnston şi DiNardo, 1994). Relaţia dintre variabile este estimată utilizând
un model de tip corecţie a erorilor:
m n
Yt =  + t + ˆt −1 +   i X t −i +   i Yt −i +  t
i =1 i =1

unde
ˆt −1 = Yt − aˆ 0 − aˆ1 X t
Analiza cauzalităţii dintre variabile
 În sensul abordării propuse de Granger (1969) X este cauza pentru Y, sau X explică pe Y,
dacă X ajută la predicţia lui Y.

 1. Pentru a testa dacă X este cauză pentruY, în sens Granger, se estimează ecuaţia de regresie:
k k

* Yt =  +   i Yt −i +   j X t − j +  t
i =1 j =0

unde k este fixat astfel încât erorile să fie zgomot alb.

 Relativ la această ecuaţie, ipoteza nulă respectiv alternativa sunt:


H 0 : 1 =  2 = ... =  k = 0, X nu este cauza pentru Y
H1 :   i  0
Analiza cauzalităţii dintre variabile
 Testarea ipotezei precedente se realizează utilizând un test de tip Fisher-
Snedecor:
( SSRr − SSRu ) / k ( Ru2 − Rr2 ) / k
F= =  F (k , n − 2k − 1)
SSRu /( n − 2k − 1) (1 − Ru2 ) /( n − 2k − 1)

 unde SSRu şi Ru2 reprezintă suma pătratelor reziduurilor respectiv


coeficientul de determinaţie în ecuaţia fără restricţii (*) iar SSRr şi Rr2 sunt
aceleaşi elemente dar în ecuaţia de regresie cu restricţii (**) ce include
doar termenii de tip Yt-i :
k
** Yt =  +   i Yt −i +  t
i =1
Analiza cauzalităţii dintre variabile
 În urma aplicării celor două teste sunt posibile patru concluzii:
 cauzalitate unidirecţională: X este cauză pentru Y (X →Y) dacă ipoteza nulă se
respinge la 1) şi se acceptă la 2);

 cauzalitate unidirecţională: Y este cauză pentru X (Y → X) dacă ipoteza nulă se


respinge la 2) şi se acceptă la 1);

 cauzalitate bidirecţională: X Y dacă ipoteza nulă se respinge atât la 1) cât şi la 2).


Serii de timp
MODELE ARCH
Aprilie 2023
Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Modelarea ARCH

 ARCH: AutoRegressive Conditional Heteroscedasticity


 Autoregressive indică faptul că heteroscedasticitatea observată pe anumite
perioade de timp poate fi autocorelată
 Conditional specifică faptul că varianța depinde de valorile trecute ale erorilor
 Heteroscedasticity înseamnă că varianța nu este constantă

 ARCH înseamnă că seria de timp are o dispersie ce variază în timp


(heteroscedasticity) ce depinde (conditional) de efectele decalate
(autocorrelation).

 Aceste modele au fost popularizate de câștigătorul Premiului Nobel, Robert


F. Engel (1982). Engel a introdus pentru prima dată acest tip de modele,
considerând că varianţa erorii depinde de termeni de tipul Yt −i şi  t2−i .
Când se folosesc modelele de tip ARCH?
 Analiza evoluţiei pe termen lung a variabilelor financiare sau economice, relevă deseori
faptul ca varianţa acestora variază în timp. Astfel modelele ARCH au în vedere atât
previziunile economice dar și modelarea volatilității varianței.
 Modelele de tip ARCH sunt o clasă de modele populare în domeniul financiar pentru
modelarea:
 atitudinii investitorilor nu doar cu privire la valorile așteptate dar și cu privire la risk
 evoluţiei ratei inflaţiei, a dobânzilor, a ratei rentabilității activelor. Dacă nu este luat în
considerare și risk-ul sau variabilitatea este considerată constantă, în situații de volatilitate
mare pierderile ar imense din cauza erorilor mai de previziune

 Volatilitatea ridicată apare deseori în perioade cu turbulenţe politice sau economice


sau ca răspuns la anumite evenimente punctuale.
 Dedependenţa de timp a varianţei empirice în seria ratei rentabilităţii acţiunilor a fost
observată pentru prima dată de Kendall (1953):
 seria de timp disponibilă atunci fiind împărţită în două subeşantioane de date, în scopul analizei
omogenităţii varianţei în timp.
 autorul a observat cum media rămânea constantă iar varianţa creştea în timp
Modele ARCH/GARCH
 Idei fundamentale pentru modelarea ARCH:
 In abordarea tradiţională de tip Box-Jenkins previziunile sunt bazate pe media condiţionată
a variabilei E (Yt | Yt −1 , Yt − 2 ,...)
 Abordarea de tip ARCH ia în considerare, în elaborarea previziunilor, şi informaţiile
conţinute în varianţa condiţionată a procesului (momentul condiţionat de ordinul
doi).
 Abordarea de tip ARCH poate fi folosită atât pentru serii staționare în medie cât si
nestaționare în medie
 Abordarea de tip ARCH este specifică seriilor cu varianţă variabilă în timp (nestaţionare
relativ la varianţă).
 În abordarea de tip ARCH erorile nu au aceeaşi varianţă (adică nu verifică condiţia de
homoscedasticitate) intervalele de timp cu erori de previziune mari (în perioade de
instabilitate economică) fiind urmate de intervale cu erori mici.
Modelarea ARCH

 Ce este varianța condiționată?


 Ipoteza homoscedasticității (varianță constantă) este foarte limitativă în practică și
din acest motiv este de preferat să considerăm că varianța depinde (condițional) de
istoricul ei.

 Deci modelarea ARCH presupune estimarea, previziunea sau măsurarea


volatilității variabilelor economico-financiare.

 Modelarea ARCH se realizează prin intermediul a două tipuri de ecuaţii:


 ecuaţia mediei condiţionate ce poate include şi variabile exogene
 ecuaţia varianţei condiţionate.
Specificarea econometrică
 Fie modelul:
𝑌𝑡 = 𝑐 + 𝑢𝑡 [1]
𝑢𝑡 ห𝐼𝑡−1 ~𝑁 0, 𝜎𝑡2 [2]
𝜎𝑡2 = ℎ𝑡 [3]
 Ecuația [1]: 𝑌𝑡 este exprimat ca media lui, constanta c adunată cu un zgomot alb. Aceasta este
ecuația mediei.
 Ecuația [2]: Distribuția termenului eroare condiționată de informația disponibilă la momentul
t-1 este normală de medie zero și dispersie 𝜎𝑡2
 Ecuația [3]: Dispersia erorilor 𝜎𝑡2 variază în timp, este heteroscedastică, egală cu ℎ𝑡 .

 Procesul ARCH(1):
2
ℎ𝑡 = 𝑏0 + 𝑏1 𝑢𝑡−1 0 < 𝑏0 , 0 < 𝑏1 <1

 Interpretare:
 Când un șoc puternic intervine în perioada t-1 ne așteptăm ca valoarea lui ut să fie mare în
2
valoarea absolută, ceea ce înseamnă că atunci când 𝑢𝑡−1 este mic/mare și 𝑢𝑡2 va fi mic/mare.
 b1 0 pentru că pătratul erorilor prezintă corelație serială pozitivă și varianța este pozitivă
 𝑏1 <1 este o condiție de stabilitate – altfel procesul ar fi exploziv.
Specificarea econometrică
 Procesul ARCH(q) :
 2
ARCH(1): ℎ𝑡 = 𝑏0 + 𝑏1 𝑢𝑡−1 0 < 𝑏0 , 0 < 𝑏1
2 2
 ARCH(2): ℎ𝑡 = 𝑏0 + 𝑏1 𝑢𝑡−1 + 𝑏2 𝑢𝑡−2
 ...
2 2 𝑞 2
 ARCH(q): ℎ𝑡 = 𝑏0 + 𝑏1 𝑢𝑡−1 + ⋯ + 𝑏𝑞 𝑢𝑡−𝑞 = 𝑏0 + σ𝑖=1 𝑏𝑖 𝑢𝑡−𝑖

 Interpretare:
 Normalitatea condițională a erorilor înseamnă că distribuția depinde de
informația cunoscută de la momentul t-1:
2
 dacă t=2, 𝑢𝑡 ห𝐼1 ~𝑁 0, 𝑏0 + 𝑏1 𝑢𝑡−1
2
 dacă t=3, 𝑢𝑡 ห𝐼2 ~𝑁 0, 𝑏0 + 𝑏1 𝑢𝑡−1 ...
Exemple serii ce prezintă volatilitate

 Volatilitate clusterizată:
 Volatilitate: Seria de timp prezintă perioade în
Valorile seriei de timp se schimbă care schimbările sunt mari urmate
rapid într-o formă aparent de perioade în care schimbările
necontrolată sunt mai reduse
Simulare ARCH in EViews
 Pas 1 - se crează un fisier nou Eviews
 - se completează numele fișierului
 - se completează Frecventa Monthly/...
 - se specifică data de început și de final: Start date; End date

 Pas 2 – Se folosește interfața Command:


 Vom simula modelele:
Modelul cu varianță constantă: 𝜎𝑡2= ℎ𝑡 = 3,5 2
ARCH(2): ℎ𝑡 = 3,5 + 0,5∗ 𝑢𝑡−1 2
+ 0,48 ∗ 𝑢𝑡−2
Command: Command:
smpl @all smpl @all
series eta=nrnd series eta=nrnd
smpl @first @first+1 smpl @first @first+1
series y=@sqrt(3.5)*eta series y1=@sqrt(3.5/(0.5+0.48))*eta
smpl @first+2 @last smpl @first+2 @last
y= @sqrt(3.5)*eta y1= @sqrt(3.5+0.5*y(-1)^2+0.48*y1(-2)^2)*eta
smpl @all smpl @all
Rezultate simulare
Testarea existenței efectelor ARCH
 Înaintea estimării modelelor ARCH trebuie testată existența efectelor
ARCH(q). Dacă nu există efecte ARCH nu este necesară estimarea
modelelor de tip ARCH
 Pentru testarea existenței efectelor ARCH, reprezentarea efectelor AR în
rezidualuri este dată de:
2
 𝑢𝑡2 = 𝑏0 + 𝑏1 𝑢𝑡−1 2
+ ⋯ + 𝑏𝑞 𝑢𝑡−𝑞 +𝑒𝑡
 Semnificația parametrilor bi va indica presența volatilității condiționate, deci a
efectelor ARCH:
 Ipoteza nulă este: H0: b1 = ...= bq =0
 Pentru testarea efectelor ARCH(1):
 H0: b1 = 0 și H1: b1 ≠0
 Multiplicatorul Lagrange (LM) este folosit adesea pentru testarea existenței efectelor
ARCH
 Dacă nu există efecte ARCH, atunci b1 = 0 și modelul erorilor va fi foarte slab, R2 fiind
foarte mic
Testul Lagrange (LM)

 Statistica LM = (T-q)R2
 unde T este volumul eșantionului
 q este numărul de termeni autoregresivi din modelul pătratelor erorilor
 R2 este coeficientul de determinare din modelul erorilor

 Dacă H0 este adevărată:


 LM este distribuită pentru eșantioane mari 𝜒 2(𝑞)

 Regula de decizie:
 dacă LM 𝜒 2(1−𝛼,𝑞) atunci se respinge H0 deci există efecte de tip ARCH
Fie datele privind indicele FTSE (Financial Times
Stock Exchange) din fisierul de date arch.xls
Exemplu
Exemplu
 b1=0.123 și este semnificativ statistic pentru un nivel de semnificație de 1%.
 LM=15,39, p-value=0,0001
 Deci ipoteza nulă privind inexistența efectelor ARCH este respinsă. Deci există efecte ARCH.
 Concluzie: Pentru obținerea unor rezultate mai bune este bine să estimăm un model ARCH
Estimarea modelelor ARCH
 Obiectiv:
 Folosind Eviews pentru exemplul indicelui FTSE se dorește previzionarea volatilității
randamentelor pentru stocurile FTSE
 Estimarea efectelor ARCH se realizează folosind metoda verosimilității maxime
Estimarea modelelor ARCH
 𝑏෠0 = 0.0003
 ℎ෠ 𝑡 = 𝑏෠0 + 𝑏෠1 𝑢ො 𝑡−1
2
=
2
= 0.0000646 + 0.0107 𝑢ො 𝑡−1

Rezultate:

- Ecuația mediei:
- randamentul mediu este de 0.0003

- Ecuația varianței:
- Volatilitatea este dependentă de timp:
- include o constantă semnificativă (0,0000646)
- O componentă ce depinde de valorile trecute
2
ale erorilor (0,107478 𝑢ො 𝑡−1 )
- Efectele ARCH sunt semnificative – statistica z
asociată este 4,83 care sugerează existența unui
coeficient ARCH(1) semnificativ
Previziunea modelelor ARCH
 Pentru previziune sunt folosite rezultatele obținute din estimarea modelului
ARCH pentru calculul valorilor statice și dinamice pentru medie,
previziunile erorii standard și a varianței condiționate.

 Pentru exemplul anterior:


 Randamentul mediu estimat este:
 𝑏෠0 = 0.0003
 Varianța estimată:
 ℎ෠ 𝑡+1 = 𝑏෠0 + 𝑏෠1 𝑢ො 𝑡2 unde 𝑢ො 𝑡2 =(𝑟𝑡 −𝑟𝑡Ƹ )2 estepatratul erorii estimate la momentul t care
este folosit pentru determinarea dispersiei conditionate de la moentul t+1
 Deci ℎ෠ 𝑡+1 = 0.0000646 + 0.107478(𝑟𝑡 −0.0003)2
Previziunea modelelor ARCH
Previziunea modelelor ARCH
 Previziune în dinamică pentru întregul eșantion
 În acest caz volatilitatea este stabilă. Se află între limitele intervalului de
încredere.
 Varianța condiționată nu se modifică în timp
Previziunea modelelor ARCH

 Previziune statică pentru întregul eșantion


 Volatilitatea este stabilă. Ea se află între limitele intervalului de încredere.
Bibliografie
• Gujarati, D., Porter, D., Basic Econometrics, 5th edition, McGraw-Hill, 2009,

• EViews Learning Resouces, Online Tutorials


http://www.eviews.com/Learning/index.html, namely Time Series Estimation

• Youtube presentations: CrunchEconometrix


Modele SARIMA
(exemple in Eviews)
Aprilie 2023
Curs Serii de timp – Prof.univ.dr. Cristina BOBOC

Sursa informatiilor : Conf. univ. dr. Mihaela Covrig, Time series, part 8, lecture and exercises, 2019-2020,
draft
Alte surse bibliografice:
• Gujarati, D., Porter, D., Basic Econometrics, 5th edition, McGraw-Hill, 2009,
Chapter 21. Time Series Econometrics: Some Basic Concepts, pp. 737-772 and
Chapter 22. Time Series Econometrics: Forecasting, pp. 773-800.
• Florian Pelgrin http://math.unice.fr/~frapetti/CorsoP/Chapitre_5_IMEA_1.pdf
• EViews Learning Resouces, Online Tutorials http://www.eviews.com/Learning/index.html, namely Time Series
Estimation (Part C: Serial Correlation and ARMA modelling) and Forecasting
• http://www.eviews.com/help/helpintro.html#page/content%2Ftimeser-
Estimating_ARIMA_and_ARFIMA_Models_in_EViews.html%23

Exemplul 1:
Fie datele lunare privind vânzările auto cu amănuntul din SUA, în 1990 miliarde USD, deflaționate
la valoarea anului 1990 (folosind factorul de inflatie, din ianuarie 1970 până în mai 1993 (279
observații) cu modele ARIMA sezoniere. Pentru a vedea procedura de deflationare și de
desezonalizare puteti analiza fisierul excel: https://people.duke.edu/~rnau/Auto_sales_data.xlsx
(fisier preluat pe de site-ul : https://people.duke.edu/~rnau/seasarim.htm).
In continuare va fi folosit fisierul : Date vanzari auto_USA.xlsx.

Seria de timp reprezentată grafic demostrează existența unei compomente sezoniere și a uneia
tendință.

1
Modelul „podului suspendat” din ACF este tipic pentru o serie care este atât nestaționară, cât și
puternic sezonieră.
S-ar putea să avem nevoie de cel puțin un ordin de diferențiere.

Dacă se diferențiază seria o data, nesezonier:


series D_AUTOSALE_CPI = d(AUTOSALE_CPI)
se obțin următoarele reprezentări grafice :

Seria diferențiată D_AUTOSALE_CPI arată mai mult sau mai puțin staționară, dar există încă o
autocorelație foarte puternică în perioada sezonieră (lag 12, 24 sau 36), așa cum se observă din
corelogramă.

Deoarece patternul sezonier este puternic și stabil, atunci ar trebui folosit un ordin de diferențiere
sezonierăși create o nouă serie D_12_AUTOSALE_CPI, care este variabila AUTOSALE_CPI
diferențiată sezonier, pentru s = 12:

series D_12_AUTOSALE_CPI = AUTOSALE_CPI – AUTOSALE_CPI(–12)

2
Seria diferențiată sezonier, D_12_AUTOSALE_CPI, prezintă un pattern puternic de autocorelație
pozitivă. Aceasta ar putea fi o „semnătură AR” - sau ar putea semnala necesitatea unei alte
diferențieri.

Să luăm atât o diferență sezonieră, cât și non-sezonieră, aceasta înseamnă că luăm în considerare
diferența sezonieră (pentru s = 12) a diferenței non-sezoniere de ordinul întâi:

series X = D_AUTOSALE_CPI – D_AUTOSALE_CPI(–12)

3
Se observă că o diferențiere sezonieră și una non-sezonieră ne conduce la o serie de timp pentru care
prezintă o valoare negativă semnificativă a ACF la decalajul 1 și, de asemenea, o valoare negative
semnificativă a ACF la decalajul 12, în timp ce PACF arată un model de „descompunere” mai gradual
în vecinătatea ambelor decalaje.

Folosind regulile:
 Dacă funcția de autocorelație (ACF) a seriei diferențiate afișează o descreștere bruscă și/sau
autocorelația la lag 1 este negativă, atunci luați în considerare adăugarea unui termen MA
la model. Decalajul de la care se anulează ACF este numărul indicat de termeni MA.
 Dacă autocorelația (ACF) în perioada sezonieră este pozitivă, luați în considerare adăugarea
unui termen SAR la model. Dacă autocorelația în perioada sezonieră este negativă, luați în
considerare adăugarea unui termen SMA la model.
 Nu folositi niciodată mai mult de un ordin de diferențiere sezonieră sau mai mult de două
ordine de diferențiere per total (sezonieră și nesezonieră)

Aplicănd regulile anterioare, se poate spune că seria de timp are un termen MA(1) și unul SMA(12).
Se obține un model ARMA(0,1)x(0,1)12 pentru seria de timp X, adică un model
ARIMA(0,1,1)x(0,1,1)12 pentru seria de timp AUTOSALE_CPI. Unii dintre autori consider ce cel
mai folosit model ARIMA sezonier este ARIMA(0,1,1)x(0,1,1)12.

Deși mai există o valoare mică a autocorelației la


lag 12, aspectul general al corelogramei
rezidualurilor este bun. Coeficienții estimați
MA (1) și SMA (1) (obținuți după 9 iterații) sunt
semnificativi.

4
12

8
Forecast: XF_EQ_3_C
Actual: X
4 Forecast sample: 1970M01 1993M03
Included observations: 266
0
Root Mean Squared Error 1.607615
Mean Absolute Error 1.200549
Mean Abs. Percent Error 316.3107
-4 Theil Inequality Coefficient 0.406143
Bias Proportion 0.000214
-8 Variance Proportion 0.050624
Covariance Proportion 0.949162
-12
70 72 74 76 78 80 82 84 86 88 90 92

XF_EQ_3_C ± 2 S.E.

✓ Root Mean Squared Error (RMSE) este abaterea standard a erorilor prognozate.
✓ Rețineți că RMSE și Mean Absolute Error depind de scara variabilei dependente, în
timp ce următoarele două statistici (Mean Abs. Percent Error si Theil Inequality
Coefficient) sunt invariante la scară. Coeficientul Theil se situează între 0 și 1, iar 0
indică o potrivire perfectă.
✓ Bias Proportion - indică cât de departe este media prognozei față de media seriei
efective. O valoare apropiată de 0 indică faptul că modelul ales a estimat bine media.
✓ Variance Proportion - indică cât de departe este varianța prognozelor față de varianța
seriei reale. O valoare apropiată de 0 indică faptul că modelul ales a estimat bine
varianța.
✓ Covariance Proportion - măsoară erorile de prognoză nesistematice rămase.
✓ Rețineți că proporțiile Bias, Variance și Covariance adunate fac 1 (sunt date ca
proporții din 1).
✓ Dacă prognozele sunt „bune”, Bias și Variance proportions ar trebui să fie mici, iar
Covariance Proportion ar trebui să fie mare (aproape de 1).

o Scrieți modelul estimat (ecuația previzionată).

Din Eq_3_C, obținem seria de timp

( X t )t ~ ARMA ( p = 0, 0, q = 1)  ( P = 0, 0, Q = 1)12 ,
5
1
(
dar X t = 1 − B 1 − B
12
Salest )( )
(( )( ) )
 1 − B1 1 − B12 Salest t ~ ARMA ( p = 0,0, q = 1)  ( P = 0,0, Q = 1)12

și ( Salest )t ~ ARIMA ( p = 0, d = 1, q = 1)  ( P = 0, D = 1, Q = 1)12


Deoarece ( X t )t ~ ARMA ( p = 0, q = 1)  ( P = 0, Q = 1)12 , folosind următorii operatori
▪ Componentele nesezoniere sunt:
• Operatorul nesezonier autoregresiv de ordin p=0, AR:
 p (B ) =  0 (B ) = 1 este operatorul identitate deoarece nu există nici o component
autoregresivă nesezonieră.
• Operatorul nesezonier de medie mobile de ordin q=1, MA:
 q (B ) = 1 (B ) = 1 + 1  B .
▪ Componentele sezoniere sunt:
• Operatorul sezonier autoregresiv de ordin P=0, SAR:
( ) ( )
 P B s =  0 B12 = 1 este operatorul identitate deoarece nu există nici o component
autoregresivă sezonieră.

• Operatorul sezonier de medie mobile de ordin Q=1, SMA:


( ) ( )
Q B s = 1 B12 = 1 + 1 (12 )  B12 ,

putem scrie ( )
X t = 0 + 1 (B ) 1 B12  t

=  0 + (1 + 1  B1 )(1 + 1(12 )B12 ) t

=  + (1 +  ( )B +   B +    (
0 1 12
12
1
1
1 1 12 )  B
13
) t
=  0 +  t + 1(12 )B12 ( t ) + 1  B1 ( t ) + 1  1(12 )  B13 ( t )

= 0 +  t + 1(12 ) t −12 + 1   t −1 + 1  1(12 )   t −13

( )(
Din X t = 1 − B1 1 − B12 Salest )
(
= 1 − B12 − B1 − B13 Salest )
= Salest − B12 (Salest ) − B1 (Salest ) − B13 (Salest )

= Salest − Salest −12 − Salest −1 − Salest −13

Deci
Salest − Salest −12 − Salest −1 − Salest −13 = 0 +  t + 1(12 ) t −12 + 1   t −1 + 1  1(12 )   t −13
sau

6
Salest = Salest −1 + Salest −12 + Salest −13 +
+ 0 + 1   t −1 + 1(12) t −12 + 1  1(12)   t −13 +  t

Și ecuația este:

̂ 𝑡 = 𝑆𝑎𝑙𝑒𝑠𝑡−1 + 𝑆𝑎𝑙𝑒𝑠𝑡−12 + 𝑆𝑎𝑙𝑒𝑠𝑡−13 + 𝜃̂0 + 𝜃̂1 ∙ 𝜀𝑡−1 + 𝜃̂1(12) ∙ 𝜀𝑡−12 + 𝜃̂1 ∙ 𝜃̂1(12) ∙ 𝜀𝑡−12
𝑆𝑎𝑙𝑒𝑠

unde 𝜃̂0 = −0.002771, 𝜃̂1 = −0.494284, 𝜃̂1(12) = −0.930491

și 𝜀̂𝑡 sunt rezidualurile din EQ_3_C.

Tabelul următor conține valorile variabilei Vânzări și reziduurile din ultimele 27 de luni din perioada
observată. Acestea vor fi utilizate pentru a produce estimări punctuale ale vânzărilor pentru
următoarele luni, în conformitate cu următoarele reguli:
o înlocuiți erorile anterioare cu reziduurile corespunzătoare,
o înlocuiți observațiile viitoare cu previziunile lor și
o înlocuiți erorile viitoare cu zero.

Calculați prognozele punctuale ale autosale_cpi pentru lunile rămase din 1993

Data AUTOSALE_CPI RESID_EQ_3_C


t 𝑆𝑎𝑙𝑒𝑠𝑡 𝜀̂𝑡
1991M01 24.337 -1.560789
1991M02 25.642 -0.332646
1991M03 30.376 -0.032071
1991M04 31.215 1.004825
1991M05 32.821 0.968488
1991M06 31.528 -1.048326
1991M07 31.869 1.178019
1991M08 30.724 -0.515429
1991M09 29.221 -0.094095
1991M10 29.094 -0.115821
1991M11 26.304 -0.778725
1991M12 25.488 -0.518035
1992M01 26.633 1.567101
1992M02 27.907 1.154658
1992M03 31.215 -0.729359
1992M04 32.119 0.656918
1992M05 32.391 -0.567535
1992M06 34.034 1.237467
1992M07 33.434 1.251598
1992M08 31.176 -1.512909
1992M09 31.533 1.264458
1992M10 32.07 1.227284
1992M11 28.161 -1.180878

7
1992M12 28.753 0.703222
1993M01 27.81 -0.041337
1993M02 28.232 -0.516042
1993M03 33.796 0.794074

Încercați să determinati un alt model ARIMA sezonier pentru autosale_cpi.

8
o Comparați cele două modele: EQ_3_C și EQ_4_C pe baza rezultatelor anterioare.

Indicatori de precizie a predicției:

9
Exemplul 2: http://ucanalytics.com/blogs/step-by-step-graphic-guide-to-forecasting-through-arima-
modeling-in-r-manufacturing-case-study-example/
Vanzarile lunare de tractoare produse de PowerHorse se regasesc in fisierul: tractor-salex.xlsx.
Potriviti un model SARIMA acestei serii de timp și previzionați vînzările următorului an.

10
series X = D_L_TRACTORS - D_L_TRACTORS(-12)

11
12
13
Metodologia Box Jenkins
(exemple in Eviews)
Aprilie 2023
Curs Serii de timp – Prof.univ.dr. Cristina BOBOC

Sursa informatiilor : Conf. univ. dr. Mihaela Covrig, Time series, part 10, lecture and exercises, 2019-
2020, draft
Alte surse bibliografice:
• Gujarati, D., Porter, D., Basic Econometrics, 5th edition, McGraw-Hill, 2009,
Chapter 21. Time Series Econometrics: Some Basic Concepts, pp. 737-772 and
Chapter 22. Time Series Econometrics: Forecasting, pp. 773-800.
• Florian Pelgrin http://math.unice.fr/~frapetti/CorsoP/Chapitre_5_IMEA_1.pdf
• EViews Learning Resouces, Online Tutorials http://www.eviews.com/Learning/index.html, namely
Time Series Estimation (Part C: Serial Correlation and ARMA modelling) and Forecasting
• http://www.eviews.com/help/helpintro.html#page/content%2Ftimeser-
Estimating_ARIMA_and_ARFIMA_Models_in_EViews.html%23

The Box-Jenkins methodology:


G. P. E. Box and G. M. Jenkins, Time Series Analysis: Forecasting and Control, revised ed., Holden Day,
San Francisco, 1978.

Metodologia Box–Jenkins (BJ) este de fapt metodologia de idetificare a modelelor ARIMA:


accentul nu se pune pe construirea de modele cu o singură ecuație sau cu ecuații simultane, ci pe analiza
proprietăților probabilistice sau stochastice ale seriilor economice de timp pe baza evoluției lor anterioare.

Modelele Box Jenkins permit ca seria de timp Xt să fie explicată prin valori trecute sau decalate ale lui X și
prin intermediul termenilor eroare stocastici εt. Modelele ARIMA sunt uneori numite modele ateoretice,
deoarece nu sunt derivate din nici o teorie economică.

Metodologia Box-Jenkins
Construcția unui model ARIMA(p, d, q) constă în 4 pași:

Etapa 1: Identificare: determinarea valorilor corespunzătoare ale p, d și q, pentru a surprinde


caracteristicile dinamice ale datelor. Vom folosi proceduri grafice (reprezentarea grafică a seriei de timp,
ACF și PACF etc.).

1
Etapa 2 : Estimare (și selecție): această etapă implică estimarea parametrilor diferitelor modele (folosind
pasul 1) și o primă selecție de modele (folosind criteriile informaționale).

Etapa 3 : Verificarea/Testarea: în această etapă se determină dacă modelul (modelele) specificat (e) și
estimat (e) este (sunt) adecvat (e). În special, se folosește testarea rezidualurilor (erorilor). După ce am ales
un anumit model ARIMA și i-am estimat parametrii, vom vedea în continuare dacă modelul ales se
potrivește destul de bine cu datele, deoarece este posibil ca un alt model ARIMA să fie mai bun.
Acesta este motivul pentru care modelarea Box – Jenkins ARIMA este mai mult o artă decât o știință; este
necesară o abilitate considerabilă pentru a alege modelul ARIMA potrivit.
O primă verificare a modelului se face în cee ace privește reziduurile estimate din acest model: daca acestea
sunt zgomot alb putem accepta modelul ca fiind potrivit seriei de timp, altfel trebuie reluat procesul.

Etapa 4 : Utilizarea modelului pentru previziune


Metodologia BJ este un proces iterativ :

2
Exemplu. Fie seria temporală a PIB-ului SUA, miliarde de dolari SUA, date trimestriale ajustate sezonier din
1947 până în 2007, exemplu furnizat în Gujarati, D., Porter, D., Basic Econometrics, ediția a V-a, McGraw-
Hill, 2009, pp 778-784. Datele sunt disponibile la www.mhhe.com/gujarati5e sau
http://highered.mheducation.com/sites/0073375772/information_center_view0/index.html în fișierul Tabelul
21_1.xls. Datele privind PIB-ul SUA au fost introduse într-un fișier de lucru EViews.
Seria cronologică este denumită GDP.

Reprezentarea grafică a seriei de timp :

PIB-ul seriei temporale este staționar?

Comentează graficul de timp și folosește testele


rădăcină unitare.

Transformarea ln sau log a PIB-ului va elimina


varianța neconstantă în seria temporală
(transformarea logului va induce staționaritatea
în varianță).

seria LGDP = log (PIB)

Comentarii privind functia de autocorelație pe


eșantion(SACF) și se autocorelație partială pe
eșantion (SPACF) pentru seria LGDP:
▪ SACF pornește de la valori foarte mari, de la 0.988 la
lag 1 și descrește lent, deci LGDP nu este staționară.
▪ Valorile funcției ACF - ρ(k) până la lag 20 sunt
semnificativ diferite de zero pentru fiecare k,
deoarece estimatorii în eșantion sunt în afara
intervalului de încredere pentru o probabilitate de
garantare a rezultatelor de 95%.
▪ SPACF înreistrează pentru lag 1 o valoare mare
0.988 la fel ca și SACF, dar descrește brusc după lag
1 catre valori foarte apropiate de 0.

3
Testul Unit Root pentru seria de timp LGDP.

Conform testului Dickey Fuller seria de timp


LGDP nu este staționară deoarece pentru un nivel
de semnificație de 0,05 se acceptă ipoteza nulă H0 :
LGDP are o rădăcină unitate (statistica t calculată
în modul este mai mică decât valoarea tabelată
corespunzătoare unui nivel de semnificație de 0,05:
2,67<3,42).

Pentru a o transforma într-o serie de timp staționară se vor calcula diferențele de ordinul I: d(LGDP) obținându-
se seria DLGDP.

Se testează dacă această nouă serie este staționară folosind testul Unit Root Tests.

4
Null Hypothesis: DLGDP has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=14)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -11.02044 0.0000


Test critical values: 1% level -3.457286 Conform testului Dickey Fuller seria de timp
5% level -2.873289
10% level -2.573106 DLGDP poate fi considerate slab staționară
*MacKinnon (1996) one-sided p-values.
deoarece pentru un nivel de semnificație de 0,05 se
Augmented Dickey-Fuller Test Equation respinge ipoteza nulă H0 : DLGDP are o rădăcină
Dependent Variable: D(DLGDP)
Method: Least Squares
Date: 04/11/17 Time: 11:14 unitate (statistica t calculată în modul este mai
Sample (adjusted): 1947Q3 2007Q4
Included observations: 242 after adjustments mare decât valoarea tabelată corespunzătoare unui
Variable Coefficient Std. Error t-Statistic Prob.
nivel de semnificație de 0,01: 11,023,46).
DLGDP(-1) -0.671086 0.060895 -11.02044 0.0000
C 0.005570 0.000780 7.140706 0.0000

R-squared 0.336008 Mean dependent var 1.09E-05


Adjusted R-squared 0.333241 S.D. dependent var 0.011335
S.E. of regression 0.009256 Akaike info criterion -6.518950
Sum squared resid 0.020560 Schwarz criterion -6.490116
Log likelihood 790.7929 Hannan-Quinn criter. -6.507334
F-statistic 121.4501 Durbin-Watson stat 2.054237
Prob(F-statistic) 0.000000

Seria de timp LGDP este integrate de ordin 1, LGDP ~ I(1), deoarece LGDP nu esra staționară și după o
primă diferențiere devine staționară.

Deci ordinul de integrare este d=1, pentru seria LGDP.


LGDP ~ ARIMA(p, d=1, q)

În acest moment trebuie identificat modelul potrivit seriei de timp DLGDP folosind un model ARMA(p, q).
Pentru identificarea ordinelor p și q se vor reprezenta graphic funțiile SACF și SPACF pentru seria staționară
DLGDP.

▪ Funcția de autocorelație ρ(k) pare


semnificativ diferită de zero, pentru lag k =
1, 2 și 5.
▪ Funcția parțială de autocorelație ϕk,k pare
semnfiicativ diferită de zero, pentru lag k =
1, and 12.

5
Pattern-uri teoretice ale ACF și PACF

Model ACF PACF


AR(p) Descreștere exponențială (sau geometrică) sau Valori semnificativ diferite de zero
sinusoidală până la lag p și nesemnfiicative de
la p+1 încolo
MA(q) Valori semnificativ diferite de zero până la lag q Descreștere exponențialăsau
și nesemnfiicative de la q+1 încolo sinusoidală
ARMA(p, q) Descreștere exponențială sau sinusoidală Descreștere exponențială sau
sinusoidală

În practică, identificarea p și q folosind ACF și PACF implică o abordare de încercare și eroare cu mai multă
sau mai puțină subiectivitate în interpretarea acestor funcții, deoarece „datele reale” rareori prezintă modele
simple, exacte.
Metodologia generală este:
• Se aleg două valori maximale pmax și qmax, pentru ordinele AR și MA astefl încât 𝑝𝑚𝑎𝑥 =
𝑚𝑎𝑥{𝑘|𝜙𝑘,𝑘 ≠ 0} and 𝑞𝑚𝑎𝑥 = 𝑚𝑎𝑥{𝑘|𝜌(𝑘) ≠ 0};
• Se estimează toate modelele posibile ARMA(p, q) pentru 0 ≤ 𝑝 ≤ 𝑝𝑚𝑎𝑥 și 0 ≤ 𝑞 ≤ 𝑞𝑚𝑎𝑥 , folosind
metoda verosimilității maxime;
• Se folosesc criteriile informaționale: Akaike (AIC) și Schwarz (SBIC), sau alte procedure pentru
alegerea celor mai bune modele astfel:

min 𝐴𝐼𝐶(𝑝, 𝑞)
0≤𝑝≤𝑝𝑚𝑎𝑥 , 0≤𝑞≤𝑞𝑚𝑎𝑥

sau
min 𝑆𝐵𝐼𝐶(𝑝, 𝑞)
0≤𝑝≤𝑝𝑚𝑎𝑥 , 0≤𝑞≤𝑞𝑚𝑎𝑥

sau
max 𝐿𝑜𝑔 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑(𝑝, 𝑞)
0≤𝑝≤𝑝𝑚𝑎𝑥 , 0≤𝑞≤𝑞𝑚𝑎𝑥

sau
max 𝑅̅ 2 𝑜𝑓 𝐴𝑅𝑀𝐴(𝑝, 𝑞)
0≤𝑝≤𝑝𝑚𝑎𝑥 , 0≤𝑞≤𝑞𝑚𝑎𝑥

În cazul nostrum: pmax=1 and qmax= 2, deci vor fi estimate următoarele modelepentru seria de timp staționară
DLGDP:
p q 0 1 2
0 ARMA(0,0) ARMA(0,1), that is MA(1) ARMA(0,2), that is MA(2)
1 ARMA(1,0), that is AR(1) ARMA(1,1) ARMA(1,2)

6
Estimarea parametrilor a fost realizată folosind metoda verosimilității maxime folosind:
• Maximum Likelihood, implementată în EViews 8 și 9,
• Least Squares method (Nonlinear Least Squares NLS and ARMA) în EViews 7

ARMA(0, 0)

ARMA(1,0)

ARMA(0,1)

7
ARMA(0,2)

ARMA(1,1)

8
ARMA(1,2)

Modelele identificate
ARMA(1,0) ARMA(0,1) ARMA(0,2)
ARMA(1,1) ARMA(1,2)
sau AR(1) sau MA(1) sau MA(2)
AIC –6.518950 –6.493237 –6.526104 –6.514880 –6.520065
BIC –6.490116 –6.464488 –6.482979 –6.471629 –6.462397
HQIC –6.507334 –6.481657 –6.508734 –6.497457 –6.496834
Log likelihood 790.7929 790.9283 795.9216 791.3005 792.9279
Adjusted R Square 0.104671 0.081077 0.114402 0.104688 0.112937
Este modelul de
regresie semnficativ
yes yes yes yes Yes
pentru un nivel de
semnificație de 5%?
C yes yes yes yes Yes
Parametrii sunt
semnificativi?

ar(1) yes yes No


ma(1) yes yes no No
ma(2) yes No
Rezidualurile sunt
yes no yes yes Yes
White Noise?

Dintre toate aceste modele, modelul ARMA(0,2) sau MA(2) este cel mai bun din punctul de vedere al
următoarelor criterii:
 Are cea mai mica valoare a AIC,
 Are cea mai mare valoare a Log likelihood și Adjusted R Square,
 Este semnificativ statistic,

9
 Are rezidualurile white noise,
 Parametrii sunt semnificativi diferiți de zero.
Pentru eșantion s-au obținut estimatorii parametrilor :
𝜇̂ = 0,008230 ; 𝜃̂1 = 0,292321 ; 𝜃̂2 = 0,204590
Modelul de regresie estimat este :
∇ln̂
(𝐺𝐷𝑃𝑡 ) = 𝜇̂ + 𝜃̂1 𝜀𝑡−1 + 𝜃̂2 𝜀𝑡−2 , t=1947(Q2)-2007(Q4)
Iar rezidualurile estimate sunt :
𝜀̂𝑡 = ∇ ln(𝐺𝐷𝑃𝑡 ) − ∇ln̂
(𝐺𝐷𝑃𝑡 )

În Eviews se pot determina valorile rezidualurilor și ale valorilor previzionate pentru perioada de timp
observată în View/Actual, Fitted, Residual Table:

T Actual DLGDP Fitted DLGDP Residuals


2007 Q1 0.00150 0.00678 -0.00528
2007 Q2 0.00937 0.00651 0.00287
2007 Q3 0.01198 0.00799 0.00399
2007 Q4 0.00144 0.00988 -0.00854

Pentru previzionarea ratei de creștere pentru anul 2008 a ln(GDP) se va determina :

̂
∇ln (𝐺𝐷𝑃 ̂ ̂
2008(𝑄1) ) = 𝜇̂ + 𝜃1 𝜀2007(𝑄4) + 𝜃2 𝜀2007(𝑄3)

𝜀2007(𝑄4) și 𝜀2007(𝑄3) sunt necunoscute deci vor fi estimate folosind rezidualurile estimate ale modelului de
regresie.

Deci :
̂
∇ln (𝐺𝐷𝑃2008(𝑄1) ) = 0,008230 + 0,292321 ∙ (−0,00854) + 0,204590 ∙ (0,00399)=0,006549

Deci rata de creștere a LGDP în Q1 2008 a fost de 0,6549% în raport cu Q4 2007.

Regulile de calcul a valorilor previzionate sunt :

- Se înlocuiesc valorile trecute ale erorilor cu valorile rezidualurilor


- Se înlocuiesc valorile observate viitoare prin valorile lor estimate
- Se înlocuiesc valorile viitoare ale erorilor cu zero.
Astfel:
̂
∇ln (𝐺𝐷𝑃 ̂ ̂
2008(𝑄3) ) = 𝜇̂ + 𝜃1 𝜀2008(𝑄2) + 𝜃2 𝜀2008(𝑄1) =0,008230+0,292321 ∙ 0 + 0,204590 ∙ 0=0,008230

̂
∇ln (𝐺𝐷𝑃 ̂ ̂
2008(𝑄4) ) = 𝜇̂ + 𝜃1 𝜀2008(𝑄3) + 𝜃2 𝜀2008(𝑄2) =0,008230+0,292321 ∙ 0 + 0,204590 ∙ 0=0,008230

10
Deci rata de creștere a LGDP în Q3 2008 a fost de 0,8230% în raport cu Q2 2008. Toate ratele de creștere
începănd cu Q3 2008 vor fi egale cu această valoare deoarece valorile viitoare ale erorilor sunt zero.

Pentru previziunea lui GDP sau LGDP, aceasta se calculează pentru Q1 2008 astfel :

̂
ln (𝐺𝐷𝑃 ̂ ̂
2008(𝑄1) ) = ln (𝐺𝐷𝑃2007(𝑄4) ) + 𝜇̂ + 𝜃1 𝜀2007(𝑄4) + 𝜃2 𝜀2007(𝑄3) =9,3652+0,0065=9,3717

Și GDP=𝑒 9,3717 =11751 miliarde US$

În EViews se obțin valorile previzionate astfel pentru DLGDP pentru perioada de timp 1947Q1 to 2007Q4:
Se deschide ecuația modelului ARMA(0,2),
și se apasă pe on Forecast:
• la Forecast name: scrieți numele noii serii
de timp ce conține valorile previzionate ale
DLGDP, dlgdp_f
• la S.E. (optional): se scrienumele erorilor
standard
• la Forecast sample se completează
perioada de timp 1947Q1 la 2007Q4
• se selectează Static forecast, Forecast
graph și Forecast evaluation
• OK

11
Se pot calcula limitele inferioare și superioare ale intervalului de încredere. În Command window în EViews,
se scriu următoarele comenzi și se apasă ENTER după fiecare:

series lower_limit = dlgdp_f - 2*se_eq_0_2


series upper_limit = dlgdp_f + 2*se_eq_0_2

În workfile se selectează următoarele serii de timp: DLGDP, DLGDP_F, LOWER_LIMIT,


UPPER_LIMIT, și se deschid grupate pentru a fi reprezentate în același grafic.

12
Serii de timp

Curs 7, Aprilie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Capitolul 3
EXTINDERI ALE MODELELOR ARIMA:
SARIMA
Bibliografie (sursa informațiilor):
https://people.duke.edu/~rnau/seasarim.htm, https://www.otexts.org/fpp/8/9
Diverse exemple

 Se dau veniturile trimestriale ale AMAZON. Realizați o


previziune pentru aceste venituri pentru trimestrul 2 al anului
2017.
Descompunerea unei serii de timp pe
componente in Python
Definire modele SARIMA
 Modelul ARIMA sezonier încorporează atât factori non-sezonieri, cât și sezonieri într-un
model multiplicativ. Este scris astfel:
  p (B )  P (B s )(1 − B ) (1 − B s ) Yt =  0 +  q (B ) Q (B s ) t unde
d D
( t )t ~ WN (0, 2 )

 SARIMA(p, d, q)x(P,D,Q)s: Diferențele


the non - seasonal
Diferențele sezoniere
the seasonal
de ordin D ale seriei
nesezoniere
differencede orderdd difference of order D
of ordin
ale seriei timp YYt t of the
de series de timp
time Y Y
series
of the

time
   t t
 p (B )

P Bs

 
( ) (1 − B ) 1− B d
Y =
 t
( )
s D

the non - seasonal autoregresiv the Diferențele


the seasonal
Operatorul non - seasonal and seasonal
nesezoniere difference
de ordin d și celes,
Operatorul autoregresiv
autoregressive operator autoregres sive operator such that d + D  2
de ordin de ordin P sezonier sezoniere D astfel încât d+D≤2
of porder
non sezonier
p of order P

= 0 +  q (B )

( )
Q B s

 
t
the non - seasonal
Operatorul de medie the seasonal
Operatorul de medie
moving average operator moving average operator
mobilă de ordin
of order q q non moblă de ordin
of order Q Q
sezonier sezonier
 unde s este numărul perioadelor dintr-un an numită și perioada componentei sezoniere
 si B este operatorul de deplasare Byt=Yt-1

Componentele modelelor SARIMA
 Componentele nesezoniere sunt:
 Componenta autoregresivă de ordin p nesezonieră, AR:
 p (B ) = 1 − 1  B − 2  B 2 − ... −  p  B p
 Componenta medie mobilă nesezonieră de ordin q, MA:
q (B ) = 1 + 1  B +  2  B 2 + ... +  q  B q
 Componentele sezoniere sunt:
 Componenta autoregresivă de ordin P sezonieră, AR:
 P (B s ) = 1 − 1 ( s )  B s − 2 (s )  B 2 s − ... −  p (s )  B P  s
 Componenta medie mobilă sezonieră de ordin Q, MA:

( )
Q B s = 1 + 1 (s )  B s +  2 (s )  B 2 s + ... +  q (s )  B Q  s

 Se utilizează notarea cu majuscule pentru părțile sezoniere ale modelului și


notarea cu minuscule pentru părțile non-sezoniere ale modelului.
Modele SARIMA- Exemple
 SARIMA(0,0,0)(0,0,1)12 : 𝑋𝑡 = 𝑒𝑡 − Θ1 𝑒𝑡−12

 ACF ia valori diferite de zero doar la lag k=12

 SARIMA(0,0,0)(1,0,0)12 : 𝑋𝑡 = Φ1 𝑋𝑡−12 + 𝑒𝑡

 PACF ia valori diferite de zero doar la lag k=12

 SARIMA(1,1,1)x(1,1,1)4 :
Observații modele SARIMA
1. Diferența sezonieră este
yt − yt − s = yt − B s yt = (1 − B s )yt

 unde s este numărul de anotimpuri dintr-un an și dau diferența dintre o observație


și observația corespunzătoare față de anul precedent.

2. O diferență sezonieră urmată de o primă diferență non-sezonieră poate fi scrisă ca:


(1 − B )(1 − B s )yt = (1 − B − B s + B s +1 )yt =
= yt − yt −1 − yt − s + yt − s −1

unde B s yt = B s ( yt ) = yt − s
Identificarea modelului
 se identifică o combinaţie de valori plauzibile pentru d şi D care staţionarizează
seria:
 din graficele funcţiilor de autocorelaţie respectiv autocorelaţie parţială a seriei
diferenţiate (care este staţionară) se identifică valori plauzibile pentru gradele
polinomului autoregresiv p, polinomului medie mobilă q respectiv pentru gradele
polinomului autoregresiv sezonier P şi a polinomului medie mobilă sezonier Q:

𝜑 𝐵 𝑠 = 1 − 𝑎1 𝐵 𝑠 − 𝑎2 𝐵2𝑠 − ⋯ − 𝑎𝑃 𝐵𝑃𝑠

𝜃(𝐵 𝑠 ) = 1 − 𝑏1 𝐵2𝑠 − ⋯ − 𝑏𝑞 𝐵𝑄𝑠

 Notaţia generală SARIMA(p,d,q)(P,D,Q).

 Ordinele polinoamelor sezoniere P, Q sunt identificate în mod similar cu p, q


analizând funcţiile de autocorelaţie respectiv de autocorelaţie parţială pentru k=s,
2s, ....
Exemple – discuții
 Partea sezonieră a unui model AR sau MA va fi văzută în decalajele sezoniere ale
PACF și ACF.
 Comportamentul SAR pur (Partea Auroregresivă Sezonieră) sau SMA pur (Partea
Medie Mobilă Sezonieră) sunt similare comportamentelor modelelor AR pus sau
MA pur, cu excepția faptului că semnele modelelor apar pe multipli de lag în ACF și
PACF.
 De exemplu, un proces SAR pur (1) are vârfuri în ACF în decalajele s, 2s, 3s etc. în timp ce
PACF se anulează după întârzierea s.
 În schimb, un proces SMA pur (1) are vârfuri în PACF la întârzire, 2s, 3s, etc. în timp ce ACF
se anulează după lag s.

 Un model SARIMA (0,0,0) x (0,0,1)12 va arăta:


 un vârf la lag 12 în ACF și niciun alt vârf semnificativ.
 PACF va manifesta o scădere exponențială a întârzierilor sezoniere; adică vor exista vărfuri semnificativ
diferite de zero dar ce descresc exponențial la intervalele 12, 24, 36, ...

 În mod similar, un model SARIMA (0,0,0) x (1,0,0)12 va arăta:


 scăderea exponențială a întârzierilor sezoniere ale ACF, adică la intervalele 12, 24, 36, ...
 un singur vârf semnificativ la lag 12 în PACF.
Observații
 Regula 1: Dacă seria are un pattern sezonal puternic şi consistent, atunci ar trebui
utilizat un ordin de diferenţiere sezonieră dar niciodată nu se utilizează mai mult de două
ordine de diferenţiere sezonieră sau mai mult de două ordine de diferenţiere totală
(sezonieră şi nesezonieră)

 Comportamentul unui model SAR respectiv SMA este asemănător modelelor AR și MA


cu excepția faptului că apar decalate la multipli de s în funcția ACF și PACF
 Termenii non-sezonieri: Examinați întârzierile timpurii (1, 2, 3, ...) pentru a judeca
termenii non-sezonieri. Vârfuri în ACF la laguri mici indică termeni non-sezonieri MA.
Vârfurile-urile din PACF la laguri mici indica posibili termeni AR non-sezonieri.

 Termeni sezonieri: Examinați tiparele la întârzieri care sunt multiplii ai S. De exemplu,


pentru datele lunare, uitați-vă la 12, 24, 36 și așa mai departe (probabil că nu va trebui
să vă uitați la mult mai mult decât primii doi sau trei multipli de sezon). Judecati ACF si
PACF la lagurile sezoniere, in acelasi mod in care ati facut pentru decalajul anterior.
Reguli identificare modele SARIMA

 Dacă funcția de autocorelație (ACF) a seriei diferențiate afișează o descreștere


bruscă și/sau autocorelația la lag 1 este negativă, atunci luați în considerare
adăugarea unui termen MA la model. Decalajul de la care se anulează ACF este
numărul indicat de termeni MA.

 Dacă autocorelația (ACF) în perioada sezonieră este pozitivă, luați în considerare


adăugarea unui termen SAR la model. Dacă autocorelația în perioada sezonieră este
negativă, luați în considerare adăugarea unui termen SMA la model.

 Regula 2: Trebuie evitată utilizarea simultană a termenilor SMA și SAR în același


model și de asemenea trebuie evitată utilizarea a mai mult de un termen de orice fel
în model.
Estimarea si testarea modelului
 Estimați modelul (modelele) care ar putea fi rezonabile pe baza pasului anterior de
identificare. Nu uitați să includeți diferențele pe care le-ați făcut înainte de a vă uita la
ACF și PACF. În software, specificați seria originală ca date și apoi indicați diferența
dorită atunci când specificați parametrii din comanda ARIMA pe care o utilizați.

 Testare: Se examinează erorile (cu ACF, Box-Pierce și alte mijloace) pentru a vedea
dacă modelul poate fi validat. Comparați valorile AIC sau BIC dacă ați încercat mai
multe modele.

 Daca din etapa de testare nu rezultă un model bun, atunci se revine la pasul de
identificare.
ARIMA(0,0,1)(0,0,1)12
ACF (1) este Autocorelatia in perioada sezoniera
semnificativ diferit este pozitiva – se adauga un termen SMA
de zero
– se adaugă un
termen MA

Descreștere bruscă către zero


ARIMA (1,0,0)× (0,1,1)12

Autocorelatia in perioada
sezoniera
este negativă – se adauga
un termen SAR
Descreștere
bruscă către zero

PACF (1) este


semnificativ diferit
de zero
– se adaugă un
termen AR
EXEMPLU
Fie seria de timp a vanzarilor lunare de
autoturisme din Statele Unite, deflaționate, din
ianuarie 1970 pana in mai 1993 (279 observatii)

Sursa informatiilor : Conf. univ. dr. Mihaela Covrig, Time series, part 10,
lecture and exercises, 2019-2020,
Exemplu
Exemplu
Exemplu

 ARIMA(0,1,1)x(0,1,1)12
Exemplu
 Tutorial pentru estimarea modelelor SARIMA in R:
 https://www.google.com/search?q=modele+sarima&oq=model
e+sarima&aqs=chrome..69i57j0i10i22i30j0i22i30l3j0i10i22i30.2
164j0j7&sourceid=chrome&ie=UTF-
8#fpstate=ive&vld=cid:012b4473,vid:X-PpICNabVE
Serii de timp

Curs 6, Martie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Capitolul 3
MODELE UNIVARIATE DE TIP
AUTOREGRESIV MEDIE MOBILA
Etapele elaborării unui model ARIMA
(autoregresiv integrat medie mobilă)
 1. Identificarea modelului → se precizează valorile adecvate pentru p, d
respectiv q
 Verificarea staționarității: dacă seria se constată că este nestaționară ea se diferențiază până
devine staționară, rezultând ordinul de diferențiere d (în general d=1 sau 2)
 În funcție de forma funcțiilor de autocorelație și parțială de autocorelație se determină valori
plauzibile pentru p și q

 2. Estimarea parametrilor modelului → estimarea coeficienţilor ai, bi,  2

 3. Testarea validităţii modelului


  t este de tip zgomot alb? → teste privind comportamentul
reziduurilor
 teste privind semnificaţia coeficienţilor ai, bi;

 Dacă modelul nu este valid atunci se respecifică modelul (alte valori


plauzibile pentru p,d,q) şi se reiau etapele anterioare.

 4. Generarea previziunilor în baza modelului estimat.


1. Identificarea modelului
 a) Stabilirea ordinului de diferenţiere. Dacă o serie este nestaţionară
se vor calcula diferenţele de ordin 1 eventual 2, în scopul stabilirii ordinului
de diferenţiere d.

 Observaţie. Dacă seria prezinta fluctuații mari in jurul mediei, este indicat
ca inainte de modelare, sa se logaritmeze datele iniţiale, reducând astfel
amplitudinea fluctuaţiilor seriei. Se va lucra în continuare cu datele
logaritmate.

 b) Stabilirea valorilor plauzibile pentru p respectiv q.


 Dacă nu pare adecvat un model AR(p) sau MA(q) cu număr mic de parametri ( p
respectiv q mai mici ca 4) atunci se va încerca un model mixt ARMA ce combină
ambele părţi.
Metodologia Box Jenkins
Model Funcţia de autocorelaţie rk Funcţia de autocorelaţie parţială ck
AR(1) - descreşte exponenţial dacă - c1 semnificativ (> 0 dacă
Yt = a 1Yt −1 +  t a1 > 0 a1 > 0 şi <0 dacă a1 < 0);
- descreşte sinusoidal, dacă - ck = 0,  k  2
a1 < 0

AR(2) descreşte exponenţial sau sinusoidal. Forma exactă - c1 şi c2 semnificativi


Yt = a 1Yt −1 + a 2 Yt −2 +  t depinde de semnul şi valoarea coeficienţilor a1 şi a2 - ck = 0,  k  3
AR(p) descreşte exponenţial sau sinusoidal. Forma -c1, …, cp – semnificativi
Yt = a 1Yt −1 +  + a p Yt −p +  t funcţiei depinde de semnul şi valoarea -ck = 0,  k  p+1
coeficienţilor a1, …, ap
MA(1) r1 semnificativ (> 0 dacă b1< 0şi  0 dacă b1 > 0); exponenţial dacă b1 > 0
Yt =  t − b1 t −1 rk = 0,  k  2 sinusoidal dacă b1 < 0

MA(2) r1 , r2 semnificativ descreşte exponenţial sau sinusoidal. Forma


Yt =  t − b1 t −1 − b 2 t −2 rk = 0,  k  3 exactă depinde de semnul şi valoarea
coeficienţilor b1, b2
MA(q) r1 ,  , rq semnificativi descreşte exponenţial sau sinusoidal. Forma
Yt =  t − b1 t −1 −  − b q t −q rk = 0,  k  p+1 funcţiei depinde de semnul şi valoarea
coeficienţilor b1, …, bq
ARMA(1,1) descreşte exponenţial. Semnul lui r1 depinde de cel descreşte exponenţial dacă b1 > 0 respectiv
Yt = a1Yt −1 +  t − b1 t −1 al diferenţei a1–b1 sinudoidal dacă b1 < 0

ARMA (p,q) descreşte exponenţial sau sinusoidal începând cu descreşte exponenţial sau sinusoidal începând cu
k=q-p k=q-p
Metodologia Box Jenkins
 În practică vom căuta:

 cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie parţială ck nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru p ordinul modelului autoregresiv AR(p); AR(p) este adecvat
variabilelor dependente exclusiv de trecutul lor, cu pronunţat caracter inerţial (exemplu:
consumul de bunuri de strictă necesitate unde se creează obişnuinţă).

 cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie rk nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru q, ordinul modelului medie mobila MA(q). MA(q) e adecvat
variabilelor „sensibile” la modificări ale variabilelor exogene, determinând abateri accidentale
de la evoluţia medie.

 În principiu nu este dificil să distingem între un model AR(p) şi un model MA(q), în schimb
determinarea ordinelor p, q pentru un model mixt este un proces relativ incert. Există şi
posibilitatea selectării modelului ce minimizeaza diferite criterii construite utilizând funcţia de
verosimilitate (ex: criteriul Akaike AIC, criteriul Schwarz SC).
Estimarea parametrilor modelului
 Forma restrânsă a unui model
 ARMA(p,q):  (L )Yt =  (L ) t
 ARIMA(p,d,q):  (L )(1 − L) d X t =  (L ) t

 Metoda clasică a celor mai mici pătrate de minimizare a sumei pătratelor erorilor
conduce la estimatori ai parametrilor a1, a2,…, ap regăsind ecuațiile Yule-Walker
(relațiile între coeficienții modelului și coeficienții de autocorelație).
 Estimatorii obținuți nu sunt eficienți deoarece există colinearitate între variabilele
explicative din model.
 De aceea se utilizează metoda verosimilității maxime.

 Proprietate: Funcţia de verosimilitate asociată seriei observaţiilor Y=(Y1, …,YT )


este:
1
(2 2 ) −T / 2 det[(ai , bi )]−1 / 2 exp{− Y ' [(ai , bi )]−1 Y
2  2

 Maximizarea acesteia conduce la valori pentru coeficienţii ai, bi ce asigură cea mai
mare probabilitate de apariţie a observaţiilor Y1, …, YT.
 Acești estimatori sunt consistenți, asimtotic eficienți și normal distribuiți.
Testarea validității modelului
 Pentru a vedea dacă modelul estimat surprinde adecvat modul de generare a
datelor (caracterul inerţial respectiv cel de asimilare a şocurilor) este utilă în
prealabil o analiza comparativă a funcţiei de autocorelaţie r̂k respectiv de
autocorelaţie parţială ĉ k estimate, pentru seria iniţială Yt respectiv pentru seria
generată de model Yˆt .
 O asemănare între corelogramele acestora indică faptul că modelul surprinde
adecvat mecanismul de generare a datelor.
 De asemenea se pot analiza rădăcinile unitate ale polinoamelor autoregresive
respectiv medie mobilă.

 Se vor aplica două grupe de teste:


 teste de semnificație a coeficienţilor modelului
 teste referitoare la reziduuri (pentru a vedea dacă sunt de tip zgomot alb).
Teste privind semnificația coeficienților
 Considerăm un model staţionar ARMA(p,q) cu medie diferită de zero:
 (L )Yt = a 0 +  (L ) t

 Se testează dacă ai (sau bi ) diferă semnificativ de zero:

H 0 : ai = 0
H 1 : ai  0


ai
 Statistica: t=   N(0,1)
Var (ai )

 Regula de decizie: Pentru un nivel de semnificaţie  , dacă t calc  − t tab ,+t tab  atunci
ipoteza
nulă H0 nu se respinge. Prin urmare variabila corespunzătoare se elimină din model, şi se
respecifică respectiv re-estimează modelul.

 Observație: Ca teste asupra coeficienţilor se pot utiliza şi alte teste precum testul Wald, sau
teste de tip LM (Multiplicatorul lui Lagrange) pentru omisiunea unor variabile, teste de
stabilitate a coeficienţilor.
Teste privind reziduurile
 Dacă modelul este bine specificat, atunci reziduurile din modelul estimat
sunt generate de un proces de tip zgomot alb (succesiune de variabile
aleatoare independente, identic repartizate), cu medie zero şi normal
distribuit.
 Autocorelarea reziduurilor. Pentru detectarea unor dependenţe în seria
reziduurilor se examinează funcţia de autocorelaţie şi de autocorelaţie
r̂k
parţială a reziduurilor.ĉ kDacă reziduurile sunt necorelate, atunci aceşti
coeficienţi nu trebuie să fie semnificativ diferiţi de zero.
rˆk 
Var (rˆk ) =
1
 Statistica: t=  N(0,1) unde
Vˆar (rˆk ) T

 Regula de decizie: Pentru un nivel de semnificaţie  , dacă rˆk  − ttab / T , ttab / T 


atunci ipoteza nulă H0 nu se respinge, deci reziduurile sunt necorelate.

 Observații:
 1. Același test se aplică și pentru coeficienții parțiali de autocorelație.
 2. Se mai aplică și testul Ljung Box studiat în cursurile precedente
Investigarea normalității reziduurilor
 Testul Jarque&Bera:
 Se bazează pe coeficienții de boltire și de asimetrie
 Dacă un eşantion de T observaţii provine dintr-o distribuţie normală atunci coeficientul de
asimetrie calculat în baza observaţiilor urmează asimptotic legea normală N(0, 6/T) iar
coeficientul boltirii legea N(3,24/T).
 Jarque şi Bera obţin prin însumarea celor două variabile normale independente statistica:
1 1
JB = Tˆ 32 + T (ˆ 4 − 3) 2   2 (2)
6 24
 Regiunea critică:

P ( JB  2 , 2 ) = 
Investigarea heteroscedasticităţii
reziduurilor
 Testul multiplicatorilor lui Lagrange pentru heteroscedasticitate de tip
ARCH(p) presupune:
 estimarea reziduurilor et = ˆt din ecuaţia ce defineşte modelul;
 estimarea regresiei auxiliare (ce fundamentează testul):
et2 =  0 +  1et2−1 + ... +  p et2− p

 testarea ipotezei nule în ecuaţia de regresie auxiliară:


H o :  1 =  2 = ... =  p = 0 (nu există efect ARCH).
 Statistica LM definită prin:
LM = T  R 2   2 ( p )
 unde R2 este coeficientul de determinaţie aferent regresiei auxiliare iar T este lungimea seriei
de timp.
 Ipoteza homoscedasticităţii (varianţă constantă în timp) se respinge dacă LM calculat este
superior valorii critice pentru un nivel de semnificație :
P ( LM  2 , p ) = 
Criterii de selecție pentru cel mai bun
model ARIMA
 Criteriul AIC (Akaike 1974):
AIC = ln(ˆ 2 ) + 2( p + q ) / T unde ˆ 2 este estimatorul varianței 2 pentru modelul ARMA
potrivit seriei wt=dxt, t=1,2,...,T

 Criteriul BIC (Rissanen, Schwartz 1978):


BIC = ln(ˆ 2 ) + ( p + q ) ln(T ) / T unde ˆ 2 este estimatorul varianței 2 pentru modelul ARMA
potrivit seriei wt=dxt, t=1,2,...,T

 Procedura:
 Se determină P și Q maximele ordinelor modelelor AR respectiv MA
 p și q se determină astfel încât să obțin minimul criteriilor descrise
Realizarea previziunilor
 Modelul ARIMA estimat şi validat poate fi utilizat pentru generarea de previziuni:
 previziuni punctuale
 intervale de previziune.
 Previziuni punctuale
 Pentru un orizont de previziune h, ataşăm momentului T+h, unde T este originea efectuării
previziunii, variabila aleatoare YT + h .

YT + h = E (YT + h | YT , YT −1 ,..., Y1 )

YˆT + h = aˆ 0 + aˆ1YT + h −1 + aˆ 2YT + h − 2 +  + aˆ p YT + h − p − bˆ1 T + h −1 − bˆ2  T + h − 2 −  − bˆq  T + h − q +  T + h


 Previziunile se obţin în baza informaţiilor disponibile până la momentul T, pas cu pas:
 termenii autoregresivi YT + h −i pentru h-i>0 (adică YT +1 , YT + 2 ... se substituie cu previziunile obţinute la
paşii anteriori;
 termenii autoregresivi YT + h −i pentru h-i<0 se înlocuiesc cu valorile înregistrate, aici fiind cunoscuţi
termenii seriei (YT-1, YT-2, ...);
 termenii eroare  T + h −i pentru h-i>0 (adică T+1, T+2,…) se înlocuiesc cu zero (deoarece înlocuindu-i
cu media lor și erorile fiind de tip zgomot alb, media lor este 0)
 termenii eroare  T + h −i pentru h-i<0 (adică T-1, T-2,… ) se înlocuiesc cu reziduurile estimate din
model (spre exemplu  = Y − Yˆ , pentru t<T).
t t t
Determinarea intervalului de previziune
 Eroarea de previziune:

eT + h = YT + h

( )
− YT + h  N 0, V (eT + h ) 
YT + h − YT + h
V (eT + h )
 N (0,1)

 Din distribuţia legii normale de probabilitate, pentru o probabilitate P fixată se determină


k astfel încât:

 Y − Y 
− k  T + h T +h
 k = P

 V (eT + h ) 

 Intervalul de previziune:
YT +h

− k V (eT + h ); YT + h + k V (eT + h ) 
 Calculul varianţei erorii de previziune necesită punerea modelului sub forma mediei mobile cu un număr
infinit de termeni (orice model ARMA poate fi pus în această formă):

Yt =  t + c1 t −1 + c 2 t −2 + ...  Yt = C (L ) t
  ( L)C (L ) =  ( L)
 (L )
Yt = t
 (L )
  h −1 
eT + h = YT + h − YT + h =  t + c1 t −1 + c 2  t − 2 + ... − (c h  T + c h +1 T −1 + ...)  V (eT + h ) =  2 1 +  c 2j 
 j =1 
Exemplu
 Fie seria temporală a PIB-ului SUA,
miliarde de dolari SUA, date
trimestriale ajustate sezonier din
1947 până în 2007, exemplu furnizat
în Gujarati, D., Porter, D., Basic
Econometrics, ediția a V-a, McGraw-
Hill, 2009, pp 778-784
Verificarea stationarității seriei
Este seria diferențiată stationară?
Corelograma seriei diferențiate

p
0 1 2
q
0 ARMA(0,0) ARMA(0,1), deci MA(1) ARMA(0,2), deci MA(2)
1 ARMA(1,0), deci AR(1) ARMA(1,1) ARMA(1,2)
ARMA(0, 0)
ARMA(1,0)
ARMA(0,1)
ARMA(0,2)
ARMA(1,1)
ARMA(1,2)
Compararea modelelor

Modele identificate

ARMA(1,0) ARMA(0,1) ARMA(0,2)


ARMA(1,1) ARMA(1,2)
or AR(1) or MA(1) or MA(2)

AIC –6.518950 –6.493237 –6.526104 –6.514880 –6.520065


BIC –6.490116 –6.464488 –6.482979 –6.471629 –6.462397
HQIC –6.507334 –6.481657 –6.508734 –6.497457 –6.496834
Log likelihood 790.7929 790.9283 795.9216 791.3005 792.9279
Adjusted R Square 0.104671 0.081077 0.114402 0.104688 0.112937
Este modelul semnificativ?

yes yes yes yes Yes

C yes yes yes yes Yes


semnificativi?
Parametrii

ar(1) yes yes No


ma(1) yes yes no No
sunt

ma(2) yes No
Rezidualurile sunt White
yes no yes yes Yes
Noise?
Exemple rezolvate
Condiția de stationaritate pentru modelele AR
Calculul funcțiilor de autocorelație și de autocorelație partială pentru modelele AR și
ARMA

Materialul a fost pregatit pornind de la cursul si seminarul de serii de timp al Dnei Prof. Silvia
Spataru

Problema 1. Se consideră modelul yt = 0,6 yt −1 − 0,08 yt −2 +  t

Să se verifice dacă este îndeplinită condiţia de staţionaritate.

Rezolvare:

Un model AR(P): 𝜑(𝐿)𝑌𝑡 = 𝜀𝑡 este staționar atunci când rădăcinile polinomului:


𝜑(𝐿) = 1 − 𝑎1 𝐿 − 𝑎2 𝐿2 − ⋯ − 𝑎𝑝 𝐿𝑝 (reale sau complexe) sunt în modul mai mari ca 1 (se spune că
sunt în afara cercului unitate).

Avem 𝑎1 = 0,6 şi 𝑎2 = −0,08.

Polinomul caracteristic asociat este:


𝜑(𝐿) = (1 − 𝑎1 𝐿 − 𝑎2 𝐿2 )  𝜑(𝑧) = (1 − 𝑎1 𝑧 − 𝑎2 𝑧 2 ) = (1 − 𝜆1 𝑧)(1 − 𝜆2 𝑧)

Determinăm rădăcinile polinomului:


𝑃(𝜆) = 𝜆2 − 𝑎1 𝜆 − 𝑎2 = 0  P( ) = 2 − 0,6 + 0,08 = 0
 1 = 0,2 şi  2 = 0,4  1  1 şi  2  1

Deci rădăcinile polinomului caracteristic sunt:


𝜑(𝑧) = (1 − 0,2𝑧)(1 − 0,4𝑧) 
z1 = 1 / 1 = 1 / 0,2 = 5 şi z 2 = 1 /  2 = 1 / 0,4 = 2,5 ,
deci z1  1 şi z 2  1 .

Condiţia de staţionaritate este îndeplinită. Procesul este staţionar.

Problema 2: Se consideră modelul y t = 1,8 y t −1 − 0,8 y t − 2 +  t


Să se verifice dacă este îndeplinită condiţia de staţionaritate.

Rezolvare:

Un model AR(P): 𝜑(𝐿)𝑌𝑡 = 𝜀𝑡 este staționar atunci când rădăcinile polinomului:


𝜑(𝐿) = 1 − 𝑎1 𝐿 − 𝑎2 𝐿2 − ⋯ − 𝑎𝑝 𝐿𝑝 (reale sau complexe) sunt în modul mai mari ca 1 (se spune că
sunt în afara cercului unitate).

Avem 𝑎1 = 1,8 şi 𝑎2 = −0,8


𝜑(𝐿) = (1 − 𝑎1 𝐿 − 𝑎2 𝐿2 )  𝜑(𝑧) = (1 − 𝑎1 𝑧 − 𝑎2 𝑧 2 ) = (1 − 𝜆1 𝑧)(1 − 𝜆2 𝑧) = 0

P ( ) = 2 − 1  −  2 = 0  P ( ) = 2 − 1,8 + 0,8 = 0
 1 = 0,8 şi  2 = 1  1  1 dar  2 = 1  z1  1 dar z 2 = 1 .

Dei există o rădăcină unitară.


Condiţia de staţionaritate nu este îndeplinită. Procesul este nestaţionar.
Problema 3: Se consideră modelul yt = 1,5 yt −1 − 0,75 yt −2 +  t
a) Verificaţi dacă este îndeplinită condiţia de staţionaritate.
b) Calculaţi ACF şi reprezentaţi corelograma asociată.
c) Calculaţi PACF şi reprezentaţi corelograma corespunzătoare.

Rezolvare:

a. Un model AR(P): 𝜑(𝐿)𝑌𝑡 = 𝜀𝑡 este staționar atunci când rădăcinile polinomului:


𝜑(𝐿) = 1 − 𝑎1 𝐿 − 𝑎2 𝐿2 − ⋯ − 𝑎𝑝 𝐿𝑝 (reale sau complexe) sunt în modul mai mari ca 1 (se spune că
sunt în afara cercului unitate).

Avem 𝑎1 = 1,5 şi 𝑎2 = −0,75


𝜑(𝐿) = (1 − 𝑎1 𝐿 − 𝑎2 𝐿2 )  𝜑(𝑧) = (1 − 𝑎1 𝑧 − 𝑎2 𝑧 2 ) = (1 − 𝜆1 𝑧)(1 − 𝜆2 𝑧) = 0

P ( ) = 2 − 1  −  2 = 0  P ( ) = 2 − 1,5 + 0,75 = 0 
1 = a + bi = 0,75 + 0,43 i şi 2 = a − bi = 0,75 − 0,43 i 
 = R = a 2 + b 2 = 0,8645    1  |𝑧|1

Condiţia de staţionaritate este îndeplinită.

b. Conform ecuațiilor Yule Walker ACF se calculeaza astfel:


𝑎 1,5
𝜌1 = 1−𝑎1 = 1+0,75 = 0,8571
2
𝑎12 1,52
𝜌2 = + 𝑎2 = − 0,75 = 0,5357
1 − 𝑎2 1 + 0,75

𝜌𝑘 = 𝑎1 𝜌𝑘−1 + 𝑎2 𝜌𝑘−2 pentru k > 2

deci 𝜌3 = 1,5 ∙ 𝜌2 − 0,75 ∙ 𝜌1 = 1,5 ∙ 0,5357 − 0,75 ∙ 0,8571 = 0,1607

𝜌4 = 1,5 ∙ 𝜌3 − 0,75 ∙ 𝜌2 = 1,5 ∙ 0,1607 − 0,75 ∙ 0,5357 = −0,1607

𝜌5 = −1,5 ∙ 0,1607 − 0,75 ∙ 0,1607 = −0,3616


𝜌6 = −1,5 ∙ 0,3616 + 0,75 ∙ 0,1607 = −0,42

......

c. Conform ecuațiilor Yule Walker PACF se calculeaza astfel:

𝜑11 = 𝜌1 = 0,8571
𝜌2 −𝜌12 0,5357−0,85712 0,5357−0,85712 −0,1989
𝜑22 = = = = = −0,75
1−𝜌12 1−0,85712 1−0,85712 0,2654

𝜑𝑘𝑘 = 0 pentru k  2

Problema 4:
Fie yt =  yt −1 +  t +   t −1
yt = −0,7 yt −1 +  t − 0,7  t −1   = −0,7 şi  = −0,7
a) Să se calculeze ACF
b) Să se calculeze PACF

Rezolvare:
a. ACF:
 ( +  )(1 +  ) (−0,7 − 0,7 )(1 + 0,49)
1 = 1 =  1 = = −0,8445
0 1 + 2 +  2
1 + 2(0,49) + 0,49
Pentru k  2 avem  k =   k −1
 2 =  1 = (−0,7)( −0,8445) = 0,591
 3 =   2 = −0,414 ;  4 = 0,290 ;  5 = −0,203 ;  6 = 0,142 ,  7 = −0,099 ;  8 = 0,07

b. PACF
11 = 1 = −0,8445
 2 − 12 0,591 − (−0,8445) 2
 22 = = = −0,426
1 − 12 1 − (−0,8445) 2
 33  0 ;  44  0 , …
Modele de medie mobilă – MA(1),
ARIMA(0,0,1), ARMA(0,1)
 Modelul medie mobilă de ordinul 1 cu media zero:
Yt =  t − b1 t −1  t ~ WN (0, 2 )

 Proprietate: Un model MA(1) este staționar iar funcția sa de autocorelație se


anulează pentru k2.
 Media procesului este nulă: E (Yt ) = E ( t ) − b1E( t −1 ) = 0

 Varianța procesului: ( ) 2 2
( )
Var (Yt ) = E Yt − E (Yt ) = E Yt 2 = E( t − b1 t −1 )( t − b t −1 ) =

( ) ( ) (
= E  t2 + E (− b1 t −1  t ) − E (− b1 t −1  t ) + E b12 t2−1 =  2 1 + b12 )
 Covarianța procesului: Cov(Yt , Yt − k ) = E ( t − b1 t −1 )( t − k − b1 t − k −1 ) =

=
( )
E ( t − b1 t −1 )( t −1 − b1 t − 2 ) = −b1 E  t2−1 = −b1  2 pentru k = 1
0 pentru k  1

0, k2
Funcția de autocorelație: 
 rk =  b1

 1+ b2 , k =1
 1
MA(1): Xt= t + 0,8  t-1
Modele de medie mobilă – MA(q), ARIMA(0,0,q)
 Modelul medie mobilă de ordinul q cu media zero:
Yt =  t − b1 t −1 − b2  t − 2 −  − bq  t − q  t ~ WN (0, 2 )

 Proprietate: Un model MA(q) este staționar iar funcția sa de autocorelație se anulează


pentru kq+1.

 Media procesului este nulă: E (Yt ) = 0


 Varianța procesului: (
Var (Yt ) =  2 1 + b12 + b22 + ... + bq2 )
 Covarianța procesului: Cov(Yt , Yt −k ) = E ( t − b1 t −1 − b2 t −2 −  − bq  t −q )( t −k − b1 t −k −1 − b2 t −k −2 −  − bq  t −k −q ) =
 2 (-b k + b1 b k +1 + ... + b q-k b q ) pentru k = 1, 2,..., q
=
0 pentru k  q + 1

 - b k + b1 b k +1 + ... + b q -k b q
pentru k = 1, 2,..., q
 Funcția de autocorelație: rk =  1 + b12 + b22 + ... + bq2

0 pentru k  q + 1

 Observație: Dacă procesul are medie nenulă atunci modelul include şi un termen liber, acesta fiind
egal cu media: Yt = m +  t − b1 t −1 −  − bq  t − q
Modele MA
y t =  t + 0,9 *  t −1 y t =  t − 0,9 *  t −1

y t =  t − 0,5  t −1 + 0,25  t − 2
Modelul autoregresiv – AR(1), ARIMA(1,0,0)
 Modelul autoregresiv de ordinul 1 de medie zero:
Yt = a1Yt −1 +  t a1  1
 t ~ WN (0,  2 )

 Proprietate: Un model AR(1) , cu a1  1 este staționar iar funcția sa de


autocorelație are forma: rk = a1
k

Yt =  t + a1Yt −1 =  t + a1 (a1Yt −2 +  t −1 ) =  t + a1 t −1 + a1 Yt − 2 =


2

t −1
=  t + a1 t −1 + a1 (a1Yt −3 +  t −2 ) =  =  t + a1 t −1 + a1  t − 2 + a1  t −3 +  + a  =  a1j  t − j
t −1
2 2 3
1 1
j =0

 Media procesului este nulă: E (Yt ) = 0


 Covarianța procesului:

( )(
Cov (Yt , Yt − k ) = Cov (Yt , Yt + k ) = E (Yt Yt + k ) − E (Yt )E (Yt + k ) = E (Yt Yt + k ) = E  t + a1 t −1 +  + a1t −1 1  t + k + a1 t + k −1 +  + a1t + k −1 1 = )
( )( ) (
= E  t + a1 t −1 +  + a1t −1 1  t + k + a1 t + k −1 +  + a1k  t + a1k +1 t − `1 + a1k + 2 t − `2 +  + a1t + k −1 1 = E a1k  t2 + a1k + 2 t2−1 +  + a1k + 2(t −1) 12 )=
 2 k 1 − a12t
  a1 , a1  1
( ) (
=  2 a1k +  + a1k + 2(t −1) =  2 . a1k 1 +  + a12(t −1) ) = 1 − a12
 2 t , a1 = 1
 
a1k
cov(Yt , Yt + k ) ⎯⎯
⎯→  k =  
t → 2
a1  1
1 − a12
Modelul autoregresiv – AR(1), ARIMA(1,0,0)
 Varianța procesului: Var(Yt ) =  0 =  2 1
1 − a12

 Funcția de autocorelație: k
rk = = a1k
0

 Observații:
 a1 = 1 regăsim varianţa unui proces nestaţionar de tip mers aleator
 a1 > 0 funcţia de autocorelaţie rk descreşte exponenţial
 a1 < 0 descreşte sinusoidal (dinţi de ferăstrău, valorile negative alternează cu cele pozitive)

 Observație: Un proces AR(1) în care apare şi constanta:


Yt = a 0 + a1Yt −1 +  t
a0
 Media: E (Yt ) =  =
1 − a1

 Dispersia: Var(Yt ) =  2 1
1 − a12
AR(1): Xt=-0,8Xt-1+t
Modele AR
y t = 0,8 * y t −1 +  t y t = −0,8 * y t −1 +  t
Modelul autoregresiv – AR(p), ARIMA(p,0,0)
 Utilizând scrierea cu operatorul L, un model AR(1) devine:
(1 − a1 L)Yt =  t
 condiţia de staţionaritate a 1  1 este echivalentă cu cerinţa ca rădăcina polinomului
de gradul unu  (L ) = 1 − La1 , notată cu x să aibă modulul mai mare decât unu:
1
1 − xa1 = 0  x =
a1
 Proprietate: Un model AR(P):  (L )Yt =  t este staționar atunci când rădăcinile
polinomului:  ( L) = 1 − a1 L − a2 L2 −  − a p Lp (reale sau complexe) sunt în modul mai
mari ca 1 (se spune că sunt în afara cercului unitate).

 Proprietate: Coeficienţii de autocorelaţie parţială ai unui model AR(p) sunt egali


cu zero, pentru k mai mare decât p (ordinul modelului).
 Coeficientul de regresie al variabilei Yt-p-1 în modelul autoregresiv AR(p+1):
Yt = a 0 + a1Yt −1 + a 2Yt − 2 +  + a pYt − p + a p +1Yt − p −1 +  t

deoarece pentru un model AR(p) coeficientul ap+1 =0.


Exemplu verificarea stationaritatii AR(2)
Se consideră modelul yt = 0,6 yt −1 − 0,08 yt −2 +  t

Să se verifice dacă este îndeplinită condiţia de staţionaritate.

Rezolvare:
Avem 𝑎1 = 0,6 şi 𝑎2 = −0,08.
Polinomul caracteristic asociat este: 𝜑 𝐿 = 1 − 𝑎1 𝐿 − 𝑎2 𝐿2

Determinăm rădăcinile polinomului:

1 − 0.6𝜆 + 0.08 𝜆2 = 0
0.6 ± 0.2
∆=0.36-4*0.08=0.04 𝜆1,2 =
2 ∗ 0.08
𝜆1 =5>1 𝜆2 = 2.5>1

Condiţia de staţionaritate este îndeplinită. Procesul este staţionar.


Modelul autoregresiv – AR(2), ARIMA(2,0,0)
 Modelul autoregresiv de ordinul 1 de medie zero:
Yt = a1Yt −1 + a2Yt − 2 +  t Yt − a1Yt −1 − a2Yt − 2 =  t (1 − a1 L − a2 L2 )Yt =  t

 (L )Yt =  t unde  ( L) = 1 − a1 L − a2 L2 este polinomul caracteristic al procesului AR(2)


Media procesului este nulă: E (Yt ) = E (a0 + a1Yt −1 + a2Yy −2 +  t )  E (Yt ) = 1 − a 0− a = 0
a

1 2

 Varianța procesului:
 2
Var (Yt ) = Var ( a1Yt −1 + a2Y y −2 +  t ) = a Var (Yt −1 ) + a Var (Yt −2 ) + Var ( t )  Var (Yt ) =
2 2

1 − a12 − a22
1 2

 Autocorelațiile unui proces AR(2):


 Ecuațiile Yule Walker: rk − a1rk −1 − a2 rk − 2 = 0 pentru
2
k0
a1 a1
r1 = r = + a2 rk = a1rk −1 + a2 rk − 2 pentru k  2

2
1 − a2 1 a 2

 Autocorelațiile parțiale ale unui proces AR(2):


c1 = r1
a + r a = r r2 − r12
 Ecuațiile Yule Walker:  1 1 2 1  c2 =
1 − r12
r1a1 + r2 = r2
ck = 0 pentru k  2
AR(2): Xt=0,5Xt-1+ 0,25Xt-2+ t
Modelul autoregresiv medie mobilă –
ARMA(1,1), ARIMA(1,0,1)
 Modelul autoregresiv medie mobilă de ordinul 1, de medie zero - ARMA(1,1):
Yt = a1Yt −1 +  t − b1 t −1 a1  1  t ~ WN (0,  2 )

(1 − a1 L)Yt = (1 − b1 ) t

 Media procesului este nulă: E (Yt ) = 0

1 + 2a1b1 + b12 2 (a1 + b1 )(1 + a1b1 ) 2


 Covarianța procesului: 0 =  
 = 
1 − a12
1
1 − a12
 k = a1 k −1 pentru k  2

(a1 + b1 )(1 + a1b1 ) rk = a1rk −1 pentru k  2


 Autocorelațiile unui proces ARMA(1,1): r1 =
1 + 2a1b1 + b12

c1 = r1
 Autocorelațiile parțiale ale unui proces ARMA(1,1): r2 − r12
c2 =
1 − r12
ck  0 pentru k  3
ARMA(1,1): Xt=0,8Xt-1+t+0,9  t-1, n=100
Seminar 4
Martie 2023

Functia de autocorelatie si functia partiala de autocorelatie


Materialul a fost pregatit pornind de la cursul si seminarul de serii de timp al Dnei Prof. Silvia Spataru

Problema 1: Pentru a ilustra calcularea unei funcţii SACF, considerăm 10 valori ale unei serii de timp y t :

13, 8, 15, 4, 4, 12, 11, 7, 14, 12. Să se calculeze autocorelaţiile de selecţie pentru lag-urile 1, 2 şi 3.
Calculăm media de selecţie şi obţinem y = 10 . Folosim formulele

t =2 ( yt − y )( yt −1 − y ) t =k +1 ( yt − y )( yt −k − y )
n n

r1 = ̂1 = , rk = ̂ k =
t =1 ( yt − y ) 2 t =1 ( yt − y ) 2
n n

(13 − 10)(8 − 10) + (8 − 10)(15 − 10) +  + (7 − 10)(14 − 10) + (14 − 10)(12 − 10) − 27
ˆ1 = = = −0,188
(13 − 10) 2 + (8 − 10) 2 +  + (12 − 10) 2 144

(13 − 10)(15 − 10) + (8 − 10)(4 − 10) +  + (11 − 10)(14 − 10) + (7 − 10)(12 − 10) − 29
ˆ 2 = = = −0,201
(13 − 10) 2 + (8 − 10) 2 +  + (12 − 10) 2 144

26
̂ 3 = = 0,181
144

Problema 2: Considerăm o selecţie de volum n=200 de observaţii asupra unui proces stochastic pentru care se cunosc
1 = −0,4 şi  k = 0, k  2 . Autocorelaţiile estimate sunt:
k 1 2 3 4 5 6 7 8 9 10
rk -0,38 -0,08 0,11 0,08 0,02 0,00 0,00 0,00 0,07 -0,08

Să se testeze şi să se indice care coeficient de autocorelaţie este semnificativ diferit de zero.

Deoarece varianţa estimată a lui rk este Var (rk ) = Var ( ˆ k ) = 1 / n = 1/200=0,005 rezultă că abaterea standard va fi

se ( ˆ k ) = 1 / n = 1 / 200 = 0,005 = 0,07 . Un coeficient  k este semnificativ diferit de zero dacă se află în afara

intervalului (−2 / n ; + 2 / n ) , în acest caz ( −0,14 ; + 0,14) .

Dacă ˆ k  (−0,14 ; + 0,14) acceptăm ipoteza că  k nu este semnificativ diferit de zero.

Deoarece avem r1 = ˆ1 = −0,38 , înseamnă că ˆ1  (−0,14 ; + 0,14) , deci acceptăm ipoteza că  k este semnificativ

diferit de zero ( 1  0). Pentru restul coeficienţilor acceptăm ipoteza că nu sunt semnificativi, adică  k = 0, k  2 .

Problema 3: Considerăm o selecţie de volum n=50 de observaţii asupra unui proces stochastic. Autocorelaţiile estimate
sunt:
k 1 2 3 4 5 6 7 8 9 10 11 12
rk 0,84 0,73 0,61 0,54 0,47 0,46 0,38 0,29 0,17 0,05 0,01 -0,01

a) Să se calculeze coeficienţii de autocorelaţie parţială de selecţie pentru lag-urile 1, 2 şi 3.


b) Să se testeze şi să se indice care coeficient de autocorelaţie parţială de selecţie este semnificativ diferit de zero.

a) Folosim ecuaţiile Yule-Walker pentru a calcula coeficienţii de autocorelaţie parţială de selecţie. Obţinem:
1 0,84 0,84
1 0,84 0,84 1 0,73
0,84 0,73 0,73 0,84 0,61
ˆ11 = r11 = r1 = ˆ1 = 0,84 ; ˆ22 = = 0,08 ; ˆ33 = = −0,075
1 0,84 1 0,84 0,73
0,84 1 0,84 1 0,84
0,73 0,84 1

b) Deoarece varianţa estimată a lui ˆkk este Var (rkk ) = Var (ˆkk ) = 1 / n = 1/50=0,02 rezultă că abaterea standard va fi

se (ˆkk ) = 1 / n = 1 / 50 = 0,02 = 0,1414 . Un coeficient ˆkk este semnificativ diferit de zero dacă se află în afara

intervalului (−2 / n ; + 2 / n ) , în acest caz (−0,2828 ; + 0,2828) .

Dacă ˆkk  (−0,2828 ; + 0,2828 ) acceptăm ipoteza că  kk nu este semnificativ diferit de zero.

Deoarece avem r11 = 0,84 , înseamnă că r11  (−0,2828 ; + 0,2828) , deci acceptăm ipoteza că 11 este semnificativ

diferit de zero. Pentru coeficienţii  22 şi 33 acceptăm ipoteza că nu sunt semnificativi statistic, deoarece r22 = 0,08 şi

r33 = −0,075 aparţin intervalului ( −0,2828 ; + 0,2828) .

Problema 4: Presupunem că se cunosc datele y1 , y 2 ,  , y n .

a) Să se definească autocorelaţia de lag 1. Această corelaţie măsoară dependenţa liniară a lui y t în raport cu ce altă

variabilă?
b) Descrieţi un test statistic (inclusiv regula de decizie), care poate fi folosit pentru a testa ipoteza nulă
H 0 : 1 =  2 =  3 =  4 , faţă de alternativa

H 1 : exista  i  0 , pentru i  [1,2,3,4] . Se presupune că seria y t este staţionară.

c) Descrieţi o metodă pentru a testa ipoteza nulă H 0 :  4 = 0 , faţă de alternativa H 1 :  4  0 , unde  4 este autocorelaţia

de lag 4 a unei serii cu date trimestriale y t . Care este statistica testului? Care este distribuţia de referinţă?

a) Autocorelaţia de lag 1 măsoară dependenţa liniară a lui y t în raport cu y t −1 .

 ( yt − y )( yt −1 − y )
n

r1 = ̂1 = t =2 n
t =1 ( yt − y ) 2
b) Folosim statistica Ljung-Box (calculată şi în EViews):
4  ˆ2 

Q(4) = n(n + 2)  k  ~  42 .
k =1  n − k 

Dacă Q(4)   42  acceptăm H 0  seria este staţionară.

Dacă Q(4)   42  respingem H 0  seria este nestaţionară.

c) Folosim raportul t = ˆ 4 / se ( ˆ 4 ) = ˆ 4 n , deoarece Var ( ˆ 4 ) = 1 / n . Dacă valoarea lui n este mare, statistica testului
urmează o distribuţie normală standard.
Problema 5: Analiza staţionarităţii seriei de timp PIB, pe baza corelogramei seriei
Un test simplu al staţionarităţii seriei este bazat pe funcţia de autocorelaţie (ACF).
Graficul funcţiei de autocorelaţie în raport cu decalajul k, se numeşte corelogramă.
Mai jos avem corelograma seriei cu date trimestriale privind PIB-ul , realizată în EViews.

Cum interpretăm corelograma?


Observăm că începe cu valori foarte mari (0,969 la lag-ul 1) şi scade treptat. Chiar la lag-ul 14, coeficientul de
autocorelaţie are o valoare destul de mare (0,500). Corelograma arată că seria PIB este nestaţionară. Pentru serii
nestaţionare coeficienţii de autocorelaţie scad foarte încet. Prin contrast, dacă un proces stochastic este pur aleator,
autocorelaţia la orice lag k  0 , va fi zero.

Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt aproximativ
normal distribuiţi, cu media 0 şi varianţa 1 / n , unde n este volumul selecţiei. ˆ k ~ N (0,1 / n) . Putem determina un

interval de încredere 95% în care se află  k .

 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k )) , deci  k  (−1,96 *1 / n ; 1,96 *1 / n ) .

În exemplul dat, deoarece n=88, varianţa lui ̂ k este 1/88, iar eroarea standard este 1 / 88 = 0,1066 . Conform

proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice k va fi

 1,96 (0,1066 ) = 0,2089 . Astfel, dacă un  k estimat se află în intervalul (−0,2089 ;0,2089 ) , nu respingem ipoteza

că  k real este zero. Dacă  k estimat se află în afara intervalului (−0,2089 ;0,2089 ) , atunci putem respinge ipoteza

că  k real este zero. Intervalul de încredere 95% este marcat prin două linii punctate. În corelogramă se observă că toţi

coeficienţii ̂ k până la decalajul 23 sunt semnificativi statistic, adică sunt statistic diferiţi de 0. Pentru a testa ipoteza

că toţi coeficienţii de autocorelaţie sunt simultan nuli, folosim statistica Ljung-Box:


m   ˆ2 
Q(m) = LB = n(n + 2)  k  ~  m2 .
k =1  n − k 

H 0 : toti  k = 0 (seria este staţionară)

H 1 : exista  k  0 (seria este nestaţionară)

Pentru seria de date PIB, statistica Q bazată pe 25 de decalaje are valoarea 891, deci este semnificativ diferită de 0;
probabilitatea de a obţine o astfel de valoare  2 este zero. Concluzia finală, bazată pe corelogramă, este că seria de
timp PIB este nestaţionară.

Problema 6: Testul pentru staţionaritate sau pentru o rădăcină egală cu 1


y t =  y t −1 +  t Dacă  = 1 , spunem că variabila y t are o rădăcină unitară.

y t = (  − 1) y t −1 +  t =  y t −1 +  t

Ipoteza de rădăcină unitară-Unit Root


H 0 : seria are rădăcină unitară şi este nestaţionară

H 1 : seria este staţionară

Testul Dickey-Fuller(Unit Root Test)


Dacă  = 1 sau  = 0 , atunci seria nu este staţionară. Dacă   1 , atunci seria este staţionară

 = DF = ˆ se(ˆ) . Dacă |  calc |  |  crt | respingem H 0 şi acceptăm că seria este staţionară.


Dacă |  calc |  |  crt | acceptăm că seria este nestaţionară.

Dickey şi Fuller au propus trei ecuaţii de regresie diferite:


i) y t =  y t −1 +  t (fără constantă şi fără trend);

ii) y t =  y t −1 +  +  t (cu constantă şi fără trend);

iii) y t =  y t −1 +  + t +  t (cu constantă şi cu trend);

Dacă  = 0 , seria conţine o rădăcină egală cu 1.


Testul ADF include termeni AR(p) ai termenului y t în cele trei modele alternative. Dacă termenul eroare este

autocorelat, ultimul din cele trei modele va fi:


p
yt =  yt −1 +  + t +   i yt −i +  t .
i =1

În cazul când avem Constantă dar nu avem Trend (fig. stânga) am obţinut:
Am obţinut următoarele rezultate:

Pˆ IBt = 28,7190 − 0,0033 PIBt −1 + 0,3197 PIBt −1


t = (1,2143) (–0,5472) (3,0888)
2
R =0,1047 DW=d=2,0405
Pentru scopul nostru este importantă statistica t (  =tau) a variabilei PIBt-1. Ipoteza nulă este că  = 0 , echivalent cu
 = 1 , sau există o rădăcină unitară. Pentru modelul nostru, valorile critice sunt –3,508326, –2,895512 şi –2,584952,
corespunzătoare nivelurilor de semnificaţie de 1%, 5% şi 10%. Valoarea calculată pentru statistica  este –0,547205,
care în valoare absolută este mai mică decât valorile critice. Probabilitatea=0,8756. Nu putem respinge ipoteza nulă
(acceptăm H0). Există o rădăcină unitară, deci seria PIB este nestaţionară.

În cazul când avem Constantă şi Trend (fig. dreapta) obţinem următoarele rezultate:

Pˆ IBt = 234 ,9729 + 1,892199 t − 0,078661 PIBt −1 + 0,355794 PIBt −1


t = (2,383391) (2,152260) (–2,215287) (3,464708)
R2=0,152615 DW=d=2,085875
Pentru scopul nostru este importantă statistica t (  =tau) a variabilei PIBt-1. Ipoteza nulă este că  = 0 , echivalent cu
 = 1 , sau există o rădăcină unitară. Pentru modelul nostru, valorile critice sunt –4,06829, –3,462912 şi –3,157836,
corespunzătoare nivelurilor de semnificaţie de 1%, 5% şi 10%. Valoarea calculată pentru statistica  este –2,215287,
care în valoare absolută este mai mică decât valorile critice. Prob=0,4749. Nu putem respinge ipoteza nulă, că există o
rădăcină unitară, deci seria PIB este nestaţionară.
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var ( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k = 0
 funcţia de autocovarianţă este: k = 
0 , k  0
1, k = 0
 funcţia de autocorelaţie este: k = 
0 , k  0
 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp y t este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci y t , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică y t creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Modele ARMA(p,q)
 Definiție: Un proces autoregresiv (AR) este un proces unde valoarea
curentă a lui y este influenţată de propriile valori din trecut şi de o
perturbaţie t:
yt = f ( yt −1 , yt − 2 , ) +  t

yt = a0 + a1  yt −1 + a2  yt − 2 +  + a p  yt − p

variabila aleatoare t este numită şi inovaţie, deoarece reprezintă partea


nepredictibilă a valorilor variabilei yt, date fiind valorile anterioare yt-1, yt-2, ….;

 Definiție: Un proces de medie mobilă (MA) este un proces unde


valoarea curentă (contemporană) a lui y este influenţată atât de valoarea
contemporană cât şi de valorile din trecut ale termenului inovaţie t:

yt = f ( t −1 ,  t − 2 , ) +  t

yt = a0 − b1 t −1 − b2 t − 2 −  − bq t − q +  t


Modele ARMA(p,q)
 Definiție: Un model de tip autoregresiv-medie mobilă ARMA(p,q) are o
componentă de tip autoregresiv respectiv o componentă de tip medie mobilă:
yt = f ( yt −1 , yt − 2 , ) + g ( t −1 ,  t − 2 , ) +  t

yt = a0 + a1 yt −1 + a2 yt − 2 +  + a p yt − p − b1 t −1 − b2 t − 2 −  − bq t − q +  t

 unde p este ordinul părţii autoregresive, q ordinul mediei mobile iar t este
un proces de tip zgomot alb (acesta fiind o succesiune de variabile
aleatoare independente şi identic repartizate, cu medie zero).
Funcția parțială de autocorelație (PAC)
 Observație: Coeficientul de autocorelaţie parţială măsoară efectul direct al
lui yt-k asupra variabilei yt (se izolează influenţa variabilei yt-k). Definiția
acestuia este similară cu a coeficientului de corelaţie parţială din
econometrie.
 Definiție: Coeficientul de autocorelaţie parțială între două variabile separate
de k unităţi de timp notat prin kk este coeficientul de regresie al variabilei yt-k
în modelul autoregresiv AR(k):
yt = k1 yt −1 + k 2 yt − 2 +  + kk yt − k +  t

şi măsoară informaţia adiţională adusă de variabila yt-k în explicarea


comportamentului prezent yt (cu câte unităţi se modifică yt dacă yt-k creşte cu
o unitate iar celelalte variabile yt-1, yt-2,…, yt-k+1 rămân nemodificate).
 Definiție: Funcția de autocorelație parțială constă în setul de
coeficienți kk, unde k=1,2,3,…
Estimarea coeficienților de autocorelație
parțială
 11 se estimează cu coeficientul de regresie a variabilei yt-1 în modelul AR(1):
yt = 11 yt −1 +  t  11 = corr ( yt , yt −1 ) = 1

 22 se estimează cu coeficientul de regresie a variabilei yt-2 în modelul AR(2):


yt = 21 yt −1 + 22 yt − 2 +  t  22 = corr ( yt , yt − 2 yt −1 )

Știind că:
r ( x, y ) − r ( x, z ) r ( y , z )
r ( x, y | z ) =  22 = (  2 − 12 ) /(1 − 12 )
1 − r ( x, z ) 1 − r ( y , z )
2 2

 kk se estimează cu coeficientul de regresie a variabilei yt-k în modelul AR(k):

yt = k1 yt −1 + k 2 yt − 2 +  + kk yt − k +  t
Estimarea funcției parțiale de autocorelație
 Observaţie: În practică (inclusiv în softurile de statistică) coeficienţii de
autocorelaţie parţială nu se determină prin modele de regresie ci se
folosesc ecuaţiile Yule-Walker, ce redau relaţiile dintre coeficienţii de
autocorelaţie şi coeficienţii de autocorelaţie parţială.
 Ecuaţiile Yule-Walker exprimă coeficienţii de autocorelaţie k sub
forma unor funcţii de coeficienţii autoregresivi i. Definim matricea
coeficienţilor liniari de autocorelaţie prin R(p), vectorul parametrilor
modelului prin  şi vectorul coeficienţilor de autocorelaţie prin .
0 1  p
R( p)   =  R( p) =
1 0 1  p −1
2 1  1
p  p −1  0

 Funcția parțială de autocorelație de selecție este mulțimea


coeficienților
{ˆ11 , ˆ22 ,...} = {ˆkk , k  1}
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
 Dacă în modelul de regresie
yt = yt −1 +  +  t
 găsim =1 , spunem că variabila are o rădăcină unitară.
yt = (  − 1) yt −1 +  t =  yt −1 +  t
 Ipoteza de rădăcină unitară (Unit Root)
 H0: seria are rădăcină unitară şi este nestaţionară ( =1 sau =0)
 H1: seria este staţionară ( 1 sau 0)
 Testul Dickey-Fuller (Unit Root Test)
 Dacă =1 sau =0 atunci seria nu este staţionară.
 Dacă 1 atunci seria este explozivă (tot nestaţionară; de regulă astfel de comportament nu este regăsit
în economie)
 Dacă 1 sau 0 atunci seria este staţionară.

 Statistica testului:  = DF = ˆ se(ˆ)


 Regula de decizie:
 Dacă |  calc |  |  crt | respingem H0 şi acceptăm că seria este staţionară.
 Dacă |  calc |  |  crt | acceptăm H0 că seria este nestaţionară.
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
 Dickey şi Fuller au propus trei ecuaţii de regresie diferite, care pot fi
folosite pentru a testa prezenţa unei rădăcini egale cu 1
 Test pentru un proces de mers la întâmplare, contra unui proces autoregresiv, de ordinul
întâi, AR(1), staţionar:
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  t ,   1 y t − y t −1 = (  − 1) y t −1 +  t  yt =  yt −1 +  t

 Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  +  t ,   1 yt − yt −1 = (  − 1) yt −1 +  +  t  yt =  yt −1 +  +  t

 Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare şi trend în timp.
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  + t +  t ,   1
yt − yt −1 = (  − 1) yt −1 +  + t +  t  yt =  yt −1 +  + t +  t
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)

 Parametrul de interes în toate cele trei ecuaţii de regresie este .


 Dacă o serie este staţionară, condiţia -1<<1 este echivalentă cu condiţia
de staţionaritate: .-2<<0.
 Dacă =0, seria conţine o rădăcină egală cu 1.
 Testul implică estimarea uneia din ecuaţiile de mai sus prin MCMMP, pentru
a obţine valorile estimate ale lui  şi eroarea standard asociată. Deoarece
termenul eroare este puţin probabil să fie un proces de zgomot alb, Dickey
şi Fuller au aplicat o procedură îmbunătăţită, care foloseşte p decalaje ale
variabilei dependente. Testul ADF include termeni AR(p) ai termenului yt în
cele trei modele alternative. Dacă termenul eroare este autocorelat, ultimul
din cele trei modele va fi:
p
yt =  yt −1 +  +  t +   i yt −i +  t
i =1
1. Analiza graficului unei serii de timp
 Graficele seriilor arată
că seriile au o tendinţă
crescătoare, deşi trendul
nu este neted.
 Se observă că media,
varianţa şi
autocovarianţele fiecărei
serii nu par a fi
invariante în raport cu
timpul. Aceste serii sunt
serii de timp
nestaţionare.

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


2. Analiza staţionarităţii seriei de timp
PIB, pe baza corelogramei seriei

Corelograma arată că seria PIB este nestaţionară.


Intervalul de incredere pentru coeficientii de
autocorelatie este:

(−1,96(0,1066),+1,96(0,1066))

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1,
Seria are Constantă dar nu si Trend

y t =  y t −1 +  t
 Dacă  = 0 , spunem că variabila are o
rădăcină unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1
Seria are Constantă si Trend

p
yt =  yt −1 +  + t +   i yt −i +  t
i =1

 Dacă  = 0 , spunem că variabila are o


rădăcină unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
Procese nestaționare
 Definiție: Un proces este nestaționar dacă nu verifică una sau mai multe
din cerinţele din definiția procesului staţionar.
 În economie majoritatea seriilor sunt nestaţionare, media respectiv varianţa
acestora nefiind constante în timp.

 Detectarea nestaţionarităţii:
 din cronogramă şi corelogramă: autocorelaţiile unei serii staţionare se apropie
rapid de zero, odată ce k creşte (tind exponenţial spre zero). Pentru o serie
nestaţionară autocorelaţiile sunt mari şi pozitive pentru un număr mare de valori
ale lui k.
 utilizarea unor teste de staţionaritate (numite şi teste de rădăcină unitate)
Serie nestaționară de tip TS (Trend Stationarity)
 Definiție: O serie nestaţionară este de tip TS dacă trendul este de
tip determinist şi se elimină prin scădere sau prin împărţire
y t =  +  t +  t t = 1,2,..., n;  t este zgomot alb
 Proprietăți:
 Media unei serii TS nu este constantă: E ( yt ) = E ( +  t +  t ) =  +  t

Varianța seriei este constantă în timp: Var ( yt ) = Var ( +  t +  t ) =  


2

 Covarianța este zero: cov( y t , y t + h ) = 0 ,  h  0

 Observații:
 Efectul produs de un șoc aleator este tranzitoriu, deci nu se acumulează în timp

 Staționarizarea se face prin estimarea trendului și eliminarea lui din seria


inițială
Serie nestaționară de tip DS (Differency Stationarity)
 Definiție: O serie nestaţionară este de tip DS dacă trendul este de
tip stochastic şi se elimină prin calculul diferențelor de ordinul 1 sau
mai mare decât 2
yt = yt −1 +  +  t t = 1,2,..., n;  t este zgomot alb

 Diferențele de ordin 1 și 2:
yt = yt − yt −1
2 yt = ( yt − yt −1 ) = yt − yt −1 = ( yt − yt −1 ) − ( yt −1 − yt − 2 ) = yt − 2 yt −1 + yt − 2

 Definiție: Dacă =1 spunem că yt are o rădăcină unitate


 Proprietăți:
 Media unei serii DS este variabilă în timp: E ( yt ) = y 0 +  t

Varianța seriei depinde de timp: Var ( yt ) = t 


2

Covarianța seriei nu este zero: cov( yt , yt + h ) = h    ,  h  0


2

Serie nestaționară de tip DS (Differency Stationarity)
 Observații:
 Termenul liber al seriei de tip DS nu este o constantă ci o realizare a variabilei
aleatoare yt

 Efectul produs de un șoc aleator nu este tranzitoriu ci de durată

 Staționarizarea se face prin aplicarea operatorului de diferențiere


Serii integrate
 Definiție:
 Spunem că seria yt este integrată de ordinul 1, sau conţine o rădăcină egală cu 1,
dacă este nestaţionară dar seria diferenţelor este staţionară. O astfel de serie se
notează prin yt  I(1).
 Spunem că seria yt este integrată de ordinul 2 dacă ea conţine două rădăcini egale cu
1 şi astfel, este necesară diferenţierea de două ori pentru a induce staţionaritatea. Se
notează prin yt  I(2).
 Spunem că seria yt este integrată de ordinul d dacă ea conţine d rădăcini egale cu 1
şi astfel, este necesară diferenţierea de d ori pentru a induce staţionaritatea. Se
notează prin yt  I(D).
 Observație:
 Ordinul de integrare al unei serii este egal cu numărul care arată de câte ori trebuie
diferenţiată seria pentru a deveni staţionară şi este egal cu numărul de rădăcini egale cu 1.
 Majoritatea seriilor de date economice conţin o singură rădăcină egală cu 1.
 Cele mai multe serii cronologice macroeconomice au tendinţă şi, în mod specific, ele
conţin trenduri stochastice.
Modele ARIMA
 Definiție: xt este un proces ARIMA(p,d,q) dacă:
 xt este o serie nestaționară
 xt devine staționară după d diferențieri
 d xt = (1-L)dxt este proces ARMA(p,q)

 Scrierea modelelor ARIMA folosind operatorul de diferențiere:


 ARMA(p,q): Yt = a1Yt −1 + a 2Yt −2 +  + a PYt − P − b1 t −1 − b2 t −2 −  − bq  t −q +  t
(1 − a L − a L
1 2
2
) ( )
−  − a p L p Yt = 1 − b1 L −  − bq Lq  t

 (L )Yt =  (L ) t
 (L ) = 1 − a1 L − a2 L2 −  − a p Lp
 ( L) = 1 − b1 L −  − bq Lq

ARIMA(p,d,q):  (L )(1 − L) X t =  (L ) t
d

Definiții, Notații
 Un proces autoregresiv
 AR (p): 𝑦𝑡 = 𝑎0 + 𝑎1 ⋅ 𝑦𝑡−1 + 𝑎2 ⋅ 𝑦𝑡−2 + ⋯ + 𝑎𝑝 ⋅ 𝑦𝑡−𝑝 + 𝜀𝑡

 Un proces de medie mobilă


 MA (q): 𝑦𝑡 = 𝑎0 − 𝑏1 𝜀𝑡−1 − 𝑏2 𝜀𝑡−2 − ⋯ − 𝑏𝑞 𝜀𝑡−𝑞 + 𝜀𝑡

 Un model de tip autoregresiv-medie mobilă


 ARMA(p,q): yt = a0 + a1 yt −1 + a2 yt − 2 +  + a p yt − p − b1 t −1 − b2 t − 2 −  − bq t − q +  t

 Un model integrat de tip autoregresiv-medie mobilă


ARIMA(p,d,q):  (L )(1 − L) X t =  (L ) t
d

 (L ) = 1 − a1 L − a2 L2 −  − a p Lp
 ( L) = 1 − b1 L −  − bq Lq
d xt = (1-L)dxt staționară
Teorema de descompunere a lui Wold
 Orice proces stochastic slab staţionar şi absolut nedeterminist (yt - )
poate fi reprezentat ca o combinaţie liniară (sau filtru liniar) de variabile
aleatoare necorelate.

yt −  =  t − b1 t −1 − b2 t − 2 −  =  j  t − j  0 = 1, j = −b j pentru j = 1,2,...
j =0 


j =0
2
j 

 teste un proces de zgomot alb (white noise), adică un şir de variabile


aleatoare independente, identic distribuite, cu media 0 şi varianţa 2.
Ponderile j sunt legate de autocorelaţiile lui yt prin relaţiile:

  j j +k

  0 =1
 k = k = j =0  2 , k  0
 0 1+   j
j =1
Seminar 3
Martie 2023

Analiza stationarității seriilor de timp

Materialul a fost pregatit pornind de la cursul si seminarul de serii de timp al Dnei Prof. Silvia Spataru

ANALIZA STAŢIONARITĂŢII SERIEI PIB


1. Analiza graficului unei serii de timp
Considerăm datele observate cu privire la 5 serii cronologice economice cu frecvenţă trimestrială, în perioada anilor
1985-2006, un total de 88 observaţii pentru fiecare serie de timp. Seriile sunt: Produsul Intern Brut (PIB), Venitul
Personal Disponibil (VPD), Cheltuielile de Consum Personal (CCP), Profiturile şi Dividendele.
Valorile observate se află în fişierul Aplicatie 5 Serii Timp.xls din folderul Eviews 4.1 Stud.

Figura 1. Graficele seriilor de timp PIB, VPD, CCP, Profituri şi Dividende.


Graficele seriilor arată că seriile au o tendinţă crescătoare, deşi trendul nu este neted, mai ales în cazul seriei Profiturilor.
Se observă că media, varianţa şi autocovarianţele fiecărei serii nu par a fi invariante în raport cu timpul. Aceste serii
sunt serii de timp nestaţionare.

2. Analiza staţionarităţii seriei de timp PIB, pe baza corelogramei seriei


Un test simplu al staţionarităţii seriei este bazat pe funcţia de autocorelaţie (ACF).
Graficul funcţiei de autocorelaţie în raport cu decalajul k, se numeşte corelogramă.
Mai jos avem corelograma seriei cu date trimestriale privind PIB-ul , realizată în EViews.

Cum interpretăm corelograma?


Observăm că începe cu valori foarte mari (0,969 la lag-ul 1) şi scade treptat. Chiar la lag-ul 14, coeficientul de
autocorelaţie are o valoare destul de mare (0,500). Corelograma arată că seria PIB este nestaţionară. Pentru serii
nestaţionare coeficienţii de autocorelaţie scad foarte încet. Prin contrast, dacă un proces stochastic este pur aleator,
autocorelaţia la orice lag k  0 , va fi zero.
Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt aproximativ
normal distribuiţi, cu media 0 şi varianţa 1 / n , unde n este volumul selecţiei. ˆ k ~ N (0,1 / n) . Putem determina un

interval de încredere 95% în care se află  k .

 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k )) , deci  k  (−1,96 *1 / n ; 1,96 *1 / n ) .

În exemplul dat, deoarece n=88, varianţa lui ̂ k este 1/88, iar eroarea standard este 1 / 88 = 0,1066 . Conform

proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice  k va fi

 1,96 (0,1066 ) = 0,2089 . Astfel, dacă un  k estimat se află în intervalul (−0,2089 ;0,2089 ) , nu respingem

ipoteza că  k real este zero. Dacă  k estimat se află în afara intervalului (−0,2089 ;0,2089 ) , atunci putem respinge
ipoteza că  k real este zero. Intervalul de încredere 95% este marcat prin două linii punctate. În corelogramă se

observă că toţi coeficienţii ̂ k până la decalajul 23 sunt semnificativi statistic, adică sunt statistic diferiţi de 0.

3. Se consideră 2 variabile economice cu date pe 25 perioade.

vt 1 4 2 2 5 5 3 3 1 4 4 3 3 5 4 4 4 1 3 3 3 3 1 2 2
zt 1 1 2 1 2 2 2 3 3 3 3 3 4 4 5 5 5 5 6 5 6 6 7 8 8

Coeficienţii de autocorelaţie obţinuţi pentru decalajele k=1, 2, 3 sunt:


– pentru seria vt: r1 = 0,1053; r2 = –0,0526; r3 = 0.
– pentru seria zt: r1 = 0,8302; r2 = 0,6887; r3 = 0,5755.
Să se testeze coeficienții de autocorelație folosind testul Bartlet?

Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt aproximativ
normal distribuiţi, cu media 0 şi varianţa 1 / n , unde n este volumul selecţiei. Putem determina un interval de încredere
95% în care se află  k .

 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k )) , deci  k  (−1,96 *1 / n ; 1,96 *1 / n ) .

În exemplul dat, deoarece n=25, varianţa lui ̂ k este 1/25, iar eroarea standard este 1 / 25 . Conform proprietăţilor

distribuţiei normale standard, intervalul de încredere 95% pentru orice  k va fi (−0,392 ;0,392 ) . Astfel, dacă un  k

estimat se află în intervalul (−0,392 ;0,392 ) , nu respingem ipoteza că  k real este zero. Dacă  k estimat se află în

afara intervalului (−0,392 ;0,392 ) , atunci putem respinge ipoteza că  k real este zero.

Pentru seria vt: toţi rk sunt în interiorul intervalului. Seria este aleatoare.
Pentru seria zt: toţi rk sunt în afara intervalului
Serii de timp

Curs 3, Martie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Noţiuni generale
 Definiţie: Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia
aferentă momentului t și variabila aleatoare (Yt ), se definesc:

 media variabilei (Yt ): E (Yt ) =  t

 varianţa variabilei (Yt ) : Var (Yt ) =  t2 = E[(Yt −  t ) 2 ]

 covarianţa dintre două variabile (Yt ) şi ( Y s ), prin:

 ts = cov(Yt , Ys ) = E (Yt −  t )(Ys −  s )


Procese staţionare
 În termeni generali, o serie cronologică este considerată staţionară
dacă nu prezintă nici o modificare sistematică în medie (nu prezintă
tendinţă pe termen lung) şi nici o modificare sistematică în varianţă.

 Graficul unei serii staţionare prezintă fluctuaţii cu amplitudine relativ


constantă (varianţă constantă) în jurul unei medii constante, independente
de timp (staţionaritate în medie).
Procese staţionare
 Definiţie: Un proces stochastic este strict staţionar dacă funcţia
densitate de probabilitate a oricăror doi vectori (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑛 ) şi
(𝑌𝑠 , 𝑌𝑠+1 , … , 𝑌𝑠+𝑛 ) , cu n+1 elemente consecutive, este aceeaşi pentru orice

valori ale lui t şi s, indiferent de mărimea lui n.

 Altfel spus: un proces stochastic este strict staţionar dacă pentru


orice k, distribuţia lui (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑘 ) este aceeaşi pentru toţi t, deci este
invariantă în timp (comportamentul procesului nu se modifică în timp).

 Exemplu: Distribuţia lui (𝑌5 , 𝑌6 , … , 𝑌 10 ) este aceeaşi cu distribuţia lui


(𝑌110 , 𝑌111 , … , 𝑌115 )
Procese staţionare
 Observaţii:
 Distribuţia lui Yt este aceeaşi cu distribuţia lui Yt+k pentru orice întreg k

 1. E(Yt)=E(Yt+k)
 2.Var(Yt)=Var(Yt+k)
 3.Variabilele (Yt) dintr-un proces staţionar sunt identic distribuite (nu
neapărat independente).
 Distribuţia lui (Yt, Ys) este aceeaşi cu distribuţia lui (Yt+k,Ys+k) pentru
toate decalajele (t-s) şi pentru orice întreg k 
 Cov (Yt, Ys) = Cov (Yt+k, Ys+k) =  (k) pentru orice s, t, k.

 Definiţie: Prin lag se înţelege decalajul (întârzierea) exprimată în unităţi de


timp, între modificarea variabilei cauză şi manifestarea efectului.
Procese staţionare

 Definiţie: Un proces stochastic este slab staţionar (staţionar de


ordinul 2, staţionar în covarianţă) dacă media şi dispersia sunt constante în
timp iar covarianţa sa între două perioade de timp depinde numai de
decalajul dintre cele două perioade şi nu de momentul de timp la care este
calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui
nivel mediu constant 
 E (Yt ) =  , t : media este constantă în timp (staţionalitate în medie)
 Var (Yt ) =  2 : varianţa este constantă în timp (staţionalitate în varianţă)
 cov (Yt , Ys ) =  k , t  s unde k=s-t: covarianţa dintre două variabile este funcţie
doar de lungimea intervalului de timp ce separă cele 2 variabile.
Procese staţionare
 Observaţii:
 1. Dacă seria de timp este normal distribuită, atunci staţionaritatea slabă
şi staţionaritatea strictă sunt echivalente.
 2. Seriile cronologice staţionare au proprietatea că media, varianţa şi
covarianţele (atunci când există), pot fi calculate pe baza unui eşantion.
 3. Staţionaritatea slabă implică faptul că reprezentarea grafică a datelor va
arăta că cele n valori fluctuează cu o variaţie constantă în jurul unui nivel
constant.
Procese nestaţionare
Procese nestaţionare - exemple
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var ( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k = 0
 funcţia de autocovarianţă este: k = 
0 , k  0
1, k = 0
 funcţia de autocorelaţie este: k = 
0 , k  0
 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp y t este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci y t , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică y t creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Funcţia de autocorelaţie
 Definiţie: Se defineşte funcţia de autocovarianţă a unui proces staţionar
şirul autocovarianţelor de lag k, (k) unde k=0,±1,±2,…

𝛾𝑘 = 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 = 𝐸 𝑌𝑡 𝑌𝑡+𝑘 − 𝐸 𝑌𝑡 E(𝑌𝑡+𝑘 )

 Definiţie: Se defineşte funcţia de autocorelaţie a unui proces staţionar şirul


autocorelaţiilor de lag k, (k) unde k=0,±1,±2,…
𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝛾𝑘
𝑘 = 𝑐𝑜𝑟𝑟 𝑌𝑡 , 𝑌𝑡+𝑘 = = =
𝑉𝑎𝑟 𝑌𝑡 𝑉𝑎𝑟(𝑌𝑡+𝑘 ) 𝑉𝑎𝑟 𝑌𝑡 𝛾0

 Definiţie: Graficul funcţiei de autocorelaţie în raport cu decalajul k se


numeşte corelogramă
Corelogramă

 Cum interpretăm corelograma?


 Observăm că începe cu valori foarte mari
(0,969 la lag-ul 1) şi scade treptat.
 Chiar la lag-ul 14, coeficientul de autocorelaţie
are o valoare destul de mare (0,500).
 Corelograma arată că seria PIB este
nestaţionară.
 Pentru serii nestaţionare coeficienţii de
autocorelaţie scad foarte încet.
 Prin contrast, dacă un proces stochastic
este pur aleator, autocorelaţia la orice
lag K0 , va fi zero.
Interpretarea corelogramei
a) Serie aleatoare. O serie complet aleatoare are coeficienţii de autocorelaţie
 k  0 pentru orice k  0 şi pentru valori mari ale lui n. Pentru o serie aleatoare
se demonstrează că  k ~ N (0,1 / n) şi atunci ne aşteptăm ca o singură valoare a lui
 k să fie semnificativă.
b) Serie ce prezintă corelaţie pe termen scurt. O astfel de serie are o valoare
mare a lui 1 , după care urmează 2 sau 3 coeficienţi diferiţi de zero dar
valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori
ale lui  k apropiate de 0.
c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei,
atunci şi coeficienţii de autocorelaţie vor alterna. Coeficientul  1 va fi negativ.
Dacă valoarea observată la lag-ul 2 tinde să fie de aceeaşi parte a mediei,
atunci  2 va fi pozitiv.
d) Serie nestaţionară. Dacă o serie conţine trend, o observaţie de o anumită
parte a mediei tinde să fie urmată de un număr mare de observaţii de aceeaşi
parte a mediei. În acest caz, valorile lui  k vor tinde la zero doar pentru valori
foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea
coeficienţilor  k . Cu alte cuvinte, coeficienţii  k trebuie calculaţi numai
pentru seriile staţionare.
Estimarea coeficienţilor de autocorelaţie
 În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionarităţii, media
 şi varianţa 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
1 T
Y =  Yt
T t =1
1 T
s =  (Yt − Y ) 2
2

T t =1

 Coeficientul de autocorelaţie de selecţie se estimează prin:


 (Y − Y )(Yt − k − Y ) /(T − k )
T

t
rˆk = t = k +1
sau prin:
 (Y −Y ) /T
T
2
t
t =1

 (Y − Y )(Yt − k − Y )
T

t dacă T este suficient de mare pentru


rˆk = t = k +1

 (Y −Y ) ca T/T-k să poată fi aproximat cu 1


T
2
t
t =1
Testarea semnificaţiei coeficieţilor de
autocorelaţie (test Bartlet)
Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n, unde n este volumul selecţiei:
ˆ k ~ N (0,1 / n) Putem determina un interval de încredere 95% în care se află k .
Ipoteze:
H0 : rk = 0 (nu diferă semnificativ de zero) . Deci seria de timp este pur aleatoare
H1 : rk  0 . Deci seria de timp nu este staționară
Testul Student:
rˆk
t= converge asimtotic (când T →  ) la N (0,1)
Vˆar (rˆk )
Pentru varianţa estimatorului coeficientului de autocorelaţie
Bartlett a furnizat următoarea expresie:

1  1
 ( )
 k −1
Var (rˆk ) = 1 + 2 rˆi 2  = 1 + 2 rˆ12 +  + rˆk2−1 . Var ( ˆ k ) = 1 / T pentru T mare
T i =1  T

Regula de decizie: O regiune de acceptare 1- pentru H0 va fi dată prin intervalul


Fie  un nivel de semnificaţie  
− ttab / T , ttab / T pentru k0. Dacă valoarea coeficientului de
t calc  − t tab , t tab   se accepta H0 autocorelaţie cade în afara acestui interval, pentru o valoare dată a
lui k, atunci ipoteza H0 este respinsă și se acceptă H1.
Testarea semnificației coeficienților de
autocorelație

 Testarea ipotezei că mai mulţi coeficienţi de autocorelaţie sunt zero:


H 0 : toti  k = 0 1 =  2 =  =  m = 0
H 1 : exista  k  0
m
 Statistica Box şi Pierce: QBP (m) = n  ˆ k2  2m
k =1

m
 ˆ k2 
 Statistica Ljung Box : QLB (m) = n(n + 2 )   ~  m2
k =1  n − k 

 Regula de decizie: QLB   crt


2
 se accepta H 0

QLB   crt
2
 se respinge H 0
Exemplu
 Se consideră 2 variabile economice cu date pe 25 perioade.
vt 1 4 2 2 5 5 3 3 1 4 4 3 3 5 4 4 4 1 3 3 3 3 1 2 2
zt 1 1 2 1 2 2 2 3 3 3 3 3 4 4 5 5 5 5 6 5 6 6 7 8 8

Coeficienţii de autocorelaţie obţinuţi pentru decalajele k=1, 2, 3 sunt:


– pentru seria vt: r1 = 0,1053; r2 = –0,0526; r3 = 0.
– pentru seria zt: r1 = 0,8302; r2 = 0,6887; r3 = 0,5755.

Să se testeze coeficienții de autocorelație folosind testul Bartlet?

 Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n , unde n este volumul selecţiei.
 Putem determina un interval de încredere 95% în care se află  k .
 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k ))   k  (−1,96 *1 / n ; 1,96 *1 / n )

 n=25, varianţa lui este 1/25, iar eroarea standard este 1/5.
 Conform proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice  k va fi
(-0.392,0.392) .
 Pentru seria vt: toţi rk sunt în interiorul intervalului. Seria de timp este pur aleatoare
 Pentru seria zt: toţi rk sunt în afara intervalului deci seria este nestaționară.
Seminar 1
Februarie 2023
Modele deterministe – serii de timp

Problema 1: Estimarea tendinţei exponenţiale


Previziunea populaţiei unei ţări, a schimbărilor în structura sa pe vârste, constituie
componente importante ale deciziilor pe termen lung privind sistemul asigurărilor sociale (în
principal a pensiilor) influenţând şi politica de imigrare.
Populaţia României a crescut în perioada 1980-1988 într-un ritm destul de accelerat, după
cum arată şi datele de mai jos:

An 1980 1981 1982 1983 1984 1985 1986 1987 1988


Nr. populaţiei 22.20 22.35 22.48 22.55 22.62 22.72 22.82 22.94 23.15
(mil. loc.)

Vom modela tendinţa printr-o funcţie exponenţială, avand in vedere modelul multiplicativ:
Yt = a  b t   t
Logaritmarea ambilor membrii conduce la liniarizarea tendinţei:
ln Yt = ln a + t ln b + ln  t ,
respectiv
Z t = A + Bt + t ,
unde Z t = ln Yt , A = ln a, B = ln b, t = ln  t .

t 1 2 3 4 5 6 7 8 9
Z t = ln Yt 3.100 3.107 3.109 3.116 3.119 3.123 3.128 3.133 3.142

M (tZ ) − M (t ) M ( Z )
B= ,
M (t 2 ) − M (t )
2

A = M ( Z ) − BM (t ).
3.100 + 3.107 +  + 3.142
M (Z ) = = 3.119,
9
(1  3.100) + (2  3.107) +  + (9  3.142)
M (tZ ) =
9
Se obţin pentru parametrii A respectiv B următoarele estimaţii:
B = 0.005 , A = 3.09 .
Parametrii tendinţei exponenţiale rezultă în consecinţă:
a = e A = 22 .11, b = e B = 1.005
Tt = 22 .11  (1.005 ) t .

O extrapolare a acestei tendinţe ar indica o populaţie previzibilă pentru anul 2000 de:
Yˆ21 = Tˆ21 = 22.11  (1.005)21 = 24.36 mil. locuitori,
valoarea reală fiind de 22.43 mil. locuitori. După 1989 nu s-a menţinut tendinţa de creştere a
numărului populaţiei, mediul economic şi social, cu influenţă directă asupra evoluţiei populaţiei
unei ţări, schimbăndu-se substanţial faţă de cel din perioada 1980 – 1988 (perioadă utilizată în
estimarea tendinţei).

Problema 2 : Estimarea componentelor deterministe în cazul seriilor sezoniere


Datele privind evoluţia trimestrială a producţiei de bere (mii hl) realizată de către o societate în
perioada 2001-2006 sunt indicate în tabelul 4.

Tabelul 4. Evoluţia trimestrială a producţiei de bere, perioada 2001-2006


An/Trim. I II III IV
2001 124.1 263.2 252.4 124.5
2002 130.1 280.2 260.6 151.1
2003 157.5 301.2 353.3 185.0
2004 169.7 340.0 350.9 168.7
2005 177.5 407.6 417.2 224.1
2006 202 .9 385 .3 425 .6 196 .6

a) Calculul mediilor mobile de ordin p=4


Graficul seriei, din figura 7, indică prezenţa unei componente sezoniere predominante, de perioadă
p = 4. Punctul de pornire în estimarea componentelor deterministe îl constituie seria mediilor mobile
(valorilor desezonalizate) prezentată în tabelul 5, iar grafic în figura 7.
Mediile mobile de ordin p = 4 sunt calculate conform relaţiei de definiţie a mediilor mobile centrate. Astfel,
spre exemplu:
0.5  Y1 + Y2 + Y3 + Y4 + 0.5  Y5
Y3 = =
4
0.5  124.1 + 263.2 + 252.4 + 124.5 + 0.5  130.1
= = 191.8
4

0.5  Y2 + Y3 + Y4 + Y5 + 0.5  Y6
Y4 = =
4
0.5  263.2 + 252.4 + 124.5 + 130.1 + 0.5  280.2
= = 194.7
4

0.5  Y20 + Y21 + Y22 + Y23 + 0.5  Y24
Y22 = =
4
0.5  224.1 + 202.9 + 385.3 + 425.6 + 0.5  196.6
= = 306.0.
4
Datele observate au fost numerotate aici în ordine cronologică Y1 , Y2 , ...Y24 .
Tabelul 4. Mediile mobile de ordinul 4
t MM(4) t MM(4)
1 - 13 261.7
2 - 14 259.4
3 191.8 15 258.3
4 194.7 16 267.7
5 197.8 17 284.5
6 202.2 18 299.7
7 208.9 19 309.8
8 214.9 20 310.2
9 229.2 21 308.4
10 245.0 22 306.0
11 250.8 23 -
12 257.1 24 -
a) Estimarea tendinţei pornind de la seria mediilor mobile
Seria mediilor mobile prezentată grafic în figura 7. relevă o uşoară tendinţă de creştere a producţiei de
bere. Vom considera tendinţa liniară:
Tt = a + bt +  t ,
originea de măsurare a timpului trimestrul II al anului 2001, unitatea de măsură un trimestru. Astfel, pentru
trimestrul III 2001 avem t = 1 ş.a.m.d:

t 1 2 3 ... 19 20
Mediile mobile ( Z t ) 191.8 194.7 197.8 ... 308.4 306.0

M (tZ ) − M (t ) M ( Z )
b= ,
M (t 2 ) − M (t )
2

a = M ( Z ) − bM (t ).
Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
Tendinţa producţiei de bere în este estimată prin ecuaţia liniară:
Tt = 180 .44 + 6.9  t .
500

450

400

350

300

250

200

150

100

50
0 2 4 6 8 10 12 14 16 18 20 22 24 26
Productia de bere MM(4)

Figura 7. ---- Producţia de bere; ---- MM(4); ---- Tendinţa


c) Estimarea componentei sezoniere prin metoda raportării la mediile mobile
Cum amplitudinea oscilaţiilor creşte uşor în timp, cronograma seriei sugerează luarea în considerare a
unui model multiplicativ:
Yij = Tij  S j   ij ; i = 1, 2,..., 6 iar j = 1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani şi sunt prezente aici 4 sezoane. Ţinând seama de notaţiile
specifice acestui paragraf, Yij reprezintă nivelul producţiei de bere în anul i trimestrul j. Astfel,
spre exemplu Y13 = Y2001;III = 252 .4 sau y34 = y2003; IV = 185 .0 . Mediile mobile din tabelul 4 vor fi
transpuse într-un tabel analog cu cel de prezentare a datelor observate:
An/Trim. I II III IV
2001 - - 191.8 194.7
2002 197.8 202.2 208.9 214.9
2003 229.2 245.0 250.8 257.1
2004 261.7 259.4 258.3 267.7
2005 284.5 299.7 309.8 310.2
2006 308.4 306.0 - -
Yij
Rapoartele S ij =  100 , respectiv mediile acestora pentru fiecare sezon sunt indicate în tabelul 5.
Yij

Tabelul 5. Calculul indicilor sezonalităţii


An/Trim. I II III IV
1996 - - 131.6 63.9
1997 65.8 138.6 124.7 70.3
1998 68.7 122.9 140.9 71.9
1999 64.8 131.1 135.8 63.0
2000 62.4 136.0 134.7 72.7
2001 65.8 125.9 - -
Ij 65.5 130.9 133.5 68.4 Media 99.6
Sj 65.6 131.4 134.0 68.8 Media 100

Explicaţii privind calculele:


Y13 252.4 Y 124.5
S13 =  100 =  100 = 131.6 , S14 = 14  100 =  100 = 63.9 ,
Y13 191.8 Y14 194.7
Y 130.1
S 21 = 21  100 =  100 = 65.8 , ş.a.m.d.
Y21 197.8
Cum era de aşteptat, aceste rapoarte între datele observate şi mediile mobile sunt mai mici decât 1 pentru
trimestrele I şi IV, când nivelul producţiei a fost sistematic mai mic (sub tendinţă).

S 21 + S 31 + S 41 + S 51
I1 = = 65.5, I 2 = 130.9,
4
S + S 23 + S 33 + S 43
I 3 = 13 = 133.5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel că este necesară o corecţie astfel încât media să fie 100:
I1 65.5
S1 =  100 =  100 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
99.6 99.6
Urmare a caracterului sezonier specific producţiei de bere, în trimestrul I producţia a fost mai mică în medie
cu 34.4% decât valorile corespunzătoare de pe tendinţă. În trimestrul II producţia a fost în medie mai mare
de 1.314 ori decât valorile de pe tendinţă. Analog se interpretează S3 şi S4.
Componenta sezonieră este dată de vectorul format cu indicii sezonalităţii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).
d)Descompunerea seriei pe componente
Pentru tendinţă a fost estimat modelul liniar:
Tt = 180 .44 + 6.9t t=1, 2, ....
originea de măsurare a timpului fiind trimestrul II al anului 2001, unitatea de măsură un trimestru.
Componenta sezonieră constă în indicii sezonalităţii:
S1 = 65 .6, S 2 = 131 .4, S 3= 134 .0, S 4 = 68 .8 .
Componenta aleatoare (reziduu) se deduce ţinand seama de forma multiplicativă a modelului:
Y
Comp. aleatoare (Reziduu) =
T S
Tabelul 6. Descompunerea seriei pe componente

An Trim. Producţie MM(4) Tendinţă Comp. Reziduu


Y T sezonieră S
2001 I 124.1 - - - -
II 263.2 - - - -
III 252.4 191.8 187.34 1.340 1.005
IV 124.5 194.7 194.24 0.668 0.959
2002 I 130.1 197.8 201.14 0.656 0.986
II 280.2 202.2 208.40 1.314 1.023
III 260.6 208.9 214.94 1.340 0.905
IV 151.1 214.9 221.84 0.688 1.020
2003 I 157.5 229.2 228.74 0.656 1.049
II 301.2 245.0 235.64 1.314 0.973
III 353.3 250.8 242.54 1.340 1.087
IV 185.0 257.1 249.44 0.688 1.078
2004 I 169.7 261.7 256.34 0.656 1.009
II 340.0 259.4 263.24 1.314 0.983
III 350.9 258.3 270.14 1.340 0.969
IV 168.7 267.7 277.04 0.688 0.885
2005 I 177.5 284.5 283.94 0.656 0.953
II 407.6 299.7 290.84 1.314 1.066
III 417.2 309.8 297.74 1.340 1.046
IV 224.1 310.2 304.64 0.688 1.069
2006 I 209.9 308.4 311.54 0.656 1.027
II 385.3 306.0 318.44 1.314 0.856
III 425.6 - 325.34 1.340 0.976
IV 196.6 - 332.24 0.688 0.860

e) Previziuni utilizând modelul de descompunere


Previziunile privind evoluţia variabilei analizate Yˆ se obţin prin compunerea previziunilor realizate
pentru fiecare componentă prezentă în serie, ţinând seama de forma modelului:
Yˆ = Tˆ + Sˆ respectiv Yˆ = Tˆ  Sˆ .
Notăm cu YˆT +h previziunea realizată la momentul T, utilizând datele Y1 , Y2 ,...., YT , pentru un orizont
de timp h. În cele ce urmează previziunea componentelor deterministe se realizează astfel:
• tendinţa: se extrapolează tendinţa estimată printr-o funcţie elementară. Spre exemplu în cazul
tendinţei liniare:
TˆT +h = a + b(T + h)
dacă variantele variabilei timp t sunt: 1, 2, ...T. Se are în vedere aici modul de definire a variantelor
variabilei timp;
• componenta sezonieră: se utilizează coeficientul sezonalităţii aferent sezonului corespunzător
momentului T+h.
Tabelul următor conţine previziunile privind nivelul producţiei de bere pentru următoarele trei
trimestre:

An Trim. Tendinţă Sezonalitat Previziune


e
2006 III 325.34 1.34 435.95
IV 332.24 0.688 228.58
2007 I 339.14 0.656 217.9

Modelul de descompunere considerat a fost cel multiplicativ, astfel că valorile previzionate se obţin din
relaţia:
Yˆ = Tˆ  Sˆ
Spre exemplu, pentru trimestrul III din 2006, valorile tendinţei respectiv a componentei sezoniere sunt:

Tˆ (21) = 180.44 + 6.9  21 = 325.34 respectiv Ŝ 3 = 1.34

valoarea previzionată fiind:

Yˆ = Tˆ  Sˆ = 325 .34  1.34 = 435 .95 .


Serii de timp

Curs 2, Martie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Componentele unei serii cronologice

Yt = f (Tt , Ct , S t ,  t )
Modele de descompunere a seriilor de timp

 Modelul aditiv Yt = Tt + Ct + S t +  t

 Modelul multiplicativ Yt = Tt  Ct  S t   t

 Combinație mixtă a componentelor seriei


Mediile mobile
 Ipoteza 1: Seria prezintă doar tendință și componentă aleatoare
 Ipoteza 2: Modelul de descompunere este unul aditiv
Yt = Tt +  t

 Definiție: Media mobilă se defineşte ca o combinaţie liniară de puteri


pozitive şi negative ale operatorului de întârziere L:
m2 m2

MM =  i
i
L cu 
i = − m1
i =1 LYt = Yt −1
i = − m1

 unde m1 , m2  N ,  m , ...,  m  R iar operatorul de întârziere L este definit prin:


1 2

 Definiție: O medie mobilă este centrată dacă m1=m2=m.


 Definiție: Media mobilă este simetrică dacă este centrată şi coeficientii
simetrici sunt egali:
 i =  −i , i = 1, ..., m
Mediile mobile
 Observații:
1. Metoda mediilor mobile, utilizată în acest context, are ca şi obiective:
 reducerea amplitudinii componentei aleatoare: f ( t )  0
 conservarea tendinţei T: f (Tt )  Tt
2. Se pune problema determinării adecvate a ordinului mediei mobile simetrice
2m+1 și a coeficienților  m , ... ,  0  R
 Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrată și simetrică
conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de
ordin p+1 a ecuaţiei caracteristice:
 −m +  −m+1 + ... +  m 2 m − m = 0

Proprietate: Dacă u =    și t constituie o secvenţa de variabile aleatoare


m
 t i t −i
i =− m
necorelate şi de aceeaşi varianţă 2 atunci noile variabile ut au proprietățile:
m
Eut = 0;  *2 = Var(u x ) =  2 
i =− m
i
2
Mediile aritmetice
Yt −m + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = ; t = m + 1, m + 2,..., T − m
2m + 1

 Observații:
 1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m

  =1
i =− m
i
1
 2. Raportul de reducere a varianței erorii este: 2m + 1

 3. Mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe


polinomiale de grad mai mare sau egal cu doi. Tendinţa seriei se
estimează prin seria mediilor mobile:
Tt  Yt
 4. Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria
de timp
Medii mobile centrate
 Mediile aritmetice necesită un număr impar de observaţii
p=2m+1, în calculul fiecărei medii. Dacă ordinul mediei mobile
MM(p)este un numar par p=2m atunci de regula se utilizează
mediile mobile centrate şi simetrice, definite astfel:

0,5Yt −m + Yt −m+1 + ... + Yt + ... + Yt +m−1 + 0,5Yt +m


Yt = t = m + 1, m + 2, .... T − m
2m
Estimarea componentei sezoniere
 Presupunem că seria cronologică prezintă tendinţă, sezonalitate şi o
componentă aleatoare.
 În general, este adecvat:
 un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ constantă
Y t = T t + St
 un model multiplicativ dacă amplitudinea creşte sau scade în timp.
Y t = T t * St
 Frecvent în practică este mai adecvat modelul multiplicativ
Aplicarea modelului aditiv
Aplicarea modelului multiplicativ
Perioada componentei sezoniere
 Perioada componentei sezoniere, notată cu p, reprezintă
numărul unităţilor de timp din cadrul unui ciclu sezonier.

Durata unui ciclu sezonier Date Perioada p


1 an trimestriale 4
lunare 12
o săptămână Zilnice 7
o zi din oră în oră 24
Eliminarea componentei sezoniere
utilizând mediile mobile
 Pentru desezonalizarea seriei se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere
 Astfel:
 Se elimină componenta sezonieră
 Se elimină componenta aleatoare
 Se conservă tendința
 Proprietăți:
 Mediile aritmetice de ordin p impar și mediile mobile centrate pentru p
par lasă nedeviată tendința, functia liniara
 Fiecărei valori observate Yt îi corespunde o valoare netezită Y t calculată
ca o medie aritmetică a valorilor adiacente
 Seria valorilor inițiale are mai puțin cu p-1 termeni, respectiv p termeni
decât seria inițială
Estimarea componentei sezoniere
 se realizează prin intermediul coeficienţilor sezonalităţii, modele de regresie multiplă
prin introducerea unor variabile alternative sau prin intermediul funcțiilor
trigonometrice.
 Notaţii:
 i indice pentru ciclu sezonier de la 1 la n;
 j indice pentru sezon de la 1 la p.

 Ipoteză:
 Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
 Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează rapoartele: S ij = Yij / Y ij
 Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij =  Sij ;
n − 1 i =1
j = 1, 2,..., p
p
 Se determină componenta sezonieră astfel incat
Gourieroux & Monfort, 1990
S
i =1
i =1
1 p  j = 1, 2,..., p
S = I /
j I
j  p i
 i =1 

 Valorile rezultate ( S1 , S 2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie


componenta sezonieră
2. Model aditiv
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează diferențele: S ij = Yij − Y ij
 Se determină coeficienții medii pentru fiecare sezon:
1 n −1
Cj =  S ij
n − 1 i =1
 Se determină componenta sezonieră
1 p 
S j = C j −   Ci 
 p i =1 
 Valorile rezultate se numesc coeficienți ai sezonalităţii şi constituie componenta
sezonieră
Exemplu:

Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74

Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:

90
80
70
60
50
40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06

Nr. Bilete (valori reale) Medii mobile

Evoluţia numărului de bilete vândute de agenţie în perioada 2004-2006


Exemplu:

Calculul mediilor mobile

Perioada Yij Y ij Abateri Serie t


Sij =Yij - Y ij desezonalizata
MM (corectata)
~
Yij = Yij − S j
I 2004 32 - - 48 1
II 2004 48 - - 52 2
III 2004 64 51,5 12,5 50 3
IV 2004 58 53 5 52 4
I 2005 40 54,75 -14,75 56 5
II 2005 52 57 -5 56 6
III 2005 74 58,5 15,5 60 7
IV 2005 66 60 6 60 8
I 2006 44 62 -18 60 9
II 2006 60 64 -4 64 10
III 2006 82 - - 68 11
IV 2006 74 - - 68 12
Exemplu:
Mediile mobile vor fi:
32 40
+ 48 + 64 + 58 +
MM 1 = 2 2 = 51,5 = Y 13 bilete
4
48 52
+ 64 + 58 + 40 +
MM 2 = 2 2 = 53 = Y 14 bilete
4

66 74
+ 44 + 60 + 82 +
MM 8 = 2 2 = 64 = Y 32 bilete
4

Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:

b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:

Trim. Yij- Y ij
Anii Suma
I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
 Determinarea trendului seriei desezonalizate:


 Yij = 46 + 1,8112  t unde t momentul de timp la care se realizează previziunea

 Previziunea seriei Yij:




Yˆij = Yij + S j
MODELAREA SERIILOR DE TIMP
UNIVARIATE
Noţiuni generale
 Box & Jenkins (1970) au propus o metodologie de previziune a unei
variabile, utilizând ca şi bază de date doar trecutul şi prezentul acesteia.
Aceste modele se bucură de o largă popularitate datorită:
 calităţii previziunilor generate;

 flexibilităţii modelelor;

 rigurozităţii privind fundamentarea matematică a modelului;

 este o metodă adecvată şi pentru previziunea unor variabile cu o evoluţie


neregulată.
Noţiuni generale
 Definiţie: Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia
aferentă momentului t și variabila aleatoare (Yt ), se definesc:

 media variabilei (Yt ): E (Yt ) =  t

 varianţa variabilei (Yt ) : Var (Yt ) =  t2 = E[(Yt −  t ) 2 ]

 covarianţa dintre două variabile (Yt ) şi ( Y s ), prin:

 ts = cov(Yt , Ys ) = E (Yt −  t )(Ys −  s )


Procese staţionare
 În termeni generali, o serie cronologică este considerată staţionară
dacă nu prezintă nici o modificare sistematică în medie (nu prezintă
tendinţă pe termen lung) şi nici o modificare sistematică în varianţă.

 Graficul unei serii staţionare prezintă fluctuaţii cu amplitudine relativ


constantă (varianţă constantă) în jurul unei medii constante, independente
de timp (staţionaritate în medie).
Procese staţionare
 Definiţie: Un proces stochastic este strict staţionar dacă funcţia
densitate de probabilitate a oricăror doi vectori (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑛 ) şi
(𝑌𝑠 , 𝑌𝑠+1 , … , 𝑌𝑠+𝑛 ) , cu n+1 elemente consecutive, este aceeaşi pentru orice

valori ale lui t şi s, indiferent de mărimea lui n.

 Altfel spus: un proces stochastic este strict staţionar dacă pentru


orice k, distribuţia lui (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑘 ) este aceeaşi pentru toţi t, deci este
invariantă în timp (comportamentul procesului nu se modifică în timp).

 Exemplu: Distribuţia lui (𝑌5 , 𝑌6 , … , 𝑌 10 ) este aceeaşi cu distribuţia lui


(𝑌110 , 𝑌111 , … , 𝑌115 )
Procese staţionare
 Observaţii:
 Distribuţia lui Yt este aceeaşi cu distribuţia lui Yt+k pentru orice întreg k 
 1. E(Yt)=E(Yt+k)
 2.Var(Yt)=Var(Yt+k)
 3.Variabilele (Yt) dintr-un proces staţionar sunt identic distribuite (nu
neapărat independente).

 Distribuţia lui (Yt, Ys) este aceeaşi cu distribuţia lui (Yt+k,Ys+k) pentru toate
decalajele (t-s) şi pentru orice întreg k 
 Cov (Yt, Ys) = Cov (Yt+k, Ys+k) =  (k) pentru orice s, t, k.

 Definiţie: Prin lag se înţelege decalajul (întârzierea) exprimată în unităţi de


timp, între modificarea variabilei cauză şi manifestarea efectului.
Procese staţionare

 Definiţie: Un proces stochastic este slab staţionar (staţionar de


ordinul 2, staţionar în covarianţă) dacă media şi dispersia sunt constante în
timp iar covarianţa sa între două perioade de timp depinde numai de
decalajul dintre cele două perioade şi nu de momentul de timp la care este
calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui
nivel mediu constant 

 E (Yt ) =  , t : media este constantă în timp (staţionalitate în medie)

 Var (Yt ) =  2 : varianţa este constantă în timp (staţionalitate în varianţă)

 cov (Yt , Ys ) =  k , t  s unde k=s-t: covarianţa dintre două variabile este funcţie
doar de lungimea intervalului de timp ce separă cele 2 variabile.
Procese staţionare
 Observaţii:
 1. Dacă seria de timp este normal distribuită, atunci staţionaritatea slabă
şi staţionaritatea strictă sunt echivalente.
 2. Seriile cronologice staţionare au proprietatea că media, varianţa şi
covarianţele (atunci când există), pot fi calculate pe baza unui eşantion.
 3. Staţionaritatea slabă implică faptul că reprezentarea grafică a datelor va
arăta că cele n valori fluctuează cu o variaţie constantă în jurul unui nivel
constant.
Procese nestaţionare
Procese nestaţionare - exemple
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var ( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k = 0
 funcţia de autocovarianţă este: k = 
0 , k  0
1, k = 0
 funcţia de autocorelaţie este: k = 
0 , k  0
 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp y t este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci y t , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică y t creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Serii de timp

Curs 1 – 2023
Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Serii de timp
 Planul cursului:
 1. Introducere in analiza seriilor de timp: Definirea unei serii de timp; Componentele unei serii de timp;
Descompunerea seriei de timp pe componente; Metode de netezire exponentiala
 2. Modele autoregressive liniare: Serii stationare, serii nestationare si neomogene; Tipuri de serii
nestationare; Operatorii de intarziere si avans; Caracteristicile unei serii de timp: functia de autocorelatie si
de autocorelatie partiala; Teste de nestaţionalitate; Definirea modelelor AR(p), MA(q), ARMA(p,q),
ARIMA(p,d,q); Metodologia Box Jenkins
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

3. Extinderi ale modelelor ARIMA : Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023


SARIMA; Modele ARCH, GARCH
 4. Modele multivariate stationare: Modele VAR; Cauzalitate Granger
 5. Modele multivariate nestationare: Cointegrare; Modele VECM; Teste de cointegrare

 Nota finală:
 60% nota de la examen
 30% prezentare proiect
 10% prezenţă şi activitate seminar

 Bibliografie:
 D. Lazar – Suport de curs: Analiza seriilor cronologice și previziune
 P.J. Brockwell, R.A. Davies. Introduction to Time Series and Forecasting, Second Ed., Springer, 2002.
 Damodar N. Gujarati, Dawn C. Porter. Basic Econometrics, Fifth Edition, McGraw-Hill, 2009.
 T.Andrei, R. Bourbonais – Econometrie, Partea a V-a, Ed. Economică, 2008
 E. Titan, S. Ghita, C. Boboc – Bazele Statisticii, Capitolul 6, Ed. Meteor Press
Baze de date pentru serii de timp
 Institutul Național de Statistică http://www.insse.ro/cms/ (TEMPO Online)
 Banca Națională a României http://www.bnr.ro/Home.aspx
 World Bank http://www.worldbank.org/
 Eurostat http://ec.europa.eu/eurostat
 The University of York, Department of Mathematics
https://www.york.ac.uk/depts/maths/data/ts/
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

 Softuri utile: Eviews, R, SAS


Serii de timp
 Presupunem ca suntem interesați de evoluția unui fenomen în
timp.
 Fenomenul poate fi:
 Produsul Intern Brut
 Inflația
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

 Șomajul
 Speranța de Viață
 Natalitatea
 Mortalitatea
 Numărul pasagerilor unei companii aeriene
 Cifra de afaceri a unei companii
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

ŶT +h
Y : 
Y Y
 1 2 ... Yt

(Yt ) tZ
... YT 

 1 2 ... t ... T 
Definirea unei serii de timp
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

date anuale
Exemplu:
Speranța de viață la naștere pentru populația României,

http://www.worldbank.org/
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Exemplu:
Rata de schimb GBP – EUR, date zilnice

http://www.xe.com/currencycharts/?from=GBP&to=EUR&view=1M
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro Exemplu:

România, date trimestriale


Numarul de pasageri din aeropurturile din
Tipuri de modele de previziune
 Modele univariate: pe baza evoluției înregistrată de variabilă în
trecut este previzionat prezentul ca o funcție de trecut
Yt = f (Yt −1 , Yt − 2 , , Yt − p ,  t )
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

 Modele multivariate: pe baza evoluției variabilei Y, precum și a


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

altor variabile X1, …, Xn ce explică comportamentul acesteia,


este previzionat prezentul variabilei Y.

Yt = f (X 1t ,..., X nt , Yt −1 , Yt − 2 , , Yt − p ,  t )
Erori de previziune
 Definiție: Pentru un moment t de timp fixat, eroarea de previziune este
diferenţa între valoarea observată şi cea previzionată Yˆt ambele aferente
momentului t:

et = Yt − Yˆt
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Indicatori sintetici ai erorilor de previziune:


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023


Fie Yˆ1 , Yˆ2 ,..., Yˆs previziunile corespunzătoare observaţiilor Y1 , Y2 ,..., Ys . Se definesc:

 1. Eroarea medie pătratică: MSE =


1 s

s h=1
(Yh − Yˆh )
2

1 s
 2. Eroarea medie absolută: MAE =  Yh − Yˆh
s h=1

ˆ
 3. Eroarea medie absolută exprimată procentual: 1 s Yh − Yh
MAPE = 
s h=1 Yh
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Yt = f (Tt , Ct , S t ,  t )
Componentele unei serii cronologice
1. Tendința unei serii cronologice (T)
 redă evoluţia fenomenului pe termen lung, având alura unor funcţii neperiodice, lent variabile în timp.
 este componenta principală a seriei de timp care rezultă din efectul pe termen lung al factorilor socio-
economici și politici
 poate arăta creșterea sau declinul unei serii de timp pe o perioadă lungă de timp.
 forma tendinței poate fi liniară sau neliniară
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
2. Componenta ciclică C
 este observabilă analizând evoluţia fenomenului pe termen lung, şi se manifestă sub
forma unor oscilaţii cu perioadă şi amplitudine ce variază de regulă în timp, un ciclu
acoperind câţiva ani de zile
 aceste oscilații sunt asociate cu ciclurile de afaceri bine cunoscute
 durata ciclului depinde de tipul de afacere sau industrie analizată (de la cinci la
doisprezece ani sau mai mult)
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

https://www.slideshare.net/henrjt/the-business-
cycle-299518
3. Componenta sezonieră S
 se evidenţiază sub forma unor cicluri de durată mai mică sau egală cu un an, şi apare
în principal datorită ritmului impus de schimbarea anotimpurilor dar şi de activităţi
economice respectiv sociale.
 Se notează și se înregistrează prin modificări restrânse în sus și în jos în jurul
componentei de tendință sau a componentei ciclice, cu modificări care se repetă în
mod previzibil pe perioade de sub un an
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

Source Box, G. E. P., Jenkins, G. M. and Reinsel, G. C. (1976) Time Series Analysis, Forecasting and
Control. Third Edition. Holden-Day. Series G.
4. Componenta reziduu sau eroare t
 se manifestă prin fluctuaţii aparent aleatoare în jurul componentelor deterministe, fiind
efectul acţiunii unor factori cu acţiune punctuală în timp
 această componentă este imprevizibilă
 schimbări bruște care apar într-o serie de timp care este puțin probabil să se repete;
astfel de mișcări sunt privite ca evenimente întâmplătoare complet imprevizibile și
probabil nerecuperabile, cum ar fi greve, incendii, inundații, dezastre naturale,
războaie etc.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

 este o componentă a unei serii de timp care nu poate fi explicată prin componente de
tendință, ciclice sau sezoniere
Modele de descompunere a seriilor de timp

 Modelul aditiv Yt = Tt + Ct + S t +  t

 Modelul multiplicativ Yt = Tt  Ct  S t   t
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

 Combinație mixtă a componentelor seriei


Estimarea tendinței prin funcții
elementare
 Yt = Tt +  t sau Yt = Tt   t

Funcţii elementare utilizate în modelarea tendinţei


Tendinţă Forma liniarizată
liniară : Tt = a + bt
Parabolă: Tt = a + bt + ct 2 T = a + bt + cX
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

unde X = t ²
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023

1 T = a + bX
Hiperbolă: Tt = a + b
t 1
Unde X =
t
Exponenţială: Tt = a  b t Z = A + Bt unde Z t = ln Tt ; A = ln a; B = ln b
Putere: Tt = a  t b Z = A + bX
Unde Z t = ln Tt ; A = ln a; X = ln t
Logaritmică: Tt = a + b ln t T = a + bX
unde X = ln t
a
Curba logistică : Tt = , a, c  0
1 + e b −ct
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Parabola
Funcții elementare

Hiperbola
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Exponentială
Funcții elementare
Funcția putere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2023
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Functia logaritmică
Funcții elementare

Curba logistică

S-ar putea să vă placă și