Sunteți pe pagina 1din 12

5 Aplicație Rata-Șomajului Metodologia Box−Jenkins

Analiza staţionarităţii. Staţionarizarea seriei. Identificarea unor modele ARMA, estimarea


parametrilor, teste de validitate, alegerea celui mai performant model, efectuarea previziunilor.

Aplicaţie Să se modeleze seria Rata-Șomajului utilizând Metodologia Box Jenkins


Seria considerată este Rata-Somajului (RS) pentru perioada 2000:Q1-2020:Q1. (81 obs).
Rata şomajului este exprimată procentual(%).
Cerinţe:
a) Să se analizeze caracteristicile seriei folosind reprezentări grafice şi indicatori descriptivi adecvaţi.
b) Să se estimeze, folosind abordarea Box-Jenkins, parametrii unor modele autoregresive adecvate.
c) Se se efectueze previziuni pe baza modelului.

a) Se analizează caracteristicile seriei folosind grafice şi indicatori descriptivi.

Graficul indică o serie nestaționară. Graficul indică o serie fără sezonalitate.

RS→View→Descriptive Statistics & Tests→Histogram and Stats

b) Etapa1. Verificarea staţionarităţii seriei şi staţionarizare.


Analiza stationarităţii seriei de date se realizează în Eviews prin:
·− analiza corelogramei seriei de date (Fig.1)
·− teste pentru depistarea prezenţei rădăcinii unitate – Augmented Dickey Fuller (Fig.2, 3 și 4).

1
Fig1. Corelograma seriei RS Fig.2 Testul ADF – Exogenous:None
Ne uităm la coloanele AC, PAC, Q-stat şi Prob. Din analiza corelogramei deducem că seria RS este
nestationară, deoarece funcţia de autocorelaţie descreşte foarte lent. Limitele din grafic aproximează două
abateri standard. Valoarea la lag-ul 5 este foarte mare (0,544).

Testul ADF (Augmented Dickey-Fuller Unit Root Test)


𝑯𝟎 : seria RS are rădăcină unitară şi este nestaţionară
𝑯𝟏 : seria RS este staţionară

Fig.3 Testul ADF – Exogenous:Constant Fig.4 ADF – Exogenous:Constant, Linear Trend

2
Analizăm varianta Exogenous: Constant
Valoarea calculată pentru t-Statistic este −0,013550. Aceasta este mai mare decât valorile critice
(−2,900137 pentru 5% ). Prob=0,9539  0,05.
Rezultă 𝑡𝑐𝑎𝑙𝑐 𝑅𝐶 . Acceptăm H0  există o rădăcină unitară  seria RS este nestaţionară.

Diferenţiem seria iniţială RS. Seria diferenţelor de ordinul 1 este:


𝐷(𝑹𝑺) = ∆𝑹𝑺𝒕 = 𝑹𝑺𝒕 − 𝑹𝑺𝒕−𝟏
Comanda în Eviews: SERIES DRS=RS – RS(-1)
Pentru acestă serie construim graficul, corelograma şi aplicăm Testul ADF.

Graficul seriei D(RS) Graficul seriei DRS

Corelograma seriei D(RS) Testul ADF – Exogenous: Constant

Din corelograma seriei D(RS) deducem că seria D(RS) este stationară, deoarece funcţia de autocorelaţie
descreşte rapid spre zero.

3
Ipotezele testului ADF (Augmented Dickey-Fuller Unit Root Test):
𝑯𝟎 : seria D(RS) are rădăcină unitară şi este nestaţionară
𝑯𝟏 : seria D(RS) este staţionară

Analizăm varianta Exogenous: Constant


Valoarea calculată pentru t-Statistic este −6,360796. Aceasta este mai mică decât valorile critice.
(−2,900137 pentru 5% ). Prob=0,0000  0,05.
Rezultă 𝑡𝑐𝑎𝑙𝑐 ∈ 𝑅𝐶 . Resping H0. Accept H1, deci seria diferenţiată, D(RS), este serie staţionară.

Deoarece seria nestaţionară RS a devenit staţionară după diferenţierea de ordin 1, putem concluziona că
este integrată de ordin d=1. Simbolizăm acest lucru scriind 𝑹𝑺~𝑰(𝟏).
Drept urmare, vom aplica procedura Box-Jenkins asupra seriei de date staţionarizată prin diferenţele de
ordin1 (seria fiind integrată de ordin 1) şi vom determina procesul ARMA(p,q) corespunzător.

Observatie: Se pot aplica si alte teste pentru analiza staționarității seriei


• Testul PP (Phillip-Perron)
𝑯𝟎 : seria RS este nestaţionară
𝑯𝟏 : seria RS este staţionară

4
• Testul KPSS (Kwiatkowski-Phillip-Schmidt-Shin)
𝑯𝟎 : seria RS este staţionară
𝑯𝟏 : seria RS este nestaţionară

Etapa2. Identificarea.
Corelograma seriei diferenţiate ne va permite să alegem valorile p şi q potrivite pentru seria de date.
Ordinul p al părţii AR este dat de coeficienţii de autocorelaţie parţială semnificativi statistic. Ordinul q
al părţii MA este dat de coeficienţii de autocorelaţie semnificativi statistic (coeficienţii semnificativi se
află în afara intervalului (1,96/ √𝑇 ).
Care este modelul optim? Ar putea fi AR(4)? MA(4)? sau ARMA(4,4)?
Daca seria stationară D(RS) urmeaza un astfel de proces, ce proces urmează seria originală RS?

Etapa3. Estimarea parametrilor modelelelor AR, MA, ARMA identificate pe baza ACF/PACF.
Vom estima mai multe modele de tip ARMA(p,q) pentru seria diferenţiată D(RS), care este staţionară.
Vom estima modelele AR(4), MA(4), ARMA(4,4). La fiecare model estimat notăm dacă parametrii sunt
semnificativ diferiţi de zero, notăm valorile pentru criteriile informationale Akaike si Schwarz și valorile
pentru R-squared şi Adjusted R-squared.
Avem:
• date trimestriale: 2000Q1-2020Q1
• Perioada de estimare: 2000Q1-2019Q1
• Prognoza ex-post: 2019Q2-2020Q1
• Prognoza ex-ante: 2020Q2-2021Q1
În Eviews am specificat ecuaţia de estimat: D(RS) C AR(4)
Am estimat astfel modelul AR(4) sau ARMA(4,0).

5
Mai întâi verificăm dacă toți coeficienții de interes sunt semnificativi statistic!
D(RS) C MA(4) D(RS) C AR(4) MA(4)

D(RS) C AR(4) MA(4) MA(8)

ARIMA ARMA ptr Toți Coef. AIC SIC R-squared Adjusted


pentru RS D(RS) semnificativi? Akaike Schwarz R-squared
ARIMA(4,1,0) ARMA(4,0) Da 1,065203 1,157205 0,167319 0,144505
ARIMA(0,1,4) ARMA(0,4) Da 1,112561 1,204563 0,124190 0,100196
ARIMA(4,1,4) ARMA(4,4) Da 1,038620 1,161291 0,216077 0,183414
ARIMA(8,1,4) ARMA(8,4) Nu

Cel mai bun model pentru seria RS este un model ARIMA(4,1,4).


Ecuația celui mai bun model este ar4ma4. Trebuie să aplicăm și alte teste asupra modelului.

6
Etapa4. Diagnosticarea modelelor şi alegerea celui mai bun model.
4.1. Testarea modelelor
a)− Parametrii modelului sunt statistic semnificativi ?
(constanta nu este semnificativă deoarece Prob=0,41500,05; ceilalţi coeficienţi sunt semnificativ diferiţi
de zero deoarece toate celelalte Prob0,05).
Criteriul Akaike= 1,03862, Criteriul Schwarz= 1,161291, R-squared=0,216077…

b)− Reziduurile obţinute sunt zgomot alb?

Corelograma reziduurilor din ec: ar4ma4


Dacă seria reziduurilor reprezintă zgomot alb, deducem că modelul aproximează bine datele observate.
Din corelograma reziduurilor: Probabilităţile asociate coeficienţilor Ljung-Box (coloana Q-Stat) sunt
0,05 şi indică independenţa erorilor.

Testăm Non-Autocorelarea erorilor aleatoare. Vom aplica testul Breusch-Godfrey. Acest test nu
poate fi aplicat pe un model estimat prin “ARMA Maximum Likelihood”. De aceea am mai estimat
modelul prin metoda “ARMA-GLS (Generalized Least Squares)”.

7
Am aplicat Testul Multiplicatorului lui Lagrange (Breuch-Godfrey Serial Correlation LM Test) pe
ecuatia AR4MA4_GLS, estimată prin metoda ARMA-GLS (generalized least square). Lags to include:1.
𝑯𝟎 : Nu există Autocorelarea erorilor aleatoare de ordin 1
𝑯𝟏 : Există Autocorelarea erorilor aleatoare de ordin 1
Prob 0,05  Acceptăm 𝑯𝟎  Nu există Autocorelarea erorilor aleatoare de ordin 1.

Testul ARCH de heteroskedasticity; Din Heteroskedasticity Tests selectăm ARCH


𝑯𝟎 : erorile sunt homoscedastice
𝑯𝟏 : erorile sunt heteroscedastice
Acceptăm H0  Erorile sunt homoscedastice.

8
Testul Jarque-Bera
𝑯𝟎 : erorile au distribuție normală
𝑯𝟏 : erorile nu au distribuție normală
Reziduurile nu sunt normal distribuite, deoarece valoarea testului JB este mult mai mare decât valoarea
tabelată (5,99) şi în plus Prob tinde către zero.

 Media erorilor este zero.

Modelul este staționar și inversabil?

4.2. Alegerea celui mai bun model


Valorile Criteriilor informaționale Akaike şi Schwartz să fie cât mai mici.
Valorile coeficienților R-squared și Adjusted R-squared să fie cât mai mari.
Cel mai bun model pentru seria D(RS) este ARMA(4,4)., iar pentru seria RS este ARIMA(4,1,4).

Etapa5. Efectuarea de prognoze


Dynamic forecast. Valorile variabilei sunt calculate dynamic, începând de la prima perioadă din
eșantionul de prognoză. Valorile prognozate anterior sunt folosite pentru prognoza valorii curente.
Previziunea dinamică utilizează în formulele de recurenţă valorile previzionate anterior.
Se prognozează valoarea pentru perioada t+1 pe baza datelor cunoscute la momentul t. Pentru toate
perioadele următoare se folosesc datele deja prognozate începând din momentul t+1.
Static forecast. Este prognozată o valoare pentru o perioadă înainte numai pe baza datelor efective.
Previziunea statică-utilizează în formulele de recurenţă valorile observate pe perioada de previziune.
Forecast sample: Se va specifica intervalul de timp pentru care se dorește realizarea de prognoze. Dacă
se specifică perioade de timp pentru care nu sunt date observate, se va obține o prognoză out-of-sample.

9
Evaluarea prognozei apare numai dacă eșantionul de prognoză (forecast sample) include perioade de timp
pentru care variabila dependentă este observată.
Prognoza ex-post este pentru perioadele în care se cunosc realizările seriei. Se folosește pentru a verifica
validitatea modelului.
Prognoza ex-ante este pentru perioadele în care nu se cunosc realizările seriei. Termenul ex-ante arată că
valorile variabilei sunt prognozate în avans
Acuratețea previziunilor
Testele de precizie a prognozei se bazează pe diferența dintre valoarea reală la momentul t și valoarea
prognozată la momentul t. Cu cât cele două valori sunt mai apropiate și cu cât este mai mică eroarea de
prognoză, cu atât este mai bună prognoza.
MSE (Mean Squared Error) - valoare cât mai mică
MAE (Mean Absolute Error) - valoare cât mai mică
MAPE (Mean Absolute Percentage Error)
Coeficientul U1 Theil are valori între 0 și 1. Cu cât valoarea este mai aproape de 0, cu atât acuratețea
prognozei este mai bună.
Bias Proportion: măsoară cât de departe este media valorilor prognozate față de media seriei reale.
Variance Proportion: arată cât de deaprte este dispersia previziunilor față de dispersia valorilor reale.
Pentru ca prognoza să fie considerată bună, Bias și Variance Proportion trebuie să fie cât mai mici.
Dacă U2=1 nu există diferență între prognoza naivă și tehnica folosită.
Dacă U21 tehnica folosită este mai bună decât prognoza naivă.

Prognoză ex-post dinamică și statică. Forecast sample: 2019Q2 2020Q1

10
11
Modelul ce poate fi utilizat pentru prognoze este:

Se poate nota variabila D(RS) cu Z. Notația: 𝑧𝑡 = seria staționară de medie zero 𝑧𝑡 = 𝑥𝑡 − 𝜇


Modelul de estimat este: 𝑧𝑡 = 𝜑0 + 𝜑4 ∙ 𝑧𝑡−4 + 𝜃4 ∙ 𝑡−4 + 𝑡
Modelul estimat este:
𝑧̂𝑡 = −0,039526 − 0,795349 ∙ 𝑧𝑡−4 + 0,472280 ∙ ̂𝑡−4

Originea prognozei este n=81. Prognoza pentru perioada următoare este:


𝑧̂𝑛 = −0,039526 − 0,795349 ∙ 𝑧𝑛−4 + 0,472280 ∙ ̂𝑛−4

𝑧̂𝑛+1 = −0,039526 − 0,795349 ∙ 𝑧𝑛−3 + 0,472280 ∙ ̂𝑛−3

Dar 𝑧𝑛 (1) = 𝑧̂𝑛+1 = 𝐷(𝑅𝑆) = 𝑅𝑆𝑛+1 − 𝑅𝑆𝑛 iar 𝑧𝑛−3 = 𝑅𝑆𝑛−3 − 𝑅𝑆𝑛−4. Rezultă:

𝑅𝑆𝑛+1 = 𝑅𝑆𝑛 − 0,039526 − 0,795349 ∙ (𝑅𝑆𝑛−3 − 𝑅𝑆𝑛−4 ) + 0,472280 ∙ ̂𝑛−3


̂ 82 = 𝑅𝑆81 − 0,039526 − 0,795349 ∙ (𝑅𝑆81−3 − 𝑅𝑆81−4 ) + 0,472280 ∙ ̂81−3
𝑅𝑆81 (1) = 𝑅𝑆

12

S-ar putea să vă placă și