Documente Academic
Documente Profesional
Documente Cultură
Proiectul 5
- Prognoza seriilor de timp
Rajendra M Bhat
Pentru această sarcină specială, trebuie analizate datele diferitelor tipuri de vânzări de vin în
secolul 20. Ambele date provin de la aceeași companie, dar de vinuri diferite. În calitate de
analist în ABC Estate Wines, aveți sarcina de a analiza și prognoza vânzările de vin în secolul
20.
Vă rugăm să încercați să construiți cât mai multe modele posibil și cât mai multe iterații de modele cu parametri
diferiți.
Testa RMSE
RegressionOnTime 15.280000
SimpleAverageModel 53.483727
2pointTrailingMovingAverage 11.529811
4pointTrailingMovingAverage 14.457115
6pointTrailingMovingAverage 14.571789
9pointTrailingMovingAverage 14.731914
Alfa = 0.995, SimpleExponențialNetezire 36.819844
Testarea
RMSE
RegressionOnTime 1389.140000
SimpleAverageModel 1275.081804
2pointTrailingMovingAverage 813.400684
4pointTrailingMovingAverage 1156.589694
6pointTrailingMovingAverage 1283.927428
Testarea
RMSE
9pointTrailingMovingAverage 1346.278315
5. Verificați staționaritatea datelor pe care se bazează modelul utilizând teste statistice adecvate și
menționați, de asemenea, ipoteza testului statistic. Dacă se constată că datele nu sunt staționare, luați
măsurile corespunzătoare pentru a le face staționare. Verificați noile date pentru staționaritate și
comentați. Notă: Staționaritatea trebuie verificată la alfa = 0,05.
Pentru a verifica dacă seria este staționară, folosim testul Augmented Dickey Fuller (ADF) a cărui ipoteză nulă și
alternativă poate fi simplificată la
•Ipoteza nulă H0: Seria de timp nu este staționară
•Ipoteza alternativă Ha: Seriile de timp sunt staționare
Vânzări de vin
roze
Modelul ARIMA
Valorile AIC în ordine descrescătoare
Param AIC
17 (3, 1, 3) 1273.194108
4 (1, 1, 2) 1277.359223
3 (1, 1, 1) 1277.775747
Param AIC
9 (2, 1, 1) 1279.045689
10 (2, 1, 2) 1279.298694
5 (1, 1, 3) 1279.312635
15 (3, 1, 1) 1279.605966
16 (3, 1, 2) 1280.969245
11 (2, 1, 3) 1281.196226
1 (1, 0, 2) 1292.053210
7 (2, 0, 2) 1292.248055
2 (1, 0, 3) 1292.929011
6 (2, 0, 1) 1292.937195
14 (3, 0, 3) 1293.042709
8 (2, 0, 3) 1294.247938
0 (1, 0, 1) 1294.510585
12 (3, 0, 1) 1333.933193
13 (3, 0, 2) 1355.403813
Rezultatele
modelului ARIMA
Dep. Variabil: D.Trandafir Nu. Observaţii: 131 -
Model: ARIMA(3, 1, 3) Probabilitatea 628.597
Metodă: CSS-MLE jurnalului 28.355
Dată: Sâmbătă, 06 Mar S.D. de inovații 1273.194
2021 AIC
Oră: 14:46: 16 BIC 1296.196
Mostră: 02-01-19 80 HQIC 1282.541
- 12-01-19 90
============== ============
Coef STD Err z P>|z| [0.025
0.975]
--------------
-0.4906 0.088 -5.548 0.000 -0.664 -0.317
Const
ar. L1. -0.7244 0.086 -8.417 0.000 -0.893 -0.556
D.Trandafir
ar. L2. -0.7218 0.086 -8.349 0.000 -0.891 -0.552
D.Trandafir
ar. L3. 0.2763 0.085 3.236 0.001 0.109 0.444
D.Trandafir
Marian. L1. -0.0150 0.044 -0.338 0.735 -0.102 0.072
D.Trandafir
Marian. L2. 0.0150 0.044 0.339 0.734 -0.072 0.102
D.Trandafir
Marian. L3. -1.0000 0.046 -21.918 0.000 -1.089 -0.911
D.Trandafir Rădăcini
============== =========
Real Imaginar Modul
Frecvență
--------------
-0.5011 -0 .8661j 1.0006 -0.3335
AR.1
AR.2 -0.5011 +0 .8661j 1.0006 0.3335
AR.3 3.6147 -0 .0000j 3.6147 -0.0000
MA.1 1.0000 -0 .0000j 1.0000 -0.0000
MA.2 -0.4925 -0 .8703j 1.0000 -0.3320
MA.3 -0.4925 +0 .8703j 1.0000 0.3320
Modelul SARIMA
Valorile AIC în ordine descrescătoare (cele mai mici înregistrări AIC 10)
Cel mai mic AIC este : 774.969 cu param (0,1,2) și sezonier (2,1,2,12)
Rezultate SARIMAX
======================== ==============
y Nu. Observaţii:
Dep.
Model:Variabil:
ARIMAX(0, 1, 2)x(2, 1 , 2, 12) Probabilitatea 132
-380.485
Dată: Sâmbătă, martie jurnalului
AIC 774.969
Oră: 06 2021
13:41:44 BIC 792.622
Mostră: 0 HQIC 782.094
- 132
Covarianţă Tip: OPG
========== =========
Coef STD Err z P>|z| [0.025
0.975]
----------
-0.9524 0.184 -5.166 0.000 -1.314 -0.591
Marian. L2
Marian. L1 -0.0764 0.126 -0.605 0.545 -0.324 0.171
ar. S.L12 0.0480 0.177 0.271 0.786 -0.299 0.395
ar. S.L24 -0.0419 0.028 -1.513 0.130 -0.096 0.012
Marian. -0.7526 0.301 -2.503 0.012 -1.342 -0.163
S.L12
Marian. -0.0721 0.204 -0.354 0.723 -0.471 0.327
S.L24
sigma2 187.8679 45.274 4.150 0.000 99.132 276.604
========== ==============
(L1) (Q): 0.06 Jarque-Bera (JB ):
Ljung-Box
Prob(Q): 0.81 Prob (JB): 4.86
0.09
Heteroskedasticitate (H): 0.91 Oblic: 0.41
Prob(H) (față-verso): 0.79 Kurtoză: 3.77
Modelul ARIMA
Valorile AIC în ordine descrescătoare
Param AIC
8 (2, 1, 2) 2210.616954
7 (2, 1, 1) 2232.360490
Param AIC
2 (0, 1, 2) 2232.783098
5 (1, 1, 2) 2233.597647
4 (1, 1, 1) 2235.013945
6 (2, 1, 0) 2262.035601
1 (0, 1, 1) 2264.906439
3 (1, 1, 0) 2268.528061
0 (0, 1, 0) 2269.582796
Cel mai mic AIC este : 1382.347780 cu param (1,1,2) și sezonier 0,1,2,12)
Rezultate SARIMAX
======================================== ==============
y Nu. Observații:
Dep. Variabil: 132
Model: SARIMAX(0, 1, 2)x(0, 1, 2, 12) Log Probabilitate
Duminic Febr 2 021: -686.242
Dată: AIC
ă, 28 uari 38 1382.484
Oră: 0 BIC
e 1395.093
Mostră: 6 0 HQIC
18: 1387.573
132
Covarianţă Tip: - OPG
==========
Coef STD Err z P>|z| [0.025 0. 975]
---------- -
-0.7223 0.107 .752 0.000 -0.932 -0 .513
Marian. 6
Marian. L1
L2 -0.2292 0.137 - .671 0.095 -0.498 0.040
Marian. -0.4113 0.087 1
- .743 0.000 -0.581 -0 .241
S.L12
Marian. -0.0419 0.138 4
- .304 0.761 -0.312 0.228
S.L24
sigma2 1.736E+05 2.06E+04 0
8 .425 0.000 1. 33E+05 2.14E+05
Ljung-Box (L1) (Q): 0.02 Jarque-Bera (JB): 27.42
Prob(Q): 0.88 Prob (JB): 0.00
Heteroskedasticitate (H): 0.84 Oblic: 0.80
Prob(H) (față-verso): 0.62 Kurtoză: 5.15
7. Construiți modele ARIMA / SARIMA pe baza punctelor limită ale ACF și PACF pe datele de
antrenament și evaluați acest model pe datele de testare utilizând RMSE.
Prin luarea acestor parametri (4,1,2) rezultatele ARIMA sunt cele de mai jos
==============
Coef STD Err z P>|z| [0.025 0.975]
--------------
-0.1905 0.576 -0.331 0.741 -1.319 0.938
Const
ar. L1. 1.1685 0.087 13.391 0.000 0.997 1.340
D.Trandafir
ar. L2. -0.3562 0.132 -2.693 0.007 -0.616 -0.097
D.Trandafir
ar. L3. 0.1855 0.132 1.402 0.161 -0.074 0.445
D.Trandafir
ar. L4. -0.2227 0.091 -2.443 0.015 -0.401 -0.044
D.Trandafir
Marian. L1. -1.9506 Nan Nan Nan Nan Nan
D.Trandafir
Marian. L2. 1.0000 Nan Nan Nan Nan Nan
D.Trandafir Rădăcini
============== =========
Real Imaginar Modul
Frecvență
--------------
1.1027 -0.4116j 1.1770 -0.0569
AR.1
AR.2 1.1027 +0.4116j 1.1770 0.0569
AR.3 -0.6863 -1.6643J 1.8003 -0.3122
AR.4 -0.6863 +1.6643J 1.8003 0.3122
MA.1 0.9753 -0.2209j 1.0000 -0.0355
MA.2 0.9753 +0.2209j 1.0000 0.0355
Prin luarea acestor parametri (4,1,2) și (4,1,2,12), rezultatele SARIMA sunt cele de mai jos.
Rezultate SARIMAX
Dep. Variabil: y Nu. Observaţii: 132
Model: SARIMAX(4, 1, 2)x(4, 1, 2, 12) Probabilitatea jurnalului -277.661
Dată: Duminică, 07 martie 2021 AIC
Oră: 581.322
Mostră: 14:22:21 BIC 609.983
0 HQIC 592.663
Tip covarianță: - 132
OPG
======================= =======================================================
Coef STD Err z P>|z| [0.025 0.975]
----------------------- ---------------------------------------------------------
ar. L1 -0.9742 0.199 -4.899 0.000 -1.364 -0.584
ar. L2 -0.1122 0.285 -0.394 0.694 -0.670 0.446
ar. L3 -0.1044 0.277 -0.377 0.706 -0.647 0.438
ar. L4 -0.1285 0.162 -0.794 0.427 -0.446 0.189
Marian. 0.1605 328.137 0.000 1.000 -642.976 643.297
L1
Marian. -0.8395 275.462 -0.003 0.998 -540.734 539.055
L2
ar. S.L12 -0.1441 0.364 -0.396 0.692 -0.858 0.569
ar. S.L24 -0.3597 0.227 -1.587 0.113 -0.804 0.085
ar. S.L36 -0.2153 0.106 -2.039 0.041 -0.422 -0.008
ar. S.L48 -0.1195 0.093 -1.281 0.200 -0.302 0.063
Marian. -0.5159 0.343 -1.503 0.133 -1.189 0.157
S.L12
Marian. 0.2086 0.373 0.559 0.576 -0.523 0.940
S.L24
sigma2 215.3512 7.07E+04 0.003 0.998 -1.38E+05 1.39E+05
======================= ===============
0.03 Jarque-Bera (JB):
Ljung-Box (L1) (Q): 0.86 Prob (JB): 2.41
Prob(Q): 0.49 Înclinare: 0.30
Heteroskedasticitate 0.10 Kurtosis: 0.32
(H): 3.68
Luând în considerare acești parametri (3,1,2) și (3,1,2,12), rezultatele SARIMA sunt cele de mai jos.
Rezultate SARIMAX
8. Construiți un tabel (creați un cadru de date) cu toate modelele construite împreună cu parametrii
corespunzători și valorile RMSE respective pe datele de testare.
SimpleAverageModel 53.483727
2pointTrailingMovingAverage 11.529811
4pointTrailingMovingAverage 14.457115
6pointTrailingMovingAverage 14.571789
9pointTrailingMovingAverage 14.731914
SimpleAverageModel 1275.081804
Testarea
RMSE
2pointTrailingMovingAverage 813.400684
4pointTrailingMovingAverage 1156.589694
6pointTrailingMovingAverage 1283.927428
9pointTrailingMovingAverage 1346.278315
9. Pe baza exercițiului de construire a modelului, construiți modelul (modelele) cel mai optim (cele mai
optime) pe baza datelor complete și preziceți 12 luni în viitor, cu intervale/benzi de încredere adecvate.
Deoarece setul de date Rose are o componentă clară de sezonalitate SARIM. Prin urmare, modelul SARIMA cu parametrii
(0,1,2)x(2,1,2,12) este selectat pentru prognozarea seriei liniei de timp, iar detaliile modelului sunt cele de mai jos.
Rezultate SARIMAX
====================== ==============
Trandafir Nu. Observaţii:
Dep. Variabil:
Model: SARIMAX(0, 1, 2)x(2, 1, 2, 12) Probabilitatea jurnalului 187
-588.604
Dată: Sâmbătă, 06 Mar AIC 1191.208
Oră: 2021 13:41:48 BIC 1212.142
Mostră: 01-01-1980 HQIC 1199.714
- 07-01-1995
Covarianţă Tip: OPG
========== =========
Coef STD Err z P>|z| [0.025
0.975]
---------- ---------
-0.8254 0.080 -10.334 0.000 -0.982
Marian.
Marian. L1
L2 -0.0807 0.086 -0.934 0.350 -0.250 -0.669
0.089
ar. S.L12 0.0635 0.160 0.398 0.691 -0.249 0.376
ar. S.L24 -0.0340 0.019 -1.790 0.074 -0.071 0.003
Marian. -0.6953 0.207 -3.360 0.001 -1.101 -0.290
S.L12
Marian. -0.0547 0.150 -0.365 0.715 -0.348 0.239
S.L24
sigma2 166.0900 17.899 9.279 0.000 131.008 201.172
========== ==============
(L1) (Q): 0.07 Jarque-Bera (JB):
Ljung-Box 8.28
Prob(Q): 0.79 Prob 0.02
Heteroskedasticitate 0.51 (JB): 0.33
(H): 0.02 Oblic: 3.95
Prob(H) (față-verso): Kurtoză:
Deoarece datele de vânzări spumante au componentă de sezonalitate. Prin urmare, modelul SARIMA cu parametri
(0,1,2) (0, 1, 2, 12) este propus pentru a fi utilizat pentru prognoza pentru următoarele 12 luni folosind date complete.
Detaliile modelului sunt cele de mai jos.
SARIMAXRezultatele
====================== ===============
Spumante Nu. Observaţii:
Dep. Variabil:
Model: SARIMAX(0, 1, 2)x(0, 1, 2, 12) Butu Probabilitate 187
-1087.003
Dată: Duminică, 28 Feb 2021 c AIC 2184.006
Oră: 18:26:36 BIC 2198.958
Mostră: 01-01-1980 HQIC 2190.081
- 07-01-1995
Covarianţă Tip: OPG
========== ==========
Coef STD Err z P>|z| [0.025
0.975]
----------
-0.9094 0.104 -8.713 0.000 -1.114 -0.705
Marian.
Marian. L1
L2 -0.1316 0.087 -1.507 0.132 -0.303 0.040
Marian. -0.5456 0.065 -8.393 0.000 -0.673 -0.418
S.L12
Marian. -0.0202 0.084 -0.241 0.810 -0.185 0.145
S.L24
sigma2 1.419E+05 1.32E+04 10.755 0.000 1.16E+05 1.68E+05
========== ===============
(L1) (Q): 0.01 Jarque-Bera (JB):
Ljung-Box
Prob(Q): 0.91 Prob(JB): 49.28
0.00
Heteroskedasticitate : 0.79 Oblic: 0.74
(H)
Prob(H) (față-verso): 0.42 Kurtoză: 5.41
Vânzările estimate ale Sparkling pentru următoarele 12 luni sunt după cum urmează:
însem
Spumante mean_se mean_ci_lower mean_ci_upper
na
1995-08-01 1874.535574 390.423218 1109.320128 2639.751020
10. Comentați modelul astfel construit și raportați-vă constatările și sugerați măsurile pe care
compania ar trebui să le ia pentru vânzările viitoare.
Descompunerea tendinței seriilor de timp ale vinului roze este după cum urmează:
Tendința vânzărilor de Rose este în continuă scădere în această perioadă. Poate fi necesar un studiu detaliat pentru a
vedea dacă tendința descrescătoare se datorează modificării preferințelor clienților sau înlocuirii. Se observă
sezonalitatea vânzărilor, iar vânzările mai mari se mențin la sfârșitul anului. Unele scheme de promovare și
îmbunătățire / îmbunătățire a calității produsului pot fi examinate astfel încât să atragă noi clienți din generația tânără.