Documente Academic
Documente Profesional
Documente Cultură
TIMP
Curs Statistica și Previziune Economică anul III
Curs 05
2021-2022
C03-C06: Modelarea, ajustarea și prognoza seriilor de timp
2
formate din trend determinist și componentă aleatoare
Modelarea trendului determinist (TD) (C03)
Estimarea si testarea parametrilor trendului determinist
Indicatori ai acuratetii unui model
Ruptura de trend (C04)
Teste specifice indetificarii rupturilor de trend
Modelarea trendului determinist cu ruptura de trend: modelarea individuala, modelarea agregata cu variabile
dummy
Valori atipice pentru serii de timp (C05)
Identificarea valorilor atipice intr-o serie de timp
Modelarea seriilor cu valori atipice: inlaturarea/inlocuirea valorilor atipice intr-o serie de timp,
modelarea seriei cu valori atipice cu ajutorul variabilelor dummy
Ajustarea exponentiala unei serii de timp cu trend determinist: ajustarea exponentiala simpla, ajustarea
exponentiala dubla, ajustarea exponentiala Holt (C06)
3 Identificarea valorilor atipice intr-o serie de timp
Existenta valorilor atipice intr-o serie de timp poate avea cauze multiple care de cele mai
multe ori tin de conjunctura.
Valorile atipice intr-o serie de timp pot afecta calitatea procesului de modelare.
Problema valorilor atipice intr-o serie de timp accepta diverse abordari.
Indiferent de autori demersul pe care trebuie sa-l facem cu privire la valorile atipice/
outlieri intr-o serie de timp este urmtorul:
1.Identificarea valorilor atipice si a cauzalitatii/ contextul producerii acestora
2.Tratamentul seriei cu privire la valorile atipice – modelarea seriei care contine outlieri.
4 Identificarea valorilor atipice intr-o serie de timp
In literatura de specialitate putem intalni urmatoarele abordari:
-Lipsa de interventie asupra seriei
-Inlocuirea valorilor atipice cu o valoare mai aproape de specificul seriei: media
mobila, valoarea teoretica generata de trendul seriei, valori aflate la limita dintre
extrem si outlier s.a.( vezi exemplul in Excel: “S05_2021…”)
Indiferent de strategia aleasa este utila identificarea valorillor atipice si determinarea
factorilor care au dus la aparitia acestora care sa ne permita identificarea unui pattern
care odata reprodus sa poata sa ne permita anticiparea/ previzionarea
comportamentului seriei.
Prin urmare ne vom concentra pe cateva modalitati simple de identificare a
outlierilor unei serii de timp.
5 Identificarea valorilor atipice intr-o serie de timp
Una dintre modalitatile cele mai simple de identificare a outlier-ilor este analiza distributiei erorilor
de modelare.
1.Analiza grafica a distributiei erorilor de modelare prin diagrama Box-Plot. Acest grafic
reprezinta prin puncte externe/extreme valorile care pot fi considerate atipice pentru serie.
RESID
Pentru o distributie normala, asa cum e cazul erorii de modelare,
3,000
de parametri σ 2 si µ, N(µ ,σ 2), pot fi considerate valori atipice
valorile care sunt situate in afara intervalului centrat .
O varianta mai des intalnita este cea in care se considera valori[ t 2 s ; t 2s ]
2,000
-2,000
6
Daca luam in considerare faptul ca in urma utilizarii metodei celor mai mici patrate suma
erorilor de modelare este nula si implicit media acestora, atunci se considera valori atipice
acele valori corespunzatoare unei erori de modelare care nu sunt cuprinse in intervalul
respectiv . [2 s ;2 s ] [2,5s ;2,5s ]
2. Exista si o serie de teste inferentiale care pot duce la identificarea valorilor atipice cum ar
fi:
-Testul Dixon, utilizat pentru serii cu volum mai mic de 25 de inregistrari
-Testul Grebbs, utilizat pentru serii cu un volum depasind 20 de inregistrari
Ipotezele testate de cele doua teste sunt:
H0: t nu este valoare atipica/ outlier
H1: t este valoare atipica/ outlier
7
NB: Teste pot fi aplicate numai in ipoteza acceptarii normalitatii distributiei pentru
erorile de modelare.
Testul Dixon valorile et se ordoneaza crescator sau descrescator astfel incat valoarea
testata sa fie prima in sir si o vom nota cu et(1).
Statistica Dixon o vom calcula in functie de volumul esantionului dupa cum urmeaza:
e (1) e (2)
e (1)
e (2)
D calc (1)
t t
(T)
ptr. T 1,7 D calc t t
ptr. T 8,10
et et (1)
et et (T -1)
e (1) e (3)
D calc (1)t t
(T -1)
ptr. T 14 ,25
e t ecu
Valorile calculate vor fi comparate t valorile teoretice Dth=D1-α, T din tabele speciale.
Testul Grubbs
max | e extr. e|
Calculul statisticii test g calc t
daca estimarea modelului de face prin
se
metoda celor mai mici patrate
extr.
atunci media erorilor este zero si relatia devine
| et |
. g calc
se
Valorile calculate vor fi comparate cu valorile teoretice gth=g1-α, T din tabele speciale.