Sunteți pe pagina 1din 12

ANALIZA SERIILOR DE

TIMP
Curs Statistica și Previziune Economică anul III

Curs 05
2021-2022
C03-C06: Modelarea, ajustarea și prognoza seriilor de timp
2
formate din trend determinist și componentă aleatoare
 Modelarea trendului determinist (TD) (C03)
 Estimarea si testarea parametrilor trendului determinist
 Indicatori ai acuratetii unui model
 Ruptura de trend (C04)
 Teste specifice indetificarii rupturilor de trend
 Modelarea trendului determinist cu ruptura de trend: modelarea individuala, modelarea agregata cu variabile
dummy
 Valori atipice pentru serii de timp (C05)
 Identificarea valorilor atipice intr-o serie de timp
 Modelarea seriilor cu valori atipice: inlaturarea/inlocuirea valorilor atipice intr-o serie de timp,
modelarea seriei cu valori atipice cu ajutorul variabilelor dummy
 Ajustarea exponentiala unei serii de timp cu trend determinist: ajustarea exponentiala simpla, ajustarea
exponentiala dubla, ajustarea exponentiala Holt (C06)
3 Identificarea valorilor atipice intr-o serie de timp
Existenta valorilor atipice intr-o serie de timp poate avea cauze multiple care de cele mai
multe ori tin de conjunctura.
Valorile atipice intr-o serie de timp pot afecta calitatea procesului de modelare.
Problema valorilor atipice intr-o serie de timp accepta diverse abordari.
Indiferent de autori demersul pe care trebuie sa-l facem cu privire la valorile atipice/
outlieri intr-o serie de timp este urmtorul:
1.Identificarea valorilor atipice si a cauzalitatii/ contextul producerii acestora
2.Tratamentul seriei cu privire la valorile atipice – modelarea seriei care contine outlieri.
4 Identificarea valorilor atipice intr-o serie de timp
In literatura de specialitate putem intalni urmatoarele abordari:
-Lipsa de interventie asupra seriei
-Inlocuirea valorilor atipice cu o valoare mai aproape de specificul seriei: media
mobila, valoarea teoretica generata de trendul seriei, valori aflate la limita dintre
extrem si outlier s.a.( vezi exemplul in Excel: “S05_2021…”)
Indiferent de strategia aleasa este utila identificarea valorillor atipice si determinarea
factorilor care au dus la aparitia acestora care sa ne permita identificarea unui pattern
care odata reprodus sa poata sa ne permita anticiparea/ previzionarea
comportamentului seriei.
Prin urmare ne vom concentra pe cateva modalitati simple de identificare a
outlierilor unei serii de timp.
5 Identificarea valorilor atipice intr-o serie de timp
Una dintre modalitatile cele mai simple de identificare a outlier-ilor este analiza distributiei erorilor
de modelare.
1.Analiza grafica a distributiei erorilor de modelare prin diagrama Box-Plot. Acest grafic
reprezinta prin puncte externe/extreme valorile care pot fi considerate atipice pentru serie.
RESID
Pentru o distributie normala, asa cum e cazul erorii de modelare,
3,000
de parametri σ  2 si µ, N(µ ,σ  2), pot fi considerate valori atipice
valorile care sunt situate in afara intervalului centrat .
O varianta mai des intalnita este cea in care se considera valori[ t  2 s ;  t  2s ]
2,000

atipice valorile situate in afara intervalului .


1,000
[ t  2,5s ;  t  2,5s ]
Odata identificate valorile atipice pentru erorile de modelare
in functie de indicele t corespunzator acestora vom identifica 0

valorile seriei originale yt.


-1,000

-2,000
6

Daca luam in considerare faptul ca in urma utilizarii metodei celor mai mici patrate suma
erorilor de modelare este nula si implicit media acestora, atunci se considera valori atipice
acele valori corespunzatoare unei erori de modelare care nu sunt cuprinse in intervalul
respectiv . [2 s ;2 s ] [2,5s ;2,5s ]
2. Exista si o serie de teste inferentiale care pot duce la identificarea valorilor atipice cum ar
fi:
-Testul Dixon, utilizat pentru serii cu volum mai mic de 25 de inregistrari
-Testul Grebbs, utilizat pentru serii cu un volum depasind 20 de inregistrari
Ipotezele testate de cele doua teste sunt:
H0: t nu este valoare atipica/ outlier
H1: t este valoare atipica/ outlier
7

NB: Teste pot fi aplicate numai in ipoteza acceptarii normalitatii distributiei pentru
erorile de modelare.
Testul Dixon valorile et se ordoneaza crescator sau descrescator astfel incat valoarea
testata sa fie prima in sir si o vom nota cu et(1).
Statistica Dixon o vom calcula in functie de volumul esantionului dupa cum urmeaza:
e (1)  e (2)
e (1)
 e (2)
D calc  (1)
t t
(T)
ptr. T  1,7 D calc  t t
ptr. T  8,10
et  et (1)
et  et (T -1)

e (1)  e (3)
D calc  (1)t t
(T -1)
ptr. T  14 ,25
e t  ecu
Valorile calculate vor fi comparate t valorile teoretice Dth=D1-α, T din tabele speciale.

Criteriu de decizie Dcalc D1-α, T ->AH0 si Dcalc> D1-α, T ->RH0


8

 Testul Grubbs
max | e extr. e|
Calculul statisticii test g calc  t
daca estimarea modelului de face prin
se
metoda celor mai mici patrate
extr.
atunci media erorilor este zero si relatia devine
| et |
. g calc 
se
Valorile calculate vor fi comparate cu valorile teoretice gth=g1-α, T din tabele speciale.

Criteriu de decizie gcalc g1-α, T ->AH0 si gcalc> g1-α, T ->RH0


9 Identificarea valorilor atipice intr-o serie de timp

NB: 1. Metodele prezentate sunt metode elementare de identificare a outlierilor intr-o


serie de timp.
2. La momentul actual exista metode mult mai complexe de identificare a outlier-ilor
adaptate diferitelor metode/ modele utilizate in analiza seriilor de timp, metode care
prin complexitatea lor depasesc obiectivele impuse prin prezentul curs.
3. Este foarte important atunci cand identificam o valoare atipica sa incercam sa
identificam si factorii conjuncturali care au dus la producerea acelei valori
atipice. Acest lucru ne foloseste sa stabilim niste paternuri in comportamentul seriei
care sa ne ajute sa facem prognoze cat mai acurate.
10 Abordari privind modelarea unei serii de timp cu valori atipice
 Modelarea unei serii de timp care prezinta valori atipice este un subiect destul de
disputat.
 In abordarea clasica a seriilor de timp care implica modelarea unui trend determinist
exista urmatoarele abordari:
1. Inlocuirea valorilor atipice cu valori aflate la limita superioara/ inferioara
acceptata a valorilor tipice -> diminuarea influentei valorilor atipice pastrand
specificul lor
2. Inlocuirea valorilor atipice cu media valorilor din vecinatate -> ajustarea valorilor
atipice cu media mobila
3. Inlocuirea valorilor atipice cu valori teoretice generate de componenta trend
estimata urmata de reestimarea componentei trend -> ajustarea valorilor atipice cu
ajutorul trendului
11

4. Introducerea in model a cate unei variabile dummy care ia valorile 1 pentru


momentele corespunzatoare valorilor atipice si 0 pentru restul momentelor ->
modelare cu variabile dummy independente
5. Introducerea in model a unei variabile dummy pentru outlierii pozitivi si a unei
variabile dummy pentru outlierii negativi -> modelare cu variabile dummy comune pe
outlieri de crestere si de descrestere, situatie specifica cazului in care identificam faptul ca
avem cresteri respectiv descresteri care au la baza cauze comune.
12 Learning by doing!

S-ar putea să vă placă și