Sunteți pe pagina 1din 19

I.

Serii de timp (serii cronologice, serii dinamice)


(note de curs)

Zgomotul alb
mersul la ntmplare
procese medie mobil (MA(q))
procese autoregresive (AR(p))
procese mixate (ARMA(p,q))
seria integrat (ARIMA(p,n,q), ARFIMA(p,d,q))
serii cointegrate, procese ARCH, GARCH.

Seria cronologic reprezint un set sistematizat de valori ale unei varibile msurate la
momente sau intervale de timp egale i successive. Seria cronologic este numit i serie
dinamic sau serie de timp. Din punct de vedere matematic, seria de timp este o realizare
a unui proces stocastic X t t unde
Z sau unei mulimi din Z, iar spaiul strilor

procesului (adic X t , ) este mulimea R sau o submulime a sa.


Exemple de serii cronologice :
1). Cifra de afaceri anual a unei firme de-a lungul unui deceniu.
2). Numrul omerilor nregistrai trimestrial n timpul unei guvernri de patru ani.
3). Numrul polielor ncheiate de o societate de asigurri n fiecare trimestru dintr-o
perioad de 5 ani.
4). ncasrile zilnice ale unui supermarket pe o perioad de o lun.
5). Numrul de transporturi efectuate n fiecare trimestru din ultimii 3 ani de ctre o
firm de transporturi auto internaionale.
Analiza seriei de timp, identificarea, evaluarea i separarea componentelor ofer
informaii privind :
i) trendul, adic existena unui sens evolutiv dominant, care se manifest ndeosebi n
condiii de normalitate ale desfurrii procesului;
ii) apariia unor oscilaii periodice sistematice, cu anse mari de a se repeta i n viitor,
att ca sens ct i ca amploare;
iii) aspectul previzibil al evoluiei unor procese, ca rspuns la unele abateri din trecut;
iv) identificarea factorilor neeseniali, permind eventuala eliminare a lor;
v) caracterul inerial al desfurrii unor procese.
O prim clasificare a seriilor de timp este dat de mprirea lor n serii staionare i
serii nestaionare.
Seria staionar este seria ale crei valori oscileaz n jurul unui nivel de referin (de
echilibru). Vom nota cu x t valoarea de la momentul t i cu X t variabila aleatoare de la
momentul t a crei realizare este xt . n limbaj matematic, seria este staionar dac
procesul stocastic X t t este staionar, adic are media i dispersia constante, iar
covariana variabilelor din proces depinde numai de distana dintre momentele de timp la
care sunt nregistrate. Aadar, avem :
M X t m, D 2 X t 2 i Cov X t , X t k k , t .
Analize mai amnunite disting o staionaritate slab i o staionaritate strict. Procesul
stocastic X t tT este complet caracterizat dac pentru orice ntreg n 1 i orice

mulime de indici distinci t1 , t 2 ,..., t n este cunoscut funcia de repartiie


Ft1t2 ...tn x1 , x 2 ,..., x n P X t1 x1 , X t2 x 2 ,..., X tn x n .

Definiia 1. Procesul stocastic X t t este strict staionar dac


Ft1 h ,...,tn h x1 ,..., x n Ft1 ,...,tn x1 ,..., x n , h 0 i pentru orice mulime finit de
indici t1 , t 2 ,..., t n .
Definiia 2. Procesul stocastic X t t este slab staionar (sau, mai simplu spus, staionar)
dac momentele sale de ordin unu i doi sunt finite, M X t m, t i
Cov X t , X t h Cov X s , X s h pentru orice t,s i h (deci, covariana este funcie numai
de distana dintre variabile). Pentru staionaritatea slab se mai folosesc i sintagmele :
staionar de ordinul doi, staionar n covarian sau staionar n sens larg.
2
Observaie : Dac X t tT este o serie de timp strict staionar cu M X t (adic
momentele de ordin doi sunt finite), atunci dispersia lui X t este o constant pentru toi t.
De asemenea, un proces stocastic strict staionar cu primele dou momente finite este i
slab staionar. n economie majoritatea seriilor cronologice privind preurile, masa
monetar, consumul etc. nu sunt staionare, sunt nestaionare, deoarece prezint tendine
de cretere sau de scdere n timp (media lui X t depinde de momentul t).
n raport cu modalitatea n care se elimin tendina din seria de date avem :
1). Serii nestaionare TSP (trend stationary processes) sunt serii care prin ndeprtarea
'
tendinei sunt transformate n serii staionare. Notnd cu x t tendina i cu xt xt x t
'
rezult c seria xt t este staionar.
2). Serii nestaionare DSP (difference stationary processes) sunt serii care se
transform n serii staionare prin calculul diferenelor de ordinul nti
y t' y t y t y t 1 sau de ordinul doi x t' 2 xt x t x t 1 . Prin aceste diferene
se elimin i trendul. Evident, se pot defini diferene i de alt ordin, inclusiv fracionar. O
modalitate pentru a stabili dac o serie este de tip TSP sau DSP este dat de testul
Dickey-Fuller. Pentru aceasta se pleac de la un model de forma xt a 0 a1 t b xt 1 t
, unde a 0 , a1 i b sunt parametri iar t este o variabil aleatoare de medie zero i
2
dispersie 0 , t 1,2,..., n. Dac a1 0 i b 1 atunci seria este de tip DSP. Dac
a1 0 i b 1 , atunci seria este de tip TSP. Evident a1 0 i b 1 implic
xt xt x t 1 a 0 t care este un proces staionr oscilnd aleatoriu n jurul lui a 0 .

Autocovariane i autocorelaii
Fiind dat o serie de timp staionar, X t t , numrul k Cov X t , X t k este numit a
k autocovarian, iar irul k k vzut ca o funcie definit pe Z, este numit funcia de
k
autocovarian a lui X t t . Pentru 0 0 definim k
numit a k autocorelaie
0
a lui X t t , se mai noteaz Corr X t , X t k . Evident 0 1 i k 1, k . irul
k k vzut ca funcie definit pe Z este numit funcia de autocorelaie a lui X t t .
Este mai convenabil de lucrat cu autocorelaiile deoarece ele sunt invariante la scal.

S considerm X t tZ un proces stocastic staionar. Pentru funcia autocorelaie avem


urmtoarele proprieti.
P.1. Funcia de autocorelaie este par n raport cu lag-ul, adic avem
k k , k.

Demonstaie. X t t staionar implic k Cov X t , X t k Cov X t k , X t


k k

k
Cov X t , X t k k , rezult k
0
0
k 1
P.2.
Demonstraie. Avem Var 1 X t 2 X t k 0, 1 , 2 . Rezult
12 Var X t 22 Var X t k 2 1 2 Cov X t , X t k

12 2 22 2 2 1 2 k 0
Lund 1 2 1 obinem 2 2 2 k 0 , k 2 i
k

k k 2

1
0 2
2

Lund 1 1 i 2 1 obinem 2 2 2 k 0 , k 2 , k

k 2

1 . Aadar 1 k 1 .
2 2

Metode de extragere a trendului


1). Metoda mediilor pariale const n urmtorii pai :
Pasul1 : Se separ datele seriei n dou grupe : una inferioar i alta superioar.
Pasul 2 : Se calculeaz media aritmetic a fiecrei grupe.
Pasul 3 : Se determin mediana momentelor de timp ale fiecrei grupe. Aceasta
reprezint momentul de timp corespunztor mediei aritmetice. Pentru fiecare
grup, se reprezint grafic punctul de ordonat media aritmetic i de abscis
momentul de timp corespunztor.
Pasul 4 : Dreapta determinat de cele dou puncte, reprezentate grafic, constituie
trendul cerut.
Exemplul 1. Numrul contractelor de asigurare ncheiate de o societate de asigurri n
primele 10 luni ale anului 200N este dat n tabelul :
Ianuarie
Februarie
Martie
Aprilie
Mai
2000
2400
2600
2500
2300
Iunie
Iulie
August
Septembrie
Octombrie
2800
3000
3500
3200
3400
Utiliznd metoda mediilor pariale, s se extrag trendul.
Soluie. Primele 5 luni formeaz grupa inferioar avnd media y1 2360 cu momentul
de timp corespunztor luna martie. Celelalte luni formeaz grupa superioar avnd media
y 2 3180 cu momentul luna august.
2. Metoda mediilor mobile const n calcularea mediei aritmetice a fiecrui subset de q
valori consecutive ale seriei date. Mrimea q este denumit perioada mediilor mobile.
Formarea unui nou subset presupune scoaterea primei valori din subsetul anterior,
3

pstrarea celorlalte q-1 valori i introducerea n subset a urmtoarei valori din irul
valorilor seriei date. Mediile mobile calculate reprezint chiar componentele (valorile)
trendului seriei cronologice date.
La stabilirea perioadei mediilor mobile trebuie avut n vedere necesitatea ca aceasta s
coincid cu lungimea ciclului natural al seriei. De exemplu, la determinarea trendului
numrului de omeri nregistrai trimestrial de-a lungul mai multor ani, perioada mediilor
mobile va fi 4; la determinarea trendului ncasrilor zilnice ale unui supermarket,
nregistrate de-a lungul mai multor luni, perioada mediilor mobile va fi 7.
n cazul exemplului de la punctul 1, mediile mobile de perioad 5 sunt :
xt
2000 2400 2600 2500 2300 2800 3000 3500 3200 3400
Totaluri
11800 12600 13200 14100 14800 15900
mobile
Medii
2360 2520 2640 2820 2960 3180
mobile
n cazul n care mediile mobile sunt folosite pentru reprezentarea grafic a trendului
i se vrea reprezentarea valorilor acestuia n anumite momente de timp, exist o
metod de centrare a mediilor mobile, metod care necesit calculul mediilor
aritmetice pentru perechile succesive de medii mobile.
Modele de serii de timp
1. Modelul aditiv al seriilor de timp
Y T S R

unde : Y este valoarea cunoscut a seriei de timp,


T este componenta trend,
S este componenta sezonier,
R este componenta rezidual.
2. Modelul multiplicativ al seriilor de timp
Y T S R
unde : Y, T, S, R au semnificaia de mai sus.

3. Zgomotul alb
O serie de timp X t t format din variabile aleatoare necorelate, cu media zero i
dispersia 2 0 , se numete zgomot alb. Evident, ea este staionar, avnd funcia de

autocovarian

2, k 0

0, in rest

i funcia de autocorelaie

1, k 0
k
0, in rest

2
Se noteaz WN 0, 2 (White Noise), deci X t ~ WN 0, . Zgomotul alb mai este
denumit i proces pur aleator. Dac elementele lui X t sunt i.i.d. (independente i
identic repartizate), atunci seria de timp este strict staionar (se mai scrie
X t ~ IID 0, 2 ). Cnd X t -urile au repartiia normal, spunem c zgomotul alb este
gaussian. n cazul unui zgomot alb gaussian cele dou definiii privind staionaritatea
coincid, deci seria este att staionar ct i strict staionar. Un proces X t este un
2
zgomot alb cu media m dac X t m ~ WN 0, . Cu zgomotul alb se pot construi
multe modele de serii de timp.
2
Exemplu : Seria de timp Z t unde Z t U t U t 1 , 0 i U t ~ WN 0,
este numit medie mobil de ordinul nti (ordin unu). Se noteaz Z t ~ MA1 .
Aceast serie de timp este staionar pentru orice , are media 0, funcia de

1,

1 2 2 , k 0

autocovarian

k , k 1
0,
in rest

Evident 1

i funcia autocorelaie

k 0


k 2 , k 1
1
0, in rest

1
. Procesul MA(1) este cel mai simplu exemplu de filtru liniar.
2

4. Mersul aleator (random walk)


Se consider X t un proces discret pur aleator (adic

t Z i variabilele aleatoare

X t sunt independente i identic repartizate) cu media m i dispersia X2 . Procesul

Zt

unde Z t Z t 1 X t se numete mers aleator. n mod obinuit procesul este


t

pornit de la zero cnd t 0 , astfel c Z 1 X 1 i Z t X i . Avem :


i 1

i 1

i 1

E Z t E X i m t m i

i 1

i 1

Var Z t Var X i X2 t X2

Observaie : Cum media i dispersia depind de t, mersul aleator este nestaionar.


Totui, este interesant c diferenele de ordinul nti ale mersului aleator dau un
5

proces pur aleator care este staionar, deci X t unde X t Z t Z t 1 este staionar.
Cele mai cunoscute exemple de serii de timp care se comport foarte mult ca mersul
aleator (la ntmplare) sunt preurile aciunilor (share prices). n acest caz un model
care corespunde datelor este : Preul aciunii n ziua t = preul aciunii n ziua (t-1) +
o eroare aleatoare.
5. Procese medie mobil
Se consider Z t un zgomot alb (sau, mai restrictiv, un proces pur aleator, pentru
c n locul necorelrii se consider independena) cu media zero i dispersia Z2 .
5.1 ,
Procesul X t , unde X t 0 Z t 1 Z t 1 q Z t q
0 0, q 0, i -urile sunt constante, se numete proces medie mobil de ordin q
(abreviat MA(q)).n mod uzual Z-urile sunt scalate, astfel c 0 1 . Plasndu-ne n
ipoteza mai restrictiv ( Z t -urile independente), obinem : E X t 0 i
q

Var X t Z2 i2 . Avem : k Cov X t , X t k


i 0

Cov 0 Z t 1 Z t 1 q Z t q , 0 Z t k 1 Z t k 1 q Z t k q

kq

0,

qk

i 0

Z2 i i k ,

qk

2 ,
Z i
ik

k 0,1, , q
k 1,2, ,q

i 0

0,

k q

Cum k nu depinde de t i media este constant, rezult c procesul X t este slab


staionar (altfel zis, staionar de ordinul doi) pentru toate valorile lui i . Mai mult,
cnd Z t -urile sunt repartizate normal, atunci i X t -urile sunt repartizate normal.
Deci, procesul este complet determinat de medie i funcia autocovarian. Funcia de

1,

autocorelaie a procesului MA(q) este k 0,


q k

i i k

i 0

k 0
k q sau k q

i 0

2
i

k 1,2, , q

1 pentru k 0

n particular, procesul MA(1) cu 0 1 are funcia autocorelaie

1
,
2
1 1

k 1

in rest

S menionm c funcia autocorelaie taie (ntrerupe) la lag-ul q, ceea ce constituie o


trstur a proceselor MA. Privitor la condiiile ca un MA proces s fie staionar vom
face urmtoarele consideraii. Fie urmtoarele procese MA de ordinul nti :
X t Z t Z t 1
1).
2).

Xt

1
Z t 1

k 0

1,

, k 1
Primul proces are funcia autocorelaie 1 k
1 2
0, in rest
1,

k 0

1
, k 1
Al doilea proces are funcia autocorelaie 2 k
2
2
1 1 1

0
in rest

Aadar, avem 1 2 . Astfel se vede c un MA proces nu poate fi identificat dup


funcia autocorelaie.
Punnd n cele dou modele Z t n termeni de X t , X t 1 , , prin substituiri
succesive obinem : A). Z t X t Z t 1 X t X t 1 Z t 2
X t X t 1 2 X t 2 3 X t 3
B).

Zt X t

1
1
1
1
1

Z t 1 X t X t 1 Z t 2 X t X t 1 2 X t 2

Dac 1 , atunci seria de la A este convergent iar seria de la B este divergent.


Astfel, o procedur de estimare care implic estimarea reziduurilor, duce n mod
natural la modelul A, care se zice c este invertibil (n acest caz modelul B nu este
invertibil). Condiia de invertibilitate ne asigur unicitatea procesului MA pentru o
funcie autocorelaie dat. Aceast condiie pentru un proces MA de ordin general este
exprimat cel mai bine folosind operatorul de schimbare (mutare, dare) napoi, notat
j
cu B, care este definit prin B X t X t j j . Astfel, ecuaia (5.1) se va scrie

X t 0 1B 2 B 2 q B q Z t B Z t ,

unde B este un polinom de


ordin q n B. Un MA proces de ordin q este invertibil dac toate rdcinile ecuaiei
B 0 1 B 2 B 2 q B q 0

5.2

se afl n afara cercului unitate. De notat c n ecuaia (5.2) B este vzut ca o variabil
complex i nu ca un operator. De asemenea, se poate aduga n (5.1) o constant
arbitrar m n membrul drept, ceea ce d un proces de medie m. Cum aceasta nu
schimb funcia autocorelaie pentru simplificare va fi omis.
Privitor la formalizarea matematic, se numete proces medie mobil finit procesul
stocastic

X t ;t

Z}, unde

Xt

j M

Z t j , M N, j R, M

0, M 0

i Z t -urile sunt variabile aleatoare necorelate 0, 2 , adic E Z t 0 i


Var Z t 2 (mai restrictiv, sunt considerate independente). Procesul medie mobil
infinit X t este dat de reprezentarea X t
natural M astfel nct

j 0, j Z cu

Z t j , unde nu exist un numr

j M.

Procesul definit de

X t j Z t j , unde 0 0 i q 0 se numete proces medie mobil cu o


j 0

latur de ordin q (mai precis este un proces medie mobil stnga de ordin q, pe scurt
proces medie mobil de ordin q). Aceasta pentru c punnd t Z t q i i i q
avem X t

j Z t j

j q

2q

2q

i 0

i 0

i q Z t i q i t i , deci nu se pierde din


i jq

generalitate dac se consider numai reprezentarea cu o latur.


Un proces medie mobil de ordin infinit cu media nenul , dat de

X t i Z t i este numit proces liniar general (aceasta pentru c procesele de


i 0

acest tip se obin trecnd un proces pur aleator printr-un sistem liniar.
Cteva cuvinte despre sistemele liniare. S considerm c sunt date observaii
(nregistrri) asupra intrrilor (inputurilor) i ieirilor (outputurilor) unui sistem,
notate n cazul n care timpul este discret cu xt , y t i cu x t , y t n cazul
timpului continuu.
Definiie. Fie y1 t , y 2 t ieirile corespunztoare intrrilor x1 t , x 2 t . Sistemul se
numete sistem liniar dac i numai dac orice combinaie liniar de intrri (s zicem
1 x1 t 2 x 2 t ) produce aceeai combinaie liniar de ieiri, adic
1 y1 t 2 y 2 t , 1 , 2 fiind constante.
Definiie. Dac intrarea x t produce ieirea y t , atunci sistemul se zice c este
invariant n timp dac o ntrziere de timp la intrare produce aceeai ntrziere la
ieire, adic x t produce ieirea y t , altfel zis relaia intrare-ieire nu se
schimb cu timpul.
a) Sisteme liniare n timp

Un sistem liniar invariant n timp se poate scrie sub forma y t


y t

cazul timpului discret, sau sub forma

xt k pentru

h u x t u du pentru cazul timpului

continuu. Funcia de ponderare h u (pentru timpul continuu) sau hk (pentru


timpul discret) arat o caracterizare (descriere) a sistemului n timp i este cunoscut
sub numele de FIR (Funcia Impuls Rspuns). Un exemplu foarte simplu de sistem
liniar este dat de ntrzierea simpl, adic y t xt d unde ntregul d arat timpul de

1 pentru k d
ntrziere. Funcia sa FIR este : h
k
0 in rest

Alt exemplu de sistem liniar este ctigul pur, adic yt c xt unde constanta c

c pentru k 0
reprezint ctigul. FIR ul acestui sistem este : h
k
0 in rest
b). Sisteme liniare n frecven
O alt cale de descriere a unui sistem liniar este prin intermediul unei funcii
denumit funcia de transfer (FRF Funcia Rspuns Frecven). Aceasta este
transformata Fourier a funciei FIR, adic este

h u e

i u

du ,

i k
cazul timpului continuu i este H hk e
, 0 .
k

ntrun sistem liniar o intrare exponenial complex x t e i t cos t i sin t d


o ieire y t H x t . Pentru sistemul liniar ntrzierea simpl, y t x t
unde este o constant, funcia FIR este h u u unde este funcia delta
Dirac, adic

0, t 0
, astfel nct
t
t0

t dt

(altfel zis, pentru orice funcie

t care este continu n t 0 , funcia delta Dirac este funcia care verific

t t dt

u e

. Funcia de transfer este dat de

i u

du e i

6.

Procese autoregresive

Dac Z t este un proces pur aleator cu media 0 i dispersia Z2 , atunci un proces


X t se zice c este proces autoregresiv de ordin p dac
9

X t 1 X t 1 2 X t 2 p X t p Z t

(6.1)

Acest model seamn cu modelul regresiei multiple, dar diferena const n faptul c
X t nu este regresat peste variabile independente ci peste valorile din trecut. Se
utilizeaz abrevierea AR(p) proces.
(6.2)
Procese de ordinul nti : p 1 i X t X t 1 Z t
Prin substituii succesive obinem :
X t X t 1 Z t X t 2 Z t 1 Z t Z t Z t 1 2 Z t 2
pentru 1 1 . Deci X t poate fi exprimat ca un proces medie mobil de ordin
infinit. Utiliznd operatorul de mutare napoi (ntoarcere) B, ecuaia (6.2) se scrie
1 B X t Z t , astfel c X t 1 B 1 Z t 1 B 2 B 2 Z t
Z t Z t 1 2 Z t 2

2
2
4
Rezult : E X t 0 i Var X t Z 1

Astfel, dispersia este finit dac

1,

Z2
caz n care avem : Var X t
X2
2
1

i
Funcia autocovarian este : k E X t X t k E Z t i

Z2 i k i pt. k 0 Aceasta converge n cazul


i 0

Z2
k
k X2
2
1


Z t k j

la

Pentru k 0 gsim k k .
Deoarece k nu depinde de t, un proces AR(1) este slab staionar dac 1 .
k k X2

k , k 0,1,2,
Funcia autocorelaie este : k
2
0
X
k
Pentru toi ntregii k avem k , k 0,1,2,
Mai simplu, funcia autocorelaie poate fi gsit presupunnd apriori c procesul este
staionar, n care caz E X t 0 . nmulind ecuaia (6.2) cu X t k i lund media
obinem : pentru k 0 : k k 1 presupunnd c E Z t Z t k 0
Deoarece k este o funcie par, trebuie s avem k k 1 pentru k 0.
Cum
7. Procese mixate ARMA(p,q)
Sunt procese X t autoregresive de ordin p cu reziduuri medie mobil de ordin q
care verific relaia X t 1 X t 1 p X t p Z t 1 Z t 1 q Z t q , unde Z t
-urile sunt reziduuri medie mobil de ordin q.
8. Procese nestaionare autoregresive i de medie mobil ARIMA(p,n,q)
Sunt procese nestaionare care n forma original prezint tendin i prin diferene
de ordin n pot fi aduse la forma staionar, p fiind ordinul prii autoregresive i q
ordinul prii medie mobil a modelului.
Pentru ARIMA(1,1,2) ecuaia este : y t 0 1 y t 1 y Z t 1 Z t 1 2 Z t 2
9.
Modelul ARFIMA (Autoregressive Fractionally Integrated Movie Average)
Este o variant a modelului ARIMA(p,d,q) n care d este ordinul diferenei i este o
10

fraciune din 1 (0<d<1). Folosind operatorul de difereniere napoi (trimitere n trecut)


d
B avem : 1 B yt z t , z t ~ N 0, z2 , 0 d 1 , unde
1 B d 1 d B d d 1 B 2 d d 1 d 2 B 3
2!
3!
d
Astfel, forma general a lui ARFIMA este 1 B B y t B z t , unde , , B au
semnificaiile : B y t z t
(modelul AR(p), adic
y t 0 1 y t 1 p y t p z t )
yt B z t
(modelul MA(q), adic y t y z t 1 z t 1 q z t q )
10. Seria integrat
Seria integrat este seria de timp nestaionar care prin diferenele de ordinul nti
sau doi (adic y t y t y t 1 , 2 y t y t y t 1 ) poate fi transformat n serie
staionar.
11. Serii cointegrate
Sunt seriile cronologice care fiind integrate de acelai ordin admit o combinaie
liniar care este staionar (integrat de ordin zero) sau este integrat de ordin mai
mic dect ordinul de integrare a seriilor iniiale.
Exemplu. Seriile xt , y t au acelai ordin de integrare i exist z t , unde
z t y t a b xt care este staionar.
12. Procese ARCH (Autoregressive Conditional Heteroskedasticity)
Prind mprtierile inegale (eteroschedasticitate) ale valorilor reziduale n timp
(adic o dependen sub forma autocorelaiei i pentru variabilele reziduale). F.R.
Engle a propus ca dispersia erorii s fie dependent de valorile y t 1 sau z t 1 .
2
2
2
2
2
Astfel avem : zt 0 1 y t 1 sau varianta zt 0 1 z t 1 p z t p .
Spre deosebire de modelul AR n care eroarea z t este considerat aleatoare,
repartizat normal i cu dispersia constant, iar E y t y t 1 a y t 1 (media
condiionat este dependent de timp), n versiunea lui Engle dispersia erorii este
dependent de timp (de aici iniialele CH adugate lui AR). O variant simpl a
2
2
2
modelului este : y t a y t 1 b xt z t , unde z t ~ N 0, zt , zt 0 1 z t 1

O limitare important a modelelor ARMA este dat de faptul c trateaz prea rigid
variana condiionat a lui X t k . Clasa proceselor ARMA cu heteroscedasticitate
condiional autoregresiv sau ARMA-ARCH procese permite varianei condiionate a lui
X t s depind de istoria procesului. O serie de timp cu media zero, X t , este un proces
pur ARCH(1) dac X t t Yt , Yt ~ IID 0, 1 , (se scrie X t ~ARCH(1)), unde t
(volatilitatea stocastic) este un element al procesului stocastic care verific relaia
t2 2 X t21 , cu 0 i 0 . Deoarece E X t2 S t 1 t2 2 X t21 , un
2
proces ARCH(1) pentru X t corespunde unui proces AR(1) pentru X t . Dac 0 1 ,

2
.
1
2
2
Diferena dintre variana condiionat i necondiionat este t2 X t21 .
2

atunci procesul ARCH(1) este staionar i variana sa necondiionat este

Avem E X t21 S t 1 E X t2
2

S
t 1

11

2
t

Repetnd aceast formula obinem

E X t2 k S t 1

k 1 X t21 ,

k 1,2,

Astfel, E X t2 k S t 1 k .
O generalizare simpl a procesului pur ARCH 1 este procesul pur ARCH m , unde
t2 2 1 X t21 m X t2 m cu j 0, j 1, m 1, i m 0, care corespunde unui
2
proces AR m pentru X t .
Definiie. O serie de timp X t este numit proces ARMA p, q ARCH m dac
satisface relaia B X t B Yt , Yt ~ ARCH m unde B i B sunt
polinoame n lag- operatorul de ordin p i, respectiv q.
Mai general este un proces avnd heteroscedasticitate generalizat condiional
autoregresiv (GARCH) de ordin r, m , generalizarea lui Bollerslev, unde
t2 2 1 t21 r t2 r 1 X t21 m X t2 m , cu
r , m 0, i 0, i 1, r 1, j 0, j 1, m 1 . Avem ARCH m GARCH 0, m .
2
2
Notnd Vt X t t , atunci un proces GARCH r, m poate fi scris
X t2 1 X t21 p X t2 p 1 Vt 1 r Vt r unde
p max m, r , j j j , j 0 for j m i j 0 pentru j r. Deci un proces
GARCH r , m pentru X t corespunde unui proces ARMA p, r pentru X t2 .
Definiie. O serie de timp X t este numit proces ARMA p, q GARCH r , m dac
satisface relaia B X t B Yt , Yt ~ GARCH r , m .
Pentru exemplificarea noiunilor legate de modelele autoregresive, am fcut inferen
statistic pentru determinarea coeficienilor prin metoda celor mai mici ptrate pe datele
din rapoartele anuale ale Comisiei de Supraveghere a Asigurrilor i apoi am efectuat
~
prediciile X t X t 1 , X t X t 1 X t 2 , valorilor de interes n dou cazuri
: nti predicia pas cu pas (adic datele din anul anterior sau din anii anteriori sunt cele
raportate de CSA), apoi predicia pe termen lung (caz n care, n predicie, se folosesc
prediciile anterioare i nu datele raportate, deci ar fi cazul elaborrii unor prognoze pe
termen lung).
Tabel. 1. Valoarea total a primelor de asigurare brute ncasate din asigurri directe :
An
Prime totale ncasate
Prime ncasate n
Prime ncasate
(lei noi)
asigurrile de via
asig. generale
1997
130402200
8073900
122328300
1998
241484000
19944700
221539300
1999
427393000
50569000
376824000
2000
673887300
106658600
567228700
2001
1001242500
211473300
789769200
2002
1645965600
414514000
1231451600
2003
2422508810.2
579003012
1843505798.2
2004
3216393971.5
693443836.2
2522950135.3
Sursa : Rapoartele Anuale ale CSA
Tabelul 2. Predicii pentru primele brute ncasate din asigurrile directe
Anul
Prime brute
Predicii pas cu pas
Predicii pe termen

ncasate* (Xt)
Xt
lung X t
2

12

1997
130,402,200
----1998
241,484,000
311,729,066.9
311,729,066.9
1999
427,393,000
458,654,611.1
551,566,273.3
2000
673,887,300
704,552,507.8
868,793,866.4
2001
1,001,242,500
1,030,585,298
1,288,384,085
2002
1,645,965,600
1,463,571,087
1,843,367,180
2003
2,422,508,810.2
2,316,332,676
2,577,431,565
2004
3,216,393,971.5
3,343,449,933
3,548,362,980
**
2005
4,384,987,227
4,393,505,021
4,832,593,399
*
**
Sursa : Rapoartele Anuale ale CSA, Prime brute subscrise.
Eroarea relativ pentru prediciile din 2005 este de 0.2% n cazul pas cu pas i de 2.7% pe
termen lung. Pentru predicia ndemnizaiilor brute pltite de asigurtori pentru
asigurrile directe generale i de via, att cumulate ct i separate, am folosit dou
modele lineare.
Tabelul 2. Situaia pe date deflatate
Prime brute ncasate
Predicii
Predicii
~

Anul
deflatate (Xt)
Xt
Xt
1997
130,402,200
----1998
171,752,489.3
157,729,471.75
--1999
196,368,185.8
210,083,500.22
203,946,382.41
2000
220,057,866.1
241,249,687.82
236,706,333.31
2001
250,925,319.5
271,243,436.77
267,667,960.66
2002
350,171,401
310,325,038.33
307,698,100.38
2003
451,689,130.8
435,981,527.41
434,715,398.98
2004
548,685,334.6
564,514,173.86
567,163,062.07
2005
688,799,178.4
687,322,069.45
693,961,104.10
Eroarea relativ pentru predicia din 2005 este de 0,2% la modelul de ordinul nti i de
0,75% la modelul de ordin doi, iar eroarea relativ total a prediciilor este de 2% la
ambele modele. Predicia pentru 2006 este de 875,273,474.23 pentru date deflatate
(5,990,015,464 lei).
Tabelul 3. Predicii pentru ndemnizaiile (despgubirile) brute pltite
Anul
ndemnizaii *
Predicii pas cu pas
Predicii pas cu pas
~

(Xt)
Xt
Xt
1997
69,925,100
----1998
102,212,700
114,022,130.901
---1999
189,589,900
161,229,924.099
193,403,696.19
2000
248,978,900
288,984,380.539
273,600,712.37
2001
406,293,900
375,817,208.937
420,965,932.04
2002
649,832,600
605,827,924.718
567,138,913.81
2003
842,267,901
961,906,561.258
886,204,782.46
2004
1,311,879,000
1,243,266,770.548
1,307,528,164.13
2005
1,758,745,510
1.929,886,514.498
1,765,377,520.80
*
Sursa : Rapoartele Anuale ale CSA.
Eroarea relativ a predicie X t pentru anul 2005 este de 9.7%. Definind eroarea relativ

13

total (ERT) a prediciilor X t ca ERT

Xt

, rezult c ERT este egal cu

4.2%. Eroarea relativ a prediciei X t pentru anul 2005 este egal cu 1.8%.
Folosind modelul autoregresiv linear de ordinul nti pentru primele brute ncasate n
contractele directe de asigurri generale (non-life) am obinut
X t 103034505.55 1.31273 X t 1 cu care am fcut prediciile din tabelul 4.
Tabelul 4. Predicii pentru primele brute ncasate din asigurrile generale directe
Anul
Prime brute
Predicii pas cu pas
Predicii pe date
ncasate* (Xt)
deflatate
X t
1997
122,328,300
-----1998
221,539,300
263,618,589.2
141,284,469.84
1999
376,824,000
393,855,889.4
186,451,070.54
2000
567,228,700
597,702,842.7
206,403,634.37
2001
789,769,200
847,652,889.3
221,905,572.13
2002
1,231,451,600
1,139,788,578.9
238,181,828.83
2003
1,843,505,798.2
1,719,598,512.4
320,287,350.82
2004
2,522,950,135.3
2,523,060,692.3
425,063,112.95
2005
3,346,997,220**
3,414,987,959.3
536,137,273.30***
*
Sursa : Rapoartele Anuale ale CSA, **Prime brute subscrise, ***3,413,121,224.82 lei.
Eroarea relativ pentru predicia din anul 2005 este de 2,03%, iar eroarea relativ total a
prediciilor este de 1,709%. Predicia pentru volumul primelor brute ncasate din
asigurrile generale directe n 2006 este de 4,496,739,655.42 lei. n cazul datelor
deflatate, eroarea relativ a prediciei pentru 2005 este de 1,975%, iar eroarea relativ
total a prediciilor este de 2,291%.
n cazul asigurrilor de via modelul obinut este X t 59577744.34 1.193007 X t 1 ,
iar pentru date deflatate este X t 12430011.13244 1.07045 X t 1 .
Tabelul 5. Predicii pentru primele brute ncasate din asigurrile de via directe
Anul
Prime brute
Predicii pas cu pas
Predicii pe date
*

ncasate (Xt)
deflatate
Xt
1997
8,073,900
-----1998
19,944,700
69,209,965.58
21,072,716.00
1999
50,569,000
83,371,916.04
27,614,791.13
2000
106,658,600
119,906,927.96
37,301,077.42
2001
211,473,300
186,822,227.40
49,713,089.73
2002
414,514,000
311,866,924.39
69,161,879.41
2003
579,003,012
554,095,951.49
106,828,585.53
2004
693,443,836.2
750,332,535.32
127,993,713.31
**
2005
1,037,990,007
886,861,268.27
139,058,586.40***
*
**
***
Sursa : Rapoartele Anuale ale CSA, Prime brute subscrise, 885,265,455.84 lei.
Eroarea relativ total a prediciilor este de 6,54%, eroarea prediciei pentru 2005 este de
14,5% (mare, deci modelul linear de ordinul 1 nu e recomandabil pentru prognoze aici),

14

iar predicia pentru 2006 este de 1,297,907,347.92 lei. n cazul datelor deflatate eroarea
relativ a prediciei pe 2005 este de 14,7%, iar eroarea relativ total a prediciilor este de
5,54%.
Folosind modelul autoregresiv linear de ordinul doi pentru primele brute ncasate n
contractele directe de asigurri generale (non-life) am obinut
X t 88208606.32 1.124101 X t 1 0.346886 X t 2 cu care am fcut prediciile din
tabelul 6.
Tabelul 6. Predicii pentru primele brute ncasate din asigurrile generale directe
Prime brute
Predicii
~
Anul
ncasate* (Xt)
Xt
1997 122,328,300
--1998 221,539,300
--1999 376,824,000
379,675,001.99
2000 567,228,700
588,645,501.15
2001 789,769,200
856,545,575.45
2002 1,231,451,600
1,172,752,146.19
2003 1,843,505,798.2
1,746,443,710.78
2004 2,522,950,135.3
2,587,667,497.91
**
2005 3,346,997,220
3,563,744,112.26
Sursa : Rapoartele Anuale ale CSA, **Prime brute subscrise.
Eroarea relativ pentru predicia din anul 2005 este de 6,4%, iar eroarea relativ total a
prediciilor este de 2,45%. Predicia pentru volumul primelor brute ncasate n asigurrile
generale directe este de 4,725,745,436.68 RON.
Folosind modelul autoregresiv linear de ordinul doi pentru ndemnizaiile brute i valorile
de rscumprare pltite n contractele directe de asigurri de via am obinut
X t 41,593,144.816 0.371383 X t 1 0.010592 X t 2 cu care am fcut prediciile din
tabelul 7.
Tabelul 7. Predicii pentru ndemnizaiile brute i rscumprrile pltite
n asigurrile de via directe
ndemnizaii brute
Predicii
~
Anul
pltite* (Xt)
Xt
1997 1,858,700
--1998
4,082,800
--1999 12,053,200
43,129,113.47
2000
8,343,700
46,112,740.37
2001 57,633,200
44,819,515.05
2002 142,947,200
63,085,501.75
2003 62,499,098
95,291,716.14
2004 75,280,471
66,318,282.14
2005 97,385,521
70,212,989.45
*
Sursa : Rapoartele Anuale ale CSA
Eroarea relativ pentru predicia din anul 2005 este de 27,9% (mare !), iar eroarea
relativ total a prediciilor este de 22,81%. Predicia pentru volumul ndemnizaiilor
brute pltite n asigurrile de via directe este de 78,557,801.97 RON. Evident, erorile
mari arat neadecvarea modelului pentru prognoze. Aceast evoluie prea sinuoas a
15

acestor sume se explic n parte i prin influena schimbrilor din legislaie, care au
rencadrat anumite produse la alt categorie de asigurri, i prin faptul c evoluia
asigurrilor de via a nregistrat explozii i prbuiri.
II.

REGRESII
(note de curs)

Termenul a fost introdus de Francis Galton (1822-1911) ntr-o lucrare din 1886 n care a
studiat legtura dintre nlimea tailor i nlimea fiilor. El a observat c din prini cu
nlime mai mare dect media grupului considerat se nasc copii cu nlime mai mic
dect a prinilor, iar din prini cu nlime mai mic dect media grupului se nasc copii
cu nlime mai mare dect a prinilor. Prin urmare exist o regresie (ntoarcere) ctre
valoarea medie. n general, este vorba de modelarea relaiei de dependen a unei
variabile de una sau mai multe variabile independente, analog n cazul dependenei unui
fenomen de unul sau mai muli factori. La stabilirea ecuaiei de regresie care s
aproximeze cel mai bine forma real a dependenei cercetate, concur o serie de procedee
statistice. Cel mai simplu este reprezentarea grafic a distribuiilor statistice corelate
(corelograma), graficul sugereaz uneori forma legturii. Alte cerine pentru un calcul
statistic corect sunt reprezentate de omogenitatea datelor i de numrul mare de
observaii. n calcule se opereaz cu mrimi medii, iar media va reflecta mai bine
proprietile tipice ale populaiei cu ct aceasta este mai omogen. Caracterul omogen sau
neomogen al populaiei reprezentate prin datele statistice se sesizeaz prin examinarea
diagramei de dispersie a unitilor de observare n raport cu valorile variabilelor corelate.
Tendina punctelor de a se strnge n dou sau mai multe grupuri ori situarea unor puncte
cu mult n afara norilor de puncte evideniaz eterogenitatea populaiei. n primul caz,
soluia este de a dezmembra distribuiile statistice conform grupelor conturate, urmnd s
se rezolve modelul pentru fiecare grup obinut. n al doilea caz, soluia este dat de
eliminarea din calcule a observaiilor aberante fa de masa observaiilor.
Notnd cu y variabila dependent de p variabile independente x1 , x 2 , , x p , legtura
stocastic poate fi redat printr-o relaie de forma y f x1 , x 2 , , x p , unde este o
variabil aleatoare ce reprezint erorile de observaie sau de msurare, iar f este o funcie
determinist denumit funcia de regresie. Se consider M 0 (operatorul M
desemneaz media, la fel ca i operatorul E, aici vom folosi pentru medie doar M).
Vom considera funcia de regresie liniar f x1 , x 2 , , x p 1 x1 2 x 2 p x p Se
p

dispune de n seturi de observaii : y i xij j i ,


D 2 i 2 ,

j 1

i 1, n , unde M i 0,

i 1, n i Cov i , j 0 pentru orice i j . Notnd cu x matricea

observaiilor asupra variabilelor independente, cu coeficientul de regresie, cu y


vectorul observaiilor asupra variabilei rspuns (dependente) i cu vectorul
reziduurilor (abaterilor, erorilor), relaiile se scriu matriceal sub forma : y x
Estimaia coeficientului de regresie se obine prin metoda celor mai mici ptrate, adic
n

t min y x y x
este dat de soluia problemei : min
i2 min

i 1

Reamintim regulile de derivare pentru vectorul gradient :


16

t ,
t


t P 2P

Se obine sistemul ecuaiilor normale : x t x x t y , unde x t este transpusa matricei


x. n cazul rangului complet, adic rang x p n , atunci rang x t x p i exist
1
inversa x t x . Deci, soluia unic a sistemului de ecuaii normale este :
1
x t x x t y

n cazul n care variabilele de selecie sunt corelate, adic avem Cov y, y 2 W unde
2 este o constant necunoscut i W este o matrice nesingular cunoscut. Avem astfel
M y x , Cov y, y 2 W , unde det W 0 i
modelul : y x ,
rang x p . n acest caz, estimaia vectorului coeficienilor de regresie se obine prin
metoda celor mai mici ptrate generalizate, adic rezolvnd problema :
t
min t W 1 min y x W 1 y x

Anulnd gradientul obinem : x t W 1 x x t W 1 y


Observaii. 1). Estimaia este nedeplasat, adic M
1
1
ntr-adevr, avem M x t W 1 x x t W 1 M y x t W 1 x x t W 1 x
1
2). Estimaia are matricea covarianelor : Cov , 2 x t W 1 x
1

ntr-adevr, avem : x t W 1 x x t W 1 y
1

x W ,

Cov , M
M x W x x W

x W x x W M W x x W x
x W x x W W W x x W x x W
t

W 1 x

x t W 1 x x t W 1 x
t

x xt W

Presupunnd c vectorul erorilor are o repartiie normal cu media 0 i matricea de


covarian V 2 W , atunci funcia de verosimilitate a seleciei este :
L y1 , y 2 , , y n , 2

n
2

n
2

1
y x t V 1 y x
2

, unde

este determinantul

matricei V. Cutm estimaia de verosimilitate maxim, notat cu . Avem ecuaia de


ln L y1 , y 2 , , y n ,
0
verosimilitate maxim :

Maximizarea funciei de verosimilitate nseamn minimizarea expresiei


T y x V 1 y x
t

Aadar, estimaia de verosimilitate maxim coincide cu estimaia dat de metoda celor

mai mici ptrate generalizate. Estimaia valorii medii a observaiilor este M y x

Componentele vectorului M y se numesc valori ajustate ale lui y sau valori estimate
ale lui y.
n cazul n care matricea covarianelor vectorului erorilor este de forma 2 I (aa

t
1
y x y x
n p
1
2
este o estimaie nedeplasat pentru . ntr-adevr, avem : y x x x t x x t ,
2
numitul caz al msurtorilor de precizii egale), statistica

notnd L x x t x x t , K I L rezult
1

17

y x K ,

K t I Lt I L K ,

L2 L,

y x y x
t

K 2 K,

K t K t K 2 t K k ii i2 k ij i j
i 1

i j

Cum TrL Tr x x x x Tr x x x x
1

Tr I

p p

TrK TrI nn TrL n p (TrL este urma matricei L, adic suma elementelor de pe

diagonala principal a matricei), rezult



1
M 2
n p

k
i 1

ii

M i2

i j

ij

1 n
M i j
k ii 2 2

n p

i 1

Estimaia ridge a parametrului de regresie


Considerm modelul liniar de regresie : y x , unde y, R n , R p ,
~ N 0, , Cov , 2 I n , x M n p R , rang x p n

Am vzut c estimaia celor mai mici ptrate este x t x x t y .


S-a constatat c atunci cnd valorile proprii ale matricei x t x sunt apropiate de zero,
distana medie dintre vectorul coeficienilor de regresie i estimaia crete foarte
mult i prin urmare nu mai estimeaz bine pe . n aceast situaie se caut o

estimaie * care s scurteze aceast distan, aceast estimaie este denumit estimaia
ridge. Fie 1 2 p valorile proprii ale matricei x t x (reamintim c este
valoare proprie a matricei A dac este soluie a ecuaiei A I 0, unde A este
1

determinantul matricei A), rezult c urma matricei x t x

t
este Tr x x

Notnd cu L distana dintre i avem : L2 i


p
1
1
M L2 M t K 2 Tr K 2 Tr x t x 2
i 1 i
Se vede c apropierea de zero a unei valori proprii mrete distana M L2 ,
lim M L2

1
p

i 1

p 0

n acest caz se introduce estimaia ridge * W x t y , unde W x t x k I p , k 0 .


Ea este o transformare liniar a estimaiei celor mai mici ptrate. ntr-adevr, cum

1
1
x t y x t x avem : * x t x k I p 1 x t x x t x x t x k I Z ,

unde Z I p k x t x

1 1

Valorile proprii ale matricelor W i Z sunt i W

1
k i

i i Z

i
, unde
k i

i , i 1, p sunt valorile proprii ale matricei x t x .

ntr-adevr, i W verific ecuaia W I p 0


Cazul 1 este cazul degenerat (particular) k 0, Z I p , caz n care estimaia ridge
coincide cu .
Avem :


M * x t x k I p

xt x

, deci estimaia ridge este deplasat pentru k 0 .

18

De asemenea, avem :


Cov * , *

xt x k I p

xt x xt x k I p

Cov ,

Pierznd proprietatea de nedeplasare a estimaiei, se pune ntrebarea dac exist o metod


care s mbunteasc estimaiile prin reducerea deplasrii. O asemenea metod este

metoda jackknife, prin care se obin estimaiile cu acelai nume. Fie 1 i 2 estimaii


ale lui , atunci estimaia J 1 , 2 1 r 2 , r 1 , este numit estimaie

1 r

jackknife. Ea are deplasarea redus fa de deplasrile estimaiilor din care provine. ntradevr, considernd n volumul seleciei, parametrul estimat i
b1 n,

M i bi n, , i 1,2 unde b2 n, 0 , pentru r
1 avem

b2 n,

M J 1 , 2

. Se verific pritr-un calcul simplu :

b2 n,
b n,
1



M J 1 , 2
b1 n, 1

M 1 r M 2

b2 n, b1 n,
b2 n,
1 r

b2 n,

Parametrul r poate fi bine ales pentru clase ntregi de estimaii. Astfel, cnd 1 este o
estimaie deplasat a lui , bazat pe o selecie de volum n, astfel nct

M 1 b f n

, iar 2 este estimaia obinut prin eliminarea unei observaii din

selecie, estimatorul, funcia de selecie se pstreaz, deci


din condiia


M J 1 , 2

obinem r

f n
.
f n 1


M 2 b f n 1

atunci

Exerciiu :
1). Se dispune de datele lunare privind numrul polielor vndute ( Yt = numrul
polielor vndute n luna t),i cheltuielile pentru publicitate n mii u.m. ( X t ) ale unei
societi de asigurri :
Yt
250
220
300
330
Xt
20
25
32
43
a) S se scrie ecuaia de regresie a lui Y n raport cu X.
b) Folosind metoda mediilor mobile de perioad 3, s se extrag trendul seriei X t t , s
se reprezinte grafic i considernd X 0 0 , s se determine a i b din procesul
autoregresiv X t a b X t 1 Z t care s minimizeze suma ptratelor erorilor, unde
Z t ~ N 0, 1 .

19

S-ar putea să vă placă și