Sunteți pe pagina 1din 20

I.

Serii de timp (serii cronologice, serii dinamice)


(note de curs)
Zgomotul alb
mersul la ntmplare
procese medie mobil (MA(q))
procese autoregresive (AR(p))
procese mixate (ARMA(p,q))
seria integrat (ARIMA(p,n,q), ARFIMA(p,d,q))
serii cointegrate, procese ARCH, GARCH.
Seria cronologic reprezint un set sistematizat de valori ale unei varibile msurate la
momente sau intervale de timp egale i successive. Seria cronologic este numit i serie
dinamic sau serie de timp. Din punct de vedere matematic, seria de timp este o realizare
a unui proces stocastic
{ }
t t
X
unde
t
Z sau unei mulimi din Z, iar spaiul strilor
procesului (adic
( ) { } ,
t
X
) este mulimea R sau o submulime a sa.
Exemple de serii cronologice :
1). Cifra de afaceri anual a unei firme de-a lungul unui deceniu.
2). Numrul omerilor nregistrai trimestrial n timpul unei guvernri de patru ani.
3). Numrul polielor ncheiate de o societate de asigurri n fiecare trimestru dintr-o
perioad de 5 ani.
4). ncasrile zilnice ale unui supermarket pe o perioad de o lun.
5). Numrul de transporturi efectuate n fiecare trimestru din ultimii 3 ani de ctre o
firm de transporturi auto internaionale.
Analiza seriei de timp, identificarea, evaluarea i separarea componentelor ofer
informaii privind :
i) trendul, adic existena unui sens evolutiv dominant, care se manifest ndeosebi n
condiii de normalitate ale desfurrii procesului;
ii) apariia unor oscilaii periodice sistematice, cu anse mari de a se repeta i n viitor,
att ca sens ct i ca amploare;
iii) aspectul previzibil al evoluiei unor procese, ca rspuns la unele abateri din trecut;
iv) identificarea factorilor neeseniali, permind eventuala eliminare a lor;
v) caracterul inerial al desfurrii unor procese.
O prim clasificare a seriilor de timp este dat de mprirea lor n serii staionare i
serii nestaionare.
Seria staionar este seria ale crei valori oscileaz n jurul unui nivel de referin (de
echilibru). Vom nota cu t
x
valoarea de la momentul t i cu t
X
variabila aleatoare de la
momentul t a crei realizare este t
x
. n limbaj matematic, seria este staionar dac
procesul stocastic
{ }
t t
X
este staionar, adic are media i dispersia constante, iar
covariana variabilelor din proces depinde numai de distana dintre momentele de timp la
care sunt nregistrate. Aadar, avem :
( ) ( )
2 2
,
t t
X D m X M i
( ) ( ) t k X X Cov
k t t

+
, ,
.
Analize mai amnunite disting o staionaritate slab i o staionaritate strict. Procesul
stocastic
{ }
T t t
X

este complet caracterizat dac pentru orice ntreg 1 n i orice
1
mulime de indici distinci n
t t t ,..., ,
2 1 este cunoscut funcia de repartiie
( ) ( ). ,..., , ,..., ,
2 1 2 1 ...
2 1 2 1
n t t t n t t t
x X x X x X P x x x F
n n

Definiia 1. Procesul stocastic
{ }
t t
X
este strict staionar dac
( ) ( ) 0 , ,..., ,...,
1 ,..., 1 ,...,
1 1
>
+ +
h x x F x x F
n t t n h t h t
n n
i pentru orice mulime finit de
indici
. ,..., ,
2 1 n
t t t
Definiia 2. Procesul stocastic
{ }
t t
X
este slab staionar (sau, mai simplu spus, staionar)
dac momentele sale de ordin unu i doi sunt finite,
( ) t m X M
t
,
i
( ) ( )
h s s h t t
X X Cov X X Cov
+ +
, ,
pentru orice t,s i h (deci, covariana este funcie
numai de distana dintre variabile). Pentru staionaritatea slab se mai folosesc i
sintagmele : staionar de ordinul doi, staionar n covarian sau staionar n sens
larg.
Observaie : Dac
{ }
T t t
X

este o serie de timp strict staionar cu ( ) <
2
t
X M (adic
momentele de ordin doi sunt finite), atunci dispersia lui t
X
este o constant pentru toi t.
De asemenea, un proces stocastic strict staionar cu primele dou momente finite este i
slab staionar. n economie majoritatea seriilor cronologice privind preurile, masa
monetar, consumul etc. nu sunt staionare, sunt nestaionare, deoarece prezint tendine
de cretere sau de scdere n timp (media lui t
X
depinde de momentul t).
n raport cu modalitatea n care se elimin tendina din seria de date avem :
1). Serii nestaionare TSP (trend stationary processes) sunt serii care prin ndeprtarea
tendinei sunt transformate n serii staionare. Notnd cu t
x
tendina i cu
t t t
x x x
'

rezult c seria { }
t t
x
'
este staionar.
2). Serii nestaionare DSP (difference stationary processes) sunt serii care se
transform n serii staionare prin calculul diferenelor de ordinul nti
1
'


t t t t
y y y y sau de ordinul doi .
1
2 '


t t t t
x x x x Prin aceste diferene
se elimin i trendul. Evident, se pot defini diferene i de alt ordin, inclusiv fracionar. O
modalitate pentru a stabili dac o serie este de tip TSP sau DSP este dat de testul
Dickey-Fuller. Pentru aceasta se pleac de la un model de forma
t t t
x b t a a x + + +
1 1 0 , unde 1 0
, a a
i b sunt parametri iar t

este o variabil
aleatoare de medie zero i dispersie 0
2
>

,
. ,..., 2 , 1 n t
Dac 0
1
a i 1 b atunci
seria este de tip DSP. Dac 0
1
a i
1 < b
, atunci seria este de tip TSP. Evident 0
1
a
i 1 b implic t t t t
a x x x +
0 1 care este un proces staionr oscilnd aleatoriu
n jurul lui
.
0
a
Autocovariane i autocorelaii
Fiind dat o serie de timp staionar,
{ }
t t
X
, numrul
( ) ( )
k t t
X X Cov k
+
,
este numit a
k autocovarian, iar irul
( ) { }
k
k
vzut ca o funcie definit pe Z, este numit funcia de
autocovarian a lui
{ }
t t
X
. Pentru
( ) 0 0 >
definim
( )
( )
( ) 0

k
k
numit a k autocorelaie
a lui
{ }
t t
X
, se mai noteaz
( )
k t t
X X Corr
+
,
. Evident
( ) 1 0
i
( ) . , 1 k k
irul
2
( ) { }
k
k
vzut ca funcie definit pe Z este numit funcia de autocorelaie a lui
{ }
t t
X
.
Este mai convenabil de lucrat cu autocorelaiile deoarece ele sunt invariante la scal.
S considerm
{ }
Z t t
X
un proces stocastic staionar. Pentru funcia autocorelaie avem
urmtoarele proprieti.
P.1. Funcia de autocorelaie este par n raport cu lag-ul, adic avem

( ) ( ) . , k k k
Demonstaie.
{ }
t t
X
staionar implic
( ) ( ) ( )
+ t k t k t t
X X Cov X X Cov k , ,

( ) ( ) k X X Cov
k t t

,
, rezult
( )
( )
( )
( )
( )
( ) k
k k
k

0 0
P.2.
( ) 1 k
Demonstraie. Avem
( )
2 1 2 1
, , 0 +
+k t t
X X Var
. Rezult
( ) ( ) ( )
( ) 0 2
, 2
2 1
2 2
2
2 2
1
2 1
2
2
2
1
+ +
+ +
+ +
k
X X Cov X Var X Var
k t t k t t


Lund 1
2 1
obinem ( ) 0 2 2
2
+ k , ( )
2
k i
( )
( )
( )
( )
1
0
2
2
2

k k
k
Lund 1
1
i 1
2
obinem ( ) 0 2 2
2
k , ( )
2
k ,
( )
( )
( )

0

k
k

( )
1
2
2
2

k
. Aadar
( ) 1 1 k
.
Metode de extragere a trendului
1). Metoda mediilor pariale const n urmtorii pai :
Pasul1 : Se separ datele seriei n dou grupe : una inferioar i alta superioar.
Pasul 2 : Se calculeaz media aritmetic a fiecrei grupe.
Pasul 3 : Se determin mediana momentelor de timp ale fiecrei grupe. Aceasta
reprezint momentul de timp corespunztor mediei aritmetice. Pentru fiecare
grup, se reprezint grafic punctul de ordonat media aritmetic i de abscis
momentul de timp corespunztor.
Pasul 4 : Dreapta determinat de cele dou puncte, reprezentate grafic, constituie
trendul cerut.
Exemplul 1. Numrul contractelor de asigurare ncheiate de o societate de asigurri n
primele 10 luni ale anului 200N este dat n tabelul :
Ianuarie Februarie Martie Aprilie Mai
2000 2400 2600 2500 2300
Iunie Iulie August Septembrie Octombrie
2800 3000 3500 3200 3400
Utiliznd metoda mediilor pariale, s se extrag trendul.
Soluie. Primele 5 luni formeaz grupa inferioar avnd media 2360
1
y cu momentul
de timp corespunztor luna martie. Celelalte luni formeaz grupa superioar avnd media
3180
2
y cu momentul luna august.
2. Metoda mediilor mobile const n calcularea mediei aritmetice a fiecrui subset de q
3
valori consecutive ale seriei date. Mrimea q este denumit perioada mediilor mobile.
Formarea unui nou subset presupune scoaterea primei valori din subsetul anterior,
pstrarea celorlalte q-1 valori i introducerea n subset a urmtoarei valori din irul
valorilor seriei date. Mediile mobile calculate reprezint chiar componentele (valorile)
trendului seriei cronologice date.
La stabilirea perioadei mediilor mobile trebuie avut n vedere necesitatea ca aceasta s
coincid cu lungimea ciclului natural al seriei. De exemplu, la determinarea trendului
numrului de omeri nregistrai trimestrial de-a lungul mai multor ani, perioada mediilor
mobile va fi 4; la determinarea trendului ncasrilor zilnice ale unui supermarket,
nregistrate de-a lungul mai multor luni, perioada mediilor mobile va fi 7.
n cazul exemplului de la punctul 1, mediile mobile de perioad 5 sunt :
t
x 2000 2400 2600 2500 2300 2800 3000 3500 3200 3400
Totaluri
mobile
1180
0
1260
0
1320
0
1410
0
1480
0
1590
0
Medii
mobile
2360 2520 2640 2820 2960 3180
n cazul n care mediile mobile sunt folosite pentru reprezentarea grafic a trendului
i se vrea reprezentarea valorilor acestuia n anumite momente de timp, exist o
metod de centrare a mediilor mobile, metod care necesit calculul mediilor
aritmetice pentru perechile succesive de medii mobile.
Modele de serii de timp
1. Modelul aditiv al seriilor de timp
R S T Y + +
unde : Y este valoarea cunoscut a seriei de timp,
T este componenta trend,
S este componenta sezonier,
R este componenta rezidual.
2. Modelul multiplicativ al seriilor de timp
R S T Y
unde : Y, T, S, R au semnificaia de mai sus.
3. Zgomotul alb
O serie de timp
{ }
t t
X
format din variabile aleatoare necorelate, cu media zero i
dispersia 0
2
> , se numete zgomot alb. Evident, ea este staionar, avnd funcia de
4
autocovarian ( )

'

rest in , 0
0 ,
2
k
k

,
i funcia de autocorelaie
( )

'

rest in , 0
0 , 1 k
k
Se noteaz ( )
2
, 0 WN (White Noise), deci { } ( )
2
, 0 ~ WN X
t
. Zgomotul alb mai este
denumit i proces pur aleator. Dac elementele lui
{ }
t
X
sunt i.i.d. (independente i
identic repartizate), atunci seria de timp este strict staionar (se mai scrie
{ } ( )
2
, 0 ~ IID X
t
). Cnd t
X
-urile au repartiia normal, spunem c zgomotul alb
este gaussian. n cazul unui zgomot alb gaussian cele dou definiii privind
staionaritatea coincid, deci seria este att staionar ct i strict staionar. Un proces
{ }
t
X
este un zgomot alb cu media m dac { } ( )
2
, 0 ~ WN m X
t
. Cu zgomotul alb se
pot construi multe modele de serii de timp.
Exemplu : Seria de timp
{ }
t
Z
unde
1

t t t
U U Z
, 0 i { } ( )
2
, 0 ~ WN U
t

este numit medie mobil de ordinul nti (ordin unu). Se noteaz
{ } ( ) 1 ~ MA Z
t
.
Aceast serie de timp este staionar pentru orice , are media 0, funcia de
autocovarian ( )
( )

'

t
+

rest in , 0
1 ,
0 , 1
2
2 2
k
k
k

i funcia autocorelaie ( )

'

t
+

rest in , 0
1 ,
1
0 , 1
2
k
k
k

Evident
( )
2
1
1
. Procesul MA(1) este cel mai simplu exemplu de filtru liniar.
4. Mersul aleator (random walk)
Se consider
{ }
t
X
un proces discret pur aleator (adic
t
Z i variabilele aleatoare
t
X
sunt independente i identic repartizate) cu media m i dispersia
2
X
. Procesul
{ }
t
Z
unde
t t t
X Z Z +
1
se numete mers aleator. n mod obinuit procesul este
pornit de la zero cnd 0 t , astfel c
1 1
X Z i

t
i
i t
X Z
1
. Avem :
( ) ( ) m t m X E Z E
t
i
t
i
i t


1 1
i
( ) ( )
2
1
2
1
X
t
i
X
t
i
i t
t X Var Z Var



Observaie : Cum media i dispersia depind de t, mersul aleator este nestaionar.
Totui, este interesant c diferenele de ordinul nti ale mersului aleator dau un
5
proces pur aleator care este staionar, deci
{ }
t
X
unde
1

t t t
Z Z X
este staionar.
Cele mai cunoscute exemple de serii de timp care se comport foarte mult ca mersul
aleator (la ntmplare) sunt preurile aciunilor (share prices). n acest caz un model
care corespunde datelor este : Preul aciunii n ziua t = preul aciunii n ziua (t-1) +
o eroare aleatoare.
5. Procese medie mobil
Se consider
{ }
t
Z
un zgomot alb (sau, mai restrictiv, un proces pur aleator, pentru
c n locul necorelrii se consider independena) cu media zero i dispersia
2
Z
.
Procesul
{ }
t
X
, unde
( ) 1 . 5
1 1 0 q t q t t t
Z Z Z X

+ + +
,
i q
, 0 , 0
0

-urile sunt constante, se numete proces medie mobil de ordin q
(abreviat MA(q)).n mod uzual Z-urile sunt scalate, astfel c
1
0

. Plasndu-ne n
ipoteza mai restrictiv (
t
Z
-urile independente), obinem :
( ) 0
t
X E
i
( )


q
i
i Z t
X Var
0
2 2
. Avem :
( ) ( )
+k t t
X X Cov k ,

( ) + + + + + +
+ + + q k t q k t k t q t q t t
Z Z Z Z Z Z Cov
1 1 0 1 1 0
,

'

<


>

+
q k
q k
q k
q k
k q
i
k i i Z
k q
i
k i i Z
, 0
, , 2 , 1 ,
, , 1 , 0 ,
, 0
0
2
0
2



Cum
( ) k
nu depinde de t i media este constant, rezult c procesul
{ }
t
X
este slab
staionar (altfel zis, staionar de ordinul doi) pentru toate valorile lui
{ }
i

. Mai mult,
cnd t
Z
-urile sunt repartizate normal, atunci i t
X
-urile sunt repartizate normal.
Deci, procesul este complet determinat de medie i funcia autocovarian. Funcia de
autocorelaie a procesului MA(q) este
( )

'

t t t

,
_

,
_

> <

+
q k
q k q k
k
k
q
i
i
k q
i
k i i
, , 2 , 1
sau , 0
0 , 1
0
2
0

6
n particular, procesul MA(1) cu
1
0

are funcia autocorelaie ( )

'

t
+

rest in 0
1 ,
1
0 pentru 1
2
1
1
k
k
k

S menionm c funcia autocorelaie taie (ntrerupe) la lag-ul q, ceea ce constituie o


trstur a proceselor MA. Privitor la condiiile ca un MA proces s fie staionar vom
face urmtoarele consideraii. Fie urmtoarele procese MA de ordinul nti :
1). 1
+
t t t
Z Z X
2).
1
1

+
t t
Z X

Primul proces are funcia autocorelaie ( )

'

t
+

rest in , 0
1 ,
1
0 , 1
2
1
k
k
k

Al doilea proces are funcia autocorelaie ( )

'

t
+

,
_

rest in 0
1 ,
1
1
1
1
0 , 1
2 2
2
k
k
k

Aadar, avem
2 1
. Astfel se vede c un MA proces nu poate fi identificat dup
funcia autocorelaie.
Punnd n cele dou modele t
Z
n termeni de
, ,
1 t t
X X
, prin substituiri
succesive obinem : A).
( )
2 1 1 t t t t t t
Z X X Z X Z

+ +
3
3
2
2
1 t t t t
X X X X
B).
+
,
_


2
2
1 2 1 1
1 1 1 1 1
t t t t t t t t t
X X X Z X X Z X Z


Dac
1 <
, atunci seria de la A este convergent iar seria de la B este divergent.
Astfel, o procedur de estimare care implic estimarea reziduurilor, duce n mod
natural la modelul A, care se zice c este invertibil (n acest caz modelul B nu este
invertibil). Condiia de invertibilitate ne asigur unicitatea procesului MA pentru o
funcie autocorelaie dat. Aceast condiie pentru un proces MA de ordin general este
exprimat cel mai bine folosind operatorul de schimbare (mutare, dare) napoi, notat
cu B, care este definit prin
j X X B
j t t
j

. Astfel, ecuaia (5.1) se va scrie
7
( ) ( )
t t
q
q t
Z B Z B B B X + + + +
2
2 1 0
, unde
( ) B
este un polinom de
ordin q n B. Un MA proces de ordin q este invertibil dac toate rdcinile ecuaiei
( ) ( ) 2 . 5 0
2
2 1 0
+ + + +
q
q
B B B B
se afl n afara cercului unitate. De notat c n ecuaia (5.2) B este vzut ca o variabil
complex i nu ca un operator. De asemenea, se poate aduga n (5.1) o constant
arbitrar m n membrul drept, ceea ce d un proces de medie m. Cum aceasta nu
schimb funcia autocorelaie pentru simplificare va fi omis.
Privitor la formalizarea matematic, se numete proces medie mobil finit procesul
stocastic
{ t X
t
;
Z}, unde


M Z X
M
M j
j t j t
,
N,
j
R,
0 , 0
M M
i
t
Z
-urile sunt variabile aleatoare necorelate ( )
2
, 0 , adic
( ) 0
t
Z E
i ( )
2

t
Z Var (mai restrictiv, sunt considerate independente). Procesul
medie mobil infinit
{ }
t
X
este dat de reprezentarea


j
j t j t
Z X
, unde nu
exist un numr natural M astfel nct j
j
, 0 Z cu
. M j >
Procesul definit
de
,
0


q
j
j t j t
Z X
unde
0
0

i
0
q

se numete proces medie mobil cu o


latur de ordin q (mai precis este un proces medie mobil stnga de ordin q, pe scurt
proces medie mobil de ordin q). Aceasta pentru c punnd q t t
Z
+

i q i i


avem

+
+


q
i
i t i
q
i
q i t q i
q j i
q
q j
j t j t
Z Z X
2
0
2
0

, deci nu se pierde din
generalitate dac se consider numai reprezentarea cu o latur.
Un proces medie mobil de ordin infinit cu media nenul

, dat de


0 i
i t i t
Z X
este numit proces liniar general (aceasta pentru c procesele de
acest tip se obin trecnd un proces pur aleator printr-un sistem liniar.
Cteva cuvinte despre sistemele liniare. S considerm c sunt date observaii
(nregistrri) asupra intrrilor (inputurilor) i ieirilor (outputurilor) unui sistem,
notate n cazul n care timpul este discret cu
{ } { }
t t
y x ,
i cu ( ) { } ( ) { } t y t x , n cazul
timpului continuu.
Definiie. Fie ( ) ( ) t y t y
2 1
, ieirile corespunztoare intrrilor ( ) ( ). ,
2 1
t x t x Sistemul
se numete sistem liniar dac i numai dac orice combinaie liniar de intrri (s
zicem ( ) ( ) t x t x
2 2 1 1
+ ) produce aceeai combinaie liniar de ieiri, adic
( ) ( ) t y t y
2 2 1 1
+ ,
2 1
, fiind constante.
Definiie. Dac intrarea
( ) t x
produce ieirea
( ) t y
, atunci sistemul se zice c este
invariant n timp dac o ntrziere de timp

la intrare produce aceeai ntrziere la


ieire, adic
( ) t x
produce ieirea
( ) t y
, altfel zis relaia intrare-ieire nu se
schimb cu timpul.
a) Sisteme liniare n timp
8
Un sistem liniar invariant n timp se poate scrie sub forma


k
k t k t
x h y
pentru
cazul timpului discret, sau sub forma
( ) ( ) ( )


du u t x u h t y
pentru cazul timpului
continuu. Funcia de ponderare
( ) u h
(pentru timpul continuu) sau
{ }
k
h
(pentru
timpul discret) arat o caracterizare (descriere) a sistemului n timp i este cunoscut
sub numele de FIR (Funcia Impuls Rspuns). Un exemplu foarte simplu de sistem
liniar este dat de ntrzierea simpl, adic d t t
x y

unde ntregul d arat timpul de


ntrziere. Funcia sa FIR este :

'

rest in 0
pentru 1 d k
h
k
Alt exemplu de sistem liniar este ctigul pur, adic t t
x c y
unde constanta c
reprezint ctigul. FIR ul acestui sistem este :

'

rest in 0
0 pentru k c
h
k
b). Sisteme liniare n frecven
O alt cale de descriere a unui sistem liniar este prin intermediul unei funcii
denumit funcia de transfer (FRF Funcia Rspuns Frecven). Aceasta este
transformata Fourier a funciei FIR, adic este
( ) ( ) 0 , >





du e u h H
u i
n
cazul timpului continuu i este
( )



k
k i
k
e h H

, < < 0 .
ntrun sistem liniar o intrare exponenial complex ( ) t i t e t x
t i

sin cos +

d
o ieire
( ) ( ) ( ) t x H t y
. Pentru sistemul liniar ntrzierea simpl,
( ) ( ) t x t y

unde

este o constant, funcia FIR este


( ) ( ) u u h
unde este funcia delta
Dirac, adic
( )

'

0
0 , 0
t
t
t
, astfel nct
( ) 1


dt t
(altfel zis, pentru orice funcie
( ) t
care este continu n 0 t , funcia delta Dirac este funcia care verific
( ) ( ) ( ) 0


dt t t
. Funcia de transfer este dat de
( ) ( )


i u i
e du e u H
.
6. Procese autoregresive
Dac
{ }
t
Z
este un proces pur aleator cu media 0 i dispersia
2
Z
, atunci un proces
{ }
t
X
se zice c este proces autoregresiv de ordin p dac
9
) 1 . 6 (
2 2 1 1 t p t p t t t
Z X X X X + + + +


Acest model seamn cu modelul regresiei multiple, dar diferena const n faptul c
t
X
nu este regresat peste variabile independente ci peste valorile din trecut. Se
utilizeaz abrevierea AR(p) proces.
Procese de ordinul nti :
1 p
i
) 2 . 6 (
1 t t t
Z X X +

Prin substituii succesive obinem :


( ) + + + + + +
2
2
1 1 2 1 t t t t t t t t t
Z Z Z Z Z X Z X X
pentru 1 1 < < . Deci
{ }
t
X
poate fi exprimat ca un proces medie mobil de ordin
infinit. Utiliznd operatorul de mutare napoi (ntoarcere) B, ecuaia (6.2) se scrie
( )
t t
Z X B 1
, astfel c ( ) ( ) + + +

t t t
Z B B Z B X
2 2 1
1 1
+ + +
2
2
1 t t t
Z Z Z
Rezult :
( ) 0
t
X E
i ( ) ( ) + + +
4 2 2
1
Z t
X Var
Astfel, dispersia este finit dac
1 <
, caz n care avem : ( )
2
2
2
1
X
Z
t
X Var


Funcia autocovarian este :
( ) ( )
1
1
]
1

,
_


,
_


+ +
j
j k t
j
i
i t
i
k t t
Z Z E X X E k

+

0
2
i
i k i
Z

pt. 0 k Aceasta converge n cazul
1 <
la
( )
2
2
2
1
X
k Z k
k


Pentru 0 < k gsim
( ) ( ) k k
.
Deoarece
( ) k
nu depinde de t, un proces AR(1) este slab staionar dac
1 <
.
Funcia autocorelaie este :
( )
( )
( )
, 2 , 1 , 0 ,
0
2
2

k
k
k
k
X
X
k

Pentru toi ntregii k avem ( ) , 2 , 1 , 0 , t t k k


k

Mai simplu, funcia autocorelaie poate fi gsit presupunnd apriori c procesul este
staionar, n care caz
( ) 0
t
X E
. nmulind ecuaia (6.2) cu
k t
X

i lund media
obinem : pentru
( ) ( ) 1 : 0 + > k k k
presupunnd c
( ) 0
k t t
Z Z E

Deoarece
( ) k
este o funcie par, trebuie s avem
( ) ( ) 1 k k
pentru . 0 > k
Cum
7. Procese mixate ARMA(p,q)
Sunt procese
{ }
t
X
autoregresive de ordin p cu reziduuri medie mobil de ordin q
care verific relaia q t q t t p t p t t
Z Z Z X X X

+ + + + + +
1 1 1 1 , unde
t
Z
-urile sunt reziduuri medie mobil de ordin q.
8. Procese nestaionare autoregresive i de medie mobil ARIMA(p,n,q)
Sunt procese nestaionare care n forma original prezint tendin i prin diferene
de ordin n pot fi aduse la forma staionar, p fiind ordinul prii autoregresive i q
ordinul prii medie mobil a modelului.
Pentru ARIMA(1,1,2) ecuaia este :
2 2 1 1 1 1 0
+ + + + +
t t t t t
Z Z Z y y y
9. Modelul ARFIMA (Autoregressive Fractionally Integrated Movie Average)
Este o variant a modelului ARIMA(p,d,q) n care d este ordinul diferenei i este o
10
fraciune din 1 (0<d<1). Folosind operatorul de difereniere napoi (trimitere n trecut)
B avem : ( ) ( ) 1 0 , , 0 ~ , 1
2
< < d N z z y B
z t t t
d
, unde
( )
( ) ( ) ( )
+



+
3 2
! 3
2 1
! 2
1
1 1 B
d d d
B
d d
B d B
d
Astfel, forma general a lui ARFIMA este ( ) ( ) ( )
t t
d
z B y B B 1 , unde
B , ,

au semnificaiile :
( )
t t
z y B
(modelul AR(p), adic
t p t p t t
z y y y + + + +


1 1 0 )
( )
t t
z B y
(modelul MA(q), adic q t q t t t
z z z y y

+ + + +
1 1 )
10. Seria integrat
Seria integrat este seria de timp nestaionar care prin diferenele de ordinul nti
sau doi (adic
1
2
1
,


t t t t t t
y y y y y y ) poate fi transformat n serie
staionar.
11. Serii cointegrate
Sunt seriile cronologice care fiind integrate de acelai ordin admit o combinaie
liniar care este staionar (integrat de ordin zero) sau este integrat de ordin mai
mic dect ordinul de integrare a seriilor iniiale.
Exemplu. Seriile
{ } { }
t t
y x ,
au acelai ordin de integrare i exist
{ }
t
z
, unde
( )
t t t
x b a y z +
care este staionar.
12. Procese ARCH (Autoregressive Conditional Heteroskedasticity)
Prind mprtierile inegale (eteroschedasticitate) ale valorilor reziduale n timp
(adic o dependen sub forma autocorelaiei i pentru variabilele reziduale). F.R.
Engle a propus ca dispersia erorii s fie dependent de valorile
1 t
y
sau
.
1 t
z

Astfel avem :
2
1 1 0
2

+
t
t
z
y
sau varianta
2 2
1 1 0
2
p t p t
t
z
z z

+ + +
.
Spre deosebire de modelul AR n care eroarea t
z
este considerat aleatoare,
repartizat normal i cu dispersia constant, iar
( )
1 1

t t t
y a y y E
(media
condiionat este dependent de timp), n versiunea lui Engle dispersia erorii este
dependent de timp (de aici iniialele CH adugate lui AR). O variant simpl a
modelului este :
t t t t
z x b y a y + +
1
, unde ( )
2
1 1 0
2 2
, , 0 ~

+
t
t
z
t
z t
z N z
O limitare important a modelelor ARMA este dat de faptul c trateaz prea rigid
variana condiionat a lui k t
X
+ . Clasa proceselor ARMA cu heteroscedasticitate
condiional autoregresiv sau ARMA-ARCH procese permite varianei condiionate a lui
t
X
s depind de istoria procesului. O serie de timp cu media zero,
{ }
t
X
, este un
proces pur ARCH(1) dac
{ } ( ) 1 , 0 ~ , IID Y Y X
t t t t

, (se scrie
{ }
t
X
~ARCH(1)), unde
t

(volatilitatea stocastic) este un element al procesului stocastic care verific relaia


2
1
2 2

+
t t
X , cu 0 i 0 > . Deoarece
( )
2
1
2 2
1
2

+
t t t t
X S X E
, un
proces ARCH(1) pentru
t
X
corespunde unui proces AR(1) pentru .
2
t
X Dac 1 0 < ,
atunci procesul ARCH(1) este staionar i variana sa necondiionat este

1
2
2
.
Diferena dintre variana condiionat i necondiionat este ( )
2
2
1
2
2

t t
X .
Avem ( ) ( ) ( ) ( )
2
2
1
2
2
2
1
2
1

+ t t t t t
S X E S X E
11
Repetnd aceast formula obinem ( ) ( ) , 2 , 1 ,
2
2
1
1
2
1
2


+
+
k X S X E
t
k
t k t

Astfel, ( )
2
1
2

+ k t k t
S X E .
O generalizare simpl a procesului pur
( ) 1 ARCH
este procesul pur
( ) m ARCH
, unde
2 2
1 1
2 2
m t m t t
X X

+ + + cu
, 1 , 1 , 0 m j
j

i
, 0 >
m

care corespunde unui


proces
( ) m AR
pentru .
2
t
X
Definiie. O serie de timp
{ }
t
X
este numit proces
( ) ( ) m ARCH q p ARMA ,
dac
satisface relaia
( ) ( ) ,
t t
Y B X B

{ } ( ) m ARCH Y
t
~
unde
( ) B
i
( ) B
sunt
polinoame n lag- operatorul de ordin p i, respectiv q.
Mai general este un proces avnd heteroscedasticitate generalizat condiional
autoregresiv (GARCH) de ordin
( ) m r,
, generalizarea lui Bollerslev, unde
2 2
1 1
2 2
1 1
2 2
m t m t r t r t t
X X

+ + + + + + , cu
1 , 1 , 0 , 1 , 1 , 0 , 0 , > m j r i
j i m r

. Avem
( ) ( ) m GARCH m ARCH , 0
.
Notnd
2 2
t t t
X V , atunci un proces GARCH
( ) m r,
poate fi scris
r t r t p t p t t
V V X X X

+ + +
1 1
2 2
1 1
2
unde
( ) 0 , , , max +
j j j j
r m p
for
m j >
i
0
j

pentru
. r j >
Deci un proces
( ) m r GARCH ,
pentru
t
X
corespunde unui proces
( ) r p ARMA ,
pentru .
2
t
X
Definiie. O serie de timp
{ }
t
X
este numit proces
( ) ( ) m r GARCH q p ARMA , ,
dac
satisface relaia
( ) ( ) ,
t t
Y B X B

{ } ( ) m r GARCH Y
t
, ~
.
Pentru exemplificarea noiunilor legate de modelele autoregresive, am fcut inferen
statistic pentru determinarea coeficienilor prin metoda celor mai mici ptrate pe datele
din rapoartele anuale ale Comisiei de Supraveghere a Asigurrilor i apoi am efectuat
prediciile ( )
2 1 1
~
,


+ + +
t t t t t
X X X X X , valorilor de interes n dou
cazuri : nti predicia pas cu pas (adic datele din anul anterior sau din anii anteriori sunt
cele raportate de CSA), apoi predicia pe termen lung (caz n care, n predicie, se
folosesc prediciile anterioare i nu datele raportate, deci ar fi cazul elaborrii unor
prognoze pe termen lung).
Tabel. 1. Valoarea total a primelor de asigurare brute ncasate din asigurri directe :
An Prime totale ncasate
(lei noi)
Prime ncasate n
asigurrile de via
Prime ncasate
asig. generale
1997 130402200 8073900 122328300
1998 241484000 19944700 221539300
1999 427393000 50569000 376824000
2000 673887300 106658600 567228700
2001 1001242500 211473300 789769200
2002 1645965600 414514000 1231451600
2003 2422508810.2 579003012 1843505798.2
2004 3216393971.5 693443836.2 2522950135.3
Sursa : Rapoartele Anuale ale CSA
Tabelul 2. Predicii pentru primele brute ncasate din asigurrile directe
Anul Prime brute
ncasate
*
(X
t
)
Predicii pas cu pas

t
X

Predicii pe termen
lung
t
X

12
1997 130,402,200 --- ---
1998 241,484,000 311,729,066.9 311,729,066.9
1999 427,393,000 458,654,611.1 551,566,273.3
2000 673,887,300 704,552,507.8 868,793,866.4
2001 1,001,242,500 1,030,585,298 1,288,384,085
2002 1,645,965,600 1,463,571,087 1,843,367,180
2003 2,422,508,810.2 2,316,332,676 2,577,431,565
2004 3,216,393,971.5 3,343,449,933 3,548,362,980
2005 4,384,987,227
**
4,393,505,021 4,832,593,399
*
Sursa : Rapoartele Anuale ale CSA,
**
Prime brute subscrise.
Eroarea relativ pentru prediciile din 2005 este de 0.2% n cazul pas cu pas i de 2.7% pe
termen lung. Pentru predicia ndemnizaiilor brute pltite de asigurtori pentru
asigurrile directe generale i de via, att cumulate ct i separate, am folosit dou
modele lineare.
Tabelul 2. Situaia pe date deflatate
Anul
Prime brute ncasate
deflatate (X
t
)
Predicii

t
X

Predicii

t
X
~
1997 130,402,200 --- ---
1998 171,752,489.3 157,729,471.75 ---
1999 196,368,185.8 210,083,500.22 203,946,382.41
2000 220,057,866.1 241,249,687.82 236,706,333.31
2001 250,925,319.5 271,243,436.77 267,667,960.66
2002 350,171,401 310,325,038.33 307,698,100.38
2003 451,689,130.8 435,981,527.41 434,715,398.98
2004 548,685,334.6 564,514,173.86 567,163,062.07
2005 688,799,178.4 687,322,069.45 693,961,104.10
Eroarea relativ pentru predicia din 2005 este de 0,2% la modelul de ordinul nti i de
0,75% la modelul de ordin doi, iar eroarea relativ total a prediciilor este de 2% la
ambele modele. Predicia pentru 2006 este de 875,273,474.23 pentru date deflatate
(5,990,015,464 lei).
Tabelul 3. Predicii pentru ndemnizaiile (despgubirile) brute pltite
Anul ndemnizaii
*
(X
t
)
Predicii pas cu pas

t
X

Predicii pas cu pas



t
X
~
1997 69,925,100 --- ---
1998 102,212,700 114,022,130.901 ----
1999 189,589,900 161,229,924.099 193,403,696.19
2000 248,978,900 288,984,380.539 273,600,712.37
2001 406,293,900 375,817,208.937 420,965,932.04
2002 649,832,600 605,827,924.718 567,138,913.81
2003 842,267,901 961,906,561.258 886,204,782.46
2004 1,311,879,000 1,243,266,770.548 1,307,528,164.13
2005 1,758,745,510 1.929,886,514.498 1,765,377,520.80
*
Sursa : Rapoartele Anuale ale CSA.
Eroarea relativ a predicie
t
X

pentru anul 2005 este de 9.7%. Definind eroarea relativ


13
total (ERT) a prediciilor
t
X

ca
( )

t
t
t
t t
X
X X
ERT
2

, rezult c ERT este egal cu


4.2%. Eroarea relativ a prediciei
t
X
~
pentru anul 2005 este egal cu 1.8%.
Folosind modelul autoregresiv linear de ordinul nti pentru primele brute ncasate n
contractele directe de asigurri generale (non-life) am obinut
1
31273 . 1 55 . 103034505

+
t t
X X
cu care am fcut prediciile din tabelul 4.
Tabelul 4. Predicii pentru primele brute ncasate din asigurrile generale directe
Anul Prime brute
ncasate
*
(X
t
)
Predicii pas cu pas

t
X

Predicii pe date
deflatate
1997 122,328,300 --- ----
1998 221,539,300 263,618,589.2 141,284,469.84
1999 376,824,000 393,855,889.4 186,451,070.54
2000 567,228,700 597,702,842.7 206,403,634.37
2001 789,769,200 847,652,889.3 221,905,572.13
2002 1,231,451,600 1,139,788,578.9 238,181,828.83
2003 1,843,505,798.2 1,719,598,512.4 320,287,350.82
2004 2,522,950,135.3 2,523,060,692.3 425,063,112.95
2005 3,346,997,220
**
3,414,987,959.3 536,137,273.30
***
*
Sursa : Rapoartele Anuale ale CSA,
**
Prime brute subscrise,
***
3,413,121,224.82 lei.
Eroarea relativ pentru predicia din anul 2005 este de 2,03%, iar eroarea relativ total a
prediciilor este de 1,709%. Predicia pentru volumul primelor brute ncasate din
asigurrile generale directe n 2006 este de 4,496,739,655.42 lei. n cazul datelor
deflatate, eroarea relativ a prediciei pentru 2005 este de 1,975%, iar eroarea relativ
total a prediciilor este de 2,291%.
n cazul asigurrilor de via modelul obinut este 1
193007 . 1 34 . 59577744

+
t t
X X
,
iar pentru date deflatate este
1
07045 . 1 13244 . 12430011


+
t t
X X
.
Tabelul 5. Predicii pentru primele brute ncasate din asigurrile de via directe
Anul Prime brute
ncasate
*
(X
t
)
Predicii pas cu pas

t
X

Predicii pe date
deflatate
1997 8,073,900 --- ----
1998 19,944,700 69,209,965.58 21,072,716.00
1999 50,569,000 83,371,916.04 27,614,791.13
2000 106,658,600 119,906,927.96 37,301,077.42
2001 211,473,300 186,822,227.40 49,713,089.73
2002 414,514,000 311,866,924.39 69,161,879.41
2003 579,003,012 554,095,951.49 106,828,585.53
2004 693,443,836.2 750,332,535.32 127,993,713.31
2005 1,037,990,007
**
886,861,268.27 139,058,586.40
***
*
Sursa : Rapoartele Anuale ale CSA,
**
Prime brute subscrise,
***
885,265,455.84 lei.
Eroarea relativ total a prediciilor este de 6,54%, eroarea prediciei pentru 2005 este de
14,5% (mare, deci modelul linear de ordinul 1 nu e recomandabil pentru prognoze aici),
iar predicia pentru 2006 este de 1,297,907,347.92 lei. n cazul datelor deflatate eroarea
14
relativ a prediciei pe 2005 este de 14,7%, iar eroarea relativ total a prediciilor este de
5,54%.
Folosind modelul autoregresiv linear de ordinul doi pentru primele brute ncasate n
contractele directe de asigurri generale (non-life) am obinut
2 1
346886 . 0 124101 . 1 32 . 88208606

+ +
t t t
X X X
cu care am fcut prediciile din
tabelul 6.
Tabelul 6. Predicii pentru primele brute ncasate din asigurrile generale directe

Anu
l
Prime brute
ncasate
*
(X
t
)
Predicii

t
X
~
199
7
122,328,300 ---
199
8
221,539,300 ---
199
9
376,824,000 379,675,001.99
200
0
567,228,700 588,645,501.15
200
1
789,769,200 856,545,575.45
200
2
1,231,451,600 1,172,752,146.19
200
3
1,843,505,798.2 1,746,443,710.78
200
4
2,522,950,135.3 2,587,667,497.91
200
5
3,346,997,220
**
3,563,744,112.26
Sursa : Rapoartele Anuale ale CSA,
**
Prime brute subscrise.
Eroarea relativ pentru predicia din anul 2005 este de 6,4%, iar eroarea relativ total a
prediciilor este de 2,45%. Predicia pentru volumul primelor brute ncasate n asigurrile
generale directe este de 4,725,745,436.68 RON.
Folosind modelul autoregresiv linear de ordinul doi pentru ndemnizaiile brute i valorile
de rscumprare pltite n contractele directe de asigurri de via am obinut
2 1
010592 . 0 371383 . 0 816 . 144 , 593 , 41

+ +
t t t
X X X
cu care am fcut prediciile
din tabelul 7.
Tabelul 7. Predicii pentru ndemnizaiile brute i rscumprrile pltite
n asigurrile de via directe

Anu
l
ndemnizaii brute
pltite
*
(X
t
)
Predicii

t
X
~

199
7
1,858,700 ---
199
8
4,082,800 ---
199 12,053,200 43,129,113.47
15
9
200
0
8,343,700 46,112,740.37
200
1
57,633,200 44,819,515.05
200
2
142,947,200 63,085,501.75
200
3
62,499,098 95,291,716.14
200
4
75,280,471 66,318,282.14
200
5
97,385,521 70,212,989.45
*
Sursa : Rapoartele Anuale ale CSA
Eroarea relativ pentru predicia din anul 2005 este de 27,9% (mare !), iar eroarea
relativ total a prediciilor este de 22,81%. Predicia pentru volumul ndemnizaiilor
brute pltite n asigurrile de via directe este de 78,557,801.97 RON. Evident, erorile
mari arat neadecvarea modelului pentru prognoze. Aceast evoluie prea sinuoas a
acestor sume se explic n parte i prin influena schimbrilor din legislaie, care au
rencadrat anumite produse la alt categorie de asigurri, i prin faptul c evoluia
asigurrilor de via a nregistrat explozii i prbuiri.

II. REGRESII
(note de curs)
Termenul a fost introdus de Francis Galton (1822-1911) ntr-o lucrare din 1886 n care a
studiat legtura dintre nlimea tailor i nlimea fiilor. El a observat c din prini cu
nlime mai mare dect media grupului considerat se nasc copii cu nlime mai mic
dect a prinilor, iar din prini cu nlime mai mic dect media grupului se nasc copii
cu nlime mai mare dect a prinilor. Prin urmare exist o regresie (ntoarcere) ctre
valoarea medie. n general, este vorba de modelarea relaiei de dependen a unei
variabile de una sau mai multe variabile independente, analog n cazul dependenei unui
fenomen de unul sau mai muli factori. La stabilirea ecuaiei de regresie care s
aproximeze cel mai bine forma real a dependenei cercetate, concur o serie de procedee
statistice. Cel mai simplu este reprezentarea grafic a distribuiilor statistice corelate
(corelograma), graficul sugereaz uneori forma legturii. Alte cerine pentru un calcul
statistic corect sunt reprezentate de omogenitatea datelor i de numrul mare de
observaii. n calcule se opereaz cu mrimi medii, iar media va reflecta mai bine
proprietile tipice ale populaiei cu ct aceasta este mai omogen. Caracterul omogen sau
neomogen al populaiei reprezentate prin datele statistice se sesizeaz prin examinarea
diagramei de dispersie a unitilor de observare n raport cu valorile variabilelor corelate.
Tendina punctelor de a se strnge n dou sau mai multe grupuri ori situarea unor puncte
cu mult n afara norilor de puncte evideniaz eterogenitatea populaiei. n primul caz,
soluia este de a dezmembra distribuiile statistice conform grupelor conturate, urmnd s
se rezolve modelul pentru fiecare grup obinut. n al doilea caz, soluia este dat de
eliminarea din calcule a observaiilor aberante fa de masa observaiilor.
16
Notnd cu y variabila dependent de p variabile independente p
x x x , , ,
2 1

, legtura
stocastic poate fi redat printr-o relaie de forma
( ) +
p
x x x f y , , ,
2 1

, unde

este
o variabil aleatoare ce reprezint erorile de observaie sau de msurare, iar f este o
funcie determinist denumit funcia de regresie. Se consider
( ) 0 M
(operatorul M
desemneaz media, la fel ca i operatorul E, aici vom folosi pentru medie doar M).
Vom considera funcia de regresie liniar
( )
p p p
x x x x x x f + + +
2 2 1 1 2 1
, , ,

Se dispune de n seturi de observaii :
n i x y
i
p
j
j ij i
, 1 ,
1
+


, unde
( ) , 0
i
M

( ) n i D
i
, 1 ,
2 2
i
( ) 0 ,
j i
Cov
pentru orice
j i
. Notnd cu x matricea
observaiilor asupra variabilelor independente, cu

coeficientul de regresie, cu y
vectorul observaiilor asupra variabilei rspuns (dependente) i cu

vectorul
reziduurilor (abaterilor, erorilor), relaiile se scriu matriceal sub forma :
+ x y
Estimaia coeficientului de regresie se obine prin metoda celor mai mici ptrate, adic

este dat de soluia problemei :


( ) ( )

x y x y
t t
n
i
i
min min min
1
2
Reamintim regulile de derivare pentru vectorul gradient :
( ) ( )

t t
,

i
( )

P P
t
2
Se obine sistemul ecuaiilor normale : y x x x
t t
, unde
t
x este transpusa matricei
x. n cazul rangului complet, adic
n p x rang
, atunci ( ) p x x rang
t
i exist
inversa ( )
1
x x
t
. Deci, soluia unic a sistemului de ecuaii normale este :
( ) y x x x
t t

1

n cazul n care variabilele de selecie sunt corelate, adic avem ( ) W y y Cov


2
, unde
2
este o constant necunoscut i W este o matrice nesingular cunoscut. Avem astfel
modelul : ( ) ( ) , , , ,
2
W y y Cov x y M x y + unde 0 det W i
p x rang
. n acest caz, estimaia vectorului coeficienilor de regresie se obine prin
metoda celor mai mici ptrate generalizate, adic rezolvnd problema :
( ) ( )



x y W x y W
t t 1 1
min min
Anulnd gradientul obinem : ( ) y W x x W x
t t

1
1
1

Observaii. 1). Estimaia

este nedeplasat, adic ( )

M
ntr-adevr, avem ( ) ( ) ( ) ( )

x W x x W x y M W x x W x M
t t t t 1
1
1 1
1
1

2). Estimaia

are matricea covarianelor : ( ) ( )


1
1 2

x W x Cov
t

ntr-adevr, avem : ( )

y W x x W x
t t 1
1
1


( ) ( ) ( ) + +

1
1
1 1
1
1
W x x W x x W x x W x
t t t t
,
( ) ( ) ( ) ( ) ( ) [ ]
1
]
1

1
1 1 1
1
1

,

x W x x W W x x W x M M Cov
t t t t
t


( ) ( ) ( )

1
1 1 1
1
1
x W x x W M W x x W x
t t t t

( ) ( ) ( )
1
1 2
1
1 1 2 1
1
1

x W x x W x x W W W x x W x
t t t t

Presupunnd c vectorul erorilor are o repartiie normal cu media 0 i matricea de
covarian W V
2
, atunci funcia de verosimilitate a seleciei este :
17
( ) ( )
( ) ( )





x y V
t
x y
n n
n
e V y y y L
1
2
1
2 2
2 1
2 , , , ,
, unde
V
este determinantul
matricei V. Cutm estimaia de verosimilitate maxim, notat cu

~
. Avem ecuaia de
verosimilitate maxim :
( )
0
, , , , ln
2 1

n
y y y L
Maximizarea funciei de verosimilitate nseamn minimizarea expresiei
( ) ( ) ( )

x y V x y T
t 1
Aadar, estimaia de verosimilitate maxim coincide cu estimaia dat de metoda celor
mai mici ptrate generalizate. Estimaia valorii medii a observaiilor este
( )

x y M

Componentele vectorului
( )

y M
se numesc valori ajustate ale lui y sau valori estimate
ale lui y.
n cazul n care matricea covarianelor vectorului erorilor este de forma I
2
(aa
numitul caz al msurtorilor de precizii egale), statistica
( ) ( )

1
2

x y x y
p n
t

este o estimaie nedeplasat pentru
2
. ntr-adevr, avem : ( )

t t
x x x x x y
1

,
notnd ( ) L I K x x x x L
t t


,
1
rezult
( ) ( )

, , , ,

2 2
x y x y K K L L K L I L I K K x y
t
t t

( )


+
j i
j i ij
n
i
i ii
t t t
k k K K K K
1
2 2
Cum ( ) ( ) ( ) ( ) ( ) p I Tr x x x x Tr x x x x Tr TrL
p p
t t t t


1 1
i
p n TrL TrI TrK
n n

(TrL este urma matricei L, adic suma elementelor de pe
diagonala principal a matricei), rezult
( ) ( )
2 2
1
2 2
1
1 1

,
_

,
_

,
_

n
i
k
p n
j i
M k M k
p n
M
ii j i ij
n
i
i ii
Estimaia ridge a parametrului de regresie

Considerm modelul liniar de regresie :


+ x y
, unde
n
y R , , ,
p
R
( ) ( )
n
I Cov N
2
, , , 0 ~ ,
( ) , R
p n
M x

n p x rang
Am vzut c estimaia celor mai mici ptrate este ( ) y x x x
t t

1

.
S-a constatat c atunci cnd valorile proprii ale matricei x x
t
sunt apropiate de zero,
distana medie dintre vectorul coeficienilor de regresie

i estimaia

crete foarte
mult i prin urmare

nu mai estimeaz bine pe

. n aceast situaie se caut o


estimaie

care s scurteze aceast distan, aceast estimaie este denumit estimaia


ridge. Fie p
< < <
2 1 valorile proprii ale matricei x x
t
(reamintim c este
valoare proprie a matricei A dac este soluie a ecuaiei
A I A unde , 0
este
determinantul matricei A), rezult c urma matricei ( )
1
x x
t
este
( ) ( )



p
i
t
i
x x Tr
1
1 1


Notnd cu L distana dintre

avem : ( ) ( )

2
t
L i
( ) ( ) ( ) ( ) [ ]


p
i i
t t
x x Tr K Tr K M L M
1
2
1
2 2 2
1


18
Se vede c apropierea de zero a unei valori proprii mrete distana ( ),
2
L M
( )

2
0
lim L M
p

n acest caz se introduce estimaia ridge


y x W
t

, unde ( ) 0 ,
1
+

k I k x x W
p
t
.
Ea este o transformare liniar a estimaiei celor mai mici ptrate. ntr-adevr, cum

x x y x
t t
avem :
( ) +

1
*
x x I k x x
t
p
t

( ) ( ) [ ]

1
1
+

Z I k x x x x
p
t t
,
unde ( ) ( )
1
1

+ x x k I Z
t
p
.
Valorile proprii ale matricelor W i Z sunt
( )
i
i
k
W

1
i
( )
i
i
i
k
Z

, unde
p i
i
, 1 ,
sunt valorile proprii ale matricei x x
t
.
ntr-adevr,
( ) W
i

verific ecuaia
0
p
I W
Cazul
1
este cazul degenerat (particular) p
I Z k , 0
, caz n care estimaia ridge
coincide cu

.
Avem :
( ) +

,
_

x x I k x x M
t
p
t
1
*
, deci estimaia ridge este deplasat pentru 0 > k
. De asemenea, avem :
( ) ( ) ( )

,
1 1
2 * *
Cov I k x x x x I k x x Cov
p
t t
p
t
+ +

,
_



Pierznd proprietatea de nedeplasare a estimaiei, se pune ntrebarea dac exist o metod
care s mbunteasc estimaiile prin reducerea deplasrii. O asemenea metod este
metoda jackknife, prin care se obin estimaiile cu acelai nume. Fie

estimaii
ale lui , atunci estimaia
1 ,
1
,
2 1
2 1

,
_


r
r
r
J


, este numit estimaie
jackknife. Ea are deplasarea redus fa de deplasrile estimaiilor din care provine. ntr-
adevr, considernd n volumul seleciei, parametrul estimat i
( ) 2 , 1 , , +
,
_

i n b M
i i

unde ( ) 0 ,
2
n b , pentru
( )
( )
1
,
,
2
1

n b
n b
r
avem

,
_

,
_


2 1
, J M
. Se verific pritr-un calcul simplu :
( )
( ) ( )
( )
( )
( )
(

+ +


,
_

,
_

,
_


,
_

,
_


,
,
,
, ,
,
1
1
,
2
1
1
1 2
2
2 1 2 1
n b
n b
n b
n b n b
n b
M r M
r
J M

( ) )] ,
2
n b
Parametrul r poate fi bine ales pentru clase ntregi de estimaii. Astfel, cnd

este o
estimaie deplasat a lui , bazat pe o selecie de volum n, astfel nct
( ) ( ) n f b M +
,
_


1 , iar

este estimaia obinut prin eliminarea unei observaii din


selecie, estimatorul, funcia de selecie se pstreaz, deci
( ) ( ) 1
2
+
,
_

n f b M

atunci din condiia

,
_

,
_


2 1
, J M
obinem
( )
( ) 1

n f
n f
r
.
Exerciiu :
19
1). Se dispune de datele lunare privind numrul polielor vndute ( t
Y
= numrul
polielor vndute n luna t),i cheltuielile pentru publicitate n mii u.m. ( t
X
) ale unei
societi de asigurri :
t
Y 250 220 300 330
t
X 20 25 32 43
a) S se scrie ecuaia de regresie a lui Y n raport cu X.
b) Folosind metoda mediilor mobile de perioad 3, s se extrag trendul seriei
{ }
t t
X
, s
se reprezinte grafic i considernd
0
0
X
, s se determine a i b din procesul
autoregresiv t t t
Z X b a X + +
1 care s minimizeze suma ptratelor erorilor, unde
( ) 1 , 0 ~ N Z
t
.

20

S-ar putea să vă placă și