Sunteți pe pagina 1din 38

ESTADlSTICA ESPAOLA

Vol. 36, Nm. 135, 1994, pgs. 21 a 58


Efectos de los distintos tipos
de out/iers en las predicciones
de los Modelos ARIMA*
por
F. JAVIER TRIVEZ
Universidad de zaragoza
RESUMEN
EI presente artculo estudia el grado de incidencia que en la
exactitud de las predicciones puntuales obtenidas a partir de los pro-
cesos ARIMA, rnedida por el error cuadrtico medio de prediccin,
tiene la ignorancia (no tratamiento) de observaciones atpicas (out-
liers) en la serie temporal objeto de anlisis. La conclusin que se
obtiene es que dicho grado de incidencia depende del tipo de out-
liers que aparezca, del perodo temporal (ms o menos cercano al
del origen de la prediccin) en que tengan lugar, del horizonte tem-
poral (perodos hacia adelante) para el que efectuemos la predic-
cin, de la magnitud del outlier y del tipo de proceso subyacente a la
serie temporal.
Palabras Clave: Outliers, Modelos ARIMA, Error cuadrtico rnedio
de prediccin.
Clasificacin AMS: 62M20.
* Este trabajo ha sido realizado dentro del Proyecto DGICYT PB90-0919. EI autor desea agra-
decer los tiles comentarios y sugerencias de dos evaluadores annimos.
1 l
INTR4DUCCION
^'.^ ^ r^^)^^ ^ ^^. ^^ ^ '.^f^^r^^().:1
La presencia de observaciones atpicas (outliers) causa importantes proble-
mas en la modelizacin univariante de las series temporales. De hecho, la pro-
pia identificacin del proceso generador de datos encuentra graves dificultades,
como consecuencia de las alteraciones que las observaciones atpicas produ-
cen en los instrumentos habitualmente utilizados a tal fin (correlograma muestral
y representacin grfica de la funcin de autocorreiacin parcial muestral). Ade-
ms, los outliers afectan a la estimacin de los parmetros del modelo; y, en
consecuencia, alteran los tamaas de los intervalos de prediccin, que estn di-
rectamente relacionados con el parmetro a (varianza del ruido blanco}. Todo
ello ha motivado que en los itimos aos se haya prodigado la investigacin re-
lativa a la forma de detectar y tratar adecudamente los outliers, cabiendo desta-
car en esta lnea de investigacin los trabajos de H+Ilmer, Bell y Tiao (1983),
Muirhead (1986), Tsay (1988), Chen, Liu y Hudak (1990), Chen y Tiao (1990),
Pea (1990), Balke (1993) y Chen y Liu (1993), entre otros (1).
Desde luego, por lo comentado, parece obvio que los outliers, o mejor la ig-
norancia de los mismos, van a afectar las predicciones puntuales que se obten-
gan a partir de los modelos estocsticos univariantes de series temporales es-
pecificados. Sin embargo, esta afectacin va a depender de distintas cuestio-
nes, tales como el tipo de outliers no detectadas, el efecto cuantitativo de ios
mismos, el perodo de acurrencia (ms o menos prximo al horizonte ternporal
desde e! que comenzamos a calcular las predicciones) y el proceso estocstico
generador de los datos.
EI objetivo de este trabajo consiste en analizar detalladamente todas estas
cuestiones, para lo cual se obviar en lo que sigue el problema de la identifica-
cin y la estimacin de los parmetros, partiendo de una situacin ideal que,
aunque poco realista, permite centrar adecuadamente las consecuencias mni-
mas que en la prediccin puntual se producen al ignorar la presencia de out-
liers; esto es, supondremos que conocemos tanto el perodo de ocurrencia de
los outliers como el tipo de los mismos, as como los verdaderos valores de los
parmetros de los modelos.
Un anlisis de este tipo ha sido efectuado por Ledolter (1989) para el caso
de los outliers aditivos; en este trabajo, sin embargo, se estudian los efectos de
otros tres tipos de outliers enunciados en la literatura.
Aunque ei objetivo central de este artculo consiste en analizar las conse-
cuencias mnimas que en las predicciones puntuales obtenidas a partir de los
modelos ARIMA produce el no tratamiento de los distintos tipos de outliers, para
(1) A nivel de libros de texto tambin pueden verse los de Mills (1990), We (1990} y Aznar y
Trvez (1993).
E-:hF^.('^lO^ I)E^: I.O^ 1)l^il lti'1OS 17F'O^ l)E: ^1('IL/f.'kti Eti I.,^^S F'kk-[)I(^t_ 1OtiF-S l.^f^ LOti !^1(al^E.l ( ^ ti ^ ^kE!^1^^ ?.^
Io cual suponemos conocidos los valores de los parmetros, dado que estos
outliers pueden producir importantes sesgos en las estimaciones de los caefi-
cientes de los modelos, lo cual empeora el grado de exactitud de las prediccio-
nes puntuales, tambin se Ileva a cabo un anlisis de la cuanta de los sesgos
referidos.
EI trabajo se estructura como sigue. En la seccin 2 se presentan los dife-
rentes tipos de outliers considerados, as corno los efectos que los mismos pro-
ducen en la serie temporal objeto de estudio. En la seccin 3, se analizan los
efectas de los distintos tipos de outliers en la exactitud de las predicciones pun-
tuales de las modelos ARIMA, suponiendo que los coeficientes de los mismos
son conocidos. En la seccin 4 se aplican los resultados abtenidos en la seccin
precedente a dos tipos de modelos AR I MA concretos, el AR (1) y el I MA (1,1) .
En la seccin 5, y tomando como referencia los modelos considerados en la
seccin precedente, se evala el impacto que la ignorancia de los outliers pro-
duce en las estimaciones de los coeficientes de dichos modelos. EI trabajo #ina-
liza presentando las principales conclusiones.
2. TIPOS DE DUTLIERS
Denominemos yi a la serie temporal observada objeto de estudio y zt a la
misma serie temporal, pero libre de outliers. Suponiendo que zt sigue un proce-
so ARIMA(p, d, q), escribiremos:
^ (L)(1-L) 'zt = ^ (L)at [ 1 ]
donde:
^ (L) = 1- ^ ^ L- ^2 L2- . . . - ^PLp
e(L) = 1- e, L- e2 L2- ... - eq Lq
son operadores estacionarios e invertibles, esto es, tales que las races de ^(L) = 0
y 6(L) = 0 caen fuera del crculo unitario, donde L es el operador de retardos, tal
que Lsxr = xt_S, sin races comunes, y siendo at una secuencia de variables alea-
torias que se distribuyen idntica e independientemente con media o y varianza
6
2
a
Formas alternativas de escribr [1 ] son:
zt = ^ (L)at [2]
^ (L)zr = at [3]
donde:
`^ (L) = 1 +^ L+`^ L2+ . . . - 8 (L)
, 2
^ (L)(1-L) d
[ 4 ]
f-:^f.AI)1S"I1('A E'.S{'r^N()I1
n (L) = 1-rc L--n L2-- . . .
_
$ (L)( ^ - L
'
2
8 (L)
d
Los tipos de outliers que se han considerado en la literatura, ver por ejemplo
Chen y Tiao (1990) o Chen y Liu (1993), son: el outlier aditivo (Additive Out-
lier, AO), el autlier innovacional (^ ^lnnovational Outlier, ItJ), ei cambio de nivel
(Level Shift, LS) y el cambio temporal (Temporary Changei^ , TC).
E I outlier aditivo (AO) es un suceso (efecto externo) que afecta a una serie
en un solo instante temporal ( t = to), de manera que podemos expresarlo como:
yr =zr +^ ^ r
donde:
sit-to
O,sit^to
[ 6 ]
[ 7 ]
es la variable que representa la presencia o ausencia del outlier, siendo w el
efecto de dicho outlier.
Teniendo en cuenta [2] y[4], una forma alternativa de expresar el outler adi-
tivo es:
yr =^(L) ar +c^ r= 8(L1 a+ w^
[8l
^ (L)(1 --L) d t
r
EI outlier innovacional (10) es un suceso cuyo efecto se propaga en confor-
midad con el modelo ARIMA del praceso, afectando a todos los valores obser-
vados despus de su ocurrencia. Lo representaremos, por tanto, como sigue:
Yr - zr +`^ (L)^ ^ r [9^
siendo ^r la misrna variable ( impulso) defnida en [7].
Alternativamente, [9] puede escribirse tambin como:
y r
`^ (L) ( ar + w^ r) = 8 (L^
( a + u^^ )
[ ^0]
^(L)(1--L}'
r
r
EI cambio de nivel (LS) es un suceso que afecta a una serie en un perodo
dado, y cuyo efecto es permanente. Su definicin es:
yr =zr + ^ w^
(1-L) r
donde ^r es la variable impufso definida anteriormente.
F-:FEaCUS [^^ L(1S DIST"[N"f(1S ^1"IPOS UF ^)l.'T^IJEfzS E^:I^ Lr^S NRE:[.)[C'C^IOtif:5 [^E C.O^ MOI)F^1 OS AfZI!^9^^ ^
Resulta inmediato que [1 1] puede escribirse tambin como:
yr = zr + c^sr
siendo sr la variable escaln que se define:
S r
1 , t ? to
0, t < to
[ 12]
[13]
Finalmente, un cambio temporal (TC) es un suceso que tiene un impacto ini-
cial y cuyo efecto decae exponencialmente en conformidad con un factor de
amortiguacin, que denotaremos mediante el parmetro b. En consecuencia, lo
expresaremos como:
y=z+1 c^^,0<S<1
r r
(1-SL)
r
o bien,teniendo en cuenta [2] y[4]:
y =^(L)a + ^ c^^ , 0<b<1
r r
(1-bL} r
[14]
[15]
siendo ^r la variable impulso definida en [7].
A partir de ia tipologa de los outliers que acabamos de exponer resulta in-
mediato que los efectos de los distintos outliers en la serie original, que supon-
dremos cansta de T= to + k observaciones, son los que pasamos a comentar.
EI outlier aditivo (AO) causa un efecto inmediato y nico en la serie observa-
da en el perodo to, de magnitud u^. Esto es, se cumplir:
z r , para 1 <_ t< to
yr = zr+ c^ , para t= to
z r , para t > to
[16]
Por lo que respecta al efecto del outlier innovacional (10), ste depende de
la estructura ARIMA de la serie. En concreto, a partir de [9] podernos escribir:
zr, paral <_t<to
zr + w^^ , para t
= to + ^^ ^'- ^^`^o
[17]
donde ^^es el coeficiente j-simo del polinomio `^(L) definido en [4].
En el caso de un cambio de nivel (LS),el outlier intr oduce un cambio br usco
yper manente en la ser ie de tipo escaln,esto es:
?^ H,ti^I^>f)IS^f 1(^,^k-tiP:1Nt)LA
y
zr, para 1 < t< to
para t> zt+w,_to
[^8]
t
Finalmente, un cambio temporal (TC) produce un efecto inicial w en el pero-
do to, y este efecto decae gradualmente en el tempo con un factor de amorti-
guacn S, esto es:
Zr, paral<_t<to
yr Z^ + wS^ , para t = to + j, j>_ 0
EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIERS
EN LAS PREDICCIONES DE LOS MODELOS ARIMA
[19]
Supongamos que los coeficientes del modelo ARIMA son conocidos y que el
autlier en el perodo to ha sido ignorado. Entonces, la predccin / perodos ha-
ca adelante lineal de mnimo error cuadrtico rnedio, de la observacin futura
yro+k +^ ,
desde el origen to + k, vendr dada, ver Box y Jenkins (1976), por:
^ r ^ ^ r ^ ^ n } r ^ ^
yf^+k^'^- ^1 yto+k +^2yto+k-1 +^3yto+k-2+"' - ^ ^ %+1 yto+k j
j z0
siendo los pesos de la prediccin en esta combinacin lineal, iguales a:
r^^
7 L j = 1C^
calculndose los ^^a partir de [5] como:
1 -^ n ^ ^ ^ =^ (L)(1--L)1/e(L)
^>_ ,
y siendo:
^ ^ ^ ^ i -> >
r ^ -n 1
? L ^ = 1t
j +l --1 +^ ^ h ^ j ^ ^ =
1 , 2, . . .
n=i
[20]
[21 ]
[22]
[23]
Como ha demostrado Ledolter (1989), ver tambin Hilimer (1984), si el out-
lier adtivo ha ocurrdo en ei perodo to (k >0 perodos antes del origen de la pre-
diccin), el incremento relativo en el error cuadrtico medio (IECM) de la predic-
cin I periodos haca adelante que es debido al outlier aditivo que acontece en
el perodo referido es igual a:
w2
I EC M( l; k, a^ ^) _
6^
(24]
E_E^E-:('"T"Oti [)E-: I.US T)TST^1N"IOS T^TE't)S T)E^. ^^1,'7LIF.R.S E^ti [..^S T'KE-:UTC'('TOtiE:^, OE-: T.O^; ti1c)Uf-l.^)ti .^kl`1-^
Si el outlier que ha ocurrido en el perodo to es de tipo innovacional, el error
de prediccin / perodos hacia adelante, ver Apndice, ser igual a:
y^+k+!
donde:
^
Y^^k(I) =
e^+k(I) + c^ `^`k+i
k+ 1
(r ) `^k ^+^ [25] ^ ^
I 1
j=1
et o+k(I) = a^+k+^ + `^, at o+k+^ - - ,
+ . . . + ^, - , a
r o+k+,
[26]
En la expresin [25] debe observarse, sin embargo, que siempre se va a
cumplir, a partir de [4] y[5], que:
k+1 l
()
^k+l - ^ nj ^k j+1
j=1
Por lo que el error de la prediccin [28] ser igual a:
^ _ `
y^+k+l - yt a+k^l^ - et ;, +k^^/
En este caso, por lo tanto, el no tratamiento del outlier innovacional no incre-
menta la inexactitud de las predicciones, esto es, el valor del incremento relativo
del error cuadrtico medio de la prediccin es igual a:
I E C M(!; k, c.^ ) = o
[28]
En cuanto al carnbio de nivel, el error de prediccin / perodos hacia adelan-
te, y sus correspondientes ECM e I ECM, son iguales a:
n
yt^+k+l yt^+k^ll - +k(^) + u^
f ^
k+ 1 ^^^
- ^ ^l
J=1
/-1 k+1 ^ ^ ^ 2
I E C M ( /; k, cu) = 6 ^ ^ Y? + (^ 2 1 - ^ ?C
^ =o ^ _^
k+ 1 r ^^ 2
1 - ^ ^i
^2 j=1
IECM(l;k,c^)=
(5a
^ - ^ 2
^ ^
j=0 ^
[29]
[30]
[31 ^
Finalmente, un cambio temporal en el perodo to, origina los siguientes resul-
tados:
- ^ l= e l+ c^ ^k+^ _ k+,
^ ,^ S k+j+^
Yto+k+l Yta+k^ ^ t^+k^ ^ ^ J
^ =1
[32]
F.S^TF#[)IS^TI('A f^:SP,^N(ll_A
E C M(/y k, r.^ = 6 2 J ^ 1 ^? + u.^2
S k+ ^ _
^k+, ^^^^ Sk+ j+ 1 2
) a ^ l 4-^ l
^ ^
k+ 1 ^ 2
Sk+l ` ^ ^^ ^ Sk+ j+ 1
w2
^ 1
IECM(l; k, t^j = i=
6a ^ - t 2
^ ^^
J=0
4. CASOS PARTIC U LAR ES
[33]
[34]
Con el fin de comprender mejor las implicaciones de los resultados genri-
cos obtenidos en la seccin anterior, as como comprobar el hecho de que los
efectos de ios outliers dependen del tipo de proceso estocstico subyacente a la
serie objeto de estudio, se trata en esta seccin de aplicar los resultados obteni-
dos a procesos estocsticos con parte exclusivamente autorregresiva o de me-
dias mviles. Concretamente, nos centraremos en dos de los procesos ms ha-
bitualmente utilizados en la literatura: el AR (1 } y el IMA (1,1).
4.1. Proceso AR (1 }
En el caso de un proceso estocstico AR (1), que escribiremos:
y t ^ ^ , y t _ , + u r , ^ ^ , ^ < ^
resulta inmediato, a partir de las expresiones [4], [5
cientes n^^i y ^^ son iguales a:
( iJ i
^^ _ ^^
^n ^^^= 0 , `d j > 1
^
dj
por lo que podemos escribir:
[35]
21 ] y[22], que los coefi-
1-1
2l
2 2 4 2(I--1) 1-!^1
^ ^_^ -^-^1+^1+,..+^1 =
i=o ^ 1 _ ^;
[36]
[3^]
A continuacin veremos cmo la ignorancia de cada uno de los tipos de out-
liers considerados a excepcin del 10, que como vmos deja invariante el
IECM bajo e! supuesto de coeficientes conocidos incrementan el error cuadr-
tico medio de prediccin.
EFH:('"I'OS [^E [.OS [)IS'T'IN"hUS "^I'IPUS DE^, l)(^T^1./f'K.S^ E:N L^S E'KE^C^14..'('IONE:^ [)E^: t_O5 :^1OUF^.LOS ARttit:^
Outlier AO
Cuando el proceso es autorregresivo y los outliers en cuestin son aditivos,
stos slo afectan a la prediccin cuando acontecen en las p observaciones
ms recientes [las p+dsi el proceso es ARI (p,d )]. En el caso del proceso AR (1)
esto significa que los outliers Ao, su ignorancia, slo van a afectar a la predic-
cin cuando stos se produzcan en el mismo perodo desde el que efectuamos
la prediccin, esto es, cuando k= 0.
En concreto, Ledolter (1989) ha demostrado que el incremento relativo en el
error cuadrtico medio de la prediccin debido al outlier aditivo en to, es igual a:
IECM(l;k,w)=
Outlier LS
$21 (1 - $^ )
w2
2^ ^
cia
1 - ^^
0 ,
para k = 0
para k > 0
[38]
En el caso del outlier LS, el error de la prediccin I perodos hacia adelante,
expresin [29], y el IECM, expresin [31 ], son iguales, teniendo en cuenta [36] y
[37], a:
^
Yro+k+i - Yro+k^l) = eto+k^l) +
c , ^ { 1 - ^i }
IECM(/;k, c ^)
(w l2 (1 - ^i^2 ^^ - ^i^
\6a/
( -
^^^ )
[39]
La expresin [39] implica que el incremento del error cuadrtico medio de la
prediccin es el mismo para cualquier valor de k, es decir, es invariante a si el
outlier se produce en el perodo correspondiente al origen de la prediccin o en
cualquier otro perodo del tiempo anterior.
C^utlier TC
Por lo que respecta al outlier TC, reernplazando [36] y[37] en [32] y [34], se
obtiene:
^
Yto+k+l ^Yto+k^l) i
efo+k^!) + (^ (k+l - ^1 Sk)
_^1
f_^ t-^I7I`; I I(^,^1 F^.^,^`,^^ti ^l :^^
IECM(l;k,w)=
^^ z { k+ ^' -- ^; ^k)^ (1 - ^^)
6a
{ --^1r1
[40J
En este caso, por tanto, el IECM es menor cuanto ms alejado del origen de
la prediccin acontece el outlier TC {esto es, cuanto mayor es el valor de k}, si
bien, a diferencia de lo que ocurra con el outlier AO, el efecto, estrictamente, no
se anula.
Como conclusin de este apartado cabe sealar que cuando el proceso es-
tocstico subyacente a la serie temporal objeto de estudio es un autorregresivo,
el efecto que va a producir en la prediccin (ECM} la ignorancia de un determi-
nado outlier, depende claramente del tipo del mismo. En concreto, si el outlier
es aditivo, su ignorancia tan slo producir variaciones en el error cuadrtico
medio de la prediccin cuando ste tenga lugar en el mismo instante temporal a
partir del cual efectuamos las predicciones. Este no es el caso del resto de los
outliers analizados, pues todos los dems, a excepcin del 10, alteran el ECM
tanto si el outlier tiene lugar en el periodo correspondiente al origen de la pre-
diccin, como en perodos precedentes, si bien en el caso del outlier TC la
cuanta del efecto est relacionada de manera positiva con la proximidad al ori-
gen de la prediccin de la ocurrencia de dichas observaciones atpicas, mien-
tras que en el caso del outlier LS el efecto es invariante respecto al momento en
que tiene lugar.
Otro resultado que se observa directamente a partir de las expresiones [38]
a[40] es que, como caba esperar, cuanto mayor es la cuanta de los outliers,
es decir, cuanto mayor es w/aa, mayor es el efectos que stos producirn en
IECM.
Las cuadros 1 a 3 confirman estos resultados, adems de permitir analizar
cules son las magnitudes (en %) de incrementos en el ECM de prediccin que
originan la ignorancia de los distintos tipos de outliers. En dichos cuadros se ha
calculado el IECM, en tanto por ciento, suponiendo distintos valores de k(el pe-
rodo de ocurrencia de los outliers es ms o menos prximo al origen de la pre-
diccin), de I ( horizonte temporal de la prediccin, esto es, perodos hacia ade-
lante para los que se efecta la prediccin), as como de los valores de los par-
metros del modelo (^1, en este caso) y de la magnitud del outlier ( c^/6a).
A la vista de los resultados presentados en los cuadros citados, el primer
punto que cabe destacar es que el no tratamiento de los outliers puede Ilevar a
incrementos en ECM muy importantes ( ide hasta casi un 10.000 por ciento!).
Salvo en el caso de los outliers LS, el efecto no es muy relevante si el valor de k
es elevado, es decir, si las observaciones atpicas se producen en perodos de
tiempo bastante alejados al del origen de la prediccin. En cuanto al horizonte
E^^^E:("'1'Oti [)E^ I.O^ I)tSTtN`I'OS ` f ^IP(^)S f . 1 E : ^ ^ I ( ^ 7 ^ 1 . / E . k . ^ E:ti LAti F'Kfa)I(^('COtif:.^ ( y E^- !(^^ ti1^^1:>t^.t.r ^^ ^^ ^k1ti1,1 _ ^ 1
temporal de la prediccin (n, en el caso de outliers AO, el valor de IECMest
relacionado de manera negativa con el nmero de perodos hacia adelante para
los que efectuamos la prediccin, siendo esta relacin positiva en el caso de
outliers LS, y dependiendo de los valores concretos de ^, en los vutliers TC.
Tambin obtenemos conclusones opuestas al analizar la relacin existente en-
tre el IECMque se obtiene al ignorar los distintos tipos de outliers y el valor del
parmetro ^^, que se supone conocido. En efecto, en el caso de los outliers AO,
a mayor valor de ^^ mayor es el incremento en el error cuadrtico medio de la
prediccin que produce el no tratamiento de las observaciones atpicas, obser-
vndose una relacin totalmente contraria cuando los outliers ignorados son LS.
Cuadro 1
INCREMENTOS EN EL ECM DE PREDICCION (EN %) ORIGINADOS
POR UN OUTLIERAO EN EL PROCESO AR (1)
Perodos hacia adelante para
Outlier en el origen de la prediccin
k=0
los que efectuamos la prediccin
/--^ 1 2 3 1 2 3
Magnitud del Outlier w= 5a^ Magnitud del Dutlier w= 10aa
^, = 0, 1 25 0, 2 0 10 0 ^ o
^1 = 0, 3 225 18, 6 1, 7 900 74, 3 6, 6
^^ = 0, 5 625 125 29, 8 2.500 500 1 19, 1
^1 = 0, 7 1.225 402, 9 170 4.900 1.61 1, 4 680
^^ = 0, 9 2.025 906, 2 538, 8 8.100 3.624, 9 2.155
Cuadro 2
INCREMENTOS EN EL ECM DE PREDICCION (EN %) ORIGINADOS
POR UN OUTLIER LS EN EL PROCESO AR (1)
Perodos hacia adelante para
Outlieren cualquier perodo (d k)
los que efectuamos la prediccin
1--^ 1 2 3 1 2 3
Magnitud del Outlier w= 5a^ Magnitud del Outlier c^^ = 10aa
^1 = 0, 1 2.025 2.426 2.470 8.100 9.704 9.8$0
^1 = 0, 3 1.225 1.899, 3 2.155, 4 4.900 7.597, 2 8.621, 5
Q ^^ = 0, 5 625 1. i 25 1.458, 3 2.500 4.500 5.833, 3
Q ^ 1= 0, 7 225 436, 4 623, 7 900 1. 745, 6 2. 494, 9
^i = 0, 9 25 49, 9 74, 5 100 199, 4 297, 8
F.S I,AI){ti l l('A F^+F'AN( at.A
^
N N *-
O
^ C C
^
O O O O
N ^O_
' ^^ 4^
^j
^ ^ O C1 O
T YJ
1 _ J ^""' '.^
W1^ ^ V
U
^--
N ^
m ^^ II
Z^ ^ ^ Y
j ^ ^

N
r
O
00

O
C7

O
^-
c ^
O
o
O
r-

,--
(T
c^i
.--
M
^=
O
C^
c^
O
o
O
Cr3

^
^1 J
^
N zt ^D M r. r^ c^ r-
1 c+ ^
c^D c O ^t
^
O
^`0
M .--
1'^^
`^^
^../
^
^ _^ lli
$^ ^ ii N
^
Cp
^

^
MO ^
^ ^
h o U
Z
^
C Z7dY ,`^^
r
tt
^-
C'7 0 0
c 0
P ^-
^t
N M M
^
^ ^C ^
r--
t
N
r^
^--
O N r--
O
lf?
`rt
*-
^-
O
.-
0
r
^
i^i.. UJ WF' t'J t'J 1 ^ r-
^
^
-pO
^
M
C^D ^ N ^ f ^^7
WWW
GO
o^ti
^t
^
^O O N .-
^
Q
_ _
^ 'C
^ ^ U_
O N
V^ Q ,1 ^ il N
^77
M
T
^
1 `-
^ ^
^
^
^
'
C^
^^
ad
M
Zt^
^ ^ . Y
CO
^
(1 )
C^ r T
V O
^^.`. N ^ V
.W .^^^
^
r^ d' N
^ I^
^
^
^ O
^
^
T
^ ^ ^ ^ ^
/^\
^^ \
W^ ^ ^ W^
^ T^
...^ r r ^7 O ^
O
M
M
^ r^ f ^. W^ 1 ^ ^.//
w^
-p c c
^ ^- ^ ^ r N
0,--^Q
^o ^
Z
^ t^
^
^ 0^ d' M CO M OCa N
^ ^
_
T^ ^
C ^WII N
^ ^ ^ O ^
r ^ C1 J ^ 1 ^
=rtiW^ ^ -Y
N - r1^- N N
^.,/ ^U.r^
C.^
...^r ^
^
. Q % ^ ^
' ^ ^
T O ^
T
O L^^n/ ^
^ ^ ^ ^ ^ ^
T
^ ^ (^ ^' r
Wp,.
^ J
a- W
^
T
M^
r
^^ T N
wZ
^ W
(^^^ C^ N ^ Q^t")
t`
CNO ^
N N *-
r^^} ^
^
^
T
^
^ U ^
O C
C^ N ^t N !X} 1 ^-
w
^p ;
C ^O ^
^ I I N
^^ ^
r
O *-
^t
r t70 O O ^
^
)
Y
I.f') M r r ^ ^
W
^^
+.. `
Nr ^ ^
Z
^ ^
W
^ O O ^ O
^
T
O^ d ,-- ^-- C^ tD ^ d'
O
^^^
^
Z
W
^
W
^
U
Z
c
.p
C^
T M
0 0
II ^)
r ^--
^ n r ^ a^
000
II 1 1 II
^ r ^r
r
II
r_ c^^n r^rn
00000
II ^I II I^ ^I
t:Ft^^:C"^I^t)ti UF^: l.(^)S [^1S`I'IN"I^t)^ "f^IPOS C)E (^('TIJf^,'R.^^ F^N I.^AS 1^'FZE^L)I(^'(^I(^tif-,^ Uk: l.^)5 ti1^^I
4.2.
Proceso IMA (1,1)
En el caso dei proceso IMA (1,1):
i1 '^) Y^ = ut -- ^^ ur_^ , (81 ^ <1
^^_ 1 (>`^ ^^k1^1-^ _ ^^
[41 ]
los valores de los coeficientes n;^> y^; , teniendo en cuenta las expresiones [4],
[5], [21 ], [22] y [23], son iguales a:
n^^> = 6^
-^ (1 _ ^1) , d ^, /
, para ^ ?^ [42]
Se trata, al igual que en el apartado anterior, de analizar el incremento en el
error cuadrtico medio de la prediccin que origina la ignorancia de cada uno de
los outliers descritos. Para ello, deber tenerse en cuenta que, a partir de [42],
se obtienen los siguientes resultados:
^^^ k
^k+1 - e1 (1
I -1 2
^ `^. = 1 +(
!- 1) (^ _ e^)2
=o ^
k + 1
1 _^^^^^=^1+ 1
^
j =1
k + 1 j -
^Sk + 1 _ Si + 1)
^ ,^^' ^^k +,
_ (1 e, )
j = ^ f (s- e
,)
(la prueba de [45] y[46] se adjunta en el apndice).
Outlier AO
[43]
[45]
A diferencia de lo que suceda cuando el proceso estocstico era autorregre-
sivo, en el caso de procesos de medias mviles (o de medias mviles integra-
dos, como es el que aqu consideramos), el vutlier AO va a afectar las predic-
ciones independientemente de cuando se produzcan las observaciones atipicas,
si bien la cuanta del efecto en el ECMque produce.la ignorancia de las mismas
va a ser menor cuanto ms alejadas se encuentren dichas observaciones atpi-
cas del origen de la prediccin; es decir, el IECMser menor cuanto mayor sea
k, aunque en sentido estricto no se anular a partir de un determinado k.
F:tiTA[)1^11('^^ f.SF'^ti{)1..^^
En efecto, tal y como ha demostrado Ledolter (1989), el valor del fECM en
este caso es igual a:
IECM (l; k, c^) _
^ 2
e2k {1 - ^^)2
[47]
^a [ 1 + ( / - 1 } (1 - 8^ }2]
A partir de [47] podemos concluir, por tanto, que:
a) EI efecto del outlier AO sobre ECM en el proceso IMA (1,1) no se anula
cuando el outlier ignorado tiene lugar un nmero determinado de periodos ante-
riores al origen de la prediccin, si bien a medida que dicho nmero de perodos
(k } aumenta, el efecto del outlier, sobre el grado de exactitud de las prediccio-
nes medido por ECM, disminuye.
b) Cuanto rnayor es el horizonte temporal para el que efectuamos la pre-
diccin {es decir, cuanto mayor es l), menor es IECM.
c) Existe una relacin positiva entre magnitud del outlier (c^lcsa) y efecto
cuantitativo del mismo en IECM.
d) A diferencia de lo sealado para el proceso AR (1), en el caso del IMA
(1,1) no existe una relacin positiva entre magnitud, en valor absoluto, del coefi-
ciente del modelo (9^) y efecto cuantitativo del outlier en la inexactitud predic-
tiva.
Dutlier LS
En el caso del outlier LS, el error de la prediccin I perodos hacia adelante,
expresin [29], y el IECM, expresin [31 ], teniendo en cuenta [44] y[45], son
iguales a:
^
yro+ k+ ^ - Yro+ k^l} _
(^ 2 8; ( k+ t )
IECM (l; k, w) =
aa [1 + {I - 1) (1
- 81)2]
(I) + w e; +,
[48]
A partir de [48] podemos sealar que en el caso del outlier LS se mantienen
las conclusiones a}, b) y c) referidas para el outlierAO, es decir, existe una rela-
cin negativa entre IECMy k (perodos previos al del origen de la prediccin en
que acontecen las observaciones atpicas) algo que no se cumpla en la com-
binacin de outliers LS y procesos AR-- e IECM y /(horizonte temporal de la
FFf^,('"fC)S Df^ f.()S !)1S'!"tN"I'C)S "(^tP()S DE t)l.'7'L/f..^R.1' E:N l.AS PRE=!)IC'('1()!^f-.ti [)E= l.()^ !^^f()f)f:1 ()^ ,^^kl!tif,A ^5
prediccin); mientras que hay relacin positiva entre IECMy la magnitud del
outlier (c.^laa). Adems, como rasgo distintivo con respecto al outlier A4, en este
caso se observa una relacin positiva entre la magnitud del parmetro 6^ y el
valor de I ECM.
Outlier TC
Respecto al outlier TC, reemplazando [44] y[46J en [32] y[34], obtenemos:
Sk+,
Y
-Y (Ij=e (1)+w
Sk+^_(1 _ ) (
to+k+l tp+k fo+k 1 (S
IECM(/;k,c^)=
2
(Sk+1 _ 8 k+11
^k+/ ,_ / 1 - ^ 1 } 1 1
(^ 2 l (^-8,^^
aa [ 1 + (I- ,I ) (^ - e1)2]
[49]
A partir de [49] podemos concluir que el valor de IECMse encuentra relacio-
nado positivamente con la magnitud del out/ier (w/6a}, mientras que las relacio-
nes existentes entre los valores de ios incrementos en el error cuadrtco medio
de la prediccin y el nmero de perodos anteriores al del origen de la predic-
cin en que acontecen los outliers TC (k) o el horizonte temporal de la predic-
cin (n, dependen de los valores concretos de los parmetros 8^ y s.
Ai igual que en el apartado anterior, con el fin de poder analizar las magnitu-
des (en %) de Ios incrementos en el ECMque produce el no tratamiento (igno-
rancia) de los diferentes tipos de outliers, cuando el proceso estocstico que
subyace a la serie ternporal objeto de estudio es un IMA (1,1), se han elaborado
los cuadros 4 a 6, en los que se confirman todos los resultados sealados en
este apartado.
T
r
Q
C
r
^^
^

^
^
^
0
^
C i ^
^
^^
^^
^ Z
^v
^^
^o
.i-^.
^
O
^
W
. . . ^
^
^_
U
U_
^
^
^
^
^
U
W
J
W
Z
W
^
^
F-
Z
W
^
W
^
U
Z
_
^ ^
I I
ac
cv
-^ C^
^ct7 T^
^
N
O

^
^l
a ^
^Aa ^
W
^ a ^
cts Z3
m
a ^ ^
c
o
. ^
c^
a ^ ^
a ^
^
N
.--
N
r
M
N
N
r
(^
N
T
F.S I .^l)6ti l ( { ,-^E-. tif'^^tic )L,^^
^
cD O^
o ^ O O O r-
r
N ^
O O O O
N
M 4 O O O
I'^
N
r
N
O O O c'7 O O O O CV
^
V' d' C L 3 CO ^N
O O O I ^t ') CO O O T- r--
N
^t
M
t,A 00 C D M ^
O O ^ DO O O N c^
N
^t
c^
cD d' t`- d' d- ^
O O O Ct ^ 0^ O O N
M
W^ C^ N
r^'
C^
O ^ ^ C O
^N O 40 c^
.- T-
.- I `^ N CO N ^t C O N
o co . - rn ca
^ M ^ ^
T
^
T
^
N ^ - ^ct 00 h- N r-- C D
G^ ^ G^ ^t c, rn c Cs ? ^n
`-, y ^ r M tl^ ^^- ^D
^- N
1^ ^ N ^t Q O ^ I ` I '^ 1 `^ ^
^ ^ ^ M (T O N C D C 'r} ^
^fi O ^ ^
M
_
^ T ^ c)
N
T
T
^f
f`
I .C)
N
r-
O
O
N
I^-
^
(D N
^
N N
r
N
r
N N
t^ ^
O C^ CO O C) r r- L t ^ r ^--
N *- ^ - N
^ M r- , - .- ^t CO ^
tT f^
^
I^
^
f`^ ln C D
T-
I^
^t
1^
C O
f^
N OU
^
^
O C
rT
t^- cf l ^t T
M
et
N
CO
T-
^
N ^f ^ v-- C O I^
^
^ ^ r- f^ 00 c' V ^
,-
T
00 t.f) N ^t
^t
N
M
O
N
C ^0
N N N N O O
O N c1^ N t -- ^ t n ^ .-
N - 00
m
k ^
d^N
0
^
I I
3
^
^
^
O
T- M I .C) r`^ O) ^^ - M ^ 1 ^ O)
O O O O ^
^
O O C J O O
^
II il II II rl rl n u u rr
r T T T 1 ^
^
T T r T f^
^ ^ ^ ^ ^ ^^ W m Q ^ C D W
E:F^F:^C^..!'OS [^)E: !.t):^ C^IS^^lN"I^(^)S ^I^IYOS UE (^ ('"7^ 1_l^ ^ ^ R .S N^N LAti PRf-:l)1('('1t)NE^-.S C^F I tati !^1OC)E^.1.^^5 ^ ^ kl!^+tA ii
Q
G
i^
O
^
O
^CC
C^ U`C^
L vi V
QO ^ O
^ ^ ^. II
L1
^^^Y
1 CTr+
^ 1^ v
O
N
O
N
^ C C
O ^ `C
,Q^ .U
_^N
^^^tl
-C ^r^ a. -^C
V/^/`
^
/^ ' W
. = 4^i
(a ^o
O
-p CC
O ^^O
, ^.^
C1_^Zj r
CW^II
^^C1 -^C
.` ^^
'^
O ^^
c
o
U
U_
N ^
N
^
O
N^
^
^O
C'1 ('13
^
.^
U
N
v-
N
N
OO O
a^ o0
O oO o^
N
T
N
0^ ^ r^
^
^C'+7
N
N
C^ O O O ^ N
N ^
^t` T
N
oc^ ^a rn ,^`
CD f`-^
CD
^--
^
0 o c^ ^r c
e7 O
^ M c .C)
M
O ^
^
N
0
N
^
N
.-
M
N
QO
^
ch
^t
^_
00 ^--

r-
M
r^
(D
r--
^ ^ ^ ^
r^ N N 1'^-
c^
r'
T
M
O O^
r-
d'
O
Cf^
^O
Op
^
^
ca r^
N

^ t^
^t
N
r(,n ^
^
CV
C^
N
O
N
N
c^
^A
N
O
O^
T
N

^
1.C) C.^ ti ^
T
M
M (h CO OO ^
M
.-- - Ch 0^
,-- ^O^
r
a^ rn
N ^ ln O
.-- tl3 .-- O
.-- N
,--

CD

O
.- N
^
b
u'^
n
3
^
t
^
1
^
^
.-- C^ ln (`^- O ^
^
OOOOO
-a
^
^
u
m
I I
m
I I
a^
rl
m
I I
a^
O Q
O O O
O O
O O
,^-
t17
tti
^
^
^
M w^
1^. CQ
- C^D
N
M
Q^i
.- 1'`
N
Cf: tt (^
C^ O N Cb ^
M N^
N
N
N
0 Q O ^
T
^C7
^ M CO
O-d ^ ^ C1^
^
r-
^ C7
T^
C7
CY 3
(^-
N
^
^fY
C^O^
et
^t
+- r- M
^11
T
^
y /
^ ^
O O CD ` ^t N
^ tt O ^t
ll^ ^
N
Cr0
CO
O
^
^ ^
T^^
l
I,^
N
^d'
C L ^
OD d^ ^
^ l1")
N 1.l') 1`-
N
l1?
CD
N
Ch ^ CD ln et
^f C ^ ^- rT
^^ti
N
l ^A ^ ^
t^ O
N
d
tt
O
O^

r- ^7 t1') ^ T-
N ^t ^
T- M tn 1`- ^
OOOOO
II 11 II II II
a^ a^ ^ m c
!~ti^1^^^1OISf I<^^,^^ t-.SWAti^)LA
^ ^ ^
O
^^^U
^ ^ O
N^ ^
d + ^- - 1 1
T.7 a
Z7 ^ ^ ^[
^ ^4}
^, cts v
^
^
0
W
C
a ^
^
^-
^
0 ^^
Z
^ ^
^ ^
^
C
^ ^
^
d
0
^ ^
^ II
^
^ Q^
...,.
UUW
U v
0
^ ^
0- J
W W
^ Z
^ W
^
W
1 1 J
Z
W
U^
0
H-
Z
W
^
W
^
U
Z
O
^ CC
^ O
C^ ^
^ ^ U
_ N
^ ^ ^ II
^ ^ d-^[
^
^
^ ^cv
ciDt7
_t 0
^ ^ C
C^ ,^
N C(,j O
^ ^ UI f
^ ,^ ^ ^
^
^
O p_
^
^
V^,
W
N
r
N
M
N
T
N
^?
O
^O

^ I
N cD
^
C^ f ^ Et U^
O O I ^
N ^I 7 ^
^
I
N O
^
^.n c^
I
cn
^ t.
t^
C) ^
N ^-- 1`^ ^
.- N ln I CY 7
P^ cT N CJ7
^ C1r J ^ I Q7i
t ! ^ ^- 00 Lf7
c + ^
^
^
^ 00 M
.- T-- N
^t' ^
O ( ^ ^
N
^
N

T
N
o
C,^ ^
^ J
DO
r-
*- -
r-
^
^ C^D ^ T
N
(^3
N
d0
N
T ^
c^
^
C_ ^
N
N
r
W
N N N N
N C^ O N
M *- M
.- .-
W
rn
o
T
*-^
t `
^
^ o^ co ^t ^
N --
N CV ^
N
M
N
O
^
O
^ ^
O
I`^ ^
M
O
r^ ^ r ` r n
0000
fi ^f u ff n
- ^ .- r ^
^ ^ ^ ^ ^
3
`
g ^
^
w I ^
00
.-
^ ^
.^- N ^ ^
^
r-
N
N
r-
00 ^
c ^
^
c n T- ao ! v
l7 t,^A I ^
- N N
^ C'^ CD CG ^
^t M I ^
r- N .-
CO CL7 00 ^
^
CY 7 ^ W f^
.--
.-
^
c+ ^
^
N T
CO
l ^
^ ^ ^
^
^ 1^-
.-
`C}'

^ ^ n
^ r- 00 I ^
^ ^
N u7 tn
^ t ^D CMO I tND
00 O 4t)
.-
N ^t ^t CO
T
^ ^ ^ M
^ ^ ^ ^
^ ^ *- I
r
N t`^ M ^
^
t -
WTI Y/
^
^
O
I O
(^ N ^
r
0000
^t ^o ^ c o
M
^_ r^ ^n r^
oo0
i i i f i i u
r Tf^ f^
t^:FE(IOS [)E^. [.(^^ [^(^'f.tN"f"c)S ttF^c)^ [^E ^^^^TL.If .'K.^^ t-.N i..aS t`'REUI('('tOtit.4 I)t- I.Oti ti1l)I)f.t ^):^ -^klti9,a ^y
5. EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIEf^S
EN LAS ESTIMACIONES DE LOS MODELOS ARIMA
En la seccin anterior hemos analizado cules son las consecuencias mni-
mas (esto es, suponiendo conocidos los coeficientes de los modelos) que el no
tratamiento de los diferentes tipos de outliers considerados producen en la
exactitud de las predicciones de !os modelos ARIMA.
Las implicaciones de !os outliers en i as predicciones, sin embargo, van a
verse incrementadas como consecuencia de que en la prctica no se conocern
los verdaderos valores de los parmetros de los modelos ARIMA, debiendo, por
tanto, estimarlos. En este sentido, tal y como ha demostrado analticamente Le-
dolter {1989), considerando outliers tipo AO, los sesgos en las estimaciones de
los parmetros ocasionados por los outliers producen un efecto suma en las ine-
xactitudes predictivas de los modelos ARIMA.
EI anlisis de los efectos que los distintos tipos de outlers producen en las
estmaciones de los modelos AR IMA, io Ifevaremos a cabo considerando los
mismas casos particulares de la seccin anterior, esto es, los procesos AR (1) e
IMA(1,1).
Se trata de generalizar a los outliers 10, LS y TC los resultados que, para el
caso de los outliers AO, ha obtenido Ledolter ( 1989).
5.1. Proceso AR {1)
La estimacin minimocuadrtica del coeficiente ^^ de [35] viene dada por:
T
^ Yf Yr_i
^^ _
Cuando el outlier es aditivo, vase Ledolter ( 1989), se cumple:
T
E(^YrYt-,)=(T-1)^Y,
^L Y r_^
r = 2
T [50]
t=2
Y
T ( T -- 1) ^o + c^2
E (^ Y r_^) _
, s i k > Q
[5^ )
[52)
r 2
^
( T^1)Yo , sik=Q
E-^ I -i131^^i( A1-.tii'A!`^()l.rti
siendo y, la autocovarianza de primer orden, que en el caso del modelo AR (1 }
es igual a y, = c^,yo, y yo la varianza, que para el modelo AR {1) es igual a yQ = 6
/1 -^j.
De acuerdo con [50], [51 ] y[52], una aproximacin a E(^^ ), que es aceptable
cuando T es suficientemente grande, viene dada por:
, s i k > 0
1
+ lcu/cs^2 (1 - ^i )
T- 1
sik_0
Las expresiones [51 ] y [52] varan sustancialmente cuando los outliers, como
es el caso de los I^, LS o TC, no agotan su efecto en el perodo de ocurrencia
de los mismos. Asi, y en conformidad con las expresiones [17], [18] y[19], va-
se el Apndice, podemos escribir, suponiendo que k> 0:
y ^ 1 } _
k
(T-1)y1+w2^,`^^ `^f_^ ,con`^o=1, silQ
^-,
(T-1)y^+ku^2 , siLS
(
T- 1) y+ c^2b{ 1- 2k} , si TC
3 1 _ b2
T
E(^ y
t - 2
k-1
(T-1)yo+c,^2^`^? ,con`^o =l,sil0
j= 0
( T- 1 } yo + c^.^2
{ T } yo +
, si LS
(^2 (1 - ^2 ^
1 - ^2 , si TC
En consecuencia, y teniendo en cuenta que en el proceso AR (1) se cumple
que `^^ _^; b' j, podemos escribir las siguientes aproximaciones para E(^^):
Fa-E:('"f OS l)E: LOS [.)1S`I'!N"Tt)S 'I'!f'OS L.)E: ^I[^T^l./F.R.S E^N I.AS NFtf:I.)IC`( ^It^tiF^.ti UF^. L^ )^ 11c )I)h.Lt ^ti AK141,^ -l 1
Outlier lo
E ( c p ^ ) ^
Outlier LS
( T-1) ^ ,Yp +c ^ 2^ ,[( ^ -$jk) /( 1-^ j) ]
( T-1) Yo+c ,^ 2( ^ _^ 2k) /( ^ -$1)
( T- 1) $,Yo_
{T-^ ) yo
, si k= 0
, S I k > ^
[54]
( T --
1) ^ 1ya
+ kc^2
( T -
1) $i + k(w2/aa)2 (1 - ^?)
( T-1) ya+kc ^ 2
sik>0
[55]
Outlier TC
( T- 1) ^ ^ Yo
{ T-- 1) Ya
_^ ^
{ T- 1) +k( u^ 2/6a) 2( 1- ^ ?)
, si k- 0
( T- 1) ^ iyo
+ c,^2S(1- b2k/ 1- b2}
(T-^)yo+w2(1_^2k/1 _S2) -
_[( T- 1) $^ /( 1- ^ j ) ] +( u^/6a)2S( ^ - S2k/ 1- S2)
[(
T-- 1) /( 1- ^ ?) ]
+ (c^/aa)2(1 _ ^2k/ 1 -- b2)
si k>0 [56]
A partir de las expresiones [53] a[56] podemos concluir que los sesgos en la
estimacn del coeficiente ^1 del modelo autorregresivo de primer orden van a
ser relevantes, siempre y cuando el outlier no tenga lugar en el perodo corres-
pondiente al origen de la prediccin. Adems, en los casos en que los outliers
sean LS o TC el sesgo ser mayor cuanto ms alejado del origen de la predic-
cin acontezca el misrno. Tambin debe observarse que en el caso del outlier
10, e independientemente del perodo de ocurrencia del mismo, no se produce
sesgo alguno en la estimacin del coeficiente. Finalmente, obsrvese la relacin
directa entre tamao del sesgo y de outlier (w/6a).
Una cuantificacn de los sesgos que originan los distintos tipos de outliers en
la estimacin del coeficiente ^1 de un modelo AR (1) se adjunta en el Cuadro 7.
^ ^ ^ F-.^ i^ ^ f^ .,tt')IS^ II(^ ,; f^^.tiF^'A{)t.s^
Cuad ro 7
EFECTOS DE LOS DISTINTOS TIPOS DE (7UTLlFRS EN LA ESTIMACION
DEL COEFICIENTE DE UN MODELO AR (1). (T= 90}
E^^ ^ )
LS TC
AO
(k>1)
10
(`dk} k= 1 k= 5 k= 10 k= 1 k= 5 k= 10
6^-0.1;w=2
^^ = 0.2 0.14 0.2 0.44 0.75 0.85 0.35 0.53 0.53
^^ = 0.5 0.37 0.5 0.63 0.81 0.89 0.55 0.58 0.58
Q ^^ = 0.8 0.69 0.8 0.83 0.89 0.92 0.79 0.78 0.78
6=0.1;w-3
^, = 0.2 0.10 0.2 0.59 0.86 0.93 0.45 0.52 0.53
^^ = 0.5 0.2$ 0.5 0.72 0.90 0.94 0.59 0.62 0.62
^y = 0.8 0.59 0.8 0.85 0.93 0.96 0.77 0.76 0.76
5.2. Modelo IMA (^1,^1)
Si la serie { y t } sigue un proceso IMA ( 1,1), tal como el escrito en [41 ], las prime-
ras diferencias Dy^ = yt - y t _, seguirn un proceso MA (1) con una matriz de varian-
zas y covarianzas caracterizada por yo = 62a (1 +62^ ), y^ _-8162^ y y^ =0 para j> 1.
Para analizar el efecto de los out liers en la estimacin del parmetro 91, po-
demos comenzar examinando el efecto de los mismos en la estimacin del coe-
ficiente de autocorrelacin de primer orden de la serie diferenciada una vez.
A este respecto, podemos escribir:
E( r^ ) =
r
E (^ ^Yr ay^-1)
r^ 2
T
E (^ (dy^. , )2)
t =2
[57]
Los valores que adoptan las expresiones del numerador y denominador de
[57] dependen del tipo de outlier que acontezca, pudindose demostrar ( vase
el Apndice) los siguientes resultados:
r
E (^ ^Yt y^-i
r =2
( T- 1) y^ - c^2, pa ra k>0, s i AO
( T- 1) y^ - 9c^2, para k>0, si 10
( T- 1) y1, si LS
( T- 1) y1 + t^^2( -1) [(1 +b2k^1)/(1 +b)], para k>0, si TC
^^,F^E,("^OS [)f-: LOS [)IS'i"1N"T^C)S "i^IPO5 [.)E O('77Jf^^K.S E^N LAS f'RHf)I('C'I(^!^f^.S !>E LOti ti1(^U^^.l ^^ti Akl.ti^^^ =^3
T 2
( T - 1) yo + 2a^2, para k>1 , si AO
( T - 1) yo + w2(1 + 9^ ), para k>1, si !O y
F (^ [DYt _, ) ) -
r^2
2
( T-1) yo + w, para k>0, si LS
( T- 1) yo + w2{ 1+[(1-b) (1-b2^k-' >)/(1 +S)]}, para k>0, si TC
Reemplazando estas expresiones en [57] se obtienen las siguientes aproxi-
maciones a E(r1) :
Outlier AO
Er __ ( T- 1) 1'1 -
w2 _ --( T- 1)9^ -( w/csa)2
( ')r T -1 +2 w2 T-1 1 +82 +2 w/a^
{ ) ^p ( )( y) ( a
Outlier IO
para k > 1 [58j
_ (T- 1) Y^ -8^w2 __ -(T-
^)6^ -e^(w/aj2 _
E(r^) - T- 1 + w2 1+82 T- 1 1+ 62 + i+62 w/6 2
( ) ^p ( 1) ( )( 1) ^ 1)( a)
--e,
^ 1 +62 ^ Para k > 1
1
Outlier LS
E( r, ) _
( T -1)y^ _ _ -( T -1)^1a
( T -1)yo+w2 ( T --1)6( 1 +9^)+w2
- -{[( 1 + 8^ )/61] + [(w/6a)^l( T- 1)e^]}^' , para k > 0
Outlier TC
( T -- 1 }y^ +
r^2(^ - 1)[(1
+2 k ^)/( 1 +^)j
E( r^ )=
T- 1 + w2 1 + 1- 1-S2 ^k '^/ 1+b
( ) Yo { [( )( ) ( )]}
-( T -- 1)8^ -- ( w/6a)2 ( 1-b)[( 1-2 k-1)/( 1 +b)^
( T - 1)( 1 + 6?) + ( w/6a)2 { 1 +[( 1--5)( 1-2 ^k-' ^)/( 1 +S)]}
, para k>0
[59)
[60J
[61 ]
Teniendo en cuenta que el parmetro ^1 y la autocorrelacin de primer orden
(p1) de las primeras diferencias de un procesv IMA {1,1) estn relacionados me-
diante p1 =-81/(1 +81), pueden obtenerse estirnaciones de 6^ a partir de las ex-
E;ti'TA[)1S1^1C'A F:SPAti()t.A
presiones [58] a[61 ] reemplazando p1 por r^ y resolviendo la ecuacin cuadrti-
ca resultante para la salucin invertible e^ . Esto es, obteniendo:
1 I 1
E(c^' } = - 2E(r } ^
4[E(r )]2
-1
1 1
[s^]
La expresin [62] nos permite cuantificar, vase el Cuadro 8, el efecto de
los distintos tipos de outliers en la estimacin del parmetro e^ del modelo
IMA(1,1).
Cuad ro 8
EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIERS EN LA ESTIMACION
DEL PARAMETRO 8i DE UN MODELO IMA (1 ,1 )
TC
AO 1 0 LS
(k>1) {^Jk) (dk) k= 1 k= 5 k= 1 0
a^=0.1;w=2
6^=0.2 0.38 0. 2 0.14 0. 24 0.19 0.18
9^ =0.5 0.60 0.5 0.33 0.45 0.37 0.37
8^ =0.8 0.84 0.8 0.47 0.62 0.52 0.51
cs=0.1;c,^=3
e, =0.2 0. 49 0.2 0.10 0.26 o .1s o .18
91 =0.5 0.67 (J.5 0.23 0.42 0,31 0.30
6^ =0.8 0.86 4.8 ^.34 0.54 0.41 0.40
A partir del Cuadro 8 se observa que los sesgos en la estimacin del par-
metro s1 del modelo IMA {1,1) pueden ser reievantes, siempre y cuando el out-
lier no sea de tipo innovacional, pues en este caso, al igual que ocurra en el
modelo AR {1 } no se produce ningn sesgo en la estimacin del parmetro. En
cuanto a la relacin entre perodo de ocurrencia del outlier y tamao del sesgo,
cabe destacar que en el caso del autlier LS el tamao del sesgo ser invariante
respecto al perodo de ocurrencia del outlier, algo que no suceda al analizar el
modelo AR (1), mientras que el outlierAO produce el mismo sesgo salvo en el
caso en que el outlier acontece en el perodo correspondiente al origen de la
prediccin (k=0) o en el anterior (k=1). Finalmente, obsrvese que, al igual que
en el modelo AR (1), cuanto mayor es la magnitud del outlier objeto de estudio
{Cx3 ^6a), mayor es la cuanta del sesgo.
^ : t ^ ^ t : c ^ ^ ^ r ^ u E . ^ ^ . ^ ^ ^ t ^ > i s ^ r i N ^ r < ^ t i ^ r i E ^ ^ ^ s u ^ ^ ^ t ^ r^ _ i F, ^ x s E ^ n ^ ^ _ t ^ s E ^ K ^ ; ^ ^ i c ^ c ^ i ^ ^ ^ t i E - : ^ r ^ > F . i ^ ^ ^ , ^ ^ ^ , ^ > E - i ^ ^ ^ ; : ^ k ^ ^ ^ ^ ^ ^ > ^ ^
5.3. Ejercicio de Simulacin
Con el fi n de c ompr obar s i los s es gos en las es t i mac i on es de los c oefi c i en t es
de los modelos ARIMA, c u ya apr oxi mac i n s e ha der i vado an alt i c amen t e en Ios
dos apar t ados an t er i or es , s e c on fi r man al u t i li zar los pr oc edi mi en t os (i t er at i vos )
de det ec c i n de out li ers y es t i mac i n pr opu es t os en la li t er at ^ u r a, s e ha Ilevado a
c abo u n ejer c i c i o de s i mu lac i n (2), c on s i der an do el pr oc edi mi en t o de es t i mac i n
pr opu es #o por Chan g y Ti ao (1983) vas e t ambi n Hi llmer , Bell y Ti ao (1983),
y Chan g, Ti ao y Chen (1988j , qu e s e en c u en t r a di s pon i ble en el pr ogr ama i n -
for m#i c o SCA (Sci ent i fi c Comput i ng As s oci at es ), ver Li u y Hu dak (1986) (3}.
Par a ello, s e ha c omen zado s i mu lan do u n a s er i e t empor al de 100obs er va-
c i on es c or r es pon di en t es a modelos ARIMA, c on c r et amen t e los modelos AR (1)
e IMA(1, 1), afec t ada por u n out li er (de t i po AO, 10, LS o TC), en u n per odo de-
t er mi n ado; c on c r et amen t e s e ha c on s i der ado qu e la oc u r r en c i a del out li er t i en e
lu gar o bi en en el or i gen de la pr edi c c i n (k =0), o bi en en u n per odo (k =1) o
di ez per odos (k =10) an t es del or i gen de la pr edi c c i n . E n c u an t o a la i n n ova-
c i n , at , s t a s e ha gen er ado s u pon i en do qu e s i gu e u n a di s t r i bu c i n n or mal c on
medi a c er o y var i an za 0. 1.
Un a vez s i mu lada la s er i e s e ha pr oc edi do a efec t u ar la es t i mac i n de los
par met r os de los modelos ARIMAgen er ador es , t an t o t en i en do en c u en t a la
pr es en c i a de u n out li er del mi s mo t i po y en el mi s mo per odo de c omi en zo en el
qu e afec t a a la s er i e en c u es t i n , c omo i gn or an do la pr es en c i a del out li er,
Las es t i mac i on es en ambos modelos {c on y s i n t r at ami en t o de out /i ers ) s e ha
r eali zado eli mi n an do las di ez pr i mer as obs er vac i on es de las s er i es gen er adas (as
pu es , t oman do c omo t amaa mu es t r al T=90). La r azn de eli mi n ar los dat os r efe-
r i dos es t r i ba en qu e de es t a man er a s e logr a s u avi zar el efec t o qu e la elec c n de
la s emi i la gen er ador a de la s er i e t r an s mi t e a los pr i mer os dat os gen er ados .
E I mi s mo pr oc es o des c r i t o s e ha r epet i do 100vec es (4) par a c ada u n a de
las pos i bles c ombi n ac i on es r es pec t o a valor es de los par met r os de los mode-
los , c oefi c i en t es del out li er, t i pos de out li ers y per odo de oc u r r en c i a de los mi s -
mos . E n c on c r et o, y t oman do s i empr e 6 =0. 1, s e han c on s i der ado las s i gu i en -
t es pos i bi li dades : ^ 1 ={0. 2, 0. 5, 0. 8}, 61 ={0. 2, 0. 5, 0. 8}, c ^ _ {2, 3}, Ti pos de
out li ers ={AO, 10, LS, TC} y k ={0, 1, 10}.
Los valor es medi os de las es t i mac i on es de los par met r os del modelo AR (1)
obt en i dos a par t i r del ejer c i c i o de s i mu lac i n c omen t ado s e adju n t an en los c u a-
dr os 9a12.
(2) E I au t or des ea agr adec er la ayu da pr es t ada por Pablo Gar c a en el ejer c i c i o de s i mu lac i n
qu e s e pr es en t a en es t e apar t ado.
(3) Otros procedimientos (iterativos) de deteccin de outliers y estimacin propuestos en la li-
teratura son ios de Tsay (1986), y Chen y Liu (1993).
(4) Au n qu e s e es c on s c i en t e de qu e 100s i mu lac i on es pu eden s er poc as y qu e, gen er almen -
t e, c on vi en e hac er al men os 500par a poder obt en er c on c lu s i on es , en el pr es en t e t r abajo hemos
man t en i do es t e n mer o li mi t ado de s i r n u lac i on es por c u an t o, c omo ver emos ms adelan t e, s t e es
s u fi c i en t e par a c on fi r mar los r es u lt ados an alt i c os der i vados en los apar t ados 5. 1 y 5. 2.
E.ti l Al^l^ l l( ^1, E^.Sf'Atit )1.,^^
Cuadro 9
ESTIMAClONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1 }
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. UTLIER AO
Outler en el Out/ier un perodo ^utlierdiez perodos
el origen de la antes de! origen antes de! origen
prediccin de la prediccin de la prediccin
(k = 0) (k - 1) (k = 10)
^ Q2 ^^ ^^2 ^ ^2 ^^ ^2 ^ ^2 ^^ ^^2
1 a 1 a 1 a 1 a 1 a 1 a
csa-0.1;c^=2
^, = 0.2 0.18 0.10 0_ 18 0.14 0.21 0.09 0.14 0.14 0.19 0.10 0.13 0.14
c^^ = 0.5 4.50 0.10 0.50 0.14 0.49 0.09 0.37 0.15 0.50 0.09 0.37 0.15
q ^^ = 0.8 0.79 0.10 0.79 0.14 0,79 0.10 0.68 0.17 0.79 0.10 0.68 0.17
a=0.l;c^=3
c^, = 0.2 0.19 0.10 0.22 0.20 0.19 0.10 0.11 0.21 0.19 0,10 0.09 0.21
c^^ = 0.5 0.48 0.10 0.48 0.20 0.47 0.10 0.27 0.21 0.47 0.10 0.26 0.21
c^, = 0.8 0.79 0.10 0.80 0.20 0.79 0.10 0.57 0.24 0.79 0.10 0.57 0.24
Cuadro 10
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER 10
Outlier en el Outlier un perodo Outlier diez perodos
el origen de la antes del origen antes del origen
prediccin de la prediccin de la prediccin
(k = 0) (k = 1) (k = 10)
^ ^z $^ f2 $ 2 $^ 6+ 2 $ a2 $' a#2 1 a 1 a 1 a 1 a 1 a 1 a
cs^-0.1;c;^=2
^1 = 0.2 0.18 0.10 0.18 0.14 0.20 0.10 0.20 0.14 0.19 0.10 0.19 0.14
^^= 0.5 0.50 0.10 0.50 0.14 0.50 0.10 0.50 0.14 0.50 0.10 0.49 0.14
cpi = 0.8 0.79 0.10 0.79 0.14 0.80 0.10 0.79 0.14 0.80 0.10 0.70 0.14
a=0.l;cv=3
^^= 0.2 0.19 0.10 0.22 0.20 0.20 0.10 0.20 0.20 0.20 0.10 0.19 0.20
^^= 0.5 0.48 0.10 0.48 0.20 0.50 0.10 0.49 0.20 0.49 0.10 0.48 0.20
^^= 0.8 0.79 0.10 0.80 0.20 0.80 0.10 0.79 0.20 0.80 0.10 0.79 0.20
F^:F^E:C1()S [>F^ l.()^ Ulti'^.^N"1^()^ .1.^E^()ti f)k^. ^il'1IJF/l.S ^:^i L_A^ f'^t}.:l)I('('I()^.F ti l7E l.^)^, 1^1(71)I l^,ti ^klti1^^
Cuadro 11
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER LS
Ouilier en el Outlier un perodo Outlier diez perodos
el origen de la antes del origen antes del origen
prediccin de la prediccin de la prediccin
(k = 0) (k = 1) (k = 10)
n n2 n, n.^ n n2 n, n.2 n n2 n, n.2
^1 aa ^1 aa ^1 aa ^1 ^a ^1 aa ^1 6a
a^=0.1;c;^=2
^, =
^ 1=
^^ =
0.2
0.5
0.8
0.18
0.50
0.79
0.10
0.10
0.10
0.18
0.50
0.79
0.14
0.14
0.14
0.20
0.49
0.79
0.10
0.10
0.10
0.45
0.63
0.82
0.16
0.15
0.15
0.17
0.48
0.77
0.10
0. 09
0.10
0.85
0.88
0,96
0.20
0.17
0.21
6=O.1;cu-3
^^ = 0.2 0.19 0.10 0.22 0.20 0.18 0.10 0.59 0.24 0.18 0.10 0.92 0.27
^^ = 0.5 0.48 0.10 0.48 0.20 0.44 0.10 0.71 0.21 0.44 0.10 0.94 0.23
^^ = 0.8 0.79 0.10 0.80 0.20 0.77 0.10 0.84 0.20 0.77 0.10 0.96 0.21
Cuadro 12
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTL/ER TC
Out/ier en el Outlier un perodo Outlier dieZ perodos
el origen de la antes del origen antes del origen
prediccin de la prediccin de la prediccin
(k = 0) (k ^ 1) (k = 10)
n n^ n, n ^ n, n/^ n R nl] n n^ n n. ./^
^j ^.a ^1 6a1 ,Yj 6La ^1 ^aL ^1 ^.a ^1 ^aL
a=0.l;co=2
^ y= 0.2
^^ = 0.5
^^ = 0.8
0.18
0.50
0.79
0.10
0.10
0.10
0.18
0.50
0.79
0.14
0.14
0.14
0.20
0.49
0.79
0. 09
0.09
0.10
0. 36
0.55
0.78
0.15
0.14
0.14
0.18
0.48
0.78
0.10
0.10
0.10
0.42
0.57
0.77
0.16
0.14
0.14
6a -0.1;co-3
^^ = 0.2 0.19 0.10 0.22 0.20 0.18 0.10 0.45 0.22 0.16 0.10 0.51 0.22
^^ = 0.5 0.48 0.09 0.48 0.20 0.44 0.10 0.58 0.20 0.42 0.10 0.61 0.20
^^ = 0.8 0.79 0.10 0.80 0.20 0.78 0.10 0.76 0.20 0.77 0.10 0.74 0.20
^}`^ t-_ti^1^^^1^l^ti I^I(',^ F tiF'^Atitil ;^
Para interpretar dichos cuadros debe tenerse en cuenta que denotamos por
^^ y cs !a media de las estirnaciones de los parmetros ^^ y cs que se obtiene al
modelizar correctamente el modelo con outliers; mientras que denotamos por c^^
y la media de las estimaciones de los parmetros respectivvs que se obtie-
nen al especi#icar, incorrectamente, un modelo AR (1) sin outlers.
Comparando los resultados de los Cuadros 9 a 12 con los del Cuadro 7,
puede apreciarse cmo se canfirman los resultados tericos obtenidos en el
apartado 5.1. En concreto, las principales conclusones que pueden extraerse
son ias siguientes:
a) Para todos los tipos de outliers los valores medios de las estmaciones
de los parmetros ^^ y a cuando ei modelo se especifica adecuadamente son
prcticamente iguales a los valores de !os parmetros utilizados en el proceso
generador de datos.
b) En caso de especificacin incorrecta del modelo, no tratamiento de out-
liers, el parmetro ^, se estima de manera incorrecta con carcter general, salvo
cuando ei outlier ocurre en el origen de la prediccin (k=o), o cuando es de tipo in-
novacional. As pues, ante outliers AO, LS o TC que ocurren en perodos previos al
del origen de la prediccin se producen importantes sesgos en las estimaciones
del coeficiente ^^, que pueden llegar a ser muy importantes si el outlier es LS y el
verdadero valor del parmetro ^^ es pequeo.
c) Para cualquier tipo de outliers, e independientemente de cundo se origi-
nen los mismos, los sesgos en la estimacin del parmetro 6, cuando el modelo
omite 1a inclusin de los outliers, son muy elevados. En efecto, en el caso de
c^^ = 3, en todas las situaciones analizadas se obtiene un valor medio de la esti-
macin de cs que es ms del doble del verdadero valor del parmetro.
La aplicacin del e^ercicio de simulacin referido al modelo IMA (1,1) origina
los valores medios de las estimaciones de los parmetros que se adjuntan en
los Cuadros 13 a 16.
De manera anloga al caso del modelo AR {1) denotamos mediante ^^ y ^s
la media de las estimaciones de los parmetros e1 y a que se obtienen al mo-
delizar correctamente el madelo con outliers, y mediante 61 y 6 las medias de
las estimaciones de los parmetros respectivos obtenidas al especificar, inco-
rrectamente, un modelo I MA (1,1) sin outliers.
AI igual que en el caso anterior, en el proceso fMA (1,1 } los Cuadros 13 a 16
confirman !os resultados tericos obtenidos en el apartado 5.2, y que se resu-
m an en el Cuadro 8, pudiendo afirmar:
a) Como en e! caso del modelo AR (1), para todos los tipos de outliers, y
cualquiera que sea su perodo de acurrencia, las estimaciones medias de los
parmetros 6^ y a cuando ei modelo se especifica correctamente son prctica-
F^.F-f^:(^O^ l)F^.: LOti I)IS"I'Iti"(c)^ I If'OS 1)F; (1('7L/f:K.1 t^ti l..^ti F'FZEF)I('('I( ^ `F.^ !>f. 1,Oti ^1O1)I l(^^ ,^k1ti1.^^ -^^/
Cuadro 13
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER AO
Outlier en el Outlier un perodo Outlier diez perodos
el origen de la antes det origen antes del origen
prediccin de la prediccin de la prediccin
(k = 0} (k = 1) (k = 10)
n ^ n^ n, n n n^ n. n n n. n.
6^ 6 9^ 6 8^ a H 1 a e^ a 8^ 6
c^-0.1;w=2
81 =
8^ =
8^ =
0.2
0.5
0.8
0.22
0.49
0.79
0.10
0.10
0.10
0.21
0.48
0.78
0.14
0.14
0.14
0.19
0.49
0.79
0.10
0.10
0.10
0.41
0.61
0.82
0.16
0.15
0.15
0.21
0.49
0.79
0.10
0.10
0.10
0.40
0.60
0.83
0.17
0.15
0.15
a^-0.1;w=3
81 = 0.2 0.20 0.10 0.18 0.20 0.19 0.10 0.51 0.24 0.19 0.10 0.50 0.25
8i = 0.5 0.52 0.10 0.50 0.20 0.51 0.10 0.61 0.21 0.51 0.10 0.69 0.22
8^= 0.8 0.79 0.10 0. 77 0.20 0. 79 0.10 0. 83 0.20 0. 79 0.10 0.86 0. 21
Cuadro y 4
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER 10
Outlier en ei Outlier un perodo Dutlier diez perodos
el origen de la antes del origen antes del origen
prediccin de la prediccin de la prediccin
(k= 0) (k= 1) (k= 10)
n n
2
9^ 6a
'2
a
n
8 ^ 2
a
n.
A ^
n
a
a
n
E^^ ^ ^
a
n
e;
^R^
a
a-0.1;w=2
H ^ = 0.2 0.22 0.10 0.21 0.14 0.20 0.09 0.20 0.14 0.22 0.10 0.21 0.14
E^ i= 0. 5 0.49 0.10 0.48 0.14 0.49 0.10 0. 49 0.14 0. 50 0.10 0.50 0.14
H 1 = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.79 0.14 0.80 0.10 0.79 0.14
6=0.1;w=3
91 = 0.2 0.20 0.10 0.18 0.20 0.21 0.10 0.20 0.20 0.22 0.10 0.21 0.20
81 = 0.5 0.52 0.10 0.50 0.20 0.52 0.10 0.51 0.20 0.53 0.10 0.51 0.20
H ^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.78 0.20 0.80 0.10 0.80 0.20
51)
t.^ ^:^tii^f^ i^^c^,^^ t^tit^,^ti^^^t ^^
Cuadro 15
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO
IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER LS
Outlieren el Outlier un perodo Outlier diez perodos
e! origen de la antes del origen antes del origen
prediccn de la predccin de la prediccin
(k = 0) (k = 1) (k = 10)
^ ^ ^
^ n
^
^
81 6 H^
^.
(S^ H^
^
6a e;
6'2
a
2
aa e1
6' 2
a
cs^=0.l; c^=2
e^ = 0.2 0.22 0.10 0.21 0.14 0.19 0.10 0.13 0.14 0.22 0.10 0.15 0.14
6^ = 0.5 0.49 0.10 0,4$ 0.14 0.50 0.10 0.34 0.15 0.50 0.10 0.32 0.15
E ^^ = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.57 0.16 0.80 0.10 0.45 0.17
a^; =0.1; cu-3
8^ = 0.2 0.20 0.10 0.18 0.20 0.20 0.10 0.10 0.21 0.20 0.10 0.11 0.21
H^ = 0.5 0.52 0.10 0.50 0.20 0.52 0.10 0.24 0.21 0.52 0.10 0.23 0.21
e^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.37 0.23 0.80 0.10 0.32 0.24
Cuadro 16
ESTIMACIONES MEDIAS DE LOS PARAMETRC)S DEL MODELO IMA (1,1}
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACiON. OUTLIER TC
Outlier en el Outlier un perodo Outlier diez perodos
el orgen de la antes del origen antes del origen
prediccin de la predccin de la prediccin
(k = 0} (k = 1 } (k = 10)
A
h ^. /^. ^ A ^. N. ^ /^ ^ n.
C T 81 C s 8^ E i Qi C i^ e^ C s 6^ +6
rs=0.1;u^=2
6^ = 0.2 0.22 0.10 0.21 0.14 0.19 0.10 0.23 0.14 0.22 0.10 0.22 0.14
H^ = 0.5 0.49 0.10 0.48 0.14 0.50 0.10 0.45 0.15 0.49 0.10 0.36 0.15
9^ = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.61 0.15 0.79 0.10 0.50 0.16
6a=0.1; cu=3
e^ = 0.2 0.20 0.10 0.18 0.20 0.20 0.10 0.26 0.21 0.20 0.10 0.22 0.21
81 = 0.5 0.52 0.10 0.51 0.20 0.52 0.10 0.44 0.21 0.52 0.10 0.31 0.21
6^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.53 0.22 0.79 0.10 0.39 0.22
E=.t^^t-.c'"I^OS f)l^ L(^S UIS"f^^IN^^'(^S I^^IP<JS UE: t)l1^LL/f^R.^^ E^*^ l_.^S I'FtE^-.l^t("('I^^tit^.^, L^it-_ Lt^^ ti1t^I>t I ^^ti .^^klti1,^
mente iguales a los valores de dichos parmetros utilizados en el proceso gene-
rador de datos.
b) Cuando el modelo se especifica sin tener en cuenta los outliers, las con-
clusiones respecto a las estimaciones de 9^ son anlogas a las que sealba-
mos al analizar las estimaciones del parmetro ^^ en el modelo AR (1 }. En efec-
to, la estimacin de 81 tiene sesgos elevados, salvo cuando el outlier es de tipo
innovacionai, o bien siendo AO, LS o TCtiene lugar en el instante correspon-
diente al origen de !a prediccin.
c) Finalmente, al iguai que en ei anlisis del modelo AR (1), cualquiera que
sea el tipo de outlier que acontezca y el perodo de ocurrencia del misrno, se
producen sesgos ( positivos} muy elevados en la estimacin del parmetro a
cuando ei modelo especificado no tiene en cuenta la presencia de los outliers,
siendo las cuantas de estos sesgos similares a las correspondientes en el mo-
delo AR (1).
Obsrvese que, dada la relacin directa existente entre la varianza del ruido
blanco (cr) y las varianzas de los errores de predccn, estos sesgos positivos
detectados indican que todos los outliers considerados producen un incremento
en la amplitud de los intervalos de confianza de las predicciones.
6. CONCLUSIONES
En el presente trabajo se ha investigado el grado de incidencia mnima
--en el sentido de que suponemos que los coeficientes de los modelos ARIMA
son conocidos, obviando, por tanto, en primer trmino otro de los problemas
ms importantes que origina el no tratamiento de las observaciones atpicas, y
que consiste en los sesgos que produce en las estimaciones de los coeficientes
del model0 que en la exactitud de las predicciones puntuales obtenidas a par-
tir de los procesos ARIMA, medida por el error cuadrtico medio de la predic-
cin, tiene la ignorancia (no tratamiento) de observaciones atpicas (outliers) en
la serie temporal objeto de anlisis.
La conclusin definitiva que podemos extraer es que los efectos que se pro-
ducen en la calidad de las predicciones pueden ser importantsimos, si bien el
grado de incidencia depende del tipo de outlier que aparezca, del perodo tem-
poral {rns o menos cercano al del origen de la prediccin) en que tenga lugar,
del horizonte temporal (perodos hacia adelante) para el que efectuemos la pre-
diccin, de la propia magni#ud del outlier y del tipo de proceso estocstico sub-
yacente a la serie temporal.
En este sentido, y con carcter general, hernos obtenido que para todo pro-
ceso estocstico y tipo de outlier (con la excepcin del 10), se cumple que el in-
f^, I^lt )(ti f f( ;0 f tif'.^,ti( )t ^l
cremento en el error cuadrtico medio de !a prediccin (lECM) ariginado como
consecuencia de no tratar la presencia de outliers en la serie temporal, es ma-
yor cuanto mayor es la magnitud concreta de la observacin atpica {c^/csa).
Cualquier atro tipo de conclusin que queramos extraer va a depender del
tpo de outlier y proceso estocstico que esternos considerando. As, si bien se
observa con frecuencia que !a incidencia en la prediccin del no tratamiento de
los ou^tliers va a ser menor cuando stos aparezcan en perodos alejados al del
comienzo de las predicciones {esto es, a medida que aumenta k, menor es
IECM), esto no se cumple ni en e! caso de outliers LS, cuando el proceso esto-
cstico en cuestin es AR, ni en el outlierTC cuando el proceso es IMA.
Por ltimo, #ambin se ha analizado tericamente y mediante un ejercicio de
simulacin el efecto que los distintos tipos de outliers producen sobre las est-
maciones de los parmetros de los modelos ARIMA. Se abtiene que, salvo en el
caso de los outliers 10, los sesgos en !as estimaciones de los coeficientes auto-
rregresivos o de rnedias mviles que produce una especficacin errnea del
modelo (es decir, ai estimar como si no hubiera outliers cuando estos existen),
pueden Ilegar a ser muy elevados, salvo que los outliers acontezcan en el ori-
gen de la prediccin. Adems, el ejercicio de simulacin permite afirmar que
para todos los outliers considerados (incluidos los de tipo innovacional) la err-
nea especificacin referida produce un sesgo positivo elevado en la estimacin
de la varianza del ruido blanco del modelo, lo que indica que los outliers ocasio-
nan un incremento importante en la amplitud de los intervalos de confianza de
las predicciones.
APENDICE
Prueba de [25]
Teniendo en cuenta [17], [24] ser igual a:
^ _
y t t , + k ( I ) - - 1 L i r ^
(Zr^+k + Ctl^k) + n^^^ (
+k-1 + W^k-1 ) + ' ' ' +
+ 7^ k^^ ( Zt^+ 1 -F - {^^ 1 ^ + ^ ^k+ 1 ( Zr -+- (^t}) -f ?L ^k+2
Z f^ .^ -#- . . . _
k+1
^ ^j11 ^k j+1
^ siendo ^o =1
^=1
Luego:
^ I
yt+k+l Yt^+k ( ^ -
n k+1
/ _
t+k+! + ^^k+l ^ zt,;+k {n + ^ ^ ^ ^k-%+1 -
^-1
k+1
= et^,+k ^ ^ + c^ ^k+^ - ^
^^^1
^. `
^ k-j+ 1
^= t
^^:F^t:('"f^C)S f)E^^: l_Oti f)iS^I^(N'1^Oti ^ fIPOti E ) f ^ , ^)('7Lll^;k.S F-:N L.,^ ^ S PRF:t^I(^('1Otii=:ti 1)F^ l(^^ ti1OI)F l^^`^ ^^I^1ti1A ^.^
siendo:
/ ^ _ / ^ ^ / ^ _
et^+k ^'1 - Zt+k+l ^'J - Ztn+k ^'J `
Prueba de [29]:
k+l + ^1 af^,+k+E-1 + "' +^l-1 at,+k
Teniendo en cuenta [18], [20] ser igual a:
yt,,+k ^'1- ^ j/) ^ Zt^ +k -
^ - (^ ^ -^ 1C^tj ^Zt
+k- 1+(^ ^ +
+TLkI) ^Zt+1
+ (ll)} ^- ?L^k+1
^Zt, +
(tJ^ + ?L{t^+2
n k+1
= Zt,;+k ^^
+GJ 1L j
^ ^ ' ^
^ =1
Luego:
+
k+1
yt+k+l yt^,+k ^'` `" Zto+k+l + w- Zf^ +k ``1 + ^ .,.r ^^l) -
^^ ^ l
k+1
- et.+k
( n + (,^ 1
- ^ n(^)
j^ 1
Prueba de [32] :
Teniendo en cuenta [19], [20] ser igual a:
^ n _
yt<^+k ^'1-- 7L ^I ) ^Zto+k +
(^ t^ k) + 1L 2I ) ^Zt^+k-1 + c^t^k-1 ^ + .. . +
+ TL kI ) ^ Zto+1
+(^ tS} +7L^ k+1^ Zto +t1^ ^ +TC^ k+2 Zta- 1+... _
k+1
= Z +t^ ^ 7L^ ^ )
Sk-j +1
t+k ^ ^ /
/ =1
Luego :
n n
^ta+k+l yt^+k ^'` `
k+1
^ ^ l) ^
Zt^+k+l + ^Sk+l - Zt +k l l^ + ^
J^ll
^k-'+l
l'1 j =1
k+1
E + (.^
^k+l .._, ^` ^^l) sk-j+l
t^,+k ^ I J L _ 1r l
l
Prueba de [45] :
A parti r de [42J :
1
k+1
1 [ ^ ^ ^ + 1 ^ ^ ^ ^ +... +l C ^ ^ k
+1 -
5-^ E^ r^^[ ^[s t tc ;^ t-:^
( 1
,;
tic ft.r^
-H1}+E^?(1 -E^^)+...+8^(1
81)(1 +81 +8?+...+6^`}=(1 -
Luego;
Prueba de [46
k+1
1 - ^ ^(I) ^ 1 _/^ - ^1+1) !ek+1
I
l
^- ^
Teniendo en cuenta [42], se obtiene:
k+ 1
^ ^^!) ^k- j+ 1 i
7L ^l^bk + ?L^/)^k-1 +
1 - ^
^^^^s +^^^+,
^1)Sk +^1(1^ ^1)^k-1+... +8^ -1( ^ - 8j )^
_(1_8,){^Sk ,} e1^k-1+... +^,^-1(i +^^) _
e k+ 1
bk - 1
^
1
E 3 y
s
Luego:
k+1
^ _^ n ^^^ sk ;+^
/=1 !
}
(Sk+1_8i +1}
(^k+^ _e; ^1)
(S - ^^ )
)
Prueba de la esperanza matemtica de las expres^ones del numerador y
denominador de [50] para los diferentes tipos de outlers:
Outlier AO
Teniendo en cuenta [1 f], y dado que por [1 ] hemos supuesto que E(zt )= 0,
podemos escribir:
r
E ( ^ y t Y r
r- 2
i )
E(z2z^ ) + ... + Etzr, ^ zto_2) + E [(zr +
w)z^^^_f]+
+ E [zt,^+1(zrG+ w}] + E{zr,+2zr+1) + ... + E{zto+k zr^+k-^
} = { T - 1}7i
T
E(^ ^_^ ) = E(z1) + ... + E{zt, ^ ) + E [{zt,+ w)2] + E(zr+1) +
t=2
+... +E(z^
+k-1 ^ _ { T -
1 )y o + w2 , para k > 0
F^:}^f^:("fC)^ [)F^: !.O^ I:>1^"C^IN'i^Oti "I^lPt)S U}: I"Jl,^ll_1FR_S ^-^^ I.AS F'RF:llI("(^Ii1tiF^.^ 1)F^ 1.(^ti \^1^y1)1 ^ d ^ ti ^1k1^1^^,
Outlier IO
De manera anloga al caso anterior, pero teniendo en cuenta [17], se obten-
dr para k > 0:
T
E( ^ yt yr_^ ) = ( T - 1)y^ + c^2^^ + c^ z` Y2` ^ 1 + . .. + t^a2i^k`Nk_^ _
t^ 2
_ ( r- 1) y1 + c^2
k
^ `^i ` N^ .^ , COn ` ^ a = 1
, _,
T
E(^J^-1)=(T-1)yo+c^2+c^2`Y?+c^2iN2+...+c^2^k ^ _
t=2
k-1
=(T--1)Yo+c^2 ^^? , con^o=1
C)utler LS
Considerando [18], se obtiene para k> 0:
r
E ( ^ y r y t _, ) _( T- 1) y^ + kw2
t-2
Dutlier TC
T
E( ^^- i)_( T--
1) yo + kc^2
r=2
Teniendo encuenta [19], y para k> 0:
r
E( ^ yfyt-1 ) _ ( T - 1 )^1 + (^ 2S + (^ 2tS3 + (^ 25 + ... + C^ J2S2k^ 1 =
t=2
r
E( ^ ^ , )
t=2
2 (1 - S2k)
_( T-- 1)71 + c^ b 1_ S2
( )
T-- 1) 70 + c^2 + cu2b2 + c^24
- T - 1 + c^2 (1
b2i
( )yo 1 _ S2
( )
. , . + W2S2k-2
Prueba de las expresiones del numerador y denominador de [57]
para los diferentes tipos de outliers:
Outlier AO
A partir de [16]:
r
E( ^ ^Yr ^yr-1) _ ^ ( z2 -- z, ) ( z, - zo ) ]
t=2
^tZ3` Z2) 1z2 - z1)] +
f i f ^ F , , ^ ^ 1 AI)I^ ^ f i(';^ E-^ F '^ 1 ^ , ;t )L, ^ :
+ ... + ^[^Zt --1 ^- Zt _2^^Z1 _2 ^
Zf _3^ ] +^ ^ Zr
+ tt) - Zt_1 ^(Zt -1 - Zt,---2)] +
+ ^(Zr,#^ ^ Zl, -^^(Zt + (1J -- ^Zt,-1 )^ + ^(Zt.^+2 ^ Zt,.+1 }(Zt+
+`^ ( Z1 ^ , +3-` 2to+2) ( Zt, +2
1 }] +... -1 -
^(Zt^+k - zt^,+k-1)(Zt+k-1 ^ Zt+k-2)] `
=(T-1)y^-c^^ , parak>0
r
E( ^ (DYr_ ^ )^ ) = E{ z1 -- zo } 2 +E{ z2 - z^ ) 2 + . . . + E( zto_
^ -^
+^(zr +w - Zr.-^ )^] +^(Zr,+
}2]
+ E(z
)
+ E(zt +k_^ -- zr, +k_2)2 =
(
T - 1 )yo +2cu2 , para k > 1
utlier 14
De manera anioga, teniendo en cuenta [17], se obtiene;
r
E(^ L1yt ^1yr_1 ) ` { T - 1)Y^ + c:^^[(`^^- 1) + (`^2 -- `Y1}(^2 --- 1) +
r -2
+... +(^ k
-1 } (^ k-1 - ^ k-2)^
Y como por [42] ^1=1 -- 6^ para j>_ 1, se cumplir que `f', -- 1=- e j
`^r^ =0 para j >_ 2. En consecuencia, para k>0, puede escribirse:
T
E( ^ tlyr 1S yt_ i)_( T
t=2
1 ) ^ y1
Por otra parte, para k>1 se obtiene:
T
E( ^ (Dyt_i )2) _( T - 1 )yo +
w2 j1 + (`^ 1
r-2
( ^ f'2 - `.3'
-t` {^ k-1 - ^ k-2}2^ _( T - 1 )ip+(^ 2 (1 +^ ^ )
Outlier L^
A partir de [18] se obtiene:
T
E{ ^ ayr ^1yr-^ ) _ ( T - 1 )y1
t=2
)
T
E( ^(dyr_1}2)
_( T-- 1)1^0 + ua2, para k>4
r=^
l.I;F^('^TOS I)f; I.OS I)I^^f1N"1^Oti "I^1P^)S [)E ral'7Zl^^^k1 r.N Lr^S f'Ft^^.l)I(^f'I^^tik-^ [>E- l^ ^ ^1(rl>Fl ^^ti ^^k1ti1,^ ^ ^
Outlier TC
Teniendo en cuenta [19J, y para k> 0:
r
E( ^ aYr aYt- ^)=( T--
1) Y^ + c^2 ( b-
r = 2
1}+ c^2b{b - 1)2 + t^2cS^(b -- 1)^ +
+ ... + ao22k^3(S -- 1 )2 =l T-- 1 )^1 + GJ2b(^ - 1 ) [l 1 + S2k-11 I (1 +t^}]
T
E(^ (Dyt_^ )^ ) _ ( T - 1)yo+ cu2 + [ c ^ ( b - - 1 } ] 2 + [ c ^ S ( S - - 1 ) J 2
r = 2
+ [c^b2(b- 1)]2 + ... + [c^bk-z(s_ 1)J2 ^
- { T-- 1)yo+ c^^2 { 1 + [(1 - b) { 1 - b2^k^1 ^) / (1 + b)J}
REFERENCIAS BIBLIOGRAFICAS
AZNAR, A., y TRvEZ, F. J . ( 1 993) : Mtodos de Prediccin en Economa. Vol. 2:
Anlisis de Series Temporales, Editor ial Ar iel, Bar c elona.
BALKE, N. S. (1993): Detecting Level Shifts in Time Series, Journal of Busi-
ness and Economic Statistics, 11, 81-92.
Box, G. E. P., y JENKINS, G. M. (1976): Tme Series Analysis: Forecasting and
Control (Second Edition), San Francisco: Holden Day.
CHANG, I., y TiAO, G. C. (1983): Estimation of Time S er ies Par ameter s in the
Pr esenc e of Outliers, Technical Report, 8, University of Chic ago, S tatistic s
Resear c h Center .
CHANG, I.; TiAO, G. C., y CHEN, C. ( 1 988) : Estir nation of Time S er ies Par ameter s
in the Pr esenc e of Outlier s, Technometrics, 30, 1 93- 2 04.
CHEN, C., y L^u, L. M. (1993): Joint Estimation of Model Parameters and Outlier
Effects in Time Series, Journal of the American Statistica/ Association, 88,
284-297.
CHEN, C.; Liu, L. M., y HUDAK, G. B. ( 1 990} : Outlier s Detec tion and Adjustment
in Time S er ies Modeling and For ec asting, Working Papers Series, S c ientific
Computing Assoc iates.
CHEN, C., y TiAo, G. C. ( 1 990) : Random Level- S hift Time S er ies Models,
ARIMA Appr oximations, and Level- S hift Detec tion, Journal of the Business
and Economic Statistics, 8, 83- 97.
HI^LMER, S. C. (1984): Monitoring and Adjusting Forecast in the Presence of
Additive Outliers, Journal of Forecasting^ , 3, 205-215.
^ ^-.SI:^UIS t^l("a F^-Sf'^ti'O1_:1
HtLLMER, Si. C.; BELL, W. R., y TiAO, G. C. (1983): Modeling Considerations in
the Seasonal Adjustement of Economic Time Series, en Applied Time Se-
ries Analysis of Economic Data, A. Zellner (ed.), Washington D. C.: U. S. De-
partment of Commerce Bureau of the Census, 74-100.
LEDOLTER, J. (1989): The Effect of Additive Outiiers on The Forecast from
A R I MA Models =_ , International Journa/ of Forecasting, 5, 231-240 .
Liu, L. M., y HuoAK, G. B. (1986): The S^A Statistical System. Reference Manual
for Forecasting^ and Time Series Analysis, Dekalb, Scientific Computing As-
sociates.
Mi^LS, T. C. (1990): Time Series Techniques for Economists, Cambridge: Cam-
bridge University Press.
MUIRHEAD, C. R. (1986): Distringuishing Qutlier Types in Time Series==, Journal
of the Royal Statistica/ Society, B, 48, 39-47.
PEA, D. (1990): Influential Ubservations in Time Series, Journa/ of Business
and Economic Statstics, 8, 235-241.
TSAY, R. S. (1986): Time Series Model Specification in the Presence of Out-
liers , Journa/ of the American Statistical Association, 81, 132-141.
{1988): Outliers, Level Shifts, and Variance Changes in Time Seres=>, Jour-
na/ of Forecasting, 7, 1-20.
WE^, W. W. S. (1990) : Time Series Ana/ysis: Univariate and Mu/tivariate Met-
hods, Rewood City: Addison-Wesley.
SUMMARY
This article studies the degree of incidence on the accuracy of
the specific predictions obtained from the ARIMA processes {measu-
red by the quadratic average prediction error), of the leaving out of
outliers from the time series under analysis. The conclusion points to
the fact that said degree of incidence depends on the type of outliers
which occur, on the moment (more or less near to the origin of the
prediction) they appear, on the limits in the future for which the pre-
diction is enounced, on the size of the outler and the type of process
underlying the time series.
Key words: Outliers, ARIMA Models, quadratic average predction
error.
AMS Classificatian. 62M20.

S-ar putea să vă placă și