An Ensemble System Based On Hybrid EGARCH-ANN With Different Distributional Assumptions To Predict S&P 500 Intraday Volatility

Un Sistema conjunto basado en hbrido EGARCH-ANN con
diferentes suposiciones distributivas para predecir S & P

500 Volatilidad Intrada
S. Lahmiri y M. Boukadoum
Una previsin precisa de la volatilidad del mercado de valores es una cuestin importante en la
gestin del riesgo de la cartera. En este artculo se presenta un sistema de conjuntos para la
volatilidad del mercado burstil. Se compone de tres modelos diferentes que hibridan el proceso
de heteroscedasticidad condicional autoregresiva generalizada exponencial (GARCH) y la red
neural artificial entrenada con el algoritmo de retropropagacin (BPNN) para predecir la volatilidad
del mercado burstil bajo distribucin de errores normal, t-Student y generalizada GED) de forma
separada. El objetivo es disear un sistema de conjuntos donde cada modelo hbrido sea capaz de
capturar la normalidad, el exceso de asimetra o el exceso de kurtosis en los datos para lograr la
complementariedad. El desempeo de cada EGARCH-BPNN y el sistema de conjuntos se evala por
la cercana de las previsiones de volatilidad a la volatilidad realizada. Con base en el error absoluto
medio y la media de errores cuadrticos, los resultados experimentales muestran que el modelo de
conjunto propuesto para capturar la normalidad, asimetra y curtosis en los datos es ms preciso
que los modelos EGARCH-BPNN individuales para pronosticar la volatilidad intra-da S & P 500 En
uno y cinco minutos horizonte de datos.
Keywords: Mercado de valores; volatilidad; EGARCH; Redes neuronales; conjunto; Pronstico
1. Introduccin
La prediccin precisa de la volatilidad del mercado de valores es crucial para las instituciones
financieras y los comerciantes para estimar el riesgo de mercado, monitorear la planificacin
financiera estratgica, administrar la cartera y evaluar los derivados financieros. Los procesos
generalizados de heteroscedasticidad condicional autorregresiva (GARCH) [1, 2] son populares y
ampliamente utilizados por la comunidad financiera para modelar y predecir la volatilidad [3-7].
Son bsicamente modelos lineales que implican la estimacin conjunta de una ecuacin
condicional de media y volatilidad condicional. Por ejemplo, modelan explcitamente una variacin
condicional variable en el tiempo como una funcin lineal de los residuos cuadrados previos y de
sus valores pasados [4]. Esencialmente, los procesos de la familia GARCH son modelos
paramtricos que asumen una estructura de correlacin lineal en los datos. Adems, se limitan a
distribuciones estacionarias y normales de variables y errores. Estas suposiciones usualmente no
son verdaderas en la vida real, donde muchas series temporales financieras tienen una estructura
de dependencia no lineal y no son estacionarias [8]. Por lo tanto, los modelos de la familia GARCH
no puede capturar patrones no lineales en los datos y su enfoque de aproximacin lineal puede no
ser satisfactoria [8].
Para mejorar la capacidad de prediccin de los modelos GARCH, la literatura se ha propuesto para
combinarlos con redes neuronales artificiales (ANN), en particular con topologas feed-forward
como el perceptron multijugador [9]. Por ejemplo, un modelo hbrido basado en GARCH
exponencial (EGARCH) y ANN para predecir la volatilidad del ndice S & P 500 fue propuesto por
Hajizadeh et al. [8]. El modelo EGARCH-RNA tom como entradas la serie de volatilidad predicha
por EGARCH y un conjunto de variables explicativas que se supone estn relacionadas con el ndice
de precios S & P 500. Luego, las series de volatilidad anticipadas obtenidas por el modelo hbrido
se compararon con las del modelo EGARCH en trminos de cercana a la volatilidad realizada. Los
resultados obtenidos indicaron que el modelo hbrido EGARCH-ANN propuesto proporciona
mejores pronsticos de volatilidad que EGARCH solo. Roh [10] propuso un modelo hbrido con red
neural artificial y modelos de series temporales para predecir la volatilidad del ndice de precios de
las acciones en dos puntos de vista: desviacin y direccin. Los resultados obtenidos demostraron
la utilidad del modelo hbrido para la prediccin de la volatilidad. Bildirici y Ersin [11] compararon y
combinaron diferentes clases de modelos familiares de GARCH con ANN en la prediccin de la
volatilidad de la Bolsa de Estambul. Encontraron que las versiones extendidas de ANN de los
modelos de GARCH mejoraron los resultados de la previsin de los modelos individuales de la
familia de GARCH. Adems, la combinacin de ANN con el modelo GARCH de potencia asimtrica
(APGARCH) obtuvo el mejor resultado. Ms recientemente, Kristjanpoller et al. [12] utilizaron un
modelo hbrido ANN-GARCH para predecir la volatilidad en tres mercados emergentes
latinoamericanos, incluyendo la brasilea BOVESPA, IPSA chilena y IPyC mexicana. Cuando se
comparan los valores pronosticados con la volatilidad realizada, se encontr que el modelo de RNA
mejor el rendimiento de pronstico del modelo GARCH. Adems, los resultados de ANN-GARCH
fueron robustos y consistentes para diferentes especificaciones de RNA y diferentes medidas de
volatilidad. En resumen, trabajos recientes [8, 10-12] han demostrado que los modelos hbridos
GARCH-ANN tienen mejores resultados que los procesos de la familia GARCH individual en la
prediccin de la volatilidad de los mercados financieros. An as, la precisin de previsin del
modelo hbrido GARCH-ANN no es perfecta.
Este artculo presenta un enfoque para mejorar los procesos del tipo GARCH-ANN con un sistema
de prediccin de conjunto de dos componentes. El primer componente utiliza tres modelos
EGARCH-RNA hbridos, que estiman y predicen la volatilidad basndose en el supuesto de que los
errores de EGARCH se corresponden con un T-Student normalizado normalizado y una distribucin
generalizada de errores (GED), respectivamente. Normalmente, la distribucin normal es el
estndar. Sin embargo, las series de tiempo financiero se desvan de lo normal en la vida real, ya
que exhiben excesiva asimetra y kurtosis. Al aplicar tres modelos EGARCH-ANN a los mismos
datos, anticipamos con una mejor precisin de prediccin del conjunto, gracias a los resultados
complementarios. En particular, el hbrido EGARCH-ANN con distribucin normal capturar la
normalidad; El hbrido EGARCH-ANN con la distribucin normalizada t-Student capturar asimetra
[2], y el hbrido EGARCH-ANN con GED distribucin capturar el exceso de curtosis [13 - 15]. Por lo
tanto, los tres sistemas hbridos EGARCH-ANN pueden capturar las tres caractersticas de los datos.
Para mejorar an ms la capacidad de pronstico del sistema de conjuntos propuesto, se opt por
utilizar el proceso EGARCH en lugar de GARCH, ya que puede modelar variaciones asimtricas en
los datos, mientras que el proceso GARCH ms clsico no puede [13]. Trabajos anteriores han
hecho hincapi en la importancia de los efectos asimtricos sobre la precisin de pronstico [16 -
18], y el proceso EGARCH ha demostrado ser tambin eficaz para predecir la volatilidad del
mercado de valores [18 - 20]. El segundo componente de nuestro sistema de prediccin de
volatilidad utiliza una ANN para agregar los tres resultados de los tres modelos de EGARCCH y
proporcionar las previsiones finales. El backpropagation neutral red (BPNN) [21, 22] entrenado con
el Levenberg-Marquardt (LM) algoritmo [21, 22] se utiliza en todo (ms detalles se proporcionan
en la Seccin 2]. El BPNN es ampliamente utilizado en la literatura [8, 10 - 12]. El rendimiento del
sistema de conjuntos propuesto se evala en trminos de su cercana a la volatilidad realizada,
utilizada como proxy de la verdadera volatilidad [8, 10-12], calculando el error absoluto medio
(MAE) y la media de errores cuadrticos (MSE), que son populares en la medicin de rendimiento
de modelos predictivos [4, 8].
El resto de este documento se organiza de la siguiente manera. La seccin 2 presenta el proceso

EGARCH, la RNA, el diseo del sistema de conjuntos, el mtodo para calcular la volatilidad
realizada y las medidas de desempeo. Los datos y los resultados de las predicciones se
proporcionan en la Sec. 3. Por ltimo, Sec. 4 concluye.
2. Mtodos
En la prctica, el diseo de un conjunto de redes neuronales consta de dos pasos. En primer lugar,
se forman varias redes neuronales artificiales individuales. A continuacin, sus resultados de
prediccin se combinan. Por ejemplo, cada red neuronal individual en el ensamblaje es entrenada
usando los ejemplos de entrenamiento. Entonces, para cada ejemplo, las salidas previstas de cada
una de estas redes neuronales individuales se combinan para proporcionar la salida del conjunto
de redes neuronales.
Fig. 1. El diseo genrico de un modelo hbrido EGARCH-BPNN para la prediccin de la volatilidad.
Fig. 2. El sistema de conjunto basado en modelos hbridos EGARCH-BPNN para la prediccin de la

volatilidad.
Un diagrama de flujo genrico de la GARCH-ANN utilizado en nuestro estudio se muestra en la Fig.

1.
En este modelo, los datos normalmente distribuidos se asume para la formacin y la realizacin de
las previsiones por la ANN. Nuestro sistema de prediccin de conjuntos se muestra en la Fig. 2. En
ella, cada ANN es un BPNN y tres EGARCH-BPNNs se construyen asumiendo una distribucin
diferente del error para cada uno: normal, Student y GED. Existen una serie de mtodos para
combinar estas previsiones con el fin de hacer una prediccin final sobre el valor de la volatilidad
del mercado burstil al da siguiente. Incluyen el voto de la mayora, Bayesian, ensacar, impulsar,
por nombrar algunos. En este trabajo, un BPNN adicional aprende las tres predicciones de
EGARCH-BPNN para predecir el valor final de la volatilidad del mercado burstil al da siguiente. El
BPNN fue elegido por simplicidad y homogeneidad del sistema. Todos los pronsticos son
evaluados por su cercana a la volatilidad realizada. Las siguientes secciones describen el clculo de
la volatilidad realizada, el proceso EGARCH, el BPNN y las mtricas estadsticas utilizadas para
medir el rendimiento de EGARCH-BPNN y la precisin general del sistema de conjunto. Entonces,
una decisin BPNN aprende estas predicciones para predecir.
2.1. Volatilidad realizada
El modelo de volatilidad realizada se utiliza ampliamente para estimar la volatilidad histrica

utilizando la desviacin estndar de las variaciones histricas de los activos. La volatilidad realizada
(RV) se calcula como la varianza muestral de los retornos logartmicos con referencia a una media
de 30 das. Por ejemplo, el log-return rt del ndice de precios de mercado p en el tiempo t se
calcula como
Entonces, el valor de RV en el da t se calcula como sigue [8, 23, 24]:
Donde n es el tamao de la ventana (30 das), y r es el promedio de retorno sobre la ventana.
2.2. EGARCH y supuestos distributivos
Para estimar la volatilidad del mercado utilizando los modelos GARCH y EGARCH, la serie de
retorno rt se modela en primer lugar como un modelo de media mvil autorregresiva (ARMA) [25]
en el que se supone que el valor futuro de la variable dependiente es lineal Funcin de
observaciones pasadas y errores aleatorios. El siguiente modelo se estima para la serie rt [4, 18]:
Donde C, a y b son los coeficientes de ARMA, e es el trmino de innovacin, z es el trmino de
error, y F (0, 1) es una funcin de densidad con una media de cero y una varianza unitaria [4, 18] .
La funcin de autocorrelacin (ACF) y la funcin de autocorrelacin parcial (PACF) se utilizan
conjuntamente con el criterio de informacin Akaike (AIC) [25] para determinar el orden pyq. El
AIC se calcula de la siguiente manera:
Donde 2 es la varianza estimada por el modelo ARMA de las innovaciones e1, e2, ..., eT. Para la
variabilidad temporal de la volatilidad condicional, el proceso EGARCH (m, n) [13] se puede
expresar de la siguiente manera:
Donde , , y son parmetros del proceso. As, la varianza condicional es definida como una
funcin asimtrica de las innovaciones retardadas. El conjunto = {, , , } se estima utilizando
la estimacin de casi mxima verosimilitud (QMLE) [1, 2, 25]. En la estimacin emprica de las
volatilidades basadas en EGARCH, el trmino de error se supone que siguen tres distribuciones
condicionales diferentes, incluyendo la distribucin normal estndar, el t-Student estandarizado y
el GED. La funcin de densidad de probabilidad (PDF) de la distribucin normal estndar para la
variable aleatoria z es bien conocida. Est dado por:
Donde y son la media y la varianza, respectivamente. El t normalizado Student PDF se expresa

por:
Donde es la media, es la varianza (a menudo desconocida cuando se usa el PDF de Student),

es el grado de libertad, y el parmetro C est dado por:
() siendo la funcin gamma. El parmetro se utiliza para controlar el espesor y la longitud

significativa de las colas de la funcin de densidad, afectando as la asimetra del t-Student PDF.
Cuando es mayor que dos, el PDF tiene cero asimetra, independientemente de los datos.
Finalmente, la funcin de densidad del GED se expresa de la siguiente manera:
Donde y son la media y la varianza de los datos, y es un parmetro que controla la curtosis,
que es prcticamente constante en + , 0 y -2 para la distribucin leptocrtica, mesokurtic y
platykurtic, respectivamente. Por lo tanto, GED es menos sensible a los efectos de kurtosis dentro
de estos tipos de distribucin.
2.3. Redes neuronales
Una ANN [21, 22] es un modelo genrico para datos de proceso de datos que utiliza una mente
cerebral. El perceptron multicapa es una arquitectura popular que tiene una capa de entrada con x
variables predictivas, una o ms capas ocultas que cumplen con la asignacin de entrada-salida y
una capa de salida con la variable predicha y. La salida y se calcula como:
Donde wij es un peso de conexin de neural j a neural i, denota el sesgo, y f () es una funcin de
activacin empleada para controlar la amplitud de la salida. En este estudio, la funcin sigmoide
comnmente utilizada se utiliza para la activacin. Est dado por:
La red neuronal se entrena con el algoritmo L-M [9, 22] donde los pesos se ajustan de la siguiente
manera:
Donde J es la matriz jacobiana (primeras derivadas) de los pesos, I es la matriz de identidad, es

un parmetro de aprendizaje adaptativo establecido en 0.001, y e es un vector de errores de red.
Los valores iniciales de cada red de pesos iniciales y sesgos se establecen al azar dentro de [-1, -1].
El perceptron multijugador con este tipo de entrenamiento de error es a menudo llamado BPNN
para abreviar. En nuestro estudio, el nmero de neuronas en la capa de entrada y capa oculta se
establece en uno y dos, respectivamente, para el EGARCH-BPNN. De hecho, slo una neurona se
establece en la capa de entrada para capturar la normalidad, asimetra, o la normalidad en los
datos en funcin del tipo de hbrido EGARCH-BPNN utilizado para modelar los rendimientos del
mercado de valores. Por ejemplo, cada tipo de EGARCH-BPNN es un tipo especializado y podra
utilizar slo un tipo de informacin.
Se establecen en tres en la capa de entrada y oculta en el caso del BPNN utilizado para combinar
todas las previsiones. En todos los casos, la capa de salida tiene una neurona que corresponde al
valor predicho de volatilidad.
2.4. Medidas de desempeo
El rendimiento de los tres modelos predictivos de la prediccin de retorno del mercado burstil se
mide mediante el clculo del MAE y el MSE, que se definen de la siguiente manera:
Donde y es el valor observado, y es el valor predicho, y m es el nmero total de observaciones en

los datos de las pruebas. Cuanto ms bajos sean estos indicadores estadsticos, mejor ser la
precisin.
3. Resultados experimentales
Utilizamos datos de series de tiempo consistentes en dos semanas del ndice S & P 500 a partir de
2011, del 28 de febrero al 11 de marzo, con una tasa de muestreo de un minuto. Por lo tanto, el
nmero total de muestras fue 3572. Tambin usamos un horizonte temporal de cinco minutos en
Nuestro estudio que corresponde a 714 muestras. En este estudio, se realizan dos experimentos.
En el primer experimento, el primer 80% y el 20% restante de las muestras se utilizaron para el
entrenamiento y la prueba, respectivamente. En el segundo experimento, el primer 90% y el 10%
restante de las muestras se utilizaron para el entrenamiento y la prueba, respectivamente. El MAE
y MSE de cada individuo EGARCH-ANN y el conjunto del sistema se proporcionan en las Tablas 1 y 2
despus del primer y segundo experimento, respectivamente.
Tabla 1. Los resultados de las predicciones se basan en 80-20%. MAE
Tabla 2. Los resultados de las predicciones basados en 90-10%. MAE

De acuerdo con la Tabla 1 y basndose en un horizonte de tiempo de un minuto, el EGARCH-
Normal-ANN, EGARCH-t-Student-ANN, EGARCH-GED-ANN y el ensa- yo alcanzaron valores de MAE
de 8.73938 10-4, 17.43699 10-4, 9.26444 10-4 y 7.20822 10-4, respectivamente. Para MSE, los
valores fueron 0,7889 10-6, 3,1395 10-6, 0,8834 10-6 y 0,5379 10-6. En base a los resultados de
cinco minutos de horizonte temporal mostrados en la Tabla 1, el EGARCH-Normal-ANN, EGARCH-t-
Student-ANN, EGARCH- GED-ANN y el conjunto alcanzaron valores de MAE de 9.43853 10-4,
18.83194 10-4 , 10.00559 10-4 y 7.78487 10-4, respectivamente. Para MSE, los valores fueron
0,8520 10-6, 3,3907 10-6, 0,9541 10-6 y 0,05809 10-6. Por lo tanto, el enfoque conjunto super a
todos los hbridos EGARCH-ANN
Modelos, independientemente de los supuestos distributivos. Desde el punto de vista de la

efectividad, la precisin de prediccin del sistema de conjuntos propuestos, medida por el MAE
utilizando datos de un minuto de horizonte de tiempo y una estrategia de aprendizaje de 80-20%,
es de 1,21, 2,41 y 1,28 veces mejor que tres alternativas hbridas EGARCH-ANN. De manera similar,
la precisin de prediccin del sistema de conjuntos propuestos, medida por MSE, es 1,47, 5,84 y
1,64 veces mejor.
De acuerdo con la Tabla 2 y basndose en un horizonte de tiempo de un minuto, el EGARCH-

Normal-ANN, EGARCH-t-Student-ANN, EGARCH-GED-ANN y el conjunto alcanzaron valores de MAE
de 8.73938 10-4, 17.43699 10-4 , 9.26444 10-4, y 7.20822 10-4, respectivamente. Para MSE, los
valores fueron 0,7889 10-6, 3,1395 10-6, 0,8834 10-6 y 0,5379 10-6. En base a los resultados de
cinco minutos de horizonte de tiempo mostrados en la Tabla 2, el EGARCH-Normal-ANN, EGARCH-
t-Student-ANN, EGARCH-GED- ANN y el conjunto alcanzaron valores de MAE de 9.06098 10-4,
18.07867 10-4 , 9.60537 10-4 y 7.47348 10-4, respectivamente. Para MSE, los valores fueron
0,8179 10-6, 3,2550 10-6, 0,9159 10-6 y 0,05577 10-6.
Por lo tanto, los resultados proporcionados en la Tabla 2 estn de acuerdo con los Tabla 1. De
hecho, el enfoque conjunto super a todos los modelos hbridos EGARCH-ANN,
independientemente de los supuestos distributivos para todos los horizontes de tiempo de uno y
cinco minutos y tambin para 80-20% y 90-10% estrategias de aprendizaje. Por otra parte, el
EGARCH-Normal-ANN realizado el mejor seguido por el EGARCH-GED-ANN basado en MAE y MSE.
Este hallazgo sugiere que el uso de distribuciones distintas de lo normal no proporcionan mejores
estimaciones de los parmetros del modelo EGARCH. Este hallazgo debe ser investigado ms a
fondo en el trabajo futuro. Finalmente, vale la pena notar que los segundos experimentos basados
en el 90-10% proporcionan resultados mejorados de precisin, ya que los sistemas predictivos
aprendieron ms datos que la primera estrategia de aprendizaje-prueba. En resumen, la
combinacin de pronsticos del hbrido EGARCH-ANN bajo
Los supuestos distributivos ms altos parecen mostrar una mejor capacidad para pronosticar la
volatilidad intra-da de S & P 500 con respecto a las medidas de desempeo del MAE y del MSE.
Esto es una prueba ms de la utilidad de usar sistemas conjuntos para resolver problemas de
reconocimiento y prediccin.
4. Conclusin
Los modelos hbridos GARCH-ANN han demostrado ser eficaces para pronosticar la volatilidad del
mercado burstil. Sin embargo, la eleccin de los supuestos distributivos relacionados con la
estimacin del proceso EGARCH puede tener un efecto significativo en la precisin de prediccin
de tales modelos hbridos. Por lo tanto, presentamos un sistema de conjunto donde cada EGARCH-
BPNN es entrenado con una suposicin distributiva diferente. Los resultados experimentales
demostraron la efectividad del sistema de conjunto para superar a cada uno de EGARCH-BPNN en
la prediccin de la volatilidad intra-da S & P 500 basada en datos de horizonte de uno y cinco
minutos. Para futuras investigaciones, se recopilar un conjunto de datos ms amplio para
experimentaciones adicionales. Tambin investigaremos la efectividad del sistema propuesto al
considerar un conjunto de acciones mal negociadas.

An Ensemble System Based On Hybrid EGARCH-ANN With Different Distributional Assumptions To Predict S&P 500 Intraday Volatility

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

An Ensemble System Based On Hybrid EGARCH-ANN With Different Distributional Assumptions To Predict S&P 500 Intraday Volatility

Încărcat de

Drepturi de autor:

Formate disponibile

Un Sistema conjunto basado en hbrido EGARCH-ANN con

diferentes suposiciones distributivas para predecir S & P

Keywords: Mercado de valores; volatilidad; EGARCH; Redes neuronales; conjunto; Pronstico

El resto de este documento se organiza de la siguiente manera. La seccin 2 presenta el proceso

Fig. 1. El diseo genrico de un modelo hbrido EGARCH-BPNN para la prediccin de la volatilidad.

Fig. 2. El sistema de conjunto basado en modelos hbridos EGARCH-BPNN para la prediccin de la

Un diagrama de flujo genrico de la GARCH-ANN utilizado en nuestro estudio se muestra en la Fig.

2.1. Volatilidad realizada

El modelo de volatilidad realizada se utiliza ampliamente para estimar la volatilidad histrica

Entonces, el valor de RV en el da t se calcula como sigue [8, 23, 24]:

Donde n es el tamao de la ventana (30 das), y r es el promedio de retorno sobre la ventana.

2.2. EGARCH y supuestos distributivos

Donde y son la media y la varianza, respectivamente. El t normalizado Student PDF se expresa

Donde es la media, es la varianza (a menudo desconocida cuando se usa el PDF de Student),

() siendo la funcin gamma. El parmetro se utiliza para controlar el espesor y la longitud

2.3. Redes neuronales

Donde J es la matriz jacobiana (primeras derivadas) de los pesos, I es la matriz de identidad, es

2.4. Medidas de desempeo

Donde y es el valor observado, y es el valor predicho, y m es el nmero total de observaciones en

Tabla 1. Los resultados de las predicciones se basan en 80-20%. MAE

Tabla 2. Los resultados de las predicciones basados en 90-10%. MAE

Modelos, independientemente de los supuestos distributivos. Desde el punto de vista de la

De acuerdo con la Tabla 2 y basndose en un horizonte de tiempo de un minuto, el EGARCH-

S-ar putea să vă placă și