Sunteți pe pagina 1din 87

TRABAJO

FIN DE MASTER.

Anlisis de Series. Modelos Heterocedsticos.

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

NDICE
1.INTRODUCCIN ..................................................................................................................... 3 2.MODELOS SARIMA ................................................................................................................ 7 2.1.FORMULACIN GENERAL MODELOS ARIMA ......................................................... 7 2.2.PASOS EN LA CONSTRUCCIN DE LOS MODELOS ARIMA .................................. 9 PASO 1: Identificacin de los trminos del Modelo. ............................................................ 9 PASO 2: Estimacin de los parmetros del Modelo. .......................................................... 12 PASO 3: Validacin de Modelo. ......................................................................................... 17 PASO 4: Prediccin. ........................................................................................................... 18 2.3.EJEMPLO DE MODELIZACIN ................................................................................... 19 PASO 1: Identificacin del modelo..................................................................................... 20 PASO 2 y 3: Estimacin de los parmetros y validacin del modelo. ................................ 22 PASO 4: Prediccin. ........................................................................................................... 28 3.MODELOS ARCH Y GARCH................................................................................................ 31 3.1.MODELO ARCH.............................................................................................................. 31 3.1.1.MODELO ARCH(1) .................................................................................................. 32 3.1.2.MODELO ARCH(r)................................................................................................... 33 3.2.MODELO GARCH ........................................................................................................... 34 3.2.1.MODELO GARCH(1,1) ............................................................................................ 35 3.2.2.MODELO IGARCH .................................................................................................. 36 3.2.3.MODELO EGARCH ................................................................................................. 37 3.3.CONSTRUCCIN DE LOS MODELOS......................................................................... 38 PASO 1: Identificacin de los trminos del Modelo ........................................................... 38 PASO 2: Estimacin de los parmetros del Modelo ........................................................... 38 PASO 3: Diagnosis.............................................................................................................. 40 3.4.EJEMPLO MODELO GARCH ....................................................................................... 41 4.MODELOS SV ........................................................................................................................ 48 4.1.MODELO SV(1) ............................................................................................................... 48 5.CONTRASTES DE AUTOCORRELACIN. ........................................................................ 50 5.1.CONTRASTE DE DURBIN-WATSON (1951)............................................................... 50 5.2.CONTRASTE DE WALLIS (1972) ................................................................................. 54 5.3.CONTRASTE DE DURBIN (1970) ................................................................................. 54 5.4.CONTRASTE DE BREUSCH-GODFREY (1978) .......................................................... 56

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

5.5.CONTRASTE DE BOX-PIERCE-LJUNG....................................................................... 58 5.6.SOLUCIONES PARA LA AUTOCORRELACIN........................................................ 59 5.6.1.MTODO DE MNIMOS CUADRADOS GENERALIZADOS .............................. 59 MTODO ITERATIVO DE COCHRANE-ORCUTT ....................................................... 62 MTODO DE PRAIS-WINSTEN ..................................................................................... 63 MTODO DE DURBIN .................................................................................................... 63 6.HETEROCEDASTICIDAD CONDICIONAL.CONTRASTES. ............................................ 65 6.1.CONTRASTES DE WHITE ............................................................................................. 65 6.2.CONTRASTES DE BREUSH-PAGAN/GODFREY ....................................................... 67 6.3.CONTRASTES DE GOLDFELD-QUANDT................................................................... 69 6.4.CONTRASTES DE GLESJER ........................................................................................ 70 6.5.CONTRASTES DE RESET RAMSEY ........................................................................... 71 6.6.CONTRASTE ARCH ....................................................................................................... 71 6.7.SOLUCIONES PARA LA HETEROCEDASTICIDAD CONDICIONAL ..................... 72 6.7.1.HETEROCEDASTICIDAD CONOCIDA................................................................. 72 6.7.2.HETEROCEDASTICIDAD DESCONOCIDA ......................................................... 74 7.MULTICOLINEALIDAD CON SERIES DE TIEMPO. ........................................................ 76 7.1.DETECCIN DE LA MULTICOLINEALIDAD ............................................................ 76 7.2.SOLUCIONES AL PROBLEMA DE MULTICOLINEALIDAD ................................... 78 8.HIPTESIS DE NORMALIDAD. .......................................................................................... 80 ANEXO ....................................................................................................................................... 81 ANEXO A ................................................................................................................................... 84 BIBLIOGRAFA......................................................................................................................... 86

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

1.INTRODUCCIN
Una serie temporal o cronolgica se define como la evolucin de una variable a lo largo del tiempo, es decir, es una secuencia ordenada de observaciones en la cual, la ordenacin se hace en base al tiempo (de ah el nombre de temporales). Tambin puede hacerse tal ordenacin por otros criterios como por ejemplo el espacio. Hay casos en los que la variable observada tiene un patrn de comportamiento fijo. En trminos estadsticos estamos ante una serie determinista. Por el contrario, hay series que resultan impredecibles. Su pauta de comportamiento no responde a un patrn fijo, por lo que son puramente aleatorias. Un ejemplo tpico es la sucesin de nmeros premiados en un sorteo de loteras. En general, las series contienen una componente determinista y una componente aleatoria. Los objetivos que se persiguen con el estudio de las series temporales son los siguientes: Obtener una descripcin concisa del fenmeno generador de la serie de datos. Construir un modelo que aproxime de la forma ms fielmente posible el comportamiento de la serie de datos Predecir valores desconocidos (en el futuro o en el pasado), de la serie a partir de la informacin disponible. Controlar el proceso generador de la serie, examinando qu puede ocurrir cuando se alteran algunos parmetros del modelo o estableciendo polticas de intervencin cuando el proceso se desve de un objetivo preestablecido ms de una cantidad determinada. Una caracterstica fundamental de una serie temporal es que sus observaciones son dependientes o correladas y, por tanto, el orden en que se recogen las observaciones es muy importante. Podemos distinguir diferentes enfoques en el anlisis de Series Temporales: Mtodos tradicionales. Se basan en la descomponen la serie en componentes que se conjugan de acuerdo a alguna funcin (generalmente sumadas o multiplicadas, esquemas aditivo o multiplicativo). Tambin se consideran como tcnicas clsicas las de alisamiento exponencial, donde el objetivo es predecir el valor de la serie de forma sencilla y automtica. Mtodos basados en modelos de procesos estocsticos (Metodologa de Box-Jenkins (1970)). Se fundamenta en ajustar un modelo a los datos seleccionndolo de entre aquellos de una cierta familia. La prediccin en este caso se realiza suponiendo que la estructura del modelo permanece invariante en el tiempo, es decir, que en el futuro, el modelo sigue siendo adecuado para modelizar la serie.
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Mtodos univariantes y mtodos multivariantes. Estos atienden a la dimensin de la magnitud en estudio. En este sentido tambin tiene inters el estudio de causalidad entre las variables y los modelos matriciales, extensin de los univariantes. Anlisis en el dominio del tiempo y anlisis en el dominio de las frecuencias. Explotan las caractersticas fundamentalmente de la funcin de correlacin y densidad espectral. Aunque existe una relacin entre ellas, ambas ponen de manifiesto caractersticas complementarias en el anlisis de la serie. Nos vamos a basar en la metodologa de Box-Jenkins, en el cual el desarrollo estadstico se realiza a partir de un proceso estocstico estacionario (en sentido amplio o dbil) y para procesos que se puedan transformar en estacionarios mediante transformaciones (diferenciacin, ARIMA, o Box-Cox). Cuando se produce la ausencia de la tendencia (determinista o aleatoria), hay un numeroso conjunto de teoras y desarrollos matemticos centrados en la diferenciabilidad de la serie temporal y en la existencia o no de races unitarias a partir de los conocidos test de Dickey y Fuller, de Mackinon o de Phillips y Perron. Estas series se pueden describir con los modelos ARIMA o SARIMA. Sin embargo, el estudio de la componente de varianza constante es un fenmeno menos extendido y, de manera que el no tener en cuenta una posible no constancia de esta componente, puede suponer diversos problemas estadsticos cuando se estiman modelos (problemas ligados con la eficiencia de los parmetros estimados y su fuerte volatilidad ante el amplio intervalo de confianza en el que se mueven). Por tanto, para determinar un patrn de comportamiento estadstico para la varianza, se encuentran los Modelos Autorregresivos Condicionales Herocedsticos: ARCH. Engle, 1982, es el autor de una primera aproximacin a la varianza condicional. Para justificar el desarrollo de estos modelos heterocedasticos condicional autorregresivos, este autor, cita tres situaciones para exponer por qu estos modelos fueron propuestos para explicar ciertas propiedades que no pueden ser explicados por los modelos ARIMA y que aparecen con frecuencia en series temporales estacionarias de datos financieros y ambientales de alta frecuencia: 1. La experiencia emprica nos lleva a contrastar perodos de amplia varianza de error seguidos de otros de varianza ms pequea. Es decir, el valor de la dispersin del error respecto a su media cambia en el pasado, por lo que es lgico pensar que un modelo que atienda en la prediccin a los valores de dicha varianza en el pasado servir para realizar estimaciones ms precisas.

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

2. En segundo lugar, Engle expone la validez de estos modelos para determinar los criterios de mantenimiento o venta de activos financieros. Los agentes econmicos deciden esta cuestin en funcin de la informacin proveniente del pasado respecto al valor medio de su rentabilidad y la volatilidad que sta ha tenido. Con los modelos ARCH se tendran en cuenta estos dos condicionantes. 3. El modelo de regresin ARCH puede ser una aproximacin a un sistema ms complejo en el que no hubiera factores innovacionales con heterocedasticidad condicional. Los modelos estructurales admiten, en multitud de ocasiones, una especificacin tipo ARCH infinito que determina con parmetros cambiantes, lo que hace a este tipo de modelos capaces de contrastar la hiptesis de permanencia estructural que supone una de las hiptesis de partida y condicin necesaria para la validez del modelo economtrico tradicional.. Esta series tienen poca estructura en la media y siguen paseos aleatorios o procesos AR de orden bajo y coeficiente pequeo. Adems puede ocurrir que aunque la serie de rendimientos parezca un ruido blanco, su distribucin no sea normal, y muestre colas pesadas y alta curtosis; y que los datos estn casi incorrelados, pero al calcular las autocorrelaciones de los cuadrados se observa una fuerte estructura de dependencia. Otra propiedad es que la varianza de los residuos no es constante y aparecen rachas de mayor variabilidad seguida de rachas de menor variabilidad. Por eso se plantean este tipo de modelos, es decir, van a ser modelos con varianza marginal constate, y varianza condicionada a los valores del pasado de la serie no constante, ya que depende de estos valores previos. El modelo ARCH (AutoRegressive Conditional Heteroscedastic), supone que la varianza condicional depende del pasado con estructura autorregresiva. Estos modelos fueron generalizados por Bollerslev (1986) para dar lugar a los modelos GARCH que incorporan a esta dependencia trminos de media mvil. Proporcionan buenos ajustes con p y q pequeos (la mayora de las series temporales financieras pueden modelizarse correctamente con un GARCH(l,l)). Bollerslev(1986) proporciona la justificacin terica de esta ltima afirmacin expresando los procesos GARCH(p,q) como un ARCH(). Otra propiedad importante de los modelos GARCH, de inters en el rea financiera, es que son una aproximacin a procesos de difusin. As, Nelson(1990) prueba la convergencia del modelo GARCH(l,l) con errores condicionales normales a un proceso de difusin continuo con distribuciones estacionarias no condicionadas t. Otra clase de modelos ms flexible son los modelos de volatilidades estocsticas (SV) introducidos por Harvey, Ruiz y Shephard (1994) y Jacquier y Polson y Rossi. Estos modelos reproducen algunas de las propiedades tpicas de las series financieras, tales como exceso de curtosis, agrupamiento de los periodos de la volatilidad, correlacin en los cuadrados de la serie,Se difiere de los anteriores en que la

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

volatilidad es una componente no observable cuyo logaritmo suele modelizarse mediante un proceso lineal autorregresivo. En resumen, al considerar la volatilidad como un proceso estocstico se busca ajustar un modelo que permita describir y analizar su comportamiento presente y a partir de ste su comportamiento futuro. Para el caso de procesos de varianza constante la metodologa de Box-Jenkins ha sido ampliamente utilizada, sin embargo, este supuesto no es sostenible en varias reas de investigacin, por lo que se deben consideran otras alternativas. Dentro de estas alternativas, destacamos los modelos ARCH (Autorregresive Condicional Heterocedastic) y GARCH (Generalized Autorregresive Condicional Heterocedastic) propuestos por Engle (1982) y Bollerslev (1986) respectivamente, modelos que permiten especificar el comportamiento de la varianza. As como son los modelos de volatilidades estocstica (SV) introducidos por Harvey, Ruiz y Shephard (1994) y Jacquier y Polson y Rossi.

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

2.MODELOS SARIMA
Vamos a describir los modelos ARIMA como uno de los mtodos de prediccin basados en series temporales. La metodologa que seguiremos es la propuesta por Box-Jenkins, que consta de cuatro etapas: 1. Identificacin Consiste en elegir uno o ms modelos ARIMA, SARIMA como candidatos que pueden representar adecuadamente el comportamiento de la serie. En sta etapa deben determinarse las transformaciones necesarias para conseguir estacionariedad, contraste de inclusin de un trmino de tendencia determinstica (0) y elegir los rdenes p y q para cada uno de los modelos competitivos. 2. Estimacin Consiste en estimar los parmetros de cada uno de los modelos identificados en la fase anterior. 3. Diagnosis (Validacin) Trata de determinar si los modelos identificados y estimados son adecuados para representar a los datos. Las deficiencias encontradas en sta etapa pueden utilizarse cmo informacin para reformular los modelos. 4. Prediccin Con los modelos que han sido diagnosticados favorablemente, se pueden realizar predicciones. Esta etapa tambin puede poner de manifiesto qu modelos poseen deficiencias a la hora de predecir, y puede utilizarse como herramienta de validacin de los modelos. Para evaluar la calidad del ajuste teniendo en cuenta el nmero de parmetros estimados en el modelo y la verosimilitud, existe el criterio AIC (Criterio de informacin de Akaike); cuanto ms pequeo sea el valor del criterio de informacin, mejor ser el modelo.

2.1.FORMULACIN GENERAL MODELOS ARIMA


Vamos a realizar la formulacin general que presenta el modelo ARIMA de rdenes p, d y q, es decir, el modelo ARIMA(p,d,q) es la siguiente: donde es la variable de estudio, c una constante y es el trmino de error o residuo, . El trmino que sigue una distribucin normal de media cero y varianza constante 1 se aplica a la serie original para convertirla en estacionaria, y d corresponde al orden de la parte I del modelo ARIMA. y son polinomios de orden p y q que dependen del operador de retardo B.
7
Alumno: Manuel Quesada Pegalajar

1 (1)

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

El operador de retardo B est definido por: .

El polinomio se define como:

El polinomio se define como

donde y donde 1, , son los coeficientes del polinomio . p es el nmero de trminos del polinomio y el orden correspondiente a la parte AR del modelo ARIMA.
1 (3)

1 (2)

donde y donde 1, , son los coeficientes del polinomio . q es el nmero de trminos del polinomio y el orden correspondiente a la parte MA del modelo ARIMA. Por tanto, si sustituimos (2) y (3) en la expresin (1) se obtiene: 1 1 1

Los residuos , , 1, , se obtiene de la ecuacin anterior: 1 1

En conclusin, el modelo ARIMA est compuesto de tres partes: una parte AR de orden p, una parte I de orden d y una parte MA de orden q. El nmero de trminos para los polinomios y , es decir, los rdenes de la parte AR y MA respectivamente, as como el orden de la parte I del modelo ARIMA se determinan en el siguiente paso (utilizando la metodologa de Box-Jenkins) que explicaremos a continuacin, y dependen de la serie temporal para la cual se realiza el estudio. Nota: el modelo definido (1) relaciona la variable con sus pasados a travs del polinomio , y el error presente con los errores pasados a travs del polinomio .

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

2.2.PASOS EN LA CONSTRUCCIN DE LOS MODELOS ARIMA


PASO 1: Identificacin de los trminos del Modelo. En este paso vamos a identificar el nmero de trminos de los polinomios y , es decir, vamos a determinar el valor de p y q, as como el orden de la parte I del modelo ARIMA. En este punto procederemos de la siguiente forma: Anlisis inicial de la serie. Vamos a identificar las principales caractersticas de la serie temporal: - Alta frecuencia - Comportamiento no estacionario. - Presencia de estacionalidad de los datos. Cuanto menor es el tiempo transcurrido entre dos datos de la serie, mayor es la frecuencia de la serie. La alta frecuencia es una caracterstica intrnseca que no puede corregirse. Para la correccin de la no estacionariedad se pueden realizar dos tipos de transformaciones (vase el anexo A) sobre la serie original de datos: Para estabilizar la varianza normalmente se toman transformaciones de BoxCox: logaritmo, raz cuadrada, etc. Tambin sirven estas transformaciones para obtener normalidad a los datos (ver Apndice A). Para estabilizar la media se toman diferenciaciones del tipo:
1 1, ,

Existe estacionalidad en los datos cuando los datos que componen la serie presentan un comportamiento cclico o peridico. Por ejemplo, para la serie de precios de la energa elctrica existe estacionalidad diaria, un da suele ser parecido al da anterior; es decir, los martes tienden a ser similares a los lunes, los mircoles similares a los martes, y as sucesivamente. La serie de precios tambin presenta estacionalidad semanal, un da suele ser parecido al mismo da pero de la semana anterior; es decir, los lunes tienden a ser similares a los lunes, los martes similares a los martes, y as sucesivamente. Si los datos presentan estacionalidad, la formulacin del modelo ARIMA resulta:
1 1

donde s representa el tipo de estacionalidad que presentan los datos, s = 24 en el caso de estacionalidad diaria y/o s = 168 en el caso de estacionalidad semanal. D corresponde a la parte I del modelo ARIMA estacional. Normalmente D toma los valores 1 y 2. s y son polinomios que dependen del operador de retardo B .
9
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

El polinomio se define como: donde


y 1, , son los coeficientes del polinomio ; P es el nmero de trmino del polinomio de y el orden correspondiente a la parte AR del modelo ARIMA estacional.

El polinomio se define como: donde


y 1, , son los coeficientes del polinomio ; P es el nmero de trmino del polinomio de y el orden correspondiente a la parte MA del modelo ARIMA estacional. Estos modelos ARIMA con una estacionalidad se denota como SARIMA(p,d,q)x(P,D,Q)s.

1
1

Estudio de la funcin de autocorrelacin (FAC) y la funcin de autocorrelacin parcial (FACP). A travs de la representacin de estas funciones se determinan los rdenes p, d, q del modelo ARIMA y los rdenes P, D y Q del modelo ARIMA estacional.

La representacin grfica del coeficiente de autocorrelacin es lo que se denomina FAC. Cuya expresin es: 1 1

1 2 2 Considerando la serie 1 2 2 1 1 1, , , donde , , , , son los valores estimados

es la media de . Donde

Las series se obtienen mediante tcnicas de regresin.


10

1, , donde , , , , son los valores estimados de los parmetros que componen el modelo de regresin entre la serie y cada una de las series , , , , . Adems es la serie que recoge la parte de no explicada por cada una de las series , , , , .

de los parmetros que componen el modelo de regresin entre la serie y cada una de las series , , , , . Adems es la serie que recoge la parte de no explicada por cada una de las series , , , , . Y la serie 1 1 2 2 2 2 1 1

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

El coeficiente de autocorrelacin parcial de orden k es el coeficiente de correlacin entre , ya que se han calculado con separacin k. El coeficiente de autocorrelacin parcial de orden k se define como: , 1 1 1

Donde y son las medias de las series ,respectivamente y T es el nmero de componentes de las series , . Una vez definidos los coeficientes anteriores se estabiliza la varianza, aplicando la transformacin de Box-Cox necesaria, a continuacin se identifican los rdenes d y D del modelo ARIMA y por ltimo se identifican los rdenes p, q, P y Q. Para identificar los rdenes d y D del modelo, se representa la FAC de la serie. Si se observa un patrn de comportamiento peridico en los mltiplos de s como en 12, 24, 36, con decrecimiento lento a cero es necesario incluir D (generalmente 1 o 2). Si los primeros valores son elevados con un decrecimiento muy lento, entonces d debe de incluirse en el modelo. Los patrones que deben seguir la FAC y la FACP para la identificacin de los rdenes del modelo ARIMA. El patrn que deben seguir la FAC y la FACP para la identificacin del orden de un modelo puro AR(p) es el siguiente: la FACP presenta los p primeros valores distintos de cero y el resto de valores son cero o muy prximos a cero con un comportamiento sinusoidal, y la FAC presenta un decrecimiento exponencial y/o un comportamiento sinusoidal. El patrn que deben seguir la FAC y la FACP para la identificacin del orden de un modelo puro MA(q) es el siguiente: la FAC presenta los q primeros valores distintos de cero y el resto de valores son cero o muy prximos a cero con un comportamiento sinusoidal, y la FACP presenta un decrecimiento exponencial y/o un comportamiento sinusoidal. El patrn que deben seguir la FAC y la FACP para la identificacin de los rdenes p y q de un modelo ARMA(p,q) es una superposicin de los patrones que presentan estas funciones para un modelo AR y MA: en la FAC, q p + 1 valores iniciales distintos de cero y a continuacin un decrecimiento exponencial y/o un comportamiento sinusoidal debido a la parte AR; y en la FACP, q p + 1 valores iniciales distintos de cero seguidos de un decrecimiento exponencial y/o un comportamiento sinusoidal debido a la parte MA.

11

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Con todo esto queda establecido cmo identificar los rdenes p y q correspondientes a la parte no estacional del modelo ARIMA. Para la identificacin de los rdenes P y Q, correspondientes a la parte estacional del modelo ARIMA, el procedimiento es similar, con la diferencia de que en lugar de observar los primeros valores de la FAC y la FACP se observan los valores que presentan un comportamiento peridico. Por ejemplo, en el caso que se presente estacionalidad diaria (s = 24) los valores que habra que observar son el 24, el 48, el 72, el 96, A modo de resumen presentamos el siguiente cuadro:

FAC Decrece exponencialmente o cmo una sinusoide amortiguada

FACP

AR (p)

Corta tras el retardo p

MA (q)

Corta tras el retardo q

Decrece exponencialmente o cmo una sinusoide amortiguada Decrece

ARMA (p, q)

Decrece

PASO 2: Estimacin de los parmetros del Modelo. Una vez identificados los trminos que contiene el modelo se estiman los parmetros que lo constituyen. La estimacin de los parmetros del modelo se puede hacer a travs de por medio de diferentes mtodos. El mtodo ms utilizado es el mtodo de verosimilitud, aunque en los modelos autorregresivos, la estimacin utilizada es el mtodo de los momentos. La maximizacin de la funcin de verosimilitud es no lineal en el sentido de que la funcin a maximizar no es una funcin cuadrtica de los parmetros desconocidos. Esta maximizacin es por tanto realizada numricamente. Por ello, la convergencia al mximo ser ms rpida si se parte de un valor inicial de los parmetros prximo al valor de convergencia. Hay distintos mtodos para el clculo de estos valores iniciales, dos de ellos para el caso autorregresivo (mtodo de Yule-Walker y algoritmo de Burg) y otros dos para un caso general (algoritmo de las innovaciones y algoritmo de HannanRissanen).
12
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

El mtodo de Yule-Walker, es un mtodo de estimacin que se utiliza para procesos autorregresivos puros. Consiste en plantear el sistema de ecuaciones de YuleWalker y proceder a su resolucin sustituyendo en dicho sistema las autocorrelaciones por sus estimaciones. Por tanto, se iguala momentos tericos con estimados. Si la serie tiene estructura AR(p): , 1 1

las ecuaciones de Yule-Walker se obtienen calculando las covarianzas o correlaciones de con 1 con lo que obtenemos la ecuacin en diferencias:

Como estas funciones son pares, podemos plantear un sistema de p ecuaciones con p incgnitas. Al resolverlas obtenemos la estimacin de los parmetros , sustituyendo los valores de las covarianzas o correlaciones tericas por sus estimaciones muestrales. El valor de la varianza de se obtiene de la ecuacin:

ecuacin para k = 0.

Las covarianzas del modelo terico as obtenido coinciden con las muestrales para los valores k = 0,1,,p. Para tamaos muestrales grandes, la distribucin del estimador as obtenido es: donde ,,, es la matriz que contiene las covarianzas y aparece en la
, ,

formulacin del sistema de ecuaciones de Yule-Walker. Si se reemplaza y por sus estimaciones, podemos calcular regiones de confianza para muestras de tamao elevado. As un intervalo de confianza para un valor vendr dado por:

, y una regin para el vector completo: donde es el elemento ii de

13

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Por tanto este mtodo proporciona la estimacin de los parmetros bajo la hiptesis de que la FAC estimada coincida con la terica para los primeros retardos. El algoritmo de Burg es otro mtodo muy parecido al anterior. Se usa tambin en el caso de un proceso autorregresivo puro. Los estimadores son precisamente los coeficientes del mejor predictor lineal en funcin de las p observaciones anteriores, bajo la hiptesis de que su funcin de autocorrelacin coincide con la funcin de autocorrelacin muestral en los retardos 1,,p. La diferencia con el mtodo de Yule-Walker se basa en que el coeficiente que multiplica a Bp, es decir el ltimo factor del polinomio de retardos, se calcula minimizando los errores de prediccin un paso hacia adelante y hacia atrs. Los coeficientes de los restantes factores Bk se calculan dividiendo la suma de los cuadrados de los errores de prediccin un paso adelante y hacia atrs del modelo ajustado (si es un AR(p) habr T-p en cada sentido) entre el nmero de sumandos ( es decir, 2(T-p)). El algoritmo de las innovaciones es vlido para procesos con estructura MA y ARMA. Consiste en ajustar modelos MA a los datos: ,

siendo 0, mediante el algoritmo siguiente: Sea , , , entonces ,


1, 1 ,

1, 1 , , , 0

1,1

As procedemos siguiendo la siguiente secuencia: , , , , ,

Nos vamos a apoyar en el siguiente teorema: Si con y si definimos 1 y 0 para j > q. Si y m (n) es una sucesin que verifica

m(n) pero
14

0. Entonces para todo k entero, la distribucin de

Alumno: Manuel Quesada Pegalajar

Converge a una distribucin normal multivariante de media cero y matriz de covarianza A = (aij), donde
,

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

, ,

, , no es estimador consistente de los parmetros sino Hay que observar que que se calcula al aumentar el orden del proceso MA y truncar los parmetros al nivel q, , , . es decir, Para procesos ARMA, y bajo la hiptesis de estacionariedad, el polinomio es invertible, y la representacin MA de la serie ser por tanto

Adems es un estimador consistente de .

donde los coeficientes satisfacen

As podemos estimar los coeficientes , , por el algoritmo de las innovaciones , , , . Reemplazar estos valores en la ecuacin anterior y calcular las estimaciones de y . En primer lugar, de las ltimas p ecuaciones, calculamos (los son nulos). , , , , , , , , , , ,

con 1 y 0 para j > q.

1,

0,1,

Y por ltimo determinamos los de las ecuaciones

15

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Finalmente: .

, ,

1, ,

El algoritmo de Hannan-Rissanen es vlido para procesos con estructura AR(p), tiene la expresin de un modelo de regresin, por tanto, una estimacin preliminar puede hacerse usando mnimos cuadrados, y ARMA(p,q), es algo ms complicado porque depende de cantidades no observadas . Sin embargo, se puede aplicar este procedimiento (mnimos cuadrados) si reemplazamos por estimaciones suyas. As el algoritmo consta de los siguientes pasos: Paso 1: Ajustamos un modelo AR(m) de orden alto ( m > mx{p,q}) usando por , , . ejemplo Yule-Walker. As obtenemos Paso 2: Estimamos los residuos del modelo anterior , 1, ,

Paso 3: Estimamos los parmetros , , , , , mediante una regresin mnimo cuadrtica sobre y , minimizando

Con respecto a , es decir: Paso 4: Por ltimo,

, ,

Vamos a explicar la estimacin de los parmetros mediante la minimizacin de la suma de los residuos al cuadrado.

16

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Consiste en minimizar:

1 1 1 1, ,

Sujeto a:

Donde son las races del polinomio ( 0) y son las races del polinomio ( 0). La primera restriccin se aplica para asegurar que el modelo AR(p) cumple la condicin de estacionariedad, y la segunda restriccin se aplica para asegurar que el modelo MA(q) cumple la condicin de invertibilidad.

1 1, ,

La sumatoria de los residuos al cuadrado comienza en , 1 , ya que no se dispone de datos para las series y , t = 1,2,,T, cuando 1 t < 1. es un ruido blanco que se genera de forma aleatoria.

El vector de parmetros a estimar es , , , , , , . Al resolver este problema se obtienen los valores estimados de los parmetros que componen el modelo. Por tanto, el modelo estimado queda: 1 1 1

Los residuos estimados son:

1 (4) 1

que han de comportarse como ruido blanco si el modelo es correcto. PASO 3: Validacin de Modelo. Para asegurar la validez e idoneidad del modelo y la efectividad de las predicciones, los residuos estimados (4) se deben comportar como un ruido blanco. Un ruido blanco es una serie de datos que se caracteriza por tener distribucin normal, media y covarianza nulas y varianza constante. Para comprobar que los residuos estimados obtenidos segn (4) son ruido blanco: Representamos FAC y la FACP para los residuos: si los residuos estimados segn (4) son ruido blanco, tanto en la FAC como en la FACP de estos residuos
Alumno: Manuel Quesada Pegalajar

17

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

no debe aparecer ningn valor significativo; es decir, los valores de estas funciones deben ser muy pequeos y estar dentro de las bandas de confianza 196 196 ,

Estas son bandas asintticas al 95 % de confianza, donde T es el nmero de valores de la serie . Test de Ljung-Box: este test indica si existe dependencia entre los m primeros residuos estimados (4), es decir, si estos residuos presentan correlacin no nula. El estadstico de Ljung-Box se define como:
2

Donde es el coeficiente de autocorrelacin de los residuos estimados segn (4).T es el nmero de valores de la serie y r es el nmero de parmetros estimados. Este estadstico, Q, se distribuye como una Chi-cuadrado con un nmero de grados de libertad igual al nmero de coeficientes utilizados en la suma, m, menos el nmero de parmetros estimados r menos 1 (m-r-1). En la mayora de los casos es suficiente con representar la FAC y FACP, ya que si no presentan valores significativos, el valor del estadstico Q ser pequeo, y por tanto se puede considerar que existe independencia entre los residuos. Si se comprueba que el modelo es adecuado, se puede continuar con el procedimiento y calcular las predicciones. En caso contrario, se estudia el comportamiento de los residuos estimados segn (4), lo que ayuda a identificar un nuevo modelo; se vuelve al paso 2 y se repite todo el proceso. PASO 4: Prediccin. Despus de obtener el modelo y comprobar su validez, se puede proceder a predecir. , es el valor esperado de condicionado La prediccin ptima de , a que se conoce , , , , es decir, la esperanza condicionada de conocido , , , . De forma anloga se procede con los residuos. Por lo tanto:
| , ,
Alumno: Manuel Quesada Pegalajar

18

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

| , ,

Donde T representa el origen de la prediccin y k el horizonte de la misma. Las frmulas correspondientes a las predicciones que se quieren obtener, segn el modelo estimado, son:
1

Tomando esperanzas condicionadas en la expresin anterior, la ecuacin de prediccin para el modelo ARIMA estimado es la siguiente:
1 1 1

Donde

0 es el valor de la serie en el tiempo T+j. 0 es el valor de la serie en el tiempo T+j. 0 0

0 es la prediccin obtenida para la serie en el tiempo T+j.

2.3.EJEMPLO DE MODELIZACIN
Realizaremos un ejemplo para ilustra los pasos a seguir en la construccin de un modelo ARIMA. Se dispone de una serie de datos correspondiente a los precios horarios de electricidad de un mercado de energa elctrica , t = 1,,T donde T = 148 (vase el Anexo A). En primer lugar, se analiza esta serie de datos y se estudia el comportamiento que presenta. Presentamos a continuacin, la representacin grfica de la serie :

19

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

PASO 1: Identificacin del modelo. modelo En primer lugar estudiamos la estacionariedad. estacionariedad Si observamos la grfica de la serie se aprecia que la media no es constante. Veamos qu ocurre si dibujamos la FAC.

La FAC presenta un comportamiento tpico de una serie no estacionaria, ya que los primeros valores de la funcin son muy elevados con un decrecimiento muy lento a cero. Por lo tanto, se confirma la necesidad de aplicar una diferenciacin de orden 1 a la serie . Esta diferenciacin de orden 1 se define como

A continuacin, , se representa la serie orden:

una vez tomada la diferenciacin de primer

20

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Despus de diferenciada la serie, para poder identificar los trminos del modelo ARIMA, es necesaria la representacin de la FAC y de la FACP. Por lo tanto, se toma la diferenciacin de orden 1 a la serie y se representa su FAC y FACP, que mostramos a continuacin:

FAC con c diferenciacin de orden 1 de

FACP con diferenciacin de orden 1 de

21

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

La FAC no tiene persistencia luego no es necesaria otra diferenciacin. Podemos plantear 4 modelos: Modelo ARIMA(2,1,0). Debido a que la FACP corta en el segundo retardo y la FAC presenta un decrecimiento exponencial. . El modelo al que se ajusta la serie presenta la forma: Modelo ARIMA(0,1,2). Debido a que la FAC corta tras el retar 2 y la FACP decrece exponencialmente. . El modelo al que se ajusta la serie presenta la forma: 1 1 1

Modelo ARIMA(1,1,1). Los valores de la FAC como los de la FACP presentan un decrecimiento exponencial para los primeros valores seguidos de un comportamiento sinusoidal con valores prximos a cero para los siguientes, y el primer valor es ms significativo que el resto. El modelo al que se ajusta la serie presenta la forma: 1 1 1

Modelo ARIMA(2,1,1). Los valores de la FAC como los de la FACP presentan un decrecimiento exponencial para los primeros valores seguidos de un comportamiento sinusoidal con valores prximos a cero para los siguientes, presentando dos retardos significativos al resto. El modelo al que se ajusta la serie presenta la forma: 1 1 1

PASO 2 y 3: Estimacin de los parmetros y validacin del modelo.

A continuacin para cada uno de los modelos propuestos anteriormente vamos a realizar la estimacin y validacin. Y determinaremos de los 4 modelos cual es el que mejor se adapta a nuestra serie. Utilizaremos SPSS versin 15 para obtener la estimacin de los parmetros del modelo. Para el modelo ARIMA(1,1,1), obtendremos los valores estimados para los parmetros y y la constante c:

22

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Estimaciones de los parmetros Retardos no estacionales Constante

AR1 MA1

Estimaciones ,837 ,606 ,391

Error tpico ,097 ,142 ,262

t 8,633 4,261 1,492

Sig. aprox. ,000 ,000 ,138

Se ha utilizado el algoritmo de Melard para la estimacin.

Obtenemos por tanto que el valor estimado para es 0.837, , el valor estimado para es 0.606 y el valor estimado imado para la constante c es 0.391. 0.391 Si nos fijamos en la significacin, parece ser que la constante no es necesaria para explicar el modelo. Por lo tanto, estimamos el modelo sin constante, obteniendo:
Estimaciones de los parmetros Retardos no estacionales AR1 MA1 Estimaciones ,877 ,636 Error tpico ,073 ,118 t 12,068 5,366 Sig. aprox. ,000 ,000

Se ha utilizado el algoritmo de Melard para la estimacin.

Obtenemos por tanto que el valor estimado para es 0.877, , el valor estimado para es 0.636. Por tanto el modelo tiene la siguiente forma:

A continuacin, se realiza un estudio de los residuos estimados y se observa su comportamiento. Los residuos estimados deben ser ruido blanco. Para ello, se observa la FAC y la FACP, que se representan a continuacin:

FAC de los residuos estimados para el modelo ARIMA(1,1,1)

23

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

FACP de los residuos estimados para el modelo ARIMA(1,1,1) (1,1,1)

Los residuos estimados son ruido blanco, ya que tanto la FAC como la FACP no presentan ningn valor significativo. Todos los valores se encuentran dentro de las bandas de confianza. Por lo tanto, se puede pued concluir que el modelo es adecuado para predecir.
Diagnstico residual Nmero de residuos Nmero de parmetros GL residuales Suma de cuadrados residual corregida Suma de cuadrados residual Varianza residual Error tpico del modelo Log-verosimilitud Criterio de informacin de Akaike (AIC) Criterio bayesiano de Schwarz (BIC) 147 2 145 264,795 275,157 1,822 1,350 -251,845 507,690 513,671

Para el modelo ARIMA(2,1,0), ARIMA(2,1,0) obtendremos los valores estimados para los parmetros y la constante c:
Estimaciones de los parmetros Retardos no estacionales Constante AR1 AR2 Estimaciones ,250 ,202 ,403 Error tpico ,082 ,082 ,203 t 3,062 2,464 1,983 Sig. aprox. ,003 ,015 ,049

Se ha utilizado el algoritmo de Melard para la estimacin.

es 0.250, , el valor estimado para Obtenemos por tanto que el valor estimado para es 0.202 y el valor estimado imado para la constante c es 0.403. 0. Si nos fijamos en la
24
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

significacin, parece ser que todos los parmetros son necesarios para explicar el modelo. Por tanto el modelo tiene la siguiente forma:

A continuacin, se realiza un estudio de los residuos estimados y se observa su comportamiento. Los residuos estimados deben ser ruido blanco. Para ello, se observa la FAC y la FACP, que se representan a continuacin:

FAC de los residuos estimados para el modelo ARIMA(2,1,0)

FACP de los residuos estimados para el modelo ARIMA(2,1,0) )

Los residuos estimados son ruido blanco, ya que tanto la FAC como la FACP no presentan ningn valor significativo. Todos los valores se encuentran dentro de las bandas de confianza. Por lo tanto, se puede concluir que el modelo es adecuado para predecir.
Alumno: Manuel Quesada Pegalajar

25

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Diagnstico residual Nmero de residuos Nmero de parmetros GL residuales Suma de cuadrados residual corregida Suma de cuadrados residual Varianza residual Error tpico del modelo Log-verosimilitud Criterio de informacin de Akaike (AIC) Criterio bayesiano de Schwarz (BIC) 147 2 144 267,147 267,147 1,853 1,361 -252,504 511,008 519,979

Para el modelo ARIMA(0,1,2), obtendremos los valores estimados para los parmetros , y la constante c:
Estimaciones de los parmetros Retardos no estacionales Constante MA1 MA2 Estimaciones -,241 -,170 ,413 Error tpico ,082 ,082 ,161 t -2,928 -2,066 2,570 Sig. aprox. ,004 ,041 ,011

Se ha utilizado el algoritmo de Melard para la estimacin.

Obtenemos por tanto que el valor estimado para es -0.241, el valor estimado para es -0.170 y el valor estimado para la constante c es 0.413. Si nos fijamos en la significacin, parece ser que todos los parmetros son necesarios para explicar el modelo. Por tanto el modelo tiene la siguiente forma: 0.413 1 0.241 0.170

A continuacin, se realiza un estudio de los residuos estimados y se observa su comportamiento. Los residuos estimados deben ser ruido blanco. Para ello, se observa la FAC y la FACP, que se representan a continuacin:

26

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

FAC de los residuos estimados para el modelo ARIMA(0,1,2)

FACP de los residuos estimados para el modelo ARIMA(0,1,2) )

Los residuos estimados no son ruido blanco, ya que para los primeros retardos se observa que se salen de las bandas de confianza. Por lo tanto, no se puede concluir que el modelo es adecuado para predecir.

27

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Diagnstico residual Nmero de residuos Nmero de parmetros GL residuales Suma de cuadrados residual corregida Suma de cuadrados residual Varianza residual Error tpico del modelo Log-verosimilitud Criterio de informacin de Akaike (AIC) Criterio bayesiano de Schwarz (BIC) 147 2 144 276,366 284,989 1,918 1,385 -254,999 515,997 524,969

Para el modelo ARIMA(2,1,1), obtendremos los valores estimados para los parmetros , , y la constante c:
Estimaciones de los parmetros Retardos no estacionales Constante AR1 AR2 MA1 Estimaciones ,769 ,046 ,558 ,390 Error tpico ,249 ,135 ,239 ,260 t 3,090 ,336 2,337 1,497 Sig. aprox. ,002 ,737 ,021 ,137

Se ha utilizado el algoritmo de Melard para la estimacin.

Obtenemos por tanto que el valor estimado para es -0.241, el valor estimado para es 0.046, el valor de es de 0.558 y el valor estimado para la constante c es 0.390. Si nos fijamos en la significacin, parece ser que el parmetro y la constantes no son necesarios para explicar el modelo. Por lo tanto este modelo no es bueno para explicar este conjunto de datos. Para determinar cul de los tres modelos es mejor, nos vamos a basar en la comparacin del criterio de Akaike. Para el modelo ARIMA(1,1,1) el valor AIC es de 507.609. Para el modelo ARIMA(2,1,0) el valor AIC es de 511,008. Para el modelo ARIMA(0,1,2) el valor AIC es de 515,997. Por tanto, el mejor modelo para estimar la serie es el modelo ARIMA(1,1,1) ya que tiene un valor AIC menor al de los otros modelos. PASO 4: Prediccin. En los pasos anteriores hemos obtenido el modelo y adems hemos comprobado su idoneidad para poder predecir. La frmula de prediccin para el modelo obtenido es: 0.313 1 2 1 0.296 0.122 1
28
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Se dispone de datos hasta el tiempo T y se quieren realizar dos predicciones. Se quiere predecir el valor de la serie para t = 149 y para t = 150, es decir, 1 y 2 . Para el clculo de las predicciones basta con sustituir k = 1 y k = 2 en la frmula de prediccin. Para k = 1 la frmula de prediccin queda: 1 0.313 0 1 0 0.296 0.122 0 1 0 261.8 es el valor real de la serie en el tiempo T. Donde

1 262.8 es el valor real de la serie en el tiempo T-1.

0 1.0358 es el valor de la serie de residuos en el tiempo T. Sustituyen cada uno de los valores se calcula la prediccin para t = 149, 1. El valor obtenido para la prediccin es 1 261.66. Para k = 2 la frmula de prediccin queda: 2 0.313 1 0 1 0.296 0.122 1 2 1 0 es el valor de la serie de residuos de en el tiempo T+1.

Donde

1 261.66 es el valor predicho de la serie en el tiempo T+1. 0 262.8 es el valor real de la serie en el tiempo T. 1 0 es el valor de la serie de residuos en el tiempo T+1.

Sustituyen cada uno de los valores se calcula la prediccin para t = 150, 2. El valor obtenido para la prediccin es 2 261.91. Calculamos los errores obtenidos al realizar cada una de las predicciones. El error se calcula a travs de la siguiente expresin:

2 0 es el valor de la serie de residuos de en el tiempo T+2.

29

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Vamos a presentar una tabla con estos errores, junto con los valores reales y los predichos de la serie : Valor Real 261.2 262.7 Valor Predicho 261.66 261.91 Error (%) 0.2 0.3

| |

Calculamos el error total mediante la siguiente expresin: Se obtiene un error total de 0.25 %.

| |

30

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

3.MODELOS ARCH Y GARCH 3.1.MODELO ARCH


En la prctica los modelos del tipo lineal de series de tiempo tales como ARIMA(p,d,q) o los modelos causales de regresin lineal, no siempre resultan los ms adecuados para analizar y predecir adecuadamente un proceso real. Por tal motivo se han propuestos modelos no lineales con la consecuencia de desarrollar mtodos de estimacin apropiados para estos casos as como los test que permitan validar los resultados. Muchas series temporales econmicas, y especialmente series financieras, muestran cambios en los momentos condicionados de segundo orden. Estos cambios tienden a estar correlacionados serialmente, en el sentido de que cambios de gran magnitud en el valor de la serie son seguidos por grandes cambios (periodos de mucha volatilidad) mientras que a cambios pequeos en el valor de la serie les siguen cambios pequeos (periodos de poca volatilidad). Es decir, esto se traduce, en la presencia de correlaciones positivas en la serie de los cuadrados. Adems se produce un exceso de curtosis o la ausencia de correlacin en los niveles. Fue Engle quien proporcion una serie de modelos que tratan de representar este comportamiento de la serie. La formulacin bsica de estos modelos consiste en modelizar la serie segn la siguiente ecuacin:

La condicin de independencia entre , garantiza que la serie tenga media marginal igual a cero: 0 | | 0

Donde (proceso de ruido blanco formado por variables aleatorias normales independientes de media cero y varianza unidad) y (factor denominado volatilidad) son procesos estacionarios independientes entre s.

Y lo mismo ocurre con la media condicional que es nula:

La varianza marginal de tiene que ser constante, . Esta varianza se calcula como: Sin embargo la varianza condicionada no es constante:
1 | |

31

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

siendo

La condicin de independencia entre , adems de garantizar que la serie tenga media marginal igual a cero, nos garantiza que la serie carezca de autocorrelacin y forme un proceso de ruido blanco. Sin embargo, la serie no es de variables independientes. A continuacin vamos a estudiar el comportamiento de este modelo en los casos ms simples: modelo ARCH(1) (la varianza condicional depende de un retardo de la serie), como es lgico, este ruido blanco podra tomarse como el comportamiento de los errores provenientes de un modelo de regresin dinmico dado por donde es un vector de variables predeterminadas que incluye los trminos de en periodos anteriores y el vector de parmetros que tendra que estimarse, este modelo de regresin se denomina modelo de regresin ARCH, en el sentido de que ahora es el trmino de error de un modelo de regresin el que adopta una estructura ARCH, y consideraremos r retardos y describiremos el modelo ARCH(r).

Por tanto, , representa la varianza condicionada de la serie en cada instante , que va variando con cierta estructura estacionaria.

| 1

3.1.1.MODELO ARCH(1)

Para el modelo ARCH(1), su varianza condicional tiene una estructura similar a un AR(1), y por tanto solo depende del ltimo valor observado:
|

es alto, la varianza de la Por tanto, esta ecuacin establece que si el valor de siguiente observacin condicionada a este valor ser tambin alta. Esto va a producir correlacin entre los cuadrados de la serie, provocando rachas de valores de magnitud relativamente elevada o con mayor varianza. Pero como la media marginal y la condicionada vale cero, aunque la varianza condicionada sea alta, siempre es posible que aparezca un valor pequeo de , que disminuir la varianza condicionada de la observacin siguiente y facilitar que la siguiente observacin sea pequea en valor absoluto. De manera que la serie puede presentar rachas de valores altos, pero globalmente ser estacionaria.

donde 0 (corresponde a la mnima varianza condicional observada) y 0 1 (es una condicin necesaria y suficiente para la existencia de la varianza incondicional y la condicional).

La varianza marginal de la serie es el promedio de las varianzas condicionadas, que debe de ser mayor que y ser tanto mayor cuanto mayor sea el coeficiente que
32
Alumno: Manuel Quesada Pegalajar

transmite el efecto de la ltima observacin. Si llamamos a a la varianza marginal, entonces: Siendo y sustituyendo en 5 obtenemos: 5 |

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Adems, el modelo ARCH(1), establece dependencia de tipo AR(1) entre los cuadrados de las observaciones, por tanto:
(Nota: es un proceso de ruido blanco, formado por variables estacionarias incorreladas de media cero y varianza marginal constante).

0 1

Si llamamos a la funcin de autocorrelacin de los cuadrados de la serie, donde el subndice c se refiere a los cuadrados, se obtiene: 1

que indica que las autocorrelaciones de los cuadrados de las series tienen la estructura de un AR(1) con parmetro . Este modelo, una curtosis igual a:
1 3 1 6 1 3

Como 0, este coeficiente de curtosis es siempre mayor que 3, y puede ser mucho mayor. Por lo tanto, la distribucin marginal tendr colas pesadas. En resumen: Las esperanzas marginal y condicional son iguales a cero. La varianza marginal es constante La varianza condicional depende de los valores que haya tomado luego no es constante. La distribucin marginal del proceso ARCH(1) tiene una forma desconocida.

3.1.2.MODELO ARCH(r)
El modelo anterior puede generalizarse permitiendo una dependencia de la varianza condicional con r retardos. De manera que el modelo ARCH(r) para , la varianza condicional

33

Alumno: Manuel Quesada Pegalajar

donde 0 (corresponde a la mnima varianza condicional observada) y 0 1 (es una condicin necesaria y suficiente para la existencia de la varianza incondicional y la condicional). En este proceso las posibilidades de rachas de alta volatilidad depende de los r ltimos valores. La varianza marginal:
|

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Por tanto:

Si introducimos , como en el caso del proceso ARCH(1), ser un proceso de ruido blanco, formado por variables estacionarias incorreladas de media cero y varianza marginal constante, podemos expresar la dependencia de los cuadrados de las observaciones como un proceso AR(r):

siendo 1.

Estas variables no son independientes entre s ni de los regresores, ya que la positividad de exige que: As en un modelo ARCH(r) se verifica que: -

3.2.MODELO GARCH

Es un proceso de ruido blanco pero no es independiente y no est idnticamente distribuido. Las esperanzas condicional y no condicional son iguales a cero. La varianza no condicional es constante. La varianza condicional depende de , , , luego no es constante.

Un rasgo comn a muchas de las primeras aplicaciones empricas de los modelos ARCH es que requieren un gran nmero de parmetros autorregresivos y, para representar adecuadamente el comportamiento dinmico de la varianza, se impona una estructura fija de retardos. Con el fin de flexibilizar estas restricciones Bollerslev (1986) propuso el modelo ARCH generalizado o GARCH. La generalizacin del modelo ARCH al modelo GARCH tiene gran similitud con la extensin de los procesos autorregresivos, AR, a los autorregresivos de medias mviles, ARMA, permitiendo una representacin ms parsimoniosa de la volatilidad. Bollerslev considera que la varianza, , adems dependen de las observaciones pasadas de ,
34
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

depende tambin de su propio pasado. Esta dependencia se expresa incluyendo cierto nmero de retardos p de , de forma que la varianza condicional se define entonces como:

donde 0, 0, i = 1,,r, 0, j = 1,,p aunque estas restricciones se establecen para garantizar que la varianza sea positiva, Nelson y Cao (1992) demuestran posteriormente que la positividad de la varianza est asegurada bajo condiciones ms dbiles. En concreto demuestran que si el modelo GARCH de la ecuacin 6 admite una representacin ARCH, es suficiente exigir que los coeficientes del polinomio de retardos en dicha representacin sean todos positivos. El nuevo modelo se denomina GARCH(p,r), y se reduce al ya conocido ARCH(r) cuando p = 0. Bollerslev establece las condiciones de estacionariedad, probando que es dbilmente estacionario con 0, , 0 , Es importante la relacin que existe entre los modelos GARCH y ARMA ya que, si definimos ser un proceso de ruido blanco formado por variables estacionarias incorreladas de media cero y varianza marginal constante, podemos expresar la dependencia de los cuadrados de las observaciones del modelo GARCH como un proceso ARMA, segn la siguiente ecuacin:
,

1.

3.2.1.MODELO GARCH(1,1)
Muchos trabajos con series financieras, muestran que el ms sencillo de los modelos GARCH, el GARCH(1,1), es suficiente para modelizar con xito los cambios temporales en la varianza condicional, incluso sobre periodos muestrales largos. El modelo GARCH(1,1) se obtiene cuando p = r = 1, de forma que la varianza condicionada queda:

con 0, 0, 0. Si 1, la serie tiene varianza finita, y por ser una martingala en diferencias, es ruido blanco, de media cero y varianza

35

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Adems, Bollerslev prueba que si 2 1,el momento de orden 4 de existe y es finito, y la curtosis de es

Cuando 1, este valor es mayor que 3 y, por tanto, el proceso GARCH(1,1) estacionario es leptocrtico, propiedad que comparte con el modelo ARCH(1). Si p = r = 1, la ecuacin se escribe como:

31 1 2

el modelo GARCH(1,1) puede interpretarse como un proceso ARMA(1,1) para la serie , cuya funcin de autocorrelacin ser:
1

1 1 1 1 2 1
1 21 1 1
2

Mientras que

3.2.2.MODELO IGARCH

1,

superiores a 09. Teniendo en cuenta la forma de la funcin de autocorrelacin de , un valor de prximo a uno significa que dicha funcin apenas decrece, indicando que los cambios en la varianza condicional son relativamente lentos y, por tanto, los shocks (cambios bruscos) en la volatilidad persisten. Esta propiedad es interesante porque refleja precisamente una de las caractersticas tpicas de las series financieras: aunque la serie original est incorrelada, existe correlacin en la serie de los cuadrados y, adems, estas correlaciones decrecen lentamente, mostrando valores significativamente distintos de cero incluso para retardos altos.

En las aplicaciones de modelos GARCH(1,1) a series financieras, es casi sistemtica la obtencin de un valor estimado de prcticamente igual a uno, en especial si la frecuencia de observacin es alta. Por ejemplo, los trabajos de Engle y Bollerslev (1986), Bollerslev (1987), Baillie y DeGennaro (1989) y Hsieh (1989) con series de tipos de cambio, Chou (1988), Baillie y DeGEnnaro (1990) y Poon y Taylor (1992) con ndices de bolsa, y otros trabajos encuentran siempre valores de

Los resultados de los trabajos mencionados anteriormente justifican el inters de un modelo GARCH(1,1) en el que se imponga la condicin 1. El modelo
36
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

resultante, denominado GARCH integrado IGARCH, fue propuesto por Engle y Bollerslev (1986) y en l la ecuacin para la varianza condicionada es:

Donde es el operador de primeras diferencias, y es un proceso de ruido blanco, formado por variables estacionarias incorreladas de media cero y varianza marginal constante.

El modelo ya no es dbilmente estacionario, porque su varianza marginal no es finita. Sin embargo, se prueba fcilmente que la ecuacin admite una representacin de la forma:

La ecuacin anterior permite interpretar el modelo IGARCH(1,1) como un proceso MA(1) estacionario para las primeras diferencias de , lo que indica cierta analoga del modelo IGARCH(1,1) con el proceso ARIMA(0,1,1). Sin embargo, existen diferencias significativas entre ellos.

3.2.3.MODELO EGARCH
Nelson (1991) observ ciertas limitaciones en los modelos GARCH: Las condiciones impuestas sobre los parmetros para asegurar que no sea negativo son violadas en algunas aplicaciones empricas. El modelo GARCH es incapaz de modelizar una respuesta asimtrica de la volatilidad ante las subidas y bajadas de la serie.

Con el fin de solventar estas deficiencias, Nelson propuso un nuevo modelo GARCH exponencial o EGARCH. El modelo EGARCH garantiza la no negatividad de la varianza condicional formulando la ecuacin de la volatilidad en trminos de logaritmo de , mediante una representacin lineal del tipo:

Donde | | | |. A travs de esta funcin g, que depende del signo y de la magnitud de , el modelo EGARCH puede capturar una respuesta asimtrica de la volatilidad ante innovaciones de distinto signo, permitiendo as modelizar un efecto contrastado empricamente en muchas series financieras: las malas noticias (rendimientos negativos) provocan mayor aumento de la volatilidad que las buenas noticias (rendimientos positivos).

37

Alumno: Manuel Quesada Pegalajar

Por construccin, las perturbaciones son variables independientes e idnticamente distribuidas con media cero y varianza constante, y por tanto 7 puede considerarse como una representacin ARMA para la serie .

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

3.3.CONSTRUCCIN DE LOS MODELOS

Vamos a seguir los siguientes pasos para la construccin de estos modelos: identificacin, estimacin de los parmetros y diagnosis y validacin. PASO 1: Identificacin de los trminos del Modelo La identificacin de los modelos ARCH y GARCH, se efectan despus de ajustar un modelo ARIMA a la serie. Si existen efectos ARCH, los residuos del modelo ARIMA estarn incorrelados pero no sern independientes y este efecto ser visible en la funcin de autocorrelacin de los residuos al cuadrado, que mostrarn correlacin serial. Adems, si calculamos los coeficientes de autocorrelacin parcial de los residuos al cuadrado y el modelo para los residuos es ARCH puro, el nmero de trminos distintos de cero nos indicar, aproximadamente, el orden del proceso. Para detectar estructuras en los cuadrados podemos acudir a los contrastes de McLeod y Li (1983) y Pea y Rodrguez (2006). Adems de estos contrastes generales, que sirven para detectar una estructura general no lineal, pueden utilizarse contrastes especficos para detectarla. PASO 2: Estimacin de los parmetros del Modelo En cuanto a la estimacin de los modelos, todas las metodologas giran en torno a la aplicacin de dos: la primera es la de Mxima Verosimilitud y la segunda es el mtodo de momentos generalizados, ambos superan los inconvenientes que presenta el mtodo de mnimos cuadrados, en cuanto a su ineficacia para identificar el proceso que gobierna la evolucin de la varianza, adems ambos se aplican partiendo del modelo de regresin ARCH. Estimacin de los parmetros del modelo ARCH: Vamos a describir la estimacin de los parmetros a travs del mtodo de mxima verosimilitud. Para ello, se construye la funcin de verosimilitud utilizando la descomposicin del error de prediccin. Maximizando esta funcin se obtienen los estimadores mximo verosmiles. Como es habitual en modelos de series temporales, la funcin de verosimilitud se construye como el producto de las densidades condicionadas. Asumiendo que las perturbaciones en , son variables aleatorias independientes e idnticamente distribuidas con distribucin N(0,1), los modelos ARCH son condicionalmente gaussianos y la distribucin condicionada | es N(0, ). Por tanto, la expresin del logaritmo de la funcin de verosimilitud resulta ser: T 1 1 e ln L ln fe ; |e ln 2 ln 2 2 2

38

Alumno: Manuel Quesada Pegalajar

donde es el vector de parmetros desconocidos del modelo y fe ; |e denota la densidad condicionada de e dadas las observaciones previas hasta el instante t-1. Bajo ciertas condiciones de regularidad se demuestra que, si los momentos de primer y segundo orden estn correctamente especificados, los estimadores mximo verosmiles son consistentes y asintticamente normales. Para facilitar los clculos vamos a considerar el modelo ARCH(1). Su funcin de verosimilitud es: donde las funciones de densidad e |e son normales. Como , si consideramos , el valor de es una constante y la nica variable es que tiene distribucin normal. La media condicionada de la distribucin e |e es cero, y la varianza e . La log-funcin de verosimilitud condicionada a e ser: Le , , e | , 1 1 e T1 ln 2 ln 2 2 2 e
e 1 e e e

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

e , , e | , e e |e e |e

Derivando respecto a los parmetros, llamando e e igualando a cero se obtienen las ecuaciones:

Multiplicamos y dividimos el primer miembro por e y obtenemos: 1 e e e e e e

son las ecuaciones mnimo cuadrados para obtener los parmetros del modelo. Resolviendo este sistema obtenemos la estimacin de y .

Estimacin de los parmetros del modelo GARCH: Vamos a explicar, al igual que en el caso anterior, la estimacin de los parmetros a travs del mtodo de mxima verosimilitud.

39

Alumno: Manuel Quesada Pegalajar

Para ello vamos a considerar el modelo GARCH(r,s), donde , vamos a definir la funcin de verosimilitud de un proceso estacionario , llamando a , , : , , | | | | , , | | , , | 2 2

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

ya que la varianza condicional de las variables es . Condicionando a las primeras r observaciones, que tienen una distribucin ms complicada, la funcin soporte condicionada es: | 1 1 , , |, ln 2 2

Que puede maximizarse con un algoritmo de optimizacin no lineal para obtener los estimadores de los parmetros que aparecen en la media condicional y en la varianza condicional. Por tanto, la estimacin puede realizarse en dos etapas ya que la correlacin entre los parmetros ARMA y la de los GARCH suele ser pequea. Primera Etapa: se estiman los parmetros de la media condicional, es decir, el modelo ARMA, y se construyen las innovaciones |

Segunda Etapa: se estiman los parmetros de la varianza condicional maximizando la verosimilitud de los residuos. Alternativamente se pueden calcular las ecuaciones de la media condicional y la varianza condicional conjuntamente, con lo que se obtiene una estimacin ms precisa. PASO 3: Diagnosis. a las varianzas Vamos a llamar a los residuos del modelo ARIMA y condicionadas estimadas, los residuos estandarizados , deben seguir un proceso de ruido blanco normal y podemos aplicarles los contrastes para los procesos ARIMA. Sus cuadrados no deben mostrar dependencia, esto se puede comprobar con los contrastes sobre autocorrelacin de los cuadrados: Durbin Watson, Wallis, h-Durbin, Breusch-Godfrey y Cochrane-Orcutt. En la diagnosis de los modelos, hay que tener en cuenta la posible confusin entre valores atpicos y heterocedasticidad condicional. Los valores atpicos pueden interpretarse como un aumento de la varianza en ese instante y especialmente si aparecen en rachas, puede confundirse con efectos de heterocedasticidad condicional.
Alumno: Manuel Quesada Pegalajar

40

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Por otro lado, la serie que sigue un modelo ARCH puede mostrar muchos valores atpicos si se analiza como si tuviese varianza constante y siguiese un modelo ARMA. Por lo tanto, es importante tante diferenciar ambos fenmenos. En la prctica, se suele limpiar la serie inicialmente de las observaciones que presentan residuos tan grandes que no pueden ser debidas a heterocedasticidad condicional y que son muy probablemente valores atpicos. Una regla simple y efectiva es que es muy poco probable que la heterocedasticidad condicional pueda generar observaciones con residuos mayores de siete desviaciones tpicas, y considerar estos datos como atpicos. A continuacin se estima los efectos AR. AR

3.4.EJEMPLO MODELO GARCH


Consideramos la serie mensual de rentabilidades del Index S&P S& 500 a partir de 1926 para 792 observaciones. Presentamos a continuacin la representacin de la serie:

Vamos a denotar a la serie de rentabilidades por . A continuacin presentamos la FAC y la FAC parcial de la serie:

41

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

42

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Observando estas funciones, nos damos cuenta que para los primeros retardos, ms concretamente para el primero y el tercero se salen fuera de las bandas de confianza. confianza Presentamos entamos a continuacin la FACP de :

Podemos observar que existe una fuerte dependencia lineal. Si consideramos como buen modelo un MA(3) obtendramos:
Estimaciones de los parmetros Retardos no estacionales Constante MA1 MA2 MA3 Estimaciones -,095 -,010 ,141 ,006 Error tpico ,035 ,035 ,035 ,002 t -2,685 -,268 3,999 3,115 Sig. aprox. ,007 ,789 ,000 ,002

Se ha utilizado el algoritmo de Melard para la estimacin.

Y el modelo quedara:

Siendo

43

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Para simplificar vamos a usar un AR(3) cuya expresin es:

Realizando los clculos con SPSS obtenemos:


Estimaciones de los parmetros Estimaciones Error tpico ,035 ,036 ,035 T 2,513 -,670 -3,466 Sig. aprox. ,012 ,503 ,001 ,002

Retardos no estacionales Constante

AR1 AR2 AR3

,089 -,024 -,123

,006 ,002 3,168 Se ha utilizado el algoritmo de Melard para la estimacin.

El modelo quedara de la siguiente forma: Siendo 0.003

0.089 0.024 0.123 0.006


Vamos a crear un modelo GARCH(1,1):

Una estimacin conjunta de AR(3)-GARCH(1,1) da:

0.0078 0.032 0.029 0.008


0.000084 0.1213 0.8523

De la ecuacin de la volatilidad, la varianza implcita incondicional de : La cual es similar a 0.003 del modelo AR(3). Sin embargo la proporcin de parmetros en la ecuacin significa que sugieren que los tres coeficientes de AR no son significativamente con un nivel del 5 %. Por tanto, se perfecciona el modelo dejando caer todos los parmetros AR. El modelo refinado: 0.0076 ,
0.000086 0.121 0.8511

0.000084 0.00317 1 0.8523 0.1213

La desviacin tpica de la media es constante 0.0015, mientras que los parmetros de la ecuacin de volatilidades son 0.000024, 0.0197 y 0.0190, respectivamente. La varianza no condicional de es: Esto es un modelo estacionario simple GARCH(1,1). La siguiente grfica muestra el proceso de volatilidades estimado :
44
Alumno: Manuel Quesada Pegalajar

. . . .

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

A continuacin mostramos la representacin de los saltos de la varianza varianza ianza para el modelo GARCH(1,1):

de la

La serie parece ser un proceso de ruido blanco. Esto lo vemos en la representacin representaci de las FAC de los residuos de y de :

45

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Estas FAC no sugieren ninguna correlacin significativa serial o heterocedastica condicional en la serie de residuos. Ms especficamente, tenemos que Q(12)= 11,99 (0.45) y Q(24)=28.52 (0.24) para y Q(12)=13.11 (0.36) y Q(24) = 26.45 (0.33) para , donde el nmero entre parntesis es el p-valor p valor de la estadstica de prueba. As, el modelo parece ser adecuado para p describir la dependencia lineal neal en el retorno y la serie de volatilidades. Hay que tener en cuenta que el modelo ajustado muestra , que es cercano a 1. Este fenmeno se observa con frecuencia en la prctica prc y lleva a la imposicin de la restriccin en un GARCH(1,1), resultando en un sistema integrado de GARCH ( o IGARCH) modelo. Finalmente para predecir la volatilidad de los rendimientos mensuales superiores a los S & P 500, podemos usar usa la ecuacin acin de volatilidades en la ecuacin

Tenamos que

El paso 1 de prediccin es:

Donde es la ecuacin residual de la media en un tiempo h y se obtiene de la ecuacin de volatilidades. El valor inicial de se fija en cero o de la varianza incondicional de . Para el siguiente poso utilizamos la frmula recursiva. La tabla siguiente te muestra algunos pronsticos y la volatilidad de la publicacin n mensual: mensual
46
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Asumiendo que se distribuye segn una t-Student t Student con 5 grados de libertad, reestimamos el modelo GARCH(1,1):

Donde el error paramtrico es de 0.0015, , 0.0296 y 0.0371, respectivamente. Este modelo es un IGARCH(1,1), verificando que el cual es cercano a 1. El estadstico residual de Ljung-Box Ljung Box da Q(10)=11.38 con un p-valor p de 0.33 y estos de la serie da Q(10) =10.48 con un p-valor valor de 0.40. Por tanto, el modelo GARCH(1,1) con una distribucin T-Student T es adecuado.

47

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

4.MODELOS SV
Una forma alternativa de modelizar los cambios temporales en la volatilidad es a travs de los modelos de volatilidades estocsticas SV introducidos por Taylor (1986). En estos modelos, no depende de las observaciones pasadas de la serie, sino de una variable no observable, que habitualmente es un proceso estocstico autorregresivo. Para garantizar la positividad de la varianza, la ecuacin de la volatilidad, la volatilidad se define para el logaritmo de , al igual que en el modelo EGARCH. Los modelos SV encajan mejor con la teora financiera y se generalizan bien al caso multivariante. Sus propiedades dinmicas son fciles de obtener e interpretar a partir de las del proceso estocstico subyacente, pero desafortunadamente, la estimacin es ms difcil que en los modelos ARCH, al no poderse construir fcilmente la funcin de verosimilitud de forma exacta. Esto conlleva la utilizacin de mtodos de estimacin como pseudo-mxima verosimilitud, mxima verosimilitud simulada o el mtodo generalizado de los momentos, entre otros. A continuacin vamos a describir el modelo SV autorregresivo de orden 1.

4.1.MODELO SV(1)
La ecuacin estructural de estos modelos es idntica a la de los modelos GARCH, , donde los errores (proceso de ruido blanco formado por variables aleatorias normales independientes de media cero y varianza unidad). A diferencia de los GARCH donde la varianza depende de factores observables, en este modelo se supone que los logaritmos de las varianzas condicionales siguen un proceso AR, para nuestro caso un AR(1) tal que: Donde | | 1. Llamando este proceso es un AR(1) con ruidos normales, por lo que la distribucin de la variable ser tambin normal. Los parmetros de la
. Entonces la ser lognormal y puede demostrarse que:
distribucin marginal son los de un AR(1), es decir, la media es y la varianza

El coeficiente de curtosis es:

que ser siempre mayor que 3, que al igual que en los modelos ARCH, tienen un comportamiento leptocrtico. Este modelo tiene tambin la capacidad de generar distribuciones con colas pesadas, pero no est ligado necesariamente con la persistencia en la volatilidad, medida por el parmetro .
48
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

La estructura de correlacin de los cuadrados de este modelo es:


1

Si la varianza es pequea, puede demostrarse que esta expresin implica un decaimiento similar a un AR(1) con parmetro . Por tanto, al ser el modelo SV una martingala en diferencias, trae como consecuencia que: Las condiciones para que sea estacionario es que || 1. 0 , 0

3 1

49

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

5.CONTRASTES DE AUTOCORRELACIN.
Para detectar la presencia de autocorrelacin se pueden utilizar mtodos grficos (ya estudiados anteriormente) y contrastes de hiptesis. A travs de los contrastes grficos se intuir si existe autocorrelacin cuando existan comportamientos sistemticos para los residuos. Los contrastes de hiptesis, por su parte, permiten, a travs de una regla de decisin, considerar si con los datos de la muestra y con un nivel de significacin () concreto se debe o no rechazar la hiptesis nula. Todos los contrastes numricos de autocorrelacin se plantean con idnticas hiptesis; as, podemos sealar que la forma general del contraste es: H : No existe autocorrelacin H : Existe autocorrelacin

En la hiptesis nula se considera que el trmino de perturbacin correspondiente a una observacin es independiente del correspondiente a cualquier otra observacin. En la hiptesis alternativa se seala que el trmino de error de un modelo economtrico est autocorrelacionado a travs del tiempo. Esta hiptesis alternativa, al considerar la existencia de un patrn de comportamiento para los residuos, se puede especificar con procesos autorregresivos AR(p), de medias mviles MA(q) o mixtos ARMA(p,q) dependiendo del contraste que se vaya a utilizar. Se presentan a continuacin distintos contrastes que permiten detectar si las perturbaciones estn o no autocorrelacionadas y, en caso de estarlo, bajo qu esquema.

5.1.CONTRASTE DE DURBIN-WATSON (1951)


El contraste desarrollado por Durbin y Watson es la prueba ms frecuentemente empleada para detectar la presencia de autocorrelacin en los modelos de regresin. Este contraste permite verificar la hiptesis de no autocorrelacin frente a la alternativa de autocorrelacin de primer orden bajo un esquema autorregresivo AR(1), es decir, H : 0 H : 0 | | 1

Analticamente el contraste se especifica del siguiente modo:

La forma concreta de la hiptesis alternativa establece unas cotas para el coeficiente de correlacin; stas son necesarias para garantizar algunas caractersticas del modelo, en concreto que la varianza sea finita.

50

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

El estadstico de contraste viene dado por d

A partir de este estadstico se puede interpretar que:

Si hay autocorrelacin positiva las diferencias entre residuos que distan un periodo es muy pequea por lo que el valor del estadstico d ser prximo a cero. Si hay autocorrelacin negativa los residuos sern prcticamente iguales pero de signo contrario, su diferencia ser por tanto grande y el estadstico ser ms prximo al lmite superior que, como se ver, se establece en cuatro. Si no hay autocorrelacin, la relacin entre los residuos ser intermedia y por tanto, el valor del estadstico experimental tambin alcanzar un valor intermedio.

Para establecer los lmites de variacin del estadstico d la frmula anterior se puede desarrollar obtenindose una expresin en funcin del coeficiente de autocorrelacin : muestral de primer orden para los residuos
2 d 2 2 d ,

cuando el tamao de la muestra es grande, se puede considerar que entonces el estadstico d se puede expresar como:

y dado que el coeficiente de correlacin emprico de primer orden se calcula como , d 21 ,

entonces el estadstico experimental se puede expresar por

Teniendo en cuenta los lmites de variacin del coeficiente de correlacin emprico,1 1, se puede deducir el rango de variacin del estadstico de DurbinWatson y el signo de la autocorrelacin:

51

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Por tanto, , se aprecia que el estadstico experimental tomar valores entre 0 y 4 de tal modo que cunto ms prximo a cero (a cuatro) sea el valor del estadstico d mayor es la evidencia de autocorrelacin positiva (negativa). Si el valor del estadstico experimental d es dos, entonces la correlacin muestral ser nula y por tanto no se detectar un problema de autocorrelacin entre las perturbaciones. No obstante, estos valores (0, 2 y 4) son lmites extremos que deben matizarse estableciendo regiones ms amplias en las que pueda considerarse si existe o no autocorrelacin y, en caso de detectarse, si sta es positiva o negativa. negativa. En este sentido es necesario precisar que la distribucin terica de este estadstico no es sencilla y depende de los valores concretos de la matriz de regresores; por tanto, no existe un valor crtico nico que permita establecer una regla de decisin. decisin. Para solucionar esta dificultad Durbin y Watson hallaron unos lmites superior (du) e inferior (dL) que permiten tomar decisiones acerca de la presencia o ausencia de autocorrelacin. Estos valores sealan el lmite superior (du) para considerar autocorrelacin relacin positiva, es decir, para valores del estadstico experimental superiores a este lmite no se rechaza la hiptesis de ausencia de autocorrelacin, y el lmite inferior (dL) para no rechazar la hiptesis nula y suponer que las covarianzas de las perturbaciones perturbaciones del modelo son nulas y, por tanto, no estn autocorrelacionadas. Si el valor del estadstico d es superior a dos se puede contrastar la hiptesis nula de no autocorrelacin frente a la alternativa de autocorrelacin negativa. El anlisis es similar si pero considerando el valor mximo de 4 como lmite para la autocorrelacin negativa por tanto los lmites anteriores se establecen en los puntos 4-d 4 u y 4-dL. Grficamente se pueden sealar las regiones del contraste en el siguiente segmento:

Por lo tanto: 0 < d < dL se rechaza H0, existe entonces autocorrelacin positiva con un esquema AR(1) 4- dL < d < 4 se rechaza H0, existe autocorrelacin negativa con un esquema AR(1)
Alumno: Manuel Quesada Pegalajar

52

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

du < d < 4-du no se rechaza H0, no existe autocorrelacin dL < d < du el contraste no es concluyente 4-du < d < 4-dL el contraste no es concluyente Estos lmites dependen del tamao de la muestra (n) y del nmero de regresores del modelo (k). Las tablas originales sirven para muestras entre 15 y 100 observaciones y un mximo de 5 regresores. Aos ms tarde, Savin y White (1977) publicaron unas tablas ms completas que incluyen tamaos de muestra superiores, 5 < n < 200, y hasta 20 regresores. El tratamiento emprico de este contraste requiere de las siguientes fases: 1) Estimacin por mnimos cuadrados ordinarios (MCO) del modelo de regresin 2) Clculo de los residuos MCO 3) Obtencin del estadstico d (experimental) de Durbin-Watson 4) Bsqueda de los niveles crticos del contraste 5) Aplicacin de la regla de decisin Un inconveniente que presenta este contraste es que a veces puede no ser concluyente, por lo que hay que considerar, utilizando otros criterios, si existe o no autocorrelacin. En este sentido una solucin clsica consiste en ampliar las regiones de rechazo considerando as que existe autocorrelacin positiva para valores de d inferiores a du y autocorrelacin negativa si los valores del estadstico experimental son superiores a 4du. Este estadstico de uso frecuente, y tambin generalmente implementado en los programas y aplicaciones informticas de Econometra, se basa en un conjunto de supuestos acerca de los cuales es necesario reflexionar. En primer lugar hay que sealar que el diseo original del contraste se bas en el anlisis de un modelo de regresin que inclua trmino independiente. No obstante, este requisito exigible al modelo fue posteriormente resuelto. En 1980, Farebrother calcul los valores crticos del contraste para los modelos en los que no existe trmino independiente. Junto con la necesidad de trmino independiente en el modelo, es tambin un requisito que la matriz de variables explicativas sea no aleatoria, esto es determinista y fija en un muestreo repetido. Por tanto, este contraste no es vlido en modelos dinmicos que consideren como regresor retardos de la variable dependiente. La hiptesis alternativa considera que, si las perturbaciones estn autocorrelacionadas, el proceso que las genera es autorregresivo de orden 1. Sin
Alumno: Manuel Quesada Pegalajar

53

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

embargo, se ha comprobado que este estadstico es robusto frente a otras especificaciones de la hiptesis alternativa y, adems permite detectar errores de especificacin derivados de falta de especificacin dinmica y/o de la omisin de variables que estn correlacionadas.

5.2.CONTRASTE DE WALLIS (1972)


Este contraste presenta una modificacin del estadstico de Durbin-Watson para los modelos que utilizan datos trimestrales en los que, dado el carcter estacional de estas series, se espera que la perturbacin de una observacin concreta no est relacionada con la perturbacin del periodo inmediatamente anterior sino que dependa de la perturbacin del mismo trimestre pero del ao anterior, es decir, que la estructura de autocorrelacin sea . El contraste plantea en la hiptesis nula la ausencia de autocorrelacin: H : 0 No existe autocorrelacin H : 0 || 1

Para verificar si esta estructura de autocorrelacin es o no cierta Wallis propone una modificacin del estadstico de Durbin-Watson que denomina d4: d

Este estadstico tambin fue tabulado por Wallis bajo el supuesto de modelo de regresin con un nico trmino independiente y tambin para el caso de regresiones que incluyan trmino independiente y variables ficticias estacionales (trimestrales). Al igual que el contraste de Durbin-Watson, el estadstico d4 se ha tabulado suponiendo que la matriz de regresores es no aleatoria y suponiendo tambin que el modelo tiene trmino independiente. Adems de este contraste, King (1983) desarroll otra modificacin del estadstico de Durbin-Watson. En este caso se obtuvieron los valores de los lmites superiores (du) e inferiores (dL) de autocorrelacin para definir las regiones de rechazo, indecisin y no rechazo cuando se trabaja con datos mensuales.

5.3.CONTRASTE DE DURBIN (1970)


El contraste de Durbin-Watson, como ya se ha especificado anteriormente, impone como condicin para su correcta interpretacin que los modelos contengan regresores exclusivamente no aleatorios; con lo cual no se puede aplicar en modelos dinmicos en los que se considere como regresor algn retardo de la variable dependiente. Para corregir esta deficiencia, Durbin desarroll un estadstico que s
54
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

puede aplicarse en estos modelos que incluyan retardos de la variable dependiente. En este caso se ha obtenido un test asinttico para muestras grandes. La formulacin de las hiptesis nula contina siendo la misma ya que sigue siendo un contraste para la autocorrelacin de orden uno bajo un esquema autorregresivo AR(1), Analticamente el contraste se especifica del siguiente modo: La hiptesis nula en este caso se puede formular de la siguiente forma como: H : 0 Y la hiptesis alternativa, por su parte, se especifica ahora de modo que el contraste se configure como un contrate unilateral; esto es, se van a establecer dos posibles hiptesis alternativas segn se considere que la autocorrelacin puede ser positiva o negativa. As, el contraste quedara especificado queda:

H : 0 H : 1 El estadstico de contraste es:

que se distribuye asintticamente segn una distribucin N(0 ,1) lo que, con un nivel de significacin del 5%, supone no rechazar la hiptesis nula para los valores de h pertenecientes al intervalo (-1.645; 1.645) ya que se trabaja con un contraste de una sola cola. Para el clculo de este estadstico se necesitan conocer los siguientes datos: 1) Tamao de la muestra (n) 2) Varianza muestral estimada del coeficiente del regresor aleatorio (Yt-1) en la regresin MCO del modelo a estimar; es decir, obtenida bajo el supuesto de )]. MRLNC [Var(

H : 0 H : 1

3) Coeficiente de correlacin estimado ( ) Este coeficiente de correlacin estimado se puede calcular a partir de la estimacin de una estructura autorregresiva de orden 1 para los residuos (una regresin MCO de los residuos frente a un retardo de los mismos ( )), es decir:
55

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Otra posibilidad consiste en calcular esta correlacin muestral a partir del valor del estadstico de prueba del contraste de Durbin-Watson: 1 2 El procedimiento de contraste requiere de la realizacin de las siguientes fases: 1) Estimacin MCO del modelo de regresin y obtencin de la varianza ). estimada del coeficiente del regresor aleatorio, Var( 2) Clculo del coeficiente de correlacin estimado. 3) Clculo del valor del estadstico experimental h. 4) Aplicacin de la regla de decisin. Si h > 1,645 se rechaza la hiptesis nula al nivel de significacin del 5% considerando entonces que existe autocorrelacin positiva de primer orden. Para el caso de autocorrelacin negativa de primer orden, el valor del estadstico experimental h debe ser inferior a -1,645. El principal inconveniente que tiene este contraste es que si el radicando es negativo, ) > 1], entonces el test falla. Para estos casos Durbin propuso un esto es [n Var( procedimiento asinttico equivalente y que consiste en lo siguiente: 1) Estimar por MCO el modelo de regresin y obtener la serie de residuos MCO. 2) Estimar una regresin auxiliar en la que los residuos MCO se especifiquen como funcin de todos los regresores del modelo y tambin se incluya como regresor adicional un retardo de los residuos. 3) Analizar, utilizando el estadstico t habitual, la significacin individual del retardo de los residuos de la regresin auxiliar. Si el coeficiente del retardo del residuo es significativamente distinto de cero entonces se considera que existe autocorrelacin de primer orden. Este procedimiento sirvi de base para el contraste, ms general, de Breusch-Godfrey (1978) que como se ver a continuacin permite contrastar la existencia de otras estructuras de autocorrelacin distintas a las autorregresivas de primer orden.

5.4.CONTRASTE DE BREUSCH-GODFREY (1978)


Los contrastes anteriores, a pesar de su validez y robustez para detectar autocorrelaciones de rdenes superiores, se disearon inicialmente para contrastar la
Alumno: Manuel Quesada Pegalajar

56

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

presencia de procesos autorregresivos de primer orden por lo que el procedimiento adecuado, una vez detectado un problema de autocorrelacin, consistir en el anlisis de otros procesos de autocorrelacin, ya sean autorregresivos de orden superior, procesos de medias mviles o procesos mixtos. En este sentido, el contraste de Breusch-Godfrey se especifica con la finalidad de analizar si existe o no autocorrelacin de orden superior a uno; para ello, en la hiptesis alternativa se incluyen especificaciones ms generales que la del modelo autorregresivo de primer orden y que se pueden generalizar a cualquier especificacin ARMA(p,q). En la hiptesis nula se considera ahora que no existe autocorrelacin; la hiptesis alternativa especificar un esquema concreto de autocorrelacin. Por ejemplo, en un modelo autorregresivo de orden p: H : 0 Este contraste, al igual que los estudiados hasta el momento, se basa en los residuos MCO y se define como una prueba de significacin conjunta de las primeras p autocorrelaciones de los residuos. Para su aplicacin emprica es necesario desarrollar las siguientes etapas: 1) Estimacin por MCO del modelo de regresin y obtencin de los residuos MCO ( ).

la hiptesis nula se formulara con el supuesto de ausencia de autocorrelacin, es decir, nulidad de todos los coeficientes autorregresivos:

2) Estimacin de una regresin auxiliar de los residuos sobre p retardos de los mismos, , , ..., , as como sobre las variables explicativas del modelo original. 3) Obtencin del coeficiente de determinacin (R2) de la regresin auxiliar.
4) C del estadstico experimental, que se distribuye, bajo la hiptesis nula de no autocorrelacin como , donde p es el nmero de retardos de los residuos incluidos en la regresin auxiliar; esto es, el orden de autocorrelacin que se est contrastando; n es el nmero de observaciones del modelo.

5) Regla de decisin: si el valor del estadstico experimental excede del estadstico terico entonces hay evidencia suficiente para rechazar la hiptesis
57
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

nula y admitir que existe autocorrelacin; en caso contrario no sera correcto rechazar la ausencia de autocorrelacin. Este contraste presenta algunas ventajas frente al estadstico de Durbin-Watson; se puede considerar que el contraste de Breusch-Godfrey puede utilizarse en modelos que incluyan como regresores algunos retardos de la variable endgena, sin que por ello cambien las propiedades del contraste. En segundo lugar se puede sealar que este contraste permite especificar en la hiptesis alternativa cualquier esquema de autocorrelacin ya sea a travs de un proceso autorregresivo, de medias mviles o mixto. A pesar de estas ventajas que lo pueden hacer preferible al contraste de Durbin Watson, no hay que olvidar que para la aplicacin de este contraste es necesario especificar una longitud del retardo y que sta se determinar por un procedimiento de experimentacin basado en el anlisis de significacin individual de los retardos de los residuos, lo que en principio podra dificultar la tarea de seleccin del orden de autocorrelacin.

5.5.CONTRASTE DE BOX-PIERCE-LJUNG
Box y Pierce desarrollaron un estadstico que, basado en los cuadrados de los primeros coeficientes de autocorrelacin de los residuos, permite analizar si existe o no autocorrelacin. El estadstico se define como una suma acumulada de estos cuadrados de los coeficientes de correlacin empricos, es decir:

Siendo

Bajo la hiptesis nula de no autocorrelacin el estadstico Q se distribuye asintticamente segn una con grados de libertad igual a la diferencia entre el nmero de coeficientes acumulados (p) y el nmero de parmetros estimados al ajustar el proceso ARMA que se considere. Posteriormente este estadstico fue revisado por Ljung-Box obtenindose mejores resultados para muestras pequeas si se utiliza esta otra expresin alternativa.

58

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.
2

Estos estadsticos se definieron inicialmente para el anlisis de Series Temporales pero a veces tambin se utilizan para verificar la hiptesis de autocorrelacin en los modelos de regresin. No obstante, esta aplicacin en modelos estructurales debe realizarse con cautela ya que la inclusin de variables exgenas en el modelo tiene un efecto desconocido sobre el estadstico experimental.

5.6.SOLUCIONES PARA LA AUTOCORRELACIN


La presencia de autocorrelacin en un modelo se puede solventar mediante el mtodo de Cochrane-Orcutt o mediante la introduccin de variables dummy adecuadas en el modelo. Existen otros mtodos menos utilizados como el mtodo de estimacin de Durbin y el procedimiento de Prais-Winsten.

5.6.1.MTODO DE MNIMOS CUADRADOS GENERALIZADOS


Este mtodo se basa en la realizar la estimacin del modelo con autocorrelacin mediante mnimos cuadrados generalizados (MCG), es decir, supongamos que en el modelo de regresin mltiple para datos de series temporales: el trmino de error sigue un proceso AR(1): , 1,

en donde el error es un proceso de ruido blanco: 0, y 0 0. Sabemos que la funcin de autocovarianzas de un proceso
AR(1) es con , de modo que la matriz de varianzas y covarianzas

de u puede escribirse como:

1 1

59

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Para la estimacin del modelo de regresin aplicando MCG se necesitara conocer la inversa de esta matriz que es 1 0 0 0 0 1 0 0 0 1 0 0 ... 0 0 0 0 0 0 0 1 0 0 0 1

Si el parmetro fuera conocido, entonces podramos calcular el estimador de mnimos cuadrados generalizados usando la frmula: O alternativamente, si el modelo generalizado se quisiera transformar a un modelo clsico utilizando la transformacin de Aitken se necesitara expresar la matriz de paso P que para el supuesto concreto de un modelo autorregresivo de primer orden se formula:
1 0 0

0 1 0

0 0 1 0

0 0 0

0 0 0 1

excepto el primero que es igual a 1 , y elementos en la primera subdiagonal por debajo de la diagonal principal iguales a .

es una matriz bidiagonal inferior con elementos en la diagonal principal iguales a 1,

Expresando el estimador MCG en trminos de P, tenemos: PP PP


Alumno: Manuel Quesada Pegalajar

60

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

en donde
1 1 y 1 1 1 1

De aqu, podemos escribir el modelo de regresin transformado: Y como:


1 1 1 1

1 El procedimiento descrito tiene dos limitaciones: En primer lugar, no podemos extenderlo a otras formas de autocorrelacin. Por ejemplo, no tenemos una frmula cerrada para crear la inversa de un proceso AR(p) general. En segundo lugar, el clculo del estimador MCG requiere conocer el parmetro . Si , entonces podemos estimar el estimador MCG como: disponemos de una estimacin que es el estimador de mnimos cuadrados generalizados factibles (MCGF). Las son desconocidas en muestras finitas son propiedades estadsticas de en muestras grandes. Si desconocidas, y dependen de las propiedades asintticas de tambin es consistente. es un estimador consistente de , entonces

, es decir, cuando es desconocido, existen Por tanto cuando no conozcamos algunos procedimientos para estimar el coeficiente. Hay otros procedimientos como el de mxima verosimilitud que no lo explicaremos. Los que aqu se muestran son procedimientos que se desarrollan en dos etapas. En la primera etapa se obtiene la
61
Alumno: Manuel Quesada Pegalajar

estimacin de , que se utiliza en la segunda etapa para transformar las variables con las que estimar una ecuacin en diferencias generalizada (mtodo que coincide bsicamente con la aplicacin de los mnimos cuadrados generalizados). Estos mtodos se conocen con el nombre de mnimos cuadrados generalizados factibles (MCGF).
MTODO ITERATIVO DE COCHRANE-ORCUTT

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Cochrane y Orcutt propusieron un mtodo simple para estimar iterativamente los parmetros de un modelo de regresin y los parmetros de un proceso AR(p), que evita la inversin de la matriz y que vamos explicar a continuacin considerando un modelo de regresin con dos variables explicativas: 8 9

y autocorrelacin de tipo AR(1)

La idea es transformar el modelo de regresin en un modelo cuyo trmino de error sea ruido blanco . Dada la relacin entre y , podemos definir directamente las variables:
10

y especificar la relacin

Nota: Si el proceso AR(1) en trminos del operador B, 1 , vemos que multiplicando la ecuacin por 1 obtenemos la ecuacin : Nuestro objetivo es estimar los coeficientes i (i = 1, 2, 3) de la ecuacin 10 y el parmetro de la ecuacin 9. El problema consiste en que para estimar i (i =1, 2, 3) necesitamos una estimacin de , y para estimar necesitamos estimaciones de i (i = 1, 2, 3). La solucin a este crculo vicioso propuesta por Cochrane y Orcutt es el siguiente procedimiento iterativo: 1. Usar una estimacin preliminar de , por ejemplo 0, transformar los datos y estimar por MCO los coeficientes i (i = 1, 2, 3) en la ecuacin 10. nos permiten encontrar una nueva estimacin de en 9. 3. Los residuos
62

1 . en donde

2. Usando estas estimaciones, podemos obtener los residuos en la ecuacin 8.

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

4. Los pasos 1, 2 y 3 se repiten sucesivamente hasta alcanzar la convergencia, es decir, hasta que las estimaciones en dos repeticiones o iteraciones consecutivas prcticamente no cambien. Los criterios de convergencia usuales son:

1. La estimacin del parmetro en dos iteraciones consecutivas no cambia, 10 , donde j indica la iteracin.

3. La estimacin de la suma de cuadrados de los residuos en dos iteraciones consecutivas no cambia, 10.

2. La estimacin de cada parmetro en dos iteraciones consecutivas no cambia,

10 .

Nota: En general, si el trmino de error sigue un proceso AR(p), , el modelo transformado se obtiene multiplicando el modelo de inters por el polinomio .
MTODO DE PRAIS-WINSTEN

4. Se alcanza un nmero mximo de iteraciones.

Una modificacin del procedimiento de Cochrane-Orcutt fue propuesta por Prais y Wisten (1954); estos autores sugieren ampliar el tamao de muestra incluyendo una transformacin para la primera observacin que, como consecuencia de la utilizacin de primeras diferencias, desaparece. En lugar de utilizar el modelo que surge directamente de la transformacin se incorpora, para las primeras observaciones de las variables el dependiente ser 1 y anlogamente para la matriz de regresores. Esta modificacin permite mejorar la eficiencia en la estimacin de muestras pequeas.
MTODO DE DURBIN

factor de correccin 1 , con lo que la primera observacin para la variable

Durbin (1960) propone una primera estimacin del modelo en cuasi diferencias expresado a partir de la igualdad, 1

Como primera estimacin del coeficiente de autocorrelacin se va a considerar el coeficiente de la variable endgena desplazada, ya que, aunque sesgada, se trata de una estimacin consistente de .

63

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Esta primera estimacin del coeficiente de autocorrelacin puede servir de base para la aplicacin de cualquiera de los otros dos mtodos presentados con anterioridad. En concreto, Griliches y Rao muestran, a partir de un estudio de Monte Carlo que el estimador obtenido a partir de una primera estimacin con el mtodo de Durbin y seguido del procedimiento de Prais-Wisten para las variables transformadas es mejor otras alternativas. En este sentido Greene (1998) (citando a Harvey y McAvinchey (1981)) afirma que es bastante peor omitir la primera observacin que mantenerla.

64

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

En el modelo lineal , suponamos una serie de hiptesis entre las que se encontraban que la variable u (trmino de error) es una variable aleatoria con esperanza nula 0 y la matriz de covarianzas constante y diagonal . Es decir, que para todo t, la variable ut, tiene media cero y varianza no dependiente de t, y adems , 0 para todo i y para todo j distintos entre s, pudiendo escribir .

6.HETEROCEDASTICIDAD CONDICIONAL.CONTRASTES.

El hecho de que la varianza de ut sea constante para todo t (que no dependa de t), se denomina hiptesis de homocedasticidad. Por tanto el caso contrario, en el que la varianza ut no es constante estamos ante la presencia de heterocedasticidad. La importancia del incumplimiento de la hiptesis de homocedasticidad radica, entre otras cosas, en que los estimadores obtenidos por mnimos cuadrados no son de varianza mnima aunque sigan siendo insesgados. Adems, para cada variable del modelo se estimar una varianza del error.

Para analizar la heterocedasticidad condicional de un modelo se suele comenzar por el anlisis grfico de los residuos, siendo esenciales las grficas de los residuos (a poder ser estandarizados) respecto de la variable endgena predicha y respecto de las exgenas, que deben de presentar una estructura aleatoria libre de tendencia. El grfico de los residuos contra cada variable exgena permite detectar como variable ms culpable de heterocedasticidad aquella cuyo grfico se separa ms de la aleatoriedad. Tambin es un instrumento grfico til la grfica de valores observados frente a valores predichos, cuyos puntos han de ser lo ms ajustados posible a la diagonal del primer cuadrante. A parte del anlisis grfico es necesario realizar contrastes formales de heterocedasticidad, entre los que destacan Goldfeld-Quandt, Glesjer, Breush-Pagan, White, y Reset de Ramsey.

6.1.CONTRASTES DE WHITE
Para simplificar la exposicin, vamos a describir el contraste en una ecuacin de regresin con trmino constante y dos variables explicativas. La extensin del contraste al modelo lineal general es trivial. Consideremos por tanto el siguiente modelo: , 1, ,
65
: :

Y deseamos contrastar las hiptesis:

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Los pasos para realizar el contraste son los siguientes: 1. Estimar por mnimos cuadrados ordinarios la ecuacin de regresin de inters y obtener los residuos . , 1, ,

2. Estimar por mnimos cuadrados ordinarios la ecuacin de regresin auxiliar


y calcular el coeficiente de determinacin .

3. Calcular el estadstico de contraste , que sigue asintticamente una distribucin Chi-cuadrado con p 1 grados de libertad, donde p es el nmero de parmetros de la regresin auxiliar. 4. La hiptesis nula se rechaza al nivel de significacin , si , donde c es el valor crtico para el cual . Suele decirse que el test de White es general porque no necesitamos conocer las variables que causan la heterocedasticidad. Sin embargo, de la ecuacin de regresin auxiliar vemos que la forma de heterocedasticidad implcita es:
2 1 2 2 3 3 4 2 2 5 3 6 2 3

y las hiptesis a contrastar son:

Bajo , la varianza del error es constante ; bajo , hay heterocedasticidad del tipo: 1 2 2 3 3 4 2 5 2 6 2 3 2 3

: 2 3 0 : 0 2, ,

La regresin auxiliar incluye como variables explicativas todas las variables explicativas del modelo de inters, sus cuadrados y los productos cruzados, siempre que tales variables no sean redundantes, es decir, no aparezcan ya en la ecuacin de regresin. Por ejemplo, si es una variable ficticia tomando los valores 0 y 1, y se dice que es redundante. entonces
66
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

En resumen, algunas ventajas del test de White son: 1. Es un test general, 2. Es un test constructivo, nos sugiere una forma de heterocedasticidad si se rechaza H0, 3. Es muy simple de aplicar. y como inconvenientes 1. La ecuacin de regresin auxiliar puede incluir muchas variables explicativas, k(k + 1)/2. 2. La ecuacin de regresin auxiliar no est exenta de los errores de especificacin de cualquier regresin, 3. Es un contraste asinttico, vlido para muestras muy grandes.

6.2.CONTRASTES DE BREUSH-PAGAN/GODFREY
Godfrey (1978) considera el modelo de regresin mltiple: , 1, , 1 2 2

con heterocedasticidad del tipo:

Esta ecuacin indica que la varianza es funcin exponencial de una combinacin lineal de variables conocidas. En la prctica, las variables Zj (j = 2, . . . , p) coinciden con las variables explicativas Xj (j = 1, . . . , k). Breusch y Pagan (1979) consideran una forma ms general de heterocedasticidad 1 2 2

donde h es una funcin no especificada. Las hiptesis a contrastar son:

: 2 3 0 : 0 2, ,

Los pasos para realizar el contraste son los siguientes: 1. Estimar por mnimos cuadrados la ecuacin de regresin de inters obtener los

residuos , y calcular

67

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

2. Estimar por mnimos cuadrados la ecuacin de regresin auxiliar y calcular la suma de cuadros explicada, SCE.

3. Calcular el estadstico de contraste SCE/2, que sigue bajo (y suponiendo normalidad) una distribucin Chi-cuadrado con p 1 grados de libertad. 4. La hiptesis se rechaza al nivel de significacin , si SCE/2 > c, donde c es el valor crtico para el cual . Un procedimiento equivalente es el siguiente: 1. Estimar por mnimos cuadrados la ecuacin de regresin de inters obtener los residuos . 2. Estimar por mnimos cuadrados la ecuacin de regresin auxiliar

y calcular el coeficiente de determinacin, .

3. Calcular el estadstico de contraste , que sigue bajo (y suponiendo normalidad) una distribucin Chi-cuadrado con p 1 grados de libertad.

Si es cierta, entonces la varianza no depende de las variables Zj (j = 2, . . . , p) y el en la regresin auxiliar ser bajo. Por el contrario, si es cierta, entonces la varianza depende de las variables Zj (j = 2, . . . , p) y el ser alto. El problema est en decidir cuando el se considera bajo y alto. Pues bien, ser bajo cuando y alto cuando . Podemos observar que cuando las variables que causan la heterocedasticidad, Zj (j = 2, . . . , p) coinciden con las variables explicativas Xj (j = 1, . . . , k), la ecuacin de regresin auxiliar de este contraste est contenida en la regresin auxiliar del test de White. En resumen, algunas ventajas del test de BPG son: 1. Es muy simple de aplicar, 2. No requiere conocer la forma funcional de la heterocedasticidad,
68
Alumno: Manuel Quesada Pegalajar

4. La hiptesis se rechaza al nivel de significacin , si c, donde c es el valor crtico para el cual .

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

3. Es un test constructivo, nos sugiere una forma de heterocedasticidad si se rechaza , y como inconvenientes 1. Descansa en el supuesto de normalidad de los errores, 2. La ecuacin de regresin auxiliar no est exenta de los errores de especificacin de cualquier regresin, Nota: no se debe de confundir el tests de autocorrelacin y heterocedasticidad de Godfrey. Recordemos que en el primer caso nos interesa la dependencia del residuo de su pasado .

6.3.CONTRASTES DE GOLDFELD-QUANDT

El contraste de Goldfeld-Quandt (1965) se aplica cuando sospechamos que la varianza del error aumenta con los valores de una variable conocida Z:

El problema a contrastar:

: : 2, ,

Los pasos del contraste de Goldfeld-Quandt son los siguientes: 1. Identificar la variable que causa la heterocedasticidad, digamos Z. 2. Ordenar la tabla de datos segn los valores crecientes de Z. 3. Dividir la tabla de datos en tres submuestras. La submuestra central con m observaciones, y las otras dos submuestras con (n m)/2 observaciones. 4. Omitir las observaciones centrales, y estimar por mnimos cuadrados ordinarios la ecuacin de regresin en cada submuestra. 5. Calcular la suma de cuadrados de los residuos en cada submuestra: SCR1 y SCR2. Si es cierta, entonces SCR2 > SCR1.

6. Calcular el estadstico de contraste que sigue una distribucin F con (nm)/2 grados de libertad en el numerador y denominador.

7. La hiptesis se rechaza al nivel de significacin , si F > c, donde c es el valor crtico para el cual , .
69
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

La eleccin del nmero de observaciones a omitir, m, juega un papel clave en el contraste. Cuanto mayor sea m, tanto mayor ser la diferencia entre las sumas de cuadrados de los residuos SCR1 y SCR2 y ms probable ser rechazar si es falsa. El problema es que disminuyen los grados de libertad de cada regresin estimada, con lo cual el valor crtico c aumenta y menos probable es rechazar si es falsa. Por ejemplo, el valor crtico para Prob(F4,4 > c) = 0,95 es c = 6,388 y Prob(F8,8 > c) = 0,95 es c = 3,438. En la prctica, m suele elegirse igual a n/3. Nota: Si depende negativamente de los valores de Zi, entonces el cociente SCR1/SCR2 debera ser mayor que uno, y deberamos basar el contraste en esta cociente.

6.4.CONTRASTES DE GLESJER
Los estadsticos anteriores son capaces de darnos informacin sobre el grado de igualdad de las varianzas de una serie de submuestras. Sin embargo, no hacen ningn intento de modelizar el patrn heterocedstico que sigue la varianza de la perturbacin. En ese sentido, los estadsticos anteriores son no constructivos. Debemos tener en cuenta que para aplicar mnimos cuadrados generalizados resulta indispensable conocer qu tipo de heterocedasticidad sigue la varianza de la perturbacin. Desde este punto de vista, parece conveniente utilizar mtodos que nos den alguna ayuda en este sentido. Un primer intento es el contraste propuesto en Glejser (1969). El contraste que se plantea es el siguiente: : :

La motivacin de este estadstico es que bajo la hiptesis alternativa, la varianza de la perturbacin del modelo depende de una variable z. Entonces, este autor propone estimar la relacin que existe que vincula a estas dos variables. Para ello, dado que desconocemos el valor de la varianza, utiliza como variable proxy de la desviacin tpica de la perturbacin a | |, donde son los residuos mco procedentes de la estimacin del modelo . Es posible tambin utilizar como variable proxy de la varianza de la perturbacin. Una vez determinada la variable a explicar, el siguiente paso es realizar una regresin entre sta y la variable que creemos causa los problemas de heteroscedasticidad, en nuestro caso z. Como la forma funcional no tiene que ser lineal, se pueden utilizar formas funcionales alternativas. Por tanto, el estadstico de Glejser est basado en la estimacin de la siguiente relacin: | |

donde h puede tomar valores 1,0,1,2. El siguiente paso es determinar qu forma funcional es la que mejor se adeca a nuestro caso. Esto se puede realizar comparando,
70
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

por ejemplo, los coeficientes de determinacin del modelo. Una vez estimada la mejor de las relaciones debemos contrastar la hiptesis nula : 0, mediante el uso del estadstico . Si aceptamos esta hiptesis nula, es tanto como decir que no existe relacin entre la desviacin tpica del modelo y la variable z, lo que equivale a aceptar la hiptesis de homodedasticidad. Si, por el contrario, encontramos que es significativamente distinto de cero, entonces concluimos que no es constante, por lo que debemos rechazar la hiptesis nula de homocedasticidad.

6.5.CONTRASTES DE RESET RAMSEY

Segunda etapa: se realiza la regresin auxiliar de las estimaciones de contra todos los regresores del modelo inicial y las m primeras potencias de las estimaciones de . Si no hay significatividad de los coeficientes hay heterocedasticidad.

Primera etapa: se estiman los residuos del modelo inicial y los correspondientes valores ajustados de . Para cada t se calculan las m primeras potencias de las estimaciones de .

6.6.CONTRASTE ARCH

El contraste que se plantea es el siguiente: para la hiptesis nula : la varianza es constante en toda la muestra, frente a la hiptesis alternativa, : la varianza condicional es autorregresiva. Es decir, en el caso de un ARCH(1):
| .

Por tanto, vamos a seguir los siguientes pasos: 1. Ajustar el modelo por MCO. Obtener los residuos MCO e. 2. Estimar por MCO la regresin entre los residuos al cuadrado del modelo anterior y los residuos al cuadrado de dicho modelo retardados. En el caso de un ARCH(1) la regresin sera:
. 3. Forma del contraste: contrastar la significatividad de los parmetros del modelo anterior. El contraste de multiplicadores de Lagrange, TR2, se distribuye como una Chi-2 con un grado de libertad y es equivalente asintticamente al F habitual.

El problema para este contraste, es determinar bien el orden p, para el modelo ARCH(p), para lo cual se suele utilizar el correlograma estimado de los residuos al cuadrado, tomando p como el retado a partir del cual los coeficientes son no significativos.

71

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

6.7.SOLUCIONES CONDICIONAL

PARA

LA

HETEROCEDASTICIDAD

Los remedios que vamos a ver para este problema dependen de si la heterocedasticidad es conocida o desconocida. En el primer caso, el mtodo de estimacin preferido ser el de mnimos cuadrados generalizados; en el segundo, podemos optar por mnimos cuadrados generalizados factibles o mnimos cuadrados ordinarios.

6.7.1.HETEROCEDASTICIDAD CONOCIDA
El modelo lineal general con heterocedasticidad: , 1, , 11

en donde 0, y 0 , es un caso especial del modelo con perturbaciones no esfricas. En este marco, el estimador lineal, insesgado, consistente y ptimo es el estimador de mnimos cuadrados generalizados:

cuya matriz de varianzas y covarianzas es:

en donde , , es una matriz diagonal, cuya inversa es simplemente y requiere crear la , , . El clculo directo de

matriz de orden . En la prctica, podemos evitar la creacin de esta matriz usando el mtodo de mnimos cuadrados ponderados. MNIMOS CUADRADOS PONDERADOS

En el modelo los errores cuasitipificados son:


Cumplen las hiptesis bsicas: 1. Media cero:


2. Varianza constante
72

0
Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

3. Covarianza cero

tpica de los errores obtenemos: 1

De aqu, si transformamos el modelo de inters 11 dividiendo por la cuasidesviacin , 1, ,

O bien:

El modelo transformado 12 contiene los mismos parmetros , , que el modelo de inters 11, pero su error cumple las hiptesis bsicas. Por tanto, el estimador de mnimos cuadrados ordinarios en 12 ser lineal, insesgado y eficiente, que se denomina estimador de mnimos cuadrados ponderados. Podemos interpretar este mtodo de estimacin como un mtodo en dos etapas: Primera etapa, se transforman las variables dividiendo los datos por la cuasidesviacin tpica de los errores. En una segunda etapa, se estiman los parmetros por mnimos cuadrados ordinarios. El mtodo de mnimos cuadrados ponderados es una forma conveniente de obtener el estimador de mnimos cuadrados generalizados bajo heterocedasticidad. No debemos considerarlo como un mtodo de estimacin alternativo. Podemos comprobar la equivalencia entre los dos mtodos usando la descomposicin y expresando el estimador MCG como:

, 1, , 12

en donde

73

Alumno: Manuel Quesada Pegalajar

1 0 0

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

1 0

Ahora es claro que los datos transformados: 1 1 1

se corresponden con los datos de las variables divididos por las cuasi-desviaciones tpicas de los errores correspondientes.

6.7.2.HETEROCEDASTICIDAD DESCONOCIDA
En este caso, usamos el mtodo de mnimos cuadrados generalizados factibles. En la prctica cuando deseamos estimar una ecuacin de regresin mltiple: , 1, , 13

Desconocemos la forma de heterocedasticidad. Si sospechamos que:

Ahora bien, como no conocemos las varianzas , tendremos que estimarlas utilizando los valores ajustados obtenidos en la estimacin de la regresin auxiliar:

podramos aplicar el test de Breusch-Pagan-Godfrey. Si rechazamos la hiptesis nula de homocedasticidad, entonces debemos estimar por mnimos cuadrados generalizados.

esto es:

74

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Tipificando los datos, obtenemos el modelo transformado:

Las propiedades estadsticas de este estimador en muestras finitas son desconocidas; mientras que en muestras grandes, dependen de las propiedades de : si es un estimador consistente de , entonces el estimador MCGF tambin lo ser. En el caso de que la estimacin se realice por mnimos cuadrados ordinarios:

en donde el estimador de mnimos cuadrados ordinarios se denomina mnimos cuadrados generalizados factibles (MCGF). El trmino factible enfatiza que la . estimacin se ha realizado reemplazando por una estimacin

1 , 1, ,

Cuando la heterocedasticidad es desconocida, el estimador MCO cumple algunas propiedades deseables: es lineal, insesgado y consistente. El problema surge porque el estimador es ineficiente y, en consecuencia, los estadsticos t y F estarn sesgados. White demostr que la matriz de varianzas y covarianzas

puede estimarse consistentemente reemplazando la matriz desconocida por una matriz diagonal que contiene los residuos al cuadrado de la estimacin MCO, . , , Algunos autores prefieren el estimador MCO al MCGF, y calculan los estadsticos t y F usando la matriz de varianzas y covarianzas consistente en presencia de heterocedasticidad desconocida.

75

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

7.MULTICOLINEALIDAD CON SERIES DE TIEMPO.

Dado el modelo , suponamos unas series de hiptesis. Una de ellas es que las variables , , , son linealmente independientes, es decir que no existe relacin lineal entre las variables. Esta hiptesis se denomina de independencia, si no se cumple, entonces se dice que el modelo presenta problemas de multicolinealidad. Podemos distinguir dos tipos de multicolinealidad: Multicolinealidad exacta: se produce cuando || 0. En este caso existe infinitas soluciones para el sistema: Todas las variables independientes estn relacionadas.

- Multicolinealidad de grado: en este caso || 0. La solucin no es exacta analticamente hablando. La principal consecuencia de un modelo que presenta multicolinealidad es que se obtienen estimaciones de los parmetros con altos errores estndares, hacindolos poco precisos y muy inestables.

7.1.DETECCIN DE LA MULTICOLINEALIDAD
Es necesario tener en cuenta que la multicolinealidad es un problema de grado, es decir, lo importante no es distinguir sobre la presencia o ausencia de multicolinealidad, sino del grado de la misma. Adems la multicolinealidad es un problema muestral, por lo que no existen mtodos nicos y definitivos para detectarla, sino de reglas generales que deben ser interpretadas conjuntamente para decidir el grado de la misma. Entre estas reglas se distinguen las siguientes:

Indicios de . multicolinealidad. Es no quiere decir que sea un problema, sobre todo si estamos en el caso de que haya algunos coeficientes de regresin significativos. Se considera un problema cuando se dan las tres condiciones a la vez.

Valores grandes de los coeficientes de Pearson muestrales, entre Xi y Xj, es un claro indicio de multicolinealidad. Cuando 0,8. No obstante, no es necesario que dichos coeficientes sean altos para que la multicolinealidad sea un problema. Existen casos en donde 0,5 y en los cuales hay problemas de multicolinealidad.

76

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

Puesto que la multicolinealidad surge debido a que uno o mas regresores son combinaciones lineales del resto, entonces la realizacin de una regresin por cada variable explicativa de la siguiente forma: , , , , , 1, ,

puede ser muy informativo para detectar este problema. A estas se les llama regresiones auxiliares. En cada una de ellas se debe calcular el coeficiente de determinacin mltiple y a partir del mismo hacer el contraste de regresin. tanto no estar relacionado linealmente con el resto de las variables explicativas. 1 . Por tanto, si 1 0 1 y por

Factores de tolerancia: se define el factor de tolerancia de la variable como

grande puede darse el efecto de compensacin y ser el valor de la reducido, no siendo por tanto un problema la multicolinealidad. -

No obstante este criterio tambin tiene crtica, ya que segn sabemos, la varianza depende de , y de . Por tanto, aun teniendo un muy

Estructuras de autovalores de R. Los autovalores de la matriz de correlaciones R de las variables explicativas proporcionan una informacin precisa sobre la multicolinealidad. Consideremos la descomposicin espectral de donde diag , , 0, y U matriz ortogonal con columnas de autovectores de R. Adems se sabe que . La ordenacin de los autovalores de mayor a menor nos indica si existen problemas de multicolinealidad. Dado que el rango de R es igual al nmero de autovalores no nulos de R, claramente si un autovalor o ms son nulos entonces el rango de R no ser completo, indicando dependencia lineal. Sin llegar a este extremo, autovalores muy pequeos pueden proporcionarnos informacin sobre problemas de multicolinealidad. ndice de condicin. Se define el ndice de condicin de la matriz R de la siguiente forma:

Si 0 10 presencia de multicolinealidad dbil.

Interpretacin de este ndice:

Si 10 30 presencia de multicolinealidad moderada.

77

Alumno: Manuel Quesada Pegalajar

Los criterios de deteccin de multicolinealidad expuestos anteriormente estn basados en la matriz R, matriz que se calcula a partir de los datos en desviaciones, no apareciendo la influencia que tiene el trmino constante. Dado que los datos en desviaciones estn centrados por su media existen ocasiones en que este centrado es poco natural, ya que este obliga a que el modelo pase por el origen. Cuando esto no sea justificable no debe de utilizarse la matriz R, sino que debe de ser sustituida por la siguiente expresin: donde E es matriz diagonal cuyos elementos son los elementos de la diagonal de . Esto hace que dispongamos de un autovalor ms que con la matriz R

Si 30 presencia de multicolinealidad severa.

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

7.2.SOLUCIONES AL PROBLEMA DE MULTICOLINEALIDAD


Dado que la multicolinealidad es un problema muestral, las soluciones al mismo no son simples, fundamentalmente porque se est pidiendo ms informacin de la que realmente tiene la muestra. Presentamos las siguientes opciones: Eliminacin de regresores. Dado que el problema de multicolinealidad se presenta cuando dos o ms regresores son colineales y por tanto solapan informacin. Una posible solucin es eliminar alguna de las variables. Esta solucin puede presentar problemas muy graves, ya que puede dar lugar a lo que se denomina error de especificacin del modelo y hacer que los estimadores de los coeficientes de regresin sean sesgados. Por tanto, la eliminacin de variables en el modelo solo debe de hacerse cuando se tenga constancia de que dicha variable no es necesaria en el mismo. Aumento del tamao muestral. Dado que la multicolinealidad tiene como consecuencia fundamental el aumento de los errores estndares de los parmetros estimados, una alternativa es buscar soluciones para reducir tales errores. Una va para este objetivo es el aumento del tamao muestral. Usualmente al aumentar el tamao muestra se produce un incremento en la variabilidad de los regresores y por tanto disminuye por tanto el error estndar. El problema es que no siempre es sencillo, posible o econmico aumentar el tamao muestral. En el caso en que el estudio est basado en un diseo de experimentos controlado por el investigador, en este caso podemos aumentar artificialmente la variabilidad de los regresores sin necesidad de aumentar el tamao muestral. Utilizar el modelo en diferencias vigilando la autocorrelacin. Aplicacin de otras tcnicas estadsticas como:
Alumno: Manuel Quesada Pegalajar

78

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

o Regresin Ridge. o Regresin basada en Componentes Principales.

79

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

8.HIPTESIS DE NORMALIDAD.
La hiptesis de normalidad de las perturbaciones (residuos) aleatorias es necesaria para realizar inferencias sobre los parmetros. As mismo afecta a las propiedades de los estimadores mnimo cuadrticos, ya que si esta no es aceptable, la estimacin por mnimos cuadrados es diferente de a la estimacin de los parmetros por se hacen ineficientes. De esta mxima verosimilitud, y por tanto los estimadores forma no se obtendra el mximo partido de la informacin muestral, agravndose este hecho si existen observaciones atpicas en la muestra (pueden ser la causa real de la no normalidad). Los contrastes de normalidad que se suelen utilizar son: Kolmogorov-Smirnov (Lilliefors) -Pearson Shapiro-Wilks DAgostino Asimetra y kurtosis (Bera-Jarke)

Los contrastes de normalidad presentan algunos inconvenientes a la hora de aplicarlos, ya que estos asumen siempre que los datos proceden de variables aleatorias independientes. Otro inconveniente que presentan estos contrastes es su dependencia respecto al tamao muestral, en concreto, un tamao muestral muy grande hace que tengan una alta potencia, tendiendo a rechazar la normalidad . Por el contrario un tamao muestral reducido tiene poca potencia, tendiendo a no rechazar la normalidad. Las causas ms frecuentes de que unos datos no sean normales es por problemas de asimetra y curtosis (por excesiva concentracin de observaciones cerca de la media o presencia de observaciones atpicas). Si la causa de la no normalidad es por problemas de asimetra, el tratamiento que se debe seguir es transformar la variable respuesta. Generalmente una transformacin adecuada de sta suele resolver tambin problemas de no linealidad. Uno de los procedimientos ms usados para transforma la serie es la utilizacin de la familia de transformaciones BOX-COX vase en el Anexo.

80

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

ANEXO

Conceptos y definiciones.
Serie Estacionaria. Dada una serie , 1, , , se dice que es estacionaria si: Su media es constante. Su varianza es constante.

La autocovarianza entre y la serie solo depende de k y no del instante de tiempo t, es decir, su valor es independiente del periodo de tiempo que se considere. El ndice k toma los valores k = 0,1,2,,h, donde h < T. Esta autocovarianza se define como: 1

Ruido blanco.

donde es la media de la serie y T es el nero de componentes de la serie .

Dada una serie , 1, , , estacionaria , se dice que esta serie es un ruido blanco si: Su media es cero Su varianza es constante

La autocovarianza entre y la serie (k = 0,1,2,,h ; h < T) es cero.

Transformaciones de Box-Cox. Uno de los procedimientos ms usados para resolver los problemas de falta de normalidad y de heterocedasticidad es el transforma la serie es la utilizacin la familia de transformaciones BOX-COX: Se desea transformar la variable y, cuyos valores se suponen positivos, e caso contrario se suma una cantidad fija M tal que Y + M > 0. La transformacin de Box-Cox depende de un parmetro por determinar y viene dada por:
81
Alumno: Manuel Quesada Pegalajar

Si se quieren transformar los datos para conseguir normalidad, el mejor mtodo para estimar el parmetro es el de mxima verosimilitud y se calcula como sigue: para diferentes valores de se realiza la transformacin 1 0 0 0

1 0 0 0

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

donde es la media geomtrica. Para cada , se obtiene el conjunto de valores 1 . La funcin de verosimilitud es: que maximiza . En la prctica, se calcula en un Se elige el parmetro enrejado (grid) de valores de que permite dibujar aproximadamente la funcin y se obtiene el mximo de la misma: 2

Como casos particulares ms usuales son: Si 1 los datos no se transforman.

Si 2 se realiza una transformacin cuadrtica. Si 1 se realiza una transformacin inversa. Un mtodo grfico sencillo para estimar es el siguiente: Si 0 se realiza una transformacin logartmica.

2. Se dibuja el grfico de los pares de puntos media y desviacin tpica . , y se ajusta una curva del tipo: . .

1. Para cada grupo de residuos, segn el tratamiento, se calcula la media de la respuesta . y la desviacin tpica de los residuos .

Un ajuste lineal respecto a los logaritmos de ambas componentes. 3. Conclusin: -Si 0 los residuos son homocedsticos.
Alumno: Manuel Quesada Pegalajar

82

logaritmos.

-Si 1 hay heterocedasticidad y la transformacin a realizar es tomar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

-En otro caso, hay heterocedasticidad y se deben transformar los datos segn la transformacin de Box-Cox con 1

83

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

ANEXO A

La tabla siguiente muestra los datos correspondientes a la serie de datos , para el modelo ARIMA. Hemos utilizado estos datos para realizar el ejemplo del modelo ARIMA.

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

200,1 199,5 199,4 198,9 199 200,2 198,6 200 200,3 201,2 201,6 201,5 201,5 203,5 204,9 207,1 210,5 210,5 209,8 208,8 209,5 213,2 213,7 215,1 218,7 219,8 220,5 223,8 222,8 223,8 221,7 222,3 220,8 219,4 220,1

t 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70

220,6 218,9 217,8 217,7 215 215,3 215,9 216,7 216,7 217,7 218,7 222,9 224,9 222,2 220,7 220 218,7 217 215,9 215,8 214,1 212,3 213,9 214,6 213,6 212,1 211,4 213,1 212,9 213,3 211,5 212,3 213 211 210,7

84

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

t 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109

210,1 211,4 210 209,7 208,8 208,8 208,8 210,6 211,9 212,8 212,5 214,8 215,3 217,5 218,8 220,7 222,2 226,7 228,4 233,2 235,7 237,1 240,6 243,8 245,3 246 246,3 247,7 247,6 247,8 249,4 249 249,9 250,5 251,5 249 247,6 248,8 250,4

t 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148

250,7 253 253,7 255 256,2 256 257,4 260,4 260 261,3 260,4 261,6 260,8 259,8 259 258,9 257,4 257,7 257,9 257,4 257,3 257,6 258,9 257,8 257,7 257,2 257,5 256,8 257,5 257 257,6 257,3 257,5 259,6 261,1 262,9 263,3 262,8 261,8

85

Alumno: Manuel Quesada Pegalajar

Master en Estadstica Aplicada. Trabajo Fin de Master. Anlisis de Series Temporales. Modelos Heterocedsticos.

BIBLIOGRAFA
Tsay, R.S. (1987): Conditional Heteroskedastic Time Series Models. Journal of American Statistical Assotiation, 82. 590-604. ENGLE, R.F. (1982): Autorregresive Conditional Heterocedasticity with Estimates of the Variance of the U.K. Inflation Economtrica, 50. Pgs: 987-1008 Nelson, D.B. (1990). ARCH models as diffusion approximations. J. Econometrics. 45, 7-39. G. E. P Box, G. M. Jenkins y G. C. Reinsel, Time series analysis forecasting and control, 3rd ed., Prentice-Hall, Englewood Cliffs, Nueva Jersey, 1994. W. W. S. Wei, Time series analysis, Addison-Wesley, EE.UU, 1990. Robret F. Engle (1942) desarroll con Granger el concept de cointegracin e invent los procesos ARCH. Introduccin a los modelos de series temporales no lineales. Juan Gabriel Rodrguez Hernndez. Mayo 2001. Introduccin a los modelos autorregresivos con heterocedasticidad condicional (ARCH). Rafael de Arce. I.L.Klein, diciembre de 1998. Andersen, T.G. y Bollerslev, T. (1998): Answering the skeptics:Yes, standar volatility models do provide accurate forecasts. International Economic Review. Bollerslev, T. (1986): Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics. Nelson, D. B. (1991). Conditional Heteroskedasticity in Asset Returns: A New Approach Econometria. Pgina Web: http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/garch.html)

86

Alumno: Manuel Quesada Pegalajar

S-ar putea să vă placă și