Sunteți pe pagina 1din 28

MODELO DE REGRESIN LINEAL SIMPLE

En algunos casos la naturaleza de las variables permite suponer que existe relacin de dependencia entre ellas, es decir, q

valores de una variable Y (variable dependiente o endgena) dependen o estn influidos por los valores de otra variable, X (va

independiente o exgena). En el caso en que pueda suponerse una relacin lineal de dependencia, sta podr sintetizarse me
un modelo de regresin.

A partir del diagrama de dispersin y de los resultados obtenidos en el anlisis de correlacin puede decidirse si est relacin

tipo lineal. En este caso, los puntos del diagrama de dispersin aparecen tanto ms prximos a una lnea recta ajustada a la

de puntos cuanto ms intenso es el grado de asociacin. Por otra parte, segn sea el sentido de la asociacin dicha lnea t
pendiente positiva si el coeficiente de correlacin simple, r, es positivo y negativa en caso contrario.

El punto de partida del modelo de regresin lineal simple (MRLS) es que la relacin entre ambas variables no es d

determinista, sino estocstico; de forma que para cada valor de X existe una distribucin de probabilidad de Y, siendo la relac
que los valores esperados de las distribuciones de probabilidad de Y asociadas a cada uno de los valores de X estn situados
una lnea recta, llamada recta de regresin poblacional, que se expresa como:

ESTIMACIN

Para estimar la lnea de regresin poblacional a partir de la nube de puntos se utiliza el mtodo de los mnimos cuadrados ordi
(MCO), que considera como recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los resduos.

Si la recta de mejor ajuste es


la ordenada en el origen,

los errores o resduos se definen como:

y los estimadores por M

, y de la pendiente, , son:

Para evaluar la bondad del ajuste se calcula el coeficiente de determinacin R 2 y, para medir la dispersin de los puntos alrede
la recta estimada, el error tpico de la estimacin S u. Estas medidas se definen como:

Donde SCT o suma total de cuadrados es la variacin total de Y en la muestra y SCR o suma de cuadrados de la regresin

parte de la variacin total explicada por la recta ajustada. Por lo tanto, R 2 indica la proporcin de variacin total explicada me

larelacin lineal entre X e Y, y toma valores entre 0 y 1. Un valor de R 2 prximo a 1 indica que la recta ajustada es un buen m

para explicar el comportamiento de la variable Y, y por lo tanto existe relacin lineal entre X e Y. Por el contrario, un valor prx
0 indica que la recta ajustada no explica la variacin observada en Y.

Para establecer el intervalo de confianza para la pendiente de la recta de regresin,

, y contrastar si el valor de este parme

o no significativamente diferente a cero es necesario calcular el error tpico de b que se define como:

El estadstico de prueba del contraste es

que presenta una distribucin de probabilidad t de Student con n-2 grad

libertad.

Para la obtencin de la recta de regresin la secuencia es:

Analizar

Regresin

Lineal

Se abre el cuadro de dilogo Regresin lineal donde se seleccionan las variables Dependiente e Independientes.

La opcin Mtodo permite elegir el mtodo de estimacin. Si se trata de una regresin lineal simple (con una sola va

independiente) se conserva la definida por defecto (Introducir) siendo el resto de opciones para modelos con ms d
variable explicativa.

Cuando se desee realizar un ajuste lineal basado nicamente en los casos que pertenecen a un subgrupo determinad

un valor o conjunto de valores de otra variable, sta se deber indicar en Variable de seleccin del cuadro de d

Regresin lineal e introducir la Regla o condicin que debe verificar un caso para ser incluido en el anlisis.

Opcionalmente se puede seleccionar la variable que recoge las etiquetas de los casos indicndola en Etiquetas de caso

El botn MCP hace referencia a la estimacin por mnimos cuadrados ponderados.

Este cuadro de dilogo adems permite ampliar el anlisis de regresin activando las opciones incluidas en Estadsticos, Grf
Opciones.

ESTADSTICOS

El botn Estadsticos abre el cuadro de dilogo Regresin lineal: Estadsticos que por defecto tiene activadas las op
Estimaciones y Ajuste del modelo.

- La opcin Estimaciones proporciona las estimaciones de los coeficientes de la recta ajustada

por

el mtodo de los mnimos cuadrados ordinarios y sus correspondientes errores tpicos, as como los coeficientes
estandarizados (beta), los valores del estadstico t y el nivel de significacin crtico.

- La opcin Ajuste del modelo muestra en el resumen delmodelo la bondad del ajuste o coefiente de
determinacin y en elcuadro ANOVA la descomposicin de la suma total de cuadrados oinformacin total
observada.

Otras opciones que presenta este cuadro de dilogo son:

- Intervalos de confianza de los coeficientes de regresin que por defecto se calculan al 95\%.

- Matriz de covarianzas y de varianzas, y la matriz de correlaciones de los coeficientes del modelo que se analiza

en el contexto de la regresin mltiple.

- Cambio en R cuadrado. Cuantifica la variacin del coeficiente de determinacin que se produce al aadir o
eliminar alguna variable independiente en un modelo de regresin mltiple.

- Descriptivos incluye las medias y las desviaciones tpicas de las variables seleccionadas y la matriz de
correlaciones.

- Diagnsticos por caso. Esta opcin presenta dos alternativas para el anlisis de los residuos:

- la obtencin de Valores atpicos a ms de (por defecto 3) desviaciones tpicas. Identifica


aquellos casos para los cuales el valor estandarizado de los residuos difiere en (por defecto 3) o
ms desviaciones tpicas de su media. Para estos casos tambin presenta el valor observado, el
valor pronosticado y el residuo sin estandarizar. Incluye un cuadro de estadsticos de los
residuos con la media y desviacin tpica de los valores pronosticados y de los residuos,
tipificados y no tipificados, diferenciando entre los casos incluidos y los excluidos del anlisis. La
identificacin de casos atpicos es importante porque su presencia en la muestra puede
distorsionar los resultados de la regresin.

- la obtencin de predicciones de Y para Todos los casos. Genera las predicciones de Y y sus
correspondientes residuos para todos los casos.

El resto de opciones hacen referencia al modelo de regresin lineal mltiple.

GRFICOS

El botn Grficos abre el cuadro de dilogo Regresin Lineal: Grficos.

Este cuadro de dilogo permite seleccionar los grficos a incluir en los resultados.

El recuadro superior presenta una serie de nuevas variables relacionadas con las predicciones y los residuos. stas puede

seleccionadas para definir los ejes X e Y de los diagramas de dispersin que se quieren elaborar. Pulsando el botn Siguie
programa va numerando los diagramas que incluir en los resultados.

El recuadro Grficos de residuos tipificados presenta dos opciones: Histograma que muestra un histograma de los re

tipificados superponindole la distribucin normal y Grfico de prob. normal que crea un grfico P-P til para comprobar la hip

de normalidad a partir de los residuos tipificados. La comprobacin de esta hiptesis es fundamental para la correcta interpre
de las estimaciones por intervalo, tanto de los coeficientes de la recta como de las predicciones.

OPCIONES

El botn Opciones abre el cuadro de dilogo Regresin Lineal: Opciones.

Permite desactivar Incluir constante en la ecuacin que elimina el trmino independiente y proporciona la recta de regresi
pasa por el origen de coordenadas. Por lo que se refiere a los Valores perdidos, adems de las dos posibilidades Excluir casos
lista, activada por defecto, y Excluir casos segn pareja, comentadas en el epgrafe 3.6, hay la posibilidad de Reemplazar
media, opcin que sustituye los valores missing por la media de la variable correspondiente.

OBTENCIN DE PREDICCIONES Y ANLISIS DE RESIDUOS

El modelo permite generar predicciones para el valor esperado o para un valor individual de la variable
dependiente (Y) asociado a un valor dado de la variable independiente (X). En ambos casos la prediccin
puntual es la misma y se obtiene sustituyendo en el modelo estimado el valor X 0 para el cual se desea
realizar la prediccin.

Para obtener el intervalo de confianza de los pronsticos y/o contrastar si puede aceptarse un
determinado valor de Y condicionado a un valor X 0 es necesario calcular el error estndar de la
prediccin, el cual depender del valor pronosticado:

Prediccin del valor esperado de Y para X=X0,

Prediccin del valor individual de Y para X=X0,

Para obtener las predicciones se debe acceder al cuadro de dilogo Regresin Lineal: Guardar nuevas
variables con el botn Guardar:

El bloque Valores pronosticados presenta una serie de opciones que permiten guardar en el
archivo activo las predicciones No tipificadas y Tipificadas correspondientes a los casos incluidos
en la estimacin y las predicciones correspondientes a los casos no incluidos obtenidas a partir
del modelo estimado. Con la opcin Corregidos se obtienen los valores ajustados para cada
caso calculados a partir de la recta estimada exluyendo el caso (por lo tanto, se realizan tantas
estimaciones de la recta como casos incluidos en la muestra). La opcin E.T. del pronstico
promedio proporciona el error tpico de las predicciones del valor esperado.

El bloque Residuos permite guardar en el archivo activo los residuos correspondientes a los
casos incluidos en la estimacin No tipificados, Tipificados y Estudentizados. Con las opciones
Eliminados y Eliminados estudentizados se guardan los residuos correspondientes a las
regresiones obtenidas excluyendo el caso correspondiente.

El bloque Intervalos de pronstico calcula intervalos de confianza para las predicciones de la


Media y/o los Individuos para el nivel de confianza deseado (95% de confianza por defecto).

Si se desea guardar estos resultados en un archivo nuevo se activa la opcin Estadsticos de los
coeficientes y se indica el nombre del archivo.

EJEMPLOS

Ejemplo 1.

Con las variables Peso y Est (estatura) del archivo Encinf.sav analizadas en el ltimo ejemplo del
captulo 3* estime el modelo de regresin lineal simple que explica el comportamiento del Peso (variable
dependiente) en funcin de la Est (variable independiente). Realice la estimacin con los 100 primeros
casos.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se seleccionan la variable Peso como Dependiente y la variable Est como Independiente. En el recuadro
Variable de seleccin se introduce la variable Enc (nmero de encuesta) y con el botn Regla se abre el
cuadro de dilogo Regresin Lineal: Establecer regla donde se introduce la condicin 'menor o igual que
100'.

Los resultados que se obtienen son:

En el cuadro resumen del modelo se observa que: r=0,883, R 2=0,78 (obsrvese que R2 es igual a r al
cuadrado) y Su=6,0638. El coeficiente de determinacin indica que el 78% de la variacin total del peso
en la muestra queda explicada por el modelo estimado y, por lo tanto, el modelo proporciona un buen
ajuste.

El cuadro Coeficientes presenta los siguientes resultados:

- Modelo estimado:

=-132,783 + 1,148Est.

- Errores tpicos (errores estndar) de las estimaciones de los parmetros

: Sa=10,613 y

Sb=0,062.

- Coeficientes beta, que se obtienen estimando la regresin a partir de las observaciones estandarizadas.
En la regresin simple este coeficiente coincide con el coeficiente de correlacin lineal simple, r.

- Estadsticos t de los contrastes de significacin de las estimaciones y sus correspondientes niveles de

significacin crticos:

=-12,511 y

=18,662. En este caso las estimaciones son

significativamente distintas decero para cualquier nivel de significacin.

Ejemplo 2.

Compruebe si existen valores extremos y analice el comportamiento de los residuos del modelo de
regresin lineal estimado en el apartado anterior.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente.
Con el botn Estadsticos se accede al cuadro de dilogo que presenta las opciones correspondientes al
diagnstico de residuos. Se activa Diagnstico por caso y Valores atpicos a ms de 2 desviaciones
tpicas.

- Se observa que nicamente un caso presenta un resduo estandarizado, igual a 2,046, superior a 2
veces la desviacin estndar. Esto nos indica que no existe ningn caso atpico.

- En el cuadro Estadsticos sobre los residuos se comprueba que efectivamente no hay valores atpicos
ya que los valores mximo y mnimo de los residuos tipificados son inferiores a 3 en valor absoluto.

Con el botn Grficos se abre el cuadro de dilogo donde se deben activar las opciones correspondientes
a los Grficos de residuos tipificados.

El histograma de los residuos permite comprobar grficamente la hiptesis de normalidad; aspecto que
deber tenerse en cuenta para la interpretacin de los resultados de la inferencia estadstica. En este
caso vemos que la distribucin es campaniforme pero presenta una laguna en el centro que puede ser,
en parte, consecuencia de los intervalos definidos.

El diagrama P-P compara la frecuencia acumulada por los residuos tipificados con la probabilidad
esperada bajo la hiptesis de normalidad. Se observa que estas diferencias podran ser significativas en
alguna zona del grfico; lo cual, de ser cierto, pondra en duda la validez de la hiptesis de normalidad
de los residuos. No obstante, el criterio para decidir si se puede rechazar la hiptesis de normalidad ser
el que proporcione alguno de los contrastes de normalidad.

Adems, en el mismo cuadro de dilogo se puede pedir que elabore los diagramas de dispersin de, por
ejemplo, los residuos estandarizados en funcin de la variable dependiente (ZRESID y DEPENDNT).

En el grfico vemos que no existe ningn patrn de comportamiento de los residuos respecto a Y. Por lo
tanto, podemos mantener que estas variables aleatorias estn incorrelacionadas.

Ejemplo 3.

Obtenga las predicciones y los residuos correspondientes a los 100 casos incluidos en la estimacin y a
los 14 casos excluidos.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente.
Con el botn Guardar se abre el cuadro de dilogo donde se deben activar las opciones:

Valores Pronosticados > No tipificados y Tipificados para obtener las predicciones a partir del
modelo estimado.

Residuos > No tipificados y Tipificados para obtener los residuos de todos los casos.

Intervalos de Pronstico > Media e Individuos para obtener los lmites de los intervalos.

Los resultados de estas opciones quedan almacenados en el archivo de datos activo, y estn disponibles
para anlisis posteriores. Por defecto los nombres de las variables que crea son: Pre_1 (predicciones no
estandarizadas),

Res_1

(residuos

no

estandarizados),

Zpr_1,

Zre_1(predicciones

residuos

estandarizados, respectivamente), Sep_1 (error estndar de las predicciones), Imci_1, Unci_1 (Lmite
inferior y superior del intervalo de confianza para la prediccin del valor esperado de Y), Lici_1, Uici_1
(Lmite inferior y superior del intervalo de confianza para la prediccin individual de Y).

Por ejemplo, para el caso 101, que presenta una estatura de 168 y un pesoigual a 56, los resultados
son:

- Prediccin del peso sin tipificar 60,04886 Kg. y tipificada -0,43094.

- Residuos, no tipificados y tipificados, -4,04886 y -0,66771, respectivamente.

- Error estndar de la prediccin 0,66081.

- Intervalo de confianza para el valor esperado de Y para los individuos con estatura 168 (58,73751 ;
61,36022).

- Intervalo de confianza para el valor individual (47,94423 ; 72,15350).

Idnticamente, la prediccin para el caso 102, que presenta una estatura de 180, es de 73,82255 kg.,
con un residuo igual a -3,82255 y un error estndar 0,77055. Los correspondientes intervalos de
confianza para el valor esperado y para el valor individual son (72,29343 ; 75,35167) y (61,69239;
85,95271), respectivamente.

Series temporales
ANLISIS DE SERIES TEMPORALES

Una serie temporal est formada por una sucesin de observaciones de una variable efectuadas a intervalos regulares de tie

Las series temporales siempre presentan un orden natural determinado por el tiempo. El mantenimiento de este ord
fundamental para analizar la serie.

Las tcnicas estadsticas de anlisis de series temporales tienen por objeto estudiar y describir su evolucin en el pasado para
formular predicciones en un futuro ms o menos prximo.

REPRESENTACIN GRFICA

Para representar y anlizar una serie temporal con el programa SPSS, en primer lugar se debern introducir en el orden tempo

que han sido observados los valores de la variable cuya evolucin se desea analizar. A continuacin es necesario generar var

de fecha del sistema, que se utilizarn para establecer la periodicidad de la serie temporal y para etiquetar los resultado
anlisis realizado. Con la secuencia:

Datos

Definir fecha

se abre el siguiente cuadro de dilogo:

En el recuadro Los casos son se indica el intervalo de tiempo deseado para generar las fechas. En El primer caso es se debe i

la fecha inicial que se asigna al primer caso. A los siguientes casos el sistema les asigna valores secuenciales, basndose
intervalo de tiempo definido.

Periodicidad a nivel superior indica, segn el caso, la amplitud del ciclo, el nmero de trimestres y/o meses, el nmero de das
semana, el nmero de horas por da, etc.

Al aceptar, y segn se haya definido la fecha (da, mes, trimestres, ao, ..), se crean una o ms variables numricas y de cade

el editor de datos. Los nombres de las nuevas variables terminan con un carcter de subrayado y se debern manten

modificar. Por ejemplo, si se define la fecha como Aos, trimestres, meses se crean las variables numricas Year_, Qua

Month_ y la variable cadena Date_. Si ya se han definido variables de fecha anteriormente, stas sern reemplazadas p
nuevas.

El anlisis de una serie temporal debe partir de su representacin grfica. El grfico ms frecuente es la representacin

sistema cartesiano con el tiempo en el eje de abscisas y los valores de la variable temporal en el de ordenadas. Esta represen

pone de manifiesto las caractersticas ms importantes de la serie como son el movimiento secular o a largo plazo, oscilac
rupturas, valores anmalos, variacin absoluta entre periodos, etc.

En algunos casos es conveniente obtener el grfico semilogartmico transformando la serie aplicando logaritmos naturales
grfico recoge las tasas de variacin, lo que permite comparar la evolucin relativa de dos o ms series.

Otro grfico que en ocasiones es interesante analizar es el de las primeras diferencias de la serie, (X t-Xt-1), que permite visu
los cambios que ha experimentado la serie en perodos sucesivos.

Para generar los grficos anteriores la secuencia a seguir es:

Grficos

Secuencia

En el cuadro de dilogo se seleccionan la o las variables que se quieren representar en la ventana Variables.

En Etiquetas del eje del tiempo se indica la variable cuyos valores se emplearn para etiquetar el eje de abscisas. Esta va
puede ser numrica o de cadena.

Las opciones de Transformar permiten seleccionar los grficos correspondientes a las siguientes transformaciones de los datos

-Transformacin log natural;

-Diferenciar (se debe indicar el orden de las diferencias);

-Diferenciar ciclo.

Si se quieren representar las variables seleccionadas en grficos distintos se deber activar Un grfico por variable. Por d
todas las variables se representan en el mismo grfico.

Con el botn Lneas temporales se accede a un cuadro de dilogo donde se pueden definir lneas de referencia para el eje tem

Por defecto est activada la opcin Sin lneas de referencia. Por ejemplo, si los datos son mensuales, activando la opcin Ln
cada cambio de y seleccionando year_, el grfico aparecer dividido por lneas verticales (perpendiculares al eje de abscisas)

puntos correspondientes al ltimo mes de cada ao. Activando la opcin Lnea en la fecha aparecer en el grfico una lnea v
dividiendo la serie en dos partes, antes y despus de la fecha indicada.

El botn Formato presenta un conjunto de opciones que permiten modificar el grfico. Por defecto estn activadas las op

Tiempo en el eje horizontal y Grfico de lneas. Si se activa la opcin Lnea de referencia en la media de la serie en el g
aparece una lnea paralela al eje de abscisas que seala el valor medio de la serie.

COMPONENTES DE UNA SERIE

El enfoque clsico de anlisis de las series temporales se basa en el supuesto de que los valores observados de una serie
resultado de agregar todos o algunos de los siguientes componentes:

Tendencia, recoge el movimiento secular o a largo plazo de la serie determinado por fuerzas de carcter estructural q
mantienen estables durante largo tiempo.

Ciclo, son las oscilaciones peridicas de duracin superior al ao registradas como consecuencia de la dinmica econmica.

Variaciones Estacionales, recogen las fluctuaciones perodicas de duracin inferior al ao que siguen la misma pauta ao tra

Estas variaciones se deben a factores de tipo climtico, institucional, tradicional, etc. Para identificar la existencia de
componente es necesario que el perodo de observacin est dividido en subperodos.

Variaciones Irregulares, son oscilaciones que se presentan en perodos muy cortos como consecuencia de factores no explicad
el tiempo y de difcil control.

Estos componentes no pueden ser observados directamente por separado, pero pueden estimarse con diferentes tcnic

descomposicin. El mtodo de descomposicin que se deber aplicar en cada caso dependerar del esquema de agregacin

componentes que se suponga presenta la serie analizada. Los esquemas ms frecuentes son el aditivo que postula que la sum

los componentes constituye la serie observada; y el multiplicativo que supone que la serie observada es el resultado de mult
los componentes.

Si las observaciones de la variable se efectuan en subperodos (meses, trimestres, das, horas) se puede determinar el esque

agregacin de las componentes a partir de la representacin grfica. Si las fluctuaciones de los valores de la variable por enc
por debajo de la tendencia presentan un patrn regular en el transcurso del tiempo, el modelo de agregacin ser el aditivo.
el contrario la amplitud de dichas fluctuaciones crece o decrece con la tendencia el esquema o modelo es el multiplicativo.

Otro procedimiento para analizar el esquema de agregacin se basa en el clculo de los valores medios y las desviaciones t

para los k subperodos en que se ha dividido la unidad de observacin. Si a medida que aumenta (o disminuye) el valor me

desviacin tpica aumenta (o disminuye) el esquema de agregacin adecuado es el multiplicativo; si las desviaciones tpic
mantienen aproximadamente iguales sea cual sea el valor de la media, el modelo adecuado es el aditivo.

ANLISIS DE LA TENDENCIA

Para analizar la tendencia, es decir, para aislar el componente que determina el comportamiento a largo
plazo de la serie pueden utilizarse dos procedimientos: las medias mviles y el ajuste por mnimos
cuadrados ordinarios.

Medias mviles

Una serie de medias mviles puede considerarse como una serie temporal artificial construida
substituyendo el valor observado de la variable en cada perodo por la media de dicho valor y algunos
anteriores y posteriores a l. En general, el primer valor de una media mvil de orden k es:

el segundo valor es:

Por el mismo procedimiento se calculan los valores sucesivos. De esta forma se obtiene una serie
alisada, de la cual se han eliminado o suavizado las fluctuaciones con periodicidad igual o inferior al
orden de la media mvil. Esta serie alisada puede considerarse como una serie de estimaciones de la
tendencia en cada perodo.

El procedimiento para la obtencin de las medias mviles est incluido en el procedimiento de


descomposicin estacional.

Ajuste por mnimos cuadrados ordinarios

En caso de que la tendencia de una serie temporal sea lineal, sta puede modelizarse como Xt=a+bt
donde t es el tiempo o variable independiente y b es la tasa de crecimiento o decrecimiento de la
tendencia. Para estimar los parmetros a y b a partir de la serie observada se ajusta por MCO una recta
a la nube de puntos (t,Xt). Para obtener la estimacin de la tendencia con el programa SPSS la secuencia
es: Analizar > Regresin > Lineal, teniendo en cuenta que la variable dependiente es, en este caso, X y
la independiente es t.

NDICE DE VARIACIN ESTACIONAL

Las series observadas con periodicidad inferior al ao (mensual, trimestral, ...) recogen conjuntamente la evolucin coyuntur

largo plazo, y las variaciones estacionales. Para poder analizar correctamente la serie es necesario separar estas va

procedimiento que permite aislar el componente estacional utilizado por el SPSS se basa en la descomposicin mediante me

Se parte del supuesto de que el patrn de las variaciones estacionales se mantiene constante ao tras ao, y pueden cuan
nmeros ndices si el esquema de agregacin es multiplicativo o con coeficientes si el esquema es aditivo.

Los ndices de variacin estacional (IVE) recogen el incremento o la disminucin porcentual que el componente estacional prod

estacin anual (mes, trimestre,...). Estos ndices no deben incidir sobre la serie anual, por lo tanto, su promedio anual siem
igual a 1 (o 100 si est expresado en tanto por ciento).

Los coeficientes de variacin estacional indican el valor en que aumenta o disminuye la tendencia a causa del componente est
que estos coeficientes no modifiquen la serie anual siempre debern sumar 0.

Para obtener los ndices o coeficientes por el mtodo de descomposicin, el SPSS realiza las siguientes operaciones:

- estimacin del componente extraestacional (Tendencia-Ciclo) con una media mvil de orden k, siendo k el nmero
estacionales que presenta la serie (k=12 si las observaciones son mensuales, k=4 si son trimestrales, etc);

- estimacin de las variaciones estacionales especficas de cada perodo dividiendo (o restando) la serie por la media mvil;

- estimacin de las variaciones estacionales netas u obtencin del IVE eliminando las fluctuaciones irregulares observadas en c

para ello se toma el valor mediano de las variaciones especificas de cada perodo estacional por separado y se corrigen de f
promedio no afecte a la serie anual.

Para estimar los factores estacionales multiplicativos o aditivos de una serie temporal la secuencia a seguir es:

Analizar

Series Temporales

Descomposicin estacional

Si previamente no se ha definido la variable fecha, tal y como se ha explicado en el primer apartado, al ejecutar la secuenc
programa muestra un mensaje indicando que es necesario tener alguna variable fecha creada.

El el cuadro de dilogo se debe indicar:

- la o las variables para las que se desea estimar los factores estacionales en el cuadro Variables;

- el tipo de modelo de agregacin de los componentes (multiplicativo o aditivo) con las opciones Modelo;

- el criterio que se emplear para calcular las medias moviles de orden par (si la periodicidad es impar todos los puntos se p
igual). Las opciones de Ponderacin de la media mvil son:

- Todos los puntos son iguales calcula las medias mviles con una amplitud igual a la periodicidad y con todos los puntos po
igual.

- Puntos finales ponderados por ,5 centra las medias moviles de orden par calculando una media mvil de orden 2 con los res
primera media mvil que se calcula con una amplitud igual a la periodicidad.

Al seleccionar Mostrar el listado por casos se obtiene un resumen para cada caso de todos los resultados intermedios,
estadsticos finales.

Al aceptar, el programa genera un conjunto de variables nuevas con los resultados del proceso: ERR, SAS, SAF y STC. Por d

variables se incluyen en el archivo activo, pero con el botn Guardar se puede indicar que no las cree o que sustituya las existe

EJEMPLO

Ejemplo 1.

Identifique si la variable Viajes del archivo Turivia.sav presenta estacionalidad.

Con la secuencia Grficos > Secuencia y seleccionando en el cuadro de dilogo las variables Viajes y Ao se obtiene
representacin grfica:

La observacin del grfico pone de manifiesto la existencia de una tendencia creciente as como de un patrn estacional muy

valor mximo anual se observa sistemticamente en el mes de agosto, seguido por los valores de la variable en julio y sep
mismo, en los meses de enero, febrero, noviembre y diciembre se observan sistemticamente los valores mnimos anuales.

Ejemplo 2.

Determine cul es el modelo de agregacin de las componentes ms adecuado.

Para determinar el modelo ms adecuado se hallan para cada ao la media y la desviacin tpica de las 12 observaciones m

primer lugar, es necesario una variable fecha. Para crear esta variable la secuencia a seguir es: Datos > Definir fecha. Com

mensual se elige la opcin Aos, meses (tambin se puede aplicar el formato Aos, trimestres, meses) y se indica el ao corre

la primera observacin y el mes. En este caso se deber tomar como ao de inicio 1995 y Mes: 1 que corresponde a ene

creado la variable fecha con el formato Aos, trimestres, meses se indicar tambin que la primera observacin correspon

trimeste, es decir, Trimestre: 1).

Con la secuencia Analizar >Informes > Resumir por casos se abre el cuadro de dilogo donde se seleccionan: en Variables

Variable de seleccin: year_. Con el botn Estadsticos se activan las opciones Media y Desviacin tpica. Para obtener s
resultados finales se desactiva Mostrar los casos. El resultado que se obtiene es el siguiente:

Como puede observarse, las desviaciones tpicas de cada ao crecen a medida que crece el valor medio, lo cual es indicio de q
de agregacin de las componentes de esta serie es multiplicativo.

Ejemplo 3.

Determine los valores de los ndices de variacin estacional de la variable Viajes del archivo Turivia.sav.

Para poder calcular los ndices de variacin estacional de la serie Viajes es necesario, en primer lugar, definir una variable fec
ha hecho en el ejemplo 2.

Para obtener los ndices de variacin estacional correspondientes a cada uno de los 12 meses la secuencia a seguir es: Anal

Temporales > Descomposicin estacional. En el cuadro de dilogo se selecciona la variable Viajes, se mantiene el modelo M

se indica que las medias mviles se quieren realizar con la ponderacin Puntos finales ponderados por ,5. Si se quiere recoger
los resultados de la descomposicin en el editor de resultados se deber seleccionar Mostrar el listado por casos.

El cuadro de resultados presenta:

Moving averages: Medias mviles centradas de orden 12;

Ratios (*100)=

100: componente estacional especfica de cada perodo;

Seasonal factors: ndices de variacin estacional corregidos (IVE),obtenidos como mediana de los ratios correspondientes a
estacional por separado y corregido teniendo en cuenta que se debe verificar:

Serie desestacionalizada;

Smoothed trend-cycle: Estimacin del componente Tendencia-Ciclo;

Estimacin del componente irregular.

Algunos de los resultados que se obtienen son:

Los ndices de variacin estacional obtenidos son: JAN 62,207 FEB 63,671 MAR 80,921 APR 95,999 MAY 105,515 JUN 104,870

AUG 180,162 SEP 115,276 OCT 99,178 NOV 68,232 DEC 71,698. Por lo tanto, se puede concluir que la serie en los meses en
marzo, abril, octubre, noviembre y diciembre toma valores inferiores a la tendencia media; el componente estacional

repercusin en el mes de agosto incrementando en algo ms del 80% el valor de los viajes; en el mes de enero es cuando s
mayor decremento de los viajes debido a la estacionalidad, reducindose stos en cerca del 38%.

La representacin grfica de la serie desestacionalizada y de la estimacin de la tendencia-ciclo (o del componente extraesta


siguiente:

Como se puede observar, la serie desestacionalizada presenta fluctuaciones a muy corto plazo debidas a la accin del
irregular, mientras que la serie de valores de tendencia-ciclo est mucho ms alisada y sugiere una tendencia lineal creciente.

TCNICAS DE PREDICCIN

El objetivo de las tcnicas de prediccin no causal (TPNC) es obtener estimaciones o pronsticos de


valores futuros de una serie temporal a partir de la informacin histrica contenida en la serie observada
hasta el momento actual. Estas tcnicas no requieren la especificacin de los factores que determinan el
comportamiento de la variable, sino que se basan nicamente en la modelizacin del comportamiento
sistemtico de la serie. Se consideran tres modelos posibles del comportamiento sistemtico de una
serie temporal: modelo estacionario (sin tendencia), modelo con tendencia lineal y modelo con
estacionalidad. La tcnica de prediccin adecuada depender del modelo de comportamiento de la serie.

Las hiptesis en que se basan las TPNC son, en primer lugar, la estabilidad de la forma del
comportamiento sistemtico de la serie y, en segundo lugar, que el valor de la variable observado en
cualquier perodo t es el resultado del comportamiento sistemtico y de una perturbacin aleatoria.

ALISADO EXPONENCIAL SIMPLE

Cuando la serie presenta un comportamiento estacionario, es decir, no tiene tendencia y puede ser
modelizada como

Xt=a+ut

(donde ut es un trmino de perturbacin aleatorio, con valor esperado cero y

varianza constante para todo t, e independiente de

Xt

para todo t) el mtodo de prediccin adecuado es

el alisado exponencial simple (AES). Este mtodo estima para cada perodo T el parmetro a como suma
ponderada de todas las observaciones anteriores, dando mayor importancia a las observaciones ms
recientes que a las ms antiguas. La expresin de clculo es:
es la estimacin de

obtenida en el perodo T-1 y

es la

constante de alisado que toma valores entre 0 y 1.

Como se observa, el AES actualiza perodo a perodo las estimaciones de a incorporando la nueva
informacin.

La eleccin de la constante de alisado determina las caractersticas operativas del AES, ya que la rapidez
con que se adaptan las predicciones a los posibles cambios experimentados por el valor de
. Si
valor de

a depende de

es grande (prximo a 1) el AES se adapta rpidamente a los cambios experimentados en el

y, en consecuencia, deber escogerse un valor grande de

contrario, si la serie es muy estable, el valor de

cuando a es poco estable. Por el

deber ser pequeo para conseguir eliminar al

mximo las fluctuaciones aleatorias debidas al trmino de perturbacin y conseguir un mejor alisado.
La prediccin del valor de

Xt para los perodos T+1,T+2,... realizada al finalizar el perodo actual T es:

Para obtener predicciones mediante el AES la secuencia es:

Analizar

Series Temporales

Suavizado exponencial

En el cuadro de dilogo Suavizado exponencial est activado por defecto el mtodo AES que corresponde
al Modelo: Simple. Se indica la serie que se quiere predecir en la ventana Variables. Con el botn

Parmetros se abre el siguiente cuadro de dilogo en el que se puede modificar la eleccin del valor de
la constante de alisado:

Por defecto est activada para Alfa la opcin Valor: 0,1. Con la opcin Bsqueda en rejilla se puede fijar
un intervalo de valores entre los que el sistema seleccionar el valor de

que proporcione menor suma

de cuadrados de los errores de estimacin (SSE). La bsqueda puede afinarse tanto como se quiera
modificando en la casilla Por el valor de incremento. Si se mantiene seleccionada la opcin Mostrar slo
los 10 mejores modelos de la bsqueda en rejilla se muestran slo en el visor de resultados los valores
de los parmetos y las SSE para los 10 valores de

con menor error de estimacin. En caso contrario,

aparecen todos los modelos probados.

El valor inicial del alisado, por defecto, lo calcula el sistema automticamente a partir de la serie
observada. Con la opcin Valores iniciales: Personalizado se puede fijar el valor de inicio que se desee.

El botn Guardar, del cuadro de dilogo Suavizado Exponencial, permite modificar las opciones
relacionadas con la creacin de nuevas variables y con la prediccin:

Con respecto a la creacin de nuevas variables con los resultados del alisado, la opcin activada por
defecto es Aadir al archivo con la que se aaden a la base de datos activa la serie alisada y los errores
de prediccin. La opcin Sustituir las existentes guarda slo las variables del ltimo procedimiento
sustituyndolas si en el archivo activo ya existan. Por ltimo, la opcin No crear indica que no se desea
guardar ninguna variable de resultados.

Con respecto a las predicciones, en Pronosticar casos, por defecto, est activada la opcin Desde el
perodo de estimacin hasta el ltimo caso que proporciona los valores alisados (St) nicamente para los
perodos observados. La opcin Pronosticar hasta permite generar predicciones para valores futuros de
la variable hasta el perodo indicado en Observacin.

MTODO DE HOLT
Cuando la serie presenta tendencia lineal, creciente o decreciente, y puede ser modelizada como
+

bt

ut

(donde

ut

xt

=a

es un trmino de perturbacin aleatorio) un mtodo de prediccin adecuado es el

propuesto por Holt. Este mtodo se basa en dos ecuaciones de alisado:

La primera de las ecuaciones proporciona una estimacin del nivel de la serie en el perodo T y la
segunda permite obtener una estimacin de la pendiente de la recta de tendencia para el perodo T.

Las constantes de alisado

toman valores comprendidos entre 0 y 1. Cuanto menores sean estas

constantes ms alisada ser la serie de predicciones.

La prediccin para los perodos futuros T+1, ....T+k obtenida en el perodo T es:

La secuencia para aplicar el mtodo de Holt es:

Analizar

Series Temporales

Suavizado exponencial

En el cuadro de dilogo se selecciona la variable y se activa la opcin Holt. Con el botn Parmetros se
accede al cuadro de dilogo que permite modificar las constantes de alisado y personalizar los valores
iniciales tal y como se ha visto en el epgrafe anterior.

Para obtener predicciones para perodos futuros se activa el botn Guardar y se procede de la misma
forma que en el caso del AES.

MTODO DE WINTERS
Una serie con tendencia lineal y patrn estacional multiplicativo puede modelizarse como:

ct+ut

donde

ct

es el ndice estacional correspondiente al perodo t. Las estimaciones de

Xt=(a+bt)
aT, bT

cT

vienen dadas por:

donde S es la periodicidad de la serie.

Las constantes de alisado

deben satisfacer nicamente la condicin de tomar valores

comprendidos entre 0 y 1.

La prediccin para los perodos futuros T+1, ..., T+k obtenida en el perodo T es:

Para que el mtodo de Winters est disponible en el sistema, es imprescindible haber creado
previamente una variable fecha con la secuencia Datos > Definir fecha.

La secuencia para aplicar el mtodo de Winters es:

Analizar

Series Temporales

Suavizado exponencial

En el cuadro de dilogo se selecciona la variable y se activa la opcin Winters. Con el botn Parmetros
se accede al cuadro de dilogo que permite fijar valores a las constantes de alisado y personalizar los
valores iniciales.

Las predicciones para perodos futuros se obtienen activando el botn Guardar indicando en el cuadro de
dilogo correspondiente el ao y el perodo estacional hasta el que se desea obtener predicciones.

EJEMPLO

Pronostique el nmero de visitantes que entrarn en Espaa el prximo ao aplicando el mtodo de


prediccin no causal adecuado a la variable Viajes del archivo Turivia.sav.

Dado que la serie presenta componente estacional, para poder aplicar el mtodo de alisado de Winters,
en primer lugar, es preciso definir la variable fecha con la secuencia Datos > Definir fecha.

Con la secuencia Analizar > Series > Suavizado exponencial se accede al cuadro de dilogo Suavizado
exponencial donde se selecciona la variable Viajes y se indica el modelo de prediccin: Winters.

Para determinar las constantes de alisado que minimizan la suma de errores de estimacin al cuadrado
es preciso activar el botn Parmetros. Con la opcin Busqueda en rejilla se puede especificar un
intervalo de valores para cada una de las constantes de alisado, Alfa, Gama y Delta, entre los cuales el
sistema determinar aquellos que optimicen la prediccin. En este caso se mantienen los valores de las
constantes de alisado que el sistema proporciona por defecto.

Se eligen como valores iniciales del alisado los que el sistema proporciona automticamente.

Para generar los pronsticos del nmero de visitantes en el prximo ao hay que activar el botn
Guardar y seleccionar la opcin Pronosticar hasta e indicar en Ao: 2000 y en Mes: 12.

Los resultados que se obtiene son:

Los coeficientes estacionales que el mtodo Winters utiliza para inicializar el alisado son los que se
obtienen aplicando el mtodo de descomposicin estacional establecido por defecto en el sistema.

En el editor de datos se han creado 14 nuevos perodos, que van desde noviembre de 1999 a diciembre
de 2000, que recogen los pronsticos de la variable Viajes. Por ejemplo, para los meses de noviembre y
diciembre de 1999, enero, febrero, marzo y abril de 2000 el sistema pronostica que el nmero de
visitantes ser 4.493.515, 4.751.482, 4.171.475, 4.274.225, 5.441.096 y 6.553.431, respectivamente.

S-ar putea să vă placă și