Documente Academic
Documente Profesional
Documente Cultură
En algunos casos la naturaleza de las variables permite suponer que existe relacin de dependencia entre ellas, es decir, q
valores de una variable Y (variable dependiente o endgena) dependen o estn influidos por los valores de otra variable, X (va
independiente o exgena). En el caso en que pueda suponerse una relacin lineal de dependencia, sta podr sintetizarse me
un modelo de regresin.
A partir del diagrama de dispersin y de los resultados obtenidos en el anlisis de correlacin puede decidirse si est relacin
tipo lineal. En este caso, los puntos del diagrama de dispersin aparecen tanto ms prximos a una lnea recta ajustada a la
de puntos cuanto ms intenso es el grado de asociacin. Por otra parte, segn sea el sentido de la asociacin dicha lnea t
pendiente positiva si el coeficiente de correlacin simple, r, es positivo y negativa en caso contrario.
El punto de partida del modelo de regresin lineal simple (MRLS) es que la relacin entre ambas variables no es d
determinista, sino estocstico; de forma que para cada valor de X existe una distribucin de probabilidad de Y, siendo la relac
que los valores esperados de las distribuciones de probabilidad de Y asociadas a cada uno de los valores de X estn situados
una lnea recta, llamada recta de regresin poblacional, que se expresa como:
ESTIMACIN
Para estimar la lnea de regresin poblacional a partir de la nube de puntos se utiliza el mtodo de los mnimos cuadrados ordi
(MCO), que considera como recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los resduos.
, y de la pendiente, , son:
Para evaluar la bondad del ajuste se calcula el coeficiente de determinacin R 2 y, para medir la dispersin de los puntos alrede
la recta estimada, el error tpico de la estimacin S u. Estas medidas se definen como:
Donde SCT o suma total de cuadrados es la variacin total de Y en la muestra y SCR o suma de cuadrados de la regresin
parte de la variacin total explicada por la recta ajustada. Por lo tanto, R 2 indica la proporcin de variacin total explicada me
larelacin lineal entre X e Y, y toma valores entre 0 y 1. Un valor de R 2 prximo a 1 indica que la recta ajustada es un buen m
para explicar el comportamiento de la variable Y, y por lo tanto existe relacin lineal entre X e Y. Por el contrario, un valor prx
0 indica que la recta ajustada no explica la variacin observada en Y.
o no significativamente diferente a cero es necesario calcular el error tpico de b que se define como:
libertad.
Analizar
Regresin
Lineal
Se abre el cuadro de dilogo Regresin lineal donde se seleccionan las variables Dependiente e Independientes.
La opcin Mtodo permite elegir el mtodo de estimacin. Si se trata de una regresin lineal simple (con una sola va
independiente) se conserva la definida por defecto (Introducir) siendo el resto de opciones para modelos con ms d
variable explicativa.
Cuando se desee realizar un ajuste lineal basado nicamente en los casos que pertenecen a un subgrupo determinad
un valor o conjunto de valores de otra variable, sta se deber indicar en Variable de seleccin del cuadro de d
Regresin lineal e introducir la Regla o condicin que debe verificar un caso para ser incluido en el anlisis.
Opcionalmente se puede seleccionar la variable que recoge las etiquetas de los casos indicndola en Etiquetas de caso
Este cuadro de dilogo adems permite ampliar el anlisis de regresin activando las opciones incluidas en Estadsticos, Grf
Opciones.
ESTADSTICOS
El botn Estadsticos abre el cuadro de dilogo Regresin lineal: Estadsticos que por defecto tiene activadas las op
Estimaciones y Ajuste del modelo.
por
el mtodo de los mnimos cuadrados ordinarios y sus correspondientes errores tpicos, as como los coeficientes
estandarizados (beta), los valores del estadstico t y el nivel de significacin crtico.
- La opcin Ajuste del modelo muestra en el resumen delmodelo la bondad del ajuste o coefiente de
determinacin y en elcuadro ANOVA la descomposicin de la suma total de cuadrados oinformacin total
observada.
- Intervalos de confianza de los coeficientes de regresin que por defecto se calculan al 95\%.
- Matriz de covarianzas y de varianzas, y la matriz de correlaciones de los coeficientes del modelo que se analiza
- Cambio en R cuadrado. Cuantifica la variacin del coeficiente de determinacin que se produce al aadir o
eliminar alguna variable independiente en un modelo de regresin mltiple.
- Descriptivos incluye las medias y las desviaciones tpicas de las variables seleccionadas y la matriz de
correlaciones.
- Diagnsticos por caso. Esta opcin presenta dos alternativas para el anlisis de los residuos:
- la obtencin de predicciones de Y para Todos los casos. Genera las predicciones de Y y sus
correspondientes residuos para todos los casos.
GRFICOS
Este cuadro de dilogo permite seleccionar los grficos a incluir en los resultados.
El recuadro superior presenta una serie de nuevas variables relacionadas con las predicciones y los residuos. stas puede
seleccionadas para definir los ejes X e Y de los diagramas de dispersin que se quieren elaborar. Pulsando el botn Siguie
programa va numerando los diagramas que incluir en los resultados.
El recuadro Grficos de residuos tipificados presenta dos opciones: Histograma que muestra un histograma de los re
tipificados superponindole la distribucin normal y Grfico de prob. normal que crea un grfico P-P til para comprobar la hip
de normalidad a partir de los residuos tipificados. La comprobacin de esta hiptesis es fundamental para la correcta interpre
de las estimaciones por intervalo, tanto de los coeficientes de la recta como de las predicciones.
OPCIONES
Permite desactivar Incluir constante en la ecuacin que elimina el trmino independiente y proporciona la recta de regresi
pasa por el origen de coordenadas. Por lo que se refiere a los Valores perdidos, adems de las dos posibilidades Excluir casos
lista, activada por defecto, y Excluir casos segn pareja, comentadas en el epgrafe 3.6, hay la posibilidad de Reemplazar
media, opcin que sustituye los valores missing por la media de la variable correspondiente.
El modelo permite generar predicciones para el valor esperado o para un valor individual de la variable
dependiente (Y) asociado a un valor dado de la variable independiente (X). En ambos casos la prediccin
puntual es la misma y se obtiene sustituyendo en el modelo estimado el valor X 0 para el cual se desea
realizar la prediccin.
Para obtener el intervalo de confianza de los pronsticos y/o contrastar si puede aceptarse un
determinado valor de Y condicionado a un valor X 0 es necesario calcular el error estndar de la
prediccin, el cual depender del valor pronosticado:
Para obtener las predicciones se debe acceder al cuadro de dilogo Regresin Lineal: Guardar nuevas
variables con el botn Guardar:
El bloque Valores pronosticados presenta una serie de opciones que permiten guardar en el
archivo activo las predicciones No tipificadas y Tipificadas correspondientes a los casos incluidos
en la estimacin y las predicciones correspondientes a los casos no incluidos obtenidas a partir
del modelo estimado. Con la opcin Corregidos se obtienen los valores ajustados para cada
caso calculados a partir de la recta estimada exluyendo el caso (por lo tanto, se realizan tantas
estimaciones de la recta como casos incluidos en la muestra). La opcin E.T. del pronstico
promedio proporciona el error tpico de las predicciones del valor esperado.
El bloque Residuos permite guardar en el archivo activo los residuos correspondientes a los
casos incluidos en la estimacin No tipificados, Tipificados y Estudentizados. Con las opciones
Eliminados y Eliminados estudentizados se guardan los residuos correspondientes a las
regresiones obtenidas excluyendo el caso correspondiente.
Si se desea guardar estos resultados en un archivo nuevo se activa la opcin Estadsticos de los
coeficientes y se indica el nombre del archivo.
EJEMPLOS
Ejemplo 1.
Con las variables Peso y Est (estatura) del archivo Encinf.sav analizadas en el ltimo ejemplo del
captulo 3* estime el modelo de regresin lineal simple que explica el comportamiento del Peso (variable
dependiente) en funcin de la Est (variable independiente). Realice la estimacin con los 100 primeros
casos.
Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se seleccionan la variable Peso como Dependiente y la variable Est como Independiente. En el recuadro
Variable de seleccin se introduce la variable Enc (nmero de encuesta) y con el botn Regla se abre el
cuadro de dilogo Regresin Lineal: Establecer regla donde se introduce la condicin 'menor o igual que
100'.
En el cuadro resumen del modelo se observa que: r=0,883, R 2=0,78 (obsrvese que R2 es igual a r al
cuadrado) y Su=6,0638. El coeficiente de determinacin indica que el 78% de la variacin total del peso
en la muestra queda explicada por el modelo estimado y, por lo tanto, el modelo proporciona un buen
ajuste.
- Modelo estimado:
=-132,783 + 1,148Est.
: Sa=10,613 y
Sb=0,062.
- Coeficientes beta, que se obtienen estimando la regresin a partir de las observaciones estandarizadas.
En la regresin simple este coeficiente coincide con el coeficiente de correlacin lineal simple, r.
significacin crticos:
=-12,511 y
Ejemplo 2.
Compruebe si existen valores extremos y analice el comportamiento de los residuos del modelo de
regresin lineal estimado en el apartado anterior.
Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente.
Con el botn Estadsticos se accede al cuadro de dilogo que presenta las opciones correspondientes al
diagnstico de residuos. Se activa Diagnstico por caso y Valores atpicos a ms de 2 desviaciones
tpicas.
- Se observa que nicamente un caso presenta un resduo estandarizado, igual a 2,046, superior a 2
veces la desviacin estndar. Esto nos indica que no existe ningn caso atpico.
- En el cuadro Estadsticos sobre los residuos se comprueba que efectivamente no hay valores atpicos
ya que los valores mximo y mnimo de los residuos tipificados son inferiores a 3 en valor absoluto.
Con el botn Grficos se abre el cuadro de dilogo donde se deben activar las opciones correspondientes
a los Grficos de residuos tipificados.
El histograma de los residuos permite comprobar grficamente la hiptesis de normalidad; aspecto que
deber tenerse en cuenta para la interpretacin de los resultados de la inferencia estadstica. En este
caso vemos que la distribucin es campaniforme pero presenta una laguna en el centro que puede ser,
en parte, consecuencia de los intervalos definidos.
El diagrama P-P compara la frecuencia acumulada por los residuos tipificados con la probabilidad
esperada bajo la hiptesis de normalidad. Se observa que estas diferencias podran ser significativas en
alguna zona del grfico; lo cual, de ser cierto, pondra en duda la validez de la hiptesis de normalidad
de los residuos. No obstante, el criterio para decidir si se puede rechazar la hiptesis de normalidad ser
el que proporcione alguno de los contrastes de normalidad.
Adems, en el mismo cuadro de dilogo se puede pedir que elabore los diagramas de dispersin de, por
ejemplo, los residuos estandarizados en funcin de la variable dependiente (ZRESID y DEPENDNT).
En el grfico vemos que no existe ningn patrn de comportamiento de los residuos respecto a Y. Por lo
tanto, podemos mantener que estas variables aleatorias estn incorrelacionadas.
Ejemplo 3.
Obtenga las predicciones y los residuos correspondientes a los 100 casos incluidos en la estimacin y a
los 14 casos excluidos.
Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que
se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente.
Con el botn Guardar se abre el cuadro de dilogo donde se deben activar las opciones:
Valores Pronosticados > No tipificados y Tipificados para obtener las predicciones a partir del
modelo estimado.
Residuos > No tipificados y Tipificados para obtener los residuos de todos los casos.
Intervalos de Pronstico > Media e Individuos para obtener los lmites de los intervalos.
Los resultados de estas opciones quedan almacenados en el archivo de datos activo, y estn disponibles
para anlisis posteriores. Por defecto los nombres de las variables que crea son: Pre_1 (predicciones no
estandarizadas),
Res_1
(residuos
no
estandarizados),
Zpr_1,
Zre_1(predicciones
residuos
estandarizados, respectivamente), Sep_1 (error estndar de las predicciones), Imci_1, Unci_1 (Lmite
inferior y superior del intervalo de confianza para la prediccin del valor esperado de Y), Lici_1, Uici_1
(Lmite inferior y superior del intervalo de confianza para la prediccin individual de Y).
Por ejemplo, para el caso 101, que presenta una estatura de 168 y un pesoigual a 56, los resultados
son:
- Intervalo de confianza para el valor esperado de Y para los individuos con estatura 168 (58,73751 ;
61,36022).
Idnticamente, la prediccin para el caso 102, que presenta una estatura de 180, es de 73,82255 kg.,
con un residuo igual a -3,82255 y un error estndar 0,77055. Los correspondientes intervalos de
confianza para el valor esperado y para el valor individual son (72,29343 ; 75,35167) y (61,69239;
85,95271), respectivamente.
Series temporales
ANLISIS DE SERIES TEMPORALES
Una serie temporal est formada por una sucesin de observaciones de una variable efectuadas a intervalos regulares de tie
Las series temporales siempre presentan un orden natural determinado por el tiempo. El mantenimiento de este ord
fundamental para analizar la serie.
Las tcnicas estadsticas de anlisis de series temporales tienen por objeto estudiar y describir su evolucin en el pasado para
formular predicciones en un futuro ms o menos prximo.
REPRESENTACIN GRFICA
Para representar y anlizar una serie temporal con el programa SPSS, en primer lugar se debern introducir en el orden tempo
que han sido observados los valores de la variable cuya evolucin se desea analizar. A continuacin es necesario generar var
de fecha del sistema, que se utilizarn para establecer la periodicidad de la serie temporal y para etiquetar los resultado
anlisis realizado. Con la secuencia:
Datos
Definir fecha
En el recuadro Los casos son se indica el intervalo de tiempo deseado para generar las fechas. En El primer caso es se debe i
la fecha inicial que se asigna al primer caso. A los siguientes casos el sistema les asigna valores secuenciales, basndose
intervalo de tiempo definido.
Periodicidad a nivel superior indica, segn el caso, la amplitud del ciclo, el nmero de trimestres y/o meses, el nmero de das
semana, el nmero de horas por da, etc.
Al aceptar, y segn se haya definido la fecha (da, mes, trimestres, ao, ..), se crean una o ms variables numricas y de cade
el editor de datos. Los nombres de las nuevas variables terminan con un carcter de subrayado y se debern manten
modificar. Por ejemplo, si se define la fecha como Aos, trimestres, meses se crean las variables numricas Year_, Qua
Month_ y la variable cadena Date_. Si ya se han definido variables de fecha anteriormente, stas sern reemplazadas p
nuevas.
El anlisis de una serie temporal debe partir de su representacin grfica. El grfico ms frecuente es la representacin
sistema cartesiano con el tiempo en el eje de abscisas y los valores de la variable temporal en el de ordenadas. Esta represen
pone de manifiesto las caractersticas ms importantes de la serie como son el movimiento secular o a largo plazo, oscilac
rupturas, valores anmalos, variacin absoluta entre periodos, etc.
En algunos casos es conveniente obtener el grfico semilogartmico transformando la serie aplicando logaritmos naturales
grfico recoge las tasas de variacin, lo que permite comparar la evolucin relativa de dos o ms series.
Otro grfico que en ocasiones es interesante analizar es el de las primeras diferencias de la serie, (X t-Xt-1), que permite visu
los cambios que ha experimentado la serie en perodos sucesivos.
Grficos
Secuencia
En el cuadro de dilogo se seleccionan la o las variables que se quieren representar en la ventana Variables.
En Etiquetas del eje del tiempo se indica la variable cuyos valores se emplearn para etiquetar el eje de abscisas. Esta va
puede ser numrica o de cadena.
Las opciones de Transformar permiten seleccionar los grficos correspondientes a las siguientes transformaciones de los datos
-Diferenciar ciclo.
Si se quieren representar las variables seleccionadas en grficos distintos se deber activar Un grfico por variable. Por d
todas las variables se representan en el mismo grfico.
Con el botn Lneas temporales se accede a un cuadro de dilogo donde se pueden definir lneas de referencia para el eje tem
Por defecto est activada la opcin Sin lneas de referencia. Por ejemplo, si los datos son mensuales, activando la opcin Ln
cada cambio de y seleccionando year_, el grfico aparecer dividido por lneas verticales (perpendiculares al eje de abscisas)
puntos correspondientes al ltimo mes de cada ao. Activando la opcin Lnea en la fecha aparecer en el grfico una lnea v
dividiendo la serie en dos partes, antes y despus de la fecha indicada.
El botn Formato presenta un conjunto de opciones que permiten modificar el grfico. Por defecto estn activadas las op
Tiempo en el eje horizontal y Grfico de lneas. Si se activa la opcin Lnea de referencia en la media de la serie en el g
aparece una lnea paralela al eje de abscisas que seala el valor medio de la serie.
El enfoque clsico de anlisis de las series temporales se basa en el supuesto de que los valores observados de una serie
resultado de agregar todos o algunos de los siguientes componentes:
Tendencia, recoge el movimiento secular o a largo plazo de la serie determinado por fuerzas de carcter estructural q
mantienen estables durante largo tiempo.
Ciclo, son las oscilaciones peridicas de duracin superior al ao registradas como consecuencia de la dinmica econmica.
Variaciones Estacionales, recogen las fluctuaciones perodicas de duracin inferior al ao que siguen la misma pauta ao tra
Estas variaciones se deben a factores de tipo climtico, institucional, tradicional, etc. Para identificar la existencia de
componente es necesario que el perodo de observacin est dividido en subperodos.
Variaciones Irregulares, son oscilaciones que se presentan en perodos muy cortos como consecuencia de factores no explicad
el tiempo y de difcil control.
Estos componentes no pueden ser observados directamente por separado, pero pueden estimarse con diferentes tcnic
descomposicin. El mtodo de descomposicin que se deber aplicar en cada caso dependerar del esquema de agregacin
componentes que se suponga presenta la serie analizada. Los esquemas ms frecuentes son el aditivo que postula que la sum
los componentes constituye la serie observada; y el multiplicativo que supone que la serie observada es el resultado de mult
los componentes.
Si las observaciones de la variable se efectuan en subperodos (meses, trimestres, das, horas) se puede determinar el esque
agregacin de las componentes a partir de la representacin grfica. Si las fluctuaciones de los valores de la variable por enc
por debajo de la tendencia presentan un patrn regular en el transcurso del tiempo, el modelo de agregacin ser el aditivo.
el contrario la amplitud de dichas fluctuaciones crece o decrece con la tendencia el esquema o modelo es el multiplicativo.
Otro procedimiento para analizar el esquema de agregacin se basa en el clculo de los valores medios y las desviaciones t
para los k subperodos en que se ha dividido la unidad de observacin. Si a medida que aumenta (o disminuye) el valor me
desviacin tpica aumenta (o disminuye) el esquema de agregacin adecuado es el multiplicativo; si las desviaciones tpic
mantienen aproximadamente iguales sea cual sea el valor de la media, el modelo adecuado es el aditivo.
ANLISIS DE LA TENDENCIA
Para analizar la tendencia, es decir, para aislar el componente que determina el comportamiento a largo
plazo de la serie pueden utilizarse dos procedimientos: las medias mviles y el ajuste por mnimos
cuadrados ordinarios.
Medias mviles
Una serie de medias mviles puede considerarse como una serie temporal artificial construida
substituyendo el valor observado de la variable en cada perodo por la media de dicho valor y algunos
anteriores y posteriores a l. En general, el primer valor de una media mvil de orden k es:
Por el mismo procedimiento se calculan los valores sucesivos. De esta forma se obtiene una serie
alisada, de la cual se han eliminado o suavizado las fluctuaciones con periodicidad igual o inferior al
orden de la media mvil. Esta serie alisada puede considerarse como una serie de estimaciones de la
tendencia en cada perodo.
En caso de que la tendencia de una serie temporal sea lineal, sta puede modelizarse como Xt=a+bt
donde t es el tiempo o variable independiente y b es la tasa de crecimiento o decrecimiento de la
tendencia. Para estimar los parmetros a y b a partir de la serie observada se ajusta por MCO una recta
a la nube de puntos (t,Xt). Para obtener la estimacin de la tendencia con el programa SPSS la secuencia
es: Analizar > Regresin > Lineal, teniendo en cuenta que la variable dependiente es, en este caso, X y
la independiente es t.
Las series observadas con periodicidad inferior al ao (mensual, trimestral, ...) recogen conjuntamente la evolucin coyuntur
largo plazo, y las variaciones estacionales. Para poder analizar correctamente la serie es necesario separar estas va
procedimiento que permite aislar el componente estacional utilizado por el SPSS se basa en la descomposicin mediante me
Se parte del supuesto de que el patrn de las variaciones estacionales se mantiene constante ao tras ao, y pueden cuan
nmeros ndices si el esquema de agregacin es multiplicativo o con coeficientes si el esquema es aditivo.
Los ndices de variacin estacional (IVE) recogen el incremento o la disminucin porcentual que el componente estacional prod
estacin anual (mes, trimestre,...). Estos ndices no deben incidir sobre la serie anual, por lo tanto, su promedio anual siem
igual a 1 (o 100 si est expresado en tanto por ciento).
Los coeficientes de variacin estacional indican el valor en que aumenta o disminuye la tendencia a causa del componente est
que estos coeficientes no modifiquen la serie anual siempre debern sumar 0.
Para obtener los ndices o coeficientes por el mtodo de descomposicin, el SPSS realiza las siguientes operaciones:
- estimacin del componente extraestacional (Tendencia-Ciclo) con una media mvil de orden k, siendo k el nmero
estacionales que presenta la serie (k=12 si las observaciones son mensuales, k=4 si son trimestrales, etc);
- estimacin de las variaciones estacionales especficas de cada perodo dividiendo (o restando) la serie por la media mvil;
- estimacin de las variaciones estacionales netas u obtencin del IVE eliminando las fluctuaciones irregulares observadas en c
para ello se toma el valor mediano de las variaciones especificas de cada perodo estacional por separado y se corrigen de f
promedio no afecte a la serie anual.
Para estimar los factores estacionales multiplicativos o aditivos de una serie temporal la secuencia a seguir es:
Analizar
Series Temporales
Descomposicin estacional
Si previamente no se ha definido la variable fecha, tal y como se ha explicado en el primer apartado, al ejecutar la secuenc
programa muestra un mensaje indicando que es necesario tener alguna variable fecha creada.
- la o las variables para las que se desea estimar los factores estacionales en el cuadro Variables;
- el tipo de modelo de agregacin de los componentes (multiplicativo o aditivo) con las opciones Modelo;
- el criterio que se emplear para calcular las medias moviles de orden par (si la periodicidad es impar todos los puntos se p
igual). Las opciones de Ponderacin de la media mvil son:
- Todos los puntos son iguales calcula las medias mviles con una amplitud igual a la periodicidad y con todos los puntos po
igual.
- Puntos finales ponderados por ,5 centra las medias moviles de orden par calculando una media mvil de orden 2 con los res
primera media mvil que se calcula con una amplitud igual a la periodicidad.
Al seleccionar Mostrar el listado por casos se obtiene un resumen para cada caso de todos los resultados intermedios,
estadsticos finales.
Al aceptar, el programa genera un conjunto de variables nuevas con los resultados del proceso: ERR, SAS, SAF y STC. Por d
variables se incluyen en el archivo activo, pero con el botn Guardar se puede indicar que no las cree o que sustituya las existe
EJEMPLO
Ejemplo 1.
Con la secuencia Grficos > Secuencia y seleccionando en el cuadro de dilogo las variables Viajes y Ao se obtiene
representacin grfica:
La observacin del grfico pone de manifiesto la existencia de una tendencia creciente as como de un patrn estacional muy
valor mximo anual se observa sistemticamente en el mes de agosto, seguido por los valores de la variable en julio y sep
mismo, en los meses de enero, febrero, noviembre y diciembre se observan sistemticamente los valores mnimos anuales.
Ejemplo 2.
Para determinar el modelo ms adecuado se hallan para cada ao la media y la desviacin tpica de las 12 observaciones m
primer lugar, es necesario una variable fecha. Para crear esta variable la secuencia a seguir es: Datos > Definir fecha. Com
mensual se elige la opcin Aos, meses (tambin se puede aplicar el formato Aos, trimestres, meses) y se indica el ao corre
la primera observacin y el mes. En este caso se deber tomar como ao de inicio 1995 y Mes: 1 que corresponde a ene
creado la variable fecha con el formato Aos, trimestres, meses se indicar tambin que la primera observacin correspon
Con la secuencia Analizar >Informes > Resumir por casos se abre el cuadro de dilogo donde se seleccionan: en Variables
Variable de seleccin: year_. Con el botn Estadsticos se activan las opciones Media y Desviacin tpica. Para obtener s
resultados finales se desactiva Mostrar los casos. El resultado que se obtiene es el siguiente:
Como puede observarse, las desviaciones tpicas de cada ao crecen a medida que crece el valor medio, lo cual es indicio de q
de agregacin de las componentes de esta serie es multiplicativo.
Ejemplo 3.
Determine los valores de los ndices de variacin estacional de la variable Viajes del archivo Turivia.sav.
Para poder calcular los ndices de variacin estacional de la serie Viajes es necesario, en primer lugar, definir una variable fec
ha hecho en el ejemplo 2.
Para obtener los ndices de variacin estacional correspondientes a cada uno de los 12 meses la secuencia a seguir es: Anal
Temporales > Descomposicin estacional. En el cuadro de dilogo se selecciona la variable Viajes, se mantiene el modelo M
se indica que las medias mviles se quieren realizar con la ponderacin Puntos finales ponderados por ,5. Si se quiere recoger
los resultados de la descomposicin en el editor de resultados se deber seleccionar Mostrar el listado por casos.
Ratios (*100)=
Seasonal factors: ndices de variacin estacional corregidos (IVE),obtenidos como mediana de los ratios correspondientes a
estacional por separado y corregido teniendo en cuenta que se debe verificar:
Serie desestacionalizada;
Los ndices de variacin estacional obtenidos son: JAN 62,207 FEB 63,671 MAR 80,921 APR 95,999 MAY 105,515 JUN 104,870
AUG 180,162 SEP 115,276 OCT 99,178 NOV 68,232 DEC 71,698. Por lo tanto, se puede concluir que la serie en los meses en
marzo, abril, octubre, noviembre y diciembre toma valores inferiores a la tendencia media; el componente estacional
repercusin en el mes de agosto incrementando en algo ms del 80% el valor de los viajes; en el mes de enero es cuando s
mayor decremento de los viajes debido a la estacionalidad, reducindose stos en cerca del 38%.
Como se puede observar, la serie desestacionalizada presenta fluctuaciones a muy corto plazo debidas a la accin del
irregular, mientras que la serie de valores de tendencia-ciclo est mucho ms alisada y sugiere una tendencia lineal creciente.
TCNICAS DE PREDICCIN
Las hiptesis en que se basan las TPNC son, en primer lugar, la estabilidad de la forma del
comportamiento sistemtico de la serie y, en segundo lugar, que el valor de la variable observado en
cualquier perodo t es el resultado del comportamiento sistemtico y de una perturbacin aleatoria.
Cuando la serie presenta un comportamiento estacionario, es decir, no tiene tendencia y puede ser
modelizada como
Xt=a+ut
Xt
el alisado exponencial simple (AES). Este mtodo estima para cada perodo T el parmetro a como suma
ponderada de todas las observaciones anteriores, dando mayor importancia a las observaciones ms
recientes que a las ms antiguas. La expresin de clculo es:
es la estimacin de
es la
Como se observa, el AES actualiza perodo a perodo las estimaciones de a incorporando la nueva
informacin.
La eleccin de la constante de alisado determina las caractersticas operativas del AES, ya que la rapidez
con que se adaptan las predicciones a los posibles cambios experimentados por el valor de
. Si
valor de
a depende de
mximo las fluctuaciones aleatorias debidas al trmino de perturbacin y conseguir un mejor alisado.
La prediccin del valor de
Analizar
Series Temporales
Suavizado exponencial
En el cuadro de dilogo Suavizado exponencial est activado por defecto el mtodo AES que corresponde
al Modelo: Simple. Se indica la serie que se quiere predecir en la ventana Variables. Con el botn
Parmetros se abre el siguiente cuadro de dilogo en el que se puede modificar la eleccin del valor de
la constante de alisado:
Por defecto est activada para Alfa la opcin Valor: 0,1. Con la opcin Bsqueda en rejilla se puede fijar
un intervalo de valores entre los que el sistema seleccionar el valor de
de cuadrados de los errores de estimacin (SSE). La bsqueda puede afinarse tanto como se quiera
modificando en la casilla Por el valor de incremento. Si se mantiene seleccionada la opcin Mostrar slo
los 10 mejores modelos de la bsqueda en rejilla se muestran slo en el visor de resultados los valores
de los parmetos y las SSE para los 10 valores de
El valor inicial del alisado, por defecto, lo calcula el sistema automticamente a partir de la serie
observada. Con la opcin Valores iniciales: Personalizado se puede fijar el valor de inicio que se desee.
El botn Guardar, del cuadro de dilogo Suavizado Exponencial, permite modificar las opciones
relacionadas con la creacin de nuevas variables y con la prediccin:
Con respecto a la creacin de nuevas variables con los resultados del alisado, la opcin activada por
defecto es Aadir al archivo con la que se aaden a la base de datos activa la serie alisada y los errores
de prediccin. La opcin Sustituir las existentes guarda slo las variables del ltimo procedimiento
sustituyndolas si en el archivo activo ya existan. Por ltimo, la opcin No crear indica que no se desea
guardar ninguna variable de resultados.
Con respecto a las predicciones, en Pronosticar casos, por defecto, est activada la opcin Desde el
perodo de estimacin hasta el ltimo caso que proporciona los valores alisados (St) nicamente para los
perodos observados. La opcin Pronosticar hasta permite generar predicciones para valores futuros de
la variable hasta el perodo indicado en Observacin.
MTODO DE HOLT
Cuando la serie presenta tendencia lineal, creciente o decreciente, y puede ser modelizada como
+
bt
ut
(donde
ut
xt
=a
La primera de las ecuaciones proporciona una estimacin del nivel de la serie en el perodo T y la
segunda permite obtener una estimacin de la pendiente de la recta de tendencia para el perodo T.
La prediccin para los perodos futuros T+1, ....T+k obtenida en el perodo T es:
Analizar
Series Temporales
Suavizado exponencial
En el cuadro de dilogo se selecciona la variable y se activa la opcin Holt. Con el botn Parmetros se
accede al cuadro de dilogo que permite modificar las constantes de alisado y personalizar los valores
iniciales tal y como se ha visto en el epgrafe anterior.
Para obtener predicciones para perodos futuros se activa el botn Guardar y se procede de la misma
forma que en el caso del AES.
MTODO DE WINTERS
Una serie con tendencia lineal y patrn estacional multiplicativo puede modelizarse como:
ct+ut
donde
ct
Xt=(a+bt)
aT, bT
cT
comprendidos entre 0 y 1.
La prediccin para los perodos futuros T+1, ..., T+k obtenida en el perodo T es:
Para que el mtodo de Winters est disponible en el sistema, es imprescindible haber creado
previamente una variable fecha con la secuencia Datos > Definir fecha.
Analizar
Series Temporales
Suavizado exponencial
En el cuadro de dilogo se selecciona la variable y se activa la opcin Winters. Con el botn Parmetros
se accede al cuadro de dilogo que permite fijar valores a las constantes de alisado y personalizar los
valores iniciales.
Las predicciones para perodos futuros se obtienen activando el botn Guardar indicando en el cuadro de
dilogo correspondiente el ao y el perodo estacional hasta el que se desea obtener predicciones.
EJEMPLO
Dado que la serie presenta componente estacional, para poder aplicar el mtodo de alisado de Winters,
en primer lugar, es preciso definir la variable fecha con la secuencia Datos > Definir fecha.
Con la secuencia Analizar > Series > Suavizado exponencial se accede al cuadro de dilogo Suavizado
exponencial donde se selecciona la variable Viajes y se indica el modelo de prediccin: Winters.
Para determinar las constantes de alisado que minimizan la suma de errores de estimacin al cuadrado
es preciso activar el botn Parmetros. Con la opcin Busqueda en rejilla se puede especificar un
intervalo de valores para cada una de las constantes de alisado, Alfa, Gama y Delta, entre los cuales el
sistema determinar aquellos que optimicen la prediccin. En este caso se mantienen los valores de las
constantes de alisado que el sistema proporciona por defecto.
Se eligen como valores iniciales del alisado los que el sistema proporciona automticamente.
Para generar los pronsticos del nmero de visitantes en el prximo ao hay que activar el botn
Guardar y seleccionar la opcin Pronosticar hasta e indicar en Ao: 2000 y en Mes: 12.
Los coeficientes estacionales que el mtodo Winters utiliza para inicializar el alisado son los que se
obtienen aplicando el mtodo de descomposicin estacional establecido por defecto en el sistema.
En el editor de datos se han creado 14 nuevos perodos, que van desde noviembre de 1999 a diciembre
de 2000, que recogen los pronsticos de la variable Viajes. Por ejemplo, para los meses de noviembre y
diciembre de 1999, enero, febrero, marzo y abril de 2000 el sistema pronostica que el nmero de
visitantes ser 4.493.515, 4.751.482, 4.171.475, 4.274.225, 5.441.096 y 6.553.431, respectivamente.