Sunteți pe pagina 1din 94

ANLISIS DE REGRESIN

Y SERIES DE TIEMPO
Objetivo del curso:
Conocer, comprender y utilizar los conceptos relacionados
con anlisis de regresin y de series de tiempo, en el
contexto de la optimizacin de procesos
TEMAS DEL CURSO
1. Introduccin a los modelos de pronsticos
2. Modelos de regresin
3. Modelos de series de tiempo
1. Introduccin a los modelos
de pronsticos
Definicin de pronstico
Caractersticas de los modelos de pronsticos
Aplicacin de los pronsticos en diferentes reas
de la empresa
Clasificacin de modelos de pronsticos
Criterios de desempeo=medicin del error

Definicin de pronstico
Predecir lo que es probable que ocurra en el futuro,
basndose en el anlisis de informacin disponible
y en la experiencia de l o los involucrados
Caractersticas de los
modelos de pronsticos
No son 100% exactos
Requieren informacin histrica confiable
Necesitan revisin contnua
Es til si se reduce la incertidumbre que
rodea al evento en cuestin y si su beneficio
es superior al costo incurrido en obtenerlo

Aplicacin de los pronsticos
Produccin
Mercadotecnia
Finanzas
Recursos Humanos
Planeacin estratgica
Clasificacin de modelos de
pronsticos


Cualitativos

Cuantitativos
Modelos de pronsticos
cuantitativos


De series de tiempo

Causales o de Regresin

Series de tiempo
Promedio mvil simple
Suavizacin exponencial simple
Promedio mvil lineal
Suavizacin exponencial lineal
Suavizacin exponencial cuadrtica
Winters
Descomposicin de series de tiempo

Causales

Regresin lineal simple
Regresin mltiple
Regresin polinomial
Seleccin del mtodo de
pronstico
Informacin disponible
Patrn de la informacin
Exactitud deseada (error)
Ciclo de vida del producto

Patrn de la informacin
Patrn estacionario
10
15
20
25
30
35
40
45
50
55
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Serie1
Patrn de la informacin
Patrn tendencia

135
140
145
150
155
160
165
170
175
180
185
1 2 3 4 5 6 7 8 9 10 11
Serie1
Patrn de la informacin
Patrn estacional
0
20
40
60
80
100
120
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Serie1
Patrn de la informacin
Patrn cclico

Exactitud deseada(error)

Criterios de desempeo=medicin del error
Se han ideado algunos criterios para resumir los errores generados
por un mtodo particular de pronstico, la mayora de ellos implican
promediar alguna funcin de la diferencia entre el valor real (Y
t
) y
su valor de pronstico (

)
t t t
Y Y e

=
t
Y

Criterios de desempeo=medicin del error


2
1
)

(
1

=
=
n
t
t t
Y Y
n
MSE
a) Error cuadrtico medio (Mean Square Error)
Penaliza fuertemente los errores grandes
Se utiliza para seleccionar los mejores parmetros
dentro de un mtodo de pronstico
Menor es mejor
Criterios de desempeo=medicin del error
100 *

1
1

=
n
t
t
t t
Y
Y Y
n
MAPE
b) Promedio del porcentaje de error absoluto
Representa el % de error del mtodo aplicado para una
serie de datos
Se utiliza para seleccionar el mejor mtodo de pronstico
Menor es mejor
Criterios de desempeo=medicin del error
c) Desviacin absoluta media (MAD)
n
Y Y
MAD
n
t
t t
=

=
1

Resulta de gran utilidad cuando el analista desea medir el


error en las mismas unidades de los datos originales
Menor es mejor

Criterios de desempeo=medicin del error
d) Porcentaje medio del error (MPE)
( )
n
Y
Y Y
MPE
t
n
t
t t
=

=
1

Resulta til cuando se desea determinar si un pronstico


est sesgado:
Si el MPE da un resultado cercano a cero, el pronstico no est sesgado
Si el MPE da un resultado negativo grande, el pronstico est sobreestimado
Si el MPE da un resultado positivo grande, el pronstico est subestimando
Pasos:
Recopilacin de datos
Condensacin de datos
Construccin del modelo
Extrapolacin del modelo (pronosticar)
2. Modelos de regresin
Regresin lineal simple
El pronstico se expresa como funcin de un factor
que se piensa lo afecta.

El pronstico no necesariamente depende del tiempo



Supuestos de la regresin lineal
Asociacin lineal entre las 2 variables involucradas
Los valores de Y tienen una distribucin normal a lo
largo de la ecuacin de regresin
Los errores tienen variancia constante
Los errores tienen media cero
Los errores estn normalmente distribuidos
Independencia de las observaciones

x
f(x)
Asociacin lineal
Ecuacin de prediccin
i i
i i i
X b b y
e X y
x f y
1 0
1 0

) (
+ =
+ + =
=
| |
Ecuacin de prediccin
Donde:

y = variable dependiente
X = variable independiente

0
|
= interseccin de la recta (poblacin)
1
|
= pendiente de la recta (poblacin)
b
0
= interseccin de la recta (muestra)
b
1
= pendiente de la recta (muestra)
e =error o residual
Regresin lineal simple
PASOS:
Determinar la forma de la relacin
Estimar los parmetros de la relacin
Probar que la relacin encontrada es
adecuada para la toma de decisiones
Relacin lineal positiva
Relacin lineal negativa
Relacin curvilnea positiva
Relacin parablica
Determinar la forma de la relacin
Ninguna relacin
Estimar los parmetros de la relacin:
mtodo de mnimos cuadrados

Consiste en ajustar una lnea recta a la muestra de datos
de tal forma que el error cuadrtico medio (MSE) sea
mnimo

Parmetros de la ecuacin de prediccin





=
2 2
2
0
) ( X X n
XY X Y X
b

=
2 2
1
) ( X X n
Y X XY n
b
Ejemplo:

Los siguientes datos representan las ventas semanales de cierta
compaa. Se piensa que a las ventas les afecta los gastos
semanales en publicidad.
Ventas($) Gastos publicidad($)
1250 41
1380 54
1425 63
1425 54
1450 48
1300 46
1400 62
1510 61
1575 64
1650 71
1. Calcule la ecuacin de prediccin
2. Pronostique las ventas para un gasto semanal de $50
Ventas(Y) Gastos(X)
1250 41 51250 1681
1380 54 74520 2916
1425 63 89775 3969
1425 54 76950 2916
1450 48 69600 2304
1300 46 59800 2116
1400 62 86800 3844
1510 61 92110 3721
1575 64 100800 4096
1650 71 117150 5041
14365 564 818755 32604

XY

2
X

=
2 2
2
0
) ( X X n
XY X Y X
b
1268 . 828
) 564 ( 32604 * 10
818755 * 564 14365 * 32604
2
0
=

= b

=
2 2
1
) ( X X n
Y X XY n
b
7867 . 10
) 564 ( 32604 * 10
14365 * 564 818755 * 10
2
1
=

= b
i i
X y 7867 . 10 1268 . 828

+ =
1367.46475 ) 50 ( 7867 . 10 1268 . 828

= + = y
Pronstico:
Probar que la relacin encontrada es
adecuada para la toma de decisiones

Coeficiente de correlacin y de
determinacin
Significancia del modelo (ANOVA)
Significancia de los coeficientes
Coeficiente de correlacin(r) y de determinacin (r
2
)

+
=
2 2
2
1 0 2
Y n Y
Y n XY b Y b
r
2
r r =
r
2
: mide el porcentaje de variabilidad en Y que es explicado
A travs de X
r : mide el grado de asociacin lineal entre las variables X,Y
1 1 s s r
Ejemplo:
9 0.71901925
(1436.5) * 10 - 20763875
(1436.5) * 10 - 818755 * 10.7867573 14365 * 828.126888
2
2
2
=
+
= r
0.84795003 9 0.71901925 = = r
0 :
0
= H
Es una prueba de proporcin de variancia o estadstica F, para validar
que un modelo en particular es bueno para pronosticar
Significancia del modelo (ANOVA)
No existe diferencia entre la media y la ecuacin
De regresin para hacer el pronstico
0 :
1
= H
La ecuacin de regresin es mejor que la media para
pronosticar
Significancia del modelo (ANOVA)
Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Cuadrados
medios
F
0
Regresin
(explicada)
m-1
Error
(no explicada)
n-m
Total n-1
( )
2

Y Y
( )
2

Y Y
( )
2

Y Y
( )
1

m
Y Y
( )
m n
Y Y

( )
1

m
Y Y
( )
m n
Y Y

Significancia del modelo (ANOVA)


m n m c
F F

=
, 1 , o
Donde:
m= nmero de variables en la ecuacin
n=nmero de observaciones (datos)
o
= nivel de significancia que se desea en la prueba
0
F
c
F Si
>
Se rechaza H
0
Por lo tanto es mejor la ecuacin de regresin que la media para
pronosticar
Significancia del modelo (ANOVA)
F
c
H
o
H
1
Significancia de los coeficientes
Es una prueba que sirve para validar estadsticamente la correlacin
entre las variables del modelo, y de esta manera asegurar que la variable
independiente es buena para predecir el comportamiento de la variable
dependiente
0 :
0
=
i
H |
0 :
1
=
i
H |
No existe correlacin entre las variables
Si existe correlacin entre las variables
Significancia de los coeficientes
Para b
0
0
0
0
b
S
b
t =
( )


+ =
2
2
1
0
x x
x
n
S S
yx b
( )
m n
y y
S
yx

=

2

Significancia de los coeficientes


Para b
1
1
1
0
b
S
b
t =
( )


=
2
1
x x
S
S
yx
b
Significancia de los coeficientes
-t
c
t
c
H
o
H
1
H
1
m n
c
t t

=
,
2
o
En el lado positivo: Si t
o
>t
c
0
En el lado negativo: Si t
o
<t
c
Se rechaza Ho
Se rechaza Ho
Intervalo de confianza de los parmetros de
la ecuacin de prediccin
Pendiente ( )
1
|
|
|
.
|

\
|
+ s s
|
|
.
|

\
|


xx
E
m n
xx
E
m n
S
MS
t b
S
MS
t b
,
2
1 1
,
2
1 o o
|
( )
2
1

=
=
n
i
i xx
X X S
Donde:
MS
E
= Cuadrados medios del error
Intervalo de confianza de los parmetros de
la ecuacin de prediccin
Para la interseccin
|
|
.
|

\
|
(

+ + s s
|
|
.
|

\
|
(

+

xx
E
m n
xx
E
m n
S
x
n
MS t b
S
x
n
MS t b
2
,
2
0 0
2
,
2
0
1 1
o o
|
Intervalo de confianza de la respuesta media
( )
( )
( )
( )
|
|
|
|
.
|

\
|

+ + s s
|
|
|
|
.
|

\
|

+

=

n
i
i
yx
m n
n
i
i
yx
m n
X X
X X
n
S t y y
X X
X X
n
S t y
1
2
2
0
,
2
0 0
1
2
2
0
,
2
0
1

o o
Intervalo de prediccin de nuevas
observaciones de la variable dependiente
( )
y
m n
S t y

,
2
0

|
|
.
|

\
|


o
( )
( )

+ + =
2
2
0

1
1
X X
X X
n
S S
i
yx y
Prueba de independencia de los
residuos: Heteroscedasticidad

Durbin-Watson
0 :
0
=
e
H
0 :
1
=
e
H
Los residuos no estn correlacionados
Los residuos si estn correlacionados
( )

=
=

=
n
i
i
n
i
i i
e
e e
dw
1
2
2
2
1
0
Prueba de independencia de los residuos
2 d
L
d
U
4-d
u
4-d
L
Si dw
0
< d
L
si dw
0
>4-d
L Existe correlacin entre los errores
Si d
U
<dw
0
< 4- d
U No existe correlacin entre los errores
Si d
L
<dw
0
<d
U
Si 4- d
U
<dw
0
< 4-d
L
No existe evidencia estadstica suficiente
para validar la correlacin entre los errores
Modelos no lineales
Exponencial (Exponential fit)
Logartmico (Logarithmic fit)
Asinttica (Asymptotic fit)
Polinomial (Polynomial fit)

Exponencial

Es una transformacin de la ecuacin de regresin lineal
simple, a travs de ln.
Donde:

y= ln y
i
X b b y
1 0

ln + =
La ecuacin de pronstico se transforma a:
Ajuste logartmico
Es una transformacin de la ecuacin de
regresin lineal simple, a travs de log.
Donde:

x=log(x)
La ecuacin de pronstico se transforma a:
x b b y log

1 0
+ =
Asinttica
Es una transformacin de la ecuacin de
regresin lineal simple, a travs del inverso de
las variables.
Donde:

y=1/y
x=1/x
La ecuacin de pronstico se transforma a:
x b b
x
y
0 1

+
=
Polinomial

La forma ms comn de representar un polinomio en regresin
lineal es:
k
k
X b X b X b X b b y + + + + + = ...

3
3
2
2 1 0
Lo que convierte a una regresin simple en una mltiple,
tenindose que utilizar el clculo matricial para resolver
el polinomio
Se puede transformar las 2 variables a la vez, donde:
x=log x
y=log y
La ecuacin de pronstico se transforma a:
x b b y
o
log

log
1
+ =
Ejemplos
Regresin lineal mltiple
El pronstico de la variable de inters se expresa en
funcin de los factores o variables que se piensa la afectan.
y= f(x
1
,x
2
,x
3
,...,x
k
)
Supuestos de la regresin lineal mltiple




Asociacin lineal entre cada variable independiente con la
variable dependiente
Los valores de Y tienen una distribucin normal a lo largo de la
ecuacin de regresin
Los errores tienen variancia constante
Los errores tienen media cero
Los errores estn normalmente distribuidos
Independencia de las observaciones
Variables independientes no correlacionadas

Regresin mltiple
ki k i i i
ki k i i i
X b X b X b b y
X X X y
+ + + + =
+ + + + =
...

...
2 2 1 1 0
2 2 1 1 0
| | | |
Regresin lineal mltiple
PASOS:
Estimar los parmetros de la relacin
Probar que la relacin encontrada es
adecuada para la toma de decisiones
Regresin lineal mltiple
Estimar los parmetros de la relacin
( ) ( ) Y X X X b
T T
1
=
Donde:
b=matriz de coeficientes de la ecuacin de regresin (b
0
,b
1
,b
2
,...b
k
)
(
(
(
(

=
kn n n n
k
k
k
X X X X
X X X X
X X X X
X X X X
X
...
...
...
...
3 2 1
3 33 23 13
2 32 22 12
1 31 21 11
Regresin lineal mltiple
(
(
(
(

=
n
y
y
y
y
Y
3
2
1
X
T
= matriz transpuesta de X
(
(
(
(

=
kn k k k
n
n
n
T
X X X X
X X X X
X X X X
X X X X
X
...
...
...
...
3 2 1
3 33 32 31
2 23 22 21
1 13 12 11
Regresin mltiple

Coeficiente de correlacin y de determinacin
Colinealidad
Heteroscedasticidad
Significancia del modelo (ANOVA)
Significancia de los coeficientes
Elementos a considerar para el mejor modelo:
Regresin lineal mltiple
Coeficiente de correlacin y de determinacin
Al igual que en la regresin simple, 1 1 s s r
Solamente que en la regresin mltiple, r est en funcin de una ms
variables independientes.

Lo mismo pasa con r
2
Regresin lineal mltiple
Colinealidad: cuando 2 variables independientes estn
fuertemente correlacionadas
Problemas:
La ecuacin de regresin puede mentir
r
2
no se incrementa significativamente al agregar una nueva
variable independiente al modelo
Regresin lineal mltiple
Heteroscedasticidad
Durbin-Watson
0 :
0
=
e
H
0 :
1
=
e
H
Los residuos no estn correlacionados
Los residuos si estn correlacionados
( )

=
=

=
n
i
i
n
i
i i
e
e e
dw
1
2
2
2
1
0
Regresin lineal mltiple
Significancia del modelo (ANOVA)
Regresin lineal mltiple
Significancia de los coeficientes
3. Modelos de series de tiempo
Estos modelos se caracterizan por pronosticar siempre
en funcin del tiempo. Los modelos que emplean son:

Promedio mvil simple
Suavizacin exponencial simple
Promedio mvil lineal
Suavizacin exponencial lineal
Suavizacin exponencial cuadrtica
Winters
Descomposicin de series de tiempo

Promedio mvil simple
Este mtodo se emplea para pronosticar series de tiempo
con patrn estacionario
Promedia N datos para calcular el pronstico, dndole el
mismo peso a cada uno de los N datos
Promedio mvil simple
Donde:
1 + t
P : Pronstico para el periodo t+1
X
t
: dato real en el periodo t
N : nmero de datos que se promedian para el pronstico
N X X X X P
N t t t t t
/ ) ... (
1 2 1 1 + +
+ + + + =
Suavizacin exponencial simple(SES)
Este mtodo se emplea para pronosticar series de tiempo
con patrn estacionario
Utiliza siempre la informacin ms reciente para pronosticar,
ya que le da mayor peso o ponderacin al dato ms reciente
y disminuye exponencialmente ese peso conforme la
informacin se hace ms antiga
Suavizacin exponencial simple(SES)
t t t
P X P * ) 1 ( *
1
o o + =
+
Ecuacin de pronstico
Donde:
1 + t
P
: Pronstico para el periodo t+1
o :peso o ponderacin del dato ms reciente
1 0 s so
X
t
: Dato real ms reciente

P
t
: pronstico ms reciente
Promedio mvil lineal
Este mtodo se emplea para pronosticar series de tiempo
con patrn tendencia
Utiliza 2 promedios mviles simples como base para
calcular los elementos de la ecuacin del pronstico
Promedio mvil lineal
Donde:
) (m b a P
t t m t
+ =
+
a
t
: interseccin de la recta con el eje vertical en el periodo t
b
t
: pendiente de la recta en el periodo t
m: nmero de periodos a pronosticar
t t t
P P a
' '

'
= 2
( )
t t t
P P
N
b
' '

'

=
1
2
Promedio mvil lineal
( )
N
X X X X
P
N t t t t
t
1 2 1
...
+
+ + + +
=
'
( )
N
P P P P
P
N t t t t
t
1 2 1
...
+
+ + + +
=
' '
Suavizacin exponencial lineal:
mtodo de Brown
Se utiliza para pronosticar series de tiempo con tendencia
Emplea 2 suavizamientos para calcular los elementos de la
ecuacin de pronstico
) (m b a P
t t m t
+ =
+
Suavizacin exponencial lineal:
mtodo de Brown
Donde:
a
t
: interseccin de la recta con el eje vertical en el periodo t
b
t
: pendiente de la recta en el periodo t
m: nmero de periodos a pronosticar
t t t
S S a
' '

'
= 2
( )
t t t
S S b
' '

'

=
o
o
1
Suavizacin exponencial lineal:
mtodo de Brown
1
* ) 1 ( *

'
+ =
'
t t t
S X S o o
1
* ) 1 ( *

' '
+
'
=
' '
t t t
S S S o o
Suavizacin exponencial lineal:
mtodo de Holt)
) (m b a P
t t m t
+ =
+
Se utiliza para pronosticar series de tiempo con patrn tendencia
Emplea el mismo concepto de suavizacin que el mtodo SES
Suaviza por separado a la interseccin de la recta y a la pendiente,
utilizando parmetros de suavizamiento independientes para este fin
Ecuacin de pronstico:
Suavizacin exponencial doble
(Mtodo de Holt)
Donde:

P
t+m
= pronstico para el periodo t+m
a
t
= interseccin de la recta del pronstico
b
t
= pendiente de la recta del pronstico
m= nmero de periodos a pronosticar
( )( )
1 1
1

+ + =
t t t t
b a X a o o
( ) ( )
1 1
1

+ =
t t t t
b a a b | |
o
|
= Peso o ponderacin que se le da a la interseccin de la recta
= Peso o ponderacin que se le da a la pendiente de la recta
Suavizacin exponencial
cuadrtica
2
) ( ) (
2
1
m c m b a P
t t t m t
+ + =
+
Este mtodo se utiliza cuando los
datos tienen variacin estacional.
La metodologa consiste en
determinar de que manera
afectan los elementos de las
series de tiempo el
comportamiento de la informacin
histrica con el fin de desarrollar
los pronsticos.
Holt- Winters
m L t t t m t
I m b a P
+ +
+ = )] ( [
Elemento constante
(estacionario):
Es la parte de la
informacin histrica que
se mantiene ms o menos
estable a travs del
tiempo.
Elemento Tendencia:
Comportamiento que ms
se manifiesta a travs del
tiempo.
Elemento estacional:
Es un comportamiento recurrente o
predecible que guarda la informacin
histrica en ciertas pocas del ao y que
principalmente se debe a factores
climticos o fechas del calendario.
.
Fase I.- Consiste en calcular los elementos
iniciales de la serie de tiempo(a
o
, b
o
, I
o
)
Fase II.- Determinar los factores de
ponderacin para cada uno de los elementos
de la serie de tiempo(alfa _elemento
constante, beta_ elemento tendencia, gama_
elemento estacional).
Fase III.- Actualizar y corregir cada uno de
los elementos de las series de tiempo.
Fase IV.- Elaborar los pronsticos verdaderos.
Fase I
Pasos.
1.- Calcular el promedio para cada uno de los
aos de la primera mitad.
2.- Se calcula el elemento inicial tendencia.
3.- Se calcula el elemento inicial constante.
4.- Se calcula el elemento estacional inicial( se
calcula un ndice para cada uno de los
periodos del ao).


Fase II , III y IV
Fase II: Determinar factores de ponderacin para cada
uno de los elementos de las series de tiempo por prueba y
error (alfa, beta y gama).
Fase III: Actualizar y corregir cada uno de los elementos
de la serie de tiempo.
Pasos:
1.- Actualizar y corregir el elemento constante.
2.- Actualizar y corregir elemento tendencia.
3.- Actualizar y corregir el elemento estacional.
4.- Determinar el pronstico para el siguiente perodo para
poder calcular el MSE.
Fase IV: Desarrollar los pronsticos verdaderos.
Holt- Winters
Procedimiento detallado
Descomposicin de series de
tiempo
t t t t t
E C T I P * * * =
Procedimiento
Clculo del pronstico

S-ar putea să vă placă și