Sunteți pe pagina 1din 8

TEMA 6: PREDICCIÓN EN EL MODELO DE REGRESIÓN LINEAL BÁSICO

6.1 Introducción
6.2 Predicción puntual
6.3 Predicción por intervalos del valor individual
6.4 Evaluación de la capacidad predictiva de un modelo

Objetivos del Tema 6:


• Predicción puntual
• Predicción por intervalos
• Errores de predicción
• Estadísticos para evaluar la capacidad predictiva
• Evaluar la capacidad predictiva
6.1 Introducción

En Economía y también en el mundo de la empresa interesa muchas veces disponer de


técnicas para predecir el futuro de una variable (Y). Hay múltiples métodos de
predicción (cualitativos y cuantitativos).

Hasta ahora nos hemos centrado en obtener y contrastar hipótesis acerca de los
parámetros del MLB. En este tema utilizaremos nuestro MLB para anticipar el
comportamiento futuro de la variable endógena, es decir PREDECIR Y.

Hay que tener en cuenta que la predicción puntual es una “simple” extrapolación
mientras que la predicción por intervalos recoge una medida de la precisión de la
predicción (medida de fiabilidad de mi predicción).

Por otro lado también, a posteriori, interesará evaluar cual ha sido la capacidad
predictiva de mi modelo. ¿Es mi modelo adecuado para predecir?

6.2 Predicción puntual

El periodo de predicción lo denominamos por 0. Supongamos que hemos planteado el


siguiente modelo:

Yt = β1 + β 2 X 2t + β 3 X 3t + L β k X kt + ut

y al estimar obtenemos:

Yˆt = βˆ1 + βˆ 2 X 2t + βˆ3 X 3t + L βˆk X kt

Si los valores de las variables explicativas son conocidas en el periodo T=0, entonces,
podemos utilizar el modelo estimado para obtener una predicción de Y en el periodo
T=0.

Yˆ0 = βˆ1 + βˆ2 X 20 + βˆ3 X 30 + L βˆ k X k 0

En formato matricial, si los valores de los k regresores se recogen en el vector


x0′ = [1 X 20 X 30 L X k 0 ] la predicción puntual o predictor será:

Yˆ0 = x0′ β̂

El predictor es, si se cumplen las h.e.b, un estimador lineal, insesgado y óptimo de Y0.

6.3 Predicción por intervalos del valor individual

Comparemos la predicción de Y0 con el verdadero Y0:

2
Y0 = x0′ β + u 0
Yˆ0 = x0′ β̂

Hay tres posibles fuentes de error al utilizar la predicción puntual para predecir Y0 en el
MLB:

1) Se ha utilizado el modelo estimado, no el modelo teórico; es decir, no se han


utilizado los verdaderos valores de los parámetros.
2) Perturbación aleatoria. En el valor de Y0 hay una parte aleatoria.
3) Los valores de las variables explicativas no se conocen exactamente y estos valores
bajo los cuales se ha condicionado la predicción, puede ser erróneos

Por lo tanto, en general las predicciones no coincidirán con el verdadero valor de Y0.

Intervalo de predicción para el valor individual:

El error de predicción viene dado por:

Yˆ0 − Y0 = x0′ βˆ + x0′ β − u 0

Bajo las h.e.b. el error de predicción tendrá la siguiente distribución:

[ ] [ ]
E Yˆ0 − Y0 = E x0′ βˆ − x0′ β − u 0 = x0′ β − x0′ β = 0

( Yˆ0 es un estimador insesgado de Y0 puesto que la esperanza de su diferencia es cero)

La varianza del error de predicción será:

 ′
var Yˆ0 − Y0 = E  Yˆ0 − Y0 Yˆ0 − Y0  = E  x0′ βˆ − x0′ β − u 0 x0′ βˆ − x0′ β − u 0  =

[ 
] ( )(
 
) ( )( ) 
  ′   ′ 
( ( 
) )( 
)
( 
)( ) [ ( ) ]
= E  x0′ βˆ − β − u 0  βˆ − β x0 u ′  = E  x0′ βˆ − β βˆ − β x0  + E[u 0 u 0′ ] − E x0′ βˆ − β u 0′ −

 ′   ′
( ) ( )( )
E u 0 βˆ − β x0  = x0′ E  βˆ − β βˆ − β  x0 + E [u 0 u 0′ ] = x0′ σ 2 ( X ′X )−1 x0 + σ 2 =
   
[
= σ 2 x0′ ( X ′X )−1 x0 + 1 ]
Por tanto, el error de predicción del valor individual para Y0 tendrá la siguiente
distribución:

[
Yˆ0 − Y0 → N 0, σ 2 ( x0′ ( X ′X )−1 x0 + 1) ]
Un estimador insesgado de la varianza del error de predicción será:

σˆ 2ˆ = σˆ 2 ( x0′ ( X ′X )−1 x0 + 1)
Y0 −Y0

3
Por tanto,
(Yˆ0 − Y0 )
2
→F 1,T − k
σˆ 2ˆ
Y0 − Y0

O alternativamente,
(Yˆ0 − Y0 ) → t
T −k
σˆ 2ˆ
Y0 − Y0

Para un nivel de confianza 1-α se tendrá que:

(Yˆ0 − Y0 ) ≤ t α / 2
T −k
σˆ ˆ
Y0 − Y0

o lo que es lo mismo:

− tTα −/ k2 ≤
(Yˆ0 − Y0 ) ≤ t α / 2
T −k
σˆ ˆ
Y0 − Y0

Por tanto, un intervalo de probabilidad para el valor individual queda definido por:

[Yˆ − t
0
α /2 ˆ ˆ α /2 ˆ
T − k σ Yˆ0 − Y0 ; Y0 + tT − k σ Yˆ0 − Y0 ]

Ejemplo:
(Examen 29-01-2008)

Para una muestra de 61 individuos se dispone de las siguientes variables:


LSALARIO= Logaritmo del salario
EDUCAC= Años de educación
EXPLAB= Años de experiencia laboral
SEXO= Variable dicotómica que toma valor 1 si el individuo es hombre y 0 si no lo es
SEXOEXP = SEXO*EXPLAB
SEXOEDU= SEXO*EDUCAC

Se pretende analizar los distintos factores que determinan el salario de los individuos.
Utilizando los resultados del CUADRO 1:

4
a) Estime el sueldo que cobraría un hombre con 30 años de edad, 4 años de experiencia
y 10 años de educación
b) Proporcione un intervalo de predicción al 90% para el logaritmo del salario (para la
misma persona del apartado anterior) [Nota: suponga que la desviación típica del error
de predicción es 2]

CUADRO 1

6.4 Evaluación de la capacidad predictiva de un modelo

Para juzgar la capacidad predictiva de un modelo econométrico utilizaremos los


siguientes estadísticos:

1. Error absoluto medio (EAM): al tomar valores absolutos evitamos que se


compensen los errores de predicción.

h
∑ Pt − At
EAM = t =1
h

Si la predicción es sobre los valores originales, Pt = Yˆ0 y At = Y0


Con datos de serie temporal a veces tiene más sentido predecir las tasas de
crecimiento. Predecir el cambio y no el nivel.
Si las predicciones son sobre la tasa de crecimiento de la serie temporal,
entonces, definimos las tasas de variación de la predicción (Pt) y de los valores
observados (At):

5
Yˆ − Yt −1 Y − Yt −1
Pt = t At = t
Yt −1 Yt −1

2. Error cuadrático medio (ECM): al elevar al cuadrado también se evita que se


compensen los errores de predicción.

h 2
∑ (Pt − At )
ECM = t =1
h

3. Correlación entre valores observados y predichos (COP):


h
∑ (Pt − P )(At − A )
t =1
COP =
h 2 h
∑ (At − A )
2
∑ (Pt − P )
t =1 t =1
Si COP toma valores cercanos a cero, el modelo no predice muy bien, ¿y si COP
tomase un valor negativo?

4. Índice de desigualdad de Theil (U66):

h
( 2
∑ Pt − At / h
t =1
)
U 66 =
h
2
∑ At / h
t =1
0 ≤ U66 ≤ ∞

Si U66= 0 estaríamos en el caso de que todas las predicciones aciertan.


Si U66= 1 todas las predicciones son igual a cero. (no hay cambio en la
predicción).
Si U66> 1 la capacidad predictiva del modelo es “peor que si pronosticara
valores cero”.

5. Descomposición del ECM (numerador de U66): El ECM se puede


descomponer en:
ECM = (P − A ) + (S P − S A )2 + 2(S P S A − S PA )
2

Siendo SP la desviación típica de los valores predichos


Siendo SA la desviación típica de los valores observados
Siendo SPA la covarianza entre los valores predichos y observados
(P − A )2 recoge la desigualdad debida al sesgo.
(S P − S A )2 recoge la desigualdad debida a una distinta varianza.
2(S P S A − S PA ) recoge la desigualdad debida a factores aleatorios.

6
Para que un modelo fuese adecuado para predecir seria deseable que los dos
primeros componentes fuesen cero.

6. Diagrama predicción observación

Ejemplo:
(Examen 8-07-2008)

Una empresa dedicada a la producción de muebles de jardín está valorando la


posibilidad de ampliar las instalaciones para lo cual ha analizado entre otras cosas los
factores que determinan el stock deseado de su producto. El económetra de la empresa
ha especificado y estimado el siguiente modelo:
LSTOCK t = β1 + β 2 LPRECIOt + β 3 LINTERES t + β 4 LSTOCK t −1 + u t
donde: LSTOCK= Logaritmo de las existencias deseadas
LPRECIO= Logaritmo del precio relativo de los muebles de jardín
LINTERES= Logaritmo de la tasa de interés
a) Evalúe la capacidad predictiva del modelo para el periodo 2001-2007.

7
Gráfico1.

S-ar putea să vă placă și