Sunteți pe pagina 1din 128

Programa MDF

Escuela de Postgrado
Universidad Diego Portales
Rodrigo Montero P.

1.
2.
3.

Introduccin
El modelo clsico de regresin lineal
Modelos
economtricos
con
temporales

datos

En una hoja en blanco, nombre, cargo,


principales funciones
Defina muy brevemente cada uno de los
siguientes conceptos: (a) Estimador, (b)
Mediana, (c) Desviacin estndar, (d) Media,
(e) Intervalo de confianza, (f) Kurtosis, (g)
Regresin, (h) Muestra

La estadstica es la ciencia de la
incertidumbre (encontrar regularidades en el
comportamiento de los datos)
Preguntas del tipo qu podra ser? o qu es
probable que sea?

El tipo de cambio probablemente se


depreciar de aqu a fin de ao
La inflacin probablemente volver a sus
niveles de equilibrio en el corto plazo

El muestreo tiene como objetivo llegar a


conclusiones sobre la poblacin a la que
pertenece dicha muestra
Problema: hasta qu punto es posible
generalizar los resultados?
Siempre habr un error en la inferencia que
se realice a partir de la muestra (hay que
reflejar dicha incertidumbre)

Estadstica descriptiva (ED) vs estadstica


inferencial (EI)
La ED describe las caractersticas de la
poblacin: mediante tablas, grficos, y
diagramas se facilita el entendimiento de la
informacin
La inferencia estadstica implica hacer
generalizaciones, afirmaciones, inferir el
comportamiento de la poblacin por medio
de una muestra (reducir el grado de
incertidumbre y cuantificarlo)

Mtodos de muestreo: probabilstico (los sujetos


son elegidos en funcin de su probabilidad de
ocurrencia) y no probabilstico (los sujetos se
eligen sin tomar en cuenta su probabilidad de
ocurrencia)
Muchas empresas hacen encuestas de manera no
probabilstica: proveen gran cantidad de datos en
poco tiempo (usuarios de Internet)
Problemas: sesgo de seleccin e imposibilidad de
generalizacin de los resultados
7

Muestreo probabilstico: es el ideal. Permite


hacer inferencias estadsticas correctas a
partir de una muestra
Tipos de muestreo probabilstico: (i) aleatorio
simple, (ii) sistemtico (la muestra se divide
en grupos), (iii) estratificado (la muestra se
divide en estratos, y luego se combinan las
muestras), (iv) conglomerado (la poblacin se
divide en conglomerados, y luego se
muestrea cada uno de los conglomerados)

Qu es la econometra?
Medicin de la economa
Para qu sirve la econometra?
Proyecciones
Testar teoras
Aplicaciones: finanzas (CAPM), decisiones
de produccin / manejo de inventarios,
evaluacin de polticas pblicas, etc.

La
Econometra
aplica
mtodos
matemticos y estadsticos al anlisis de
datos econmicos
Frish: La experiencia ha mostrado que cada

uno de estos tres puntos de vista, la


estadstica,
teora
econmica
y
matemticas, es necesario, pero no
suficiente para una comprensin real de las
relaciones
cuantitativas
de
la
vida
econmica. Es la unin de estos tres puntos
lo que constituye una herramienta de
anlisis potente, la Econometra
10

Pesaran,1987 Econometrics historia de la


econometra
El trabajo emprico frecuentemente descubre
regularidades empricas que motivan avances
tericos
Por ejemplo, se tiene una hiptesis/teora
(trabajadores ms productivos reciben mayores
salarios), luego sta se contrasta con lo que dicen
los datos (relacin entre salario y aos de
escolaridad)
Los buenos resultados dependen tanto de calidad
de los datos utilizados como del mtodo aplicado
para la estimacin
11

1,02

Hiptesis: la
demanda de un
bien tiene
pendiente negativa

1,00
0,98

Precio

0,96
0,94
0,92
0,90
0,88
0,86
0,84
0

50

100

150

200

Cantidad

Fuente: En base a un experimento controlado (Bemmaor


y Mouchoux, 1991)
12

13

Anlisis de regresin: es el estudio del


comportamiento del valor promedio de la
variable dependiente (explicada) en funcin
del comportamiento de las variables
dependientes (explicativas)

La teora del
capital
humano:
Salarios y aos
de escolaridad

160.000
140.000
120.000
100.000

En US$

80.000
60.000
40.000
20.000
0
0

9
12
15
Aos de escolaridad

18

21

24

14

15

Quick
Graph
educ salary
Scatter

16

17

En Econometra interesa la dependencia estadstica


entre las variables, las cuales son aleatorias, es
decir, variables que tienen una distribucin de
probabilidad (diferente a la fsica)
La regresin es una relacin estadstica que no
implica causalidad a priori (importancia del
modelo) Johann Carl Friedrich Gauss

18

La funcin de regresin poblacional (FRP) es el


lugar
geomtrico
de
todas
las
medias
condicionales de la variable dependiente para los
valores fijos de la(s) variable(s) explicativa(s) es
la relacin terica entre las variables (no la
observaremos nunca!!!)

Yi E (Y | X ) ui

La funcin de regresin muestral (FRM) representa


la recta de regresin poblacional, pero debido a las
fluctuaciones
muestrales
slo
puede
ser
considerada como una aproximacin
19

Relacin entre salario y escolaridad


400

FRP

350

FRM

300
250
200
150

100
50
0
0

10

15

20

25
20

Ejemplos:
Ventas = f(Imacec) f() > o <0?
Tasa de inters = g(brecha PIB / gasto) g() >
o <0?
Tasa de inters = h(dficit fiscal) h() > o <0?
Dlar = t(spread r / r*) t() > o <0?
Consumo = j(riqueza) j() > o <0?
Inversin = y(utilidades) y() > o <0?
Precio del cobre = q(inventarios) q() > o <0?
Precio de los dptos. nuevos = r(meses para agotar
stock) r() > o <0?
21

Las tasas de inters dependen, entre otras cosas,


del dficit fiscal
Asumiendo que dicha relacin es lineal (FRP), se
puede plantear el siguiente modelo:

Yi = E(Y | X)+ ui = b1 + b2 Xi + ui

Por qu incorporar un shock estocstico en este


contexto?

ui ~ iid (0, )
2

22

(1) Omisin de otros factores


El consumo no slo depende del ingreso disponible (tasa de
inters / riqueza) error de especificacin
Otros elementos menos sistemticos: variaciones en el clima,
nimo, temblores, epidemia, etc.
El error representa esos elementos no considerados en la
ecuacin, pero que tienen un impacto moderado y causas
independientes
Teora del capital humano: correspondera al esfuerzo de la
personas, poder de negociacin, redes de contactos,
habilidades
Las ventas de una empresa dependen de la capacidad
gerencial
El PIB depende de factores climticos, shocks, huelgas, etc.
23

(2) Error de medida


La variable dependiente est medida con error (Y =
Y* + )
Por ejemplo, el ingreso familiar (incentivos a
subdeclarar)
El error de medida puede estar en la variable
dependiente,
o
bien,
en
las
variables
independientes (X = X* + )
Por ejemplo, aos de escolaridad (son una proxy
del capital humano)
Errores de medida en las variables explicativas
crean
serios
problemas
economtricos
(estimadores inconsistentes)
24

(3) Comportamiento humano


El comportamiento humano es de tal forma que
bajo circunstancias idnticas las acciones llevadas
a cabo diferirn de una manera aleatoria
Mismo estmulo respuestas diversas
El
trmino de error puede representar esta
aleatoriedad inherente en el comportamiento
humano

25

Yi E(Y | X ) ui 1 2 X i ui

La estimacin de este modelo vendra dada por


(FRM):

Y E (Y | X ) u Yi u 1 2 X i u

Yi 1 2 X i

1 1
2 2
26

27

Propiedades de los estimadores


Costo computacional
Mnimos cuadrados
Bondad de ajuste
f ( )
Insesgamiento
Eficiencia
Error cuadrtico medio
Propiedades asintticas
100

f ( ) 70
f ( ) 40

f ( )10

28

El mtodo de mnimos cuadrados ordinarios (MCO)


escoge los estimadores para los parmetros de tal
forma de minimizar la suma de los errores al
cuadrado

ui Yi Yi Yi 1 2 X i
n

min u (Yi 1 2 X i )

1 , 2

i 1

2
i

Problema
estndar
restricciones

i 1

de

optimizacin

sin

29

30

Las CPO de este problema son las siguientes:


ui2
2 (Yi 1 2 X i ) 2 ui 0 ui 0
1
ui2
2 (Yi 1 2 X i ) X i 2 ui X i 0
2

Simplificando las ecuaciones anteriores se


obtienen las ecuaciones normales:
(1)
(2)

Y n X
Y X X X
i

2
i
31

Resolviendo el sistema de ecuaciones:

2
X
i Yi X i X iYi

n X X i

2
i

n X iYi X iYi
n X

2
i

X Y nXY

X
X nX
2

i i
2
i

32

Alternativamente:

1 Y 2 X
n

(X
i 1

X )(Yi Y )

(X
i 1

X)

x y
i 1
n

x
i 1

2
i

33

Ejemplo: utilidades=f(gasto en I+D)

1 20
2 2
Y 20 2 X

34

35

36

Se puede demostrar que:

2
X
2 1

1 ~ 1 ,
n

n
2
(Xi X )

i 1

2 ~ 2 , n

2
(Xi X )

i 1

Nota:
No conocemos
2, hay que
estimarlo

u
i 1

2
i

~ 2

2
u

i
i 1

nk
37

1.
2.
3.

Linealidad en los parmetros


Muestreo aleatorio
Media condicional nula:

E (u | x) 0

38

4.

Variacin muestral de la variable independiente:


n

2
(
X

X
)
0
i
i 1

Con estos cuatro supuestos se puede demostrar


insesgamiento:

E ( )
5.

Homoscedasticidad
(supuesto
clave
para
determinar la eficiencia del estimador de MCO):

var(ui | x) 2
39

El estimador de MCO es el mejor estimador


lineal e insesgado de entre todos los
estimadores lineales e insesgados. Cualquier
otro estimador lineal e insesgado tiene
varianza mayor a la del estimador MCO. Es
decir, el estimador MCO es MELI (BLUE).

40

Todo lo que hemos visto se puede generalizar


para
incluir
k
variables
independientes
(explicativas):

yi 1 2 xi 2 3 xi 3 ... k xik ui

El salario de los individuos est en funcin de:


aos
de
escolaridad,
experiencia
laboral
(potencial), sector econmico, oficio, gnero de la
persona
(discriminacin
salarial),
uso
de
computador (tecnologa), etc.

41

La inclusin de ms variables explicativas va a


afectar la estimacin de todos los parmetros del
modelo
Van a aumentar las varianzas de los estimadores
de MCO
Los estimadores de MCO se obtienen de manera
similar al caso simple de dos variables
Se minimiza la suma de los errores al cuadrado
Se trabaja en trminos matriciales (es ms
simple)
Los coeficientes estimados representan el efecto
marginal (parcial) de cada una de las variables
explicativas (ceteris paribus)
42

El modelo clsico de regresin lineal con k


variables
yi 1 2 xi 2 3 xi 3 ... k xik ui

ui ~ iid (0, 2 )
y1
X 12
X 1k u1


y2
X 22
X 2 k u2
1 2 k


y
X
X u
n
n2
nk n
43

Agrupando en vectores:

y1 1 X 12

y2 1 X 22
1

y 1 X
n2
n

X 1k
u1
1
X 2 k u2
y X u

k
u
X nk
n

Nuevamente:

y y u X u u ( y X )
44

El problema consiste en minimizar la suma de


los errores al cuadrado:
n

u
'
u

(
y

)'
(
y

min

i 1

2
i

Derivando e igualando a cero se llega a la


siguiente solucin:

( X ' X ) X ' y

k

45

Propiedades del estimador de MCO:

E ( )
v( ) 2 ( X ' X ) 1

Supuestos del modelo clsico de regresin mltiple:


1. Lineal en los parmetros
2. Muestreo aleatorio
3. Valor esperado condicionado nulo E (u | x1 , x2 , , xk ) 0
4. No colinealidad perfecta

Bajo estos supuestos:

E ( j ) j
46

Ejemplo:
Variable dependiente
COLGPA: promedio de notas en la Universidad
Variables independientes
HSGPA: promedio de notas en la educacin
secundaria
ACT: Puntaje en la prueba de acceso a la universidad

Modelo a estimar

COLGPA 1 2 HSGPA 3 ACT u


47

48

49

En este caso, la variable Y es


explicada por los regresores X y Z

amarillo

azul

Los crculos X y Z tendrn algn


grado de traslape reflejando la
colinealidad existente entre ambas
variables (zona roja y naranja)

verde
rojo

caf

naranjo

Si Y fuera regresionada solo contra


X,
entonces,
se
utilizara
la
informacin representada por la
zona azul y roja para estimar x

Si Y fuera regresionada solo contra Z, entonces, se utilizara la


informacin representada por la zona verde y roja para estimar Z

50

Cuando Y es regresionada contra X


y Z el estimador MCO utiliza el rea
azul para estimar insesgadamente
X, descartando la proveniente del
rea roja

amarillo

azul

verde
rojo

caf

naranjo

El rea azul corresponde a la


variacin de Y que se debe a la
variacin de X

El rea verde corresponde a la variacin de Y que se debe a la


variacin de Z. Utilizando esta informacin se obtiene una
estimacin insesgada de Z
El rea roja no se utiliza porque refleja la variacin de Y que es
determinada por la variacin conjunta de X y Z
51

Note que la regresin de Y contra X


y Z produce estimaciones insesgadas
de X y Z, mientras que al
regresionar Y contra Z y X por
separado
produce
estimaciones
sesgadas de X y Z, porque este
ltimo mtodo utiliza el rea roja

Y
amarillo

azul

verde

rojo
caf

naranjo

Dado que el primer mtodo


descarta el rea roja, utiliza menos
informacin para la estimacin de las
respectivas pendientes

Estas estimaciones tendrn mayores varianzas. En econometra


el precio de obtener estimaciones insesgadas (agregar variables)
es tener mayores varianzas en las estimaciones
52

Si X y Z fueran ortogonales sus


reas no se traslaparan, el rea roja
tendera a cero

Y
amarillo

azul

Por lo tanto, ambos mtodos (Y


contra X y Z; Y contra X y Z por
separado) arrojaran las mismas
estimaciones para X y Z

verde
rojo

caf

naranjo

Si hubiese un alto grado de


colinealidad, y las reas azul y verde
fueran pequeas, entonces, se
utilizara muy poca informacin para
estimar X y Z

Por lo tanto, se tienen estimaciones con varianzas enormes

Multicolinealidad aumenta las


varianzas

53

La multicolinealidad se refiere a la correlacin que


existe entre las variables del modelo
Por ejemplo, considere el siguiente modelo:

yi 1 2 x2i 3 x3i ... k xki ui

Es directo notar que siempre existir algn grado


de correlacin (positiva o negativa) entre las
variables explicativas del modelo (los Xs)
Por lo tanto, note que la multicolinealidad siempre
est presente, es un problema de grado
Qu efecto tiene esto en el estimador de MCO?

54

La presencia de multicolinelidad incrementa las


varianzas del estimador de MCO
Indicios de la presencia de un alto grado de
multicolinealidad: (i) Un elevado R cuadrado, pero
coeficientes
estimados
no
estadsticamente
significativos, (ii) los coeficientes estimados
pueden tener signos distintos a los esperados o
una magnitud poco crebles (muy grandes)
Hay algunos tests formales para detectar cuando el
problema es grave (Belsley)
Qu hacer? Eliminar la variable que causa
problemas? OVR sesgo e inconsistencia
En general, se sugiere no hacer nada
55

Si la colinealidad fuera exacta, las


reas verde y azul desaparecen y la
estimacin no se puede realizar

Y
amarillo

azul

Note que las reas azul, roja y


verde, representan la variacin de Y
que se explica por la variacin
conjunta de X y Z

verde
rojo

caf

naranjo

Una medida de bondad de ajuste


del modelo sera el ratio entre la
suma de las reas roja, verde y azul
y el crculo Y

Importante: el rea roja solo se descarta para la estimacin!!


El rea amarilla representa la variacin de Y que se atribuye al
trmino de error, y por lo tanto, la magnitud de dicha rea
representa la magnitud de 2, la varianza del trmino de error
56

Se requiere un criterio que establezca cun bien


ajusta el modelo estimado a la muestra de datos
El criterio adecuado consiste en analizar si la
variacin de la variable dependiente se explica o
no por la variacin de las variables independientes
n

STC ( yi y ) 2

Suma de cuadrados totales

i 1

SEC ( y i y ) 2

Suma explicada de los cuadrados

i 1

SCE ui
i 1

Suma de los cuadrados de los


residuos

57

La variacin total de la variable dependiente


siempre se puede expresar como la suma de la
variacin explicada y la variacin no explicada

STC SEC SCE

Para medir la capacidad que tienen las variables


independientes en explicar la variable dependiente
se utiliza el estadstico R cuadrado de la regresin,
que se define de la siguiente manera:
2
u
i
SEC
SCE

2
R
1
1
2
STC
STC
(
y

y
)
i
58

Note que:

0 R2 1

Si el R cuadrado es cero, entonces, la variabilidad de las


variables independientes no explica la variabilidad de la
variable dependiente
Si el R cuadrado es uno, entonces, la variabilidad de las
variables independientes explica completamente la
variabilidad de la variable dependiente
Dado que el MCO minimiza la suma de los errores al
cuadrado, automticamente maximiza el valor para el R
cuadrado

59

Considere el modelo simple:

yi 1 2 X i ui

En este contexto, el R cuadrado viene dado por:

SEC
SCE
R
1

STC
STC
2

22 ( X i X ) 2
2
(
y

y
)
i

2
u
i

1
2
(
y

y
)
i

60

Un elevado R cuadrado indica un buen grado de


ajuste del modelo
Un elevado R cuadrado no quiere decir
necesariamente una buena estimacin
El R cuadrado es monotnico, es decir, aumentar
siempre que al modelo se le agregue una nueva
variable independiente
Esto no es gratis, pues se ir perdiendo precisin
en las estimaciones

61

Considere el siguiente modelo:

yi 1 2 x2i 3 x3i ... k xki ui

Se puede demostrar que:

var( j )

2
2
(
X

X
)
(
1

R
ji j
j)

Por lo tanto, al agregar variables, aumentar el R


cuadrado, y por ende, aumentar tambin la
varianza del estimador
Se aprecia cmo la multicolinealidad incrementa las
varianzas del estimador MCO

62

Dada la monotonicidad del estadstico R cuadrado,


algunos ponen ms atencin en el R cuadrado
ajustado:

SCE /( n k )
2 n 1
R 1
1 (1 R )
STC /( n 1)
nk
2

Ajustado por los grados de libertad que se pierden


al incluir regresores adicionales en el modelo
El R cuadrado ajustado podra disminuir al incluir
un regresor adicional, e incluso podra llegar a ser
negativo

63

Testar la significancia individual de los


parmetros estimados
Testar hiptesis de inters terico
Testar la significancia global del modelo
Para los test estadsticos que se analizarn
(test t, test F) es esencial el supuesto de
normalidad del trmino de error (iid normal):

ui ~ N (0, )
2

64

Considere el modelo de regresin lineal mltiple:

yi 1 2 x2i 3 x3i ... k xki ui

Se podra evaluar la
coeficiente estimado:

individual

H 0 : j 0

| t | t

Se rechaza la hiptesis
nula (1%,5%,10%)

significancia

*
nk

var( j )

del

~ tnk

Si el p-value es menor que 0.05 se rechaza la hiptesis


nula al 5% de significancia
65

Se estableci que:

( i i 0 )
~ tnk
V ( i )

i i 0

i i 0

La probabilidad acumulada en la zona de rechazo es el


nivel de significancia (1%, 5%, 10%)
66

Otro ejemplo:

H0 : h j 1

h j 1
var( h ) var( j ) 2 cov( h , j )

| t | t
c

*
nk

~ tnk

Se rechaza la hiptesis
nula (1%,5%,10%)

67

Cmo se construye?

68

Enfocarse excesivamente en ste puede inducir a


errores
Que un coeficiente sea estadsticamente no
significativo no quiere decir que no sea
econmicamente significativo
Poner al test-t en la perspectiva apropiada
Por otro lado, el valor t calculado es sensible al
tamao de la muestra. Si sta es muy grande,
entonces, la varianza cae, y por ende, el test t
aumenta. Se tendrn test t gigantes, por lo que
los coeficientes estimados sern con una alta
probabilidad significativos

69

yi 1 2 x2i 3 x3i ... k xki ui

El test de significancia global del modelo evala la


siguiente hiptesis nula:

H 0 : 2 3 k 0
SEC /( k 1)
F
~ F( k 1,nk )
SCE /( n k )
R 2 /(k 1)
F
~ F( k 1,n k )
2
(1 R ) /(n k )

Si F calculado > F
crtico se
rechaza la
hiptesis nula

70

Pr( j t1 / 2,nk var( j ) j j t1 / 2,nk var( j ) ) 1

El intervalo de confianza muestra el rango


admisible de valores para el coeficiente estimado
Si el 0 est dentro del intervalo de confianza (IC)
significa que no se puede rechazar la hiptesis
nula (no es estadsticamente significativo)
Si el 0 no est en el IC, se rechaza la hiptesis nula,
entonces, es estadsticamente distinto de cero

71

El pasado puede afectar el futuro


Ejemplo. Tasa de inflacin y desempleo para EE.UU.:
Ao

Inflacin

Desempleo

1948

8.1

3.8

1949

-1.2

5.9

1998

1.6

4.5

1999

2.2

4.2

Muestra aleatoria? Observamos un posible resultado o


realizacin del proceso estocstico (solo vemos una
nica realizacin)
72

Ejemplo:

Un caso podra ser la curva de Phillips esttica:

yt 0 1 zt ut
inf t 0 1unemt ut

(Nota: esta versin de la curva de Phillips asume


una tasa de desempleo natural y expectativas de
inflacin constantes)
Pueden incluirse ms variables explicativas:
inf t 0 1unemt 2 Et ut

73

Ejemplo: yt 0 0 zt 1 zt 1 2 zt 2 ut
A este modelo se le conoce como un MRD de orden
dos
Suponga que z es constante e igual a c en todos
los perodos, pero en el momento t z aumenta en 1
(c+1), y en t+1 vuelve a su nivel inicial
Luego:
yt 1 0 0 c 1c 2 c

yt 0 0 (c 1) 1c 2 c
yt 1 0 0 c 1 (c 1) 2 c
yt 2 0 0 c 1c 2 (c 1)
yt 3 0 0 c 1c 2 c
74

De las 2 primeras ecuaciones se obtiene: yt yt 1 0


A este valor se le denomina propensin al impacto
o multiplicador del impacto
Luego: yt 1 yt 1 1
Esto corresponde al efecto que ocurre un perodo
despus del cambio
Por otro lado: yt 2 yt 1 2
Este es el cambio dos perodos despus del cambio
En el tercer perodo, la variable ha regresado a su
valor original: yt 3 yt 1
Esto se debe a que se ha asumido que hay solo dos
retardos en el modelo

75

Cuando se grafica el tamao del cambio j en


funcin de j, se obtiene la distribucin de retardos,
que resume el efecto dinmico sobre y que tiene
un incremento temporal de z
Coeficiente
1.6
1.4

1.2
1.0
0.8

0.6
0.4

0.2
0.0
0

76

Cul es el efecto de un cambio permanente en z:

z s c, s t

Por lo tanto:

z s c 1, s t
yt 1 0 0 c 1c 2 c
yt 0 0 (c 1) 1c 2 c
yt 1 0 0 (c 1) 1 (c 1) 2 c
yt 2 0 0 (c 1) 1 (c 1) 2 (c 1)

Y as sucesivamente

77

Despus de un perodo y ha aumentado en: 0 1


Tras dos perodos, el aumento es de: 0 1 2
No hay ms cambios despus de dos perodos
La suma de los coeficientes de los z corrientes y
retardados, corresponde al cambio de largo plazo
en y dado un aumento permanente en z, y se
denomina propensin a largo plazo (PLP) o
multiplicador de largo plazo
As, para un MRD de orden q:

PLP 0 1 q

78

Debido a que a menudo existe una correlacin


elevada entre los distintos retardos de z
(multicolinealidad), puede resultar difcil obtener
estimadores precisos de las propensiones de
impacto y de largo plazo
Suponga que:

int t 1.6 0.48 inf t 0.15 inf t 1 0.32 inf t 2 ut

Cules son las propensiones de impacto y de largo


plazo?

79

1.
2.

3.

Linealidad en los parmetros


Media condicional nula: E (ut | X ) 0 . Este supuesto
exige ms que la exogeneidad contempornea. El
error debe estar incorrelacionado con todos los
valores de las variables explicativas. Cuando se
cumple esto se dice que las variables explicativas
son estrictamente exgenas. Para demostrar
insesgamiento, se requiere de este supuesto
No multicolinealidad perfecta
Bajo estos tres supuestos, se cumple que:

E ( j ) j
80

4.
5.

Homocedasticidad
No correlacin serial: Corr (ut , us | X ) 0
Bajo estos cinco supuestos, se cumple el Teorema
de Gauss-Markov

6.

Inferencia
Normalidad. Los errores son independientes de X
y
estn
independiente
e
idnticamente
distribuidos segn una distribucin normal (0,2)

81

Bajo estos supuestos, los estimadores MCO se


distribuyen normalmente, condicionados a X. Bajo
la hiptesis nula, cada estadstico t tiene una
distribucin t de student, y cada estadstico F
tiene una distribucin F. La construccin habitual
de intervalos de confianza sigue siendo vlida
En otras palabras, todo lo que se ha aprendido en
el contexto de datos de corte transversal acerca
de la estimacin e inferencia se puede aplicar
directamente a las regresiones con datos de
series temporales

82

83

Los efecto de la inflacin y los dficits sobre las tasas


de inters:

i3t 0 1 inf t 2 def t ut

Es decir, las tasas de inters de las letras del tesoro a


tres meses (EE.UU.) dependen de la tasa de inflacin
anual y del dficit presupuestario del gobierno federal
(como % del PIB)

84

85

Considere el siguiente modelo que relaciona la


demanda de dinero con el producto interno bruto:

ln( M t ) 0 0 ln(GDPt ) 1 ln(GDPt 1 ) 2 ln(GDPt 2 )

3 ln(GDPt 3 ) 4 ln(GPDt 4 ) ut

La propensin de impacto ( 0 )
se denomina
tambin elasticidad a corto plazo
La
propensin
a
largo
plazo
se denomina elasticidad a largo plazo

PLP 0 1 2 3 4
86

Las variables ficticias (binarias) son muy tiles en


las aplicaciones de series de tiempo
La variable ficticia representa la ocurrencia de un
cierto evento en un determinado perodo
Por ejemplo, se puede definir una variable dummy
que tome el valor uno si la empresa es
transnacional y cero si no
Las variables ficticias son el componente principal
de los denominados estudios de acontecimientos
(eventos)

87

En un estudio de acontecimientos el objetivo


consiste en determinar si un acontecimiento
particular tiene un influencia sobre alguna
variable resultado
(En OI) se han investigado los efectos de ciertos
acontecimientos sobre el precio de las acciones
de las empresas
Por ejemplo: la rentabilidad de la empresa
depende de la rentabilidad de mercado y de un
acontecimiento

Rt 0 1R 2 dt ut
f

m
t

88

La rentabilidad de la empresa se calcula generalmente


en una semana o un mes
La rentabilidad de mercado se calcula a partir de un
ndice de mercado
Si es un compaa area la variable dummy podra
indicar si la aerolnea ha sufrido un accidente con
repercusin pblica
Se pueden utilizar mltiples variables ficticias
Si se trata de un acontecimiento como la imposicin
de una nueva regulacin, se puede incluir una dummy
que tome el valor 1 pocas semanas antes del anuncio,
y otra dummy que tome el valor 1 pocas semanas
despus del anuncio
La primera dummy permite detectar la presencia de
informacin privilegiada

89

Es posible que se quiera modelar el comportamiento de una


variable en funcin de su propia historia
Esto es comn de hacer en el contexto de series de tiempo (t)

Ciertas variables presentan altos grados de persistencia en su


comportamiento (cantidad de dinero, PIB, consumo,
inversin)
Modelos autorregresivos de primer orden: AR(1). La variable
dependiente tiene como variable explicativa a ella misma,
pero rezagada un perodo. La variable se explica por rezagos
de ella misma

Por qu de primer orden? Porque slo depende del primer


rezago

yt 1 2 yt 1 ut
90

Un proceso es estacionario si sus distribuciones de


probabilidad son estables a largo del tiempo: si tomamos una
coleccin cualquiera de variables aleatorias en la sucesin, y
acto seguido, desplazamos esa sucesin hacia adelante h
perodos, la distribucin de probabilidad conjunta debe
permanecer invariada
Un proceso estocstico que no es estacionario se denomina
proceso no estacionario
Dado que la estacionariedad es un aspecto del proceso
estocstico subyacente , y no de la realizacin concreta de la
que disponemos (muestra), es muy difcil determinar si los
datos que hemos recolectado han sido generados por un
proceso estacionario
Es fcil detectar ciertas sucesiones que no son estacionarias
(el tiempo como regresor)
91

El proceso estocstico {xt: t=1,2,} con un momento de


segundo orden finito, E ( xt2 ) , es estacionario en covarianza
si:
(i) La esperanza de x es constante
(ii) La varianza de x es constante
(iii) La covarianza entre xt y xt+h depende solamente de
h no de t

Por lo tanto, la estacionariedad en covarianza se centra


solamente en los dos primeros momentos de un proceso
estocstico: la media y la varianza del proceso son constantes
a lo largo del tiempo, y la covarianza depende solamente de
la distancia , h, entre los dos trminos, y no de dnde est
situado el perodo temporal inicial, t (ocurre lo mismo con la
correlacin)
92

Si un proceso estacionario tiene un momento de segundo


orden finito, entonces deber ser estacionario en covarianza,
pero lo inverso no es cierto
Para subrayar que la estacionariedad es un requisito ms
fuerte que la estacionariedad en covarianza, a la primera se le
denomina estacionariedad estricta
Se dice que una serie temporal es dbilmente dependiente si
xt y xt+h son casi independientes a medida que h aumenta
Las sucesiones estacionarias en covarianza se pueden
caracterizar en trminos de correlaciones: una serie temporal
estacionaria en covarianza es dbilmente dependiente si la
correlacin entre xt y xt+h se aproxima a cero de manera
suficientemente rpida a medida que h tiende a infinito

93

A medida que las variables se van separando en el tiempo, la


correlacin entre ellas se hace cada vez ms pequea (se dice
de estas series que son asintticamente incorrelacionadas)
Por qu la dependencia dbil es importante para el anlisis
de regresin?
Porque sustituye el supuesto de muestreo aleatorio para
asegurar que se satisfacen la ley de los grandes nmeros y el
teorema central del lmite
Para los datos de series temporales, el TCL ms conocido
requiere la estacionariedad y alguna forma de dependencia
dbil
Por lo tanto, las series temporales estacionarias dbilmente
dependientes son ideales para el anlisis de regresin
mltiple
94

Por ejemplo, considere el proceso autorregresivo de orden 1:

yt 1 yt 1 et

El supuesto crucial para la dependencia dbil de este proceso


AR(1) es la condicin de estabilidad:

| 1 | 1

Luego, este proceso


dependiente)

es

estable

(luego

es

dbilmente

Se puede demostrar que:

Corr(yt , yt+h ) =

Cov(yt , yt+h )

s ys y

=r

h
1
95

1.

Linealidad y dependencia dbil

2.

Media condicionada igual a cero

3.

Ausencia de colinealidad perfecta

E (ut | xt ) 0

Con estos tres supuestos se puede mostrar que los


estimadores MCO son consistentes, pero no necesariamente
insesgados:

p lim( j ) j

4.

Homocedasticidad

5.

Ausencia de correlacin serial

Con estos 5 supuestos, los estimadores MCO siguen una


distribucin normal asinttica, los errores estndar, los test
t y F, son vlidos asintticamente
96

En este contexto, existen muchas formas de modelar el


comportamiento de la variable dependiente: AR(j)
Por ejemplo:

yt 1 2 yt 1 ut

yt 1 2 yt 1 2 yt 2 ut

Criterios de informacin (se escoge el modelo que tenga el


menor CI)
Importante: (i) los criterios deben calcularse para cada
modelo, y deben tener el mismo nmero de observaciones
(AR(1) pierdo un dato)
Los modelos deben ser anidados
97

Criterio de Akaike:

u 2 k
2
AIC ln

T T

Criterio de Schwarz:

u 2
k

BIC ln
ln(T )

T
T

Criterio de Hannan-Quinn:

u 2
2 ln(ln(T )) k
HQC ln

T
T
98

Se ha asumido
homoscedstico:

que

el

trmino

de

error

es

var(ui | x) 2

Cuando se trabaja con datos de series de tiempo se


asume adems que los errores no estn
autocorrelacionados, es decir:

cov(ui , u j ) 0

Cuando se cumplen estas dos propiedades se dice


que las perturbaciones (errores) son esfricas

99

Los errores son heteroscedsticos cuando:

var(ui | x) i2

Cuando esto ocurre el


estimador de MCO es
insesgado, pero deja
ser MELI (eficiente)
Hay que corregir la
matriz de varianzas del
estimador
de
MCO
(correccin de White)

Al aplicar la correccin cambiarn los errores


estndar, los test t y los p-value
100

yi 0 1H i 2 Ei ui

101

102

103

Los errores estn autocorrelacionados cuando:

cov(ui , u j ) 0

El estimador de MCO es insesgado pero ineficiente


Correccin de Newey-West
Test de Durbin Watson permite detectar error AR(1)
Este test aparece en el output de Eviews
Debe ser cercano a dos (ausencia de problema)
104

105

Considere el rendimiento % semanal del ndice


compuesto de la Bolsa de Nueva York
Una forma estricta de la HME establece que la
informacin observable en el mercado antes de la
semana t no debera servir para predecir el rendimiento
obtenido durante la semana t

E ( yt | yt 1 , yt 2 ,) E ( yt )

Si esto es falso, entonces, podramos utilizar


informacin del rendimiento pasado para predecir el
rendimiento futuro
Un modelo AR(1) nos permite contrastar la HME
Nyse.wf1 la evidencia est en contra de la HME

106

107

108

No slo es importante obtener buenas estimaciones de


los parmetros poblacionales, sino tambin realizar
buenas predicciones con el modelo
Dos tipos de predicciones econmicas:
Prediccin economtrica (modelo economtrico): el
modelo se puede utilizar para predecir el valor de la
variable dependiente (Y) en funcin de la informacin
existente para las variables independientes (X)
existencia de un modelo econmico
Modelos de series de tiempo: las series de tiempo
pueden ser caracterizadas a travs de una tendencia (t),
un factor estacional, un elemento cclico y un trmino
de error. As, se generan predicciones para el
comportamiento de la serie (la historia pesa!). Tcnicas
de anlisis de Box-Jenkins (modelos ARIMA)
109

Existen cuatro potenciales orgenes


momento de realizar una prediccin:
1)
2)
3)
4)

de

error

al

Error de especificacin: los supuestos no se cumplen


(forma funcional, variables incluidas, cambios de
rgimen)
Error de condicionamiento: XT+1 inexacto
Error muestral: se utilizan estimaciones de los
parmetros poblacionales para hacer la prediccin
Error aleatorio: Se asume implcitamente que T+1 es
cero, cuando en verdad no tiene por qu ser as

Para
construir
el
intervalo de confianza
de la prediccin slo se
consideran
los
potenciales errores (3) y
(4)

intervalo de
confianza

110

Si las fuentes de error (1) y (2) son insignificantes, entonces,


no existe otra prediccin con un intervalo de confianza ms
apretado que el de la figura
Sin embargo, en la prctica eso no ocurre, por lo que los
econometristas deben ajustar las predicciones de sus
modelos para dar cuenta de estos fenmenos
En este sentido, las modificaciones de criterio en los modelos
economtricos consisten en complementar las predicciones
con informacin de tipo cualitativo y con la experiencia del
econometrista (huelgas, cambios de poltica, terrorismo,
cambio en los precios de las materias primas, como el
petrleo)
Para hacer prediccin es mejor explicar la variable
dependiente en funcin de valores pasados de las variables
indepentientes, para no tener que proyectarlas tambin:

yt = b1 + b2 yt-1 + b3zt-1 + ut
111

Para este modelo, la prediccin para el prximo perodo


sera:

yT+1 = b1 + b2 yT + b3zT

Intervalo de confianza
Corra la siguiente regresin:

yt = q0 + q1 (yt - yT )+ q2 (zt - zT )+ ut

El estimador del intercepto y su error estndar


corresponden a la prediccin y al error estndar de la
prediccin

112

El error estndar del error de prediccin viene dado por:


2
2 1/2

ee(eT+1 ) = [(ee( yT+1 )) + s ]

Luego, el intervalo
aproximadamente:

del

pronstico

al

95%

es

yT+1 1, 96ee(eT+1 )

113

PHILLIPS.wf1 solo con datos para el perodo 1948 a


1996
Se quiere pronosticar la tasa de desempleo para 1997
Se utilizan dos modelos
El primer modelo es un AR(1) para la tasa de desempleo
El segundo modelo es tambin un AR(1) pero se agrega
la inflacin (pasada)
Para el primer modelo:

unem1997 =1, 572 + 0, 732(5, 4) = 5, 52

Para el segundo modelo:

unem1997 =1,304 + 0, 647(5, 4)+ 0,184(3, 0) = 5,35

La tasa de desempleo fue de 4,9 para 1997


114

Intervalo de pronstico para el modelo 2


Se corre la siguiente regresin

unemt = q1 + q2 (unemt-1 - 5, 4)+ q3 (inft-1 -3, 0)+ ut

Se obtiene 5,35 como pronstico (intercepto), con error


estndar de 0,137
Luego el error estndar del error de prediccin es:

ee(eT+1 ) = [0,1372 + 0,8832 ]1/2 = 0,894

Por lo tanto el intervalo de pronstico ser

5,351, 96(0,894) = [3, 6;7,1]


115

Raz cuadrada del


error cuadrtico
medio:

n0

( yi y i ) 2

i 1

RMSE

n0
n0

Error
absoluto:

medio

Estos mtodos
presentan problemas de
escala Estadstico de
desigualdad de Theil (U).
Si U=0, prediccin
perfecta

MAE

| y

y i |

i 1

n0
n0

(1 / n 0 )
U

( yi y i ) 2

i 1

n0

(1 / n 0 )

yi

i 1

116

Luego de estimar la
ecuacin: forecast

117

Corte transversal (CT): heterocedasticidad


Series de tiempo (ST): autocorrelacin
Engle (1982, 1983): la varianza es menos
estable de lo que se cree en ST
Engle: grandes y pequeos errores de
prediccin aparecen en clusters. La varianza
del error de prediccin depende del tamao
del shock que hubo previamente
ARCH: volatilidad de la inflacin, estructura
tasas de inters, tipo de cambio, etc.
118

El modelo:

yt = x b + et
'
t

et = ut a0 + a e

2
1 t-1

donde u se distribuye normal estndar

E(et | xt , et-1 ) = 0
2
2
var(et | et-1 ) = E(et2 | et-1 ) = E(ut2 )(a0 + a1et-1
) = a0 + a1et-1
a0
var(et ) = var(et-1 ) = a 0 + a1 var(et-1 ) =
1- a1
119

El error se distribuye incondicionalmente con


media cero y varianza:

a0
s =
1- a1
2

El modelo puede estimarse por MCO


Hay un estimador, no lineal, ms eficiente: el
estimador de mxima verosimilitud (MV)

120

El modelo ARCH (q):


2
2
2
s t2 = a0 + a1et-1
+ a2et-2
++ aqet-q

Es un proceso de media mvil de orden q


El modelo ARCH en media (ARCH-M):

yt = xt' b + ds t2 + et

var(et | Y) = ARCH(q)
121

La base CAPM.xls contiene informacin sobre


precio de acciones
Crear un workfile en Eviews: datos regulares,
mensuales, 2002:01 hasta 2007:4
Importar la base desde excel:
File/Import/Read text-lotus-excel
Los datos estn ordenados por observacin,
el primer dato est en la celda B2, y hay 6
series en el archivo
Guarde el archivo
122

Seleccione las series que quiere inspeccionar, click


View/Open selected/One window. Luego escoja
Open group
Aparece una especie de planilla excel con las
variables
Se construyen los retornos accionarios
Click Genr y escriba lo siguiente:
RSANDP=100*LOG(SANDP/SANDP(-1))
RFORD=100*LOG(FORD/FORD(-1))
USTB3M=USTB3M/12
ERSANDP=RSANDP-USTB3M
ERFORD=RFORD-USTB3M
123

Grafique el exceso de retorno de S&P y Ford


Click Object/New Object/Graph/Introduzca las
series que quiere graficar (ERSANDP ERFORD)
Para hacer un Scatter haga click en Options
Cambie Lines/Symbol por Symbol only
Click Type y escoja X/Y Graph
Ahora se estimar el Beta de Ford:

( RFORD ,t rf ,t ) ( RM ,t rf ,t ) t

Seleccione Object/New Object/Equation


ERFORD C ERSANDP

124

125

C provee de una estimacin para


ERSANDP provee de una estimacin de
El output tambin provee informacin sobre
la bondad de ajuste, criterios de informacin
y test de autocorrelacin
Se puede testar la hiptesis nula H 0 : 1
View/Coefficient tests/Wald-Coefficient
Restrictions
Escriba C(2)=1
Se pueden realizar test de diagnstico:
View/Residual test
126

Considere el siguiente modelo (volat.wf1)

rsp500t 0 1 pcipt 3i3t ut

La rentabilidad mensual (anualizada) del ndice de


la bolsa de valores Standard & Poors 500, depende
del cambio porcentual de la produccin industrial,
y la rentabilidad de las letras del Tesoro a 3 meses
(anualizadas)
Qu signos debieran tener los coeficientes?
Qu variables son estadsticamente significativas?

127

Muchas gracias

128

S-ar putea să vă placă și