Sunteți pe pagina 1din 54

Econometría

Semestre Primavera 2018


Profesora: Maria Elisa Farías
maria.fariase@usm.cl
Clase 9 de Septiembre 2018

o Econometría: “Medida económica”

o Dos visiones:

Econometría permite verificar hipótesis (teoría) a partir de


los datos (realidad). Ejemplo, la función de consumo
Keynesiana.

Econometría permite construir nuevas hipótesis (teorías) a


partir de observaciones y comportamientos de la realidad.
Hechos estilizados.

Ejemplo: cada vez que hay una mala noticia, caen los precios
en los mercados financieros.
2
Rol de la Econometría?

Teoría

Econometría

Datos

Hechos

3
El Método en Econometría

1. Plantear una hipótesis. Ej. Teoría Consumo Keynesiana

2. Especificar un modelo matemático.

3. Especificar un modelo econométrico.

4. Datos. Análisis de los datos

5. Estimación de los parámetros del modelo.

6. Test de hipótesis.

7. Predicciones.

8. Usos del modelo?

4
Ejemplo 1: La demanda de inversión neoclásica
1. Hipótesis: La demanda por inversión depende negativamente de
la tasa de interés real.

2. La función de demanda:

It = I0 - b1rt

3. El modelo econométrico:

Ln It = I0 + b1rt + ut

4. Datos anuales de formación de capital bruto (DK) entre 1995 y


2015. Fuente: Banco Central de Chile.

5
Demanda por Inversión

16
15.5
15
14.5
14

0 5 10 15 20 25
Tasa de Interés Interbancaria

95% CI Fitted values


linv

linv Coef. Std. Err. t P>|t| [95% Conf. Interval]

ltir -0.23451 0.064415 -3.64 0.001 -0.36286 -0.10616


_cons 15.54956 0.113359 137.17 0 15.32369 15.77543 6
Relaciones entre Variables
1. Bi-variadas: pares de variables de la forma

(x, y)

Ejemplo: ingreso, gasto (x, y); precio del cobre, ventas


de cobre; inflación, tipo de cambio.

2. Multivariadas: grupos de variables de la forma

(x, y, z)

Ejemplo: ingreso, precios, consumo (x, y, z);


producción, costos, ventas, etc.
7
Inflación y Tipo de Cambio

6
4
lipc

2
0

2 3 4 5 6 7
ltc

8
Regresión y Causalidad

1. Análisis de regresión: dependencia entre una o mas


variables.

y = f(x)
y = f(x, z)

x, z: variables independientes
y: variable dependiente.

2. Causalidad: el comportamiento de una o más


variables causa o “explica” el comportamiento de otra.

9
Coeficiente de Correlación Simple (r)
o Mide el signo y la importancia de la “relación” entre
dos variables X, Y.

o El coeficiente de correlación simple:

r = Si=1,nxy/nsxsy

o Las variables “desviadas” con respecto a la media:

xi = Xi – 𝑋ത

Yi = Yi- 𝑌ത

10
Relación entre el PIB y el tamaño de la población: Caso de Chile
(r = 0,99)

PIB y Poblacional Nacional (Chile)


18.2
18
17.8
17.6
17.4

16.45 16.5 16.55 16.6 16.65 16.7


Poblacion (ln Pob)

11
Modelo de Regresión Lineal (MRL)

o Se desea conocer el comportamiento medio de la


población en relación a una o más variables
explicativas.

o El modelo de regresión lineal (MRL) simple:

E(Y/X) = f(X)

Y: Variable dependiente
X: Variable explicativa

12
La Función de Regresión Poblacional (FRP)

o Según las predicciones de la teoría:

E(Y/X) = b1 + b2X

• b1 : Intercepto

• b2 : Pendiente de la regresión

13
Ejemplo: Consumo familiar semanal

14
Ejemplo: Consumo familiar mensual

15
Función de Regresión Poblacional
o La Función de Regresión Poblacional (FRP):

E(Y/Xi) = b1 + b2Xi

o Para una observación individual

Yi = b1 + b2Xi +ui

o En el modelo de regresión lineal (MRL):

• Y: variable dependiente, estocástica


• X: variable explicativa, determinística
• b1, b2: parámetros del modelo (coeficientes de regresión)
• u: término de error (variable estocástica)

16
Linealidad

o Linealidad en las Variables: La función de regresión E(Y/Xi)


es una línea recta, en que la variable independiente tiene
potencia igual a 1.

o Linealidad en los parámetros: La función de regresión


E(Y/Xi) es lineal, ya que los parámetros son lineales. Esto
es la potencia del parámetro de regresión es 1.

La función de regresión lineal requiere linealidad en los


parámetros.

17
Razones para el Término de Error
1. Teoría puede estar incompleta o ser errónea. Ej. Precios, gustos
(variables excluidas), variables redundantes.

2. Conjunto de variables excluidas/redundantes agrupadas en el


término de error.

3. Datos difíciles de obtener para algunas variables, ej.


Preferencias, gustos.

4. Aleatoriedad del comportamiento humano. Variabilidad en el


consumo.

5. Errores de medición. Por ejemplo, se mide el ingreso disponible


en lugar del ingreso permanente.

6. Forma funcional errónea.

18
Función de Regresión Muestral
o Para una muestra de tamaño n se puede obtener la
Función de Regresión Muestral (FRM), como una
estimación de la FRP.
o La Función de Regresión Muestral (FRM):

𝑌෠ i = 𝛽መ 1 + 𝛽መ 2Xi

o Residuo de la estimación:
ei = Yi - 𝑌෠ i

o Para una observación individual

Yi = 𝛽መ 1 + 𝛽መ 2Xi + ei

19
Supuestos de Comportamiento Parámetros Poblacionales

1. Los errores se “compensan” en la población:

E(ui) = 0
Para todo i = 1,…, N

2. La varianza poblacional es (des)conocida y constante:

Var (ui) = E(u2i) = s2


Para todo i = 1,…, N

3. Los errores son independientes entre si:

cov(ui ,uj) = E(uiuj) = 0


Para todo i ≠ j

20
Estimación por Mínimos Cuadrados Ordinarios (MCO)

1. Se busca minimizar la suma de cuadrados de los errores o


residuos (muestrales), en que SCR = f(𝛽መ 1 , 𝛽መ 2).

Min{𝛽 1,Ƹ 𝛽 2Ƹ } SCR = Min S(e2i)


Sujeto a:
ei = Yi – (𝛽መ 1 + 𝛽መ 2Xi)

2. Estimadores:
𝛽መ 1 = 𝑌ത − 𝛽መ 2𝑋ത
𝛽መ 2 = Sxy/Sx2
𝜎ො = Se2/n-2

21
Clase 10/9/ 2018
Propiedades de la Regresión obtenida por (MCO)

1. Minimiza la suma de cuadrados de los residuos.

2. Pasa a través de los puntos medios (promedios) de


las variables X e Y.

3. Los errores muestrales no están correlacionados con


los valores de X.

E(eX) = 0
22
Supuestos del Modelo de Regresión Lineal

1. El modelo de regresión es lineal en los parámetros.

2. Los valores de X son fijos en muestras repetidas. X es no


estocástica.

3. El valor esperado de los errores, condicionado a X es cero:

E(u/X) = 0

4. La varianza de los errores es homocedástica, es decir, existe


una varianza común (constante) para todos los errores.

5. Los errores no están correlacionados entre observaciones:

Cov(ui, uj) = 0
23
Supuestos del Modelo de Regresión Lineal
6. La covarianza entre X y los errores es nula.

Cov(u, X) = 0

7. El tamaño de la muestra debe ser mayor al número de


parámetros que se desea estimar:
n>k
8. El valor de X debe variar en la muestra. Varianza de X debe
ser finita y positiva.

9. El modelo de regresión lineal debe estar bien especificado.

10. Las variables explicativas no están correlacionadas entre si.


No existe multicolinealidad.
24
El Modelo Matricial

o La función de regresión poblacional (FRP):

Y = Xb + u
Con: u ~ N(0, s2I)

o La función de regresión muestral (FRM):

෠ X𝛽መ
𝑌=
o El vector de residuos: para cada observación, indica la
diferencia entre el valor observado y el valor estimado.

e = Y - 𝑌෠

25
Propiedades Matrices

o Matriz Simétrica, Diagonal, Identidad, Triangular

o Matriz Idempotente

26
Regresión Lineal en Stata – Paso a Paso 1
1. Cargar los datos desde una planilla Excel:

a. En Stata abrir el editor de datos: se abrirá una planilla,


posicionarse en la primera celda.
b. Ir a Excel y seleccionar el área de los datos incluyendo los
nombres de las variables. Copiar el área y pegar en la
planilla de Sata (primera celda).
c. Guardar el archivo con un nombre a recordar.

2. Si los datos existen, cargar desde Stata:


use “nombre archivo”
3. Describir los datos como series de tiempo:
tsset periodo, yearly
4. Estadísticas Básicas: entrega los estadísticos del conjunto de
variables
summarize
5. Graficar los datos:
plot y x

27
Cálculo de la Regresión por MCO - Paso a Paso (2)

1. Estimación de un modelo por MCO, en que y es la variable


dependiente, x es variable explicativa:
regress y x
2. Guardar resultados de la estimación:

est store mo1


3. Obtener matriz de varianzas y covarianzas

estat vce
4. Calcular la regresión estimada (𝑦):

predict ye, xb
5. Obtener el vector de residuos:

predict res, residuals


28
Propiedades de Matrices
1. Matriz Simétrica: A es una matriz simétrica si los
elementos aik fuera de la diagonal, son idénticos a los
elementos aki (también fuera de la diagonal).
137
A= 352
721
2. Matriz Diagonal: Matriz cuadrada, en que los valores
fuera de la diagonal son cero.
100
A= 050
001
3. Matriz Identidad: Matriz diagonal, en que para cada
elemento de la diagonal, se tiene: aii = 1 y aij = 0.

4. Matriz triangular: Para los elementos aik que están


por encima (o por debajo) de la diagonal, se tiene: aik = 0.
29
Matriz Idempotente (M)
o Transforma los datos en desviaciones con respecto a la
media.

1
M= 𝐼 − 𝑖𝑖 ′
𝑛

o Una matriz M es idempotente si su cuadrado es igual a


la matriz. Por lo tanto,

M’M = M
MM’ = M

Demostrar….

30
Cálculo de la Regresión por MCO - Paso a Paso (1)
1. Estimación de un modelo por MCO, en que con es la variable
dependiente e, yd es variable explicativa:
regress con yd

2. Guardar resultados de la estimación:


est store mo1

3. Obtener matriz de varianzas y covarianzas


estat vce
4. Calcular el consumo estimado:

predict cone, xb

5. Obtener el vector de residuos:

predict res, residuals


31
Cálculo de la Regresión por MCO - Paso a Paso (3)
6. Graficar el consumo observado y estimado

line con cone periodo

7. Graficar el vector de residuos

line res periodo

32
Resultados de la Estimación

33
ANOVA en el Modelo Simple

Fuente de Variación SS df MSS

Debido a la regresión (SCE) σ 𝑦ො 2 1 σ 𝑦ො 2

Debido a los residuos (SCR) Se2 n-k Se2/n-k

Total (SCT) Sy2 n-1

34
Probabilidad de Confianza (1 - a): Elección de a
o Error tipo I (a): Probabilidad de rechazar la hipótesis
verdadera.

o Error tipo II (b): Probabilidad de aceptar la hipótesis falsa.

Problema? Al reducir a, puede aumentar b (y viceversa)


Ejemplo: a = 5% (probabilidad de cometer error tipo I).

Alternativa?

o Nivel exacto de significancia p: Nivel de significancia más


bajo al cual la hipótesis nula puede ser rechazada
(probabilidad de aceptar H0).

35
Probabilidad de rechazar H0: p

36
Laboratorio Octubre 1

Test de Cambio Estructural – Chow

Modelo a estimar:

y = Aka
Modelo lineal:

lnPIB pc = b1 + b2lnK + b3ihc + b4Openness + u

37
Laboratorio Octubre 1 - Datos
Datos de Panel: Combinación de series de tiempo (1960 –
2012) y corte transversal (seis países de A Latina).

• Datos de PIB
(ln) PIB pc en dólares constantes de 1990: ly90
(ln) PIB pc en dólares constantes de 2005: ly05

• Datos de Capital
(ln) Capital en dólares constantes: lk

• Índice de Capital Humano: ihc

• Openness (apertura comercio internacional)

38
Laboratorio Octubre 1 – Estadísticas Básicas
• Definir los datos como un panel:
tsset coun year, yearly

• Matriz de Estadísticas Básicas


summarize

• Matriz de Correlación
correlate

correlate ly90 ly05 lk ihc openness

39
Laboratorio Octubre 1 – Estimación
• Modelo Sin Restricciones:
regress ly90 lk ihc openness
est store mo1
estat vce

• Modelo Con Restricciones:


regress ly90 lk ihc openness if year < 1986
est store mo2
estat vce

regress ly90 lk ihc openness if year > 1985


est store mo3
estat vce

40
Laboratorio Octubre 1 – Test de Chow

H0: bI = bII vs H1: bI ≠ bII

F-Chow = {[SCRnr – (SCR1 + SCR2)]/k}/[(SCR1 + SCR2)/(n –


2k)]

Si F-Chow > Fa(k, n – 2k), se Rechaza H0 al (1-a)%

F-5%(4, 304) = 2,37

41
Laboratorio Octubre 1 – Tabla de Resultados
estimates table mo*, stats(chi2 df N aic bic rank) star(.05 .01 .001)
style(oneline)

42
Compatibilidad entre Datos de Excel y Stata

• Para que los datos de Excel sean compatibles con Stata,


estos deben estar expresados en el mismo formato:

1. Definidos como caracteres numéricos.


2. Decimales con punto.
3. Valores en miles sin coma.

• Para esto, deben asegurarse que la planilla Excel este


configurada tal como lo está Stata.

43
Configuración de Excel

• Abrir la planilla de Excel y hacer click en Archivo

• En Archivo hacer click en Opciones

• En Opciones buscar Avanzadas

En Opciones Avanzadas buscar Opciones de Edición

En Opciones de Edición ver donde dice: Usar separadores del sistema:

Separador decimal: si esta con , cambiar por .


Separador de miles: si esta con . cambiar por ,

• Hacer click en Aceptar y cerrar (probar con una base de datos…)


44
Multicolinealidad

o Sea el modelo:
Yi = b1 + b2X2 + b3X3 +...+ bkXk + ui

1) Multicolinealidad exacta:

l1X1 + l2X2 +...+ lkXk = 0

2) Multicolinealidad imperfecta:

l1X1 + l2X2 +...+ lkXk + v = 0

45
Como Detectarla?

1. Valores de pruebas “t” pequeños para algunas variables y


bondad de ajuste alto (R2 alto).

2. Coeficientes de correlación parcial alto entre pares (rij >


0,5).

3. Regresión Auxiliar: Rj2


X2 = a1 + a2X2 +...+ akXk + e

4. Raíces y Condición de Índice (CI):


l1X1 + l2X2 +...+ lkXk + v = 0

K = Raíz Máxima/Raíz Mínima


CI = (K)1/2
46
Como Detectarla?
5. Índice de Tolerancia (TOL). Dada la varianza de los
estimadores “betas”:

መ = s2/Sx2j(1 – R2j)
Var(𝛽)

o Factor de Inflación de Varianza (FIV):

FIV = (1 – R2j)

o Índice de Tolerancia:
TOL = 1/FIV

Si TOL = 1 (No existe multicolinealidad)


Si TOL = 0 (perfecta multicolinealidad)

47
Corrección de la Multicolinealidad

1. Información a Priori: Se conoce la naturaleza de la


multicolinealidad y se introduce en la regresión a estimar.

2. Combinación de datos de series de tiempo y sección cruzada.

3. Eliminando variables. Problema? Sesgo de estimación.

4. Transformación de variables.

5. Datos adicionales: ampliar la muestra de observaciones.

6. Ortogonalización, especialmente en polinomios.

7. Análisis de factores y componentes principales. Estimador de


Ridge.

48
Laboratorio Octubre 8 – Multicolinealidad
Para probar la existencia de multicolinealidad, se utilizara
la siguiente regresión:

ly90it = b1 + b2lkit + b3ihcit + b4Opennessit + uit

En que ly90 es el log del PIB per cápita del país i en el periodo
t, lk es el capital del país en ese periodo, ihc es el índice de
capital humano del país y Openness indica el grado de
apertura comercial, ambos en el periodo t.

A esta regresión base se le agregaran 3 variables


explicativas:

• lemp: logaritmo del empleo


• lyus: log del PIB pc de EEUU
• lychina: log del PIB pc de China
49
El Conjunto de Regresiones
Modelo Básico:

ly90it = b1 + b2lkit + b3ihcit + b4Opennessit + uit

Modelo “Aumentado”:

ly90it = b1 + b2lkit + b3ihcit + b4Opennessit + b5lempit + uit

ly90it = b1 + b2lkit + b3ihcit + b4Opennessit + + b5lempit + b6lyust


+ uit

ly90it = b1 + b2lkit + b3ihcit + b4Opennessit + + b5lempit + b6lyust


+ b7lychinat + uit

50
La Regresión en Stata
• Modelo Básico:

correlate ly90 lk ihc openness


regress ly90 lk ihc openness
est store mo1

Matriz de Varianzas y Covarianzas

estat vce

Factor de Inflación de Varianzas

estat vif

51
Índice de Tolerancia
El comando estat VIF entrega el análisis de inflación de
varianza para cada estimador y el valor promedio del modelo,
VIF. A partir de este valor se obtiene el Índice de Tolerancia
(TOL).

TOL = 1/VIF

Si TOL = 1, no existe multicolinealidad. Por lo tanto, a medida


que TOL se aleja de 1, se dice que existe multicolinealidad,
que se hace mas severa a medida que TOL se aproxima a 0.

Si TO = 0, existe perfecta multicolinealidad.

52
El Modelo Aumentado
1) correlate ly90 lk ihc openness lemp lyus lychina
regress ly90 lk ihc openness lemp
est store mo2
estat vce
estat vif

2) regress ly90 lk ihc openness lemp lyus


est store mo3
estat vce
estat vif

3) regress ly90 lk ihc openness lemp lyus lychina


est store mo4
estat vce
estat vif
53
Corrección
1) Eliminar algunas variables: problema? Sesgo de
estimación…

2) Ortogonalizar variables fuertemente correlacionadas:


lk, lemp, lyus, lychina

orthog ly90 lk lemp lyus lychina, generate(ly901 lk1 lemp1


lyus1 lychina1)

3) Transformar variables:

D.ly90it = b1 + b2D.lkit + b3ihcit + b4Opennessit + uit

54

S-ar putea să vă placă și