Sunteți pe pagina 1din 27

BUAP

ECONOMETRÍA 1

LICENCIATURA EN ACTUARÍA (FCFM-FE)


INTRODUCCIÓN A LA MODELACIÓN ECONOMÉTRICA
Referencias Básicas: Frees, Edward (2010) Regression modeling with actuarial and financial applications
Website : http://research.bus.wisc.edu/RegActuaries
Datasets : http://instruction.bus.wisc.edu/jfrees/jfreesbooks/Regression%20Modeling/BookWebDec2010/data.html

Hill, Carter; Griffiths, William; Lim Guay (2011) Principles of Econometrics


Website : http://principlesofeconometrics.com/
Datasets : http://www.principlesofeconometrics.com/poe4/poe4stata.htm

Gujarati, Damodar; Porter, Dawn C. (2010) Econometría


Website : http://www.econometrics.com/comdata/gujarati/
Datasets: http://www.econometrics.com/comdata/gujarati/data.html
Otros sitios de Interés
Stata 12
http://www.stata.com/stata12/
http://www.stata-press.com/data/r12/

Institute for Digital Research and Education - UCLA


https://idre.ucla.edu/
http://www.ats.ucla.edu/stat/stata/

Blog personal
www.economia-gap.blogspot.mx
Contacto:
israelg.garciapz@udlap.mx
Israel Gerardo García Pérez, Dr. En Economía
Sobre el estudio de la econometría
Thomas R.L (1997).
“…Es la aplicación de la estadística matemática a datos económicos con la finalidad de ofrecer soporte empírico a los modelos construidos
desde la economía matemática (teoría económica) y de obtener estimaciones numéricas de estos modelos…”

Wooldridge J.(2006)
“…La econometría se basa en el desarrollo de métodos estadísticos para realizar estimaciones sobre relaciones entre variables:
-testear teorías económicas
- Evaluar e implementar políticas publicas y privadas …”

Gujarati: (2006)
“Literalmente significa medición económica, pero el alcance de la econometría es mas amplio”
-Hallar determinaciones empíricas de leyes (relaciones) económicas
-Validar o refutar planteamientos de posturas teóricas sobre problemas en el área de la economía (salud, antropología,
biología)

Frees (2010)
“Regression analysis is a statistical method used to analyze data. As we will see, the distinguishing feature of this method is the ability to
make statements about. variables after having controlled for values of known explanatory variables.”

Hill, Griffiths, Lim (2011)


“Econometrics is about how we can use a theory and data from economics, business, actuarial and the social sciences, along with tools
from statistics, to answer “How much” questions.”
Sobre el estudio de la econometría (Definición)

Objetivos del análisis Econométrico:


Fundamentalmente la econometria tiene tres objetivos.

A. Medir relaciones entre variables y estimar parámetros que nos indiquen el sentido y la magnitud de tales relaciones

B. Probar ideas teóricas sobre el comportamiento entre variables

C. Emplear la cuantificación de las relaciones entre variables para realizar pronosticos o inferencia estadística sobre su comportamiento
en el futuro.

Teoria Actuarial Modelo Actuarial Modelo econométrico


Teoria Económica Modelo Económico Análisis empírico
Teoría Financiera Modelo Financiero Pruebas de hipótesis
Inferencia estadística
Sobre el estudio de la econometría (Definición)

Metodología empleada en Econometría.

1. Establecimiento de una hipótesis:


2. Especificación de un modelo teórico-matemático
3. Especificación del modelo estadístico o econométrico
4. Obtención de los datos vía muestreo
5. Estimación de los parámetros del modelo econométrico (cuantificación)
6. Testeo de hipótesis
7. Realización de pronósticos (forecasting)
8. Utilización del modelo econométrico para propósitos de política (pública o privada) y toma de
decisiones
Sobre la estructura de los datos empíricos
que empleamos en ECONOMETRIA
Cross Sectional Data (CS)

Cross sectional data

Muestra aleatoria de individuos hogares familias o países, etc. o de una variedad de unidades tomadas en un punto en el tiempo (t) .De
cada unidad de observación se hace un sondeo de varias variables.

NO hay problema alguno en el caso de que algunas variables sean captadas en diferentes periodos.

El ordenamiento de los CS no importa poner a la obs. i en la posicion 1; la j en la 2; la k en la tres o bien: j en la 1; k en la 2; i en la tres,


etc.

Ejemplo
Time Series

Conjunto de observaciones de una o varias variables a lo largo de un periodo (t; t+1; t+2; … t+k)

NO es una muestra aleatoria; sino sistemáticamente elegida; lo cual requiere un tratamiento especial.

El incorporar tiempo en las variables genera una dependencia entre éstas y el tiempo “ la historia importa”

Existe cierta periodicidad en los datos: Mensual trimestral, cuatrimestral, anual.

La presencia de tiempo genera dos fenómenos que no se presentan en un CS.


Tendencia (trending)
Estacionalidad (seasonality)
Estacionariedad (Stationarity proccess)
Pooled Cross Sectional Data
Dataset conformado por la combinacion de un cross section y un time series.

Contiene n observaciones {1,2…n} de un solo punto en el tiempo (t) y cada observacion reporta un conjunto de variables.

Adicionalmente incorpora otras m observaciones {n+1; n+2; …n+k} de otro punto distinto del tiempo (t+w) y cada observacion reporta el
mismo conjunto de variables.

Dado que existen 2 bloques condistinta temporalidad, es fiundameental incorporar la variable “año” al conjunto de variables compiladas para
cada observacion.

Tener un PCS requiere un tratamiento similar a un CS pero adicionalmente se debe de trabajar con el fenomeno de diferencias seculares
entre año y año
Panel Data
-Lo tenemos cuando para cada miembro i-esimo de una cross section existe una serie de tiempo
-Ejemplo: Podemos colectar para el mismo conjunto de estados de la RM datos sobre:
Tasas impositivas locales
Niveles salariales per cápita
Gasto de gobierno per cápita.
En los años de 1980, 1995 y 1990.

-Aspecto clave:
Para que sea formalmente llamado PD, es necesario que las observaciones o agentes estudiados sean exactamente los mismos en todos los
cortes de tiempo. En caso contrario les consideraremos como PCS.
IMPORTANTE:
Notar que en PD no es relevante cual observación
o agente va primero.

Notar que el ordenamiento de PD difiere de PCS


pues en PD los 1,2…t años para cada i-ésimo
agente van juntos.

Este ordenamiento es el preferido para PD debido


a que será necesario aplicar transformaciones
para cada agente del PD entre año y año.
Análisis Econométrico: Algunos ejemplos

[1] ¿Cómo se relacionan los gastos médicos con la demanda de seguros?


Diversos estudios han planteado una relación positiva entre el monto de gastos médicos y la demanda de seguros en salud

Hip. 1: Personas con malos niveles de salud anticipan utilizar mas servicios médicos que aquellas con buena salud.
Hip. 2: Personas con malos niveles de salud buscan mayores niveles de aseguramiento en salud para compensar sus gastos.
Hip. 3: Personas con malos niveles de salud desean obtener mayor nivel de cobertura médica:
a. Seleccionando un plan de seguro más generoso por parte de un empleador
b. Eligiendo un empleador que ofrezca un mejor plan de aseguramiento en salud.
c. Pagando mas en términos individuales para obtener mas servicios médicos

[2] Precios y Selección adversa:


Las compañías aseguradoras no utilizan el mismo precio para todos sus asegurados .
¿Cómo afecta el hecho de fumar en los costos de un seguro de vida o de gastos médicos mayores?
[3] Estrategias de mercado.
Administradores de una institución que realizan sorteos anualmente, desean focalizar sus ventas en zonas geográficas (pensemos en Zonas
Postales -ZP-) densamente pobladas.
¿Cómo influye la densidad poblacional en el volumen de ventas de boletos del sorteo?

Ventas de Boletos por ZP = f (Habitantes en cada ZP )

[4] Modelo de gasto en alimentos en lo hogares


¿Cómo se comporta el gasto en alimentación de las familias ante variaciones en el ingreso?

Gasto en alimentación semanal del hogar = f (ingreso semanal del hogar)

En el modelo económico, asumimos una relación lineal entre ambas variables.

Variable Y Variable X

-Dependiente -Independiente
-Explicada -Explicativa
-Regresando -Regresora
-Endógena -Exógena
-Respuesta -Impulso
Análisis Econométrico: Conceptos básicos

y   0  1 x  e [1] El modelo econométrico: Componente Sistemático vs. Aleatorio


Parámetros poblaciones: Intercepto y pendiente

Analizando el componente sistemático:

El componente sistemático es conocido como la media condicional de y: y  1   2 x [Ec.1]

E[ y | x]
E[ y | x]  1   2 x [2] Modelo de regresión Simple
Incorporando el error aleatorio:

El componente aleatorio (error aleatorio) se define como: e  y  E[ y | x] [Ec.2]

e  y  1   2 x El término de error es la diferencia


entre “y” y su media condicional:
Reagrupando tenemos: y  E[ y | x]  e

Lo que definimos como Modelo Econométrico Poblacional: y  1   2 x  e [Ec.3]


Componente Componente
sistemático Aleatorio
La media condicional del término de error es nula:

E[e | x]  E  y  E[ y | x]
E[e | x]  E[ y  1   2 x]
E[e | x]  E[ y | x]  1   2 x
 1   2 x  1   2 x
0
Las variables aleatorias {y,e} solo difieren por una constante.
Una consideración adicional es que sus varianzas deben ser idénticas e iguales a σ2

Por lo que hay 2 supuestos implícitos en las v.a. {y,e}:

1) E[y|x]= β1+β2x
Media nula del error
E[e|x]= 0

2) Var(e)=Var(y)= σ2 Varianza constante de v.a. {y,e}


Supuestos Básicos del Modelo de Regresión Lineal Simple (MRLS)
MRLS1: El valor de y para cada valor de x está dado por:

y  1   2 x  e
MRLS2: El valor esperado del termino de error es:

Que es equivalente a: E[e]  0


E[ y | x]  1   2 x
MRLS3: La varianza del termino de error e, es:
var[e]   2  var[ y ]
Las variables aleatorias y, e poseen la misma varianza.

MRLS4: La covarianza entre cualquier par de errores aleatorios ei,ej es:


cov[ei e j ]  0  cov[ yi y j ]
La versión mas fuerte de este supuesto establece que los errores aleatorios con estadísticamente independientes, en cuyo caso
los valores de la variable dependiente y también son estadísticamente independientes.

MRLS5: La variable x no es aleatoria y al menos debe presentar 2 valores distintos

MRLS6: Los valores de la v.a. {e} están distribuidas normalmente alrededor de su media si es que los valores de la v.a. {y} lo están
(y viceversa) 2
e N(0, σ )
y
~ N(β + β x, σ )
1 2
2
Con valores de y, x dados; es posible obtener el componente sistemático que se representa gráficamente por

y E(y|x) = 1 + 2x

y4 .
Nuestro objetivo es estimar la ubicación
de la línea media de la variable
dependiente y, condicional a cada valor de
x.
y3 .
y2 . Dicha línea representa la media
poblacional o el comportamiento
poblacional promedio de y.

y1 .
x1 x2 x3 x4 x
Por su parte, los errores poblacionales se representan gráficamente como :

y E(y|x) = 1 + 2x
y4 .
e4 {
Cada error poblacional (ei) representa
la diferencia entre la media condicional
poblacional de y (el comportamiento
y3 .} e3 promedio poblacional de y) y los

y2 e { . verdaderos valores observados de y,


nuestra variable dependiente.
2

y1 . } e1

x1 x2 x3 x4 x
Problema: (i) - ¡No tenemos acceso al universo! (población)
(ii) - Hay tantas líneas como parámetros beta considerados.
Para resolver el problema (i), es factible considerar una muestra aleatoria de {y, x} que permita analizar la relación que prevalece entre
estas variables en la población
Muestra
Población

E[ y | x]  1   2 x y  b1  b2 x
 
Parámetros poblacionales: {β1, β2} Estimadores {b1, b2 } (ó 1 ,  2 )
 
e  y  E[ y | x] e y y
e  y  1   2 x 
e  y  b1  b2 x
^y = b + b x
1 2
y
y4
e^4

^e
y3 3

y2
e^2

^
e1
y1

x1 x2 x3 x4 x
El principio de Mínimos Cuadrados Ordinarios (MCO)

Este principio nos permite resolver el problema (ii).


Objetivo: elegir valores b1 b2 tales que minimicen la suma de los residuales
cuadrados

n n
min  eˆi    ( yi  yˆ i ) 2
2
Función objetivo:
( b1b2 )
i 1 i 1 b1

   yi  ˆ1  ˆ2 xi 
n n

 eˆi 
2 2

i 1 i 1
b*1
Podemos hallar el valor mínimo aplicando las CPO a la función objetivo:
n
  eˆi 
n 2
  eˆi 
2

i 1
0
i 1
0
b1 b2
n b*2
   yi  b1  b2 xi 
n
   yi  b1  b2 xi 
2 2

i 1
0
i 1
0
b1 b2 b2
Diferenciando y resolviendo para b1, b2, tenemos los valores b*1 b*2
La estimación por MCO para b1 , b2 nos lleva a:

__ __
b1  y  b2 x

b1

b*1
n
 __
 __

  i
i 1 
x  x  i

y  y 
 cov( x, y )
b2  
__ 2
n
  var( x)
  xi  x 
i 1   b*2

b2
Engine
Ejemplo: Un modelo econométrico que analice la Diplacement MPG
relación entre el rendimiento de gasolina (-MPG-) Car Line 3
(in ) (highway)
y el desplazamiento del motor en pulgadas 300C/SRT-8 215 30.8
CARVAN 2WD 201 32.5
cúbicas (-ED- indicador de su tamaño y potencia) CROSSFIRE ROADSTER 196 35.4
DAKOTA PICKUP 2WD 226 28.1
DAKOTA PICKUP 4WD 226 24.4

MPGi   0  1 EDi  ei DURANGO 2WD


GRAND CHEROKEE 2WD
348
226
24.1
28.5
GRAND CHEROKEE 4WD 348 24.2
LIBERTY/CHEROKEE 2WD 148 32.8
LIBERTY/CHEROKEE 4WD 226 28
Donde: MPG Millas por galón de gas. NEON/SRT-4/SX2 122 41.3
ED: Desplazamiento del motor PACIFICA 2WD 215 30
PACIFICA AWD 215 28.2
(pulgadas cubicas) PT CRUISER 148 34.1
RAM1500 PICKUP 2WD 500 18.7
RAM1500 PICKUP 4WD 348 20.3
SEBRING 4DR 165 35.1
STARTUS 4DR 148 37.9
TOWN & COUNTRY 2WD 148 33.8
VIPER CONVERTIBLE 500 25.9
WRANGLER/TJ 4WD 148 26.4
MPGi  1   2 EDi  ei
Los estimadores b1 b2 del modelo anterior, los obtenemos mediante MCO
________ ____
b1  MPG  b2 ED
n
 ____
 ________

  EDi  ED  MPG i  MPG 
b2  i 1     cov(MPG, ED)
_____ 2
n
  var(ED)
  EDi  ED 
i 1  

Descriptive Statistics: ED_inc3, mpg

Variable N Mean StDev Variance


b1 = 29.55 – (238.9*-0.0422) = 39.157 ED_inc3 21 238.9 109.1 11907.6
mpg 21 29.55 5.71 32.57
b2 = (-478.880/ 11907.59) = -0.04022

Covariances: ED_inc3, mpg


ED_inc3 mpg
ED_inc3 11907.590
mpg -478.880 32.571
Fitted Line Plot
mpg = 39.16 - 0.04022 ED_inc3
Regression Analysis: mpg versus ED_inc3
S 3.74332
-------------------------------------------------
40 R-Sq
R-Sq(adj)
59.1%
57.0%
The regression equation is

35 mpg = 39.16 - 0.04022 ED_inc3


mpg

30 S = 3.74332 R-Sq = 59.1% R-Sq(adj) = 57.0%

25 --------------------------------------------------
Analysis of Variance
20

100 200 300 400 500


Source DF SS MS F P
ED_inc3 Regression 1 385.177 385.177 27.49 0.000
Error 19 266.236 14.012
Total 20 651.412
Scatterplot of RESI1 vs ED_inc3
8

2
RESI1

-2

-4

-6

-8
100 200 300 400 500
ED_inc3

S-ar putea să vă placă și