Sunteți pe pagina 1din 39

Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal

TEMA 1. Introduccin al anlisis emprico de


variables econmicas.

Profesor: Pedro Albarrn Prez

Universidad de Alicante. Curso 2010/2011.


Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal

Contenido

1 Datos Econmicos
Introduccin
Tipos de Datos. Tratamiento de la Informacin

2 Anlisis Bsico de los Datos


Mtodos grcos.
Estadsticos descriptivos.

3 Relacin entre Variables


Correlacin
Correlacin y Causalidad

4 Modelo de Regresin Lineal


Modelo de Regresin Lineal con Regresores Aleatorios
Estimador de MCO
Efectos Marginales
Modelo con Regresores Binarios
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Introduccin

La importancia de saber analizar datos

En el mundo laboral, muchos profesionales de la economa, la


empresa y las nanzas deben trabajar con datos:

para contrastar explicaciones tericas sobre el comportamiento de la


economa o sobre el comportamiento de activos nancieros

para anticipar los efectos de cambios en las polticas pblicas (tipo


de inters, prestaciones por desempleo) o en la gestin de la empresa
(exportar a nuevos mercados, inversiones)

para predecir la evolucin de la produccin, los mercados nancieros,


los tipos de cambio, los precios de los bienes

para la analizar el estado y desempeo de una empresa

En este curso, estudiaremos las herramientas que se utilizan en la


prctica

motivando los conceptos generales con ejemplos particulares y


desarrollando las habilidades informticas necesarias.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Tipos de Datos. Tratamiento de la Informacin

Tipos de Datos
1 Series Temporales: los datos de nuestra variable estn ordenados
temporalmente

Ejemplos: el PIB, tipos de inters, ventas de una empresa, precios de


activos nancieros, etc.
La frecuencia de los datos puede ser anual, trimestral, mensual,
semanal, diaria, cada hora, cada minuto, etc.

2 Datos de seccin cruzada: los datos se reeren a unidades


individuales (en un momento del tiempo)

las unidades puede ser personas, empresas, pases, activos en una


cartera de inversin
el orden de las unidades no importa

3 Datos de Panel: informacin sobre unidades individuales a lo largo


del tiempo

combinan dimensin temporal y de corte transversal


Ejemplo: pases de la UE15 entre 1992-2010, rentabilidad de los
activos en una cartera durante los ltimos 10 aos, etc.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Tipos de Datos. Tratamiento de la Informacin

Informacin cuantitativa: los datos establecen un valor numrico


para cada unidad y/o periodo de tiempo

Ej.: el precio de un activo son 10 euros

Ej.: las ventas en agosto han sido 20.000 euros

Informacin cualitativa: los datos informan de una cualidad o una


eleccin

Ejemplos:
Hombre/Mujer
S/No
Bueno/Regular/Malo
Coche/Autobs/Tren

A veces, los datos se convierten en valores numricos:


Variables binarias (dummies): S=1, No=0
Variables categricas: Bueno=3, Regular=2, Malo=1

Aunque no siempre, algunas veces la informacin cualitativa puede


interpretarse ordinalmente (Bueno/Regular/Malo)

NUNCA se pueden interpretar cardinalmente como la informacin


cuantitativa
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Tipos de Datos. Tratamiento de la Informacin

Transformaciones de los Datos

En el curso, supondremos que los datos de inters (la variable Y )


est directamente disponible

En la prctica, el profesional obtiene los datos (en bruto) de una


fuente de informacin y los transforma para realizar su anlisis
emprico

Frecuentemente se tienen que calcular ratios:


X = benecios de la empresa, W = nmero de acciones
= Y = WX
= benecio por accin

Muchas datos informan sobre el nivel de una variable: ej., el precio


de una accin o de un bien, ventas, PIB, etc.

Pero podemos estar interesados en cmo cambia esa variable en el


tiempo, es decir, la tasa de crecimiento
Otras transformaciones puede ser necesarias segn el contexto:
deactar variables, calcular rentabilidades, trabajar con nmeros
ndice, etc.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal

Cmo analizar la informacin?

Para cualquier anlisis emprico, resulta crucial ofrecer un resumen


relevante de los datos

los datos originales (cientos de observaciones) no son informativos


por s mismos

de hecho, la econometra simplemente desarrolla mtodos por los


cuales la informacin de los datos se resumen de forma informativa
Tambin se pueden usar tablas y grcos para presentar la
informacin de forma muy til.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Mtodos grcos.

Grcos de series temporales

La forma ms simple de representar la evolucin de una serie temporal es


un grco de lneas de los datos en funcin del tiempo
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Mtodos grcos.

Histograma
Con datos de seccin cruzada, un grco de lneas NO es informativo
porque el orden no importa.
Podemos representar la distribucin de distintas categoras de valores
1 Elegir los intervalos de valores
2 Calcular las frecuencias muestrales en cada intervalo
3 Realizar un grco de barras (de las frecuencias en cada intervalo)
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Mtodos grcos.

Este grco puede ayudar con varias cuestiones de inters:

Cmo es la distribucin de renta per cpita entre pases?

Cmo de importante es la desigualdad?

NOTA: el histograma depende de la eleccin de la amplitud y el nmero


de intervalos

muchos programas realizan automticamente histogramas eligiendo


automticamente este aspecto

distintas elecciones pueden llevarnos a conclusiones diferentes


(puede que incorrectas)
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Mtodos grcos.

Grco de Dispersin
Muchas veces, estaremos interesados en analizar relaciones entre dos o
ms variables
Aunque no es fcil mediante grcos, se pueden explorar mediante
grcos de dispersin
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Mtodos grcos.

En este ejemplo, parece existir una relacin positiva entre el salario de los
ejecutivos y los benecios que obtienen las empresas

Relacin positiva: valores altos de una variable suelen asociarse con


valores altos de la otra variable

Relacin negativa: valores altos de una variable suelen aparecer junto


con valores pequeos de la otra variable

En muchas ocasiones encontraremos valores atpicos: observaciones que


no se ajustan al patrn general.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estadsticos descriptivos.

Estadsticos descriptivos
Una distribucin se puede resumir en una tabla de frecuencias
(equivalente al histograma)
til cuando la variable tiene pocos valores diferentes
PERO puede contener demasiada informacin para ser interpretable

Estadsticos descriptivos: nmeros que resumen las propiedades de la

distribucin de una variable econmica


ofrecen precisin numrica frente al impacto visual de los grcos

(1) Medidas de localizacin: intuitivamente, indican el centro de la


distribucin, individuo promedio o tpico
PN
Media (o promedio): X= N
1
i= 1 X i

(2) Medidas de dispersin: muestran la variabilidad/dispersin de la


distribucin en torno al valor central, desigualdad
PN  2
r
desviacin estndar: s= 1
N i= 1 X i X
varianza= s2
Otros estadsticos: mediana, moda, percentiles (cuartiles, deciles,
etc.); rango intercuartlico, etc.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin

Correlacin
Correlacin: mide numricamente la relacin entre dos variables

PN   
i =1 Yi Y Xi X
r = rYX = rXY = r
PN  2 rP
N X X 2
 
i =1 Yi Y i =1 i

1 6 r 6 1

r >0 indica relacin positiva entre X e Y

la relacin es ms fuerte cuanto mayor sea r


r = 1 indica una correlacin positiva perfecta
r <0 indica relacin negativa entre X e Y

la relacin es ms fuerte cuanto menor sea r


r = 1 indica una correlacin negativa perfecta
r =0 indica ausencia de relacin entre X e Y

r XX = 1
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin

r =1 r = 0,51

r =0 r = 0,58
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin

Correlacin entre variables variables

La correlacin es una propiedad que relaciona DOS variables

Pero frecuentemente querremos trabajar con varias variables

los modelos de regresin son los ms adecuados en este caso


Se pueden calcular las correlaciones de CADA PAR de variables, que
se presentan en una matriz de correlaciones

si tenemos muchas variables pueden ser muchas correlaciones

Pero no conocemos si la relacin entre dos variables es directa o


indirecta (por medio de una tercera)
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin

Ejemplo: relacin entre salario de ejecutivos, benecio de la empresa,


cambio en las ventas y cambio en la deuda

compensation prots changesales changedebt


compensation 1
prots 0.6591 1
changesales -0.0524 -0.1269 1
changedebt 0.3016 0.0886 0.2489 1
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin

Ejemplo: relacin entre valor de mercado de una empresa, su deudas, sus


ventas, sus ingresos netos y el valor contable de sus activos

value debt sales income assets


value 1
debt 0.322 1
sales 0.410 0.638 1
income 0.486 0.511 0.624 1
assets 0.014 0.041 0.025 0.019 1
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin y Causalidad

Por qu estn dos variables correlacionadas?

Cuando dos variables estn correlacionadas, se puede pensar en


trminos de inuencia o causalidad

Las correlaciones pueden sugerir pero no establecer por s misma la


existencia de relacin causal.
Ejemplo: Cigeas y nacimientos en una muestra de 17 pases europeos

area storks humans birth_rate


area 1.0000

storks 0.5793 1.0000


(0.0148)
humans 0.8122 0.3542 1.0000
(0.0001) (0.1630)
birth_rate 0.9225 0.6203 0.8512 1.0000
(0.0000) (0.0079) (0.0000)
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Correlacin y Causalidad

Causalidad Directa vs. Causalidad Indirecta


Causalidad directa o inmediata: una variable inuye real e

independientemente sobre otra


un cambio en una variable provocar necesariamente un cambio en la
otra sin que intereran cambios en otras variables
El ejemplo anterior sobre la relacin entre ventas y valor de mercado
puede interpretarse como causalidad directa

Causalidad indirecta (intermediada o aproximada): la relacin

aparente entre dos variables se debe a una tercera que s causa a


ambas
una mayor rea permite observar ms cigeas y que haya ms
poblacin humana y, por tanto, nacimientos
slo una mayor deuda orientada a aumentar las ventas aumenta el
valor de mercado

Una correlacin (debida a causalidad indirecta) siempre puede usarse


para predecir.
El sentido comn o los razonamientos y teoras econmicas nos debe
ayudar a establecer si una correlacin puede interpretarse como
relacin causal.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Modelo de Regresin Lineal con Regresores Aleatorios

Modelo de Regresin Lineal


Supongamos una relacin lineal

Y t = 1 + 2 X2t + ... + k Xkt + ut

En notacin vectorial

t = X t + ut
0
Y

X t = (1, X2t , .., Xkt )0 es un vector ( k 1) de variables aleatorias y u t

es una variable aleatoria

= (1 , 2 , .., k )0 un vector (k 1) de parmetros (poblacionales,


verdaderos)

 T
Para datos de corte transversal, suponemos que (Yt , Xt0 ) 0 t =1 i.i.d.

por tanto, {ut }T


t =1
tambin es i.i.d.

 T
Para datos de series temporales, suponemos que (Yt , Xt0 ) 0 t =1 es
un proceso estocstico estacionario
por tanto, {ut }T
t =1
tambin es un proceso estocstico estacionario
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Modelo de Regresin Lineal con Regresores Aleatorios

Y t = 1 + 2 X2t + ... + k Xkt + ut


Supuestos bsicos:

(a) E ( ut | Xt ) = 0, E ( Yt | Xt ) = Xt0
Esto implica: E ( u Xt ) = 0
t

(b) Var ( ut | Xt ) = 2 (homocedasticidad)

Var ( u | Xt ) = E u 2 Xt = g (Xt ) = 2 (Xt )



(b)' NO ES NECESARIO: t t

(c) = E (Xt Xt0 ) es denida positiva

(no hay multicolinearidad perfecta)

(d) Una forma concreta de la dependencia entre observaciones del


trmino de error {ut }t =1
T

(d.1) Ausencia de correlacin: Cov (u , u |X , X ) = 0, t 6= s


t s t s

(d.2) u t AR (p ), ut MA(q ), . . .
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estimador de MCO

Estimador MCO

Utilizando los supuestos (a)

E [ Xt u ]=E Xt Y Xt0 = E (Xt Yt ) E Xt Xt0


  
t t =0

y (c) para despejar


Se puede identicar el parmetro en la poblacin

E Xt Xt 0 1
E ( Xt Y
 
= t )

El estimador MCO se obtiene en nuestra muestra como un


estimador del mtodo de los momentos:

T
X
!1 T
X
!

b= 1
T
Xt Xt
0
T
1
Xt t
Y

t =1 t =1
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estimador de MCO

En notacin matricial,
Y = X + u
donde

Y1
u1
Y2 u2
Y u

(T 1)

= . y = . son vectores
. .
. .
YT uT

X 100
X2
(T k )

X= .
es una matriz
.

.
XT 0

El estimador de MCO es

X 0Y
1

b = (X 0 X)

Se puede denir el vector ( T 1) de residuos

e1

e2
e=Y


X
b = .
.
.
e T

donde e t = Yt Xt 0
b, t = 1, 2, .., T
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estimador de MCO

Propiedades del estimador MCO

Bajo (algunos de) los supuestos anteriores el estimado de MCO tiene


buenas propiedades
   
Insesgado: E
b X = E
b =

Varianza  
Var b X = (X 0 X)1 X 0 X (X 0 X)1

donde
u1
u2
= Var (u ) = Var


.
.
.
uT

Bajo homocedasticidad y ausencia de correlacin, = 2 II , por lo

Var b X = 2 (X 0 X)1
 
que
Los programas informticos tambin calculan errores estndar
robustos (y otros estadsticos de contraste) usando la formula general
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estimador de MCO

Es consistente
p
b MCO

Es asintticamente normal
  
b MCO ' N , Var
b
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Estimador de MCO

Esta propiedad se puede explotar para hacer inferencia sobre el vecto de


parmetros :
Hiptesis nula y alternativa

H0 : j = 0j H0 : j = 0j H0 : j = 0j
H1 : j 6= 0j H1 : j > 0j H1 : j < 0j

y el estadstico de contraste

b j 0

t =  j ' N (0, 1)
SE cj H0

Regla de rechazo: rechazar H0 (con un nivel de signicacin )

(a ) H0 : R = r (b ) H0 : R = r (c ) H0 : R = r
H1 : R 6= r H1 : R > r H1 : R < r

si |t | > C/2 si t > C si t < C

N (0, 1) > C ) = y Pr N (0, 1) > C/2



donde Pr ( = /2
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Efectos Marginales

Y t = 1 + 2 X2t + ... + k Xkt + ut


Cmo se interpretan los coecientes del modelo de regresin?

Si el modelo tiene constante

1 = E [ Y | X2t = 0, . . . , Xkt = 0]

El coeciente de una variable continua (digamos, X2 ) es un efecto


marginal


2 = E [ Y | X2t , X3t = x3 , . . . , Xkt = xk ]
X2t
El coeciente de una variable discreta (digamos, Xk ) tambin es un
efecto marginal (discreto)

k = E [ Y | X2t = x2 , , . . . , Xk 1,t = xk 1 , Xkt = xk + 1]


E [ Y | X2t = x2 , , . . . , Xk 1,t = xk 1 , Xkt = xk ]
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Y t = 1 + 2 X2t + ... + k Xkt + ut


E Y | X2t = x2 , . . . , Xj 1,t = xj 1 , Xj ,t , Xj +1,t = xj +1 , . . . , Xkt = xk
 
j =
Xjt

El coeciente j informa del

cambio esperado en la variable dependiente Y

ante un cambio de unidad o innitesimal de la variable explicativa Xj

manteniendo el resto en valores dados/constantes (ceteris paribus)

E [ Y | X2t , ..., Xkt ]



j
Xjt X2t =x2 ,...,Xj 1,t =xj 1 ,Xj +1,t =xj +1 ,...,X kt =xk

Por tanto, el coeciente de un modelo de regresin (correctamente


especicado) ofrece el efecto causal directo de Xjt sobre Yt
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Modelos no lineales
El modelo de regresin lineal puede estimarse por MCO siempre que
la especicacin sea lineal en los parmetros

(no necesariamente lineal en las variables del modelo)

Es decir, se pueden incluir como variable dependiente y como


variables explicativas transformaciones no lineales de las variables
originales
ln Yt = 1 + 2 X2t + 3 ln X3 + ut

3
1
Y t = 1 + 2 X2t + 3 + ut
X3

2
1
Y t = 1 + 2 X2t + 3 X2t + 4 + 5 X3t + ut
X2 t

El estimador de MCO de estos modelos tiene las buenas


propiedades que ya hemos discutido

PERO debemos tener cuidado al interpretar los coecientes y los


efectos marginales
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Modelos no lineales: efectos marginales


Seguimos interesados en los efectos marginales: ofrecen el efecto
causal

PERO el efecto marginal de inters de la variable Xj NO coincide


necesariamente con un nico coeciente j
En modelos con variables transformadas en logaritmos, los efectos
marginales se interpretan como (semi-)elasticidades
1 ln Yt = 1 + 2 ln X + ut
ln Y Y /Y %Y
2 = = elasticidad
ln X X /X %X
2 ln Yt = 1 + 2 X + ut
ln Y Y /Y %Y
2 =
X X X
3 Y t = 1 + 2 ln X + ut
Y Y Y
2 =
ln X X /X %X
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

En el modelo,
1
Y t = 1 + 2 + 3 X3t + ut
X2 t
cul es el efecto marginal (causal) de X2 sobre Y ?

1
E [ Yt | X2t , X3t ] = 2
X2t X
2
2 t

Se pueden extraer varias conclusiones de este ejemplo (vlidas en


general)
1 el efecto marginal NO coincide con un coeciente del modelo (en
este caso,2 )
2 el efecto marginal NO es constante

depende, en este caso, de X2t

individuos con distinto valor de X2 t tendrn distinto cambio esperado


en Y t ante un mismo cambio (innitesimal) en X2 t
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Frecuentemente, se utilizan modelos lineales con polinomios e


interacciones de las variables explicativas
1
Y t = 1 + 2 X2t + 3 X22t + 4 X23t + 5 X3t + ut

E [ Yt | X2t , X3t ] = 2 + 23 X2t + 34 X22t
X2t
Depende de varios parmetros
Depende del valor de X2t
2
Y t = 1 + 2 X2t + 3 X2t X3t + 4 X3t + ut

E [ Yt | X2t , X3t ] = 2 + 3 X3t
X2t
Depende de varios parmetros
Depende del valor de otra variable: X3 t

3
Y t = 1 + 2 X2t + 3 X22t + 4 X2t X3t + 5 X22t X3t + 6 X3t + ut

E [ Yt | X2t , X3t ] = 2 + 23 X2t + 4 X3t + 25 X2t X3t
X2t
Depende de varios parmetros
Depende del valor de X2t y de X3t

4 Existen muchas otras combinaciones posibles


Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Sesgo de variable omitidas


Una especicacin incorrecta del modelo implica que los efectos
marginales NO son interpretables como efectos causales
el efecto marginal de X es manteniendo constante el resto de
j

variables incluidas en el modelo


por tanto, no se tienen en cuenta las variables (relevantes) omitidas

Ejemplo:

Y t = 0 + 1 X1t + 2 X2t + ut
Slo nos interesa el efecto de X1 (se estima un modelo reducido):

Y t = 0 + 1 X1t + t
Si 1 = 1 , este modelo reducido s proporciona el verdadero efecto
causal de inters de X1 sobre Y
Se puede mostrar fcilmente que

Cov (X1 , X2 )
1 = 1 + 2
Var (X1 )
En general, omitir una variable sesga el coeciente: no coincide con
el efecto causal
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Cov (X1 , X2 )
1 = 1 + 2
Var ( X1 )

Sin embargo, omitir la variable X2 no sesga el efecto causal de X1 si

1 realmente X2 no afecta a Y : no es relevante porque 2 = 0


2 se tiene que Cov (X1 , X2 ) = 0.

El argumento (no la formula concreta) se puede generalizar al caso


de mltiples variables

si las variables omitidas (relevantes) no estn correlacionadas con las


variables explicativas incluidas en la regresin, los coecientes
estimados para stas no estarn sesgados.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

Prediccin: R 2

Puesto que el modelo de regresin establece que

E [ Y | X2 , . . . , X
t t kt ] = 1 + 2 X2t + + k Xkt
Se puede predecir el valor esperado de la variable dependiente (en funcin
de las variables explicativas):

Yb t = b 2 X2t + +
b1 + b k Xkt

El valor observado de Y t se descompone en una parte predicha por el


modelo y un residuo
Y t =Y
bt + et
Se puede demostrar que la varianza de los datos observados tambin se
puede descomponer en dos partes:

Var
d (Y ) Var
d Y + Var
d (et )
 
t = b t

X
T  2 X
T  2 X
T

Y t Y = Yb t Y + e2
t
t= 1 t= 1 1
t=

SCT = SCE + SCR


Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Efectos Marginales

SCT = SCE + SCR


2
Se dene el R como

2
SCE SCR
R = =1
SCT SCT

mide la proporcin de la variabilidad de Y t explicada por el modelo:


0 6 R2 6 1
cuanto ms prxima a 1, mayor es la capacidad predictiva del modelo
(menores residuos=parte no explicada)

Si usamos el modelo de regresin para predecir, NO estamos


interesados en saber si los coecientes tienen interpretacin causal o
no

en el ejemplo anterior, podemos predecir Y t slo con X1t igual de


bien que con X1 y X2 t t

nos da igual si Y es aumenta con X1


t t directamente o indirectamente
a travs de X2 t

2
Un mayor valor de R indica mejor capacidad predictiva, pero NO
nos informa sobre la interpretacin causal de los coecientes del
modelo.
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Modelo con Regresores Binarios

Regresores Binarios
El modelo de regresin admite datos cuantitativos o cualitativos
Una variable binaria (o dummy) es una forma de transformar
variables cualitativos en cuantitativos

1, si el individuo es mujer
D t=
0, si el individuo es hombre

La interpretacin de los efectos marginales de un regresor binario son


un caso particular de lo que hemos visto para variables discretas:

Yt = 1 + 2 X2t + .. + 2 Xk 1t + k Dkt + ut

k = E [ Y | X2t = x2 , , . . . , Xk 1,t = xk 1 , Dkt = 1]


E [ Y | X2t = x2 , , . . . , Xk 1,t = xk 1 , Dkt = 0]

Por tanto, k es el aumento esperado en el valor de Yt por


pertenecer al grupo Dkt =1 frente al grupo Dkt = 0, ceteris paribus

el valor esperado de Y t para el grupo con D kt =1 menos su valor


esperado para el grupo con D kt =0
Datos Econmicos Anlisis Bsico de los Datos Relacin entre Variables Modelo de Regresin Lineal
Modelo con Regresores Binarios

El uso de variables binarios permite que cada grupo tenga un valor


esperado diferente (dado un mismo valor del resto de variables)
En un caso simple,
Y t = 1 + 2 Dt + ut
Se tiene que
E [Y |D
t t = 1] = 1 + 2
E [Y |D
t t = 0] = 1

Tambin se puede interactuar una variable binaria con otra variable del
modelo; por ejemplo,

t = 1 + 2 X2t + 3 X2t Dt + 4 X3t + ut


Y

En este caso, el efecto marginal de X2t depende de Dt


E [ Yt | X2t , Dt , X3t ] = 2 + 3 Dt
X2t

Esto implica que el efecto marginal de X2t es diferente para el grupo


D kt = 1 y para el grupo Dkt =0
X

2t
E [ Y | X2 , D
t t t = 1, X3t ] = 2 + 3

2t
X
E [ Y | X2 , D
t t t = 0, X3t ] = 2

S-ar putea să vă placă și