Documente Academic
Documente Profesional
Documente Cultură
Captulo1:Introduccin
Captulo 1
Introduccin
Etimolgicamente, coomra significa medicin de la economa. Existen muchas definiciones para QusonlosestimadoresporMCOy esta disciplina cientfica que van culessonsuspropiedades? desde las ms complejas, como el anlisis cuantitativo de fenmenos QusonlosestimadoresporMVy econmicos reales, basados en el culessonsuspropiedades? desarrollo simultneo de la teora y la observacin, relacionados mediante Culessonloscriteriospara mtodos apropiados de inferencia1 discriminarentremodelos? hasta otras ms simplificadoras comoladeterminacinempricadelas Principalesformasfuncionalesysu leyes econmicas2. Como disciplina interpretacin terica,ensuelaboracinseunenlas Matemticas, la Estadstica y la TeoraEconmica;comodisciplinaempricasecentraenlainvestigacinsocial. En este capitulo se realiza una breve resea de los aspectos ms importantesdelprocesodeestimacindelosmodeloslineales. Para un anlisis en profundidad de estos temas, se debe acudir a la bibliografarecomendada.
Quesunmodeloeconomtrico?
Quesunmodeloeconomtrico?
Los MODELOSECONMICOSrelacionanunavariabledependienteconotras independientesoexplicativas.Suponeunarelacinexactaydeterministaentre lasvariables.
y = f (x 1 , x 2 , x 3 , ... , x k ) Sin embargo, a nivel emprico las relaciones no son deterministas. De hecho,siseespecificaunarelacinatravsdeunafuncinmatemticaparauna
P.A. Samuelson, T.C. Koopmans y J.R.N. Stone, Report of the Evaluative Committee for Econometrica,Econometrica,vol.22,nm.2,abrilde1954,pp.141146. 2H.Theil,PrinciplesofEconometrics,JohnWiley&Sons,NuevaYork,1964,p.1.
1
muestra determinada con total seguridad habra ms de una observacin que nocoincidiraconlafuncinpreestablecida. Para considerar las relaciones inexactas entre las variables del mundo econmico surgen los MODELOS ECONOMTRICOS. stos, adems de relacionar una variable dependiente con otras independientes o explicativas (relacin de comportamiento), introducen una componente aleatoria o trmino de error. sta tiene un comportamiento estocstico y representa factores determinantes del comportamiento de la variable endgena que los modelos no pueden recoger de forma explcita. As, el comportamiento de la variable (y) viene explicado por un modelo o relacin en la que se puede distinguir una parte determinista(integradaporlasvariablesexplicativas)yunapartealeatoria.
y = f (x 1 , x 2 , x 3 , ... , x k , u)
Un sencillo ejemplo para una mejor distincin consiste en suponer una relacinlinealentreuna variabledependientey y la independientex. He aqu losmodelos: Modelomatemtico Modeloeconomtrico
y = +x
y = +x + u
Qusonlosestimadorespormnimoscuadradosordinarios(MCO) yculessonsuspropiedades?
El modelo de regresin lineal simple es el ms sencillo e incluye nicamenteunavariableindependiente:
y i = 1 + 2 x i + u i
En general, el problema que se plantea es la bsqueda del valor de los parmetrosdelarectaquemejorseajustaalanubedepuntosqueformacada pardeobservaciones(yi,xi).Paraelloseminimizaladistanciaentrelarecta y y todos los puntos observados yi , es decir se minimizan la suma de errores al cuadradoparaquelossignos(+)ylos()nosecompensen:
min e i
= (y i 1 2 x i ) 2 =
(y i yi ) 2
ei2 1
= 0 y i = N 1 + 2 x i
(1)
ei2 2
2 = 0 x i y i = 1 x i + 2 x i
(2)
Despejandode(1)seobtiene: = y - x
1 2
ysustituyendo(1)en(2)seobtieneque;
2 =
x y yx x xx
i i 2 i i
(x x)(y y) ( x x)
i i 2 i
Asimismo,elestimadordelavarianzadelasperturbacionesdelmodeloes: ei2 2 = N 1 Elmodeloderegresinlinealmltipleeslageneralizacindelmodelode regresin lineal simple, para el caso de que el modelo tenga k1 variables exgenas. Su resolucin tambin pasa por un problema de minimizacin de residuos para hallar el vector de estimadores a partir del sistema de k ecuacionesnormales.
coomra Becarios: Fernando Pascual, Carlos Salvador, Joan Crespo 4
FORMAEXTENDIDA
FORMAMATRICIAL
y i = 1 + 2 x 2i + ... + k x ki + u i
min e i 2 = (y i y i ) 2
Nx1
Y = X + u
Nxk kXN Nx1
Sistemadeecuacionesnormales; y =N + x
min
1XN Nx1
e e = (Y - X)(Y - X)
y i = 1 x i + 2 x i2
N N x 2 i i =1 . . N x ki i =1
x 2i x
i =1 i =1 N
2 2i
x
i =1
ki
x 2i
ki
1 y x 2 y 2 . = x3 y . . k xk y
CUADRO 1: Hiptesis clsicas del modelo de regresin lineal A continuacin se exponen los supuestos bsicos (tambin conocidos como clsicos) que se asumen como punto de partida del modelo de regresin lineal. En principio, dicho modelo se supone bien especificado, es decir, la ecuacin es correcta y no falta ni sobra ninguna variable. Las hiptesis bsicas son: El valor esperado de la
PERTURBACIN ALEATORIA
es cero.
E (u i ) = 0
E (u) = 0
E (u i ) 2 = 2 u
E(uu ) = 2 u I
5
E (u i u j ) = 0, i j
El cumplimiento de los supuestos de No Autocorrelacin y de Homocedasticidad recibe el nombre de Esfericidad. En este caso se habla de perturbaciones esfricas. Las variables
X
son
FIJAS,
esto es,
NO ALEATORIAS
en el muestreo.
E (x i u i ) = 0
E (x'u) = 0
(x' x) = k
stas son las hiptesis bsicas sobre las que descansa el modelo de regresin lineal clsico. A lo largo del curso se va a ir viendo que son excesivamente rigurosas y en la mayora de ocasiones dejan de cumplirse.
Siseestablecenunashiptesisdecomportamientoenelmodelocomolas expuestas en el cuadro anterior, los Estimadores obtenidos por Mnimos Cuadrados Ordinarios (MCO) presentan las siguientes PROPIEDADES PROBABILSTICAS3:
LINEALESENY
MCO = (X ' X ) 1 X ' Y =f (Y)
INSESGADEZ
) [
] [
= + (XX)-1 X E(u) =
=0
3
ParaundesarrollomscompletepuedeacudirseaURIEL,E.etal.(1990) 6
E ( MCO ) =
Los estimadores por MCO son insesgados bajo el supuesto de que las x son fijas.
OPTIMALIDADYEFICIENCIA
) [ )
= 2 u E (XX)-1
] [ (XX) (XX) ] =
-1
(XX)-1
V MCO = 2 u (XX)-1
Puede demostrarse, a travs del Teorema de GaussMarkov, que el resultadoobtenidoesdevarianzamnima. LosestimadoresporMCOsonlinealesinsesgadosyptimosbajolossupuestos dehomocedasticidadynoautocorrelacin( E (u i u j ) = 2 I ).
QusonlosestimadoresporMximaVerosimilitud(MV)ycules sonsuspropiedades?
Seplanteaunnuevosupuestoadicionalalashiptesisbsicasplanteadas anteriormente: La perturbacin aleatoria sigue una distribucin Normal de acuerdoconestaestructura: u i N(0, 2 u )
Las perturbaciones aleatorias que as se distribuyen se conocen como ruido blanco. Bajo este supuesto se podran obtener un nuevo tipo de estimadores: los de Mxima Verosimilitud. Para ello, bastara con resolver un problema de maximizacin de la funcin de probabilidad o verosimilitud. Se realizar esta demostracinparaelmodeloderegresinsimple.
Laideaquesubyaceesladeencontraraquellosvaloresdelosparmetros que hacen mxima la probabilidad de que la muestra disponible proceda de unapoblacincaracterizadapordichosparmetros. La FUNCIN DE PROBABILIDAD CONJUNTA puede descomponerse en el productorio de las individuales, dado que las perturbaciones aleatorias son independientesunasdeotras(supuestodenoautocorrelacin):
P (u 1 , u 2 , u 3 ,..., u N ) = P (u 1 ) P (u 2 ) P (u 3 ) ... P (u N )
us independientes
P (u i ) =
1 2
2
1 2 2u
u2
1 2 2u
ui2
Laperturbacinaleatoriaenelmodeloderegresinsimplepuedeponerse enfuncindelasvariablesyiyxi:
u i = y i - (1 + 2 x i )
L = P (u/X, ) =
1 (2 2 ) N/2
1 2 2u
(yi 1 2 x i ) 2
Paraelloesprecisorealizarantesunatransformacin:linealizarlafuncin deverosimilitud.Bastacontomarlogaritmos:
l = ln L =
N N 1 ln 2 ln 2 (y i 1 2 x i ) 2 u 2 2 2 2 u
8
Para resolver cualquier problema de maximizacin, se obtienen las CONDICIONES DE PRIMER ORDEN, derivando la funcin respecto de las variables decontroleigualandoa0. Enestecaso,lasvariablesdecontroldelproblemademaximizacin,son losparmetrosparalosquesebuscamaximizarlafuncin; 1 , 2 y 2 . ln L 2 % % =+ (yi 1 2 x i ) = 0 yi = N 1 + 2 x i 1 2 2u
~ 1 MV = 1 MCO
x y
i
% % = 1 x i + 2 x i 2
ln L N 1 = ( (yi 1 2 x i ) 2 ) + ( 2 u ) 2 = 0 2 2 u 2 u 2
~ 2 u MV = ee 2 u MCO = ee N Nk
varianza
cuasivarianza
As, se puede comprobar que los estimadores MCO por MCO son lineales,
insesgadosyptimosbajolashiptesisbsicasestablecidas:
E (u) = 0
E (u i u j ) = 2 I
Sonconsistentes
~ lim prob MV
N
cualquierotroestimadorconsistente.
Los estimadores obtenidos por el mtodo de Mxima Verosimilitud siguen unadistribucinasintticamenteNormal,sonconsistentesyasintticamente eficientes.
Deaqusededucelaimportanciadelsupuestodequelapertubacinaleatria tengaunadistribucinnormal,yaqueelloconduceaquelosestimadorespor MCO tengan tambin las mismas propiedades que los estimadores de MV. Igualmente este supuesto permite establecer una funcin de distribucin para los estimadores por MCO y con ello determinar intervalos de confianza y realizarcontrastesdehiptesis. Este supuesto de normalidad de las pertubaciones aletorias hay que contrastarlo. Para ello se utiliza el test de JarqueBera, aplicado sobre los residuosdelmodeloestimadoporMCO.
EJEMPLO 1: Test de Jarque-Bera o de Normalidad de los residuos El Test de Jarque-Bera se formula bajo la hiptesis nula de Normalidad de los residuos. Se construye de la siguiente manera:
s 2 (k 3) 2 2 JB = N + 2 6 24
donde N es el tamao muestral, s el coeficiente de asimetra y k la kurtosis o apuntamiento. Bajo la H0 de normalidad, el estadstico JB se distribuye como una 2 de dos grados de libertad. Si el valor obtenido del estadstico de Jarque-Bera es menor que el valor crtico tabulado, no se rechaza la hiptesis nula de normalidad. En caso contrario se rechaza la normalidad de la variable.
10
Asimismo, pese a que la estimacin por MV resulte muy recomendable, debe someterse a pruebas de validacin. Para ello se realizan diversos CONTRASTESsobrelosparmetrosysobreelmodeloens,quediferirnen cierta medida de los que se aplicaban habitualmente tras la estimacin por MCO.
Encuantoalainferencia,loscontrastesde SIGNIFICATIVIDADINDIVIDUAL de las variables explicativas se pueden realizar a partir de la distribucin Normal (0,1), en muestras muy grandes . Ahora bien, en el caso de que se cumpla el supuesto de normalidad asinttica y /o se conozca la varianza del estimadoresposiblecalcularelsiguienteestadstico:
Estos contrastes se emplean para analizar si una variable, por s misma, explica parte del comportamiento de la variable endgena. De este modo, las hiptesisdeestecontrastebilateralodedoscolassonlassiguientes:
H0:i=0
H1:i0
NoRechazarH0lavariablenoessignificativa. RechazarH0lavariableessignificativa.
El anlisis de la SIGNIFICATIVIDAD GLOBAL permite contrastar si todo el modelo en su conjunto es significativo para explicar el comportamiento de la variable endgena. Generalmente se considera la inclusin de todas las variables explicativas simultneamente, comprendiendo todos los parmetros salvolaconstanteotrminoindependiente.Lahiptesisacontrastar,portanto, serlasiguiente:
H0:2=3==k=0
H1:Algni0
ParaanalizarlasignificatividadglobaldeunmodeloestimadoporMCO sepodaacudiraladistribucinFdeSnedecor.Enlamayoradeocasioneslos
coomra Becarios: Fernando Pascual, Carlos Salvador, Joan Crespo 11
valores generados eran muy elevados, existiendo una tendencia irrevocable haciaelrechazodelahiptesisnulao,loqueeslomismo,laaceptacindela significatividad de los modelos estimados. Por ello, para el contraste de la significatividad conjunta de los modelos estimados por MV se realiza un test genrico:elTESTDELARAZNDEVEROSIMILITUDque parte de la expresin: L = R Ratioorazndeverosimilitud LG
donde L R se corresponde con la funcin de verosimilitud del modelo restringido y L G con la funcin de verosimilitud del modelo general o sin restringir.Enestecasosedistinguen2modelos:elgeneralyelrestringido.El primerodeelloseselmodeloqueseestsometiendoaanlisis;elsegundoes aquelenelqueseintroducelarestriccin,estoes,enelquesehaceefectivala hiptesisnula.
Modelocompletoogeneralelmodelosinlarestriccin.
y i = 1 + 2 x 2i + 3 x 3i + ... + k x ki + u i seraelmodelogeneral.
Modelorestringidoelmodeloendondesecumplelahiptesisnula
enunciadaanteriormente.
SiH0escierta y i = 1 seraelmodelorestringido.
Apartirdelarazndeverosimilitudsedefineelestadsticosiguiente:
RV = -2 log = -2 (log LR - log LG ) 2 restricciones en la Ho
quepermitecontrastarlasrestriccionesdelahiptesisnulademaneraque: SiH0ciertaelmodelonoessignificativoensuconjunto. SiH0noesciertaelmodeloessignificativoensuconjunto. Eltestderazndeverosimilitudtieneotrasutilidadesynoesnicamente vlido para contrastar la significatividad conjunta del modelo. Siempre va a poderemplearseelvalordelafuncindeverosimilituddelmodelorestringido y del modelo general para contrastar cualquier otra hiptesis sobre los parmetrosqueseconsidererelevante.
coomra Becarios: Fernando Pascual, Carlos Salvador, Joan Crespo 12
EJEMPLO 2: Test de omisin de variables o de errores de especificacin (Test reset de Ramsey) Este ejemplo pone de manifiesto uno de los mltiples usos del test de razn de verosimilitud. Suponer que se parte de un modelo de regresin lineal simple muy sencillo bajo la siguiente especificacin:
y i = 1 + 2 x 2i + u i
Para analizar si el modelo est bien especificado, una vez realizada la estimacin, se realizan los siguientes pasos 1. Estimar el modelo original tal cual estaba previsto:
y i = 1 + 2 x 2i + u i
(1)
2. Obtener la variable y i :
y i = 1 + 2 x 2i
3. Incluir la variable y i en el modelo original (debe incluirse al cuadrado) como regresor adicional:
2 y i = 1 + 2 x 2i + 3 y i + ui
(2)
4. Estimar el nuevo modelo (2) y contrastar la significatividad individual de la nueva variable incluida. 4.a Habitualmente, se recurre al estadstico t de Student: H0: 3 = 0 H1: 3 0 t N-K
Lgicamente, el hecho de que la inclusin de la nueva variable no fuera significativa implicara una correcta especificacin inicial del modelo. si 3 = 0 el modelo es correcto, es decir, est bien especificado. si 3 0 el modelo est mal especificado. En este caso, las predicciones explicaran mejor el modelo que el modelo en s. 4.b Sin embargo, este contraste tambin se puede realizar a travs de la razn de verosimilitud. La hiptesis a contrastar ser tambin 3 = 0. El modelo (2) ser el modelo general; a partir de su estimacin podr obtenerse el ln L G . El modelo (1), que incorpora la hiptesis nula de 3 = 0, ser el modelo restringido; a partir de su estimacin podr obtenerse el ln L R .
2 RV = -2 (log LR - log LG ) 1
Las conclusiones son exactamente idnticas a las anteriores. Si la inclusin de la variable no es significativa quiere decir que el modelo estaba correctamente especificado en su origen. Este test detecta fallos en la forma funcional y omisin de variables.
13
Culessonloscriteriosparadiscriminarentremodelos?
La eleccin de un modelo entre varios que presenten la misma variable endgenasepuederealizaratravsdedistintosestadsticosy/ocriteriosquese presentanacontinuacin: Criterio R 2 o bien R 2 : Se escoger aquel con mayor valor del indicador, queesunestadsticodecarcterdescriptivo. ConloscriteriosdeValordelaFuncindeVerosimilitudydelLogaritmo de la Funcin de Verosimilitud: Se escoger el modelo que presenta mayor valor de ambos estadsticos, siendo habitual su utilizacin en el caso de muestrasmuy grandes, y tambin en el caso de modelos con distinta variable dependiente. Tambinparamuestrasgrandes,loscriteriosdeinformacindeAkaikey Schwartz tendrn un valor menor para aquel modelo que presente un mejor ajuste. ElcriteriodeinformacindeAkaike(AIC)sedefinecomo; 2 2k AIC = ln L + T T Siendo mejor el modelo que menor AIC presente, una vez realizadas las correlaciones pertinentes para tener en cuenta las posibles diferencias en la variables dependiente de los modelos. Sin embargo, se elegir como mejor modelo el que presente mayor lnL (de nuevo realizando las correcciones pertinentesantediferenciasenlamedidadelavariabledependiente). ElcriteriodeSchwartzseutilizatambinparacompararmodeloscomoel AIC,peroademsestecriteriopenalizaeltamaomuestral. 2 k ln T Schwartz = ln L + T T AligualqueenelcasodelAIC,seelegiraquelmodeloconmenorcriterio deSchwartz. Los criterios antes descritos permitirn la eleccin de la forma funcional quemejorseadaptealaestructuradelosdatos,entrelasdiferentespropuestas para el modelo. Cuando se pretende discriminar entre un modelo con la variableendgenaenniveles,yi,yotroquepresentacomovariabledependiente ellogaritmoneperianodedichavariable,lnyi,elcriterioautilizareselcriterio
14
AIC C = AIC L + 2 ln Y
siendoAICLelcriterioAICdelmodeloconlnyicomovariabledependiente
Principalesformasfuncionalesysuinterpretacin
A menudo una mera lnea recta (modelo lineal) no es la especificacin funcional ms adecuada para ajustar la nube de puntos de las observaciones muestrales.Enocasionesresultamejoremplearformasfuncionalesalternativas. Estaesunadelasrazonesporlasquesurgelanecesidaddecompararmodelos yelegiraquelqueimpliqueunmejorajuste. Enelsiguientecuadroserecogenlasespecificaciones,formasfuncionales o modelos ms habituales, lineales o bien linealizados que se pueden estimar porMCOyMV.Parafacilitarlainterpretacindeloscoeficientesestimadosen cadaunodelosmodelossedetallanlapropensinmarginalylaelasticidadde lavariabledependienteantevariacionesdeX. Cuadro:Formasfuncionales
Modelo
Elasticidad
LINEAL
yi = + x i + u i
x y
INVERSO
1 yi = + + ui xi
1 x2
1 xy
SEMILOGARTMICO
y i = + ln x i + u i
1 x
1 y x -
DOBLEMENTE LOGARTMICO
ln y i = + ln x i + u i
y x y y - 2 x
LOGARTMICOLINEAL
ln y i = + x i + u i
LOGARTMICO INVERSO
ln y i = +
1 + ui xi
1 x
15
Modelooriginal
Modelolinealizado
DOBLEMENTELOGARTMICO
yi = e
x i
e ln y i = + ln x i + u i
ui
LOGARTMICOLINEAL
y i = e +x i + u i
ln y i = + x i + u i
Conclusiones
Frente a los modelos matemticos, los modelos economtricos se caracterizanporincluiruntrminodeperturbacinodeerror,decarcter estocsticooaleatorio.
LosestimadoresdelosparmetrosdeunmodelolinealporMCO,bajo las hiptesis bsicas de homocedasticidad y no autocorrelacin de las perturbaciones aleatorias y de variables explicativas fijas en el muestreo, sonlinealesenlosparmetros,insesgadosyptimos(ELIO).
Existennumerososestadsticosycriteriosparaescogerunmodeloentre varias especificaciones. Cuando presentan la misma variable endgena, son el coeficiente de determinacin ajustado y el criterio de informacin de Akaike, estadsticos que hay que maximizar y minimizar
16
respectivamente.Todosellospermitenelegirlaformafuncionalquemejor expliqueelcomportamientodelavariabledependientedelmodelo. Cuando se quiere comparar un modelo que presenta la variable endgenaennivelesfrenteaotroconellogaritmoneperianodeesamisma variable como variable dependiente, se debe utilizar el AIC de Akaike corregidoparadiscriminarentreambasespecificaciones.
17
Lecturaspropuestas
Alseruncaptulointroductorio,acontinuacinseexponenlosmanuales que mejor se adaptan a la estructura del curso. En cualquier caso, en cada captulosecitarnlosmsapropiadosparalamateriaqueseesttratando. CABRERB.,SANCHO,A:,SERRANOG:(2001):Microeconometriaydecisin.Ed. Pirmide. GREENE,W.(2001),Econometra,Madrid,PrenticeHall,,3ed. GUJARATI,D.N.,(2003):Econometra,Madrid,McGrawHill,,4ed. JOHNSTON,J.yDINARDO,J.(2001): Mtodosdeeconometra,Barcelona,Vicens Vives, NOVALES,A.,(1993):Econometra,McGrawHill,,2ed. URIEL,E.etal.,(1990).Econometra,Madrid,EdAC.
18