Problemas Econometricos Con Stata

PROBLEMAS ECONOMTRICOS CON STATA
Carlos Giovanni Gonzlez Espitia

E-mail: cggonzalez@icesi.edu.co
Departamento de Economa
Universidad Icesi
Resumen
El objetivo de este documento es introducir al lector en los problemas economtricos
del modelo de regresin lineal, y realizando su aplicacin en el programa economtrico
Stata.
Palabras Clave: Econometra, software economtrico, Stata

Clasificacin JEL: C01, C87.
Stata es una marca registrada de StataCorporation. Copyright 19962010 StataCorp LP, 4905 Lakeway
Drive, College Station, TX 77845 USA.Las opiniones contenidas en este documento, los errores u
omisiones son de exclusiva responsabilidad del autor.
1 Introduccin
En econometra, a la hora de realizar la estimacin de un determinado modelo terico,
pueden surgir diferentes tipos de problemas, muchos de los cuales no se pueden
evadir. A la hora de la especificacin del modelo, es posible que el econometrista se
encuentre con dos variables que le proporcionan la misma informacin, o con
variables incluidas adicionales que sobran dentro del modelo o simplemente con
variables olvidadas pero que son necesarias dentro del modelo. A la hora de la
estimacin del modelo, se pueden presentar otro tipo de problemas, como son que las
observaciones no tengan varianzas constantes o que los errores estn correlacionados
entre s. Como estos, existen otros errores o problemas a los que se enfrenta el
econometrista y debe tener presente para realizar un buen desempeo.
Muchas veces existe la posibilidad de que estos sean corregidos, sin embargo, hay
ocasiones en las que simplemente se debe convivir con el problema, y es ah donde se
debe tener en cuenta para la interpretacin de los resultados.
Stata proporciona herramientas tiles y rpidas para la realizacin de grficos cuando
se sospecha la presencia de un problema, y pruebas especficas que determinan con
una mayor certeza si el problema existe dentro del modelo o en los datos, facilitando
las decisiones del econometrista a la hora de la identificacin del mismo.
2 Multicolinealidad
El problema de multicolinealidad surge en la estimacin economtrica en el momento
en que se viola el supuesto segn el cual las variables X 1 , X 2 ,..., X k son linealmente
independientes entre s. Existen cuatro grados de multicolinealidad: moderada, alta,
muy alta y perfecta.
2.1 Multicolinealidad perfecta
La multicolinealidad perfecta se da cuando una variable explicativa es linealmente
dependiente de otra, cosa que provoca que las columnas de la matriz X no sean
independientes entre s y por tanto: no hay rango columna completo, X T X no tiene
rango completo, det( X T X ) = 0 , X T X es una matriz singular, los estimadores son
incalculables.
En el caso de que sea multicolinealidad perfecta, es necesario revisar el modelo y
chequear su definicin y las variables involucradas en el mismo, pues de otra forma no
es posible que sea corregido. El modelo no podr ser estimado pues ni Stata ni ningn
otro programa de regresin lo estimar en presencia de este problema. La solucin
entonces es sencilla, pero implica la realizacin de una nueva especificacin del
modelo.
2.2 Multicolinealidad no perfecta
Los sntomas para la deteccin de multicolinealidad no perfecta en el modelo son:
Estadsticos t bajos, F global y R2 altos: poca significatividad individual de las

variables X , gran probabilidad de rechazo de la significancia conjunta y R2 alto.
Sensibilidad de los ' s a cambios pequeos en el nmero de observaciones n :

si ante cambios pequeos en la muestra, los betas estimados varan en gran
proporcin.
Sensibilidad de los ' s a la inclusin o exclusin de regresores en el modelo: si

frente a incluir una nueva variable o excluir una ya incluida, los betas
estimados varan en gran proporcin.
Una vez identificados estos sntomas en la estimacin del modelo, es importante tener
en cuenta que puede haber multicolinealidad de algn grado, y que, por tanto se debe
corregir pues de lo contrario se estara haciendo inferencia sobre estimadores
sesgados e inconsistentes.
3 Heteroscedasticidad
Los datos de corte transversal suponen un muestreo aleatorio de la poblacin
subyacente. La varianza no constante en los trminos de error es un problema comn
en la econometra. Se conoce como heterocedasticidad y se presenta precisamente
cuando se viola el supuesto segn el cual la matriz de varianzas y covarianzas del
residuo es constante. En efecto, el supuesto implicara que para todo i,
tiene
varianza constante denominada 2 . El problema bsicamente est en que en

presencia de heteroscedasticidad, la varianza de los errores ahora depende de la
observacin a la que pertenece, y por tanto dicha varianza ahora est relacionada con
el subndice que muestra la observacin en la muestra: i=1,2n.
Los supuestos sobre el trmino de error son los siguientes:
0,
, ; 0
El intercepto y los dems coeficientes sern estimados consistentemente as la
muestra presenten problemas de heteroscedasticidad. La presencia de este problema
economtrico implica que los estimadores obtenidos por el mtodo de MCO
aunque sern insesgados, no tendrn la mnima varianza posible. El anlisis respectivo
debe hacerse por mtodos grficos, corroborando la presencia del problema
mediante pruebas especficas. La prueba no-formal, que es la grfica, se hace
graficando los residuos o la variable dependiente en funcin de cada una de las
independientes.
Se puede observar por ejemplo el de manera grfica. Stata permite hacer esto en
varios pasos:
.regress vardep var1 var2 var3
.predict ehat, residual

.twoway (scatter ehat var3)
Con estos comandos, lo que se est haciendo es estimando el modelo lineal de
manera tradicional. Despus se realiza la prediccin de los residuos llamndolos ehat
y ms adelante se realiza el grfico.
Una vez hecho esto, se debe graficar los residuos en funcin de la variable
dependiente:
.twoway (scatter ehat vardep)
En el caso del e la ecuacin minceriana de salarios del ejemplo de Wooldridge (2006),
los comandos para la realizacin de estos grficos seran los siguientes:
.regress lwage educ exper expersq
.twoway (scatter ehat exper)
.twoway (scatter ehat educ)
El usuario de Stata observar los grficos siguientes:
Grfico 2. Residuos vs aos de
educacin
-2
-2
-1
-1
Residuals
0
Residuals
0
Grfico 1. Residuos vs aos de

experiencia
10
20
30
years potential experience
40
50
10
years of education
15
Estos dos grficos muestran la relacin entre los residuos y cada una de las variables
independientes. Es importante hacerlo con cada una para, de manera visual, intentar
tener una idea de la variable que estara generando la presencia de
heteroscedasticidad. Es importante mencionar que las pruebas grficas no evidencian
completamente el problema, simplemente proporcionan una mayor sospecha.
Una vez realizados esto, no se debe olvidar observar tambin el grfico de los errores
en funcin de la variable dependiente. Este se obtiene as:
.twoway (scatter ehat lwage)
20
-2
-1
Residuals
0
Grfico 3. Residuos vs logaritmo del salario
-1
1
log(wage)
Lo que se observa en el grfico 3 es que aparentemente hay mayores variaciones (que

se miden por la distancia vertical en el grfico) para los salarios ms altos que para
aquellos ms bajos.
Grficos como estos dan indicios sobre la variable que presenta mayor
heteroscedasticidad, y esta es aquella cuyo grfico se separa ms de la aleatoriedad.
Las pruebas grficas sern insuficientes en la medida en que muestran la presencia de
heteroscedasticidad en una variable en particular, pero no la detectan si esta se
origina en la combinacin lineal de todas o algunas de las variables incluidas en el
modelo. Con este fin se realizan pruebas formales como la prueba Goldfeld Quandt,
Breush Pagan o White (Prez, 2006).
a) La Prueba Goldfeld Quandt
Este test es una prueba eficaz cuando se sospecha la presencia de heteroscedasticidad
en una variable especfica. Es una prueba complementaria al anlisis grfico que
permite determinar claramente si el problema existe o no en los datos con los que se
est trabajando.
Las hiptesis con las que trabaja esta prueba son:
:
:
Una vez se detecta la variable culpable de heteroscedasticidad Xj, se deben ordenar las
observaciones de tal manera que se pueda a continuacin eliminar las c observaciones
centrales de modo que representen 1/3 del total. Se realizan entonces dos regresiones
con las observaciones de los extremos, considerando un estadstico F tal que:

1
2
Donde SCE1 representa la suma de cuadrados del error de la primera regresin que se
realiz con las observaciones de valores bajos, y SSE2 la suma de cuadrados del error
de la segunda regresin realizada con los valores altos. Este estadstico tiene (n-c-2k)/2
grados de libertad.
En Stata, los comandos para la realizacin de este proceso son hacer la regresin para
las primeras 351 observaciones y guardando la varianza y los grados de libertad:
.regress lwage educ exper expersq in 1/175
.scalar s_small = e(rmse)^2
.scalar df_small = e(dr_r)
Ahora, se realiza la segunda regresin para los ltimos 175 valores guardando
igualmente la varianza y los grados de libertad:
.regress lwage educ exper expersq in 375/526
.scalar s_large = e(rmse)^2
.scalar df_large= e(dr_r)
Una vez hecho esto, se halla el estadstico Goldfeld Quandt y su valor p asociado:
.scalar GQ = s_large/s_small
.scalar crit = invFtail(df_large,df_small,.05)
.scalar pvalue =Ftail(df_large,df_small,G
.scalar list GQ pvalue crit
Los resultados obtenidos en la ventana de Stata son los siguientes:
. scalar list GQ pvalue crit
GQ =
.8194388
pvalue =
.
crit =
.
As es posible realizar la prueba de hiptesis y verificar si existe o no

heteroscedasticidad de tipo Golfeld Quandt.
b) La Prueba Breush Pagan

Las hiptesis nula y alternativa de esta prueba son:
:
:
! !
La hiptesis nula se refiere a una homoscedasticidad en los datos mientras que la

alternativa se refiere a que los datos son heteroscedsticos de una forma tal que
depende de las variables ; " ! . La funcin h no est especificada, podra
entonces tratarse de una funcin lineal de las variables.
Como primera medida, para la realizacin de esta prueba se debe estimar el modelo
de manera tradicional y en seguida guardar los residuos. Una vez hecho esto, se deben
elevar al cuadrado los residuos y correr la regresin con los residuos al cuadrado. Por
ltimo, se debe computar NR2 de esta regresin y compararlo con un valor crtico de la
distribucin chi cuadrado a un nivel de significancia .
En Stata, los diferentes comandos para la realizacin de los pasos anteriormente

descritos son los siguientes:
.regress lwage educ
.gen ehat2= ehat*ehat
Ahora, para la realizacin del test:
.regress ehat2 educ
.scalar LM = e(N)*e(r2)
.scalar pvalue = chi2tail(1,LM)
.scalar list LM pvalue
El resultado que muestra Stata cuando se realiza la prueba de heteroscedasticidad de
Breush Pagan es:
. scalar list LM pvalue
LM = .74201753
pvalue = .38901536
Una vez obtenido el resultado, mediante el valor p o el test chi cuadrado se puede
rechazar (o no) a hiptesis nula y as concluir sobre la presencia del problema
economtrico.
c) La Prueba White
La prueba White es la prueba ms general comparada con las anteriores. Esta prueba
es parecida a la de Breush Pagan. En efecto, sus hiptesis son:
:
:
Si no se tiene idea alguna sobre la naturaleza de la heteroscedasticidad en lo datos, la
prueba White podra ser un buen comienzo. Los comandos que se deben usar en Stata
son:
.gen educ2 = educ^2
.regress ehat2 educ educ2
.scalar LM = e(N)*e(r2)
.scalar pvalue = chi2tail(2,LM)
.scalar list LM pvalue
Obteniendo como resultado lo siguiente:
. scalar list LM pvalue
LM = .85364976
pvalue = .65257782
Este resultado permite entonces realizar la prueba de hiptesis y as concluir sobre la

presencia de heteroscedasticidad.
Por otro lado, como ya lo sabemos, cuando se estima en Stata el modelo con el
comando .regress y se obtienen los resultados en presencia de heteroscedasticidad,
los coeficientes obtenidos sern insesgados pero las desviaciones estndar estarn mal
calculadas.
Para la correccin de este problema se utiliza el comando que da la opcin de hallar un
estimador robusto de varianzas y covarianzas denominado vce(robust) por sus siglas
en ingls: heteroscedasticity robust variance-covariance estimator.
. regress vardep indepvar1 indepvar2, vce(robust)
Una vez se introduce el comando, Stata arroja de nuevo una estimacin del modelo, en
la cual se obtienen los mismos valores para los coeficientes s que anteriormente
fueron estimados, pero con unos valores diferentes para las desviaciones estndar y
los valores de la prueba t student.
Para el ejemplo de la ecuacin de salarios minceriana, las dos tablas que se obtienen al
hacer las dos estimaciones con el fin de comparar los resultados se muestran a
continuacin:
.regress lwage educ exper expersq, vce(robust)
Tabla 1. Resultado de la estimacin del modelo

Source
SS
df
MS
Model
Residual
44.5393713
103.79038
3
522
14.8464571
.198832146
Total
148.329751
525
.28253286
lwage
Coef.
educ
exper
expersq
_cons
.0903658
.0410089
-.0007136
.1279975
Std. Err.
.007468
.0051965
.0001158
.1059323
t
12.10
7.89
-6.16
1.21
Number of obs
F( 3,
522)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.000
0.000
0.227
=
=
=
=
=
=
526
74.67
0.0000
0.3003
0.2963
.44591
[95% Conf. Interval]

.0756948
.0308002
-.000941
-.0801085
.1050368
.0512175
-.0004861
.3361035
Tabla 2. Resultado robusto de la estimacin del modelo

Linear regression
Number of obs
F( 3,
522)
Prob > F
R-squared
Root MSE
lwage
Coef.
educ
exper
expersq
_cons
.0903658
.0410089
-.0007136
.1279975
Robust
Std. Err.
.0077827
.0050237
.0001098
.1071261
t
11.61
8.16
-6.50
1.19
P>|t|
0.000
0.000
0.000
0.233
=
=
=
=
=
526
71.03
0.0000
0.3003
.44591
[95% Conf. Interval]

.0750766
.0311398
-.0009292
-.0824537
.105655
.050878
-.0004979
.3384487
Se evidencia entonces que los valores estimados para los estadsticos son los mismos,
sin embargo la desviacin estndar cambia significativamente.
3.1 Solucin del problema de heteroscedasticidad

3.1.1 Si se conoce la naturaleza
Como sabemos entonces, los estimadores de mnimos cuadrados ordinarios no son
eficientes en presencia de este problema economtrico. Existe por tanto otro
estimador igualmente insesgado y que adems es preciso, denominado estimador de
Mnimos Cuadrados Ponderados (MCP), un. En trminos generales, este estimador se
utiliza en presencia de heterosedasticidad y lo que hace es que utiliza las diferentes
varianzas de los errores para asociarles diferentes pesos a cada observacin y que as
todas tengan finalmente la misma varianza. Una vez hecho esto, el mtodo de MCO
arroja estimadores eficientes.
Para transformar el modelo, se debe tener en cuenta que si
y si se divide
por , entonces todos tendran la misma varianza igual a 1, esto es:

$ 1$
%1$ & 1

Entonces el modelo de regresin lineal simple quedara tal que:

1
)
'
( (

Stata incluye la posibilidad de trabajar con este mtodo. Para estimar el modelo de
regresin lineal simple dando diferentes pesos a las varianzas de los errores, se utiliza
lo que Stata denomina aweights, los cuales deben ser inversamente proporcionales a
las varianzas de las observaciones y por tanto el comando que se emplea es:
.regress vardep indepvar1 [aweight =1/indepvar]
Para dar un ejemplo, se desea estimar el modelo de salarios minceriana Stata de esta
manera. As, es necesario dar diferentes pesos a las varianzas de los errores para lo
cual se emplea el comando anterior de la siguiente manera:
.regress lwage educ exper expersq [aweight =1/educ]
3.1.2 Si no se conoce la naturaleza
En caso de que no se conozca la naturaleza de la heteroscedasticidad, Stata permite de
una manera sencilla encontrar errores estndar robustos utilizando el siguiente
comando:
.reg vardep var1 var2 var3, robust
De esta manera, la tabla que arroja Stata corrige el problema de heteroscedasticidad y
los estimadores son ahora consistentes e insesgados.
4 Autocorrelacin
El problema de autocorrelacin de los residuos se da al violarse el supuesto segn el
cual los errores son independientes entre s, es decir la hiptesis que establece que
cov( i ; j ) = 0 . Este problema se presenta cuando se est trabajando con unos datos
de series temporales. En efecto, el problema consiste en que el error del modelo
depende del error del error del periodo previo:
+, -+,. /,
Donde - es un parmetro que describe la dependencia de +, con +,. y /, es un
nuevo error aleatorio.
La autocorrelacin de los errores se puede dar en dos tipos:
-
Autocorrelacin de orden 1 o AR(1): se da cuando el error est correlacionado

con el del periodo inmediatamente anterior.
Autocorrelacin de orden 2 o AR(2): se da cuando el trmino de error est
correlacionado con el error del periodo anterior y el previo a este.
Las diferentes pruebas que se pueden realizar en caso de sospecha de la presencia de

un problema de autocorrelacin son:
-
Prueba de Rachas
Esta prueba asume de entrada que como existe autocorrelacin, entonces no debera
haber errores con los mismos signos seguidos en la autocorrelacin positiva, ni muchos
cambios de signo seguidos en la autocorrelacin negativa. Esto lo revelan los grficos
como se muestra a continuacin:
Grfico 4. Autocorrelacin positiva de
los errores
Grfico 5. Autocorrelacin negativa de

los errores
Las hiptesis que utiliza esta prueba son:

: - 0
: 0
Los pasos para la realizacin de la prueba Rachas son: como primera medida, se debe
contar el nmero de errores con signo positivo y llamar este valor N+ al igual que se
debe contar el nmero de errores con signo negativo y llamar este valor N- . Una vez
hecho esto, se debe contar el nmero de rachas, es decir el nmero veces en que
cambia el signo de los errores y llamarlo k, para a continuacin calcular:
1
var( k ) =
20 2 0 .
1
02 0.
2 N + N (2 N + N N + N )
( N + N ) 2 ( N + + N 1)
Ahora se debe calcular el estadstico RA:
RA =
k E (k )
var(k )
La regla para rechazar o no la hiptesis nula es:

Si |45| 6 7 entonces se rechaza , de lo contrario no. El intervalo de confianza para
8
esta prueba es:
k E (k ) z var(k )
Se debe adems tener en cuenta que si N+ o N- son menores a 20, se emplearn los
valores de la tabla D.6. para los lmites del intervalo.
-
Prueba Durbin Watson
En esta prueba se debe calcular el estadstico Durbin Watson con la siguiente frmula:
n
( )
t
DW =
t 1
t =2
Si se tiene una muestra lo suficientemente grande, es posible demostrar que

DW 2(1 ) Y por tanto 0 < DW < 4 .
Los valores dU y dL dependen del nmero de observaciones de la muestra, y se hallan
a partir de la tabla estadstica.
Es importante no olvidar que el estadstico Durbin Watson no tiene sentido en dos
casos: el caso en el que el modelo carezca de intercepto y aquel en el que haya una
variable independiente rezagada. En estos casos, esta prueba no es una prueba vlida
para determinar autocorrelacin y se debe acudir a otro tipo de pruebas para ello.
Adems, este estadstico solamente detecta autocorrelacin de orden 1, AR(1), pero
como se mencion anteriormente existe tambin otros tipos de autocorrelacin para
las cuales se debe utilizar otras pruebas.
Prueba de Box Pierce
La prueba de Box Pierce es una prueba que permite determinar el problema de

autocorrelacin en caso de que esta sea de orden superior a uno. Es una prueba que
funciona en la medida que se realice sobre muestras mayores a 20 observaciones o
periodos de tiempo. Se basa en la autocorrelacin muestral de los errores la cual es:
n
( )(
t k
k = t =k +1
t t k
= t = kn+1
( )
( )
t =1
t =1
El estadstico Box Pierce se calcula:

s
Q = n rk 2 ~ a s 2
k =1
Donde s es el nmero de rezagos que se quieren considerar. A partir de este

estadstico con una distribucin chi cuadrado, se definen las hiptesis siguientes:
H 0 : No autocorrelacin
H1 : Al menos una correlacin no es cero
Y se toma la decisin sobre esta prueba de hiptesis si Q>2 s.

-
Prueba de Ljung Box
La prueba de Ljung Box es una prueba que se utiliza generalmente en muestras

pequeas pues esta tiene un mejor comportamiento. Este estadstico funciona igual
que el Box Pierce:
rk 2
k =1 n + k
s
Q ' = n( n + 2)
4.1 Solucin al problema de autocorrelacin

4.1.1 Si se conoce la naturaleza
En caso de que se conozca la naturaleza de la autocorrelacin de los errores, el
mtodo que se debe utilizar se denomina Diferencias Generalizadas. Este mtodo
consiste en realizar una transformacin del modelo original para construir un modelo
sin autocorrelacin.
En el caso de un modelo de regresin lineal mltiple tenemos que:
yt = 1 + 2 X 2t + 3 X 3t + ... + k X kt + t
yt 1 = 1 + 2 X 2t 1 + 3 X 3t 1 + ... + k X kt 1 + t 1
Una vez el modelo est rezagado en un periodo, este se multiplica por a ambos lados
obteniendo:
yt 1 = 1 + 2 X 2t 1 + 3 X 3t 1 + ... + k X kt 1 + t 1
Ahora, si se restan ambos modelos se obtiene que:
yt yt 1 = 1 1 + 2 X 2t 2 X 2t 1 + 3 X 3t 3 X 3t 1 + ... + k X kt k X kt 1 + t t 1
(1 ) 1 + 2 ( X 2t X 2t 1 ) + 3 ( X 3t X 3t 1 ) + ... + k ( X kt X kt 1 ) + t t 1
Este nuevo modelo donde el trmino de error ya no tiene autocorrelacin, se expresa
de la siguiente manera:
yt * = 1 (1 ) + 2 X *2t + 3 X *3t + ... + k X *kt + t

Con esto, el problema ha sido entonces solucionado. Sin embargo, generalmente no se
conoce la naturaleza de la autocorrelacin, caso en el cual este mtodo planteado no
funciona. Se debe entonces utilizar otra opcin.
4.1.2 Si no se conoce la naturaleza

En caso de que no se conozca la naturaleza, el mtodo de Durbin ofrece la posibilidad
de realizar una correccin del problema que se presenta.
Este mtodo consiste en estimar el modelo:
yt = 1 + 2 X 2t + 3 X 3t + ... + k X kt + k +1 X 2t 1 + k + 2 X 3t 1 + ... + k + ( k 1) X kt 1 + yt 1 + t
A partir de este se haya entonces un -9 y con esto se deben realizar las siguientes
transformaciones:
yt * = yt yt 1
X *2t = X 2t X 2t 1
X *3t = X 3t X 3t 1
Y a continuacin se estima el siguiente modelo:

y*t = 1 + 2 X *2t + 3 X *3t + ... + k X *kt + t
5 Otros problemas economtricos

Un modelo economtrico presenta endogeneidad cuando existe correlacin entre las
variables explicativas y el trmino de error. Esto se da al violarse el supuesto del
teorema de Gauss-Markov segn el cual las variables explicativas son no estocsticas.
Existen diferentes casos en los que se puede presentar un problema de endogeneidad:

simultaneidad, error de medicin y variables omitidas. La forma de corregir dicho
problema es mediante el mtodo de Variables Instrumentales, sin embargo, este tema
no se tratar en este documento.
5.1 Simultaneidad
La simultaneidad surge cuando una o ms variables explicativas estn determinadas
conjuntamente con la variable dependiente, en general a travs de un mecanismo de
equilibrio (Wooldridge, 2006).
Un ejemplo de ecuaciones simultneas es el siguiente:
:, ;, ;,. <,,
>, ( ( :, ( :,. (" ?, <,,

;, @ :, A, ?,
Las variables que se determinan por fuera del modelo son llamadas variables
exgenas, y aquellas que se determinan dentro del modelo son variables endgenas.
En este sistema de ecuaciones, se est estimando el consumo y las importaciones a
partir de la identidad de la demanda agregada. Sin embargo, se debe tener en cuenta
que para poder ser estimadas, el sistema de ecuaciones debe estar bien se
perfectamente identificada o bien sobreidentificada. Para poder concluir acerca de
esta caracterstica de las ecuaciones, se debe tener en cuenta las siguientes reglas de
decisin:
Sea B el nmero de variables endgenas incluidas dentro de la ecuacin, y sea 1 el
nmero de variables exgenas excluidas de la ecuacin. Tanto B como 1 sern
comparados con el nmero total de variables exgenas o endgenas dentro del
sistema de ecuaciones. La regla de decisin es:
Si 1 C B D 1 entonces la ecuacin est sobreidentificada
Si 1 B D 1 entonces la ecuacin est perfectamente identificada
Si 1 E B D 1 entonces la ecuacin est subidentificada
Una ecuacin subidentificada no permite ser estimada por el mtodo de MCO. Es
importante entonces revisar esta regla a la hora de enfrentarse a un sistema de
ecuaciones simultneas.
5.2 Error de medicin
En general, una muestra se tiene tras la medicin de las variables explicativas. Sin
embargo, esta puede tener errores los cuales convierten los regresores en variables
estocsticas, produciendo un problema economtrico en el modelo que se va a
estimar.
5.3 Especificacin: Variables omitidas

Muchas veces en la especificacin del modelo puede haber variables relevantes
omitidas. Esto es considerado como un error economtrico que el econometrista debe
tener presente pues muchas veces no es posible incluir en un modelo todas las
caractersticas que afectan una variable determinada, pero es de suma importancia
incluir aquellas ms relevantes. Las consecuencias de esta omisin de variables
relevantes son que el intercepto y las pendientes estaran sesgadas y serian
inconsistentes, adems de que tendran unas varianzas invlidas que no permiten
trabajar correctamente con los respectivos intervalos de confianza ni hacer las pruebas
de significancia parcial ni global. Adems de esto, si la variable omitida est
relacionada con otra variable independiente del modelo, se produce el problema de
endogeneidad.
Omitir una variable relevante provoca entonces un sesgo por omisin de variables (o
heterogeneidad no observada). Existen tres diferentes opciones para enfrentar este
problema: la primera es pasarlo por alto y sufrir las consecuencias; el segundo es
encontrar una variable proxy adecuada para la variable no observada; y la tercera es
suponer que dicha variable omitida no cambia en el tiempo, es decir, asumirla como
constante y realizar primeras diferencias o el mtodo denominado Efectos Fijos
(Wooldridge, 2006). Sin embargo, esos temas no competen en este nivel de anlisis y
por tanto en este documento no se analizarn estas soluciones.
6 Problemas asintticos: Distribucin normal del error

En econometra se utilizan siempre muestras para realizar inferencia sobre una
determinada poblacin. Se trata de acercarse lo ms posible a los parmetros
poblacionales a partir de unos estimadores especficos. Es evidente que entre ms
pequea sea la muestra, ms alejado estar el valor estimado del valor poblacional del
parmetro, y por ende, entre mayor sea la muestra, ms se acercar.
En el caso de que se trabaje con una muestra pequea, es fundamental verificar que el
valor esperado del error tiende a cero a medida que la muestra aumenta. La
consistencia de un estimador es una propiedad de suma importancia, sin embargo por
s sola esta propiedad no permite hacer inferencia ni realizar contrastes sobre los
parmetros. Para esto, es necesario conocer la distribucin de los estimadores MCO.
Bajo los supuestos del teorema de Gauss Markov se puede verificar que estas
distribuciones son normales (Wooldridge (2006)).
La propiedad de normalidad en la distribucin de lo estimadores del mtodo de MCO
depende de la normalidad del trmino de error en la poblacin. Si dichos errores
provienen de muestras aleatorias no distribuidas normalmente, aqu se presentara un
problema en la medida en que los estimadores MCO no estaran distribuidos de
manera normal y por tanto ni los estadsticos t ni los F serian consistentes con sus
respectivas distribuciones.
Esto es de suma importancia que sea verificado por el econometrista a la hora de la

estimacin de un modelo pues en caso de que no se evidencie, habr problemas con la
consistencia de las conclusiones a las que se llegue.
7 Comentarios finales
En econometra es bastante comn que se presenten problemas en todas las etapas
del trabajo, no solamente a la hora de especificar el modelo, sino tambin al este ser
estimado, o al momento de seleccionar la muestra con la que se va a trabajar. En
algunas ocasiones, los problemas no son evitables pero si son solucionables, cosa que
se debe tener muy claro para no olvidar hacer mencin de ellos y corregirlos en caso
tal.
El software Stata, como algunos otros, facilita la labor del econometrista permitiendo
en su programa la realizacin de grficos y pruebas especficas que evidencian la
presencia o no de un problema economtrico en el modelo que se est estimando.
8 Bibliografa
Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press

Adkins L.C y Carter R. (2008). Using Stata for Principles of Econometrics. Wiley.
Baum C. F. (2006) An Introduction to Modern Econometrics Using Stata. Stata
Press
Becker, Gary S. (1964) Human Capital: A theorical and empirical analysis, with
special reference to education. New York.
Blossfeld H-P., Golsch K., Rohwer G. (2007) Event History Analysis with Stata.
Cameron A.C y Trivedi P.K (2009). Microeconomtrics using Stata. Stata Press
Cleves M., Gould W., Gutierrez R., Marchenko Y. (2002) An Introduction to
Survival Analysis using Stata. Thrid edition. Stata Press
Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of
earnings. Institute for the study of labor (IZA). IDEAS
Gujarati (2010) Econometra. Mxico. Mc Graw Hill
Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with
Stata. Stata Press
Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press
Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX:
Stata Press
Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.
Mincer, J. (1974) Schooling, experience and earnings, Columbia University
Press.
Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press
Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson
Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ
Press.
Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using
STATA, London: Chapman & Hall/CRC Press
Newton J., Cox N. (2003) Seventy-six Stata tips

STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.
Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed.
Thomson
Algunos recursos en Internet para usuarios Stata:
http://www.ats.ucla.edu/stat/stata/
http://econpapers.hhs.se/paper/bocbocoec/531.htm
http://fmwww.bc.edu/ec/res.info.php
http://ideas.repec.org/s/boc/bocins.html
http://ideas.repec.org/s/boc/bocode.html

Problemas Econometricos Con Stata

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Problemas Econometricos Con Stata

Încărcat de

Drepturi de autor:

Formate disponibile

PROBLEMAS ECONOMTRICOS CON STATA

Carlos Giovanni Gonzlez Espitia

Palabras Clave: Econometra, software economtrico, Stata

Estadsticos t bajos, F global y R2 altos: poca significatividad individual de las

Sensibilidad de los ' s a cambios pequeos en el nmero de observaciones n :

Sensibilidad de los ' s a la inclusin o exclusin de regresores en el modelo: si

varianza constante denominada 2 . El problema bsicamente est en que en

.predict ehat, residual

Grfico 1. Residuos vs aos de

Grfico 3. Residuos vs logaritmo del salario

Lo que se observa en el grfico 3 es que aparentemente hay mayores variaciones (que

As es posible realizar la prueba de hiptesis y verificar si existe o no

b) La Prueba Breush Pagan

La hiptesis nula se refiere a una homoscedasticidad en los datos mientras que la

En Stata, los diferentes comandos para la realizacin de los pasos anteriormente

Este resultado permite entonces realizar la prueba de hiptesis y as concluir sobre la

Tabla 1. Resultado de la estimacin del modelo

[95% Conf. Interval]

Tabla 2. Resultado robusto de la estimacin del modelo

[95% Conf. Interval]

3.1 Solucin del problema de heteroscedasticidad

Entonces el modelo de regresin lineal simple quedara tal que:

Autocorrelacin de orden 1 o AR(1): se da cuando el error est correlacionado

Las diferentes pruebas que se pueden realizar en caso de sospecha de la presencia de

Grfico 5. Autocorrelacin negativa de

Las hiptesis que utiliza esta prueba son:

Ahora se debe calcular el estadstico RA:

La regla para rechazar o no la hiptesis nula es:

esta prueba es:

Prueba Durbin Watson

Si se tiene una muestra lo suficientemente grande, es posible demostrar que

Prueba de Box Pierce

La prueba de Box Pierce es una prueba que permite determinar el problema de

El estadstico Box Pierce se calcula:

Donde s es el nmero de rezagos que se quieren considerar. A partir de este

Y se toma la decisin sobre esta prueba de hiptesis si Q>2 s.

Prueba de Ljung Box

La prueba de Ljung Box es una prueba que se utiliza generalmente en muestras

4.1 Solucin al problema de autocorrelacin

yt * = 1 (1 ) + 2 X *2t + 3 X *3t + ... + k X *kt + t

4.1.2 Si no se conoce la naturaleza

Y a continuacin se estima el siguiente modelo:

5 Otros problemas economtricos

Existen diferentes casos en los que se puede presentar un problema de endogeneidad:

>,  (  ( :,  ( :,.  (" ?,  < ,,

5.3 Especificacin: Variables omitidas

6 Problemas asintticos: Distribucin normal del error

Esto es de suma importancia que sea verificado por el econometrista a la hora de la

Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press

Newton J., Cox N. (2003) Seventy-six Stata tips

Algunos recursos en Internet para usuarios Stata:

S-ar putea să vă placă și

yt * = 1 (1 ) + 2 X 2t + 3 X 3t + ... + k X *kt + t

>, ( ( :, ( :,. (" ?, <,,