Sunteți pe pagina 1din 4

test hacker bera

mco

normalidad

heteroestacidad

metodologa

tenemos un problema de variables emitida no observable = se corrige con un modelo Panel de


efectos fijos.

como habilidad de un trabajo

los estimados estn sobreestimados ( con signo correcto)

test normalidad = Pertubacin no tiene distribucin normal.

heterocedasticidad no se corrige ni con una matriz de varianza y covarianza robusto.

Para este tipo de modelos se permite que el R2 < 40 - Especificado en el wolbridge

Supuesto de normalidad

El modelo clsico de regresin lineal normal supone que cada ui est normalmente distribuida con

Media: E(ui) 0 (4.2.1)

Varianza: E[ui E(ui)]2 E u2 i 2 (4.2.2)

cov(ui, uj): E{[(ui E(ui)][uj E(uj)]} E(ui uj) 0 i j (4.2.3)

Estos supuestos se expresan en forma ms compacta como

ui N(0, 2) (4.2.4)

Donde el smbolo sgnifica distribuido y N signica distribucin normal, y donde los trminos
entre parntesis representan los dos parmetros de la distribucin normal: la media y la varianza.
Como se seala en el apndice A, para dos variables normalmente distribuidas, una covarianza o
correlacin cero signi ca independencia entre las dos variables. Por consiguiente, con el supuesto
de normalidad, la ecuacin (4.2.4) signica que ui y uj no slo no estn correlacionadas, sino que
tambin estn independientemente distribuidas. Por tanto, (4.2.4) se escribe como
ui NID(0, 2) (4.2.5)

donde NID signica normal e independientemente distribuido.

Por qu debe formularse el supuesto de normalidad? Por qu se emplea el supuesto de


normalidad? Existen diversas razones.

1. ui representa la inuencia combinada (sobre la variable dependiente) de un gran nmero de


variables independientes que no se introdujeron explcitamente en el modelo de regresin. Como
explicamos, se espera que la inuencia de estas variables omitidas o descartadas sea pequea y, en
el mejor de los casos, aleatoria. Ahora, gracias al conocido teorema central del lmite (TCL) en
estadstica (vanse los detalles en el apndice A), se puede demostrar que, si existe un gran nmero
de variables aleatorias independientes con idntica distribucin, entonces, con pocas excepciones,
la distribucin de su suma tiende a ser normal a medida que se incrementa al innito el nmero de
tales variables. Este teorema del lmite central es el que proporciona una justicacin terica para
el supuesto de normalidad de ui.

2. Una variante del teorema del lmite central establece que, aunque el nmero de variables no sea
muy grande, o si estas variables no son estrictamente independientes, su suma puede estar an
normalmente distribuida.

3. Con el supuesto de normalidad, se derivan con facilidad las distribuciones de probabilidad de los
estimadores de MCO, pues, como se explica en el apndice A, una propiedad de la distribucin
normal es que cualquier funcin lineal de variables normalmente distribuidas estar tambin
normalmente distribuida. Como ya analizamos, los estimadores de MCO 1 y 2 son funciones
lineales de ui. Por consiguiente, si ui est normalmente distribuida, tambin lo estn 1 y 2 , lo cual
hace que la tarea de probar hiptesis sea muy fcil.

4. La distribucin normal es una distribucin comparativamente sencilla y requiere slo dos


parmetros (la media y la varianza); es muy conocida y sus propiedades tericas se han estudiado
con amplitud en estadstica matemtica. Adems, al parecer muchos fenmenos se rigen por la
distribucin normal.

5. Si trabajamos con una muestra nita o pequea, con datos de 100 o menos observaciones, la
suposicin de normalidad desempea un papel relevante. No slo contribuye a derivar las
distribuciones de probabilidad exactas de los estimadores de MCO, sino tambin permite utilizar las
pruebas estadsticas t, F y 2 para los modelos de regresin. Las propiedades estadsticas de las
distribuciones estadsticas t, F y 2 se estudian en el apndice A. Como veremos en seguida, si el
tamao de la muestra es razonablemente grande, se puede exibilizar el supuesto de normalidad.

6. Por ltimo, en muestras grandes, los estadsticos t y F tienen aproximadamente las distribuciones
de probabilidad de t y F, por lo que las pruebas t y F que se basan en el supuesto de que el trmino
de error est distribuido normalmente pueden seguir aplicndose con validez. En la actualidad hay
muchos datos transversales y de series de tiempo con una cantidad relativamente grande de
observaciones. Por tanto, el supuesto de normalidad puede no ser tan crucial en conjuntos grandes
de datos. Advertencia: Como se est imponiendo el supuesto de normalidad, es menester
encontrar aplicaciones prcticas que requieran tamaos pequeos de muestras en las que el
supuesto de normalidad resulte apropiado. Ms adelante se realizarn algunas pruebas para hacer
precisamente eso; asimismo, se presentarn situaciones en las que tal vez sea inadecuado el
supuesto de normalidad. No obstante, hasta ese momento, consideraremos vlido el supuesto de
normalidad por las razones expuestas.

(pag 99 - 100)

Consecuencias de la heterocedasticidad para MCO

Considere de nuevo el modelo de regresin lineal mltiple:

y 0 1x1 2x2 k xk u. 8.1

Se prob el insesgamiento o insesgadez de los estimadores de MCO 0, 1, 2, , k bajo


los primeros cuatro supuestos, RLM.1 a RLM.4, de Gauss-Markov. En el captulo 5 se mostr que
estos mismos cuatro supuestos implican la consistencia de MCO. El supuesto de homocedasticidad
RLM.5, dado en trminos de la varianza del error como Var(u x1, x2, , xk) 2, no desempe papel
alguno al demostrar si los MCO eran insesgados o consistentes. Es importante recordar que la
heterocedasticidad no ocasiona sesgo ni inconsistencia en los estimadores MCO de las Bj mientras
que omitir una variable importante s tendr este efecto.

La interpretacin de las medidas de bondad de ajuste, R2 y R2, tampoco se ve afectada por la


presencia de heterocedasticidad. Por qu? Recurdese que en la seccin 6.3 se vio que la R-
cuadrada usual y la R-cuadrada ajustada son dos distintas maneras de estimar la R-cuadrada
poblacional, la cual es simplemente 1 2 u / 2 y , donde 2 u es la varianza poblacional del error
y y 2 es la varianza poblacional de y. El punto clave es que como en la R-cuadrada poblacional ambas

varianzas son incondicionales, la R-cuadrada poblacional no se ve afectada por la presencia de


heterocedasticidad en Var(u x1, , xk). Adems, SRC/n estima consistentemente 2 u, y STC/n
estima consistentemente 2 y , al margen de si Var(u x1, , xk) es constante. Lo mismo es cierto
cuando se ajustan los grados de libertad. Por tanto, R2 y R2 son estimadores consistentes de la R-
cuadrada poblacional, se satisfaga o no el supuesto de homocedasticidad.

Si la heterocedasticidad no causa sesgo ni inconsistencia en los estimadores de MCO, por qu se


introduce como uno de los supuestos de Gauss-Markov? Recuerde que en el captulo 3 se vio que
sin el supuesto de homocedasticidad los estimadores de las varianzas, Var( j), son sesgados. Como
los errores estndar de MCO se basan directamente en estas varianzas, dejan de ser vlidos para la
construccin de intervalos de confianza y de estadsticos t. En presencia de heterocedasticidad los
estadsticos t usuales de MCO no tienen distribuciones t, y el problema no se resuelve empleando
muestras grandes. Esto se ver explcitamente en la siguiente seccin para el caso de la regresin
simple, donde se obtiene la varianza de los estimadores de pendiente de MCO bajo
heterocedasticidad y se propone un estimador vlido en presencia de heterocedasticidad. De
manera similar, los estadsticos F dejan de seguir una distribucin F, y el estadstico ML deja de tener
una distribucin ji-cuadrada asinttica. En resumen, los estadsticos empleados en las pruebas de
hiptesis bajo los supuestos de Gauss-Markov ya no son vlidos en presencia de heterocedasticidad.

Tambin se sabe que el teorema de Gauss-Markov, que dice que MCO da el mejor estimador lineal
de insesgamiento, depende de manera crucial del supuesto de homocedasticidad. Si Var(u x) no es
constante, MCO ya no es MELI. Adems, MCO ya no es asintticamente eficiente en la clase de los
estimadores. En presencia de heterocedasticidad es posible hallar estimadores que sean ms
eficientes que MCO (aunque es necesario conocer la forma de la heterocedasticidad). Con tamaos
de muestra relativamente grandes, puede no ser tan importante obtener un estimador eficiente. En
la siguiente seccin se muestra cmo pueden modificarse los estadsticos de prueba usuales de MCO
de manera que sean vlidos, por lo menos asintticamente.

S-ar putea să vă placă și