Documente Academic
Documente Profesional
Documente Cultură
La tabla 11.7 proporciona datos sobre 81 automóviles respecto de su MPG (millas promedio
por galón), CF (caballos de fuerza de su motor), VOL (pies cúbicos de su cabina), VM (velocidad
máxima en millas por hora) y su PS (peso del vehículo en cientos de lb).
*en los datos proporcionados en clase, el archivo HETEROS.dta se corrigieron las iniciales de
las variables.
- En velocidad máxima, millas por hora (vm) se necesita como mínimo 90 y máximo
165
- En caballos de fuerza del motor (cf) se necesita como mínimo 49 y máximo 322
- En peso del vehículo, cientos de libras (ps) se necesita como mínimo 17.5 y
máximo 55
- Además, observamos en el pvalue>|t| que todas son 0.000 entonces explican
significativamente.
b) ¿Esperaría que la varianza del error en el modelo anterior sea heteroscedástica? ¿Por
qué?
Como se trata de un conjunto de datos transversales que involucran una diversidad de
vehículos. A priori se podría esperar heterocedasticidad.
1. Método informal
1.1. Gráficos
Se generan los residuos
predict e, resid
Luego para valores estimados se agrega la “f” al nombre que se quiera escoger
predict heterosf
Gráfico de dispersión que relaciona los residuos con las variables estimadas
rvfplot, yline(0)
Para ver gráficamente la relación entre los residuos de la variable endógena (mpg) con
cada una las variables predeterminadas (vm cf ps), por separado
avplots
Ahora la relación que existe entre cada variable predeterminada (vm) y los residuos,
rvpplot vm
La relación que existe entre cada variable predeterminada (cf) y los residuos
rvpplot cf
La relación que existe entre cada variable predeterminada (cf) y los residuos
rvpplot ps
Por el método grafico se puede observar que el grafico que relaciona los residuos con
cada variable, en el caso de la variable “ps” los valores tiene una forma sistemática,
ñor lo que se podría concluir que la variable ps (peso del vehículo en cientos de lb) es
la que causa la heterocedasticidad en el modelo.
Al tratar de contrastar la heterocedasticidad, es necesario utilizar los residuos
cuadrados
gen ec=e^2
- Se etiqueta: label variable ec "residuos cuad"
Se sigue graficando, esta vez se van a relacionara los residuos cuadrados con
cada variable
- twoway scatter ec vm
- twoway scatter ec cf
- twoway scatter ec ps
Se sigue observando que la variable ps (peso del vehículo en cientos de lb) es la que causa la
heterocedasticidad en el modelo.
2. Métodos formales
la variable ps (peso del vehículo en cientos de lb) tiene mayor correlación (negativa) con los
residuos. ps = - 0.3300
Ahora se genera una variable que contenga los valores absolutos de los residuos
gen ea=abs(e)
- Se etiqueta: label variable ea "residuos en valores absolutos"
Elaborar una regresión con la posible variable que este causando la heterocedasticidad
ps (peso del vehículo en cientos de lb) y los residuos absolutos
Luego generar
gen vi=1/ps
Una regresión con ea y vi
reg ea vi
El menor ROOT MSE es el que explica mejor quien tiene mayor relevancia en el
esquema de autocorrelación.
Hacemos una regresión de la variable generada “p” como endógena contra las
predeterminadas.
reg p vm cf ps
Hallamos los valores calculados y tabulados para oder contrastar la hipótesis
nula
- scalar chc=e(mss)/2
- scalar cht=invchi2(1,0.95)
display "Chi Calculado="= chc ……. 51.921566
display "Chi Tabulado="= cht ……. 3.8414588
Ho : No existe heterocedasticidad
Calculado > tabulado
51.921566 > 3.8414588
Se rechaza la Ho, por lo tanto si hay heterocedasticidad en el modelo.
estat hettest,iid
- scalar FC=(SRCM2/df2)/(SRCM1/df1)
- display "F Calculado=" = FC
- display "F Tabulado FT ="invF(df1,df2,1-0.05)
Ho : No existe heterocedasticidad
Calculado < tabulado
0.1468212 < 1.810379
Se acepta la Ho, por lo tanto no hay heterocedasticidad en el modelo, según este
probador.
2.4. Contraste White
Regresión del modelo
reg mpg vm cf ps
Generar las variables al cuadrado
- gen vm2=vm^2
- gen cf2=cf^2
- gen ps2=ps^2
luego se generan las variables multiplicadas entre si
- gen vmcf=vm*cf
- gen vmps=vm*ps
- gen cfps=cf*ps
se halla la regresión con el residuo cuadro como endógena y las variables
iniciales con las variables al cuadro y las que están multiplicadas entre si
mismas
reg ec vm cf ps vm2 cf2 ps2 vmcf vmps cfps