Documente Academic
Documente Profesional
Documente Cultură
MVICTORIAVERDUGOMATSMISABELCALBOUZADA
MULTICOLINEALIDAD
INTRODUCCIN
Lamulticolinealidadensentidoestrictohacereferenciaalaexistenciaderelacioneslinealesentre
lasvariablesexplicativasdeunmodeloeconomtrico.Noobstante,algunosautoresconsideranun
concepto de multicolinealidad ms amplio, la definen como la existencia de relaciones lineales
entrelosregresoresdelmodelo(incluyeademsdelasrelacionesentrevariablesexplicativas,las
relaciones entre alguna/s variable/s explicativa/s y el regresor ficticio), es lo que Marquart,
denominamulticolinealidadnoesencialomulticolinealidadensentidoamplio.
Es posible considerar dos tipos de multicolinealidad, que aunque plantean problemas similares,
tienen efectos esencialmente distintos, la multicolinealidad exacta o perfecta y la
multicolinealidad aproximada, dependiendo de s las relaciones lineales son perfectas o
aproximadas.
En el MRLNC se supone que entre los regresores del modelo no existen relaciones lineales
perfectas, ni siquiera aproximadas en sentido estricto. Cuando la multicolinealidad aproximada
1
Cuando Gretl detecta multicolinealidad perfecta realiza la estimacin omitiendo alguna/s de la/s variable/s
causante/s del problema.En el siguiente caso, las variables X4 yX5proporcionan lamisma informacin, por lo que
GretlrealizalaestimacindelmodelosintenerencuentaX5.
? X5 = X4
Se ha generado la serie X5 (ID 6)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
2
est presente, se puede abordar la estimacin MCO del modelo, pues se sigue cumpliendo la
hiptesisderangoy,adems,losestimadoresMCOsiguensiendoLIO.Enestecasolamatrizde
productoscruzadosdelosregresoresseraunamatriznosingular(sudeterminantenoseranulo
peroseacercaraaceroamedidaqueaumenteelgradodemulticolinealidad),sepodracalcular
lainversadeXXperosuselementosseranelevados(tantomselevadosamedidaqueaumente
el grado de multicolinealidad). Adems, como la matriz de varianzascovarianzas de los
estimadores es proporcional a XX, las varianzas de los estimadores seran elevadas y los
estimadoresseranimprecisos.Ladificultadestenqueentalsituacin,aislarlosefectosquelas
variablesexplicativasejercensobreelregresandoconstituyeunadifciltarea.
Estecaptuloseocupartantodelestudiodereglasparaladeteccindemulticolinealidadcomo
desusposiblessoluciones.
DETECCINDEMULTICOLINEALIDAD
Dado que la multicolinealidad es esencialmente un problema de tipo muestral, no existen
contrastes estadsticos propiamentedichos parasu deteccin y/o la determinacin de su grado.
Sin embargo, se han desarrollado numerosas reglas prcticas encaminadas a determinar en qu
medida dicho problema afecta a la estimacin y contrastacin del modelo y, qu variable o
variablessonlascausantesdelmismo.
CRITERIOSDESCRIPTIVOS
En la estimacin y contrastacin del modelo existen una serie de indicios, que aunque no son
concluyentes desde el punto de vista estadstico, pueden hacer sospechar la existencia de
problemasdemulticolinealidad:
Estimadoresconsignosincorrectos
Estimadoresimprecisosybondaddeajusteelevada
Contradiccionesentreloscontrastesdenulidadindividualyconjunta
CRITERIOSESTADSTICOS
COEFICIENTES DE CORRELACIN LINEAL Y DETERMINANTE DE LA MATRIZ DE
CORRELACIN
Un criterio para la deteccin de problemas de multicolinealidad consiste en el anlisis de los
coeficientes de correlacin simple entre las variables explicativas (elementos de la matriz de
correlacindelasvariablesexplicativas,RX).
Elcoeficientedecorrelacinsimpleocoeficientedecorrelacinlinealentrelasvariables X i y X j
( r ij )esunindicadordelgradoderelacinlinealentredichasvariables:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
3
T
(X
t 1
it - X i )(X jt - X j )
rij = - 1 rij 1
T T
(X
t 1
it - Xi ) 2
(X
t 1
jt
2
-Xj )
Observandoelcoeficientedecorrelacinenvalorabsoluto:
Si | r ij | 1 lacolinealidadesexacta
Si | r ij | 1 essntomadeelevadacolinealidad
Si | r ij | 0 implicaortogonalidad
RxeslamatrizdecorrelacinentrelasKvariablesexplicativasdelmodelo:
r 11 r 12 ... r 1K
r 21 r 22 ... r K2
=
RX 0 | Rx | 1
... ... ... ...
... r KK KxK
r K1 r K2
Observandoeldeterminantedelamatrizdecorrelacin:
Si | R x | 0 lacolinealidadesexacta(algunasdelascorrelacionessonunitarias)
Si | R x | 0 lacolinealidadeselevada(algunasdelascorrelacionesestncercanasauno)
Si | R x | 1 implicaortogonalidad(lascorrelacionessonnulas)
R 2 AUXILIARES,FACTORESDEINCREMENTODELAVARIANZAYTOLERANCIAS
Conelanlisisdelascorrelacionessimplesslosepuededeterminarlaexistenciadecolinealidad
entre las variables dos a dos, pero puede ocurrir que dicha colinealidad no exista o sea
relativamente baja, existiendo una elevada interaccin entre todas las variables consideradas
conjuntamente.
R 2j
X j / const , X 1 , X 2 , X j 1 , X j 1.,..., X K j 1,2,..., K
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
4
Comoreglaemprica2:
Si R 2j 0 Ortogonalidad:
1 1 1 1
FIV j 1 T j 1 o T j 1 R 2j 1 0 1
1 R 2j 1 0 FIV j 1
Si R 2j 0.9 :
1 1 1 1 1
FIV j 10 T j 0.1 o T j 1 R 2j 1 0.9 0.1
1 R 2j 1 0.9 0.1 FIV j 10
Si R 2j 1 Multicolinelidadperfecta:
1 1 1 1
FIV j T j 0 o T j 1 R 2j 1 1 0
1 R 2j 1 1 FIV j
AUTOANLISIS
Esposiblelaexistenciadecolinealidadesquenoimpliquenatodaslasvariablesindependientesy
que,portanto,noseanbiendetectadasporlosFactoresdeIncrementodelaVarianza.Unaforma
ms completa de detectar colinealidad es realizar un anlisis de componentes principales de las
variablesindependientes.
Lascomponentesprincipalesdeunconjuntodevariablessonotrasvariables,combinacinlineal
delasoriginalesquecumplentrespropiedades:
2
Kleinbaumconsideraquehayproblemasdecolinealidadsialgncoeficientededeterminacinauxiliaressuperiora
0.9,loqueimplicaquealgnFactordeIncrementodelaVarianzaessuperiora10yalgunaToleranciaesinferiora0.1.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
5
- sonindependientesentres(noestncorrelacionadas)
- contienenlamismainformacinquelasvariablesoriginales
- tienenlamximavarianzaposiblecumpliendolasdospropiedadesanteriores
Lasmedidasdeautoanlisismsutilizadasson:
ElcocienteentreelautovalormximoyelautovalorisimosedenominaNmerodeCondicini
simo( NC i ):
NCi =
max i 1,2,..., N variables
i
Enelcasoparticulardequeeldenominadorseaelautovalormnimo,dichococientesedenomina
NmerodeCondicinGlobal( NC ):
NC =
max
min
ElNmerodeCondicinGlobalservircomoindicadordemulticolinealidad:
3
Cuando se est interesado en el anlisis de la colinealidad entre los regresores del modelo (multicolinealidad en
sentido amplio), se debe utilizar la matriz de productos cruzados de los regresores normalizados (en Gretl se debe
ejecutaruncomandoviftraslaestimacinMCOdelmodelocondatosoriginales).
Cuando se est interesado en el anlisis de la colinealidad entre las variables explicativas del modelo
(multicolinealidadensentidoestricto),sedebeutilizarlamatrizdeproductoscruzadosdelasvariablesexplicativas
centradas normalizadas (en Gretl se debe ejecutar un comando vif tras la estimacin MCO del modelo con datos
centrados).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
6
Si NC 100 lacolinealidadnoesunproblema
Si 100 NC 900 colinealidadmoderada
Si NC 900 elevadacolinealidad
Larazcuadradadelcocienteentreelautovalormximoyelautovalorisimosedenominandice
deCondicinisimo( IC i ):
ICi NCi =
max i 1,2,..., N variables
i
Enelcasoparticulardequeeldenominadorseaelautovalormnimo,dichococientesedenomina
ndicedeCondicinGlobal( IC ):
IC NC =
max
min
ElndicedeCondicinGlobalservircomoindicadordemulticolinealidad4:
Si IC 10 lacolinealidadnoesunproblema
Si 10 IC 30 colinealidadmoderada
Si IC 30 elevadacolinealidad
Thisteddefineelndicedemulticolinealidad( imc ):
2
N Variables
min
imc = i=1
i
Elndicedemulticolinealidadservircomoindicadordemulticolinealidad5:
Si imc 1 elevadacolinealidad
Si imc 2 colinealidadmoderada
4
ParaBelsleyndicesdeCondicinentre5y10estnasociadosconunacolinealidaddbilendicesdeCondicinentre
30y100estnasociadosconunacolinealidaddemoderadaafuerte.
5
DeacuerdoconThistedlamulticolinealidadenunmodeloesprcticamenteperfectasielimcesaproximadamente1.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
7
v 2ji
i j 1,2,..., N variables i 1,2,..., N variables
PDV ji = N Variables
v 2ji
i=1 is
LaProporcindeDescomposicindelaVarianzaservircomoindicadordemulticolinealidad7:
Siunautovalorestcercanoacero8ydosomsvariablestienenunaPDV>0.5enelmismo,esas
variablesserncolineales.
COMANDOSPARAANALIZARLAMULTICOLINEALIDAD
COMANDOols
Elformatodelcomandools9es:
olsYconstX1X2XK
Lasalidaestndardelcomandoolses:
MCO, usando las observaciones 1-T
Variable dependiente: Y
Coeficiente Desv. Tpica Estadstico t Valor p
--------------------------------------------------------------
const b0 Sb t0 pvt00
X1 b1 Sb1 t1 pvt1
X2 b2 S b2 t2 pvt2
XK bK SbK tK pvt K
6
Eslaproporcindelavarianzadelasvariablessobrecadacomponente.SidosomsvariablestienenunaProporcin
deDescomposicindelaVarianzaaltaenunacomponente,dichasvariablesestnimplicadasenlacolinealidad.
7
BelsleyproponeusarconjuntamentelosICylasPDVpararealizareldiagnsticodecolinealidad:siunacomponente
tieneunIC>30ydosomsvariablestienenunaPDV>0.5enelmismo,esasvariablessoncolineales.
8
Para determinar cundo un autovalor pequeo est suficientemente prximo a cero se usa su valor relativo con
respectoalmayorautovalor(ndicedeCondicin),alqueselepedirqueseasuperiora30.
9
OtraformadeaccederaestainformacinseraseleccionarMnimosCuadradosOrdinariosenelmenModeloen
laBarradeMendelaVentanaPrincipaldeGretl.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
8
Suma de cuad. residuos SCE D.T. de la regresin S
R-cuadrado R2 R-cuadrado corregido R2
F(K, T-K-1) F2 Valor p (de F) pv F2
Log-verosimilitud L Criterio de Akaike AK
Criterio de Schwarz SC Crit. de Hannan-Quinn HQ
Sin considerar la constante, el valor p ms alto fue el de la variable
Utilizandolas30primerasobservacionesdelficherodatos1.gdt10existenunaseriederesultados
en la estimacin y contrastacin del modelo que pueden hacer pensar en la existencia de un
problemademulticolinealidad:
? smpl 1 30
Rango de datos completo: 1 - 60 (n = 60)
Muestra actual: 1 - 30 (n = 30)
? ols Y const X1 X2 X3 X4
Modelo 1: MCO, usando las observaciones 1-30
Variable dependiente: Y
Coeficiente Desv. Tpica Estadstico t Valor p
--------------------------------------------------------------
const 13.7944 4.21508 3.273 0.0031 ***
X1 13.2993 13.8701 0.9588 0.3468
X2 0.00832247 0.000511718 16.26 8.32e-015 ***
X3 0.177501 0.617597 0.2874 0.7762
X4 9.71591 13.9330 0.6973 0.4920
10
Elficherodatos1.gdtcontieneinformacinrelativaa60familiasparalasvariables:consumofamiliarmensualmedio
de aceite de oliva en litros (Y), precio medio de compra del aceite de oliva en euros/litro (X1), ingresos familiares
mensuales medios en euros (X2), precio medio de compra del aceite de girasol en euros/litro (X3), precio medio de
compradelaceitedesojaeneuros/litro(X4)ytamaofamiliar(X5).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
9
COMANDOcorr
El comando corr11 permite visualizar la matriz de coeficientes de correlacin lineal entre las
variablesqueintervienenenelcomandoysuformatoes:
corrX1X2XK
Lasalidaestndardelcomandocorres:
Coeficientes de correlacin, usando las observaciones 1 - T
valor crtico al 5% (a dos colas) = VC para T =
X1 X2 ... XK
r11 r12 ... r1K X1
r22 ... r2 K X2
... ... ...
rKK XK
Enestecaso,comoelcoeficientedecorrelacinlinealentreX1yX4envalorabsolutoestcercano
alaunidad( | r14 | 0.9999 ),sepodraafirmarqueexisteunelevadogradodemulticolinealidaden
elmodeloprovocadoporlarelacinlinealentreambasvariables:
? corr X1 X2 X3 X4
COMANDOgenr matrixOPERADORESmcorrydet
El operador mcorr del comando genr matrix permite calcular la matriz de coeficientes de
correlacinlinealentrelasvariablesqueintervienenenelcomando.
? Xraya = {X1, X2, X3, X4}
Se ha generado la matriz Xraya
? RX = mcorr(Xraya)
Se ha generado la matriz RX
? print RX
RX (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
El operador det del comando genr matrix permite calcular el determinante de la matriz que
intervieneenelcomando.
? RXD = det(RX)
11
Otra forma de acceder a esta informacin es en la Ventana Principal de Gretl, seleccionar las variables y elegir
Matrizdecorrelacindelmenqueseabrealhacerclicconelbotnderechodelratn.Obien,seleccionarMatrizde
correlacinenelmenVer.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
10
Se ha generado el escalar RXD = 0.000194477
Enestecaso,comoelvalordeldeterminantedelamatrizdecorrelacindelasvariablesesmuy
pequeo ( | R x | 0.000194477 0 ), se puede concluir que existe un elevado grado de
multicolinealidadenelmodelo.
COMANDOgenr matrixOPERADOReigengen
Eloperadoreigengendelcomandogenrmatrix permitecalcularlosvalorespropios(autovalores)de
unamatrizcuadrada12.Comolosautovaloresdependendelasunidadesdemedidadelasvariables,
esaconsejableunaprevianormalizacindelasmismas.
MATRIZXX
Dadoqueentrelasvariablesespecificadasseencuentraelregresorficticio,lanormalizacinnose
puedehacerutilizandoladesviacinestndar,yaqueparaelregresorficticioseranula,portanto,
se opta por normalizar dividiendo cada una de sus observaciones por la raz cuadrada del
T
sumatoriodelasobservacionesdelavariablealcuadrado X 2 .
it
t 1
Traslanormalizacindelosregresores,losautovaloresnodependendelasunidadesdemediday
sonmsfcilesdeinterpretar:
- Lasumadelosautovalorescoincideconelnmerodevariablesqueintervienenenelanlisis.
- El valor de los autovalores est acotado, su mximo es igual al nmero de variables que
intervienen en el anlisis y su mnimo es cero. En el caso de multicolinealidad perfecta el
autovalormximoseraigualalnmerodevariablesyelrestodeautovaloresseranigualesa
cero(mximadiferenciaentreelautovalormximoyelautovalormnimo).Lanicaposibilidad
dequetodoslosautovalorescoincidanesqueseanigualesalaunidad,siendoesteelcasode
ortogonalidad.
# Se definen los regresores normalizados
? constn = const/sqrt(sum(const^2))
Se ha generado la serie constn (ID 13)
? X1N = X1/sqrt(sum(X1^2))
Se ha generado la serie X1N (ID 14)
? X2N = X2/sqrt(sum(X2^2))
Se ha generado la serie X2N (ID 15)
? X3N = X3/sqrt(sum(X3^2))
Se ha generado la serie X3N (ID 16)
? X4N = X4/sqrt(sum(X4^2))
Se ha generado la serie X4N (ID 17)
12
La matriz de productos cruzados de los regresores normalizados (multicolinealidad en sentido amplio) o de las
variablesexplicativascentradasnormalizadas(multicolinealidadensentidoestricto).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
11
? print AVAXTXNo
AVAXTXNo (5 x 1)
4.9646
0.020139
0.013349
0.0019477
1.3513e-006
Enestecaso,elanlisisdelosautovalores13hacesospecharmulticolinealidadensentidoamplio,
yaqueelautovalormximotomaunvalormuycercanoacinco( max 1 4.965 N variables 5 )y
el resto de los autovalores toman valores muy cercanos a cero
( 2 0.020139 , 3 0.013349 , 4 0.0019477 y min 5 1.3513 10 -6 ).
13
En este caso, los autovalores obtenidos son los que Gretl proporciona cuando se ejecuta un comando vif tras la
estimacinMCOdelmodelocondatosoriginales.
? ols Y const X1 X2 X3 X4 --quiet
? vif
Factores de inflacin de varianza (VIF)
Mnimo valor posible = 1.0
Valores mayores que 10.0 pueden indicar un problema de colinealidad
X1 4634.927
X2 1.111
X3 1.164
X4 4633.188
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
12
MATRIZR X
Cuando se est interesado en el anlisis de la multicolinealidad en sentido estricto o
multicolinealidadnoesencial,seutilizanlosautovaloresdelamatrizdeproductoscruzadosdelas
variables explicativas centradas normalizadas, que son los que Gretl proporciona cuando se
ejecutauncomandoviftraslaestimacinMCOdelmodelocondatoscentrados14(vasecomando
vif):
# Se definen las variables explicativas centradas normalizadas
? X1CN = (X1-mean(X1))/sqrt(sum((X1-mean(X1))^2))
Se ha generado la serie X1CN (ID 18)
? X2CN = (X2-mean(X2))/sqrt(sum((X2-mean(X2))^2))
Se ha generado la serie X2CN (ID 19)
? X3CN = (X3-mean(X3))/sqrt(sum((X3-mean(X3))^2))
Se ha generado la serie X3CN (ID 20)
? X4CN = (X4-mean(X4))/sqrt(sum((X4-mean(X4))^2))
Se ha generado la serie X4CN (ID 21)
? print XTXCN
XTXCN (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
? print AVAXTXCNo
AVAXTXCNo (4 x 1)
2.0348
1.2647
0.70036
0.00010790
Elanlisisdelosautovaloresenestecasopermiteconcluirqueexistemulticolinealidadensentido
estricto, ya que el autovalor mximo ( max 1 2.035 ) es muy grande en comparacin con el
autovalor mnimo ( min 4 0.000 ) y los autovalores toman valores diferentes a la unidad
( max 1 2.035 , 2 1.265 , 3 0.700 y min 4 0.000 ).
14
Estosautovaloresyautovectorescoincidenconlosdelasalidadelcomandopca.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
13
COMANDOvif
Elcomandovif15debeirprecedidoporuncomandoolsenelquealmenosexistandosvariables
independientes:
olsYconstX1X2XK
vif
Cuandoelintersseaanalizarlamulticolinealidadensentidoestricto,quevaaserlohabitual,las
variablesdebenestarcentradas:
olsYCX1CX2CXKC
vif
Lasalidaestndardelcomandovifes:
Factores de inflacin de varianza (VIF)
Mnimo valor posible = 1.0
Valores mayores que 10.0 pueden indicar un problema de colinealidad
X1 VIF(1)
X2 VIF(2)
... ...
XK VIF(K)
VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de correlacin mltiple entre la variable j y las
dems variables independientes
Diagnsticos de colinealidad de Belsley-Kuh-Welsch:
--- proporciones de la varianza ---
Lambda cond X1C X2C ... XKC
1 IC1 PDV11 PDV21 ... PDVK 1
2 IC2 PDV12 PDV22 ... PDVK 2
... ... ... ... ... ...
K ICK PDV1K PDV2 K ... PDVKK
Enlaprimerapartedeestasalida,GretlproporcionalosFactoresdeIncrementodelaVarianza
( FIV j ),elcriteriodeinterpretacinylaexpresindeclculo.Enlasegundaparte,pararealizarun
diagnsticodemulticolinealidadbasadoenBelsleyKuhWelsch,proporcionalosautovalores( i ),
elndicedeCondicin( IC i )ylasProporcionesdeDescomposicindelaVarianza( PDV ji ).
Enestecaso:
# Se definen el regresando y las variables explicativas centradas
? YC = Y-mean(Y)
Se ha generado la serie YC (ID 22)
? X1C = X1-mean(X1)
Se ha generado la serie X1C (ID 23)
? X2C = X2-mean(X2)
Se ha generado la serie X2C (ID 24)
15
OtraformadeaccederaestainformacinseraseleccionarColinealidadenelmenAnlisisdelaVentanaModelo.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
14
? X3C = X3-mean(X3)
Se ha generado la serie X3C (ID 25)
? X4C = X4-mean(X4)
Se ha generado la serie X4C (ID 26)
- DadoquehayFIVmayoresque10seconcluyequehaymulticolinealidadensentidoestrictoy
quelasvariablescausantesdeellasonX1yX4( FIV1 4634.927 y FIV4 4633.188 ).
- El anlisis de los autovalores en este caso permite concluir que existe multicolinealidad en
sentidoestricto,yaqueelautovalormximo( max 1 2.035 )esmuygrandeencomparacin
con el autovalor mnimo ( m in 4 0.000 ) y los autovalores toman valores diferentes a la
unidad( max 1 2.035 , 2 1.265 , 3 0.700 y min 4 0.000 ).
- ndicesdeCondicinsuperioresa30( IC4 137.325 )indicanunproblemademulticolinealidad
ensentidoestricto.
- ComounacomponentetieneunndicedeCondicinsuperiora30( IC4 137.325 )yenesafila
delamatrizdeProporcionesdeDescomposicindelaVarianzahaydosvaloressuperioresa
0.5,sepuedeconcluirqueexisteunproblemademulticolinealidadensentidoestrictoyque
lasvariablescausantessonX1yX4( PDV14 1.000 y PDV44 1.000 ).
COMANDOpca
Los autovalores (valores propios) y autovectores (vectores propios) tambin se pueden obtener
utilizandoelcomandopca.
pcaX1X2XK
Lasalidaestndardelcomandopcaproporcionalosautovaloresyautovectoresutilizandolamatriz
decorrelacindelasvariablesespecificadasenelcomando:
Anlisis de Componentes Principales
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
15
1 1 1 1
i i
2 2 2 1 2
i i
... ... ... ...
K K K 1 2 ... K
i i
Elanlisisdelosautovaloresenestecasohacesospecharmulticolinealidadensentidoestricto,ya
que el autovalor mximo ( max 1 2.0348 ) es muy grande en comparacin con el autovalor
mnimo( m in 4 0.0001 ):
? pca X1 X2 X3 X4
SOLUCIONESALAMULTICOLINEALIDAD
Dadoquelamulticolinealidadestmuyrelacionadacondeficienciasenlainformacinmuestral,
no se dispone de reglas generales para su correccin. No obstante, la propuesta de algunas
solucionesorecomendaciones,dependerdelaseveridadconquesepresenteelproblema.
Unaposiblesolucinesampliarlainformacinmuestral,porejemplo,incrementandoeltamao
delamuestra.Setratadeunamedidaquenosiempreproporcionaresultadossatisfactorios,dado
queloimportantenoeselnmerodeobservacionessinosucontenido.
Existenotrasposibilidadescomoeliminarregresores,suministrarinformacinadicionaloutilizar
mtodos de estimacin alternativos al de MCO como componentes principales, que mejora la
precisinyeficienciadelosestimadoresperotieneelinconvenientedeproporcionarestimadores
sesgados.
AUMENTARELTAMAOMUESTRAL
Si la multicolinealidad es muestral el problema se solucionar al aumentar el nmero de
observacionesdelamuestra:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
16
# Se ampla el tamao muestral
? smpl 1 60
Rango de datos completo: 1 - 60 (n = 60)
# Se definen el regresando y las variables explicativas centradas para el nuevo rango muestral
? YC = Y - mean(Y)
Se ha reemplazado la serie YC (ID 22)
? X1C = X1 - mean(X1)
Se ha reemplazado la serie X1C (ID 23)
? X2C = X2 - mean(X2)
Se ha reemplazado la serie X2C (ID 24)
? X3C = X3 - mean(X3)
Se ha reemplazado la serie X3C (ID 25)
? X4C = X4 - mean(X4)
Se ha reemplazado la serie X4C (ID 26)
? vif
Seobservaquesehasolucionadoelproblemademulticolinealidadensentidoestricto.Adems,el
coeficiente de determinacin del modelo aumentando el tamao muestral se ha incrementado
ligeramenteyslounavariableresultanosignificativa(X3).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
17
ELIMINARREGRESORES
Una de las soluciones ms simples a la multicolinealidad consiste en eliminar alguna/s de la/s
variable/s causante/s de la misma. Esta prctica debe ser utilizada con cautela ya que puede
generarimportantessesgosyerroresdeespecificacinenelmodelo.
Localizadas las variables causantes de multicolinealidad (en este caso X1 y X4), una solucin es
eliminaralguna/sdelmodelo,nosiendoconvenienteeliminarlastodas,puestoquelainformacin
queproporcionanpuedeserrelevanteparalaexplicacindelcomportamientodelregresando.
Seobservaquesehasolucionadoelproblemademulticolinealidadensentidoestricto.Adems,el
coeficiente de determinacin del modelo eliminando X1 apenas ha variado y slo una variable
resultanosignificativa(X3).
? ols YC X2C X3C X4C simple
? vif
OcurrealgosimilareliminandoX4,sehasolucionadoelproblemademulticolinealidadensentido
estricto.Adems,elcoeficientededeterminacindelmodeloeliminandoX4apenashavariadoy
slounavariableresultanosignificativa(X3).
? ols YC X1C X2C X3C --simple
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
18
? vif
La duda que se plantea en este caso es cul de las dos variables se elimina? o dicho de otra
forma,existealgnfundamentotericoparaeliminarunauotra?,siesasseestaraaadiendo
informacinadicionaloimponiendolarestriccindequeelverdaderovalordelcoeficientedela
variableeliminadaseanulo.
? vif
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
19
SUMINISTRARINFORMACINADICIONAL
Unaalternativaparalacorreccindelamulticolinealidadpuedeserlautilizacindeinformacin
extramuestral, estableciendo restricciones sobre el comportamiento de los parmetros o
aprovechando informacin derivada de otros estudios empricos16. Con la incorporacin de
restricciones se reduce el nmero de parmetros a estimar en el modelo, lo que contribuye a
corregirdeficienciasenlainformacinmuestral.
Eliminarunavariableesequivalenteaimponerlarestriccindequesucoeficienteseanulo.
? ols Y const X1 X2 X3 X4 --quiet
? restrict
? b[2] = 0
? end restrict
Restriccin:
b[X1] = 0
Estadstico de contraste: F(1, 25) = 0.919389, con valor p = 0.346818
Estimaciones restringidas:
Coeficiente Desv. Tpica Estadstico t Valor p
--------------------------------------------------------------
const 9.88011 1.04789 9.429 7.11e-010 ***
X1 0.00000 0.00000 NA NA
X2 0.00827381 0.000508405 16.27 3.77e-015 ***
X3 -0.0319147 0.597713 -0.05339 0.9578
X4 -3.64220 0.207554 -17.55 6.22e-016 ***
Desviacin tpica de la regresin = 0.293692
16
Lasrestriccionesqueseconsiderendeberntenerunsignificadoeconmicoy/oempresarialclaro.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
20
CLCULOS
COEFICIENTESDECORRELACINLINEAL
X
t 1
it X i X jt X j
rij = i 1,2,..., K j 1,2,..., K - 1 rij 1
X jt X j
T T
X
2 2
it Xi
t 1 t 1
? r11 = (sum(((X1-mean(X1))*(X1-mean(X1))))/(sqrt((sum((X1-mean(X1))^2))*(sum((X1-mean(X1))^2)))))
Se ha generado el escalar r11 = 1
? r12 = (sum(((X1-mean(X1))*(X2-mean(X2))))/(sqrt((sum((X1-mean(X1))^2))*(sum((X2-mean(X2))^2)))))
Se ha generado el escalar r12 = -0.115113
? r13 = (sum(((X1-mean(X1))*(X3-mean(X3))))/(sqrt((sum((X1-mean(X1))^2))*(sum((X3-mean(X3))^2)))))
Se ha generado el escalar r13 = -0.0970125
? r14 = (sum(((X1-mean(X1))*(X4-mean(X4))))/(sqrt((sum((X1-mean(X1))^2))*(sum((X4-mean(X4))^2)))))
Se ha generado el escalar r14 = 0.999882
? r21 = r12
Se ha generado el escalar r21 = -0.115113
? r22 = (sum(((X2-mean(X2))*(X2-mean(X2))))/(sqrt((sum((X2-mean(X2))^2))*(sum((X2-mean(X2))^2)))))
Se ha generado el escalar r22 = 1
? r23 = (sum(((X2-mean(X2))*(X3-mean(X3))))/(sqrt((sum((X2-mean(X2))^2))*(sum((X3-mean(X3))^2)))))
Se ha generado el escalar r23 = -0.265263
? r24 = (sum(((X2-mean(X2))*(X4-mean(X4))))/(sqrt((sum((X2-mean(X2))^2))*(sum((X4-mean(X4))^2)))))
Se ha generado el escalar r24 = -0.117717
? r31 = r13
Se ha generado el escalar r31 = -0.0970125
? r32 = r23
Se ha generado el escalar r32 = -0.265263
? r33 = (sum(((X3-mean(X3))*(X3-mean(X3))))/(sqrt((sum((X3-mean(X3))^2))*(sum((X3-mean(X3))^2)))))
Se ha generado el escalar r33 = 1
? r34 = (sum(((X3-mean(X3))*(X4-mean(X4))))/(sqrt((sum((X3-mean(X3))^2))*(sum((X4-mean(X4))^2)))))
Se ha generado el escalar r34 = -0.0927363
? r41 = r14
Se ha generado el escalar r41 = 0.999882
? r42 = r24
Se ha generado el escalar r42 = -0.117717
? r43 = r34
Se ha generado el escalar r43 = -0.0927363
? r44 = (sum(((X4-mean(X4))*(X4-mean(X4))))/(sqrt((sum((X4-mean(X4))^2))*(sum((X4-mean(X4))^2)))))
Se ha generado el escalar r44 = 1
Enestecaso,comoelcoeficientedecorrelacinlinealentreX1yX4envalorabsolutoestcercano
alaunidad( | r14 | 0.999882 ),sepodraafirmarqueexisteunelevadogradodemulticolinealidaden
elmodelo,provocadoporlarelacinlinealentreambasvariables.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
21
MATRIZDECORRELACIN
r 11 r 12 ... r 1K
r 21 r 22 ... r K2
RX = 0 | Rx | 1
... ... ... ...
... r KK KxK
r K1 r K2
# Se genera la matriz de correlacin de las variables explicativas
? RX = {r11,r12,r13,r14;r21,r22,r23,r24;r31,r32,r33,r34;r41,r42,r43,r44}
Se ha generado la matriz RX
? print RX
RX (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
Enestecaso,comoelcoeficientedecorrelacinlinealentreX1yX4envalorabsolutoestcercano
alaunidad( | r14 | 0.999882 ),sepodraafirmarqueexisteunelevadogradodemulticolinealidaden
elmodelo,provocadoporlarelacinlinealentreambasvariables.
DETERMINANTEDELAMATRIZDECORRELACIN
Enestecaso,comoelvalordeldeterminantedelamatrizdecorrelacindelasvariablesesmuy
pequeo ( | R x | 0.000194477 0 ), se puede concluir que existe un elevado grado de
multicolinealidadenelmodelo.
R 2 AUXILIARES
Rj
X j / const , X 1 , X 2 , X j 1 , X j 1 .,..., X K j 1,2,..., K
2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
22
Dado que hay coeficientes de determinacin auxiliares mayores que 0.9 se concluye que hay
multicolinealidad en el modelo y que las variables causantes de ella son X1 y X4 ( R12 0.999784 y
R42 0.999784 ).
FACTORESDEINCREMENTODELAVARIANZA
1
FIV j = j 1,2,..., K
1 - R 2j
? FIVX1 = 1/(1-R2X1)
Se ha generado el escalar FIVX1 = 4634.93
? FIVX2 = 1/(1-R2X2)
Se ha generado el escalar FIVX2 = 1.11079
? FIVX3 = 1/(1-R2X3)
Se ha generado el escalar FIVX3 = 1.16441
? FIVX4 = 1/(1-R2X4)
Se ha generado el escalar FIVX4 = 4633.19
Dado que hay Factores de Incremento de la Varianza mayores que 10 se concluye que hay
multicolinealidad enelmodelo y que las variables causantes deella son X1 y X4 ( FIV1 4634.93 y
FIV4 4633.19 ).
TOLERANCIAS
1
Tj = 1 - R 2j j 1,2,..., K
FIV j
# Se calculan las Tolerancias
? T1 = 1-R2X1
Se ha generado el escalar T1 = 0.000215753
? T2 = 1-R2X2
Se ha generado el escalar T2 = 0.900264
? T3 = 1-R2X3
Se ha generado el escalar T3 = 0.858806
? T4 = 1-R2X4
Se ha generado el escalar T4 = 0.000215834
? T1 = 1/FIVX1
Se ha reemplazado el escalar T1 = 0.000215753
? T2 = 1/FIVX2
Se ha reemplazado el escalar T2 = 0.900264
? T3 = 1/FIVX3
Se ha reemplazado el escalar T3 = 0.858806
? T4 = 1/FIVX4
Se ha reemplazado el escalar T4 = 0.000215834
DadoquehayToleranciasmenoresque0.1seconcluyequehaymulticolinealidadenelmodeloy
quelasvariablescausantesdeellasonX1yX4( T1 0.000215753 y T4 0.000215834 ).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
23
AUTOVALORES
i i 1,2,..., K
# Se define la matriz de productos cruzados de las variables explicativas centradas normalizadas
? matrix XTXCN = XCN' * XCN
Se ha generado la matriz XTXCN
? print XTXCN
XTXCN (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
? print AVAXTXCNo
AVAXTXCNo (4 x 1)
2.0348
1.2647
0.70036
0.00010790
NMEROSDECONDICIN
NC i
max i 1,2,..., K
i
# Se calculan los Nmeros de Condicin
? NC1 = AVAXTXCNo[1]/AVAXTXCNo[1]
Se ha generado el escalar NC1 = 1
? NC2 = AVAXTXCNo[1]/AVAXTXCNo[2]
Se ha generado el escalar NC2 = 1.60893
? NC3 = AVAXTXCNo[1]/AVAXTXCNo[3]
Se ha generado el escalar NC3 = 2.90539
? NC4 = AVAXTXCNo[1]/AVAXTXCNo[4]
Se ha generado el escalar NC4 = 18858.1
Dado que hay Nmeros de Condicin mayores que 900 ( NC4 15858.1 ) se concluye que hay
multicolinealidadenelmodelo.
NDICESDECONDICIN
ICi NCi =
max i 1,2,..., K IC NC =
max
i min
# Se calculan los ndices de Condicin
? IC1 = sqrt(NC1)
Se ha generado el escalar IC1 = 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
24
? IC2 = sqrt(NC2)
Se ha generado el escalar IC2 = 1.26844
? IC3 = sqrt(NC3)
Se ha generado el escalar IC3 = 1.70452
? IC4 = sqrt(NC4)
Se ha generado el escalar IC4 = 137.325
Dado que hay ndices de Condicin mayores que 30 ( IC4 137.325 ) se concluye que hay
multicolinealidadenelmodelo.
PROPORCIONESDEDESCOMPOSICINDELAVARIANZA
v 2ji
i j 1,2,..., K i 1,2,..., K
PDV ji = N Variables
v 2ji
i=1 is
Eloperadoreigengendelcomandogenrmatrix permitecalcularlosautovalores(valorespropiosy
losautovectores(vectorespropios)17deunamatrizcuadrada.
# Se calculan el vector de autovalores (valores propios) y la matriz de autovectores (vectores propios)
de la matriz de variables explicativas centradas normalizadas
? AVEXTXCN = 0
Se ha generado la matriz AVEXTXCN = {0}
? AVAXTXCN = eigengen(XCN'XCN,&AVEXTXCN)
Se ha generado la matriz AVAXTXCN
AVEXTXCN (4 x 4)
? print AVAXTXCND
AVAXTXCND (4 x 4)
2.0348 0.0000 0.0000 0.0000
0.0000 0.00010790 0.0000 0.0000
0.0000 0.0000 0.70036 0.0000
0.0000 0.0000 0.0000 1.2647
17
Paraguardarlosautovectoresenunamatrizesnecesarioquedichamatrizestpredefinida.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
25
Se ha generado la matriz AVAXTXCNM
? print AVAXTXCNM
AVAXTXCNM (4 x 4)
2.0348 2.0348 2.0348 2.0348
0.00010790 0.00010790 0.00010790 0.00010790
0.70036 0.70036 0.70036 0.70036
1.2647 1.2647 1.2647 1.2647
? print AVEXTXCN2
AVEXTXCN2 (4 x 4)
0.48678 0.50009 0.012709 0.00042057
0.017667 1.2051e-006 0.49316 0.48918
0.0088094 7.5374e-006 0.48106 0.51013
0.48674 0.49990 0.013078 0.00027730
? print AVEXTXCN2T
AVEXTXCN2T (4 x 4)
0.48678 0.017667 0.0088094 0.48674
0.50009 1.2051e-006 7.5374e-006 0.49990
0.012709 0.49316 0.48106 0.013078
0.00042057 0.48918 0.51013 0.00027730
? print NPDVXTXCN
NPDVXTXCN (4 x 4)
0.23923 0.0086821 0.0043293 0.23921
4634.7 0.011169 0.069854 4632.9
0.018146 0.70415 0.68687 0.018673
0.00033254 0.38679 0.40336 0.00021926
? print DPDVXTXCN
DPDVXTXCN (1 x 4)
4634.9 1.1108 1.1644 4633.2
? print DPDVXTXCNT
DPDVXTXCNT (4 x 1)
4634.9
1.1108
1.1644
4633.2
? print DPDVXTXCNM
DPDVXTXCNM (4 x 4)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
26
? print PDVXTXCN
PDVXTXCN (4 x 4)
5.1614e-005 0.0078162 0.0037181 5.1629e-005
0.99994 0.010055 0.059991 0.99994
3.9151e-006 0.63392 0.58989 4.0303e-006
7.1747e-008 0.34821 0.34640 4.7323e-008
NDICEDEMULTICOLINEALIDAD
2
N Variables
min
imc = i=1
i
1 imc N Variables
? print AVAXTXCNo
AVAXTXCNo (4 x 1)
2.0348
1.2647
0.70036
0.00010790
TESTDEFARRARYGLAUBER
H 0 : | R x |= 1 ortogonalidad
H 1 : | R x | < 1 multicolinealidad
1
G = - [T - 1 - (2K + 5)] ln | R x |
sd
2n
6
BajolahiptesisnulaelestadsticodeFarraryGlaubersedistribuyecomounachicuadradocon
1
n= K(K - 1) gradosdelibertad:
2
Si G 2n ( ) RegindeaceptacinNoserechaza H 0 : | R x |= 1 Ortogonalidad
Si G > 2n ( ) RegincrticaSerechaza H 0 : | R x |= 1 Multicolinealidad
# Se guardan las variables temporales tamao muestral y n de variables explicativas
? T = $T
Se ha generado el escalar T = 30
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
27
? K = $ncoeff-1
Se ha generado el escalar K = 4
Observando el pvalor del estadstico de Farrar y Glauber ( pvchiG = 1.0820845 10-46 ) se rechaza la
hiptesis nula de ortogonalidad para cualquier nivel de significacin, es decir, se acepta la
hiptesisalternativademulticolinealidad.
CASOPARTICULAR:ORTOGONALIDAD
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
28
18
EnunmodeloconortogonalidadeltestdeFarraryGlaubertomasuvalormnimo(0).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
29
COMPROBACIONES
COEFICIENTESDECORRELACINLINEAL
Cuando en el comando corr intervienen dos variables se muestra el coeficiente de correlacin, el
valordelestadsticotquepermitecontrastarlahiptesisnuladeausenciadecorrelacinysupvalor:
corr Xi Xj
Sepuedecomprobarquedichoestadsticot,secorrespondeconelquepermitecontrastarlanulidad
del parmetro que acompaa a una de las variables en un modelo formulado con ordenada en el
origenenelqueelregresandoeslaotravariable:
? ols Xi const Xj --simple
Xj b1 Sb1 tj pvt j
2
SCR = SCR , R-cuadrado = R
Por tanto, para un nivel de significacin fijado , se acepta que existe una correlacin importante
entreambasvariablesparacualquierniveldesignificacinmayorqueelpvaloryserechazaencaso
contrario.
? corr X1 X2
corr(X1, X2) = -0.11511290
Bajo la hiptesis nula de no correlacin:
t(28) = -0.613196, con valor p a dos colas 0.5447
? ols X1 const X2
Modelo 4: MCO, usando las observaciones 1-30
Variable dependiente: X1
Coeficiente Desv. Tpica Estadstico t Valor p
-----------------------------------------------------------------
const 2.75904 0.472878 5.835 2.86e-06 ***
X2 0.000274336 0.000447386 0.6132 0.5447
Media de la vble. dep. 2.470667 D.T. de la vble. dep. 0.268109
Suma de cuad. residuos 2.056964 D.T. de la regresin 0.271041
R-cuadrado 0.013251 R-cuadrado corregido -0.021990
F(1, 28) 0.376010 Valor p (de F) 0.544696
Log-verosimilitud 2.368661 Criterio de Akaike 8.737322
Criterio de Schwarz 11.53972 Crit. de Hannan-Quinn 9.633832
En este caso, dado el tamao muestral y para un nivel de significacin del 5%, slo resulta
significativalacorrelacinentreX1yX4( | r14 | 0.99988178 ).
? corr X1 X2
corr(X1, X2) = -0.11511290
Bajo la hiptesis nula de no correlacin:
t(28) = -0.613196, con valor p a dos colas 0.5447
? corr X1 X3
corr(X1, X3) = -0.09701251
Bajo la hiptesis nula de no correlacin:
t(28) = -0.515775, con valor p a dos colas 0.6101
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
30
? corr X1 X4
corr(X1, X4) = 0.99988178
Bajo la hiptesis nula de no correlacin:
t(28) = 344.089, con valor p a dos colas 0.0000
? corr X2 X3
corr(X2, X3) = -0.26526307
Bajo la hiptesis nula de no correlacin:
t(28) = -1.45579, con valor p a dos colas 0.1566
? corr X2 X4
corr(X2, X4) = -0.11771699
Bajo la hiptesis nula de no correlacin:
t(28) = -0.627261, con valor p a dos colas 0.5356
? corr X3 X4
corr(X3, X4) = -0.09273627
Bajo la hiptesis nula de no correlacin:
t(28) = -0.492838, con valor p a dos colas 0.6260
MATRIZDECORRELACIN
R X XC N' XC N
? print RX XTXCN
RX (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
XTXCN (4 x 4)
1.0000 -0.11511 -0.097013 0.99988
-0.11511 1.0000 -0.26526 -0.11772
-0.097013 -0.26526 1.0000 -0.092736
0.99988 -0.11772 -0.092736 1.0000
La traza de la matriz de correlacin de las variables explicativas coincide con la suma de sus
autovalores(queasuvezcoincideconelnmerodevariablesexplicativas):
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
MULTICOLINEALIDAD
31
K
tr ( R X )
i 1
i Ndevariablesexplicativas
CASOPARTICULAR:ORTOGONALIDAD
Cuando las variables explicativas son ortogonales, la matriz de correlacin coincide con una matriz
identidad:
? corr PC1 PC2 PC3 PC4
Coeficientes de correlacin, usando las observaciones 1 - 30
valor crtico al 5% (a dos colas) = 0.3610 para n = 30
PC1 PC2 PC3 PC4
1.0000 0.0000 0.0000 0.0000 PC1
1.0000 -0.0000 0.0000 PC2
1.0000 -0.0000 PC3
1.0000 PC4
Cuandolasvariablesexplicativassonortogonales,losautovaloresdelamatrizdeproductoscruzados
delasvariablesexplicativascentradastomantodossuvalormximo1:
? RPC = I(4)
Se ha generado la matriz RPC
? AVARPC = eigengen(RPC)
Se ha generado la matriz AVARPC
? print AVARPC
AVARPC (4 x 1)
1
1
1
1
Cuando las variables explicativas son ortogonales, el indice de multicolinealidad toma su valor
mximonmerodevariablesque,enestecaso,es4:
? genr imc = (AVARPC[4]/AVARPC[1])^2 + (AVARPC[4]/AVARPC[2])^2 + \
(AVARPC[4]/AVARPC[3])^2 + (AVARPC[4]/AVARPC[4])^2
Se ha reemplazado el escalar imc = 4
Cuando las variables explicativas son ortogonales, los Factores de Incremento de la Varianza son
todos iguales a la unidad y en cada fila de la matriz de Proporciones de Descomposicin de la
Varianzahayunnicoelementomayoroigualque0.5:
? ols YC PC1 PC2 PC3 PC4 --quiet
? vif
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
32
PC2 1.000
PC3 1.000
PC4 1.000
VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de correlacin mltiple
entre la variable j y las dems variables independientes
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
INTRODUCCIN
Si el modelo cumple todas las hiptesis de un MRLNC, los estimadores MCO no slo son
adecuados, sino incluso los mejores (ms eficientes) que podran llegar a obtenerse. En este
puntocabrapreguntarse,sirealmente,apriori,sepuedegarantizarunacorrectaespecificacin
del modelo, en el sentido de garantizar que se cumplan todas las hiptesis de partida. Resulta
evidente la no existencia de dichas garantas a priori, debe ser el proceso de elaboracin del
modelo el que permita establecer criterios para juzgar su mayor o menor idoneidad, e incluso
establezcaposiblesvasdeperfeccionamiento.
Elprocesodecontrasteyvalidacindelmodelopuedellevarseacabodediversasformas,siendo
una de ellas los contrastes de hiptesis bsicas (contrastes de diagnosis del modelo), con la
finalidad de evidenciar las distorsiones que puede provocar la equivocada admisin inicial de
hiptesis no acordes con la aplicacin realizada. En este captulo y en los siguientes se
contrastarnlashiptesisdecomportamientodelMRLNCyseobtendrnestimadoresalternativos
alosMCOencasodequeestosdejendeseradecuados.
DETECCINDELANONORMALIDADDELASPERTURBACIONES
El primer paso para la deteccin de problemas de no normalidad de las perturbaciones es la
estimacindelmodeloporMCOylaobtencindelosresiduosoerroresdeestimacin19,eneste
casosehautilizadoelficherodatos2.gdt20:
# Se estima el modelo por MCO
? ols Y const X1 X2
19
Larelacinqueexisteentreresiduoyperturbacinvienedadapor et X t' b t
20
Elficherodatos2.gdtcontieneinformacinrelativaa20familiasparalasvariables:consumofamiliarmensualmedio
de aceite de oliva en litros (Y), precio medio de compra del aceite de oliva en euros/litro (X1), ingresos familiares
mensualesmedioseneuros(X2).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
34
Suma de cuad. residuos 1.331946 D.T. de la regresin 0.279910
R-cuadrado 0.961449 R-cuadrado corregido 0.956913
F(2, 17) 211.9857 Valor p (de F) 9.58e-13
Log-verosimilitud 1.287856 Criterio de Akaike 8.575713
Criterio de Schwarz 11.56291 Crit. de Hannan-Quinn 9.158845
GRFICOSDELOSRESIDUOS
Las representaciones grficas de los residuos pueden ayudar a vislumbrar problemas de no
normalidad.Paraello,losresiduossepuedenrepresentarrespectoalordendelasobservaciones,
respectoalavariableexplicadayrespectoacadaunadelasvariablesexplicativasqueintervienen
enelmodelo.
Parafacilitarelanlisisdeestosgrficos,ademsdelalneaquepasaporelcero(querepresenta
la media de los residuos), resulta conveniente trazar dos lneas paralelas al eje horizontal para
definir una banda de variacin que represente msmenos dos veces la desviacin tpica de los
residuos,loquepermitiranalizardeformasencillasidichosresiduossedistribuyendeacuerdo
conunanormal,encuyocasosusvaloresestarancomprendidosdentrodeesabandaconun95%
deprobabilidad.
Tambin resulta de inters el grfico en el que se representan los cuantiles observados de los
residuosrespectoaloscuantilesesperadossidichosresiduossiguieranunaleynormal.
ESTADSTICOSDESCRIPTIVOS
Las medidas de forma comparan la forma que tiene la representacin grfica, bien sea el
histogramaoeldiagramadebarrasdeladistribucinobservada,conladistribucinnormal:
CoeficientedeAsimetradePearson21:midelacantidaddedatosqueseagrupanentornoala
media.
3
T
et e
1
1 S
T t 1 e
m3
21
Otraformadecalcularelcoeficientedeasimetra: 1
m23 / 2
donde m2 S 2 S12 y m3 S 3 3S1S 2 2S13 son los momentos centrados de segundo y tercer orden y
T
e
1
SK K
t K 1,2,3 sonlosmomentosnocentradosdeordenK.
T t 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
35
e
T
T
1 1 2
donde e et eslamediay S e t e ladesviacintpicadelosresiduos.
T t 1
T t 1
Sedefinen3tiposdedistribucionessegnsugradodeasimetra:
CoeficientedeexcesodeCurtosis22:midelamayoromenorcantidaddedatosqueseagrupan
entornoalosvalorescentrales.
4
T
et e
1 3
2 S
T t 1 e
e
T
T
1 1 2
donde e et eslamediay S e t e ladesviacintpicadelosresiduos.
T t 1
T t 1
Sedefinen3tiposdedistribucionessegnsugradodecurtosis:
m4
22
Otraformadecalcularelcoeficientedeexcesodecurtosis: 2 3
m22
donde m 2 S 2 S12 y m4 S 4 4 S1 S 3 6 S12 S 2 3S14 son los momentos centrados de segundo y cuarto orden y
T
e
1
SK t
K
K 1,2,3,4 sonlosmomentosnocentradosdeordenK.
T t 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
36
alrededordelosvalorescentralesdelavariable(menosapuntadaquelanormal).
TESTDEJARQUEBERA
El test de JarqueBera23 es una prueba asinttica basada en los residuos MCO. Analiza los
coeficientesdeasimetrayexcesodecurtosisyloscomparaconlosdeunadistribucinnormal.
H 0 : Normalidad
H1 : No normalidad
2 2 sd
JB t12 t22 T 1 2 22
6 24
Si JB 22 ( ) alniveldesignificacin serechazalahiptesisnuladenormalidad,puesfallaal
menosunadelascaractersticasdeforma.
TESTDEASIMETRA
Unaprimerapruebaparalanormalidadconsistirencontrastarlahiptesisdequeladistribucin
delaqueprovienenlosresiduostieneunasimetranormal24:
H 0 : No hay asimetra : 1 = 0
H1 : Existe asimetra (positiva o negativa) : 1 0
1 1
Paracontrastarestahiptesisseutilizaelestadstico t1 = ,quebajolahiptesisnulase
S1 6/T
distribuirasintticamentecomounaN(0,1).
TESTDEEXCESODECURTOSIS
Unasegundapruebaparalanormalidadconsistirencontrastarlahiptesisdequeladistribucin
delaqueprovienenlosresiduostieneunacurtosisoapuntamientonormal25:
23
Bajolahiptesisdenormalidaddelasperturbacionesycuandolamuestraseasuficientementegrande,eltestde
JarqueBera se distribuye como una chi cuadrado con dos grados de libertad, ya que es la suma de dos variables
AN(0,1)alcuadrado.
24
Bajonormalidadelcoeficientedeasimetraesnuloysedistribuyeasintticamentenormal 1
sd
AN 0, 6 / T .
25
Bajo normalidad el coeficiente de exceso de curtosis es nulo y se distribuye asintticamente normal
2 AN 0, 24 / T .
sd
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
37
2 2
Paracontrastarestahiptesisseutilizaelestadstico t 2 = ,quebajolahiptesisnulase
S2 24 / T
distribuirasintticamentecomounaN(0,1).
26
OtraformadeaccederaestainformacinseraenlaVentanaPrincipaldeGretl,seleccionarla/svariable/syenel
menqueseabrealhacerclicconelbotnderechodelratn,elegirEstadsticosprincipales.ObienenlaVentana
PrincipaldeGretl,seleccionarla/svariable/syenelmenVerseleccionarEstadsticosprincipales.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
38
Media 2.9310e-015
Mediana 0.056038
Mnimo -0.64192
Mximo 0.36023
Desviacin tpica 0.26477
C.V. 9.0334e+013
Asimetra -0.61677
Exc. de curtosis -0.096815
Percentil del 5% -0.62765
Percentil del 95% 0.35942
Rango intercuartlico 0.43016
Observaciones ausentes 0
COMANDOmodtest : TESTDENORMALIDADDEDOORNIKHANSEN
Elcomandomodtestdebeirprecedidoporuncomandools(paracalculareltestdenormalidad,
GretlutilizalosresiduosdelaltimaestimacinMCOrealizada).
Elformatodelcomandomodtest27paraladeteccindenonormalidades28:
modtestnormality
Lasalidaestndardelcomandomodtestes:
? modtest --normality
27
OtraformadeaccederaestainformacinseraseleccionarNormalidaddelosresiduosenelmenContrastesdela
VentanaModelo.Deestaforma,GretlproporcionaademsdeltestdeDoornikHansenydelatabladedistribucinde
frecuencias,unhistogramaenelqueserepresentaelcomportamientodelafuncindedensidadobservadayenelque
para facilitar su interpretacin, se superpone una curva de la distribucin normal. Gretl por defecto para la
construccindeestegrficoutiliza7intervalos.
SiseaccedealaconstruccindedichogrficoseleccionandoenlaVentanaPrincipaldeGretllavariablequecontiene
lasobservacionesdelosresiduosyenelmenVariableseseleccionaDistribucindefrecuenciassepuedecambiar
elnmerodeintervalos,definirelvalormnimo(intervaloizquierdo),definirlaamplituddelosintervalos,mostrarla
tabladefrecuencias,mostrarelcontrastedenormalidadymostrarelgrfico.
28
Observacin: de los comandos de los que dispone Gretl para la deteccin de normalidad, el nico que contrasta
verdaderamentelanormalidaddelosresiduosdelmodeloeselcomandomodtestconlaopcinnormality,yaque
vinculadichosresiduosalmodelo,mientrasqueelrestodecomandostratanlosresiduoscomounavariableaislada.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
39
Enestecaso,conelcontrastedeDoornikHansenseaceptaralahiptesisnuladenormalidadde
lasperturbacionesparacualquierniveldesignificacinmenoroigual al40.83%yserechazara
paranivelesdesignificacinsuperiores( p valor 0.40827 ).
# Se estima el modelo por MCO
? ols Y const X1 X2 --quiet
2.5
Estadstico para el contraste de normalidad: e
N(2.931e-015,0.26477)
Chi-cuadrado(2) = 1.792 [0.4083]
1.5
Densidad
0.5
0
-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8
e
Ilustracin1.Ejemplogrficodedistribucindefrecuenciasrespectoaunadistribucinnormal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
40
COMANDOnormtest
Elformatodelcomandonormtest29es:
normtestresiduosopciones
Paraanalizarlanormalidaddelosresiduos,antesdeejecutarelcomandonormtestsernecesario
guardardichosresiduos,yaqueestecomandopodrautilizarseparacontrastarlanormalidadde
cualquiervariable.
Algunasdelasopcionesdisponiblesdelcomandonormtestson:
dhansen proporciona el test de DoornikHansen (aparece tambin cuando no se especifica
ningunaopcin)
swilkproporcionaeltestWdeShapiroWilk
lillieproporcionaeltestdeLilliefors
jberaproporcionaeltestdeJarqueBera
all proporcionatodoslostestdenormalidaddisponiblesenGretl(loscitadosanteriormente)
DeloscuatrotestsdenormalidadproporcionadosporGretl,serecomiendautilizarlaspruebasde
DoornikHansenyWdeShapiroWilkenmuestraspequeasylaspruebasdeLillieforsyJarque
Beraenmuestrasgrandes.
Cuando se ejecuta el comando normtest sin opciones, la salida slo muestra el test de Doornik
Hansenysupvalor.
ParaaccederalabateracompletadetestqueGretlproporcionaparaanalizarlanormalidadde
lasperturbaciones,elcomandonormtestsedebeejecutarconlaopcinall.
ols Y const X1 X2 XK --quiet
e = $uhat
? normtest e --all
Contraste de normalidad de uhat1:
En este caso, con la batera de contrastes se aceptara la hiptesis nula de normalidad de las
perturbaciones para cualquier nivel de significacin menor o igual al 40.83% con el test de
DoornikHansen( p valor 0.40827 ),al31.39%coneltestWdeShapiroWilk( p valor 0.313921 ),
29
OtraformadeaccederaestainformacinseraenlaVentanaPrincipaldeGretl,enelmenVariableseleccionar
ContrastedeNormalidad.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
41
al 43% con el test de Lilliefors ( p valor 0.43 ) y al 52.84% con el test de JarqueBera
( p valor 0.528398 ). En este caso, dado que el tamao muestral es pequeo, los test ms
adecuadosparacontrastarlanormalidadsonelDoornikHansenyelWdeShapiroWilk.
# Se estima el modelo por MCO
? ols Y const X1 X2 --quiet
Contraste de normalidad de e:
COMANDOfreq
Elformatodelcomandofreq30es:
freqresiduosnormal
Para analizar la normalidad de los residuos, antes de ejecutar el comando freq ser necesario
guardardichosresiduos,yaqueestecomandopodrautilizarseparacontrastarlanormalidadde
cualquiervariable.
Cuandoseejecutaelcomandofreqsinopciones,lasalidaslomuestralatabladedistribucinde
frecuencias.
Cuando se ejecuta el comando freq con la opcin normal, la salida muestra la tabla de
frecuenciasconelestadsticodeDoornikHansenysupvalor31.
ols Y const X1 X2 XK --quiet
e = $uhat
? freq e --normal
Distribucin de frecuencias para e , observaciones 1 - T
nmero de cajas = n , media = e , desv.tp.= se
30
OtraformadeaccederaestainformacinseraenlaVentanaPrincipaldeGretl,enelmenVariableseleccionar
Distribucindefrecuencias.
31
Lasalidaestndardelcomandofreqconlaopcinnormalessimilaralaobtenidaconelcomandomodtestconla
opcinnormality.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
42
liI 2 - lsI 2 pmI 2 fab 2 fre 2 fac 2
liI3 - lsI3 pmI3 fab3 fre3 fac3
lsI n pmI n fab n fre n facn
Enestecaso,conelcontrastedeDoornikHansenseaceptaralahiptesisnuladenormalidadde
lasperturbacionesparacualquierniveldesignificacinmenoroigual al40.83%yserechazara
paranivelesdesignificacinsuperiores( p valor 0.40827 ).
# Se estima el modelo por MCO
? ols Y const X1 X2 --quiet
COMANDOqqplot
Elformatodelcomandoqqplot32es:
qqplotresiduosopciones
Paraanalizarlanormalidaddelosresiduos,antesdeejecutarelcomandoqqplotsernecesario
guardardichosresiduos,yaqueestecomandopodrautilizarseparacontrastarlanormalidadde
cualquiervariable.
32
OtraformadeaccederaestainformacinseraenlaVentanaModeloyenelmenGrficos,seleccionarGrficoQ
Qdelosresiduos.Deestaforma,Gretlproporcionaloscuantilesobservadosdelaserieseleccionadarespectoalos
cuantilesdeladistribucinnormal.
SiseaccedealaconstruccindedichogrficoseleccionandoenlaVentanaPrincipaldeGretllavariablequecontiene
las observaciones de los residuos y en el men Variable se selecciona Grfico QQ normal se puede optar por el
grficoanterior(equivalenteautilizarelcomandonormtestsinopciones),porestandarizarlosdatos(equivalentea
utilizarelcomandonormtestconlaopcinzscores)oporrepresentarloscuantilesbrutosrespectoaunanormal
reducida(equivalenteautilizarelcomandonormtestconlaopcinraw).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
43
Cuando se ejecuta el comando qqplot sin opciones, Gretl proporciona un grfico donde se
representan los cuantiles observados de la serie seleccionada respecto a los cuantiles de la
distribucin normal. Para que Gretl proporcione dicho grfico es necesario que en el rango
muestral corriente exista un mnimo de veinte observaciones vlidas. Por defecto los cuantiles
observados se representan respecto de los cuantiles de una distribucin normal cuya media y
varianzacoincidenconladelosdatosdelamuestra.
Algunasdelasopcionesdisponiblesdelcomandoqqplotson:
zscoresloscuantilessecalculancondatosestandarizados
rawserepresentanloscuantilesbrutosrespectoaunaN(0,1)
Enestecaso,losgrficosQQobtenidosvislumbranlaexistenciadenormalidad,yaquelanubede
puntosseencuentraentornoalabisectriz.
# Se estima el modelo por MCO
? ols Y const X1 X2 --quiet
1.5
0.5
-0.5
-1
-1.5
-2
-2.5
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
Cuantiles de la Normal
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
44
0.4
0.2
-0.2
-0.4
-0.6
-0.8
-0.6 -0.4 -0.2 0 0.2 0.4 0.6
Cuantiles de la Normal
0.2
-0.2
-0.4
-0.6
-0.8
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
Cuantiles de la Normal
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
45
COMANDOgnuplot
Elformatodelcomandognuplot33es:
gnuplotvariablesejeverticalvariableejehorizontalopciones
Cuandoseejecutaelcomandognuplot,Gretlproporcionaungrficodondeserepresentanenel
eje vertical las variables proporcionadas en primer lugar y en el eje horizontal la ltima de las
variablesproporcionada.
En este caso, se representan los residuos frente al n de observacin, los residuos frente a la
variableaexplicarylosresiduosfrenteacadaunadelasvariablesexplicativas.Comopuedeverse
enla
Ilustracin2,Ilustracin3,Ilustracin4eIlustracin5,elanlisisdelanormalidaddelosresiduos
resultamsfcilenlosgrficosdeladerechaqueenlosdelaizquierdaportenerestosltimosla
bandadevariacin.
# Se estima el modelo por MCO
? ols Y const X1 X2 --quiet
De acuerdo con estos grficos, para un nivel de significacin del 5% se puede aceptar la
normalidaddelosresiduospordistribuirsedeformasimtricaysituarsetodosmenosunodentro
delabandadeconfianzadel95%34.
33
OtraformadeaccederaestosgrficosseraenlaVentanaModeloyenelmenGrficos,seleccionarGrficode
residuos y elegir la opcin deseada (residuos frente al n de observacin, residuos frente a la variable a explicar y
residuosfrenteacadaunadelasvariablesexplicativas).
34
Adems,enestosgrficossedetectaunvaloratpicouobservacinanmala(observacinquesesitafueradela
bandadeconfianza)ysernecesariodarleuntratamientodiferenciadoalrestodelasobservaciones(temaqueno
sertratadoenestecaptuloporestarfueradesusobjetivos).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
46
# Se representan los residuos frente al n de observacin
? gnuplot e --time-series
escribi C:\gpttmp01.plt
0.4
0.2
0.2
0
0
residuo
residuo
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8 -0.8
2 4 6 8 10 12 14 16 18 20 2 4 6 8 10 12 14 16 18 20
Ilustracin2.Grficodelosresiduosrespectoalordendelasobservaciones
0.4 0.6
0.4
0.2
0.2
0
0
residuo
residuo
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8 -0.8
8 9 10 11 12 13 8 9 10 11 12 13
y y
Ilustracin3.Grficodelosresiduosrespectoalavariableexplicada
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
47
# Se representan los residuos frente a la primera variable explicativa
? gnuplot e X1
escribi C:\gpttmp03.plt
0.4
0.2
0.2
0
0
residuo
residuo
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8 -0.8
2 2.2 2.4 2.6 2.8 3 2 2.2 2.4 2.6 2.8 3
x1 x1
Ilustracin4.GrficodelosresiduosrespectoaX1
0.2 0.4
0.2
0
0
residuo
residuo
-0.2
-0.2
-0.4
-0.4
-0.6
-0.6
-0.8 -0.8
800 900 1000 1100 1200 1300 800 900 1000 1100 1200 1300
x2 x2
Ilustracin5.GrficodelosresiduosrespectoaX2
SOLUCIONESALANONORMALIDADDELASPERTURBACIONES
La no normalidad de los residuos puede estar provocada por mltiples motivos, siendo los ms
habituales, la existencia de observaciones anmalas o datos atpicos (outliers), que los datos
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
48
procedandemsdeunapoblacinolaespecificacinincorrectadelmodelo(omisindevariables
relevantes,faltadelinealidad,).
Parasolucionaresteproblemasesuelerecurriralaintroduccindevariablesficticiasparatratar
de forma diferenciada los datos atpicos o los datos procedentes de distintas poblaciones o a la
reformulacin del modelo o a la transformacin de las variables (transformacin tipo BoxCox)
cuandoexistaunproblemadeespecificacin.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
49
CLCULOS
# Se estima el modelo
? ols Y const X1 X2 quiet
# Se calculan los momentos no centrados de orden primero (S1), segundo (S2), tercero (S3) y cuarto
(S4)
? S1e = (1/T)*sum(e)
Se ha generado el escalar S1e = 2.93099e-015
? S2e = (1/T)*sum(e^2)
Se ha generado el escalar S2e = 0.0665973
? S3e = (1/T)*sum(e^3)
Se ha generado el escalar S3e = -0.0106
? S4e = (1/T)*sum(e^4)
Se ha generado el escalar S4e = 0.0128762
# Se calculan los momentos centrados de orden segundo (m2), tercero (m3) y cuarto (m4)
? m2e = S2e-(S1e^2)
Se ha generado el escalar M2e = 0.0665973
? m3e = S3e-(3*S1e*S2e)+(2*(S1e^3))
Se ha generado el escalar M3e = -0.0106
? m4e = S4e-(4*S1e*S3e)+(6*(S1e^2)*S2e)-(3*(S1e^4))
Se ha generado el escalar M4e = 0.0128762
COEFICIENTEDEASIMETRADEPEARSON
3
T et e
1
1
T S
t 1 e
e
T
T
1 1 2
donde e et eslamediay S e t e ladesviacintpicadelosresiduos.
T t 1
T t 1
En este caso, como el coeficiente de asimetra ( 1 -0.61677 ) est cercano a cero, se podra
aceptar la hiptesis de que la distribucin de la que provienen los residuos tiene una simetra
normal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
50
m3
1
m23 / 2
donde m2 S 2 S12 y m3 S3 3S1S 2 2S13 son los momentos centrados de segundo y tercer
T
e
1
ordeny S K K
t con K 1,2,3 sonlosmomentosnocentradosdeordenK.
T t 1
COEFICIENTEDEEXCESODECURTOSIS
4
T
et e
1 3
2 S
T t 1 e
e
T
e eslamediay S
T
1 1 2
donde e t e t e ladesviacintpicadelosresiduos
T t 1
T t 1
En este caso, como el coeficiente de exceso de curtosis ( 2 -0.096815 ) est cercano a cero, se
podra aceptar la hiptesis de que la distribucin de la que provienen los residuos tiene una
curtosisoapuntamientonormal.
m4
2 3
m22
e
1
cuartoordeny S K K
t con K 1,2,3,4 sonlosmomentosnocentradosdeordenK.
T t 1
# Se calcula el coeficiente de exceso de curtosis con los momentos centrados de los residuos
? cece = (m4e/(m2e^2))-3
Se ha generado el escalar cece = -0.0968151
TESTDEASIMETRA
H 0 : No hay asimetra : 1 = 0
H1 : Existe asimetra (positiva o negativa) : 1 0
1
t1
sd
N (0,1)
S1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
51
3
T
et e
1 6
donde 1 S eselcoeficientedeasimetray S1 T esladesviacinestndardel
T t 1 e
coeficientedeasimetra.
TESTDEEXCESODECURTOSIS
H 0 : No hay exceso de curtosis : 2 = 0
H1 : Existe exceso de curtosis : 2 0
2
t2
sd
N (0,1)
S2
4
T
et e 24
donde 2 1
T
t 1
S
e
3 eselcoeficientedeexcesodecurtosisy S
2
T
esladesviacin
estndardelcoeficientedeexcesodecurtosis.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
52
TESTDEJARQUEBERA
H 0 : Normalidad
H1 : No normalidad
2 2 sd
JB T 1 2 22
6 24
UtilizandolaregladelpvalorconeltestdeJarqueBeraenestecaso,seaceptaralahiptesisnula
denormalidaddelasperturbacionesparacualquierniveldesignificacinmenoroigualal52.84%
( p valor 0.528398 ).
Utilizando la regla del valor crtico en este caso, como el test de JarqueBera ( JB = 1.27581 ) es
inferioralvalorcrticodeladistribucinchicuadradocondosgradosdelibertad( vcchiJB = 5.99146 ),
al 5% se acepta la hiptesis de que la distribucin de la que provienen los residuos tiene una
simetrayunacurtosisoapuntamientonormal.
Observacin: debe de tenerse en cuenta que dado que en este caso el tamao muestral es
pequeo,lostestmsadecuadosparacontrastarlanormalidadsonelDoornikHansenyelWde
ShapiroWilk.
H 0 : Normalidad
H1 : No normalidad
2 2
JB t12 t 22 1 2
sd
22
S S
1 2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
NORMALIDAD
53
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
54
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
55
HETEROCEDASTICIDAD
INTRODUCCIN
Una de las hiptesis de comportamiento del MRLNC es que las perturbaciones tienen la misma
varianza, es decir, son homocedsticas. Se trata de una hiptesis muy restrictiva y, en algunos
casos,pocorealista,sobretodo,sisetrabajacondatosdecortetransversal.
SiseignoralaheterocedasticidadyseestimaelmodeloporMCO,losestimadoresobtenidosno
sernlosdemenorvarianzaentretodoslosestimadoreslinealeseinsesgadosdelosparmetros,
dehecho,elverdaderovalordesusvarianzasestarsubestimado.
DETECCINDELAHETEROCEDASTICIDAD
ElprimerpasoparaladeteccindeheterocedasticidadeslaestimacindelmodeloporMCOyla
obtencin de los residuos o errores de estimacin35, en este caso se ha utilizado el fichero
datos3.gdt36:
# Con las 30 primeras observaciones se har la estimacin del modelo
? smpl 1 30
Rango de datos completo: 1 - 34 (n = 34)
Muestra actual: 1 - 30 (n = 30)
35
Larelacinqueexisteentreresiduoyperturbacinvienedadapor et X t' b t
36
Elficherodatos3.gdtcontieneinformacinrelativaa34familiasparalasvariables:consumofamiliarmensualmedio
deaceitedeolivaenlitros(Y),ingresosfamiliaresmensualesmedioseneuros(X1)ytamaofamiliar(X2).Conlas30
primerasobservacionesseharlaestimacinyconlas4ltimaslaprediccin.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
56
# Se guardan los residuos
? e = $uhat
Se ha generado la serie e (ID 7)
MTODOGRFICO
Esunmtodoinformal,perodegranutilidadparadiagnosticarlaheterocedasticidad,determinar
su estructura y ayudar a solucionar el problema. Con este fin se pueden utilizar varios tipos de
grficos:
GRFICOSDELASVARIABLES
En los grficos de las variables se representa la variable dependiente respecto a las variables
explicativas.Lanubedepuntospuedeayudaravislumbrarlaexistenciadeheterocedasticidady,si
staexiste,laformafuncionaldelgrficopuedesugerireltipodeheterocedasticidad.
GRFICODELOSRESIDUOS
En el grfico de los residuos se representan los residuos
respecto a los valores estimados del regresando. La nube de
puntos puede ayudar a vislumbrar la existencia de
heterocedasticidad.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
57
dispersinentrelosresiduosalaumentarlosvaloresestimadosdelregresando).
GRFICOSDELOSRESIDUOSALCUADRADO
Enlosgrficosdelosresiduosalcuadradoserepresentanlosresiduosalcuadradorespectoalos
valores estimados del regresando o los valores de alguna variable de la que se sospecha es la
causante de heterocedasticidad. La nube de puntos puede ayudar a vislumbrar la existencia de
heterocedasticidad y, si sta existe, la forma funcional del grfico puede sugerir el tipo de
heterocedasticidad.
TESTSESTADSTICOS
La mayora de los tests para detectar la presencia de heterocedasticidad estn basados en el
anlisisdelosresiduosMCO.
37
Bajolahiptesisdehomocedasticidadynormalidaddelasperturbaciones.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
58
CONTRASTEDEWHITE
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
PararealizarelcontrastedeWhiteesnecesarioestimarelmodeloporMCO,calcularlosresiduos,
formular la regresin auxiliar de los residuos al cuadrado frente a las variables explicativas, sus
cuadrados y sus productos cruzados y calcular el coeficiente de determinacin o la Suma de
CuadradosdeRegresin:
W1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
SCR sd
W2 2p p ndevariablesexplicativasdelaregresinauxiliar
2 2
donde 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
UnavariantedelcontrastedeWhiteconsisteenformularlaregresinauxiliardelosresiduosal
cuadrado frente a las variables explicativas y sus cuadrados, sin tener en cuenta los productos
cruzados:
W3 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
59
SCR sd
W4 2p p ndevariablesexplicativasdelaregresinauxiliar
2 2
donde 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
CONTRASTEDEBREUSCHPAGAN
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
PararealizarelcontrastedeBreuschPaganesnecesarioestimarelmodeloporMCO,calcularlos
residuos y estandarizarlos, formular la regresin auxiliar de los residuos estandarizados al
cuadradofrentealasvariablesexplicativasycalcularelcoeficientededeterminacinolaSumade
CuadradosdeRegresin:
rt2 0 1 X 1t 2 X 2t ... K X Kt ut
BP1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
EstaversinrobustadelcontrastedeBreuschPaganseconocecomocontrastedeKoenker.
SCR sd
BP2 2p p ndevariablesexplicativasdelaregresinauxiliar
2
CONTRASTEDEGOLDFELDQUANDT
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
PararealizarelcontrastedeGoldfeldQuandt,sisecreequelaheterocedasticidadescreciente(la
varianza de la perturbacin depende directamente de los valores de la variable) es necesario
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
60
ordenarlasvariablesdeacuerdoconlosvalorescrecientesdelavariablequesesospechequees
la causante de la heterocedasticidad38, omitir las p observaciones centrales denominando
respectivamente grupo 1 ( G1 ) y grupo 2 ( G 2 ) a las observaciones situadas por debajo y por
encima de las omitidas39, estimar el modelo por MCO en cada grupo, calcular las Sumas de
CuadradosdelosErrores(SCE1ySCE2)ycalcularelestadsticodeGoldfeldQuandt(GQ):
SCE 2
gl2 T-p
G Q =
sd
F gl
gl1
2
gl1 gl 2 = - (K + 1)
SCE 1 2
gl1
PRUEBADEHARVEY
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
PararealizarlapruebadeHarveyesnecesarioestimarelmodeloporMCO,calcularlosresiduos,
formular la regresin auxiliar del logaritmo natural del cuadrado de los residuos frente a las
variables explicativas y calcular el coeficiente de determinacin o la Suma de Cuadrados de
Regresin:
ln et2 0 1 X 1t 2 X 2t ... K X Kt ut
H1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
SCR
H2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
4.9348
38
Sisecreequelaheterocedasticidadesdecreciente(lavarianzadelaperturbacindependeinversamentedelos
valoresdelavariable)sedebeordenarlamuestradeacuerdoconlosvaloresdecrecientesdedichavariableyproceder
delamismaforma.
39
Normalmente p=1/3 de la muestra y es aconsejable que el n de observaciones de los dos grupos sea igual o
aproximadamenteigual.
40
Sisesospechaheterocedasticidaddecrecienteysemantienelaordenacincrecientealniveldesignificacin se
rechazalahiptesisdehomocedasticidadsi G Q F glgl12 ( 1 ) .
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
61
TESTDEGLEJSER
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
Para realizar test de Glejser es necesario estimar el modelo por MCO, calcular los residuos,
formularlaregresinauxiliardelvalorabsolutodelosresiduosfrentealasvariablesexplicativasy
calcularelcoeficientededeterminacinolaSumadeCuadradosdeRegresin:
| et | 0 1 X 1t 2 X 2t ... K X Kt ut
G1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
SCR
G2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
2 2
1
donde 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
TESTDEBARLETT
Seutilizacuandosesospechaquelaheterocedasticidadesporgrupos.
Paramuestrasgrandes:
p
TB = (T - p) ln 2 - ( T - 1) ln
i=1
i
2
i
sd
2p 1
donde:T=tamaomuestral
p=nmerodegrupos
SCE
2 =estimadormximoverosmildelavarianzatotal 2
T
Ti=tamaodelgrupoi
SCEi
i2 =estimadormximoverosmildelavarianzadelgrupoi i2
Ti
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
62
Enmuestraspequeassesueleutilizar:
p
TB
(T - p) ln 2 - ( T - 1) ln
i
2
i
TBC = p
i=1
sd
2p 1
FC
( T - 1 )
1 -1
1+ [ i - (T - p )-1 ]
3 (p - 1) i=1
p
1
dondeFC=factordecorreccin FC = 1 + [ ( T i - 1 )-1 - (T - p )-1 ]
3 (p - 1) i=1
COMANDOSPARALADETECCINDEHETEROCEDASTICIDAD
COMANDOgnuplot
Elformatodelcomandognuplot41es:
gnuplotvariable/sejeverticalvariableejehorizontalopciones
Cuandoseejecutaelcomandognuplot,Gretlproporcionaungrficodondeserepresentanenel
ejeverticalla/svariable/sproporcionada/senprimerlugaryenelejehorizontallaltimadelas
variablesproporcionada.
En este caso, si se representa el regresando frente a cada una de las variables explicativas, se
sospechalaexistenciadeheterocedasticidaddecrecienteprovocadaporlavariableX1.
41
OtraformadeaccederaestosgrficosseraenlaVentanaPrincipalyenelmenVerseleccionarGrficosyelegir
GrficoXY(scatter)yenlaventanaemergenteseleccionarlasvariablesdelejeXydelejeY.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
63
? gnuplot Y X1
escribi C:\gpttmp01.plt
13
12
11
Y
10
8
800 900 1000 1100 1200 1300
X1
? gnuplot Y X2
escribi C:\gpttmp02.plt
13
12
11
Y
10
8
1 2 3 4 5 6 7
X2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
64
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? ye = $yhat
Se ha generado la serie ye (ID 8)
#
? gnuplot e ye
escribi C:\gpttmp03.plt
1.5
0.5
0
e
-0.5
-1
-1.5
-2
9 10 11 12 13
ye
Si se representan los residuos al cuadrado frente alregresando, no se sospecha la existencia de
heterocedasticidad.
# Se genera el cuadrado de los residuos
? e2 = e^2
Se ha generado la serie e2 (ID 9)
? gnuplot e2 ye
escribi C:\gpttmp04.plt
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
65
2.5
1.5
e2
0.5
0
9 10 11 12 13
ye
Siserepresentanlosresiduosalcuadradofrentealaprimeraexplicativa,sesospechalaexistencia
deheterocedasticidaddecrecienteprovocadaporlavariableX1.
? gnuplot e2 X1
escribi C:\gpttmp05.plt
1.5
1
e2
0.5
-0.5
800 900 1000 1100 1200 1300
X1
COMANDOmodtest
El comando modtest debe ir precedido por un comando ols, ya que para analizar la
heterocedasticidad,GretlutilizalosresiduosdelaltimaestimacinMCOrealizada.
Elformatodelcomandomodtestes:
modtestopciones
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
66
Gretl proporciona dos tipos de tests para la deteccin de heterocedasticidad, los basados en el
coeficientededeterminacin(testsLM)ylosbasadosenlaSumadeCuadradosdelaRegresin
(tests de Wald). Estos tests presuponen una determinada estructura para la heterocedasticidad,
estructura que ser tenida en cuenta a la hora de obtener los estimadores Mnimo Cuadrticos
GeneralizadosFactiblesdelmodelo.
Para realizar el contraste de White en funcin de las variables exgenas, sus cuadrados y sus
productoscruzadosseutilizarlaopcinwhite:
? ols Y const X1 X2 XK --quiet
? modtest --white --quiet
Enestecaso,conelcontrastedeWhiteserechazaralahiptesisalternativadeheterocedasticidad
para cualquier nivel de significacin menor o igual al 1.15% y se aceptara para niveles de
significacinsuperiores( p valor 0.011488 ):
? ols Y const X1 X2 --quiet
? modtest --white --quiet
42
Adiferencia de otrospaquetes economtricos, la batera de contrastes de heterocedasticidad querealiza Gretl es
muy reducida, pero es relativamente sencillo establecer un conjunto de instrucciones que permitan contrastar otras
estructurascomopuedenserlasestablecidasporHarvey,Gleser,etc.
43
Otra forma de acceder a esta informacin sera seleccionar Heterocedasticidad en el men Contrastes de la
VentanaModeloyseleccionarelcontrastedeseado.
44
Todaslasregresionesauxiliaresestnformuladasconordenadaenelorigen.Siseestinteresadoenverlaregresin
auxiliarsedeberejecutarelcomandomodtestsinlaopcinquiet.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
67
Para realizar el contraste de White en funcin de las variables exgenas y sus cuadrados (sin
considerarlosproductoscruzados)seutilizarlaopcinwhitenocross:
? ols Y const X1 X2 XK --quiet
? modtest --white-nocross --quiet
Enestecaso,conelcontrastedeWhiteserechazaralahiptesisalternativadeheterocedasticidad
para cualquier nivel de significacin menor o igual al 0.07% y se aceptara para niveles de
significacinsuperiores( p valor 0.007029 ):
? ols Y const X1 X2 --quiet
? modtest --white-nocross --quiet
Estadstico de contraste: LM = BP ,
con valor p = P(Chi-cuadrado( GLBP ) > BP ) = pvBP
PararealizarelcontrastedeBreuschPaganbasadoenelcoeficientededeterminacinseutilizarla
opcinbreuschpaganrobust:
? ols Y const X1 X2 XK --quiet
? modtest --breusch-pagan --robust --quiet
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
68
? ols Y const X1 X2 --quiet
? modtest --breusch-pagan --robust --quiet
SOLUCIONESALAHETEROCEDASTICIDAD
Unodelosproblemasquepresentaunmodeloenelquesehadetectadoheterocedasticidadesla
imposibilidaddeutilizarlosestadsticost,FyLMpararealizarinferencia,alnopodergarantizarlas
distribucionesdedichosestadsticos.Noobstante,existenprocedimientosdeestimacinrobustos
que en muestras grandes permiten ajustar los errores estndar y los estadsticos t, F y LM
garantizando su validez en presencia de heterocedasticidad de estructura desconocida y
permitiendorealizarinferencia.
Como los contrastes de hiptesis son necesarios en cualquier estudio economtrico, se debe
decidirsiseguirutilizandolosestimadoresMCOobuscarestimadoresalternativos:
Enmuestrasgrandessepuedenobtenerestimadoresrobustosdelasvarianzas,loquepermite
seguirutilizandolosestadsticospararealizarinferencia,almenosasintticamente.
EnmuestraspequeassepuedenobtenerlosestimadoresdeMCG(loquerequiereconocerla
estructuradelaheterocedasticidad),estimadoresLIOymseficientesquelosdeMCO.
ESTIMACINMNIMOCUADRTICAPONDERADA
La obtencin de los estimadores de Mnimos Cuadrados Generalizados (MCG) pasa por la
transformacin del modelo de acuerdo con la estructura de heterocedasticidad detectada y la
obtencin de los estimadores MCO del modelo transformado. Bajo heterocedasticidad dicha
transformacin consiste en ponderar las observaciones de las variables por la inversa del
45
Ensentidoestricto,antesdetomarunadecisinseranecesariocalcularotrostestsdeheterocedasticidad.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
69
estimadordeladesviacinestndardelaperturbacin46,porello,enestecaso,alosestimadores
obtenidostambinselesdenominaestimadoresdeMnimosCuadradosPonderados(MCP).
EnGretlhaydosposibilidadesparaobtenerlosestimadoresMCP:
1. Elcomandowls
2. Elcomandohsk
Ladiferenciaentreamboscomandosradicaenqueconelcomandowlsesnecesarioespecificarla
variabledeponderacinyconelcomandohsknoesnecesario,yaqueGretlestablecepordefecto
unaestructuramultiplicativayenbaseaellacalculalavariabledeponderacin47.
COMANDOwls
Elformatodelcomandowlses48:
wlsvariabledeponderacinYconstX1X2XKopciones
ConelcomandowlsGretlutilizalarazcuadradadelavariabledeponderacinparatransformar
lasvariablesqueintervienenenelmodelo.
Algunasdelasopcionesdisponiblesconelcomandowlsson:
vcvpermitevisualizarlamatrizdevarianzascovarianzasestimadasdelosestimadores
robust proporciona estimadores robustos de las desviaciones estndar bajo
heterocedasticidad
ParalaobtencindelosestimadoresMCPesnecesariaunavariabledeponderacin,quedebeser
calculadapreviamentesiguiendolospasos:
1. EstimarelmodeloporMCO.
2. Estimar una regresin auxiliar en base a la estructura de heterocedasticidad detectada para
obtenerestimadoresdelavarianzadelaperturbacinparacadaobservacindelmodelo(en
estecaso,unaestructuraaditivabasadaeneltestdeBreuchPagan).
3. Generarlavariabledeponderacincomolainversadelosvaloresestimadosdelasvarianzasen
laregresinauxiliar.
Enestecaso,losresultadosobtenidosson:
46
Queencasoextremoesdistintoparacadaobservacin.
47
La utilizacin del comando hsk ser tanto ms adecuada cuanto ms se aproxime la verdadera estructura de la
heterocedasticidadalaestructuramultiplicativaasumida.
48
OtraformadeaccederaestainformacinseraseleccionarMnimoscuadradosponderadosenelsubmenOtros
ModelosLinealesdelmenModelodelaVentanaPrincipal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
70
# Se estima por MCO y se guardan los residuos y la desviacin tpica estimada de la perturbacin
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? Sigma = $sigma
Se ha generado el escalar Sigma = 0.629066
# Se toma el valor absoluto del regresando estimado para evitar varianzas estimadas negativas
? r2ea = abs($yhat)
Se ha generado la serie r2ea (ID 32)
Observacin1:comonoseconocelaverdaderaestructuradelaheterocedasticidadyesnecesario
estimarla(enestecasoutilizandolaestructuraaditivadeltestdeBreuschPagan),losestimadores
obtenidos no son los de Mnimos Cuadrados Generalizados sino los de Mnimos Cuadrados
GeneralizadosFactibles(MCGF).
Observacin2:comoparatransformarelmodelonosehanutilizadolosverdaderosvaloresdelas
varianzassinounosvaloresaproximados,losestimadoresMCGFobtenidospuedennosermejores
quelosMCOyparasolucionaresteproblemasepuederepetirelprocesodeformaiterativa49.
49
Enestaversin,Gretlnopermitehaceriteracionesconestecomando.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
71
COMANDOhsk
Elformatodelcomandohskes50:
hskYconstX1X2XKopciones
Algunasdelasopcionesdisponiblesconelcomandohskson:
vcvpermitevisualizarlamatrizdevarianzascovarianzasestimadasdelosestimadores
Se utilizar este comando cuando la estructura de la heterocedasticidad se pueda aproximar
medianteunafuncincuadrticadelosregresores.
Enestecaso,losresultadosobtenidosson:
? hsk Y const X1 X2
ESTIMACINROBUSTA
EnGretlparaobtenerlosestimadoresrobustosseutilizaelcomandoolsconlaopcinrobust:
olsYconstX1Xkrobust
Enestecaso,elresultadoobtenidoes:
? ols Y const X1 X2 --robust
50
OtraformadeaccederaestainformacinseraseleccionarCorreccindeheterocedasticidadenelsubmenOtros
ModelosLinealesdelmenModelodelaVentanaPrincipal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
72
const 4.11794 1.76726 2.330 0.0275 **
X1 0.00498967 0.00173609 2.874 0.0078 ***
X2 0.448371 0.0679674 6.597 4.46e-07 ***
PREDICCINCONHETEROCEDASTICIDAD
Parapredecirseutilizaelcomandofcast,cuyoformatoes51:
fcastobservacininicialobservacinfinalopciones
Algunasdelasopcionesdisponiblesconelcomandofcastson:
staticproporcionaestimacionesestticas
Observacin: las predicciones deben hacerse en el mbito del modelo estimado por MCP, por lo
queencasodeheterocedasticidadelcomandofcastdebeirprecedidoporuncomandowlsopor
uncomandohsk.
Conlosdatosdisponibles:
# Se estima el modelo por MCP y se hace la prediccin con las 4 ltimas observaciones
? wls ponde Y const X1 X2 --quiet
? fcast 31 34 --static
51
Otra forma de acceder a esta informacin sera seleccionar Predicciones en el men Anlisis de la Ventana
Modeloyhacerlaseleccindeseada(dominiodeprediccin,tipodeprediccin,).
LaprediccinconheterocedasticidadsedeberealizarenelmodeloestimadoporMCP,portanto,laVentanaModelo
enlaquesehagaelanlisisdebeserladeestaestimacin.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
73
CLCULOS
CONTRASTE DE WHITE EN FUNCIN DE LAS VARIABLES EXGENAS DEL
MODELO,SUSCUADRADOSYSUSPRODUCTOSCRUZADOS
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
Regresinauxiliar:
# Se estima el modelo por MCO y se guarda el cuadrado de los residuos, el cuadrado de las exgenas,
el producto cruzado de las exgenas y el estimador mximo-verosmil de la varianza de la
perturbacin
? e2 = $uhat^2
Se ha reemplazado la serie e2 (ID 9)
? X12 = X1^2
Se ha generado la serie X12 (ID 10)
? X22 = X2^2
Se ha generado la serie X22 (ID 11)
? X1X2 = X1*X2
Se ha generado la serie X1X2 (ID 12)
? Sigma2 = $sigma^2
Se ha generado el escalar Sigma2 = 0.395723
# Se hace la regresin auxiliar de los residuos al cuadrado frente a las variables exgenas, sus
cuadrados y sus productos cruzados y se guarda el tamao muestral, el coeficiente de determinacin y
la Suma de Cuadrados de Regresin
? T = $T
Se ha generado el escalar T = 30
? R2 = $rsq
Se ha generado el escalar R2 = 0.491653
? SCR = sst($yhat)
Se ha generado el escalar SCR = 2.96253
W1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
? W1=$T*$rsq
Se ha generado el escalar W1 = 14.7496
? vcW1 =critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcW1 = 11.0705
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
74
? pvW1 = pvalue(X,$ncoeff-1,W1)
Se ha generado el escalar pvW1 = 0.0114877
SCR sd
W2 2p p ndevariablesexplicativasdelaregresinauxiliar
2 2
donde, 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
? W2 = SCR/(2*Sigma2^2)
Se ha reemplazado el escalar W2 = 11.6779
? vcW2 = critical(X,$ncoeff-1,0.05)
Se ha reemplazado el escalar vcW2 = 11.0705
? pvW2 = pvalue(X,$ncoeff-1,W2)
Se ha reemplazado el escalar pvW2 = 0.0394784
SCR
Enestecaso,dadoque W2 11.6779 2p ( ) 52 ( 0.05 ) 11.0705 , seaceptaheterocedasticidad
2 2
al5%yparacualquierniveldesignificacinsuperioral3.95%( p valor 0.0394784 ).
Regresinauxiliar:
? e2 = $uhat^2
Se ha reemplazado la serie e2 (ID 9)
? X12 = X1^2
Se ha generado la serie X12 (ID 10)
? X22 = X2^2
Se ha generado la serie X22 (ID 11)
? Sigma2 = $sigma^2
Se ha generado el escalar Sigma2 = 0.395723
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
75
# Se hace la regresin auxiliar de los residuos al cuadrado frente a las variables exgenas y sus
cuadrados y se guarda el tamao muestral, el coeficiente de determinacin y la Suma de Cuadrados de
Regresin
? T = $T
Se ha reemplazado el escalar T = 30
? R2 = $rsq
Se ha reemplazado el escalar R2 = 0.469498
? SCR = sst($yhat)
Se ha reemplazado el escalar SCR = 2.82904
W1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
? W3 = T*R2
Se ha generado el escalar W3 = 14.085
? vcW3 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcW3 = 9.48773
? pvW3 = pvalue(X,$ncoeff-1,W3)
Se ha generado el escalar pvW3 = 0.0070288
SCR sd
W4 2p p ndevariablesexplicativasdelaregresinauxiliar
2 2
donde, 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
? W4 = SCR/(2*Sigma2^2)
Se ha generado el escalar W4 = 11.1517
? vcW4 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcW4 = 9.48773
? pvW4 = pvalue(X,$ncoeff-1,W4)
Se ha generado el escalar pvW4 = 0.0249113
SCR
En este caso, como W4 11.1517 2p ( ) 52 ( 0.05 ) 9.48773 , se acepta heterocedasticidad al
2 2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
76
CONTRASTEDEBREUSCHPAGAN
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
Regresinauxiliar:
rt2 0 1 X 1t 2 X 2t ... K X Kt ut
# Se estima el modelo por MCO y se guardan los residuos y el estimador mximo-verosmil de la
varianza de la perturbacin
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? Sigma2 = $ess/$T
Se ha reemplazado el escalar Sigma2 = 0.356151
# Se hace la regresin auxiliar de los residuos estandarizados al cuadrado frente a las variables
exgenas y se guarda el tamao muestral, el coeficiente de determinacin y la Suma de Cuadrados de
Regresin
? T = $T
Se ha reemplazado el escalar T = 30
? R2 = $rsq
Se ha reemplazado el escalar R2 = 0.303892
? SCR = sst($yhat)
Se ha reemplazado el escalar SCR = 14.4363
BP1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
? BP1 = T*R2
Se ha generado el escalar BP1 = 9.11675
? vcBP1 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcBP1 = 5.99146
? pvBP1 = pvalue(X,$ncoeff-1,BP1)
Se ha generado el escalar pvBP1 = 0.0104791
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
77
SCR sd
BP2 2p p ndevariablesexplicativasdelaregresinauxiliar
2
? BP2 = SCR/2
Se ha generado el escalar BP2 = 7.21813
? vcBP2 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcBP2 = 5.99146
? pvBP2 = pvalue(X,$ncoeff-1,BP2)
Se ha generado el escalar pvBP2 = 0.0270772
SCR
Enestecaso,como BP2 0.0270772 2p ( ) 24 ( 0.05 ) 5.99146 , se acepta heterocedasticidad
2
al5%yparacualquierniveldesignificacinsuperioral2.71%( p valor 0.0270772 ).
PRUEBADEHARVEY
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
Regresinauxiliar:
ln et2 0 1 X 1t 2 X 2t ... K X Kt ut
# Se estima el modelo por MCO y se guardan los residuos
? e = $uhat
Se ha reemplazado la serie e (ID 7)
# Se hace la regresin auxiliar del logaritmo de los residuos al cuadrado frente a las variables
exgenas y se guarda el tamao muestral, el coeficiente de determinacin y la Suma de Cuadrados de
Regresin
? T = $T
Se ha reemplazado el escalar T = 30
? R2 = $rsq
Se ha reemplazado el escalar R2 = 0.233143
? SCR = sst($yhat)
Se ha reemplazado el escalar SCR = 43.4498
H1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
78
? H1 = T*R2
Se ha generado el escalar H1 = 6.9943
? vcH1 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcH1 = 5.99146
? pvH1 = pvalue(X,$ncoeff-1,H1)
Se ha generado el escalar pvH1 = 0.0302836
SCR
H2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
4.9348
? H2 = SCR/4.9348
Se ha reemplazado el escalar H2 = 8.80477
? vcH2 = critical(X,$ncoeff-1,0.05)
Se ha generado el escalar vcH2 = 5.99146
? pvH2 = pvalue(X,$ncoeff-1,H2)
Se ha generado el escalar pvH2 = 0.0122481
SCR
Enestecaso,como H 2 8.80477 2p ( ) 24 ( 0.05 ) 5.99146 ,seaceptaheterocedasticidadal
4.9348
5%yparacualquierniveldesignificacinsuperioral1.22%( p valor 0.0122481 ).
TESTDEGLEJSER
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
Regresinauxiliar:
| et | 0 1 X 1t 2 X 2t ... K X Kt ut
# Se estima el modelo por MCO y se guardan los residuos y el estimador mximo verosmil de la
varianza de la perturbacin
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? Sigma2 = $ess/$T
Se ha reemplazado el escalar Sigma2 = 0.356151
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
79
# Se calcula el valor absoluto de los residuos
? ea = abs(e)
Se ha reemplazado la serie ea (ID 17)
#
# Se hace la regresin auxiliar del valor absoluto de los residuos frente a las variables exgenas
y se guarda el tamao muestral, el coeficiente de determinacin y la Suma de Cuadrados de Regresin
? T = $T
Se ha reemplazado el escalar T = 30
? R2 = $rsq
Se ha reemplazado el escalar R2 = 0.303897
? SCR = sst($yhat)
Se ha reemplazado el escalar SCR = 1.02551
G1 TR 2
sd
2p p ndevariablesexplicativasdelaregresinauxiliar
? G1 = T*R2
Se ha reemplazado el escalar G1 = 9.11691
? vcG1 = critical(X,$ncoeff-1,0.05)
Se ha reemplazado el escalar vcG1 = 5.99146
? pvG1 = pvalue(X,$ncoeff-1,G1)
Se ha reemplazado el escalar pvG1 = 0.0104782
SCR
G2 2p p ndevariablesexplicativasdelaregresinauxiliar
sd
2 2
1
donde, 2 =estimadormximoverosmildelavarianzadelaperturbacin 2
SCE
T
? G2 = SCR/((1-(2/$pi))*Sigma2)
Se ha reemplazado el escalar G2 = 7.92398
? vcG2 = critical(X,$ncoeff-1,0.05)
Se ha reemplazado el escalar vcG2 = 5.99146
? pvG2 = pvalue(X,$ncoeff-1,G2)
Se ha reemplazado el escalar pvG2 = 0.0190252
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
80
SCR
Enestecaso,como G2 7.92398 2p ( ) 24 ( 0.05 ) 5.99146 ,seaceptaheterocedasticidad
2 2
1
al5%yparacualquierniveldesignificacinsuperioral1.90%( p valor 0.0190252 ).
CONTRASTEDEGOLDFELDQUANDT
H 0 : Homocedasticidad ( t2 = 2 t = 1,...,T )
H1 : Heterocedasticidad ( t2 2s algn t s )
PararealizarelcontrastedeGoldfeldQuandt,sisecreequelaheterocedasticidadescreciente(la
varianza de la perturbacin depende directamente de los valores de la variable) es necesario
ordenarlosdatosdeacuerdoconlosvalorescrecientesdelavariablequesesospechequeesla
causante de heterocedasticidad52, omitir p observaciones centrales53 denominando
respectivamentegrupo1( G1 )ygrupo2( G2 )alasobservacionessituadaspordebajoyporencima
delasomitidas,estimarelmodeloporMCOencadagrupo,calcularlasSumasdeCuadradosdelos
Errores(SCE1ySCE2)ycalcularelestadsticodeGoldfeldQuandt(GQ):
SCE 2
gl2 T-p
G Q =
sd
F gl
gl1
2
gl1 gl 2 = - (K + 1)
SCE 1 2
gl1
# Se estima el modelo con las 10 primeras observaciones y se guardan la SCE y los grados de libertad
? smpl 1 10
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 1 - 10 (n = 10)
52
Sisecreequelaheterocedasticidadesdecreciente(lavarianzadelaperturbacindependeinversamentedelos
valoresdelavariable)sedebeordenarlamuestradeacuerdoconlosvaloresdecrecientesdedichavariableyproceder
delamismaforma.
Si en este caso de sospecha de heterocedasticidad decreciente se mantiene la ordenacin creciente se rechazara la
hiptesisdehomocedasticidadsi G Q F gl gl1 ( 1 ) .
2
53
Normalmente p=1/3 de la muestra y es aconsejable que el n de observaciones de los dos grupos sea igual o
aproximadamenteigual.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
81
? SCE1 = $ess
Se ha generado el escalar SCE1 = 4.79297
? gl1 = $df
Se ha generado el escalar gl1 = 7
#
# Se estima el modelo con las 10 ltimas observaciones y se guardan la SCE y los grados de libertad
? smpl 21 30
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 21 - 30 (n = 10)
? SCE2 = $ess
Se ha generado el escalar SCE2 = 0.44746
? gl2 = $df
Se ha generado el escalar gl2 = 7
? GQ = (SCE2/gl2)/(SCE1/gl1)
Se ha reemplazado el escalar GQ = 0.0933576
? vcGcd = critical(F,gl2,gl1,0.05)
Se ha reemplazado el escalar vcGcd = 3.78704
? pvGQcd = pvalue(F,gl2,gl1,GQ)
Se ha generado el escalar pvGQcd = 0.997145
? vcGci = critical(F,gl2,gl1,0.95)
Se ha reemplazado el escalar vcGci = 0.264058
? pvGQci = 1-pvalue(F,gl2,gl1,GQ)
Se ha generado el escalar pvGQci = 0.00285478
# Se ordena la base de datos en funcin de la variable orden (base de datos con el orden original)
? dataset sortby orden
Rango de datos completo: 1 - 30 (n = 30)
SCE 2
DF2
En este caso, dado que G Q 0.0933576 Fglgl12 ( ) F1010 ( 0.05 ) 3.78704 , se rechaza
SCE 1
DF1
heterocedasticidadcrecienteal5%yparacualquierniveldesignificacinigualoinferioral99.72%
( p valor 0.997145 ).
SCE 2
DF2
En este caso, dado que G Q 0.0933576 Fglgl12 ( 1 ) F1010 ( 0.95 ) 0.264058 , se acepta
SCE 1
DF1
heterocedasticidad decreciente al 5% y para cualquier nivel de significacin superior al 0.29%
( p valor 0.00285478 ).
TESTDEBARLETT
Seutilizacuandosesuponequelaheterocedasticidadesporgrupos.Paramuestrasgrandes:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
82
p
TB = (T - p) ln -
2
( T - 1) ln
i=1
i
2
i
sd
2p 1
donde:T=tamaomuestral
p=nmerodegrupos
SCE
2 =estimadormximoverosmildelavarianzatotal 2
T
Ti=tamaodelgrupoi
SCEi
i2 =estimadormximoverosmildelavarianzadelgrupoi i2
Ti
Enmuestraspequeassesueleutilizar:
p
TB
(T - p) ln 2 - ( T - 1) ln
i
2
i
TBC = p
i=1
sd
2p 1
FC
( T - 1 )
1 -1
1+ [ i - (T - p )-1 ]
3 (p - 1) i=1
p
( T - 1 )
1
dondeFC=factordecorreccin FC = 1 + [ -1
- (T - p )-1 ]
3 (p - 1)
i
i=1
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? smpl 1 9
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 1 - 9 (n = 9)
? T1 = 9
Se ha generado el escalar T1 = 9
? S2G1 = sum(e^2)/T1
Se ha generado el escalar S2G1 = 0.664434
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
83
? smpl 10 20
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 10 - 20 (n = 11)
? T2 = 11
Se ha generado el escalar T2 = 11
? S2G2 = sum(e^2)/T2
Se ha generado el escalar S2G2 = 0.320695
? smpl 21 30
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 21 - 30 (n = 10)
? T3 = 10
Se ha generado el escalar T3 = 10
? S2G3 = sum(e^2)/T3
Se ha generado el escalar S2G3 = 0.117699
? T = T1+T2+T3
Se ha reemplazado el escalar T = 30
? S2 = ((T1*S2G1)+(T2*S2G2)+(T3*S2G3))/T
Se ha reemplazado el escalar S2 = 0.356151
# Se busca el p-valor
? pvTBC = pvalue(X,p-1,TBC)
Se ha generado el escalar pvTBC = 0.0422118
# Se ordena la base de datos en funcin de la variable orden (base de datos con el orden original)
? dataset sortby orden
Rango de datos completo: 1 - 30 (n = 30)
TB
(T - p) ln 2 - ( T - 1) ln
i
2
i
TBC = p
i=1
6.33011 2p 1( ) 321( 0.05 ) 5.99146 , y para
FC
1
1+ [ ( T i - 1 )-1 - (T - p )-1 ]
3 (p - 1) i=1
cualquierniveldesignificacinsuperioral4.22%( p valor 0.0422118 ).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
84
ESTIMADORESCONELMODELOTRANSFORMADO
Yt* 0 X 0*t 1 X 1*t 2 X 2*t ... K X kt* t*
donde:
Yt X it t
Yt* X it* i t*
St St St
# Se estima por MCO y se guardan los residuos y la desviacin tpica estimada de la perturbacin
? e = $uhat
Se ha reemplazado la serie e (ID 7)
? Sigma = $sigma
Se ha reemplazado el escalar Sigma = 0.629066
# Se toma el valor absoluto del regresando estimado para evitar varianzas estimadas negativas
? r2ea = abs($yhat)
Se ha reemplazado la serie r2ea (ID 11)
Yt = Y/sqrt(r12hat2)
Se ha generado la serie Yt (ID 13)
X1t = X1/sqrt(r12hat2)
Se ha generado la serie X1t (ID 14)
X2t = X2/sqrt(r12hat2)
Se ha generado la serie X2t (ID 15)
X0t = const/sqrt(r12hat2)
Se ha generado la serie x0t (ID 16)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
85
Observacin2:lasalidadelcomandoolsdelmodelotransformadonocoincideexactamenteconla
salida del comando wls, dado que en la primera todos los clculos estn referidos al modelo
transformado,mientrasqueenlasegundalamayoradelosclculosestnreferidosalmodelode
partida(variablesoriginales).
ESTIMADORESCONCORRECINDEHETEROCEDASTICIDAD
ElclculodeloqueGretldenominaestimadoresconcorreccindeheterocedasticidad54,implica
lassiguientesetapas:
1. EstimarelmodeloporMCO.
2. Estimar una regresin auxiliar55 para obtener estimadores de la varianza de la perturbacin
para cada observacin del modelo, donde la variable dependiente es el logaritmo de los
residuos MCO al cuadrado56 y las variables independientes son los regresores del modelo
originalysuscuadrados.
3. Obtener los estimadores de Mnimos Cuadrados Ponderados utilizando como variable de
ponderacinlainversadelavarianzaestimada57.
# Clculo de los estimadores con correccin de la heterocedasticidad
# Se estima por MCO y se generan el logaritmo de los residuos al cuadrado y el cuadrado de las
explicativas
? luhat2 = log($uhat^2)
Se ha generado la serie luhat2 (ID 8)
? X12 = X1^2
Se ha generado la serie X12 (ID 9)
? X22 = X2^2
Se ha generado la serie X22 (ID 10)
? luhat2e = $yhat
Se ha generado la serie luhat2e (ID 11)
54
Losestimadoresobtenidoscoincidenconlosqueproporcionaelcomandohsk.
55
Laregresinauxiliardebeestarformuladaconordenadaenelorigen.
56
Latransformacinlogartmicadeloscuadradosdelosresiduosaseguraquelosestimadoresdelavarianzaseanno
negativos.
57
Si se denomina u* a la variable que contiene los valores estimados con la regresin auxiliar, la variable de
ponderacin a utilizar ser 1/exp(u*), ya que la variable dependiente de la regresin auxiliar est en trminos
logartmicos.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
86
# Se realiza la estimacin Mnimo Cuadrtica Ponderada con el comando wls
? wls ponde Y const X1 X2
ESTIMADORESROBUSTOS
e12 0 0 ... 0
0 e22 0 ... 0
58 V (b) ( X ' X ) 1 X 'VX ( X ' X ) 1
Paracalcular seutiliza V 0
0 e32 ... 0
... ... ... . ...
0 ... 0 eT2
0
# Se estima el modelo por MCO
? Modelo 6 <- ols C const RF TF --quiet
? print V
omega (30 x 30)
0.35872 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
58
Los errores estndar robustos a la heterocedasticidad habitualmente se atribuyen a White por ser uno de los
primerosentratar eltema.Noobstante,existen modificacionesposteriores,todas con una justificacin asinttica y
asintticamente equivalentes, por lo que ninguna es preferible a las dems. Por regla general, se usa la forma que
calculaelprogramaderegresinqueseestutilizando(Gretlpermitevariasopciones,peropordefectoutilizalaHC0).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
HETEROCEDASTICIDAD
87
0.0000 0.20764 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
.............
? print Sbrobusta
Sbrobusta (3 x 1)
1.6766
0.0016470
0.064479
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
88
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
INTRODUCCIN
UnadelashiptesisdecomportamientodelMRLNCesquelasperturbacionesestnincorreladas.
Setratadeunahiptesismuyrestrictivay,enalgunoscasospocorealista,sobretodo,sisetrabaja
condatostemporales.
SiseignoralaautocorrelacinyseestimaelmodeloporMCO,losestimadoresobtenidosnosern
los de menor varianza entre todos los estimadores lineales e insesgados de los parmetros, de
hecho,elverdaderovalordesusvarianzasestarsubestimado.
DETECCINDEAUTOCORRELACIN
El primer paso para la deteccin de autocorrelacin es la estimacin del modelo por MCO y la
obtencin de los residuos o errores de estimacin60, en este caso se ha utilizado el fichero
datos4.gdt61:
# Con las 20 primeras observaciones se har la estimacin del modelo
? smpl 1 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
59
Se dedicar la mayor parte del captulo a la autocorrelacin de primer orden, que es la ms habitual cuando los
datossonanuales.
60
Larelacinqueexisteentreresiduoyperturbacinvienedadapor et X t' b t
61
Elficherodatos4.gdtcontieneinformacinanualrelativaaunafamiliaparalasvariables:consumofamiliarmensual
mediodeaceitedeolivaenlitros(Y),preciomediodecompradelaceitedeolivaeneuros/litro(X1),ingresosfamiliares
mensuales medios en euros (X2). Con las 20 primeras observaciones se har la estimacin y con las 4 ltimas la
prediccin.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
90
rho 0.453798 Durbin-Watson 1.082606
Observacin:Cuandosetrabajacondatostemporales,enlasalidadelcomandoolssemuestrael
estimador del coeficiente de autocorrelacin de primer orden ( ) y el estadstico de Durbin
Watson( dw ).
MTODOGRFICO
GRFICODELOSRESIDUOSFRENTEALTIEMPO
Porsusimplicidad,elgrficotemporaldelosresiduosesunaherramientaquepuederesultartil
paradetectarlapresenciadeautocorrelacindeprimerorden:
Silosresiduossedistribuyenaleatoriamenteporencimay
pordebajodesumedia(cerosielmodeloincluyetrmino
constante), puede ser un indicio de la ausencia de
autocorrelacin.
Siseobservanrachasde
residuos por debajo de
la media (residuos
negativos)seguidasderachasderesiduosporencimadela
media (residuos positivos), puede ser un indicio de
autocorrelacinpositiva(movimientosondulares).
Si se observan cambios sistemticos en el signo de los
residuos,puedeserunindiciodeautocorrelacinnegativa(dientesdesierra).
GRFICODELOSRESIDUOSFRENTEALOSRESIDUOSRETARDADOSUNPERODO
Tambin puede resultar de utilidad el grfico de dispersin centrado en el punto (0,0) de los
erroresfrentealoserroresretardadosunperodo,quepermiteanalizarsidichosresiduoscrecen
o decrecen de manera montona, haciendo sospechar autocorrelacin positiva o negativa
respectivamente:
Silosresiduoscrecenmontonamente(losvaloressiguenuna
trayectoriadesdeelcuadranteinferiorizquierdoalcuadrante
superior derecho marcando un claro ascenso en diagonal,
puedeserunindiciodeautocorrelacinpositiva.
Si los residuos decrecen
montonamente(losvaloressiguenunatrayectoriadesdeel
cuadrante superior izquierdo al cuadrante inferior derecho
marcando un claro descenso en diagonal, puede ser un
indiciodeautocorrelacinnegativa.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
91
TESTSESTADSTICOS
Lamayoradelostestsparadetectarlapresenciadeautocorrelacinestnbasadosenelanlisis
delosresiduosMCO.
Todosestostestscontrastanlahiptesisnuladeincorrelacinfrentealahiptesisalternativade
autocorrelacin. Estos contrastes sugieren el orden de la autocorrelacin cuando se rechaza la
hiptesis nula, por lo que la transformacin de variables necesaria para estimar el modelo por
MCGesinmediata.
ESTADSTICODEDURBINWATSON
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
donde eselcoeficientedecorrelacindeprimerorden63
ParacalcularelestadsticodeDurbinWatsonesnecesarioestimarelmodeloporMCOycalcular
losresiduos:
T
( e - e t t -1 )2
dw = t=2
T
t=1
et2
Dadountamaomuestral(T),unnmerodevariablesexplicativas(K)yunniveldesignificacin
(),lastablasdeDurbinyWatsonproporcionandosvalores,lacotainferior( d i )ylacotasuperior
( d s ):
. Si0<dw<dI >0
62
Bajolahiptesisdehomocedasticidadynormalidaddelasperturbaciones.
T
e e
t 2
t t 1
63
T
t 2
et21
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
92
Seaceptalaexistenciadeautocorrelacindeprimerordenpositiva
. SidI<dw<dsIncertidumbre
. Sids<dw<4ds =0
Serechazalaexistenciadeautocorrelacindeprimerorden
. Si4ds<dw<4dIIncertidumbre
. Si4dI<dw<4 <0
Seaceptalaexistenciadeautocorrelacindeprimerordennegativa
El estadstico de DurbinWatson mantiene con el estimador del coeficiente de correlacin de
primerordenunarelacinaproximada: dw 2(1 - )
Porlotanto:
. Si 0 dw 2(1 - ) dw 2(1 - 0 ) dw 2
Noexistenciadeautocorrelacindeprimerorden
. Si 1 dw 2(1 - ) dw 2(1 - 1 ) dw 0
Existenciadeautocorrelacindeprimerordenpositiva
. Si 1 dw 2(1 - ) dw 2 [1 - (1)] dw 4
Existenciadeautocorrelacindeprimerordennegativa
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
93
ParapoderaplicarelestadsticodeDurbinWatson,eltamaomuestraldebeserpequeo(T<60),
el modelo debe ser lineal y no autorregresivo, estar formulado con ordenada en el origen y ser
posiblelaautocorrelacindeprimerorden.
SobreelestadsticodeDurbinWatson,sepuedenhacerlassiguientesobservaciones:
1) Laexistenciadezonasdeincertidumbreimplicatenerqueacudiraotrosestadsticos,comola
razndeVonNeumann.
2)Lascotassuperioreinferiorsehanobtenidobajoelsupuestodequehayuntrminoconstante
enelmodeloynosonvlidasenmodelosformuladossinordenadaenelorigen.
3) Lascotassuperioreinferiorsehanobtenidobajoelsupuestodequelasvariablesexplicativas
son deterministas y no son vlidas en modelos autorregresivos64, lo que implica acudir al
estadsticohdeDurbin.
4) WallishallevadoacabounaextensindelcontrastedeDurbinWatsonparalaautocorrelacin
decuartoorden,denominadoestadsticod4deWallis.
5) El estadstico de DurbinWatson verifica la significacin de un slo coeficiente de
autocorrelacin,siendodeseableuntestmsgeneraldesignificacinconjuntadelasprimeras
pautocorrelacionesdelosresiduos,loqueimplicaacudiralcontrastedeBreuschyGodfrey.
RAZNDEVONNEUMANN
Unadelasdificultadesdelcontraste deDurbinWatsoneslaexistenciadezonasdeincertidumbre,
en las que no se puede llegar a ninguna conclusin respecto a la existencia o no de
autocorrelacindeprimerorden.EnestoscasospodrautilizarselarazndeVonNeumann.
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
ParacalcularlarazndeVonNeumann65esnecesarioestimarelmodeloporMCOycalcularlos
residuos:
T
( e - e
t= 2
t t -1 )2
T 2T 4 T 2 (T - 2)
v= T -1
T
= T -1
dw
sd
N(E(v), v2 ) N , 3
T - 1 (T + 1)(T - 1 )
e
t =1
2
t
64
EnmodelosautorregresivoselestadsticodeDurbinWatsonsloesapropiadopararechazarlahiptesisnula,pero
noparaaceptarla.
65
Esteestadsticoenmuestrasgrandes(T>60)ybajolahiptesisdeincorrelacin,sedistribuyecomounanormal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
94
Tipificando:
v - E(v)
zv =
sd
N(0,1)
v
Siseutilizanlosvalorescrticosdeladistribucinnormalreducida,serechazalahiptesisnulade
incorrelacinalniveldesignificacindel5%si zv z / 2 1.96
Tambin se puede utilizar este estadstico para realizar contrastes de una cola y diagnosticar
autocorrelacindeprimerordennegativaopositiva:
Elcontrastepropuestoparalacolaizquierdaes:
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden negativa ( 0)
Paraunniveldesignificacindel5%serechalahiptesisdeincorrelacinyseaceptaqueexiste
autocorrelacindeprimerordennegativasi z < - z = - 1.64
Elcontrastepropuestoparalacoladerechaes:
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden positiva ( 0)
Paraunniveldesignificacindel5%serechalahiptesisdeincorrelacinyseaceptaqueexiste
autocorrelacindeprimerordenpositivasi z < z = 1.64
Enmuestraspequeas(T<60)puedeutilizarselarazndeVonNeumanncomounaaproximacin,
efectuandoelcontrasteconlosvalorescrticosdelastablasdeHart.
Dadountamaomuestral(T)yunniveldesignificacin(),lastablasdeHartproporcionandos
valores,lacotainferior( C I )ylacotasuperior( C S ):
. Si C I <v< C S =0
Serechazalaexistenciadeautocorrelacindeprimerorden
. Siv< C I >0
Seaceptalaexistenciadeautocorrelacindeprimerordenpositiva
. Siv> C S <0
Seaceptalaexistenciadeautocorrelacindeprimerordennegativa
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
95
ESTADSTICOhDEDURBIN
Las cotas superior e inferior para el estadstico de DurbinWatson se han obtenido bajo el
supuesto de que las variables explicativas son deterministas. Por tanto, este estadstico no es
adecuado para modelos autorregresivos66 (modelos con variables endgenas retardadas como
explicativas). Durbin ha desarrollado un contraste especficamente adaptado para este tipo de
modelos, el estadstico h de Durbin, cuya mayor limitacin es estar concebido para muestras
grandes, pero que por su facilidad de clculo se emplea ampliamente en la prctica
economtrica67:
T
h = 2
sd
N(0,1)
1 - T S bK
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
Siseutilizanlosvalorescrticosdeladistribucinnormalreducida69,serechazalahiptesisnula
deincorrelacinalniveldesignificacindel5%si h z / 2 1.96
66
EnmodelosautorregresivoselestadsticodeDurbinWatsonsloesapropiadopararechazarlahiptesisnulade
incorrelacin,peronoparasuaceptacin,yaqueenestetipodemodeloslaestimacindelcoeficientedecorrelacin
de primer orden est sesgada (en el sentido de disminuir su valor absoluto) y ello facilita la aceptacin de no
autocorrelacin.
67
El estadstico h de Durbin est concebido para muestras grandes, pero tambin puede aplicarse a muestras
pequeas(podrautilizarseparaT>30),aunquetendraunascaractersticasypropiedadesespeciales.
68
Aunqueesteestimadorsersesgadosiseconfirmaautocorrelacin,sirveparaefectuarelcontraste.
69
Bajolahiptesisnuladeincorrelacin,elestadsticohdeDurbinsedistribuyecomounanormalreducida,cuandoel
tamaomuestraltiendeainfinito.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
96
Tambin se puede utilizar este estadstico para realizar contrastes de una cola y diagnosticar
autocorrelacindeprimerordennegativaopositiva:
Elcontrastepropuestoparalacolaizquierdaes:
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden negativa ( 0)
Paraunniveldesignificacindel5%serechalahiptesisdeincorrelacinyseaceptaqueexiste
autocorrelacindeprimerordennegativasi h < - z = - 1.64
Elcontrastepropuestoparalacoladerechaes:
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden positiva ( 0)
Paraunniveldesignificacindel5%serechalahiptesisdeincorrelacinyseaceptaqueexiste
autocorrelacindeprimerordenpositivasi h < z = 1.64
ESTADSTICOd 4 DEWALLIS
Elestadsticod4deWallisesunaextensindelcontrastedeDurbinWatsonysujustificacinest
enlautilizacindedatostrimestralesenlaestimacindelmodelo,encuyocasopuederesultar
msprobableunacorrelacinserialentretrimestresigualesdeaossucesivos.
H 0 : Incorrelacin ( 4 0)
H1 : Autocorrelacin de cuarto orden ( 4 0)
donde 4 eselcoeficientedecorrelacindecuartoorden70
PararealizarelcontrastedeWallisesnecesarioestimarelmodeloporMCO,calcularlosresiduosy
calcularelestadsticod4deWallis:
T
( e - e t t -4 )2
d4 =
t=5
T
e
t=1
2
t
e e
t 5
t t 4
70
4 T
t 5
et2 4
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
97
Dadountamaomuestral(T),unnmerodevariablesexplicativas(K)yunniveldesignificacin
(),lastablasdeWallis( =5%)olastablasdeGilesyKing( =1%)proporcionandosvalores,la
cotainferior( d 4I )ylacotasuperior( d 4S ):
Seaceptalaexistenciadeautocorrelacindecuartoordenpositiva
Sedeberecurriraotrosestadsticosparaladeteccindeautocorrelacin(nosepuede
aceptarnirechazarlahiptesisnula)
Serechazalaexistenciadeautocorrelacindecuartoorden
Sedeberecurriraotrosestadsticosparaladeteccindeautocorrelacin(nosepuede
aceptarnirechazarlahiptesisnula)
Seaceptalaexistenciadeautocorrelacindecuartoordennegativa
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
98
ESTADSTICOSDEBOXPIERCELJUNG
ElestadsticodeBoxPierceLjungpermitecontrastarunmodeloautorregresivodeordenJcomo
hiptesisalternativa71:
H 0 : 1 2 ... J 0
H1 : alguno o todos 0
T j
1
QJ T (T 2) 2
j
sd
J2 J 1,2,...
j 1
ESTADSTICODEBOXPIERCE
El estadstico de BoxPierce permite contrastar un modelo autorregresivo de orden p como
hiptesisalternativa:
H 0 : 1 2 ... p 0
H1 : alguno o todos 0
p
LM = T
j =1
2
j
sd
2p
CONTRASTEDEBREUSCHYGODFREY
El contraste de Breusch y Godfrey es un test de significacin conjunta para las p primeras
autocorrelacionesdelosresiduos.
H 0 : No existe autocorrelacin
H1 : Existe autocorrelacin de orden p
71
Losprocedimientosconsideradoshastaahoraverificanlasignificacindeunslocoeficientedeautocorrelacin.
T
e e
t j 1
t t j
72
j T
j 1,2,..., p
t 1
et2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
99
PararealizarelcontrastedeBreuschyGodfrey73esnecesarioestimarelmodeloporMCO,calcular
los residuos, formular la regresin auxiliar de los residuos frente a las variables explicativas y p
retardos de los mismos y calcular el coeficiente de determinacin de dicha regresin
( et2 0 1 X 1t 2 X 2t ... K X Kt 1et 1 2 et 2 ... p et p ut ).
LM TR 2
sd
2p p nderetardosdelosresiduos
Si LM 2p ( ) alniveldesignificacin seaceptalahiptesisnuladeincorrelacin
SobreelcontrastedeBreuschyGodfreysepuedenhacerlassiguientesobservaciones:
TESTDERACHAS
El test de rachas es una prueba no paramtrica que analiza la serie de los residuos para
determinar si su distribucin es aleatoria o sigue algn patrn de comportamiento. Para ello se
haceunrecuentodelnmeroderachasonmerodevecesquelosresiduoscambiandesigno.
Laexistenciademuchasrachasimplicaquelosresiduoscambianmuchodesigno,loquepuede
hacersospecharcorrelacinserialnegativa.Porelcontrario,laexistenciadepocasrachasimplica
quelosresiduoscambianpocodesigno,loquepuedehacersospecharcorrelacinserialpositiva.
73
Elmodelopuedeincluircomoexplicativasretardosdelaendgenasinquecambienlaspropiedadesdelcontraste.
74
Si N1 10 y N 2 10 seutilizaunaaproximacinnormalparaelnmeroderachas,perosi N1 10 y N 2 10 ,el
test de rachas aproximado se calcula con el factor de correccin c y se utilizan las tablas exactas de Sweed y
Hasenhart:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
100
N E ( R ), R2 N
2 N1 N 2 2 N1 N 2 (2 N1 N 2 N1 N 2 )
R
sd
1,
N
1 N 2 ( N1 N 2 ) 2 ( N1 N 2 1)
Tipificandoseconsideraelestadstico:
R E ( R)
zR
sd
N 0,1
R
Siseutilizanlosvalorescrticosdeladistribucinnormalreducida,serechazalahiptesisnulade
aleatoriedadalniveldesignificacindel5%si z R z / 2 1.96
COMANDOSPARALADETECCINDEAUTOCORRELACIN
COMANDOgnuplot
Elformatodelcomandognuplot75paraobtenerungrficotemporaldeunavariablees:
gnuplotvariableejeverticaltimeserieswithlines
Cuando se ejecuta el comando gnuplot con las opciones timeseries withlines, Gretl
proporcionaungrficodondeserepresentanenelejeverticallavariableproporcionadayenel
ejehorizontaleltiempo,uniendolospuntosconunalnea.
Enestecaso,siserepresentanlosresiduosfrentealtiempo,seobservaqueestosapenascambian
designo,loquesugiereunaposibleautocorrelacinpositiva.
? gnuplot e --time-series --with-lines
escribi C:\gpttmp01.plt
R E ( R) c
z
R
75
OtraformadeaccederaestegrficoseraenlaVentanaPrincipalyenelmenVerseleccionarGrficosyelegir
Grficodeseriestemporalesyenlaventanaemergenteseleccionarlasvariables.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
101
Elformatodelcomandognuplot76es:
gnuplotvariable/sejeverticalvariableejehorizontalopciones
Cuandoseejecutaelcomandognuplot,Gretlproporcionaungrficodondeserepresentanenel
eje vertical las variables proporcionadas en primer lugar y en el eje horizontal la ltima de las
variablesproporcionada.
Enestecaso,siserepresentanlosresiduosfrentealosresiduosretardadosunperodo,seobserva
quelosvaloressiguenunatrayectoriaquevadesdeelcuadroinferiorizquierdoalcuadrosuperior
derecho marcando un claro ascenso en diagonal (los residuos crecen montonamente), lo que
puedeserunindiciodeautocorrelacinpositiva.
? er1 = e(-1)
? gnuplot e er1
escribi C:\gpttmp02.plt
76
OtraformadeaccederaestosgrficosseraenlaVentanaPrincipalyenelmenVerseleccionarGrficosyelegir
GrficoXY(scatter)yenlaventanaemergenteseleccionarlasvariablesdelejeXydelejeY.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
102
0.2
-0.2
e
-0.4
-0.6
-0.8
-0.6 -0.4 -0.2 0 0.2
er1
77
OtraformadeaccederaestainformacinesenlaVentanaPrincipal,seleccionarMnimoscuadradosordinariosen
elmenModelo.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
103
Cuando se trabaja con datos temporales, con el comando ols Gretl proporciona adems de su
T
e e
t 2
t t 1
salidaestndar,elestimadordelcoeficientedeautocorrelacindeprimerorden T y
e
t 2
2
t 1
T
(et et 1 ) 2
elestadsticodeDurbinWatson dw t 2 T .
2
et
t 1
? ols Y const X1 X2 XK
rho Durbin-Watson dw
La variable temporal $rho recoge el valor del estimador del coeficiente de autocorrelacin de
primerordenylavariabletemporal$dwpvalrecogeelpvalordeuncontrasteconhiptesisnula
deincorrelacinfrenteaautocorrelacindeprimerordenpositiva.
En este caso se acepta autocorrelacin positiva de primer orden para cualquier nivel de
significacinmayoral1,06%( p valor 0.01657 )yserechazaencasocontrario.
? ols Y const X1 X2
? dwpvalor=$dwpval
Se ha generado el escalar dwpvalor = 0.010657
COMANDOruns:TESTDERACHAS
Gretl proporciona la posibilidad de realizar la prueba no paramtrica del estadstico de rachas.
Esta prueba analiza la serie de los errores de estimacin, calculando el nmero de rachas o
nmero de veces que los residuos cambian de signo. Si hay muchas rachas quiere decir que los
residuos cambian mucho de signo y ello puede indicar una correlacin serial negativa. Por el
contrario,laexistenciadepocasrachaspuedesugerirautocorrelacinpositiva.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
104
Para el anlisis de autocorrelacin con el comando runs78 ser necesario estimar el modelo por
MCOyguardarlosresiduos:
runsresiduosMCO
Lasalidaestndardelcomandorunses:
? runs residuos
Contraste de rachas (niveles)
Nmero de rachas (R) en la variable ' residuos ' = R
Bajo la hiptesis nula de independencia, R sigue una distribucin
N E ( R), R2
valor z R , con valor p a dos colas pvz R
DondeReselnmeroderachas79(nmerodevecesquelosresiduoscambiandesigno).
Enestecaso80seaceptarlahiptesisnuladeindependencia(incorrelacin)al5%yparacualquier
niveldesignificacinmenoroigualal44.27%( p valor 0.442749 )yseaceptarautocorrelacin
deprimerordenparacualquierniveldesignificacinsuperior81.
? runs e
Contraste de rachas (niveles)
Nmero de rachas (R) en la variable 'E' = 9
Bajo la hiptesis nula de independencia, R sigue una distribucin N(10.6, 2.08453)
valor z = -0.767559, con valor p a dos colas 0.442749
Elformatodelcomandomodtest82paracontrastarlaautocorrelacines:
modtestautocorrordendelaautocorrelacin
78
Otra forma de acceder a esta informacin es en la Ventana Principal, en el men Herramientas seleccionar
ContrastesnoparamtricosyacontinuacinContrastederachaseindicarelnombredelavariableenlaquesehan
guardadolosresiduosMCO.
79
Dadoelcarcterasintticodeestaprueba,enmuestraspequeas,lainterpretacindelresultadodebehacersecon
cautela.
80
Enestecaso,hay9rachasybajolahiptesisnuladeindependencia,elnmeroderachassigueunadistribucin
normaldemedia10.6ydesviacinestndar2.08453.
81
Enestecaso,eltamaomuestralespequeo,porloquenoseraaconsejableutilizarestecontraste.
82
Otra forma de acceder a esta informacin es en la Ventana Modelo, seleccionar Autocorrelacin en el men
Contrasteseindicarelordendeautocorrelacinquesedeseecontrastar.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
105
La salida estndar del comando modtest para contrastar una estructura de autocorrelacin de
ordenJ,es:
? ols Y const X1 X2 XK --quiet
? modtest --autocorr J
XK bK SbK tK pvt K
uhat_1(et-1) bet 1 S et 1 tet 1 pvt et 1
R-cuadrado = R2
R 2Mauxiliar R 2Moriginal
Estadstico de contraste: LMF = F3 J s
.d .
F (J ,T K 1 J )
1 R 2Mauxiliar
T K 1 J
con valor p = P(F(J,T-K-1-J) > F3 ) = pvF3
T J
1
Ljung-Box Q' = QJ T (T 2) 2
J s
.d .
2 (J )
J 1
con valor p = P(Chi-cuadrado(J) > QJ ) = pvQJ
Enestasalida,GretlproporcionalaestimacinMCOdelmodeloauxiliar,elcontrastedeBreuschy
Godfrey en sus dos versiones (la basada en la distribucin chi cuadrado y la basada en la F de
Snedecor),elestadsticoQdeLjungBoxparaelordendeautocorrelacinJelegido,acompaados
desuspvalores.
ANLISISDEAUTOCORRELACINDEORDENUNO
? modtest --autocorr 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
106
const 0.555172 0.856588 0.6481 0.5261
X1 0.0114489 0.253248 0.04521 0.9645
X2 0.000499627 0.000536788 0.9308 0.3658
uhat_1 0.543760 0.237574 2.289 0.0360 **
R-cuadrado = 0.246656
DeacuerdoconelestadsticoQ'deLjungBoxseaceptaautocorrelacindeprimerordenal5%y
paracualquierniveldesignificacinmayorqueel2.9%( p valor 0.029 ).
ANLISISDEAUTOCORRELACINDEORDENCUATRO
? modtest --autocorr 4
83
LaversinFdelestadsticodeBreuschGodfreysecorrespondeconelcontrastedenulidadindividualdelparmetro
queacompaaalprimerretardodelosresiduos(seestcontrastandoautocorrelacindeprimerordenenlaregresin
auxiliar):
? ols E const X1 X2 ER1 --quiet
? restrict --quiet
? b[4]=0
? end restrict
Restriccin:
b[ER1] = 0
Estadstico de contraste: F(1, 16) = 5.23864, con valor p = 0.036029
Adems,comoenelcontrasteintervieneunanicarestriccin,elvalordeesteestadsticoFsepodracalcularcomoel
cuadradodelestadsticotcorrespondiente: F3 tuhat _ 1 t et 1 ,enestecaso, F3 2.289 5.23
2 2 2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
107
uhat_4 0.508972 0.356853 1.426 0.1774
R-cuadrado = 0.401317
De acuerdo con el estadstico Q' de LjungBox se acepta autocorrelacin de cuarto orden para
cualquierdesignificacinmayorqueel5.62%( p valor 0.0562 ).
SOLUCIONESALAAUTOCORRELACINPARAUNAR(1)
Uno de los problemas que presenta un modelo en el que se ha detectado autocorrelacin es la
imposibilidaddeutilizarlosestadsticost,FyLMpararealizarinferencia,alnopodergarantizarlas
distribucionesdedichosestadsticos.Noobstante,existenprocedimientosdeestimacinrobustos
que en muestras grandes permiten ajustar los errores estndar y los estadsticos t, F y LM
garantizandosuvalidezenpresenciadeautocorrelacinypermitiendorealizarinferencia.
Como los contrastes de hiptesis son necesarios en cualquier estudio economtrico, se debe
decidirsiseguirutilizandolosestimadoresMCOobuscarestimadoresalternativos:
Enmuestrasgrandessepuedenobtenerestimadoresrobustosdelasvarianzas,loquepermite
seguirutilizandolosestadsticospararealizarinferencia,almenosasintticamente.
84
La versin F del estadstico de BreuschGodfrey se corresponde con el contraste de nulidad conjunta de los
parmetros que acompaan a las variables correspondientes al primer, segundo, tercer y cuarto retardo de los
residuos(seestcontrastandoautocorrelacindecuartoordenenlaregresinauxiliar).
? restrict --quiet
? b[4]=0
? b[5]=0
? b[6]=0
? b[7]=0
? end restrict
Conjunto de restricciones
1: b[ER1] = 0
2: b[ER2] = 0
3: b[ER3] = 0
4: b[ER4] = 0
Estadstico de contraste: F(4, 13) = 2.17858, con valor p = 0.128563
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
108
EnmuestraspequeassepuedenobtenerlosestimadoresdeMCG(loquerequiereconocerel
ordendelaautocorrelacin),estimadoresLIOymseficientesquelosdeMCO.
ESTIMACINMNIMOCUADRTICAGENERALIZADA
ParalaobtencindelosestimadoresdeMnimosCuadradosGeneralizados(MCG)seranecesario
conocer el coeficiente de autocorrelacin de primer orden, situacin que se da con muy poca
frecuencia.Denoseras,altrabajarconelestimadordeenvezdeconsuverdaderovalor,slo
es posible obtener los estimadores de Mnimos Cuadrados Generalizados Factibles (MCGF). Al
utilizar el valor estimado de puede ocurrir que en el modelo transformado siga existiendo
autocorrelacin, por ello, se suele optar por un proceso iterativo en el que en cada fase se
obtengaunanuevaestimacinde,queserutilizadaparatransformarnuevamenteelmodelo.
ParaobtenerlosestimadoresdeMCGFparaunAR(1)seutilizaelcomandoar185,cuyoformatoes:
ar1YconstX1X2XKopciones
Algunasdelasopcionesdisponiblesson:
pweutilizaparalaestimacinlamatrizdePraissWinsten
hiluutilizaparalaestimacinelmtododebsquedafinadeHildrethLu
vcvpermitevisualizarlamatrizdevarianzascovarianzasestimadadelosestimadores
Cuando el comando ar1 se ejecuta sin opciones, Gretl utiliza para la estimacin el mtodo de
CochraneOrcutt.
MNIMOSCUADRADOSGENERALIZADOSFACTIBLESCONPRAISSWINSTEN
1 - 2 0
0 0 ... 0 0
- 1 0 ... 0 0 0
T1 = 0 - 1 ... 0 0 0
... ... ... ... ... ... ...
0 0 0 ... - 1 0
0 0 0 ... 0 - 1 TxT
85
Otra forma de acceder a esta informacin sera seleccionar AR(1) en el submen Series temporales del men
ModelodelaVentanaPrincipal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
109
7 0.55260 0.973680
En el mbito del modelo transformado no tiene sentido, ni econmico ni estadstico, hacer una
interpretacin de los coeficientes ya que la nica finalidad de las iteraciones es obtener
estimadoresqueseparezcancadavezmsalosparmetros,porloquecualquierinterpretacin
sedeberealizarincorporandoestosvaloresalmodelodepartida.Porestarazn,Gretlrecuerda
queexistenunaseriedeestadsticosquehansidocalculadosconlasvariablesoriginalesyotros
conlasvariablestransformadas.
MNIMOSCUADRADOSGENERALIZADOSFACTIBLESCONCOCHRANEORCUTT
- 1 0 ... 00
0 - 1 ... 0 0
T2 =
... ... ... ... ... ...
0 0 ... - 1 (T 1) xT
0
? ar1 Y const X1 X2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
110
F(2, 16) 275.0531 Valor p (de F) 4.07e-13
rho 0.177146 Durbin-Watson 2.315992
MNIMOSCUADRADOSGENERALIZADOSFACTIBLESCONHILDRETHLU
ESS
3.63144 |o |
| |
| |
3.18697 + o |
| |
| o |
| |
| o |
2.4462 + |
| o |
| o |
| |
| o |
1.70542 + o |
| o |
| o |
| o
| | o o o o
0.964643 + | o o o o o o
|+---------+---------+---------+---------+---------+---------+
-0.99 RHO 0.99
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
111
ESTIMACINROBUSTA
EnGretlparaobtenerlosestimadoresrobustosseutilizaelcomandoolsconlaopcinrobust:
olsYconstX1Xkrobust
Existen varias aproximaciones a los errores estndar robustos en modelos con autocorrelacin,
todas ellas tienen una justificacin asinttica y son asintticamente equivalentes, por lo que
ningunaespreferiblealasdems.Porreglageneral,seutilizalaquecalculeelprogramaquese
estutilizando86.
Enestecaso,elresultadoobtenidoes:
? ols Y const X1 X2 --robust
Modelo 30: MCO, usando las observaciones 1987-2006 (T = 20)
Variable dependiente: Y
Desviaciones tpicas HAC, con ancho de banda 2 (Kernel de Bartlett)
Coeficiente Desv. Tpica Estadstico t Valor p
-----------------------------------------------------------------
const 10.5084 0.679389 15.47 1.90e-011 ***
X1 3.63784 0.201583 18.05 1.59e-012 ***
X2 0.00863970 0.000338978 25.49 5.51e-015 ***
Media de la vble. dep. 10.65000 D.T. de la vble. dep. 1.348488
Suma de cuad. residuos 1.331946 D.T. de la regresin 0.279910
R-cuadrado 0.961449 R-cuadrado corregido 0.956913
F(2, 17) 812.3650 Valor p (de F) 1.35e-17
Log-verosimilitud 1.287856 Criterio de Akaike 8.575713
Criterio de Schwarz 11.56291 Crit. de Hannan-Quinn 9.158845
rho 0.453798 Durbin-Watson 1.082606
? set hac_kernel qs
? ols Y const X1 X2 --robust
86
Gretlpermitevariasopciones,peropordefectoestimplementadalaopcinKerneldeBartlett.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
112
Variable dependiente: Y
Desviaciones tpicas HAC, con ancho de banda 2.00 (Kernel QS)
DIFERENCIACINYAUTOCORRELACIN
En ocasiones la diferenciacin de las variables soluciona problemas de autocorrelacin en el
modelo.
? ols Y const X1 X2 --quiet
? scalar dwpvalor=$dwpval
Se ha reemplazado el escalar dwpvalor = 0.010657
En el modelo con variables originales se acepta autocorrelacin de primer orden para cualquier
niveldesignificacinmayoral1,06%( p valor 0.010657 ).
? diff Y X1 X2
Listando 43 variables:
0) const 1) Y 2) X1 3) X2 4) E
5) er1 6) ER1 7) ER2 8) ER3 9) ER4
10) ER5 11) YT 12) X1T 13) X2T 14) X0T
15) YTI1 16) X1TI1 17) X2TI1 18) X0TI1 19) ET1I1
20) EI1 21) YTI2 22) X1TI2 23) X2TI2 24) X0TI2
25) ET1I2 26) EI2 27) YTI3 28) X1TI3 29) X2TI3
30) X0TI3 31) ET1I3 32) EI3 33) YTI4 34) X1TI4
35) X2TI4 36) X0TI4 37) ET1I4 38) EI4 39) YPMT
40) d_Y 41) d_X1 42) d_X2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
113
d_X1 3.81652 0.209088 18.25 3.90e-012 ***
d_X2 0.00807948 0.000434597 18.59 2.94e-012 ***
? scalar dwpvalor=$dwpval
Se ha reemplazado el escalar dwpvalor = 0.985697
PREDICCINCONAUTOCORRELACIN
PREDICCINDINMICA
Prediccinconvariosperodosdeantelacin87:
? ar1 Y const X1 X2 --pwe --quiet
PREDICCINESTTICA
Prediccinconunperododeantelacin88:
? fcast 2007 2010 --static --no-stats
Observaciones Y prediccin
87
Ntesequeparalaprediccindinmicaseutilizaelltimoresiduomuestral:
~
YT X T' b e~T
88
Ntesequeparalaprediccinestticaseutilizaelresiduoinmediatamenteanterior:
~
YT X T' b ~
eT 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
114
CLCULOS
COEFICIENTEDEAUTOCORRELACINESTIMADODEORDENJ
T
e e
t j 1
t t j
j T
j 1,2,..., p
t 1
et2 j
? e = $uhat
Se ha reemplazado la serie e (ID 7)
COEFICIENTEDECORRELACINDEPRIMERORDENESTIMADO
T
e e
t 2
t t 1
T
t 2
et21
? er1 = e(-1)
Se ha reemplazado la serie er1 (ID 8)
? rho1 = sum(e*er1)/sum(er1^2)
Se ha generado el escalar rho1 = 0.453798
Observacin:Elcoeficientedecorrelacindeprimerordenestimadoeselestimadordelparmetro
queacompaaalprimerretardodelosresiduosenlaregresin et et 1 ut
? ols e er1
COEFICIENTEDECORRELACINDECUARTOORDENESTIMADO
T
e e t t -4
4 = t=5
T
e
t=5
2
t -4
? er4 = e(-4)
Se ha reemplazado la serie er4 (ID 8)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
115
? rho4 = sum(e*er4)/sum(er4^2)
Se ha generado el escalar rho4 = -0.170035
Observacin:Elcoeficientedecorrelacindecuartoordenestimadoeselestimadordelparmetro
queacompaaalcuartoretardodelosresiduosenlaregresin et et 4 ut
? ols e er4
ESTADSTICODEDURBINWATSON
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
(e e
t 2
t t 1 )
2
dw T
t 1
et2
? SCE = sum(e*e)
Se ha generado el escalar SCE = 1.33195
? dw = sum((e-er1)^2)/SCE
Se ha generado el escalar dw = 1.08261
89
ParaqueGretlproporcionelosvalorestabuladosdelestadsticodeDurbinWatsonparaunniveldesignificacindel
5%, en la Ventana Principal seleccionar Tablas estadsticas en el men Herramientas, en la ventana emergente
activar el botn DW, especificar el tamao muestral y el nmero de variables explicativas y en la ventana valores
crticosaparecernlacotainferior(dL)ylacotasuperior(dU):
Valores crticos al 5% del estadstico de Durbin-Watson, n = 20, k = 2
dL = 1.1004
dU = 1.5367
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
116
(e e
t 2
t t 1 )
2
e e
t 2
2
t
t 2
2
t 1 2 e e
t 2
t t 1
dw T
T
t 1
et2 t 1
et2
? smpl 2 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1988 - 2006 (n = 19)
? dw = (sum(e^2)+sum(er1^2)-(2*sum(e*er1)))/SCE
Se ha reemplazado el escalar dw = 1.08261
? smpl 1 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
dw 2(1 - )
? dwa = 2*(1-rho1)
Se ha generado el escalar dwa = 1.0924
RAZNDEVONNEUMANN
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
( e - e
t=2
t t -1 )2
2T 4 T 2 (T - 2)
v= T -1
sd
N(E(v), v2 ) N ,
T T - 1 (T + 1)(T - 1 )3
e
t=1
2
t
T
? ols Y const X1 X2 --quiet
? T = $nobs
Se ha generado el escalar T = 20
? v = ((sum((e-er1)^2))/(T-1))/(SCE/T)
Se ha reemplazado el escalar v = 1.13958
SepodrahabercalculadolarazndeVonNeumannutilizandoelestadsticodeDurbinWatson:
T
( e - e
t=2
t t -1 )2
T -1 T
v= T
= dw
T -1
e
t=1
2
t
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
117
? v = (T/(T-1))*dw
Se ha reemplazado el escalar v = 1.13958
VALORESPERADO
2T
E(v)
T -1
? Ev = (2*T)/(T-1)
Se ha generado el escalar Ev = 2.10526
VARIANZA
4 T 2 (T - 2)
v2 =
(T + 1)(T - 1 )3
# Varianza
? Vv = (4*T^2*(T-2))/((T+1)*(T-1)^3)
Se ha generado el escalar Vv = 0.199946
# Desviacin estndar
? Sv = sqrt(Vv)
Se ha generado el escalar Sv = 0.447153
ESTADSTICONORMAL
v - E(v)
zv =
sd
N(0,1)
v
? zv = (v-Ev)/Sv
Se ha generado el escalar zv = -2.15961
? vcz2c = critical(z,0.025)
Se ha generado el escalar vcz2c = 1.95996
? pvalue z zv
Normal estndar: rea a la derecha de -2.15961 = 0.984599
(a la izquierda: 0.0154013)
(valor a dos colas = 0.0308025; complemento = 0.969197
En este caso, teniendo en cuenta el valor crtico, dado que | zv || -2.15961 | 2.15961 N / 2 1.96 se
aceptaautocorrelacindeprimerordenparaunniveldesignificacindel5%.
En este caso, teniendo en cuenta el pvalor, se acepta la hiptesis nula de incorrelacin para
cualquier nivel de significacin menor o igual al 3.09% ( p valor 0.0308025 ) y se acepta
autocorrelacindeprimerordenparacualquierniveldesignificacinsuperior.
INTERVALODECONFIANZA
v E (v) 1.96 v , E (v) 1.96 v
SielestadsticodeVonNeumannpuedeaproximarseporunadistribucinnormal,conun95%de
confianza sus valores deberan estar comprendidos en el intervalo E (v) 1.96 v y, en caso
contrario, debera rechazarse la hiptesis nula de ausencia de autocorrelacin, siendo sta
negativa si la razn de Von Neumann est a la izquierda del intervalo y positiva si est a la
derecha.
? LI = Ev-vcz2c*Sv
Se ha reemplazado el escalar LI = 1.22886
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
118
? LS = Ev+vcz2c*Sv
Se ha reemplazado el escalar LS = 2.98167
En este caso, para un nivel de significacin del 5% la razn de Von Neumann (v=1.13958) no
pertenecealintervalo(1.22886,2.98167)y,portanto,serechazalahiptesisnuladeincorrelacin
yseaceptalaexistenciadeautocorrelacindeprimerordennegativa,porestarlarazndeVon
Neumannalaizquierdadelintervalo.
Observacin1:aunquesehaefectuadoelclculodelarazndeVonNeumann,noseraadecuado
utilizarloenestecaso,yaqueelestadsticodeDurbinWatsonhasidoconcluyenteenladeteccin
deautocorrelacindeprimerordenpositiva.
ESTADSTICOHDEDURBIN
Comoenmodelosautorregresivos(modelosenlosqueentrelasvariablesexplicativashayvalores
retardados de la endgena) el estadstico de DurbinWatson no es apropiado para contrastar
autocorrelacin,enlasalidadelcomandools,GretlsustituyeelestadsticodeDurbinWatsonpor
elestadsticohdeDurbin,quesiesadecuadoenestoscasos.
Conlosdatosdelosquesedispone:
? ols Y const X1 X2 Y(-1)
H 0 : Incorrelacin ( 0)
H1 : Autocorrelacin de primer orden ( 0)
T
h =
sd
N(0,1)
1 - T S b2K
donde Sb2K es el estimador de la varianza del coeficiente estimado del primer retardo de la
endgena
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
119
? h = $rho*(sqrt((T-1)/(1-((T-1)*$stderr[4]^2))))
Se ha generado el escalar h = 2.0125
? vch = critical(z,0.025)
Se ha generado el escalar vch = 1.95996
? pvalue z h
Normal estndar: rea a la derecha de 2.0125 = 0.0220835
(valor a dos colas = 0.044167; complemento = 0.955833)
En este caso, teniendo en cuenta el valor crtico, dado que | h | 2.0125 N / 2 1.96 se acepta
autocorrelacindeprimerordenparaunniveldesignificacindel5%.
En este caso, teniendo en cuenta el pvalor, se acepta la hiptesis nula de incorrelacin para
cualquier nivel de significacin menor o igual al 4.42% ( p valor 0.044167 ) y se acepta
autocorrelacindeprimerordenparacualquierniveldesignificacinsuperior.
ESTADSTICOd 4 DEWALLIS
H 0 : Incorrelacin ( 4 0)
H1 : Autocorrelacin de cuarto orden ( 4 0)
( e - et t -4 )2
d4 =
t=5
T
e
t=1
2
t
? d4 = sum((e-er4)^2)/SCE
Se ha generado el escalar d4 = 1.63283
ESTADSTICOSDEBOXPIERCELJUNG
H 0 : 1 2 ... J 0
H1 : alguno o todos 0
T j
1
QJ T (T 2) 2
j
sd
J2 J 1,2,...
j 1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
120
? er1 = e(-1)
Se ha reemplazado la serie er1 (ID 8)
? er2 = e(-2)
Se ha reemplazado la serie er2 (ID 11)
? er3 = e(-3)
Se ha reemplazado la serie er3 (ID 12)
? er4 = e(-4)
Se ha reemplazado la serie er4 (ID 9)
? rho1 = sum(e*er1)/sum(e*e)
Se ha reemplazado el escalar rho1 = 0.453612
? rho2 = sum(e*er2)/sum(e*e)
Se ha reemplazado el escalar rho2 = 0.352828
? rho3 = sum(e*er3)/sum(e*e)
Se ha reemplazado el escalar rho3 = 0.214317
? rho4 = sum(e*er4)/sum(e*e)
Se ha reemplazado el escalar rho4 = -0.0867038
Q 1
? genr Q1 = T*(T+2)*((1/(T-1))*rho1^2)
Se ha reemplazado el escalar Q1 = 4.76506
Enestecaso,teniendoencuentaelpvalor,seaceptalahiptesisnuladeincorrelacindeprimer
orden para cualquier nivel de significacin menor o igual al 2.90% ( p valor 0.0290431 ) y se
aceptaautocorrelacindeprimerordenparacualquierniveldesignificacinsuperior.
Q 4
? genr Q4 = T*(T+2)*((1/(T-1))*rho1^2+(1/(T-2))*rho2^2+(1/(T-3))*rho3^2+(1/(T-4))*rho4^2)
Se ha generado el escalar Q4 = 9.20364
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
121
Enestecaso,teniendoencuentaelpvalor,seaceptalahiptesisnuladeincorrelacindecuarto
orden para cualquier nivel de significacin menor o igual al 5.63% ( p valor 0.0562062 ) y se
aceptaautocorrelacindecuartoordenparacualquierniveldesignificacinsuperior.
ESTADSTICODEBOXPIERCE
H 0 : 1 2 ... p 0
H1 : alguno o todos 0
p
LM = T
j =1
2
j
sd
2p
# Pvalor
? pvLM = pvalue(X,4,LM)
Se ha reemplazado el escalar pvLM = 0.104276
# Valor crtico
? vcLM = critical(X,4,0.05)
Se ha reemplazado el escalar vcLM = 9.48773
Enestecaso,teniendoencuentaelpvalor,seaceptalahiptesisnuladeincorrelacindecuarto
orden para cualquier nivel de significacin menor o igual al 10.42% ( p valor 0.104276 ) y se
aceptaautocorrelacindecuartoordenparacualquierniveldesignificacinsuperior.
Observacin:ElcontrastedeBoxPiercenoloproporcionaGretlentresussalidas.
ESTADSTICODEBREUSCHYGODFREY
H 0 : No existe autocorrelacin
H1 : Existe autocorrelacin de orden p
LM TR 2
sd
2p p nderetardosdelosresiduos
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
122
AUTOCORRELACINDEPRIMERORDEN
H 0 : 1 0
H1 : 1 0
# Sustituir valores ausentes por ceros
? smpl 1 1
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 1987 (n = 1)
? genr er1 = 0
Se ha reemplazado la serie er1 (ID 8)
? smpl 1 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
# Versin LM
? genr T = $T
Se ha reemplazado el escalar T = 20
? genr R2 = $rsq
Se ha reemplazado el escalar R2 = 0.246656
# Versin F
? ols e const X1 X2 er1 --quiet
? restrict --quiet
? b[4]=0
? end restrict
Restriccin:
b[er1] = 0
? F1 = $test
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
123
Se ha generado el escalar F1 = 5.23864
? pvF1 = pvalue(F,1,16,F1)
Se ha generado el escalar pvF1 = 0.036029
? vcF1 = critical(F,1,16,0.05)
Se ha generado el escalar vcF1 = 4.494
Enestecaso,conlaversinLMdelestadsticodeBreuschGodfrey:
Enestecaso,conlaversinFdelestadsticodeBreuschGodfrey:
teniendo en cuenta el valor crtico, dado que F1 5.23864 Fglgl21 ( ) F161 (0.05) 4.494 se acepta
autocorrelacindeprimerordenparaunniveldesignificacindel5%.
teniendoencuentaelpvalor,serechazalahiptesisdeincorrelacinparacualquiernivelde
significacin menor o igual que el 3.6% ( p valor 0.036029 ) y se acepta autocorrelacin de
primerordenparacualquierniveldesignificacinmayor.
AUTOCORRELACINDECUARTOORDEN
H 0 : 1 2 3 4 0
H1 : alguno o todos distinto de cero
# Sustituir valores ausentes por ceros
? smpl 1 1
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 1987 (n = 1)
? er1 = 0
Se ha reemplazado la serie er1 (ID 8)
? smpl 1 2
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 1988 (n = 2)
? er2 = 0
Se ha reemplazado la serie er2 (ID 11)
? smpl 1 3
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 1989 (n = 3)
? er3 = 0
Se ha reemplazado la serie er3 (ID 12)
? smpl 1 4
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 1990 (n = 4)
? genr er4 = 0
Se ha reemplazado la serie er4 (ID 9)
? smpl 1 20
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
124
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
# Versin LM
? T = $T
Se ha reemplazado el escalar T = 20
? R2 = $rsq
Se ha reemplazado el escalar R2 = 0.401317
? LM4 = $T * $rsq
Se ha reemplazado el escalar LM4 = 8.02634
? pvLM4 = pvalue(X,4,LM4)
Se ha reemplazado el escalar pvLM4 = 0.0906182
? vcLM4 = critical(X,4,0.05)
Se ha reemplazado el escalar vcLM4 = 9.48773
#
# Versin F
? ols e const X1 X2 er1 er2 er3 er4 quiet
? restrict --quiet
? b[4]=0
? b[5]=0
? b[6]=0
? b[7]=0
? end restrict
Conjunto de restricciones
1: b[er1] = 0
2: b[er2] = 0
3: b[er3] = 0
4: b[er4] = 0
? F4 = $test
Se ha generado el escalar F4 = 2.17858
? pvF4 = pvalue(F,4,13,F4)
Se ha generado el escalar pvF4 = 0.128563
? vcF4 = critical(F,3,13,0.05)
Se ha generado el escalar vcF4 = 3.41053
Enestecaso,conlaversinLMdelestadsticodeBreuschGodfrey:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
125
Enestecaso,conlaversinFdelestadsticodeBreuschGodfrey:
TESTDERACHAS
R
sd
2 N1 N 2
N E ( R ), R2 N 1,
2 N1 N 2 (2 N1 N 2 N1 N 2 )
( N1 N 2 ) 2 ( N1 N 2 1)
N1 N 2
? N1 = 12
Se ha reemplazado el escalar N1 = 12
? N2 = 8
Se ha reemplazado el escalar N2 = 8
VALORESPERADO
2 N1 N 2
E ( R) 1
N1 N 2
? ER = ((2*N1*N2)/(N1+N2))+1
Se ha generado el escalar ER = 10.6
VARIANZA
2 N1 N 2 (2 N1 N 2 N1 N 2 )
R2
( N1 N 2 ) 2 ( N1 N 2 1)
# Varianza
? VR = ((2*N1*N2*(2*N1*N2-N1-N2))/((N1+N2)^2*(N1+N2-1)))
Se ha generado el escalar VR = 4.34526
# Desviacin estndar
? SR = sqrt(VR)
Se ha generado el escalar SR = 2.08453
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
126
ESTADSTICONORMAL
R E ( R)
zR
sd
N 0,1
R
? zR = (R-ER)/SR
Se ha generado el escalar zR = -0.767559
? vcz2c = critical(z,0.025)
Se ha generado el escalar vcz2c = 1.95996
? pvalue z zR
Normal estndar: rea a la derecha de -0.767559 = 0.778625
(a la izquierda: 0.221375)
(valor a dos colas = 0.442749; complemento = 0.557251)
INTERVALODECONFIANZA
v E (v) 1.96 v , E (v) 1.96 v
? LI = ER-vcz2c*SR
Se ha reemplazado el escalar LII = 6.5144
? LS = ER+vcz2c*SR
Se ha reemplazado el escalar LSI = 14.6856
En este caso, para un nivel de significacin del 5% el nmero de rachas (R=9) pertenece al
intervalo (6.5144, 14.6856) y, por tanto, se puede aceptar el comportamiento aleatorio de los
residuos,esdecir,seaceptalahiptesisnuladeausenciadeautocorrelacindeprimerorden.
Observacin:enestecasocomoeltamaomuestralespequeonoseraaconsejableutilizareste
contraste.
MTODOITERATIVODEPRAISSWINSTEN
# 2. Estimacin de rho
? genr RO0 = $rho
Se ha reemplazado el escalar RO0 = 0.453798
# 3. Clculo de T1I1
? matrix T1I1 = {sqrt(1-RO0^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
127
0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO0,1}
Se ha reemplazado la matriz T1I1
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
128
? series EI1 = inv(T1I1)*ET1I1
Se ha reemplazado la serie EI1 (ID 18)
# 2. Clculo de T1I2
? matrix T1I2 = {sqrt(1-RO1^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO1,1}
Se ha reemplazado la matriz T1I2
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
129
Coeficiente Desv. Tpica Estadstico t Valor p
-----------------------------------------------------------------
X0TI2 11.3617 0.701517 16.20 9.11e-012 ***
X1TI2 3.79036 0.221360 17.12 3.73e-012 ***
X2TI2 0.00819095 0.000451732 18.13 1.48e-012 ***
# 2. Clculo de T1I3
? matrix T1I3 = {sqrt(1-RO2^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO2,1}
Se ha reemplazado la matriz T1I3
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
130
1997 5.824514 0.4480395 1.383677 725.0987
1998 4.824514 0.4480395 0.982177 451.3701
1999 5.376474 0.4480395 1.018413 460.8377
2000 3.376474 0.4480395 1.034971 327.2610
2001 4.480395 0.4480395 1.044971 391.4378
2002 5.480395 0.4480395 0.909452 487.0262
2003 4.928435 0.4480395 1.331207 654.5141
2004 2.928435 0.4480395 1.098020 256.5966
2005 6.032356 0.4480395 0.950099 569.4462
2006 3.928435 0.4480395 1.113932 354.5948
# 2. Clculo de T1I4
? matrix T1I4 = {sqrt(1-RO3^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO3,1}
Se ha reemplazado la matriz T1I4
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
131
# 2. Clculo de T1I5
? matrix T1I5 = {sqrt(1-RO4^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0,0; \
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
132
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO4,1}
Se ha reemplazado la matriz T1I5
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
133
# 2. Clculo de T1I6
? matrix T1I6 = {sqrt(1-RO5^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO5,1}
Se ha reemplazado la matriz T1I6
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
134
F(3, 17) 3152.802 Valor p (de F) 1.56e-23
Log-verosimilitud 1.845279 Criterio de Akaike 2.309442
Criterio de Schwarz 5.296639 Crit. de Hannan-Quinn 2.892574
rho 0.169456 Durbin-Watson 2.295410
# 2. Clculo de T1I7
? matrix T1I7 = {sqrt(1-RO6^2),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1,0; \
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-RO6,1}
Se ha reemplazado la matriz T1I7
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
135
ESTIMADORESDEMCG
Si se conoce el verdadero valor de , se pueden obtener los estimadores MCG utilizando el
modelotransformado90:
1 - 2 0 0
0 0 ... 0
- 1 0 ... 0 0 0
T1 = 0 - 1 ... 0 0 0
... ... ... ... ... ... ...
0 0 0 ... - 1 0
0 0 0 ... 0 - 1 TxT
Y1* = Y1 1 - 2
Yt* = Yt Yt 1 t = 2,3,...,T
X i*1 = X i1 1 - 2 i = 0,1,..., K X 01 = 1
? series YT = sqrt(1-0.5^2)*Y
90
Enestecasosehasupuesto 0.5
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
136
Se ha generado la serie YT (ID 12)
? smpl 2 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1988 - 2006 (n = 19)
? series YT = Y-0.5*Y(-1)
Se ha reemplazado la serie YT (ID 12)
? smpl 1 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
SehacelaestimacinMCOdelmodeloconvariablestransformadas:
# Estimacin MCO del modelo transformado
? ols YT X0T X1T X2T
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
AUTOCORRELACIN
137
Criterio de Schwarz 5.386313 Crit. de Hannan-Quinn 2.982248
rho -0.097513 Durbin-Watson 2.159794
Observacin:elmodelotransformadonotieneordenadaenelorigen.
PREDICCIN
PREDICCINDINMICA
~ ~ ~
~
YT X T' b e~T X T' b (YT YT ) X T' b YT X T' b
? ar1 Y const X1 X2 --pwe --quiet
? genr BG = $coeff
Se ha generado la matriz BG
PREDICCINESTTICA
~ ~
~
~
YT X T' b e~T 1 X T' b YT 1 YT 1 X T' b YT 1 X T' 1b
? ar1 Y const X1 X2 --pwe --quiet
? genr BG = $coeff
Se ha reemplazado la matriz BG
PREDICCINCONELMODELOTRANSFORMADO
Tambin se puede predecir Y* mediante el modelo transformado ( Y* X *'b* ) y obtener Y
mediantesurelacinconelregresandotransformado( Y* Y Y 1 Y Y* Y 1 ).
# Clculo de variables transformadas perodo prediccin
? smpl 21 24
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 2007 - 2010 (n = 4)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
138
? series X0TI4 = const-RO4*const(-1)
Se ha reemplazado la serie X0TI4 (ID 37)
? smpl 1 20
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 1987 - 2006 (n = 20)
? smpl 21 24
Rango de datos completo: 1987 - 2010 (n = 24)
Muestra actual: 2007 - 2010 (n = 4)
? smpl 1 24
Rango de datos completo: 1987 - 2010 (n = 24)
Observacin:Utilizandoelmodelotransformadoslosepuederecuperarlaprediccinesttica.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
INTRODUCCIN
Secometeunerrorenlaformafuncionalcuandoseespecificaunarelacinentreelregresandoy
losregresoresylaverdaderarelacinesdiferentedelaespecificada.Enestecaso,losestimadores
obtenidosporMCOsernsesgados,pocoprecisoseinconsistentes.
Unaespecificacinincorrectaenlaformafuncionaldelmodelopuedetenercomoconsecuencia
un trmino de perturbacin no esfrico (con heteroscedasticidad y/o autocorrelacin) y cuya
distribucinsealejedeladistribucindeltrminodeperturbacindelmodeloconunacorrecta
especificacin.
LahiptesisdeformafuncionallinealdeunMRLNCresultainadecuadaenalgunoscasos.Eneste
captulo se analizarn una serie de estadsticos que permitirn contrastar si la forma funcional
linealesonoadecuada.
ANLISISDELALINEALIDAD
El primer paso para el anlisis de la forma funcional es la estimacin del modelo por MCO y la
obtencin de los residuos o errores de estimacin91, en este caso se ha utilizado el fichero
datos2.gdt92:
? ols y const x1 x2
91
Larelacinqueexisteentreresiduoyperturbacinvienedadapor: et X t' b t
92
Elficherodatos2.gdtcontieneinformacinrelativaa20familiasparalasvariables:consumofamiliarmensualmedio
de aceite de oliva en litros (Y), precio medio de compra del aceite de oliva en euros/litro (X1), ingresos familiares
mensualesmedioseneuros(X2).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
140
Se ha generado la serie ye (ID 7)
MTODOGRFICO
Es un mtodo informal, pero de gran utilidad para diagnosticar la linealidad. Con este fin se
puedenutilizarvariostiposdegrficosbasadosenlosresiduos,siendoelmsutilizadoeldelos
residuosrespectoalregresandoestimado:
Enestegrfico,lanubedepuntospuedeayudaravislumbrarunaformafuncionaldiferentedela
lineal.
TESTSESTADSTICOS
Estos tests contrastan la hiptesis nula de linealidad frente a la hiptesis alternativa de no
linealidad.
TESTRESETDERAMSEY
H 0 : Linealidad
H1 : No linealidad
LapruebadeRamseyconsisteencompararlabondaddeajustedelmodelooriginal(MO)conla
bondaddeajustedeunmodeloalternativo(MA),enelqueademsdelosregresoresdelmodelo
original figuran una o varias potencias del regresando estimado en el modelo de partida. Si la
inclusindeestosregresoresadicionalesimplicaunincrementoestadsticamentesignificativoen
elcoeficientededeterminacin,laformafuncionallinealnoescorrecta.
( R2MA - R2MOl )/ ( K MA K MO ) sd K MO
F= FTK-MA
K MA 1
(1 - R2MA )/( T - K MA 1 )
Observacin: el inconveniente del test de Ramsey es que contrasta la linealidad frente a formas
funcionalesalternativas,peronoinformadecualpuedeserelmodeloadecuadoenelcasodeno
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
141
aceptarlinealidad.Porestemotivo,interesahacerusodetestsquepermitanespecificarlaforma
funcionalalternativadelmodelo.
PRUEBAJDEDAVIDSONYMACKINNON
H 0 : Y t = 0 + 1 X 1t + 2 X 2t + t ( MO )
H1 : Y t = 0 + 1 ln X 1t + 2 ln X 2t + t ( MA)
Como ejemplo para la aplicacin de esta prueba se ha enfrentado a la hiptesis nula de forma
funcionallineal(MO)lahiptesisalternativadeformafuncionalsemilogartmica(MA).
ParacalcularlapruebaJ:
2. Se agrega Y tMA como regresor adicional en el modelo original (lineal) y se estima el modelo
Y t = 0 + 1 X 1t + 2 X 2t 3 Y t + t
MA
3. Secontrastalanulidadindividualdelparmetroqueacompaaalnuevoregresor( 3 = 0 ).Sise
aceptadichanulidad,se"acepta"elmodelolinealcomoelverdaderomodelo,yaque Y tMA no
tieneunpoderexplicativoadicional.
Observacin: el inconveniente de esta prueba es que se asume que una de las dos formas
funcionalesespecificadaseslacorrecta,porloquesedebesercautoensuaplicacin.
PRUEBAJADEFISHERYMCALEER
H 0 : Y t = 0 + 1 X 1t + 2 X 2t + t ( MO )
H1 : Y t = 0 + 1 ln X 1t + 2 ln X 2t + t ( MA)
Como ejemplo para la aplicacin de esta prueba se ha enfrentado a la hiptesis nula de forma
funcionallineal(MO)lahiptesisalternativadeformafuncionalsemilogartmica(MA).
ParacalcularlapruebaJA:
1. Seestimaelmodelooriginal(lineal)ysecalculanlosvaloresestimadosdelregresando Y tMO
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
142
4. Secontrastalanulidadindividualdelparmetroqueacompaaalnuevoregresor( 3 = 0 ).Sise
MA
aceptadichanulidad,se"acepta"elmodelolinealcomoelverdaderomodelo,yaque Y tMO no
tieneunpoderexplicativoadicional.
Observacin: el inconveniente de esta prueba es que se asume que una de las dos formas
funcionalesespecificadaseslacorrecta,porloquesedebesercautoensuaplicacin.
COMANDOSPARAANALIZARLALINEALIDAD
COMANDOgnuplot
Elformatodelcomandognuplot93es:
gnuplotvariable/sejeverticalvariableejehorizontalopciones
Cuandoseejecutaelcomandognuplot,Gretlproporcionaungrficodondeserepresentanenel
ejeverticalla/svariable/sproporcionada/senprimerlugaryenelejehorizontallaltimadelas
variablesproporcionada.
? gnuplot e ye
escribi C:\gpttmp01.plt
0.2
-0.2
e
-0.4
-0.6
-0.8
-0.6 -0.4 -0.2 0 0.2
ye
En este grfico, la nube de puntos puede ayudar a vislumbrar que la forma funcional lineal es
adecuada.
93
OtraformadeaccederaestosgrficosseraenlaVentanaPrincipalyenelmenVerseleccionarGrficosyelegir
GrficoXY(scatter)yenlaventanaemergenteseleccionarlasvariablesdelejeXydelejeY.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
143
COMANDOreset
Conelcomandoreset94GretlproporcionaeltestResetdeRamsey,cuyoformatoes:
resetopciones
Esnecesarioqueelcomandoresetvayaprecedidoporuncomandools.
Algunasdelasopcionesdisponiblesconelcomandoresetson:
squareonly calcula el test utilizando como variable independiente adicional nicamente el
cuadradodelavariabledependienteestimada
cubeonlycalculaeltestutilizandocomovariableindependienteadicionalnicamenteelcubo
delavariabledependienteestimada
Si el comando reset se ejecuta sin opciones, el test se calcula utilizando como variables
independientesadicionaleselcuadradoyelcubodelavariabledependienteestimada.
94
OtraformadeaccederaestainformacinseraseleccionarContrasteRESETdeRamseyenelmenContrastesdela
VentanaModeloyseleccionarlavariantedeseada.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
144
Test RESET utilizando como variable independiente adicional el cubo de la variable dependiente
estimada:
? reset --cubes-only
En cada uno de los casos, la hiptesis nula es que la forma funcional lineal es correcta y si se
rechaza dicha hiptesis, ello sera un indicador de que se debera buscar una forma funcional
alternativa.
Observando los pvalores asociados a cada uno de los tests RESET anteriores
( p valor 0.514 , p valor 0.273 , p valor 0.265 ),paraunniveldesignificacindel5%,sepuede
concluirquelaformafuncionallinealescorrecta.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
145
CLCULOS
TESTRESETDERAMSEY
H 0 : Linealidad
H1 : No linealidad
( R2MA - R2MOl )/ ( K MA K MO ) sd K MO
F= FTK-MA
K MA 1
(1 - R2MA )/( T - K MA 1 )
? T = $T
Se ha reemplazado el escalar T = 20
? KMO = $ncoeff-1
Se ha generado el escalar KMO = 2
? R2MO = $rsq
Se ha generado el escalar R2MO = 0.961449
? fcast yeMO
Se ha generado la serie yeMO (ID 8)
? yeMO2 = yeMO^2
Se ha generado la serie yeMO2 (ID 9)
? yeMO3 = yeMO^3
Se ha generado la serie yeMO3 (ID 10)
ClculodeltestRESETutilizandocomovariableindependienteadicionalelcuadradodelavariable
dependienteestimada:
? ols Y const X1 X2 yeMO2 quiet
? KMA = $ncoeff-1
Se ha generado el escalar KMA = 3
? R2MA = $rsq
Se ha generado el escalar R2MA = 0.964321
? glN = KMA-KMO
Se ha generado el escalar glN = 1
? glD = T-KMA-1
Se ha generado el escalar glD = 16
? pvRESET2 = pvalue(F,glN,glD,RESET2)
Se ha generado el escalar pvRESET2 = 0.273127
? vcRESET2 = critical(F,glN,glD,0.05)
Se ha generado el escalar vcRESET2 = 4.494
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
146
SepodrahabercalculadoeltestRESETutilizandoelcomandorestrict:
? ols Y const X1 X2 yeMO2 quiet
? restrict --quiet
? b[yeMO2] = 0
? end restrict
Restriccin:
b[yeMO2] = 0
Clculo del test RESET utilizando como variable independiente adicional el cubo de la variable
dependienteestimada:
? ols Y const X1 X2 yeMO3 quiet
? KMA = $ncoeff-1
Se ha reemplazado el escalar KMA = 3
? R2MA = $rsq
Se ha reemplazado el escalar R2MA = 0.964412
? RESET3 = ((R2MA-R2MO)/(KMA-KMO))/((1-R2MA)/(T-KMA-1))
Se ha generado el escalar RESET3 = 1.3322
? glN = KMA-KMO
Se ha reemplazado el escalar glN = 1
? glD = T-KMA-1
Se ha reemplazado el escalar glD = 16
? pvRESET3 = pvalue(F,glN,glD,RESET3)
Se ha generado el escalar pvRESET3 = 0.265364
? vcRESET3 = critical(F,glN,glD,0.05)
Se ha generado el escalar vcRESET3 = 4.494
SepodrahabercalculadoeltestRESETutilizandoelcomandorestrict:
? ols Y const X1 X2 yeMO3 --quiet
? restrict --quiet
? b[yeMO3] = 0
? end restrict
Restriccin:
b[yeMO3] = 0
ClculodeltestRESETutilizandocomovariablesindependientesadicionaleselcuadradoyelcubo
delavariabledependienteestimada:
? ols Y const X1 X2 yeMO2 yeMO3 quiet
? KMA = $ncoeff-1
Se ha reemplazado el escalar KMA = 4
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
147
? R2MA = $rsq
Se ha reemplazado el escalar R2MA = 0.96472
? RESET23 = ((R2MA-R2MO)/(KMA-KMO))/((1-R2MA)/(T-KMA-1))
Se ha generado el escalar RESET23 = 0.695343
? glN = KMA-KMO
Se ha reemplazado el escalar glN = 2
? glD = T-KMA-1
Se ha reemplazado el escalar glD = 15
? pvRESET23 = pvalue(F,glN,glD,RESET23)
Se ha generado el escalar pvRESET23 = 0.514288
? vcRESET23 = critical(F,glN,glD,0.05)
Se ha generado el escalar vcRESET23 = 3.68232
SepodrahabercalculadoeltestRESETutilizandoelcomandorestrict:
? ols Y const X1 X2 yhatMO2 yhatMO3 quiet
? restrict --quiet
? b[yeMO2] = 0
? b[yeMO3] = 0
? end restrict
Conjunto de restricciones
1: b[yeMO2] = 0
2: b[yeMO3] = 0
PRUEBAJDEDAVIDSONYMACKINNON
En esta prueba se especifica la forma funcional alternativa del modelo (como ejemplo se ha
elegidounmodelosemilogartmico).
? genr lX1 = log(X1)
Se ha generado la serie lX1 (ID 4)
H 0 : Y t = 0 + 1 X 1t + 2 X 2t + t ( MO )
H1 : Y t = 0 + 1 ln X 1t + 2 ln X 2t + t ( MA)
? ols Y const lX1 lX2 quiet
? fcast yeMA
Se ha generado la serie yeMA (ID 13)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
148
Observacin: el inconveniente de esta prueba es que se asume que una de las dos formas
funcionalesespecificadaseslacorrecta,porloquesedebesercautoensuaplicacin.
PRUEBAJADEFISHERYMCALEER
En esta prueba se especifica la forma funcional alternativa del modelo (como ejemplo se ha
elegidounmodelosemilogartmico).
H 0 : Y t = 0 + 1 X 1t + 2 X 2t + t ( MO )
H1 : Y t = 0 + 1 ln X 1t + 2 ln X 2t + t ( MA)
? lX1 = log(X1)
Se ha reemplazado la serie lX1 (ID 11)
? lX2 = log(X2)
Se ha reemplazado la serie lX2 (ID 12)
? fcast yeMO
Se ha reemplazado la serie yeMO (ID 8)
? fcast yeMOMA
Se ha generado la serie yeMOMA (ID 14)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
LINEALIDAD
149
SiseanalizaelpvalordelavariableexplicativayeMOMA( p valor 0.2041 ),seaceptalahiptesis
nula de nulidad del parmetro que la acompaa para cualquier nivel de significacin igual o
inferioral20.41%.Portanto,seconcluyequesisecomparalaformafuncionallinealconlaforma
funcionalsemilogartmica,seaceptalaformafuncionallinealcomoadecuada.
Observacin: el inconveniente de esta prueba es que se asume que una de las dos formas
funcionalesespecificadaseslacorrecta,porloquesedebesercautoensuaplicacin.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
150
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
REGRESORESESTOCSTICOS
INTRODUCCIN
ElsupuestodelMRLNCdequelamatrizderegresoresesnoestocsticaonoaleatoria95,esuna
simplificacindeplanteamientoqueimplicaestartrabajandoconexperimentoscontrolables,en
los que tericamente podran repetirse unos valores prefijados para las variables explicativas y
observar su incidencia sobre la variable explicada. Pero esto no es frecuente en el anlisis
econmicoy/oempresarial,dondelasvariablesexplicativasseproducenellasmismasporalgn
mecanismoestocstico(pasodeltiempo,comportamientodelosindividuoseconmicos,etc).Por
ello,laaleatoriedadenelmodelopuedeprocedernoslodeltrminoperturbacinaleatoriasino
tambindelasvariablesexplicativasdelmodelo.
95
Elcarcterdeterministadeunregresorimplicalaausenciadecorrelacinentreeseregresorylaperturbacin.Por
ello,unavariableseconsideraendgenasiestcorrelacionadaconlaperturbacinyexgenasinoloest.
96
Como el estimador de Variables Instrumentales no es insesgado y en muestras pequeas el sesgo puede ser
importante,esnecesarioqueeltamaomuestralseagrandecuandoseutilizaestatcnica.
97
UnacorrelacindbilentreZy implicalainconsistenciadelestimadordeVariablesInstrumentales.
98
UnacorrelacindbilentreZyXaumentaelsesgodelestimadordeVariablesInstrumentales.
99
Larelevanciadelosinstrumentosjuegaunpapelfundamental:
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
152
Unodelosproblemasquesepresentaenestoscasosesquenohayunnicoinstrumento,muchas
variables pueden cumplir ambas condiciones, no estar correlacionadas con los factores no
observablesqueinfluyanenelregresando(perturbacin)yestarcorrelacionadasconlavariable
explicativaendgena.
ANLISISDELAEXOGENEIDADDELAMATRIZDEREGRESORES
TESTDEHAUSMAN
SeaelmodeloconKvariablesexplicativasexgenasyRvariablesexplicativasendgenas:
El test de Hausman101 permite contrastar la hiptesis nula de que todos los regresores son
exgenos (estn incorrelados con la perturbacin) frente a la hiptesis alternativa de que las
variablesexplicativas X i* nosonexgenas(estncorreladasconlaperturbacin).
H 0 : Cov( X , ) 0 ( Exogeneidad )
H1 : Cov( X , ) 0 ( Endogeneidad )
Laprecisindelestimadordependedelarelevanciadelosinstrumentos:amayorrelevanciadelinstrumento
mayorprecisindelestimador.
Ladistribucinnormaldelestimadordependedelarelevanciadelosinstrumentos:elempleodeinstrumentos
que expliquen poco la variabilidad de las variables explicativas endgenas (instrumentos dbiles) puede
afectargravementealainferencia(einclusoalaconsistenciadelestimador).
100
Laconsistenciadelestimadordependedelaexogeneidaddelosinstrumentos:silosinstrumentosnosonexgenos,
elestimadornoserconsistente.
101
Losregresores X i y X i* seconsideranortogonalesalaperturbacin.
102
Parapoderllevaracaboelcontraste,elnmerodeinstrumentostienequesercomomnimoigualalnmerode
variablesconproblemas.
103
SisedetectandiferenciassignificativasentrelosestimadoresdeMCOydeVIsesospechalaexistenciadevariables
explicativasendgenas.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
153
W ( MCO VI )' V (VI ) V ( MCO )
1
( MCO VI ) R2
sd
EnocasioneseltestdeHausmannosepuedecalculardeestaformaporqueladiferenciadelos
vectoresdeestimacinpuedesernegativa.Enestoscasos,unaformaalternativadellevaracabo
elcontrastedeHausmanparaelcasodeRvariablespotencialmenteendgenases:
1. Estimar por MCO cada una de las variables con problemas en funcin de todos los
instrumentos104ycalcularlosresiduos:
...
*
X Rt 0 1 X 1t ... K X Kt 1Z1t 2 Z 2t ... L Z Lt X * e X * X Rt
*
X Rt
*
Rt Rt
2. Estimar por MCO el modelo original incluyendo como R regresores adicionales los residuos
calculados:
SCE MO SCE MA sd
H T * R2
SCE MA
donde:
SCE MO eslaSCEdelmodelooriginal
SCE MA eslaSCEdelmodeloampliado(incluyelosRresiduoscomoregresoresadicionales)
Reselnmerodevariablespotencialmenteendgenas
104
Losinstrumentosdelasvariablessinproblemassonlaspropiasvariables.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
154
Siseconcluyequelosresiduossonconjuntamentesignificativos,elloindicaquealmenosunade
lasvariablesexplicativaspotencialmenteendgenaloesenrealidad.
TESTDEINSTRUMENTODBILOTESTDEVALIDEZDEINSTRUMENTOS
El test de instrumento dbil o test de validez de instrumentos contrasta si las variables
instrumentales influyen conjuntamente o no en la estimacin de las variables con problemas105
(hiptesis nula de debilidad de los instrumentos, que originara problemas en la estimacin
bietpicadeVariablesInstrumentales):
H 0 : 1 2 ... L 0
H1 : todos o alguno 0
Los instrumentos sern dbiles si todos sus coeficientes son nulos o estn cercanos a cero. Los
instrumentos dbiles explican muy poco la variacin del regresando y en este caso, los
coeficientesestimadosporVariablesInstrumentalessernmuysensiblesacambiosenlamuestra.
TESTDEINSTRUMENTODBIL:ESTADSTICOFDELAPRIMERAETAPA
CuandohayunsoloregresorconproblemaselcontrastesereduceaunestadsticoFylareglade
decisinsugierequesiF>10losinstrumentossonrelativamentefuertes.
EnestecasonoseutilizaelvalorcrticodelaFparatomarladecisinpordosrazones:
- LosestimadoresdeVI(aunqueconsistentes)sonsesgadosenmuestraspequeasyelsesgoes
inversamenteproporcionalalvalordelestadsticoF(porejemplo,F=10esaproximadamente
equivalentea1/F=10%desesgoenlamayoradeloscasos).
Porello,enestecaso,sedebenutilizarlosvalorescrticostabuladosporStockyYogo(2005)para
darunaideadeculeseltamaorealdeltestdedebilidaddeinstrumentos.
TESTDEINSTRUMENTODBIL:ESTADSTICOFDECRAGGDONNALD
Unasolucinparaidentificarladebilidaddelosinstrumentosenmodelosconmsdeunregresor
endgenosebasaenelusodelas correlacionescannicas.Lascorrelacionescannicassonuna
105
Sienelmodelohayunanicavariableconproblemas,aesteestadsticoseledenominaestadsticoFdelaprimera
etapa.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
155
generalizacin del concepto de correlacin entre dos variables e intentan describir la asociacin
entredosconjuntosdevariables.
Untestparalaidentificacindeladebilidaddelosinstrumentos106estbasadoenelestadsticoF
deCraggDonald:
min ri2
FC D T ( K 1) L i 1,2,..., R
L (1 min ri2 )
donde:
Teseltamaomuestral
Relnmeroderegresoresconproblemas
(K+1)elnmeroderegresoressinproblemas(incluidoelregresorficticio)
Lelnmerodeinstrumentosexternos(losnoincluidosenlaregresin)
El nmero de correlaciones cannicas depende del nmero de variables de cada conjunto, por
ejemplo,sihaydosvariablesenelprimerconjuntoydos variablesenelsegundoconjunto,hay
doscorrelacionescannicas(r1yr2).
ElestadsticodeCraggDonaldsereducealestadsticoFdeinstrumentosdbilescuandohayun
nico regresor con problemas (R=1). Para tener en cuenta los problemas que ocasionan la
debilidad de los instrumentos, los valores crticos para este estadstico han sido tabulados por
StockyYogo(2005).
TESTDESARGAN
EltestdeSargansolamentesecalculaparamodelossobreidentificados,esdecir,modelosenlos
quehaymsinstrumentosqueregresoresendgenos.
Dadoelmodelo:
UnaformaderealizarelcontrastedeSarganes:
1. Estimar el modelo por Mnimos Cuadrados en dos Etapas (MC2E) utilizando todos los
instrumentos(L>R)ycalcularlosresiduos (eMC 2E )
106
Losinstrumentosestncorrelacionadosconlosregresoresendgenos(correlacindbil).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
156
2. Estimar por MCO los residuos en funcin nicamente de las variables instrumentales:
eMC 2 E 0 1Z1t ... L Z Lt t
t
X1 b1 Sb1 t1 pvt1
X2 b2 S b2 t2 pvt2
XK bK SbK tK pvt K
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(1) = TH
con valor p = pvTH
107
Otra forma de acceder a esta informacin es seleccionar Mnimos cuadrados en dos etapas en el submen
VariablesinstrumentalesdelmenModelodelaVentanaPrincipal.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
157
con valor p = P(Chi-cuadrado(1) > TS) = pvTS
Observacin1:elmodeloincluyeK+1regresores,deloscualesseconsideraquelosRltimos(XK
R, XKR+1, , XK) presentan problemas de correlacin contempornea con las perturbaciones y L
variablesinstrumentales(Z1,Z2,,ZL).
Observacin 2: en la escritura del comando despus del punto y coma (;) figuran las variables
instrumentales y se debe especificar al menos una para cada uno de los regresores del modelo.
Para los regresores que no presenten problemas de correlacin contempornea con las
perturbaciones, los mejores instrumentos son ellos mismos (const X1 XKR). Para los regresores
con problemas de correlacin contempornea con las perturbaciones, se utilizan las variables
instrumentales108(Z1Z2ZL).
Observacin3:siemprequeseejecuteuncomandotslsGretlproporcionaeltestdeHausmanyel
test de instrumento dbil. El test de Sargan slo lo proporciona si el nmero de variables
instrumentalesessuperioralnmeroderegresoresconproblemasdecorrelacincontempornea
conlasperturbaciones.
GENERACINDELINSTRUMENTO:MTODODEWALD
SesuponequeX1esunavariablecorrelacionadacontemporneamenteconlaperturbacin,porlo
queutilizandoelmtododeWald,secreaunavariableinstrumentaldenominadaZ1.Enestecaso
sehautilizadoelficherodatos5.gdt109:
# 1. Generar la variable de ordenacin
? t = time
? smpl 1 15
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 1 - 15 (n = 15)
? Z1 = -1
108
Parapoderrealizarlaestimacindelmodelo,elnmerodevariablesinstrumentalesdebesercomomnimoigualal
nmeroderegresoresconproblemas( L R ).
109
El fichero datos5.gdt contiene informacin relativa a 30 familias para las variables: consumo familiar mensual
mediodeaceitedeolivaenlitros(Y),preciomediodecompradelaceitedeolivaeneuros/litro(X1),ingresosfamiliares
mensualesmedioseneuros(X2).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
158
Se ha generado la serie Z1 (ID 6)
? smpl 16 30
Rango de datos completo: 1 - 30 (n = 30)
Muestra actual: 16 - 30 (n = 15)
? Z1 = 1
Se ha reemplazado la serie Z1 (ID 6)
? smpl 1 30
Rango de datos completo: 1 - 30 (n = 30)
RELEVANCIADELINSTRUMENTO
Paraquelosinstrumentosseanrelevantesdebenestarcorrelacionadosconlavariableexplicativa
endgenaalaqueinstrumentalizan110.
? ols X1 const Z1 X2 --simple
MCO, usando las observaciones 1-30
Variable dependiente: X1
Coeficiente Desv. Tpica Estadstico t Valor p
----------------------------------------------------------------
const 2.35603 0.315981 7.456 5.08e-08 ***
Z1 0.205160 0.0330740 6.203 1.24e-06 ***
X2 0.000109051 0.000299017 0.3647 0.7182
SCR = 0.848195, R-cuadrado = 0.593111
? ols e1 e2 --simple
MCO, usando las observaciones 1-30
Variable dependiente: e1
Coeficiente Desv. Tpica Estadstico t Valor p
----------------------------------------------------------------
110
Cuantomayorsealacorrelacinmejorserelinstrumento.
111
PrimeraetapadeMC2E.
112
Tambindenominadosvariablesinstrumentalesinternas(constyX2).
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
159
e2 0.205160 0.0319131 6.429 4.95e-07 ***
SCR = 0.848195, R-cuadrado = 0.587647
? R2e1e2 = corre1e2^2
Se ha reemplazado el escalar R2e1e2 = 0.587647
LacorrelacinparcialentreX1yZ1es0.766581.
ESTIMACINMCO:COMANDOols
? ols Y const X1 X2
? genr B = $coeff
Se ha generado la matriz B
? genr SB = $stderr
Se ha generado la matriz SB
? genr VB = $vcv
Se ha generado la matriz VB
? print B SB VB
B (3 x 1)
10.861
-3.6250
0.0083035
SB (3 x 1)
0.74241
0.19932
0.00047502
VB (3 x 3)
0.55117 -0.10961 -0.00026411
-0.10961 0.039728 1.0899e-005
-0.00026411 1.0899e-005 2.2564e-007
ESTIMACINPORVI:COMANDOtsls
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
160
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(1) = 1.95686
con valor p = 0.16185
SBVI (3 x 1)
0.89229
0.26554
0.00048736
VBVI (3 x 3)
0.79618 -0.19454 -0.00029747
-0.19454 0.070510 1.9344e-005
-0.00029747 1.9344e-005 2.3752e-007
DeacuerdoconeltestdeHausman,losestimadoresdeMCOsonconsistentesyasintticamente
eficientesparacualquierniveldesignificacinmenoroigualal16.18%( p valor 0.16185 ).
# Contraste de Sargan
? ols X1 const Z1 X2 --quiet
? restrict --quiet
? b[Z1]=0
? end restrict
Restriccin:
b[Z1] = 0
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
161
Cuando hay un solo regresor con problemas, el contraste se reduce a un estadstico F para
contrastarlahiptesisdequelosinstrumentosnoentranenlaprimerafasedelaestimacinde
VI.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
162
CLCULOS
ESTIMACINPORVI:ESTIMACINMCOENDOSETAPAS
EnpresenciadeendogeneidadelestimadordeMCOdaalavariableexplicativamsimportancia
de la que le corresponde (en este caso, el coeficiente estimado del parmetro que acompaa a
dichavariabletiendeasobreestimarelverdaderoefectodelavariableexplicativasobrelavariable
dependiente). Por ello, es necesario un procedimiento alternativo para la obtencin de
estimadores consistentes en presencia del problema de endogeneidad entre las variables
explicativas.
Sesuponequelavariacindelasvariablesexplicativastienedoscomponentes:unacomponente
que est correlacionada con el termino perturbacin (causante de la endogeneidad) y otra
componentequenoloest.Sisepudieraaislarlapartenocorrelacionada,seraposiblecentraren
ellaelclculodelosestimadores,desechandoconellolapartecorrelacionada,queeslacausante
delsesgodelosestimadoresMCO.
El estimador de VI utiliza variables ajenas al modelo original para separar las componentes
correlacionadas y no correlacionadas de las variables explicativas. Los instrumentos (Z) deben
cumplirdoscondiciones:
Relevancia:Cov(Z,X) 0siuninstrumentoesrelevantesuvariacinestarrelacionadacon
lavariacindelavariableexplicativaqueinstrumentaliza.
Exogeneidad:Cov(Z, )=0siuninstrumentoesexgenolapartedevariacindelavariable
explicativa que instrumentaliza slo correspondera a la parte de variacin exgena (no
correlacionadaconeltrminodeperturbacin).
SeaelmodeloconKvariablesexplicativasexgenasyRvariablesexplicativasendgenas:
ElmtododeVIseconsiderabietpicoporqueaplicaMCOdosveces:
- Primera etapa: se estiman por MCO las variables con problemas en funcin de todos los
instrumentos(internosyexternos)yseobtienenlascorrespondientesestimaciones.
X 1*t 0 1 X 1t ... K X Kt 1Z1t 2 Z 2t ... L Z Lt X * X 1*t
1t
...
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
163
*
X Rt 0 1 X 1t ... K X Kt 1Z1t 2 Z 2t ... L Z Lt X * X Rt*
Rt
- Segunda etapa: se estima por MCO el modelo inicial sustituyendo las variables endgenas
explicativas(variablesconproblemas)porlasestimacionesobtenidasenlaprimeraetapa.
Yt 0 1 X 1t ... K X Kt 1 X 1*t 2 X 2*t ... R X Rt* t
# Primera etapa
? ols X1 const Z1 X2 --quiet
? X1e = $yhat
Se ha generado la serie X1e (ID 8)
# Segunda etapa
? ols Y const X1e X2
Modelo 8: MCO, usando las observaciones 1-30
Variable dependiente: Y
Coeficiente Desv. Tpica Estadstico t Valor p
----------------------------------------------------------------
const 11.4533 1.98730 5.763 3.96e-06 ***
X1e 3.83967 0.591404 6.492 5.84e-07 ***
X2 0.00824462 0.00108545 7.596 3.60e-08 ***
Media de la vble. dep. 10.63333 D.T. de la vble. dep. 1.449931
Suma de cuad. residuos 11.41500 D.T. de la regresin 0.650214
R-cuadrado 0.812767 R-cuadrado corregido 0.798897
F(2, 27) 58.60251 Valor p (de F) 1.50e-10
Log-verosimilitud 28.07412 Criterio de Akaike 62.14823
Criterio de Schwarz 66.35182 Crit. de Hannan-Quinn 63.49300
Observacin:slolosestimadoresMCOdelosparmetrosdelasegundaetapacoincidenconlos
estimadoresdelosparmetrosdeVIyelrestodelasalidanocoincide.
TESTDEHAUSMAN
SeaelmodeloconKvariablesexplicativasexgenasyRvariablesexplicativasendgenas:
H 0 : Cov( X , ) 0 ( Exogeneidad )
H1 : Cov( X , ) 0 ( Endogeneidad )
SCE MO SCE MA sd
H T * R2
SCE MA
donde:
SCE MO eslaSCEdelmodelooriginal
SCE MA eslaSCEdelmodeloampliado(incluyelosRresiduoscomoregresoresadicionales)
Reselnmerodevariablespotencialmenteendgenas
# Se estima la variable con problemas en funcin de todos los instrumentos y se calculan los
residuos
? ols X1 const Z1 X2 --quiet
? eX1 =$uhat
Se ha generado la serie eX1 (ID 7)
# Se estima el modelo original aadiendo como regresores adicionales los residuos y se calcula la
SCE
? ols Y const X1 X2 eX1 --quiet
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
164
? SCESR = $ess
Se ha generado el escalar SCESR = 2.07132
# Se calcula el p-valor
? pvH = pvalue(X,1,H)
Se ha generado el escalar pvH = 0.16185
Hayquesealarquepararealizarestecontrastesepodrautilizarlaversint,enlaestimacin
del modelo original aadiendo como regresores adicionales los residuos de la regresin de la
variableconproblemasenfuncindetodoslosinstrumentos:
? ols Y const X1 X2 eX1
Modelo 17: MCO, usando las observaciones 1-30
Variable dependiente: Y
Coeficiente Desv. Tpica Estadstico t Valor p
-----------------------------------------------------------------
const 11.4533 0.862669 13.28 4.32e-013 ***
X1 3.83967 0.256723 14.96 2.76e-014 ***
X2 0.00824462 0.000471185 17.50 6.66e-016 ***
eX1 0.520638 0.399789 1.302 0.2042
Media de la vble. dep. 10.63333 D.T. de la vble. dep. 1.449931
Suma de cuad. residuos 2.071318 D.T. de la regresin 0.282252
R-cuadrado 0.966025 R-cuadrado corregido 0.962105
F(3, 26) 246.4259 Valor p (de F) 3.31e-19
Log-verosimilitud 2.472969 Criterio de Akaike 12.94594
Criterio de Schwarz 18.55073 Crit. de Hannan-Quinn 14.73896
Sin considerar la constante, el valor p ms alto fue el de la variable 9 (e)
OtambinpodrautilizarselaversinF:
? restrict --quiet
? b[eX1]=0
? end restrict
Restriccin:
b[eX1] = 0
Estadstico de contraste: F(1, 26) = 1.69594, con valor p = 0.204238
Observacin2:laversintdeStudentsloestdisponiblecuandoenelcontrasteintervieneuna
nicarestriccin.
Observacin 3: en este caso (una sola restriccin) las versiones F y 2 deberan coincidir, no lo
hacenporquecuandoseutilizaelcomandorestrictparaelclculodeFGretlutilizalosgradosde
libertaddelmodelo,mientrasqueparaelclculodeltestdeHausmanutilizaeltamaomuestral.
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
165
Por lo tanto, si se multiplica el estadstico F obtenido con el comando restric por la ratio de los
gradosdelibertadentreeltamaomuestral,seobtieneeltestdeHausmandelasalidatsls:
? Stsls = ($T/$df)*1.69594
Se ha generado el escalar Stsls = 1.95685
TESTDEINSTRUMENTODBILOTESTDEVALIDEZDEINSTRUMENTOS
TESTDEINSTRUMENTODBIL:ESTADSTICOFDELAPRIMERAETAPA
X it* 0 1 X 1t ... K X Kt 1 Z1t 2 Z 2t ... L Z Lt i 1,2,..., R
X it*
H 0 : 1 2 ... L 0
H1 : todos o alguno 0
? ols X1 const Z1 X2 --quiet
? restrict --quiet
? b[Z1]=0
? end restrict
Restriccin:
b[Z1] = 0
Cuandohayunsoloregresorconproblemas,eltestsereduceaunestadsticoFparacontrastarla
hiptesisdequelosinstrumentosnoentranenlaprimerafasedelaestimacindeVI.
TESTDEINSTRUMENTODBIL:ESTADSTICOFDECRAGGDONNALD
min ri 2
FC D T ( K 1) L i 1,2,..., R
L (1 min ri 2 )
donde:
Teseltamaomuestral
Relnmeroderegresoresconproblemas
(K+1)elnmeroderegresoressinproblemas(incluidoelregresorficticio)
Lelnmerodeinstrumentosexternos(losnoincluidosenlaregresin)
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
166
F(2, 27) 290.6909 Valor p (de F) 5.46e-19
Log-verosimilitud 36.02126 Criterio de Akaike 78.04252
Criterio de Schwarz 82.24611 Crit. de Hannan-Quinn 79.38728
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(1) = 1.95686
con valor p = 0.16185
Hayunregresorendgeno(X1),uninstrumentoexterno(Z1)ydosinstrumentosinternos(consty
X2).
# Tamao muestral
? T = $T
Se ha reemplazado el escalar T = 30
Se calculan los residuos de las regresiones de los regresores con problemas y de las variables
instrumentalessobrelosregresoressinproblemas:
? ols X1 const X2 --quiet
? series e1 = $uhat
Se ha reemplazado la serie e1 (ID 8)
Secalculalacorrelacincannicaentrelaseriederesiduose1ye2:
- Secreandosconjuntosdevariables.Elprimerconjuntoincluyee1(residuosdelaregresindel
regresorendgenosobrelosinstrumentosinternos)ysecrealamatrizE1.Elsegundogrupo
incluyee2(residuosdelaregresindelinstrumentoexternosobrelosinstrumentosinternos)y
secrealamatrizE2.
- Secalculalacorrelacincannicaentreambosgrupos.
# Clculo de las correlaciones cannicas
list E1 = e1
Se ha reemplazado la lista 'E1'
list E2 = e2
Se ha reemplazado la lista 'E2'
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
167
matrix YX = mY'mX
matrix XX = mX'mX
matrix YY = mY'mY
matrix ret = eigsolve(qform(YX, invpd(XX)), YY)
return sqrt(ret)
end function
l = cc(E1, E2)
Se ha reemplazado la matriz l = {0.766581}
print l
l (1 x 1)
0.76658
scalar cd = (T-RSP-L)*(mincc^2)/(L*(1-mincc^2))
Se ha reemplazado el escalar cd = 38.4779
Paraunniveldesignificacindel5%yunsesgodel10%elvalortabuladoporStockyYogo(2005)
esde16.38.Enestecaso,dadoqueF=38.47>16.38,seconcluyequeelsesgoesmenorqueel
10% (1/38.47 = 2.6%), por lo que se esperara que el estimador de VI basado en estos
instrumentosfuertestuvieseunsesgorelativamentepequeo.
Observacin: En Gretl la funcin que se utiliza para calcular las correlaciones cannicas es la
ofertada por Ricardo Lucchetti. La funcin se denomina cc y tiene dos argumentos, que son las
listas de variables que contienen los nombres de las variables de los dos grupos, de las cuales
deseamos calcular las correlaciones cannicas. Despus, las variables de cada grupo son
demandadas utilizando la funcin cdmean. Esta funcin centra las columnas de la matriz
argumentada alrededor de las medias de las columnas. A continuacin se calculan varios
productos cruzados (YX, XX, YY) y los autovalores para |QYY|=0, donde Q=(YX)(XX)1(YX).
Despus, se calcula el valor del estadstico F de CraggDonald, tomando los dos conjuntos de
residuos y utilizando la funcin cc para calcular las correlaciones cannicas. Y, por ltimo, se
calculaeltestdeCraggDonald.
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(2) = 4.64234
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
168
con valor p = 0.0981584
Hay dos regresores endgenos (X1 y X2), dos instrumentos externos (Z1 y Z2) y un instrumento
interno(const).
# Tamao muestral
? T = $T
Se ha generado el escalar T = 30
Se calculan los residuos de las regresiones de los regresores con problemas y de las variables
instrumentalessobrelosregresoressinproblemas:
? scalar df = $df
Se ha generado el escalar df = 27
Secalculanlascorrelacionescannicasentrelasseriesderesiduose1,e2,e3ye4:
- Secalculanlascorrelacionescannicasentreambosgrupos.
# Clculo de las correlaciones cannicas
list E1 = e1 e2
Se ha generado la lista E1
list E2 = e3 e4
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
169
Se ha generado la lista E2
l = cc(E1, E2)
Se ha generado la matriz l
print l
l (2 x 1)
0.73510
0.82579
scalar cd = (T-RSP-L)*(mincc^2)/(L*(1-mincc^2))
Se ha generado el escalar cd = 15.8714
Paraunniveldesignificacindel5%yunsesgodel10%elvalortabuladoporStockyYogo(2005)
esde7.03.Enestecaso,dadoqueF=15.87>7.03,seconcluyequeelsesgoesmenorqueel10%
(1/15.87 = 6.3%), por lo que se esperara que el estimador de VI basado en estos instrumentos
fuertestuvieseunsesgorelativamentepequeo.
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(1) = 1.70705
con valor p = 0.191369
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
170
valor 19.93 11.59 8.75 7.25
Hayunregresorendgeno(X2),dosinstrumentosexternos(Z1yZ2)ydosinstrumentosinternos
(constyX1).
# Tamao muestral
? T = $T
Se ha reemplazado el escalar T = 30
Se calculan los residuos de las regresiones de los regresores con problemas y de las variables
instrumentalessobrelosregresoressinproblemas:
? ols X2 const X1 --quiet
? series e1 = $uhat
Se ha reemplazado la serie e1 (ID 8)
Secalculanlascorrelacionescannicasentrelasseriesderesiduose1,e2ye3:
- Secreandosconjuntosdevariables.Elprimerconjuntoincluyee1(residuosdelaregresindel
regresorendgenosobrelosinstrumentosinternos)ysecrealamatrizE1.Elsegundogrupo
incluye e2 y e3 (residuos de las regresiones de los instrumentos externos sobre los
instrumentosinternos)ysecrealamatrizE2.
- Secalculanlascorrelacionescannicasentreambosgrupos.
# Clculo de las correlaciones cannicas
list E1 = e1
Se ha reemplazado la lista 'E1'
list E2 = e2 e3
Se ha reemplazado la lista 'E2'
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
171
scalar cd = (T-RSP-L)*(mincc^2)/(L*(1-mincc^2))
Se ha reemplazado el escalar cd = 23.2803
Paraunniveldesignificacindel5%yunsesgodel10%elvalortabuladoporStockyYogo(2005)
esde19.93.Enestecaso,dadoqueF=23.38>19.93,seconcluyequeelsesgoesmenorqueel
10% (1/23.38 = 4.3%), por lo que se esperara que el estimador de VI basado en estos
instrumentosfuertestuvieseunsesgorelativamentepequeo.
TESTDESARGAN
Yt 0 1 X 1t ... K X Kt 1 X 1*t 2 X 2*t ... R X Rt
*
t
? tsls Y const X1 X2 ; const X1 Z1 Z2
Contraste de Hausman -
Hiptesis nula: Los estimadores de MCO son consistentes
Estadstico de contraste asinttico: Chi-cuadrado(1) = 1.70705
con valor p = 0.191369
# Tamao muestral
? T = $T
Se ha reemplazado el escalar T = 30
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
172
? RSP = 2
Se ha reemplazado el escalar G = 2
? eMC2E = $uhat
Se ha generado la serie eMC2E (ID 12)
Se concluye que todos los instrumentos son vlidos al 5% y para cualquier nivel de significacin
menoroigualal12.65%( p valor 0.126503 ).
b ( X ' X ) 1 X ' Y
SCE
S2
T K 1
V (b) S 2 ( X ' X ) 1
# Estimacin MCO utilizando lgebra matricial
? YV = {Y}
Se ha generado la matriz YV
? XTX = X'X
Se ha generado la matriz XTX
? B = inv(X'X)*(X'YV)
Se ha reemplazado la matriz B
? SCE = YV'YV-B'X'YV
Se ha generado el escalar SCE = 2.20643
? S2 = SCE/(30-2-1)
Se ha generado el escalar S2 = 0.0817195
? VB = S2*inv(X'X)
Se ha reemplazado la matriz VB
? SB = sqrt(diag(VB))
Se ha reemplazado la matriz SB
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
173
? print XTX B SCE S2 VB SB
XTX (3 x 3)
30.000 74.120 31535.
74.120 185.21 77812.
31535. 77812. 3.3516e+007
B (3 x 1)
10.861
-3.6250
0.0083035
SCE = 2.2064266
S2 = 0.081719504
VB (3 x 3)
0.55117 -0.10961 -0.00026411
-0.10961 0.039728 1.0899e-005
-0.00026411 1.0899e-005 2.2564e-007
SB (3 x 1)
0.74241
0.19932
0.00047502
b * ( Z ' X ) 1 Z ' Y
SCE *
S*
2
T K 1
? YV = {Y}
Se ha reemplazado la matriz YV
? ZTX = Z'X
Se ha generado la matriz ZTX
? SCEVI = YV'YV-2*BVI'X'YV+BVI'X'X*BVI
Se ha generado el escalar SCEVI = 2.30123
? S2VI = SCEVI/(30-2-1)
Se ha generado el escalar S2VI = 0.0852308
? VBVI = S2VI*(inv(Z'X)*Z'Z*inv(X'Z))
Se ha reemplazado la matriz VBVI
? SBVI = sqrt(diag(VBVI))
Se ha reemplazado la matriz SBVI
BVI (3 x 1)
11.453
-3.8397
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
174
0.0082446
SCEVI = 2.3012329
S2VI = 0.085230847
VBVI (3 x 3)
0.79618 -0.19454 -0.00029747
-0.19454 0.070510 1.9344e-005
-0.00029747 1.9344e-005 2.3752e-007
SBVI (3 x 1)
0.89229
0.26554
0.00048736
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLADECONTENIDO
MULTICOLINEALIDAD...................................................................................................................1
Introduccin.........................................................................................................................................1
Deteccindemulticolinealidad.............................................................................................................2
Criteriosdescriptivos.................................................................................................................................................2
Criteriosestadsticos.................................................................................................................................................2
Comandosparaanalizarlamulticolinealidad........................................................................................7
Comandools.............................................................................................................................................................7
Comandocorr............................................................................................................................................................9
Comandogenrmatrixoperadoresmcorrydet........................................................................................................9
Comandogenrmatrixoperadoreigengen..............................................................................................................10
Comandovif............................................................................................................................................................13
Comandopca..........................................................................................................................................................14
Solucionesalamulticolinealidad........................................................................................................15
Aumentareltamaomuestral................................................................................................................................15
Eliminarregresores.................................................................................................................................................17
Suministrarinformacinadicional..........................................................................................................................19
Clculos..............................................................................................................................................20
Coeficientesdecorrelacinlineal...........................................................................................................................20
Matrizdecorrelacin..............................................................................................................................................21
Determinantedelamatrizdecorrelacin..............................................................................................................21
R 2 auxiliares..........................................................................................................................................................21
FactoresdeIncrementodelaVarianza...................................................................................................................22
Tolerancias..............................................................................................................................................................22
Autovalores.............................................................................................................................................................23
NmerosdeCondicin............................................................................................................................................23
ndicesdeCondicin...............................................................................................................................................23
ProporcionesdeDescomposicindelaVarianza...................................................................................................24
ndicedemulticolinealidad.....................................................................................................................................26
TestdeFarraryGlauber..........................................................................................................................................26
Comprobaciones.................................................................................................................................29
Coeficientesdecorrelacinlineal...........................................................................................................................29
Matrizdecorrelacin..............................................................................................................................................30
NORMALIDAD............................................................................................................................33
Introduccin.......................................................................................................................................33
Deteccindelanonormalidaddelasperturbaciones.........................................................................33
Grficosdelosresiduos..........................................................................................................................................34
Estadsticosdescriptivos.........................................................................................................................................34
TestdeJarqueBera.................................................................................................................................................36
Comandosparaelanlisisdelanormalidaddelasperturbaciones......................................................37
Comandosummary:estadsticosdescriptivos........................................................................................................37
Comandomodtest:testdenormalidaddeDoornikHansen.................................................................................38
Comandonormtest.................................................................................................................................................40
Comandofreq.........................................................................................................................................................41
Comandoqqplot.....................................................................................................................................................42
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
ii
Comandognuplot....................................................................................................................................................45
Solucionesalanonormalidaddelasperturbaciones..........................................................................47
Clculos..............................................................................................................................................49
CoeficientedeasimetradePearson......................................................................................................................49
Coeficientedeexcesodecurtosis...........................................................................................................................50
Testdeasimetra.....................................................................................................................................................50
Testdeexcesodecurtosis......................................................................................................................................51
TestdeJarqueBera.................................................................................................................................................52
HETEROCEDASTICIDAD...............................................................................................................55
Introduccin.......................................................................................................................................55
Deteccindelaheterocedasticidad.....................................................................................................55
Mtodogrfico........................................................................................................................................................56
Testsestadsticos....................................................................................................................................................57
Comandosparaladeteccindeheterocedasticidad............................................................................62
Comandognuplot....................................................................................................................................................62
Comandomodtest...................................................................................................................................................65
Solucionesalaheterocedasticidad......................................................................................................68
EstimacinMnimoCuadrticaPonderada.............................................................................................................68
EstimacinRobusta.................................................................................................................................................71
Prediccinconheterocedasticidad......................................................................................................72
Clculos..............................................................................................................................................73
ContrastedeWhiteenfuncindelasvariablesexgenasdelmodelo,suscuadradosysusproductoscruzados 73
ContrastedeWhiteenfuncindelasvariablesexgenasdelmodeloysuscuadrados........................................74
ContrastedeBreuschPagan...................................................................................................................................76
PruebadeHarvey....................................................................................................................................................77
TestdeGlejser.........................................................................................................................................................78
ContrastedeGoldfeldQuandt................................................................................................................................80
TestdeBarlett.........................................................................................................................................................81
Estimadoresconelmodelotransformado..............................................................................................................84
Estimadoresconcorrecindeheterocedasticidad.................................................................................................85
Estimadoresrobustos..............................................................................................................................................86
AUTOCORRELACIN...................................................................................................................89
Introduccin.......................................................................................................................................89
Deteccindeautocorrelacin..............................................................................................................89
Mtodogrfico........................................................................................................................................................90
Testsestadsticos....................................................................................................................................................91
donde 4 eselcoeficientedecorrelacindecuartoorden.........................................................96
Comandosparaladeteccindeautocorrelacin...............................................................................100
Comandognuplot..................................................................................................................................................100
Comandools:estimadordelcoeficientedecorrelacindeprimerordenyestadsticodeDurbinWatson........102
Comandoruns:testderachas..............................................................................................................................103
Comandomodtest:contrastedeBreuschyGodfreyyestadsticodeLjungBox.................................................104
SolucionesalaautocorrelacinparaunAR(1)...................................................................................107
EstimacinMnimoCuadrticaGeneralizada.......................................................................................................108
EstimacinRobusta...............................................................................................................................................111
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
TABLA DE CONTENIDO
iii
Diferenciacinyautocorrelacin..........................................................................................................................112
Prediccinconautocorrelacin.........................................................................................................113
Prediccindinmica..............................................................................................................................................113
Prediccinesttica................................................................................................................................................113
Clculos............................................................................................................................................114
Coeficientedeautocorrelacinestimadodeordenj............................................................................................114
EstadsticodeDurbinWatson...............................................................................................................................115
RazndeVonNeumann........................................................................................................................................116
EstadsticohdeDurbin.........................................................................................................................................118
Estadsticod4deWallis.........................................................................................................................................119
EstadsticosdeBoxPierceLjung...........................................................................................................................119
EstadsticodeBoxPierce......................................................................................................................................121
EstadsticodeBreuschyGodfrey..........................................................................................................................121
Testderachas.......................................................................................................................................................125
MtodoiterativodePraissWinsten.....................................................................................................................126
EstimadoresdeMCG.............................................................................................................................................135
Prediccin..............................................................................................................................................................137
LINEALIDAD..............................................................................................................................139
Introduccin.....................................................................................................................................139
AnlisisdelaLinealidad....................................................................................................................139
Mtodogrfico......................................................................................................................................................140
Testsestadsticos..................................................................................................................................................140
ComandosparaanalizarlaLinealidad...............................................................................................142
Comandognuplot..................................................................................................................................................142
Comandoreset......................................................................................................................................................143
Clculos............................................................................................................................................145
TestRESETdeRamsey...........................................................................................................................................145
PruebaJdeDavidsonyMackinnon.......................................................................................................................147
PruebaJAdeFisheryMcAleer.............................................................................................................................148
REGRESORESESTOCSTICOS....................................................................................................151
Introduccin.....................................................................................................................................151
Anlisisdelaexogeneidaddelamatrizderegresores.......................................................................152
TestdeHausman...................................................................................................................................................152
Testdeinstrumentodbilotestdevalidezdeinstrumentos...............................................................................154
TestdeSargan.......................................................................................................................................................155
Comandoparaanalizarlanoaleatoriedaddelosregresores:tsls......................................................156
Generacindelinstrumento:mtododeWald....................................................................................................157
Relevanciadelinstrumento..................................................................................................................................158
EstimacinMCO:comandools.............................................................................................................................159
EstimacinporVI:comandotsls...........................................................................................................................159
Clculos............................................................................................................................................162
EstimacinporVI:estimacinMCOendosetapas...............................................................................................162
TestdeHausman...................................................................................................................................................163
Testdeinstrumentodbilotestdevalidezdeinstrumentos...............................................................................165
TestdeSargan.......................................................................................................................................................171
EstimacinporMnimosCuadradosOrdinariosyporVariablesInstrumentalesutilizandolgebramatricial.....172
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)
INCUMPLIMIENTOS DEL MODELO DE REGRESIN LINEAL NORMAL CLSICO CON GRETL
iv
MVictoriaVerdugoMats(vverdugo@uvigo.es)MIsabelCalBouzada(ical@uvigo.es)