Apendice E

63
ECONOMETRA ESPACIAL

Tradicionalmente en la ciencia regional, los estudios economtricos convencionales han
analizado las unidades espaciales (p.e. municipios, estados) como islas independientes
asumiendo implcitamente que los valores de una unidad y otra son independientes de su
posicin geogrfica. Este bien podra no ser el caso, podramos pensar en que la relacin
entre las caractersticas de dos unidades que comparten una frontera sea mayor que la de
dos unidades que se encuentren distanciadas. El comprobar esta hiptesis es precisamente
de lo que se ocupa la econometra espacial. As, parte de la idea de que las observaciones
tienen un cierto ordenamiento espacial y que ste da lugar a la existencia de diversas
relaciones entre ellas. Este ordenamiento es complejo, al menos ms complejo que por
ejemplo el estudio de series de tiempo debido a su naturaleza multidimensional y
bidireccional.
1

Para comenzar es importante tener claro el concepto de Matriz de Pesos
Espaciales (MPE). Esta matriz es la que se define para medir la proximidad o relacin
espacial de las observaciones, pues representa la fuerza de interaccin potencial entre las
distintas localizaciones de stas. La MPE es generalmente denotada por W y es de orden
(nxn). La manera ms general en que puede ser definida es una matriz de contigidad
binaria, generada a partir de informacin topolgica, en donde el valor de w
ij
ser 1 si las
unidades i y j comparten alguna frontera, y tomar el valor de 0 en caso contrario. En
algunos casos, para mayor facilidad de interpretacin, la MPE es estandarizada por

1
En series de tiempo la relacin es unidireccional: y se relaciona con y-1 o y-2 pero no a la inversa;
adems, la nica dimensin de estudio es el tiempo.
64
renglones, esto es, W es transformada de modo que la suma de los elementos de un
rengln es 1.
2

Debido a que la matriz de simple contigidad no puede diferenciar la fuerza de las
relaciones espaciales entre ubicaciones adyacentes, se han propuesto relaciones ms
complejas
3
: Cliff y Ord(1981) proponen una matriz asimtrica en donde los valores
vienen dados por una combinacin de la distancia entre las unidades y un clculo de
extensin relativa de las fronteras que stas comparten: w
ij
= (d
ij
)
-a
(
ij
)
b
donde d
ij
es la
distancia entre la unidad i y j,
ij
es la proporcin del lmite interior de la unidad i que
est en contacto con la unidad j, a y b son parmetros.
Dacey(1968) toma el rea relativa de las unidades espaciales: w
ij
= d
ij
ij
donde
d
ij
es un factor de contigidad binario,
i
es la porcin que representa la unidad i dentro
del rea total de estudio,
ij
es el mismo factor de Cliff y Ord.
Bodson y Peeters(1975) asignan los valores con un peso de accesibilidad general
al combinar la influencia de varios canales de comunicacin entre las unidades espaciales
en una funcin lgica. w
ij
=
j
k
j
{a/[1+b*exp(-c
j
d
ij
)]} en donde k
j
es la importancia relativa
de las vas de comunicacin, d
ij
es la distancia entre las unidades i y j; a, b y c son
parmetros que deben ser estimados.
Podemos ver as, que uno de los problemas metodolgicos ms difciles en el
anlisis espacial es la especificacin correcta de la MPE. Dado que siempre existir cierto
grado de arbitrariedad - la mayora de las aplicaciones de ciencia regional definen la MPE

2
A parte de facilitar la interpretacin de coeficientes, no hay razn matemtica o estadstica para
estandarizar, por esto, la estandarizacin no debe realizarse de manera automtica. Considere los siguientes
ejemplos: cuando la matriz estandarizada resulta asimtrica, las estimaciones y procedimientos de los test
son ms complejos; adems, si, como veremos ms adelante, la matriz est basada en alguna funcin
inversa de distancia, el estandarizar puede provocar la prdida de la interpretacin econmica de esto
(Gmez, 1999)
3
Ejemplos encontrados en Bao, Shumming.
65
como alguna combinacin de la matriz de contigidad simple y la relacin de distancia-
los autores recomiendan comparar distintos tipos de matriz a fin de encontrar el ms
apropiado.
4

Siguiendo a Anselin (1990) el trabajo de anlisis con datos espaciales se divide en
2 enfoques: Data driven approach en donde se asume la aleatoriedad y tanto el patrn,
la estructura y la interaccin espaciales son derivados de los datos nicamente, sin ser
limitados por alguna nocin terica; y el Model driven approach que comienza con una
especificacin terica que es confrontada con los datos. La mayora de los mtodos bajo
esta categora se ocupan de la estimacin y diagnstico de las especificaciones de los
modelos espaciales.
5

DATA DRIVEN APPROACH
Cae en la categora de explanatory data analysis (EDA) popularizado por Tukey en
1977. Todas las tcnicas comparten el supuesto de una distribucin aleatoria del patrn
espacial y que ste, la estructura y forma de dependencia espaciales se derivan
nicamente de los datos. Para encontrar esta asociacin espacial, definida como
autocorrelacin espacial, se proponen estadsticos globales y estadsticos locales.
El estadstico global ms comn es la I de Moran definida por:
I(d) = w
ij
(x
i

x
) (x
j

x
) / (S
2
w
ij
)
donde S
2
= (1/n) (x
i

x
)
2
, x
i
denota el valor observado en la unidad i,
x
es el
promedio de{x
i
}sobre las n ubicaciones, y w
ij
es la medida de peso espacial definida

4
Cabe mencionar que para incorporar el efecto espacial en la econometra se podran utilizar tambin
operadores de desfase espacial (rezagos), sin embargo stos implicaran definir una direccin especfica del
rezago de las observaciones y de un orden de contgidad. (Gmez, 1999)
5
Bao, Shuming
66
anteriormente. La media terica de la I de Moran es -1/(n-1). I tendr signo positivo
cuando el valor observado de las ubicaciones dentro de una distancia determinada (d)
6

tiendan a ser similares, es negativo cuando son desiguales y se aproxima a cero cuando
hay un ordenamiento aleatorio e independiente en el espacio (Goodchild, 1986). Otro
estadstico es la C de Geary que est basada en la suma ponderada del cuadrado de la
diferencia entre observaciones:
C(d) = (n-1) / (2 w
ij
) { w
ij
(x
i
x
j
)
2
/ (1/n) (x
i
-
x
)
2
}
donde x
i
y x
j
estn en valores estandarizados y w
ij
son los elementos de la matriz de pesos
espaciales estandarizada por renglones. A mayor valor de C (>>1) indica que los valores
de las unidades dentro de la distancia (d) tienden a ser diferentes, mientras que un valor
pequeo (C<<1) indica similitud.
Por ltimo, mencionamos el estadstico definido por Getis en 1992:
G(d) = w
ij
(d)x
i
x
j
/ x
i
x
j

de igual manera que I y C, una G aproximadamente normalizada se puede calcular (Z(G))
de la cual, valores positivos altos indican que el patrn espacial esta dominado por
clusters de valores altos y viceversa.
Los estadsticos globales prueban la hiptesis nula de no existencia de
autocorrelacin espacial, y estn basados en el supuesto de estabilidad estructural sobre
el espacio. Este supuesto podra bien ser no realista, especialmente con un nmero grande
de observaciones: la idea de patrones diferentes para regiones distantes entre s no es muy
difcil de concebir. Para capturar patrones locales de espacialidad existen los estadsticos
denominados locales, como el pocket plot de Cressie (1991), el Moran scatterplot de

6
No sin cierto grado de arbitrariedad.
67
Anselin(1993) el estadstico G de Getis y Ord(1992) y el Indicador local de asociacin
espacial (LISA por sus siglas en ingls) de Anselin(1994).
Adems de su utilidad como estimadores de autocorrelacin espacial, la I de
Moran y la G de Getis son usados para ilustrar la concentracin espacial de valores altos
o bajos. Es importante recordar que siempre se debe tener cierta precaucin en la
interpretacin de los resultados, pues todos los estadsticos dependen de la definicin de
la matriz de pesos espacial y el nmero de unidades espaciales de la muestra.

MODEL DRIVEN APPROACH
Los dos principales problemas de los procesos espaciales estocsticos son: la
dependencia o autocorrelacin espacial y la heterogeneidad o estructura espacial. La
causa de la primera es, en general, los errores de medicin. Estos errores a su vez son
generados por: a) al analizar las unidades de estudio nos podemos dar cuenta que la
delimitacin es por lo general aleatoria: las divisiones polticas de los municipios por
ejemplo; b) con la cada vez ms fuerte presencia de tecnologa y automatizacin de la
agregacin de datos el riesgo de no detectar errores aumenta; y c) la combinacin de
procesos espaciales como la difusin, el intercambio, la interaccin y efectos de spill
over.
7
La heterogeneidad por su parte es causada por la falta de estabilidad espacial del
comportamiento o de las relaciones que estn siendo estudiadas,
8
debido al tamao de la
unidad de observacin, sus dotaciones iniciales de recursos o los procesos de
concentracin que stas conllevan generando entonces un mosaico irregular de objetos de
anlisis. Otro aspecto de la heterogeneidad espacial es la heterocedasticidad que sta
provoca, pero de esto, nos ocuparemos ms adelante.

7
Gmez (1999)
8
Por ejemplo, las formas funcionales pueden variar para diferentes reas econmicas (Gmez, 1999))
68
Existen 2 tipos de modelos espaciales autrorregresivos que son empleados en la
estadstica espacial: Conditional Autorregresive (CAR) y Simultaneous Autorregresive
(SAR) en donde la diferencia entre ellas es la especificacin de la funcin de covarianza
inversa. Para CAR esta especificacin es: (I C)/
2
donde C es una matriz binaria de
contigidad simple; para SAR es (I W)
t
(I W)/
2
donde W es una matriz de pesos
espacial estandarizada por renglones.
9

La forma general del modelo de proceso espacial es:
y = W
1
y + X +
= W
2

+
donde W
1
y W
2
son matrices de pesos espaciales y ~N(0,

).

Existen 3 especificaciones de los modelos espaciales autorregresivos:
1.- Autorregresin espacial simple: la variable independiente es nicamente un rezago
espacial de la variable dependiente.
(y - )= W(y- ) +
o reescrito: y = Wy +
en donde es el coeficiente de autocorrelacin espacial (y su signo determina la relacin
de los efectos entre vecinos) y ~N(0,). Como el error est correlacionado con la
variable explicativa Wy, los estimadores de MCO sern sesgados e ineficientes.

2.- Modelo espacial autorregresivo con dependencia substancial (de acuerdo a la
terminologa de Anselin 1993): adems del rezago espacial, existen otras variables
explicativas exgenas.
y = Wy + X +

9
CAR es normalmente usado nicamente para relaciones de primer orden, mientras SAR es usado para
dependencia de primer y segundo orden.
69
donde X es un vector de variables explicativas que se asumen no correlacionadas con el
trmino de error. El mismo problema que en el caso anterior se presenta, y MCO
producir estimadores sesgados e ineficientes..

3.- Modelo espacial autorregresivo con dependencia espacial del error: este modelo tiene
slo variables explicativas exgenas
10
pero sigue un proceso autorregresivo espacial.
y = X +
= W +
de aqu, (y - X ) = W(y - X ) +
donde es el coeficiente escalar del error espacial (y su significancia representar que un
choque aleatorio afectar no slo a la regin en donde se provoc, sino que se transmitir
a todo el sistema) y ~N(0, ). De aqu, los estimadores MCO sern insesgados, pero
ineficientes.

Existe una cuarta especificacin propuesta por Rey y Montouri (1999) llamada Spatial
Cross-regressive. Lo que hace es introducir una variable de rezago espacial exgena
definida como (Wy
o
) y que contiene los valores iniciales de la variable relevante como
pesos en la MPE. Por ejemplo, Lim (2003) utiliza esta especificacin para la estimacin
del grado de convergencia regional a travs del crecimiento del ingreso quedando el
modelo: g =
i
+ y
o
+ Wy
o
+
Este modelo es estimado por MCO. En esta especificacin, la variable dependiente est
afectada tanto por el valor inicial de la observacin como por los valores iniciales de las
dems regiones.

10
Del modelo general , 0 y el error original tiene la matriz de covarianzas no-esfrica:
E[ ]=(I W)
-1
2
I(I - W)
-1

70
Comprobar la existencia de dependencia espacial y heterogeneidad en modelos
espaciales usualmente depende de cmo la estructura espacial o la MPE sea definida.
Dado que no hay una definicin nica, estas pruebas son ms complejas que los modelos
economtricos estndar. Existen 2 tipos de pruebas para la dependencia espacial:
probar la dependencia del error y probar para dependencia sustancial. El enfoque comn
es de aplicar la I de Moran y la prueba del Multiplicador de Lagrange (LM) a los residuos
de la regresin de MCO. Esperaramos que estos residuos tengan autocorrelacin en caso
de que la relacin espacial no haya sido tomada en cuenta especfica y correctamente en
el modelo (Gmez de Antonio, 1999).
La I de Moran
11
satisface una distribucin normal asinttica en muestras grandes, se
calcula:
I = eWe/ee ~N(
I
,
2
I
)

donde e es el vector de residuos de la regresin original. LM puede calcularse para ambas
pruebas, sigue una distribucin
2
(1) asinttica y la hiptesis nula es que no existe
dependencia espacial. De acuerdo a Anselin(1993) el tipo de dependencia puede ser
definido comparando ambos LM, el de mayor significancia tiende a ser la alternativa
correcta. El clculo viene dado por:

LM(err) = {eWe/
2
}
2
/ tr[WW + W
2
]

tr representa el matrix trace operator,
2
es un estimado de Maximum likelihood para
la varianza del error (p.e.
2
=ee/n).

11
Para probar la dependencia del error nicamente.
71
LM(lag) = {eWy/
2
}
2
/ {(WXb)MWXb/
2
+ tr[WW + W
2
]}

aqu Wy es el rezago espacial, b es el vector de estimadores MCO para los parmetros ,
M es una matriz de proyeccin, M=I-X(XX)
-1
X.
Ante la existencia de dependencia espacial, los estimadores MCO sern sesgados
e inconsistentes. Estimar por EGLS tampoco llevar a consistencia por la naturaleza
multidimensional de la dependencia espacial. Anselin(1988) y Anselin y Bera(1998)
sugieren que la inferencia en espacialidad tendr caractersticas deseables si es hecha de
acuerdo al enfoque de Maximum Likelihood.
12
El uso de Variables Instrumentales,
Mtodo General de Momentos o Mnimos Cuadrados de 2 Etapas han sido sugeridos por
algunos otros autores.
Es importante hacer notar lo siguiente, puede suceder que ante la prueba para
dependencia espacial, uno, ambos o ninguno de los estadsticos sean significativos. La
estrategia para elegir una correcta especificacin del modelo espacial est normalmente
basada en la descrita por Anselin y Florax (1995) o por Florax et al(2003). De acuerdo
con Anselin y Florax para escoger el modelo ms apropiado se comparan los estadsticos
LM
y LM: si LM
es ms significativo que LM y adems, LM
es robusto mientras el
otro no, el modelo debe ser especificado con dependencia en el error; en el caso de que
ambas condiciones se cumplan para LM la correcta especificacin es de dependencia
sustancial
13
.

12
Este ltimo enfoque, es el que se sigui en este proyecto. De acuerdo con Anselin (1988), si las
condiciones de regularidad para una funcin likelihood se cumplen, los estimadores tendrn consistencia,
sern asintticamente eficientes y seguirn una distribucin normal. Adems casi siempre son insesgados.
(En Bao, Shumming)
13
Lim (2003)
72
Florax et al(2003) define 6 pasos para encontrar la especificacin correcta:
1.- Estimar el modelo por MCO
2.- Probar dependencia espacial por LM
o LM

3.- Si no se comprueba la existencia de dependencia espacial, se deben tomar los
estimadores de MCO.
4.- Si ambos estadsticos prueban dependencia, la especificacin correcta ser la del
estadstico ms significativo.
5.- Si LM
es significativo mientras que LM
no lo es, la especificacin correcta es de un

modelo de dependencia en el error.
6.- Si LM
es significativo mientras que LM
no lo es, la especificacin correcta es de un

modelo de dependencia sustancial.
14

Una vez comprobada la dependencia espacial, las propiedades distribucionales de
los tests paramtricos tradicionales para heterocedasticidad no sern vlidas. El ltimo
paso entonces para concluir el anlisis es el de hacer un test de Chow para comprobar la
no existencia de heterogeneidad. Las hiptesis del test son las siguientes:

H
o
: y = X +

H
1
: y = X
i
0
i

+

0 X
j
j
donde X
i
(nxk) y X
j
(nxk) son subconjuntos de observaciones de la variable explicativa,
i

y
j
coeficientes de regresin relativos. Cuando el error sigue un proceso espacial
autorregresivo, el estadstico de prueba de Chow se define como:

C = {e
R
(I W)(I - W)e
R
e
U
(I - W)(I - W)e
U
} /
2
~
2
(k)

14
De igual manera que el R
2
, el log likelihood siempre aumenta cuando aumentamos el nmero de
variables en el modelo, Lim(2003) utiliza al AIC (Criterio de informacin de Akaike) para corregir esto.
La regla es que a medida que el AIC sea menor, el modelo ajusta mejor; y es calculado como:
AIC= -2L + 2K (donde L es el log likelihood maximizado y K es el numro de variables).
73
donde es el estimado de ML para el parmetro espacial, e
R
(e
U
) son los residuos para
una regresin restringida (no restringida), y
2
es el estimado de la varianza del error para
ya sea el modelo restringido, el no restringido o ambos. Esta prueba sigue una
distribucin
2
(k) bajo la hiptesis nula de no existencia de heterogeneidad espacial (
i
=
i
).
15

15
Para prevenir este problema, tambin se puede estimar los estadsticos LM robustos y ahorrarnos este
ltimo paso. (Bao, Shumming)

Apendice E

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Apendice E

Încărcat de

Drepturi de autor:

Formate disponibile

63

es ms significativo que LM y adems, LM

es significativo mientras que LM

no lo es, la especificacin correcta es de un

es significativo mientras que LM

no lo es, la especificacin correcta es de un

S-ar putea să vă placă și