Sunteți pe pagina 1din 32

Buzai, G.D. (comp.) 2007.

Mtodos Cuantitativos en Geografa de


la Salud. Universidad Nacional de Lujn. Lujn


Dr. Gustavo D. Buzai

ANLISIS EXPLORATORIO DE LA ESTRUCTURA ESPACIAL DE
ENFERMEDADES EN LA CIUDAD DE LUJN

INTRODUCCIN

El anlisis de distribucin y asociacin espacial resultan ser importantes
abordajes metodolgicos al momento de estudiar caractersticas espaciales de la
poblacin en mbitos urbanos.

El impacto generado por las polticas de una economa neoliberal globalizada,
como tendencia prioritaria en las ltimas dcadas ha dejado huellas profundas en las
estructuras socioespaciales y particularmente en el mbito urbano se han detectado
notables desigualdades que constantemente se profundizan.

El Anlisis Exploratorio de Datos Espaciales (ESDA)
1
presenta una serie de
tcnicas que permiten captar la estructura espacial de las caractersticas analizadas y en
el presente trabajo el objetivo es presentar y analizar estas tcnicas en el mbito de la
Geografa Mdica, donde los datos de morbilidad asistida a travs de los diagnsticos
realizados en las salas de atencin primaria y las condiciones sociales y habitacionales
pueden brindar importante pautas de comprensin a diferentes problemticas.

Los ejemplos presentados en cada caso de aplicacin corresponden a la ciudad de
Lujn, rea urbana de tamao intermedio de la Argentina, en datos medidos a nivel de
los 70 radios censales urbanos en que se divide estadsticamente la ciudad. Los datos
sociales y habitacionales provienen del Censo Nacional de Poblacin, Hogares y
Viviendas 2001 y los datos de morbilidad asistida fueron recabados inicialmente a nivel
de barrio para el ao 2001 en un trabajo de tesis realizado por Cruz (2004), luego
ajustado para las unidades espaciales censales.

EL ANLISIS EXPLORATORIO DE DATOS ESPACIALES (ESDA)


1
A lo largo del texto se han mantenido las diversas siglas en ingls con la finalidad de lograr compatibilidad con los
trabajos internacionales que dieron origen a las diferentes lneas, listado de las siglas utilizadas se presenta en el punto 6.
Caractersticas fundamentales

A partir del trabajo de Tukey (1977) se han comenzado a afianzar y difundir las
tcnicas del anlisis exploratorio de datos (EDA) como herramientas que permiten
realizar un estudio inicial de los mismos en aproximaciones grficas previas a la
realizacin de procedimientos estadsticos de mayor complejidad, como el anlisis de
regresin mltiple o el anlisis multivariado con finalidad de regionalizacin.

La variedad de tcnicas posibles se encuentran bien desarrolladas en una serie de
libros (Agresti y Finlay, 1994; Bosque Sendra y Moreno Jimnez, 1994; Hair et al.,
1999) y artculos orientados exclusivamente al anlisis geogrfico (Haining et al., 1998;
Unwin y Unwin, 1998; Wilhelm y Steck, 1998).

La aplicacin inicial del ESDA tiene por objetivo que el investigador cuente con
informacin estructural del comportamiento de cada variable (univariado), como as
tambin de las relaciones existentes entre dos (bivariado) y tres variables (trivariado).
Aplicacin que adems de este comportamiento estructural permite descubrir errores
en la codificacin de los datos, determinar los casos anmalos (outliers) y la posibilidad
de comprobar supuestos necesarios para la aplicacin de la mayora de los test
estadsticos.

En el nivel univariado, de acuerdo con Bosque Sendra (1994) son tres las
medidas que se deben realizar: (a) centralidad, valor de mayor representatividad, (b)
dispersin, variabilidad respecto de la centralidad, y (c) distribucin de cada dato en el
continuo numrico.

Estas bsquedas, en la estadstica bsica, llevan a resultados a partir de la
aplicacin de procedimientos aritmticos, mientras que a travs del anlisis
exploratorio de datos estas caractersticas se hacen evidentes de forma visual mediante
la realizacin de grficos especficos, los cuales permiten resaltar sus principales
cualidades.

Se considera generalmente que en la escala de medida nominal son de utilidad los
diagramas de barra, lnea y sectores; para la ordinal el box-plot, mientras que para la
escala de medida de intervalos se utilizan los histogramas y polgonos de frecuencia.

El nivel bivariado (2D) y trivariado (3D) se basa en procedimientos
comparativos del comportamiento de variables, tcnica que se apoya en los
denominados diagramas de dispersin con dos y tres ejes de coordenadas
respectivamente, a partir de los cuales las nubes de puntos formadas por las mediciones
individuales muestran una aproximacin al tipo, tendencia e intensidad de la relacin.

Las posibilidades tecnolgicas actuales del anlisis exploratorio de datos como
tcnicas de uso interactivo grficos intermedios entre las bases de datos alfanumricas
y la cartografa digital- amplan sus posibilidades de manera notable (Anselin, 1999),
principalmente al incorporar una dimensionalidad espacial que la lleva a un ESDA de
gran potencialidad.

Interactividad en el anlisis y la visualizacin

Los cambios que se estn produciendo en el uso y funcin de la cartografa como
representacin del mundo son uno de los puntos centrales de las actuales perspectivas
digitales, donde la interactividad en ambientes virtuales van tomando un lugar
preponderante.

Se considera que si bien los mapas tradicionales han representado el espacio
geogrfico principalmente desde un punto de vista esttico, en la actualidad la
flexibilidad digital los lleva a tener un dinamismo muy importante a travs de la
interactividad conseguida para el acceso a los datos espaciales asociado a ellos.

La interaccin genera resultados visuales y llega a lo que Bosque Sendra y
Zamora Ludovic (2002) presentan como Visualizacin Geogrfica (GVis) asociada a las
interfases computacionales en Sistemas de Informacin Geogrfica como aproximacin
mayor dentro de la Visualizacin Cientfica (ScVis) derivada tcnicamente de los
avances actuales en computacin grfica.

Desde un punto de vista cognitivo, Petch (1994) analiza que la forma tradicional
de obtener conocimiento a travs de la visualizacin es emprico y no est relacionado
con interfases grficas, aunque en una segunda etapa mediante el uso de computadoras
se pueda hablar de conocimientos y visualizaciones basadas en ellas.

Los diagramas de dispersin 2D y 3D son considerados en este trabajo como
parte de las nuevas herramientas que permiten ampliar las posibilidades de
investigacin a partir del procesamiento y uso de datos espaciales.

Estas tcnicas amplan posibilidades de anlisis y comienzan a tener amplia
difusin a partir de los Sistemas de Ayuda a la Decisin Espacial (SDSS).

EL ESDA EN GEOGRAFA DE LA SALUD

De acuerdo con el trabajo clsico de Howe (1985) la salud como sistema
analtico comprende cinco ramas: (1) biologa humana, (2) ambiente, (3) forma de
vida, y (4) sistema de asistencia mdica.

De acuerdo con las tendencias actuales la Geografa Mdica aborda bsicamente
la segunda lnea considerando principalmente los factores externos al cuerpo humano
que forman parte de su entorno, la Geografa de los Servicios Sanitarios aborda
bsicamente la cuarta lnea considerando a los centros de atencin mdica como
centros de oferta de servicios mdicos, los pacientes como demanda distribuida y el
anlisis de sus relaciones con la finalidad de lograr una mayor eficiencia y equidad
espacial. Ambos, Geografa Mdica y Geografa de los Servicios Sanitarios, segn
Olivera (1993), presentan de forma integrada el concepto actual de Geografa de la
Salud.

El ESDA ser aplicado a la relacin entre diagnsticos de enfermedad,
caractersticas poblacionales y ambiente urbano, es por ese motivo, que se orienta
bsicamente a los lineamientos en Geografa Mdica, aunque otros sistemas espaciales
pueden ser utilizados para el anlisis interior de los establecimientos organizacionales
(Lang, 2004) o el uso tcnico de la mayor complejidad a travs de los llamados
Sistemas de Informacin Espacial (Buzai y Baxendale, 2006).

APLICACIN DEL ESDA EN GEOGRAFA DE LA SALUD

Cartografa Temtica

Se considera que la cartografa temtica como campo cientfico tiene por objetivo
la realizacin de mapas de cualquier tipo de tema que exceda la nica representacin de
los rasgos del terreno, segn Fitz (2000) debe presentar informacin diferente a la que
se percibe en el rea de estudio analizada. Sus resultados intentan brindar apoyo a
diversos campos cientficos y ser de utilidad para las actividades de gestin y
planificacin territorial, como as tambin para la comunicacin sinttica del tema, a
nivel cartogrfico, destinada a usuarios de diversas profesiones y a un pblico en
general.

Las posibilidades de representacin de acuerdo a su amplitud temtica son
innumerables, por lo cual cada uno de estos mapas se confecciona orientado hacia un
propsito especfico, aunque desde un punto de vista general, se centran en el anlisis
de las distribuciones espaciales individuales y sus posibles correlaciones. Un recorrido
histrico puede encontrarse en la obra de Koch (2005) y su focalizacin en las
posibilidades actuales en Curto (2003).

Todo producto cartogrfico es un modelo del mundo real que cuenta con una
serie de especificaciones propias: proyeccin, sistema de coordenadas y escala. Ante las
nuevas tecnologas, la diferenciacin sucede por el cambio de ambiente, ya que estas
representaciones pasan a ser un modelo digital de la realidad.

Sus resultados pueden ser en forma de mapas topogrficos (representaciones de las
caractersticas territoriales) o mapas temticos, siendo estos ltimos los que se
encuentran ligados estrechamente al uso de datos cuantitativos obtenidos de fuentes
estadsticas.

Existen diversas maneras de representar aspectos temticos. El primer paso es la
definicin de un mapa base con la localizacin propia de cada unidad espacial
considerada y luego se define el sistema de grafa temtica (Paso Viola, 2003): utilizar
esquicios diagramticos en base a datos estadsticos (cartogramas), la combinacin de
mapas con diagramas insertos (cartodiagrama), presentar distribuciones a travs del
trazado de puntos aleatorios o regulares, generar isolneas a partir de datos puntuales o
llevados a puntos con un posible avance en 3D, generar unidades espaciales de
diferentes tamaos a partir de la magnitud de sus valores (anamorfsis o cartogramas de
distorcin), o simplemente, la realizacin de mapas en los cuales se determina un color a
partir de un valor asignado a las unidades espaciales (coroplticos).

Este ltimo corresponde a la modalidad de mayor utilizacin al momento de
representar la distribucin espacial de datos censales y de los datos de salud en unidades
areales. El mapa base utilizado corresponde a unidades administrativas (pases,
provincias, departamentos, municipios) o censales (fracciones, radios) y se colorean
estas unidades con una intensidad que hace referencia a la intensidad del valor de la
variable.

La crtica a este tipo de representacin apunta a un primer problema que
consiste en la consideracin en los tamaos relativos y absolutos de las unidades
espaciales, ya que como cada valor se representa de forma homognea en su interior
cuanto mayor superficie ocupen ms alejada estar esta representacin de la realidad.
Este aspecto corresponde al denominado Problema de la Unidad Espacial Modificable
(MAUP) estudiado sistemticamente a partir del trabajo de Openshaw (1983), aspecto
de importantes implicancias analticas en la representacin de los datos de distribucin
espacial de enfermedades (Barcellos, 2003).

Una vez resuelta la consideracin y definicin de unidades espaciales, el segundo
aspecto a resolver es la cantidad de intervalos de clase utilizados para la representacin
cartogrfica y con ellos apoyar el anlisis de la distribucin espacial de los datos
censales. Aqu se produce una tensin entre el mximo de categoras y el nivel de
lectura, puesto que la mayor cantidad de categoras brindar la mejor variacin en la
distribucin espacial, sin embargo esto atenta contra la facilidad de comprensin del
mapa.

La posibilidad de eficiencia en la clasificacin se ha visto muy beneficiada con el
uso de las tecnologas de los SIG, que han estandarizado muchos procedimientos y
aumentando la rapidez de manejo de la informacin a partir de sus tablas de atributos
asociadas. Esto da lugar a que, de acuerdo a los trabajos actuales de Anselin (2003), se
considere a la representacin cartogrfica de flexibilidad digital como un mtodo
incluido dentro del ESDA.

Las aplicaciones siguientes presentan ejemplos de cartografa temtica
coropltica para una misma variable: los diagnsticos realizados de enfermedades
infecciosas, con la finalidad de poder comparar espacialmente los diferentes resultados
obtenidos a partir del mismo conjunto de datos.

Como marco estructural se presenta la figura 1. En ella se representa un grfico
de lnea con la graficacin de los valores de la variable en forma creciente y se muestra
sobre qu dimensiones actan los tres iniciales mtodos para la obtencin de los
intervalos de clase: (1) cortes naturales, (2) intervalos iguales, y (3) cuantiles.

Figura 1 - Lgica de seleccin de intervalos de clase para tres metodologas:
Cortes naturales, intervalos iguales y cuantiles
(Fuente: Buzai y Baxendale, 2006)


Mapas de cortes naturales

Este tipo de representacin se basa en la estructura formada por los datos en la
bsqueda de sus regularidades internas sobre la lnea de datos (figura 1).

Cuando el procedimiento se realiza de forma visual la cantidad de intervalos
puede resultar evidente, sin embargo, si el objetivo resulta ser realizar una serie
cartogrfica para diferentes variables en una misma rea de estudio esta metodologa
puede brindar mapas con diferentes cantidades de intervalos y el consiguiente problema
de la comparabilidad de los resultados.

Por lo tanto, si en cada serie de datos se obtienen diferentes cantidades de cortes
naturales y se desea obtener un nmero determinado para cada mapa, los sistemas
automatizados resuelven el problema de la eleccin de los n mejores cortes a partir de
aplicar algoritmos que verifiquen la homogeneidad interna de la informacin versus la
heterogeneidad entre agrupamientos. Tal el caso de la optimizacin de Jenks
incorporados en ArcView GIS.

Figura 2 Lujn: Mapa de cortes naturales de enfermedades infecciosas



Mapas de intervalos iguales

Para obtener esta clasificacin se debe dividir en n intervalos la amplitud
generada por los valores extremos de los datos de la variable. Surgen clases de similar
amplitud en base a las diferencias de los valores de cada clase a partir de realizar cortes
sobre el eje y (figura 1).

Estos mapas pueden utilizarse en una serie cartogrfica con fines comparativos
nicamente cuando las variables se encuentran tomadas en las mismas unidades de
medida y a su vez sus valores extremos son similares.

Figura 3 Lujn: Mapa de intervalos iguales de enfermedades infecciosas



Mapas de cuantiles

En este mtodo cada clase del mapa tiene la misma cantidad de unidades
espaciales a partir de realizar cortes en el eje x (figura 1).

De acuerdo con la cantidad de intervalos considerados, los mapas obtienen
nombres especficos, por ejemplo, cuartiles (4 intervalos), quintiles (5 intervalos) o
deciles (10 intervalos).

Son comparables en una serie cartogrfica al mostrar las unidades espaciales que
se agrupan en una determinada posicin, sin embargo la consistencia interna de la
informacin agrupada es baja, ya que en una misma clase pueden quedar incluidos datos
muy dispersos.

Figura 4 Lujn: Mapa de cuantiles de enfermedades infecciosas



Mapas de desvos estndar

Con la finalidad de obtener este tipo de representacin cada dato de la variable
original se transforma en un puntaje z. Cada uno de estos nuevos valores representa
unidades de desvo respecto de la media, siendo 0 = x y 1 = .

En una serie cartogrfica para distintas variables son perfectamente comparables,
ya que todas se han llevado a la misma estructura.

Sistemas como ArcView GIS contemplan el mapeo por desvos estndar en una
perspectiva rgida a partir de intervalos de clase de 1, o de desvo considerando la
media como lmite de clases; por lo tanto si, se desea obtener mayor flexibilidad en
este tipo de representaciones, se deber trabajar con la tabla de atributos asociada,
generando las nuevas columnas de informacin a travs del clculo de z [ 1 ] y su
mapeo con los intervalos seleccionados.

[ 1 ]

x x
z
i

=

donde z es el puntaje estndar, x
i
el dato de la variable en una determinada unidad
espacial, x y son el promedio y el desvo estndar de la variable.

Figura 5. Lgica de seleccin de intervalos de clase para puntajes estndar
(Fuente: Buzai y Baxendale, 2006)



Figura 6 Lujn: Mapa de desvos estndar de enfermedades infecciosas




Mapa de caja (box-map)

Es un caso especial de mapa de cuartil en el cual de acuerdo a las caractersticas
del grfico de caja- se resaltan los valores extremos. De esta manera a las cuatro
categoras estndares representadas por el 25% de las unidades espaciales se les agregan
dos clases ms como intervalos 1 y 6, deriva as el box-map a partir del grfico box-
plot como una representacin muy til del anlisis exploratorio de datos espaciales en
la bsqueda de datos anmalos.

La leyenda queda representada por la siguiente informacin:

1 intervalo: valor extremo bajo (azul oscuro)
2 intervalo: < 25 %
3 intervalo: 25 % - 50 %
4 intervalo: 50 % - 75 %
5 intervalo: > 75 %
6 intervalo: valor extremo alto (rojo oscuro)

El 1 y 2 intervalo contienen el 25% de las unidades espaciales con valores muy
bajos, el 3 el 25% con valores bajos, el 4 el 25% con valores altos y finalmente el 5
y 6 el 25% con valores muy altos. El punto medio de la distribucin est representado
por la mediana y un valor se considera extremos o anmalo (outlier) cuando supera en
1.5 o 3.0 el rango intercuartil formado por la diferencia entre los valores que ocupan el
puesto 25% y 75% respectivamente.

Figura 7 Lujn: Mapa de box-plot (box-map) de enfermedades infecciosas




Mapa de percentiles

Al igual que el anterior, tambin es un caso especial de mapa de cuartil en el
cual se desean resaltar los valores extremos. Las seis clases en las que se representa la
informacin contienen separadamente estos porcentajes de unidades espaciales: 1%,
9%, 40%, 40%, 9% y 1%, motivo por el cual los intervalos de clase quedan
representados de este modo en las referencias del mapa:

1 intervalo : < 1 % (valor extremo bajo azul oscuro)
2 intervalo: 1 % - 10 %
3 intervalo: 10 % - 50 %
4 intervalo: 50 % - 90 %
5 intervalo: 90 % - 99 %
6 intervalo: > 99 % (valor extremo alto rojo oscuro)

La categora 6 deja el 99% de las unidades espaciales debajo, la 5 el 90%, la 4
el 50%, la 3 el 10% y la 2 el 1%. No necesariamente deben existir valores extremos
o anmalos (outliers) para quedar representados, simplemente tendrn un tratamiento
destacado las unidades espaciales con mayor y menor valor.

Figura 8 Lujn: Mapa de percentiles de enfermedades infecciosas



Representacin selectiva

Al considerar el anlisis de la distribucin de los datos de salud a travs de las
enfermedades diagnosticadas en las reas administrativas o censales se deben buscar las
mejores combinaciones grficas para lograr una adecuada diferenciacin visual. Una
representacin selectiva es aquella en la que predominan las tendencias a percibir
diferencias, y aqu sern resaltadas las diferencias entre clases.

En los ejemplos cartogrficos presentados queda claramente establecido que la
organizacin de las clases obtenidas a partir de los diferentes mtodos de
representacin se produce en una situacin de orden, es decir, que en todo momento
no slo se muestran diferencias, sino que tambin queda establecido cual presenta
valores mayores y menores.

Los diferentes colores producen una gran capacidad de diferenciacin, pero esto
es de utilidad estricta nicamente para variables de tipo cualitativas. Cuando la
intencin es hacer resaltar la posicin de orden entre diferentes unidades espaciales el
color presenta aptitud considerndose los siguientes aspectos: (1) que se realicen
graduaciones sobre un mismo color cuando se busca un orden a travs de la intensidad,
y (2) que sea utilizada una teora subyacente, como la relativa a la ubicacin de colores
fros y clidos. El primer aspecto puede verse en las figuras 2, 3 y 4, y el segundo en las
figuras 6, 7 y 8.

Exploracin interactiva de grficos estadsticos

Anlisis bivariado scatter plot 2d

El ESDA bivariado se encuentra ampliamente relacionado con las propiedades
del grfico de dispersin en dos dimensiones (scatter diagram). Su aplicacin brinda como
resultado una configuracin en la cual cada variable queda representada por un eje
ortogonal (90) y cada unidad espacial como un punto de localizacin x-y en el espacio
de relaciones a partir de sus valores de coordenadas en cada eje.

Cuando los datos de cada variable se transforman a puntajes estndar cada uno
de estos ejes toma el sector central del grfico con y x, igual a cero [1] (figura 9) y
quedan claramente definidos cuatro cuadrantes bsicos en el espacio de relaciones. El
cuadrante inferior izquierdo concentra unidades espaciales con bajos valores en ambas
variables, el cuadrante superior izquierdo con bajos valores en x y altos en y, el
cuadrante superior derecho con valores altos en ambas variables, y el cuadrante inferior
derecho con valores altos en x y bajos en y.

Figura 9. Espacio de relaciones bivariadas entre variables estandarizadas
(Fuente: Buzai y Baxendale, 2006)



Cuando se intenta avanzar hacia el anlisis del sentido de la relacin entre los
resultados producidos en ambas variables se calcula la recta de regresin con base en la
nube de puntos formada por las posiciones de cada unidad espacial en el sistema de
coordenadas. Si el sentido de la recta es desde el espacio - - al espacio ++ la relacin se
produce de manera positiva y si va desde el espacio -+ al espacio +- la relacin es
negativa, no existiendo correlacin cuando la nube de puntos es redondeada y se hace
imposible determinar un sentido.

La frmula de la funcin lineal es:

[ 2 ] bx a y + =

donde a es la ordenada al origen, es decir el punto exacto por donde la recta corta el
eje y cuando x=0 y b representa la pendiente de la recta. Este clculo y su grfica se
utiliza asimismo en el anlisis de regresin, cuando se intentan predecir valores en la
variables dependiente (y) a partir de valores conocidos en la variable independiente (x).

Figura 10 Grfico de dispersin con la relacin bivariada
Relacin de Poblacin con NBI con enfermedades infecciosas




La figura 10 presenta la relacin establecida entre la poblacin con Necesidades
Bsicas Insatisfechas (NBI) y el diagnstico de enfermedades infecciosas. Como se
puede analizar, la relacin es positiva, por lo que aquellas unidades espaciales que
presentan las peores condiciones se encuentran en el cuadrante superior derecho con
los mayores valores para ambas variables.

Las vinculaciones existentes como procedimiento del ESDA permite verificar
espacialmente la configuracin que estas unidades espaciales generan en la ciudad
(figura 11).

Figura 11 Lujn: Mapa con la distribucin espacial de la seleccin del cuadrante ++




Tambin es de destacar que si todos los puntos se ubican sobre la recta, existira
una correlacin perfecta que arroja un valor del coeficiente de correlacin de Pearson
r=1 o r=-1 para la relacin perfecta positiva y negativa respectivamente.

De forma simplificada, para datos estandarizados, el clculo del coeficiente r de
correlacin de Pearson se realiza con:

[ 3 ]
n
z z
y x
=
*
r

donde y es el puntaje estndar de las variables x e y respectivamente, n es la
cantidad de unidades espaciales. El resultado es un valor cuantitativo preciso que
sintetiza la relacin visual verificada en el diagrama de dispersin.
x
z
y
z

Anlisis trivariado scatter plot 3d

Corresponde a la incorporacin de una variable adicional (tercera dimensin) a
la configuracin anterior, de esta manera el grfico de dispersin y el espacio de
relaciones quedara definido por un cubo que genera 8 posibilidades bsicas de
correspondencia espacial y de seleccin interactiva (figura 12).

Si los valores se encuentran estandarizados, los ejes de coordenadas pueden ser
ubicados uniendo los centros de cada plano, dejando claramente definidos 8 cuadrantes
en forma de cubos menores: (Tres variables para ocho combinaciones en x-y-z: bajo-
bajo-bajo, bajo-bajo-alto, bajo-alto-bajo, bajo-alto-alto, alto-alto-bajo, alto-bajo-alto,
alto-bajo-bajo, alto-alto-alto.

Figura 12. Espacio de relaciones trivariadas (3D) entre variables estandarizadas
(Fuente: Buzai y Baxendale, 2006)



A continuacin se presentan los resultados para tres diagnsticos en cada eje de
coordenadas: enfermedades infecciosas (x), respiratorias (y), y digestivas (z).
Efectivamente las peores condiciones estaran distribuidas espacialmente en aquellas
unidades espaciales cuyos valores de coordenadas presentan puntos en los mximos
valores de cada eje. Es la seleccin realizada a partir del cubo rojo (figura 12) con su
correspondiente representacin cartogrfica en unidades espaciales en verde (figura
13).

Figura 12 Seleccin en el grfico 3D para tres variables de enfermedad
Infecciosas (x) - respiratorias (y) digestivas (z)




Figura 13 Lujn: Configuracin espacial de la seleccin
Enfermedades: Infecciosas (x) - Respiratorias (y) - Digestivas (z)



El anlisis de las relaciones entre tres variables puede realizarse a partir del
clculo del coeficiente r entre pares, conformando una matriz de correlaciones de 3x3 y el
anlisis de regresin ampla la aplicacin a la obtencin de una regresin mltiple,
procedimiento a partir del cual se intenta lograr la prediccin de los valores de una
variable dependiente (y) a partir de dos o ms independientes (x
1
, x
2
, x
3
,..., x
n
).

Finalmente, podemos decir que ambos procedimientos presentan una lgica
subyacente en la configuracin espacial, la cual muestra una disminucin del bienestar
en salud en anillos concntricos que van desde el centro a la periferia de la ciudad.

Estadstica local

Anlisis zonal

Se realiza al tomar conjuntos de unidades espaciales por sectores del rea de
estudio y realizar en ellos diferentes clculos del ESDA con la finalidad de analizar el
comportamiento espacial de las variables analizadas o de las relaciones entre variables
seleccionadas.

De manera estndar se establecen 9 zonas de anlisis (figura 13) que
corresponde a tres franjas de puntos cardinales: (1) Noroeste, Norte y Noreste, (2)
Oeste, Centro y Este, (3) Sudoeste, Sur y Sudeste, aunque podran definirse otras
sectorizaciones.

Figura 14 Muestra de las nueve zonas urbanas



Una vez definidas las zonas urbanas, puede realizarse un ESDA por sectores. En
la figura 14 se muestra la representacin grfica del box-plot correspondiente a las
enfermedades infecciosas para cada uno de las nueve zonas del rea de estudio.

Figura 15 Clculo del box-plot por zonas urbanas




Autocorrelacin espacial

Si bien la primera ley de la geografa (ley de Tobler) afirma que todo est
relacionado con todo, pero las cosas ms cercanas se encuentran ms relacionadas entre
si que con las ms lejanas, en la actualidad esta situacin debera medirse para cada caso
particular, ya que los aspectos humanos se apartan de esta ley con mayor facilidad que
los aspectos fsicos.

La fragmentacin sociocultural de la postmodernidad puede verse
territorialmente en los modelos urbanos basados en la fragmentacin (Buzai, 2003), en
donde se presentan, tanto para los espacios centrales como perifricos, clulas que
propician bruscos cambios territoriales cercanos.

El concepto de autocorrelacin espacial permite medir estos aspectos de la realidad
territorial. No se refiere a medir el grado de correlacin entre dos o ms variables en
un mismo espacio, sino la correlacin de una nica variable a travs de diferentes
unidades espaciales, es decir, su comportamiento horizontal.

Cuando centramos el anlisis en una determinada unidad espacial y sus unidades
espaciales vecinas tienen similares comportamientos, se afirma que existe una
autocorrelacin espacial positiva, a travs de mediciones opuestas habra una
autocorrelacin espacial negativa y una ausencia de autocorrelacin indicara una
distribucin generada aleatoriamente.

Por lo tanto, todo procedimiento de medicin de la autocorrelacin espacial
estara intentando verificar que la distribucin espacial obtenida a partir de los valores
de una variable no sean producidas de manera aleatoria.

El principal ndice que se ha utilizado para medir esta caracterstica espacial es el
I de Moran, actualmente incorporado satisfactoriamente en los Sistemas de Informacin
Geogrfica (Anselin, 2003). Su propsito es comparar los valores de cada localizacin
con los valores presentados por las localizaciones contiguas:

[ 4 ]


=
i
i
i j
ij
j
j ij
i
x x w
x x w x x n
I
2
) ( ) (
) ( ) (


Donde es el nmero de unidades espaciales, es el valor de la variable en la
unidad espacial i , es el valor de la variable en la otra localizacin,
n
i
x
j
x x es la media de
la variable, y es una ponderacin que indica la relacin de contigidad entre las
unidades espaciales
ij
w
j i . Si j i comparten lmites 1 =
ij
w , si no . 0 =
ij
w

El ndice I de Moran tiene la propiedad de un valor de correlacin que vara
entre 1 y 1, representando las mximas correlaciones negativas y positivas
respectivamente.

Los resultados obtenidos a nivel urbano para los grupos de enfermedades
(Clasificacin Internacional de Enfermedades, ICD9-10):

Resultados numricos de: I. Enfermedades infecciosas-parasitarias (0.2873), II.
Enfermedades de la sangre (0.2756), III. Trastornos mentales (0.5318), IV.
Enfermedades neurolgicas (0.2946), V. Enfermedades del ojo (0.3924), VI.
Enfermedades del odo (0.2769), VII. Enfermedades circulatorias (0.2232), VIII.
Enfermedades respiratorias (0.3148), IX. Enfermedades digestivas (0.3633), X.
Enfermedades de la piel-subcutnea (0.2717) y XI. Enfermedades osteomusculares
(0.4555)

Los grficos de dispersin, correspondientes al valor mximo sealado se
presenta en valores estandarizados en los ejes x e . y

Figura 16 Graficacin del ndice I de Moran Variable y W_Variable



La vinculacin digital entre los grficos y la base cartogrfica representa las
mismas capacidades tcnicas ya analizadas y en este caso cada punto se ubica en un
espacio de relaciones formado por la variable analizada (eje x) en cada unidad espacial
como centro y la variable analizada en su valor resumen de las unidades espaciales
vecinas (eje y). Figura 17.

Figura 17 Relacin entre la grfica y el mapa



Verificar la existencia de autocorrelacin espacial significativa tiene que ver con la
generacin de un test de hiptesis con las siguientes caractersticas: H
0
(hiptesis nula)
establece que la configuracin espacial de los datos se produce de forma aleatoria, y H
1

(hiptesis alternativa) establece que la configuracin espacial no se produce al azar y
que existe autocorelacin espacial. Para ello se ha aplicado un proceso de randomization
(generacin de valores aleatorios o aleatorizacin) con 999 permutaciones de los datos
espaciales.

Figura 18 Test de aleatoriedad en la autocorrelacin



La verificacin de la existencia de una autocorrelacin espacial significativa tiene
que ver con la generacin de un test de hiptesis con las siguientes caractersticas: H
0

(hiptesis nula) establece que la configuracin espacial de los datos se produce de forma
aleatoria, y H
1
(hiptesis alternativa) establece que la configuracin no se produce al
azar y que existe autocorrelacin. Para ello se aplica un proceso de aleatorizacin
(randomization) con 999 permultaciones de la informacin espacial.

A continuacin puede verse el histograma resultante formado por los resultados
generados al azar (en bord) y la ubicacin del valor medido en la configuracin real
(en amarillo) a partir del ndice I de Moran, obtenindose un valor crtico p = 0.001
muy apartado de los valores p utilizados normalmente en los test de hiptesis (0.01
0.05). Se concluye la existencia de una importante autocorrelacin espacial ya que su
valor p indica que esta autocorrelacin se puede producir aleatoriamente solamente en
el 0.1% de los casos.

Medicin local

El anlisis de autocorrelacin espacial local es una profundizacin del
procedimiento y para ello se utiliza el clculo de los Indicadores Locales de
Autocorrelacin Espacial (LISA) (Anselin, 1995) como mtodo que permitir llegar a
una descomposicin del ndice I de Moran y verificar cuanto se distribuye cada unidad
espacial en la formacin del ndice global.

Son dos las principales caractersticas de LISA: (a) obtiene un valor de
Significatividad para cada cluster formado por los similares valores entre cada unidad
espacial y sus vecinos, y (b) que el valor de LISA entre todas las unidades espaciales
genera valores proporcionales al indicador global.

LISA (L) en la localizacin i para la variable es una funcin de los valores
observados en sus unidades espaciales limtrofes .
i
x
i
J

[ 5 ] ) , (
i
J i i
x x f L =

Los lmites para cada observacin estn tomados de la matriz de contigidad
espacial.
i
J w

Por otro lado, los clusters espaciales locales, tambin denominados hot spots, se
identifican ante la Significatividad estadstica obtenido por el valor de LISA mediante el
test bsico de H
0
como la existencia de una distribucin aleatoria mecionada para el
clculo de Significatividad mediante permutaciones.

El ndice I de Moran local para cada observacin ( ) queda definido como:
i
I

[ 6 ]

=
J
j ij i i
x x w x x I ) ( ) (

donde la sumatoria sobre j est realizada solamente sobre los valores vecinos, y los
pesos de se encuentran en valores estandarizados. w

Puede verse, entonces, que la correspondencia estadstica global aparece
agregando la informacin local:

[ 7 ]

=
i j
j ij i i
x x w x x I ) ( ) (

amplindose con el denominador de la frmula del I de Moran global presentada en [ 4
].

La cartografa temtica que se presenta a continuacin para las enfermedades
infecciosas surge a partir del clculo de LISA univariado. Se presentan los clusters
espaciales y sus correspondientes valores de Significatividad. Figuras 19 y 20.

En la Figura 19 el rojo presenta las unidades espaciales con relaciones
significativas de altos valores en las relaciones de contigidad (High-High), el color azul
oscuro la relacin inversa (Low-Low) y finalmente el celeste una relacin significativa de
bajo valor central y alto valor contiguo (Low-High).

Figura 19 Lujn: Clculo de LISA Mapa de hot-spots



Las relaciones de Significatividad se presentan en graduaciones de verde, ms
significativas cuanto ms oscuridad presentan las tonalidades en la unidad espacial. Se
encuentran valores p = 0.05 (valor ms claro) y p = 0.01 (segundo inferior), no
encontrndose las significatividades a niveles de 0.001 y 0.0001.

Figura 20 Lujn: Clculo de LISA Mapa de Significatividad



La configuracin espacial del clculo de LISA apoya el mapa social del rea de
estudio, donde las relaciones negativas se producen en el centro de la ciudad y las
positivas en la periferia, siendo que las primeras son bsicamente de mayor
Significatividad en sus relaciones.

Un avance hacia mediciones bivariadas en las cuales sea medida la
autocorrelacin espacial de las enfermedades infecciosas y su relacin con la poblacin
con NBI brinda los siguientes resultados cartogrficos.

Figura 22 Lujn: Clculo de LISA bivariado Mapa de hot-spots




Figura 23 Lujn: Clculo de LISA bivariado Mapa de Significatividad



Los resultados apoyan la configuracin del mapa social. En la zona cntrica se
producen relaciones significativas en bajos valores de ambas variables y en la periferia
relaciones inversas, principalmente en el sector este de la ciudad.

Consideraciones finales

El ESDA constituye un apartado de importancia dentro de los mtodos y
tcnicas que Gatrell (2002) incluye para la investigacin en Geografa de la Salud y su
difusin sigue los caminos que han tenido histricamente otros desarrollos del anlisis
espacial cuantitativo.

Mientras en los pases centrales el ESDA ha comenzado a brindar resultados en
innumerables casos de aplicacin, en nuestro pas, el anlisis realizado por Pickenhayn y
Curto (2005) deja en evidencia que an no existen estudios sistemticos en esta lnea de
avance. En una situacin intermedia, el tema no pasa inadvertido y avanza con
aplicaciones especficas realizadas en Brasil, Cuba y Mxico (Iiguez Rojas y Barcellos,
2003; Iiguez Rojas, 2005).

Sin embargo el impacto mayor, y por lo cual se vislumbra su rpido desarrollo,
apunta a la teora de la Geografa de la Salud ya que diversos autores (Gatrell, 2002;
Pickenhayn, 2003) consideran claramente al anlisis espacial cuantitativo como una
lnea de avance terico-metodolgico con alto impacto interdisciplinario. Su abordaje
es netamente espacial y lleva al profundo conocimiento espacial de los aspectos de
localizacin, distribucin, asociacin, difusin y evolucin espacial de las
enfermedades.

Dentro de la Geografa de la Salud las posibilidades que brinda el ESDA se
transforman en un instrumento de gran potencialidad al permitir verificar la estructura
espacial de las enfermedades (distribucin mediante cartografa temtica), la relacin
de stas con diversas caractersticas socio-demogrficas y econmicas de la poblacin
(asociacin a travs de grficos interactivos bivariados y trivariados), sus caractersticas
de contagio horizontal (autocorrelacin espacial) y su verificacin por sectores del rea
de estudio (anlisis estadstico local).

Sin dudas representa un importante avance en la comprensin espacial de
diversas relaciones sobre las tradicionales inspecciones visuales cartogrficas que tan
tiles han sido al anlisis espacial de la salud desde hace mas de un siglo (Koch, 2005).

El ESDA, por su simplicidad y por haber sido sistematizado como componente
de los SDSS, toma una clara posicin de instrumento bsico en anlisis realizados desde
la Geografa de la Salud. Se encuentra al alcance de profesionales de diferentes ciencias
y favorece el abordaje interdisciplinario que intenta conocer en mayor profundidad la
estructura espacial de los procesos salud-enfermedad.

Siglas utilizadas

EDA Exploratory Data Analysis, ESDA Exploratory Spatial Data Analysis, GIS
Geographic Information Systems, GVis Geographic Visualization, ICD
International Classification Disease, LISA Local Indicators of Spatial Association,
MAUP Modifiable Area Unit Problem, ScVis Scientific Visualization, SDSS
Spatial Decision Support System.

Software

ArcView GIS Environmental Systems Research Institute
GeoDa University of Illinois
Excel Microsoft Corporation



Bibliografa

Adrienko, G.L.; Adrienko, N.A. 1999. Interactive maps for visual data exploration.
International Journal of Geographical Information Sciences. 13(4):355-374.

Agresti, A.; Finlay, B. 1997. Statistical Methods for the Social Sciences. Prentice Hall. New
Jersey.

Anselin, L. 1995. Local Indicators of Spatial Association LISA. Geographical Analysis.
27(2):93-115.

Anselin, L. 1999. Interactive techniques and exploratory spatial data analysis. In:
Longley, P.A.; Goodchild, M.F.; Maguire, D.J.; Rhind, D.W. (eds.) Geographic
Information Systems: Principles, Techniques, Management and Applications. John Wiley &
Sons. New York. pp. 253-266.

Anselin, L. 2003. An Introduction to EDA with GeoDa. Spatial Analysis Laboratory.
University of Illinois. Urbana-Champaign.

Anselin, L.; Dodson, R.F.; Hudak, S. 1993. Linking GIS and Spatial Data Analysis in
Practice. Geographical Systems. 1:3-23.

Barcellos, Ch. 2003. Unidades y escalas en los anlisis espaciales en salud. Revista
Cubana de Salud Pblica. 29(4):307-313.

Berry, J.K. 1996. The Unique Character of Spatial Analysis. GIS World. April:29.

Bosque Sendra, J. 1994. Anlisis exploratorio de datos. En: J.Bosque Sendra y
A.Moreno Jimnez. Anlisis exploratorio y multivariante de datos. Oikos-tau. Barcelona.

Bosque Sendra, J. 2001. Planificacin y gestin del territorio. De los SIG a los Sistemas
de Ayuda a la Decisin Espacial (SADE). El Campo de las Ciencias y las Artes.138:137-
174.

Bosque Sendra, J.; Moreno Jimnez, A. 1994. Anlisis exploratorio y multivariante de
datos. Oikos-tau. Barcelona.

Bosque Sendra, J.; Zamora Ludovic, H. 2002. Visualizacin geogrfica y nuevas
cartografas. GeoFocus. 2:61-77.

Boyer, G. 2003. Medical Center Uses GIS in Many Ways. Healty GIS. Spring. 1 y 11.

Buzai, G.D. 2003. Mapas Sociales Urbanos. Lugar Editorial. Buenos Aires.

Buzai, G.D.; Baxendale, C.A. 2006. Anlisis Socioespacial con Sistemas de Informacin
Geogrfica. Lugar Editorial. Buenos Aires.

Cossman, R.; Blanchard, T.; James, W.; Jackson-Beli, R.; Cosby, A. 2003. Healty and
Unhealty Places in America. Healty GIS. Spring. 10-11.

Cromley, E.K.; Mclafferty, S.L. 2002. GIS and Public Health. The Guilford Press. New
York.

Cruz, M.R. 2004. Anlisis multivariado de la estructura espacial de la salud en el medio
urbano. Diagnstico socio-espacial y morbilidad asistida en la ciudad de Lujn. Tesis
Licenciatura. Universidad Nacional de Lujn. Lujn.

Curto, S.I. 2003. Mapas en Geografa Mdica. Cuaderno Prudentino de Geografa. 25:111-
129.

Dangermond, J. 2004. Speaking the Language of Geography GIS. ArcNews. 26(3):1-
7.

Densham, P.J. 1991. Spatial Decision Support Systems. In: Maguire, D.J.; Goodchild,
M.F.; Rhind, D.W. (eds.) Geographical Information Systems. Principles and Applications.
Longman. Harlow. pp. 403-412.

Fitz, P. 2000. Cartografa Bsica. Centro Universitario La Salle. Porto Alegre.

Fotheringham, A.S.; Brunsdon, Ch. 1999. Local Forms of Spatial Analysis. Geographical
Analysis. 31(4):340-358.

Fotheringham, A.S.; Brunsdon, Ch.; Charlton, M. 2000. Quantitative Geography.
SAGE. London.

Gatrell, A. 1997. Structures of Geographical and Social Space and their consequences
for human health. Geographiska Annaler. 79B:141-154.

Gatrell, A. 2002. Geographies of Health. Blackwell. Malden.

Goodchild, M.F. 2004. Social Sciences: Interest in GIS Grows. ArcNews. 26(1):1-4.

Haining, R.; Wise, S.; Ma, J. 1998. Exploratory spatial data analysis in a geographic
information system environment. The Statistician. 47(3):457-469.

Hair, J.F.; Anderson, R.E.; Tatham, R.L.; Black, W.C. 1999. Anlisis multivariante.
Prentice Hall Iberia. Madrid.

Howe, G.M. 1985. La Geografa Mdica. En: E.H. Brown (comp.) Geografa. Pasado y
futuro. Fondo de Cultura Econmica. Mxico. pp. 392-405.

Iiguez, L. 2005. Los Sistemas de Informacin Geogrica en Salud en Amrica Latina.
Reflexiones sobre su propagacin. X Conferencia Iberoamericana de Sistemas de Informacin
Geogrfica. CD ROM. San Juan de Puerto Rico.

Iiguez, L.; Barcellos, Ch. 2003. Geografa y Salud en Amrica Latina: evolucin y
tendencias. Revista Cubana de Salud Pblica. 29(4):330-343.

Iiguez, L.; Seguinot Barbosa, J.; Snchez, M.; Batista, J.L.; Gil De La Madrid, K.
2005. Diferenciacin geogrfica de problemas de salud en el Caribe Latino Insular. El
ejemplo de Puerto Rico y Cuba. En: J.Seguinot Barbosa (ed.) GEO Caribe. San Juan. pp.
185-214

Koch, T. 2005. Cartographies of Disease. ESRI Press. Redlands.

Lang, L. 2000. GIS for Health Organizations. ESRI Press. Redlands.

Olivera, A. 1993. Geografa de la Salud. Sntesis. Madrid.

Openshaw, S. 1983. The Modifiable Area Unit Problem. Concepts and Techniques in
Modern Geography. Environmental Publications. Norwich.

OPS. 2004. Paquetes de Programas de Mapeo y Anlisis Espacial en Epidemiologa y
Salud Pblica. Boletn Epidemiolgico. 5(4):1-17.

Paso Viola, F. 2003. Diccionario de Trminos Geografa. Geosistemas. Buenos Aires.

Petch, J. 1994. Epistemological aspects of visualization. En: H.M. Hearnshaw & D.J.
Unwin (eds.) Visualization in Geographic Information Systems. Wiley. Chichester. pp. 212-
219.

Pickenhayn, J.A. 1996. La geografa mdica y el lmite operativo de las ciudades
intermedias. Seminario Internacional Ciudades Intermedias de Amrica. IPGH. Universidad
de La Serena.

Pickenhayn, J.A. 2003. La Geografa. Fronteras tericas en la evolucin hacia las
transdisciplinas. En: V.Berdoulay y H.Mendoza Vargas (eds.) Unidad y diversidad del
pensamiento geogrfico en el mundo. Retos y perspectivas. UNAM-INEGI. Mxico. pp. 73-
83.

Pickenhayn, J.A.; Curto, S.I. 2005. La Geografa de la Salud en Argentina. Revista
Geogrfica. IPGH. Mxico.

Ramrez, M.L. 2005. La moderna Geografa de la Salud y las tecnologas de la
informacin geogrfica. Investigaciones y ensayos geogrficos. IV(4):53-64.

Unwin, A.; Unwin, D. 1998. Exploratory spatial data analysis with local statistics. The
Statistician. 47(3):415-421.

Wilhelm, A.; Steck, R. 1998. Exploring spatial data by using interactive graphics and
local statistics. The Statistician. 47(3):423-430.

S-ar putea să vă placă și