La interpolación espacial es una operación interpolación espacial requiere dominante en SIG. Aunque es a menudo conjetura inteligente, y el principio que usada explícitamente en el análisis, es subyace toda interpolación espacial es la también usada implícitamente, en varias Ley de Tobler – “todos los lugares están operaciones tales como la preparación de la relacionados pero los lugares cercanos exposición de un mapa de contorno, donde están mas relacionados que los lugares la interpolación espacial es invocada sin que distantes” (Sección 5.2). el usuario este directamente involucrado. La En otras palabras, el mejor intento interpolación espacial es un proceso de como para el valor de un campo en algún conjetura inteligente, en el cual el punto es el valor medido en los puntos investigador (y el SIG) intentan hacer un de observación mas cercanos – la lluvia estimado razonable del valor de un campo aquí es mas probable que sea mas en lugares donde el campo no ha sido en similar a la lluvia registrada en las realidad medido. La interpolación espacial estaciones metereológicas mas cercanas es una operación que tiene sentido solo que la lluvia registrada en estaciones para la perspectiva de campo. Los principios metereológicas mas distantes. Un de la interpolación espacial son discutidos corolario de este mismo principio es que en la Sección 5.5; aquí el énfasis es en las en ausencia de mejor información, es aplicaciones prácticas de la técnica, y las razonable asumir que cualquier campo implementaciones comúnmente usadas de exhibe una variación relativamente los principios. suave – los campos tienden a variar lentamente, y para exhibir una La interpolación espacial encuentra autocorrelación espacial positiva, una aplicaciones en muchas áreas: propiedad de datos geográficos • En la estimación de lluvia, discutida en la Sección 5.3. temperatura, y otros atributos en lugares que no son estaciones La interpolación espacial es la metereológicas, y donde las versión de SIG de conjetura mediciones directas de estas inteligente variables no están disponibles. • En la estimación de la elevación de En esta sección dos métodos una superficie entre las ubicaciones comúnmente usados de la interpolación medidas de un DEM. espacial son discutidos: ponderación de • En el remuestreo de rasters, la distancia inversa (IDW), el cual es el operación que debe ser llevada a método mas simple; y Kriging, un cabo cuando los datos de raster método estadístico popular que está deben ser transformados a otra grilla basado en la teoría de las variables (Figura 7.9). regionalizadas y cae en el campo de la • Haciendo contornos, cuando es geoestadística. necesario adivinar donde colocar los contornos entre las ubicaciones medidas. una ponderación di, la cual será evaluada en base a la distancia desde xi hasta x. La figura 13.21 explica esta anotación con un diagrama. Entonces el promedio ponderado calculado en x es:
Figura 13.20 El caso de revestimiento de raster,
resultando en un nuevo conjunto de datos que aplica un conjunto de reglas a los conjuntos de datos entrantes, y es irreversible. Los dos conjuntos de datos entrantes son mapas de (A) tiempo de viaje desde el área urbana (ver Figura 13.16) y (B) país (el rojo indica País XX, el blanco indica País Y). El mapa de Figura 13.21 Anotación usada en las ecuaciones salida identifica el tiempo de viaje a las áreas en el definiendo la interpolación espacial. País Y, y podría ser usado para calcular el promedio del tiempo de viaje a los puntos en ese país en un paso En otras palabras, el valor interpolado es subsecuente. Esta operación no es reversible. un promedio sobre los valores observados, ponderado por las w. 13.4.4.1 Ponderación de distancia inversa Hay varias formas de definir los (IDW) pesos, pero la opción mas frecuentemente empleada es el de IDW es el caballito de batalla de la calcularlos como los cuadrados inversos interpolación espacial, el método que es de las distancias, en otras palabras mas frecuentemente usado por los (compare las opciones discutidas en la analistas de SIG. Emplea la Ley de Tobler Sección 5.5 en conexión con la al estimar mediciones desconocidas naturaleza de los datos geográficos): como promedios ponderados sobre mediciones conocidas en puntos Wi = 1 / d2i cercanos, dando las ponderaciones mas grandes a los puntos mas cercanos. Esto significa que la ponderación dada a Mas específicamente, denotar el punto un punto bajo por un factor de 4 de interés como x, y los puntos donde las cuando la distancia al punto se duplica mediciones fueron tomadas como xi, (o por un factor de 9 cuando la donde i va de 1 a n, si hay n puntos de distancia se triplica). En adición, la datos. Denotar el valor desconocido mayoría de los software dan al usuario como z(x) y las mediciones conocidas la opción de ignorar por completo los como zi. Dar a cada uno de estos puntos puntos que están mas lejos que alguna distancia especificada, o de limitar el promedio a un numero especifico de puntos mas cercanos, o de promediar sobre los puntos mas cercanos en cada uno de los varios sectores de dirección (Figura 13.22). Pero si estos valores no son especificados el software les asignará valores predeterminados. Figura 13.22 Selección de puntos para la interpolación IDW usando sectores. En este caso IDW provee una forma simple de cuatro sectores son definidos, y solo los puntos mas adivinar los valores de un campo en cercanos en cada sector son usados (cruces verdes) ubicaciones donde ninguna medición está disponible. Pero porque IDW es un promedio este sufre de ciertas características IDW logra el objetivo deseado de crear especificas que son generalmente no una superficie suave que su valor en deseadas. Un promedio ponderado que cualquier punto es mas como los usa pesos que nunca son negativos valores en puntos cercanos que los tiene que siempre retornar un valor valores en puntos distantes. Si es usado que está entre los límites de los valores para determinar z en una ubicación medidos – ningún punto en la superficie donde z ya ha sido medido retornará el interpolada puede tener un z valor medido, porque la ponderación interpolado que es mas que la z medida asignada a un punto a distancia cero es mas grande, o menos que la z medida infinita, y por esta razón IDW es mas pequeña. Imagine una superficie descrita como un método exacto de de elevación con algunos picos y hoyos, interpolación porque sus resultados pero suponga que los picos y hoyos no interpolados honran los puntos de han sido en realidad medidos, pero son datos exactamente (un método meramente indicados por los valores de aproximado es permitido para desviar los puntos medidos. La Figura 13.23 de los valores medidos con el interés de muestra una sección transversal de tal una mayor suavidad, una propiedad superficie. En vez de interpolar los que es a menudo útil si las desviaciones picos y hoyos como uno esperaría, IDW son interpretadas como indicar los produce el tipo de resultado mostrado posibles errores de medición, o las en la figura – pequeños hoyos donde desviaciones locales que van a ser debería haber picos, y pequeños picos separadas de la tendencia general de la donde debería haber hoyos. Este superficie). comportamiento es a menudo obvio en SIG de salida que ha sido generado usando IDW. Un problema relacionado concierne a la extrapolación: si una tendencia es indicada por los datos, como se muestra en la Figura 13.23, IDW va a indicar inadecuadamente una regresión a la media afuera del área de los puntos de datos. estimación de las partes faltantes de la La interpolación IDW podría superficie. La suavidad es la propiedad producir resultados no intuitivos en mas importante, y es puesta en las áreas de picos y hoyos, y afuera operación en Kriging en una forma del área cubierta por los puntos de estadísticamente significativa. Existen datos. muchas formas de Kriging, y la visión general dada aquí es muy breve. A los lectores interesados se les anima a leer el excelente tratamiento en el texto de SIG por Burrough y McDonnell (1998), o una de las introducciones generales a la geoestadística (ej. Isaaks y Srivastava 1989).
Hay muchas formas de Kriging, pero
Figura 13.23 Características potencialmente todas son firmemente fundadas en indeseables de la interpolación IDW. Este conjunto teoría. de seis puntos de datos claramente sugiere un perfil de colina (línea discontinua). Pero en áreas donde hay poco o nada de datos el interpolador se moverá Suponga que tomamos un punto x como hacia la media total (línea llena) referencia, y comenzamos a comparar los valores del campo ahí con los En resumen, los resultados de IDW no valores en otras ubicaciones en son siempre lo que uno quisiera. Hay distancias que incrementan desde el muchos mejores métodos de punto de referencia. Si el campo es interpolación espacial que tratan los suave (si la Ley de Tobler es verdad, problemas que fueron identificados, esto es, si hay autocorrelación espacial pero la facilidad de programación de positiva) los valores cercanos no serán IDW y su simplicidad conceptual lo muy diferentes – z(x) no será muy hacen uno de los mas populares. Los diferente que z(xi). Para medir la usuarios deben simplemente tener cantidad, tomamos la diferencia y lo cuidado, y tomar precauciones para elevamos al cuadrado, ya que el signo examinar los resultados de la de la diferencia no es importante: (z(x) interpolación para asegurarse que estos – z(xi))2. Podemos hacer esto con tienen sentido. cualquier par de puntos en el área.
13.4.4.2 Kriging
De todos los métodos comunes de la
interpolación espacial es Kriging que hace la alegación mas convincente de estar fundado en buenos principios teóricos. La idea básica es de descubrir algo acerca de las propiedades generales de la superficie, como se revela por los valores medidos, y luego Figura 13.24 Un semivariograma. Cada cruz aplicar estas propiedades en la representa un par de puntos. Los círculos llenos son obtenidos al promediar dentro de los rangos o cubos del eje de distancia. La línea llena es el mejor encaje para estos cinco puntos, usando una de un número Un variograma anisotrópico pequeño de funciones matemáticas estándar. pregunta como la dependencia espacial cambia en direcciones Mientras la distancia diferentes. incrementa, muy probablemente esta medición también va a incrementar, y Note como el punto de este típico en general un incremento monótono variograma muestra un incremento (consistente) en la diferencia cuadrada constante en la diferencia cuadrada con la distancia es observada para la hasta cierto límite, y ese incremento mayoría de los campos geográficos luego pierde el ímpetu y cesa (note que z tiene que ser medido en una virtualmente. De nuevo, este patrón es escala que es al menos un intervalo, ampliamente observado para los aunque el indicador Kriging ha sido campos, e indica que la diferencia en el desarrollado para tratar con el análisis valor tiende a incrementar hasta cierto de campos nominales). En la Figura limite, pero después a no incrementar 13.24, cada punto representa un par de mas. En efecto, hay una distancia mas valores sacados del total del conjunto allá donde no hay mas sorpresas de puntos de datos en los cuales las geográficas. Esta distancia es conocida mediciones han sido tomadas. El eje como el rango, y el valor de la vertical representa una mitad de la diferencia en esta distancia es conocida diferencia cuadrada (una mitad es como umbral. tomada por razones matemáticas), y el Note también lo que pasa en el gráfico es conocido como el otro, el punto final mas bajo del rango semivariograma (o variograma para de distancia. Mientras la distancia se abreviar – la diferencia de un factor de encoge, correspondiendo a pares de dos es a menudo pasado por alto en la puntos que están cada vez mas cerca, la práctica, aunque es importante semivariancia desciende, pero hay una matemáticamente). Para expresar sus sugerencia que casi nunca desciende a contenidos en forma resumida el eje de cero, hasta a distancia cero. En otras distancia es dividido en un número de palabras, si dos puntos fueron rangos o cubetas, como se muestra, y muestreados a una distancia minima los puntos dentro de cada rango son darían valores diferentes. Esto es promediados para definir los puntos conocido como el nugget del pesados mostrados en la figura. semivariograma. Un nugget no-cero Este semivariograma ha sido ocurre cuando hay un error sustancial trazado sin consideración a las en el instrumento de medición, así que direcciones entre los puntos en un par. las mediciones tomadas de una Como tal es dicho ser un variograma distancia no muy lejana pueden ser isotrópico. A veces hay una brusca diferentes debido al error, o cuando hay variación en el comportamiento en alguna otra fuente de ruido local que diferentes direcciones, y previene a la superficie de ser semivariogramas anisotrópicos son verdaderamente suave. Una estimación creados para los diferentes rangos de exacta de un nugget depende de si hay dirección (ej. para pares en cada sector pares de puntos de datos de 90 grados; ver figura 13.22). suficientemente cercanos entre si. En la práctica los puntos de muestra pueden sugiere mayor importancia en haber sido ubicados en algún tiempo en determinar el valor estimado, mientras el pasado, fuera del control del usuario, que la dirección relativa no es o pudo haber sido esparcido para importante en un estimado IDW. El capturar la variación total en la proceso de maximizar la calidad del superficie, así que es usualmente difícil estimado es llevado a cabo hacer un buen estimado del nugget. matemáticamente, usando las medidas precisas disponibles en el El nugget puede ser interpretado semivariograma. Los lectores como la variación entre las interesados en los detalles matemáticos mediciones repetidas en el mismo deben consultar las referencias dadas punto. anteriormente.
Para hacer estimados usando Kriging Kriging responde a la proximidad de
necesitamos reducir el semivariograma los puntos de muestra y a sus a una función matemática, para que la direcciones. semivariancia pueda ser evaluada a cualquier distancia, no solo en los A diferencia de IDW, kriging tiene una puntos medios de los cubos como se fundación teórica sólida, pero también muestra en la figura 13.24. En la incluye un número de opciones (ej. la práctica esto significa seleccionar uno elección de la función matemática para de el conjunto de formas funcionales el semivariograma) que requiere estándar, y encajando esa forma a los atención del usuario. En ese sentido puntos de datos observados para definitivamente no es una caja negra obtener el mejor posible encaje. Esto se que puede ser ejecutada ciegamente y muestra en la figura. El usuario de una automáticamente, pero en cambio forja función Kriging en un SIG tendrá al usuario a estar directamente control sobre la selección de los rangos involucrado en el proceso de de distancia y formas funcionales, y si estimación. Por esa razón los es que un nugget es permitido. diseñadores del software de SIG muy probablemente van a continuar Finalmente, el semivariograma ofreciendo varios diferentes métodos, encajado es usado para estimar los dependiendo si el usuario quiere algo valores del campo en los puntos de que es rápido, a pesar de sus obvias interés. Como con IDW, el estimado es fallas, o mejor, pero mas involucrado en obtenido como una combinación la parte del usuario. ponderada de valores vecinos, pero el estimado es diseñado para ser el mejor 13.4.5 Estimación y potencial de posible, dada la evidencia del densidad semivariograma. En general los valores cercanos son dados mayor La estimación de densidad es en ponderación, pero no como en IDW la muchas formas el gemelo lógico de la dirección es también importante: un interpolación espacial – comienza con punto puede ser blindado de la puntos, y termina con una superficie. influencia si está atrás de otro punto, ya Pero conceptualmente los dos enfoques que la mayor proximidad de este último no podrían ser mas diferentes, porque uno busca estimar las partes faltantes diferentes tipos de enfermedades, o de un campo de muestras del campo animales, o cualquier otro conjunto de tomadas en puntos de datos, mientras puntos bien definidos. que el otro crea un campo de objetos discretos. La Figura 13.25 ilustra esta diferencia. Los dos conjuntos de datos en el diagrama se ven idénticos desde una perspectiva de SIG – ambos son conjuntos de puntos, con ubicaciones y un solo atributo. Pero uno muestra mediciones de muestra desde un campo, y el otro muestra las ubicaciones de objetos discretos. En la vista del objeto discreto no hay nada entre los objetos mas que espacio vacío – no hay campo faltante que tiene que ser rellenado a través de la interpolación espacial. No tendría sentido aplicar la interpolación espacial a una colección de objetos discretos – y completamente sin sentido aplicar la estimación de densidad a las muestras de un campo.
La estimación de densidad solo tiene
sentido desde una perspectiva de objeto discreto, y la interpolación espacial solo desde la perspectiva del campo. Figura 13.25 Dos conjuntos de datos idénticos con significados bruscamente diferentes. (A) un campo de temperatura atmosférica medida en ocho puntos La estimación de densidad tiene de muestra espaciados irregularmente. (B) ocho muchas raíces diferentes, pero es objetos discretos representando ciudades, con poblaciones asociadas en miles. La interpolación ampliamente resumida en diversos espacial tiene sentido solo para (A), y la estimación textos, en particular ese por Silverman de densidad solo para (B) (1986), y en discusiones de análisis espacial (ej. Bailey y Gatrell 1995). Aunque puede ser aplicado a cualquier tipo de objeto espacial discreto, es mas a menudo aplicado a la estimación de la densidad de punto, y ese es el enfoque aquí. El ejemplo mas obvio es la estimación de la densidad de población, y ese ejemplo es usado en esta Figura 13.26 (A) una colección de objetos de puntos, discusión, pero puede ser igualmente y (B) una función kernel. La forma del kernel depende del parámetro de distancia – bien aplicado a la densidad de incrementando el valor de los resultados del resulta en SIG por nuestra buena parámetro en un kernel mas bajo y mas ancho, y reduciendo sus resultados en un kernel mas estrecho voluntad de hablar sobre temas sin al y nítido. Cuando cada punto es reemplazado por un mismo tiempo especificar la resolución kernel y los kernels son adicionados al resultado es espacial. una superficie de densidad el cual su suavidad depende del valor del parámetro de distancia. La estimación de densidad con un Considere el continente de Australia. kernel permite a la resolución Una manera de definir su densidad de espacial de un campo de densidad de población es tomando la población población ser hecho explicito. entera, y dividiéndola para el área total – en base a esto la densidad de La teoría de la estimación de densidad población de 1996 era mas o menos formaliza estas ideas. Considere una 2.38 por km2. Pero nosotros sabemos colección de objetos de puntos, tales que el patrón de asentamiento no es como los mostrados en la Figura 13.26. uniforme, con la mayoría de la La superficie mostrada en la Figura población concentrada en 5 ciudades 13.26(B) es un ejemplo de una función costeras (Brisbane, Sydney, Melbourne, kernel, la idea central en la estimación Adelaide, y Perth). Así que si viéramos de densidad. Cualquier función kernel al paisaje en pedazos mas pequeños, tal tiene una medida de longitud asociada, como círculos con un radio de 10 Km., y y en el caso de las funciones mostradas, calculando la densidad de población al que es una distribución Gaussiana, la dividir el número de gente en cada medida de longitud es un parámetro de circulo por el área del circulo, la distribución: podemos generar obtendríamos resultados muy distribuciones Gaussianas con diferentes dependiendo donde el cualquier valor de este parámetro, y circulo fue centrado. Así que en estos se vuelven mas planos y mas general, la densidad de población en amplios a medida que el valor una ubicación, y en una resolución incrementa. En la estimación de espacial de d podría ser definida al densidad, cada punto es reemplazado centrar un circulo en la ubicación, y por su función kernel, y las varias dividiendo el total de la población funciones kernel son adicionadas para dentro del circulo por su área. Usando obtener una superficie agregada, o esta definición hay un número infinito campo de densidad. Si uno piensa de de posibles mapas de densidades de cada kernel como una pila de arena, población de Australia, dependiendo entonces cada pila tiene el mismo peso del valor seleccionado para d. Y cumple total de una unidad. El peso total de que no hay tal cosa como la densidad de todas las pilas de arena es igual al población, solo una densidad de número de puntos, y el peso total de población en una resolución espacial de arena dentro de un área dada, tal como d. Note la similaridad entre esta idea y el área mostrada en la figura, es un la discusión previa sobre pendiente – estimado de la población total en esa en general, muchos temas geográficos área. Matemáticamente, si la densidad pueden solo ser definidos de población es representada por un rigurosamente si la resolución espacial campo p(x,y), entonces la población es hecha explicita, y mucha confusión total dentro del área A es la integral de la función de campo sobre esa área, esto es:
Una variedad de funciones kernel son
usadas en la estimación de densidad, pero la forma mostrada en la Figura 13.26 es talvez la mas común. Esta es la tradicional curva de campana o distribución Gaussiana de la estadística, y se encuentra en cualquier otra parte en este libro en conexión con los Figura 13.27 La estimación de densidad usando dos errores en la medición de la posición en diferentes parámetros de distancia en las funciones dos dimensiones (Sección 15.1.2.1). al kernel respectivas, mostrando la generalmente mas suave y menos puntiaguda naturaleza de la ajustar el ancho de la campana es superficie que resulta del parámetro de distancia posible producir un rango de mas largo superficies de densidad de diferentes cantidades de suavidad. La figura 13.27 contrasta dos estimaciones de densidad de los mismos datos, uno usando comparativamente una campana estrecha para producir una superficie compleja, y la otra usando una campana mas ancha para producir una superficie mas suave.