Documente Academic
Documente Profesional
Documente Cultură
BITCORA TALLERES
ESTADSTICA ESPACIAL
UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
FACULTAD DE INGENIERA
ESPECIALIZACIN EN SIG
ESTADSTICA ESPACIAL
BOGOT D.C. COLOMBIA 2015
P g i n a 1 | 58
TABLA DE CONTENIDO
P g i n a 2 | 58
LISTA DE FIGURAS
Figura 1-1. Proyecciones de la capa sids ................................................................ 5
Figura 2-1. Mapas de vecindad Queen y Rook. ...................................................... 6
Figura 2-2. Mapas de vecindad k vecinos. .............................................................. 6
Figura 2-3. Mapas de vecindad datos puntuales. .................................................... 7
Figura 2-4. Mapas de vecindad bandas de distancias. ........................................... 8
Figura 2-5. Matriz de pesos estandarizada (izquierda) y binaria (derecha). ............ 8
Figura 2-6. Matriz de pesos por inverso de distancia. ............................................. 9
Figura 3-1. ndice I de moran para matriz estandarizada y binaria........................ 10
Figura 3-2. ndice I de moran Monte-Carlo. ........................................................ 11
Figura 3-3. Histograma residuales I de moran Monte-Carlo. .............................. 11
Figura 3-4. ndice C de Geary. .............................................................................. 12
Figura 3-5. Diagrama de dispersin I de Moran Local. .......................................... 13
Figura 3-6. Mapa de Cluster I de Moran Local. ..................................................... 14
Figura 1-1. Proyecciones de la capa Boston. ........................................................ 15
Figura 1-2. Mapas de vecindad K vecinos............................................................. 16
Figura 1-3. Comparacin Mapas de vecindad K vecinos. ..................................... 16
Figura 1-4. Mapas de vecindad bandas de distancia. ........................................... 17
Figura 1-5. ndices I de moran para matriz de pesos por k vecinos (arriba) y bandas
de distancias (abajo). ............................................................................................ 18
Figura 1-5. Diagramas de dispersin I de moran para matriz de pesos por k vecinos
(izquierda) y bandas de distancias (derecha). ....................................................... 18
Figura 2-1. Resumen modelo de regresin. .......................................................... 19
Figura 2-2. Test de moran. .................................................................................... 19
Figura 2-3. Parmetros Test de moran. ................................................................ 20
Figura 2-4. Resultados Test de Breusch-Pagan.................................................... 20
Figura 2-5. Resumen modelo de retardo espacial................................................. 21
Figura 2-6. Resumen modelo de error. ................................................................. 22
Figura 4-2 Creacin Matriz de pesos (China 35) ................................................... 23
Figura 4-5 Reporte de variacin y prediccin de regresin (China 35) ................. 25
Figura 4-6 Reporte de regresin (China 35) .......................................................... 25
Figura 4-7 Diagnostico de dependencia espacial (China 35) ................................ 26
Figura 4-8 Morans I para Residuales (China 35) .................................................. 26
Figura 4-9 Ploteo China 29 en GeoDa .................................................................. 27
Figura 4-10 Despliegue tabla China 29 ................................................................. 27
Figura 4-13 Diagnostico dependencia espacial (China 29) ................................... 28
Figura 4-15 Reporte de regresin (Urban_Pop y RMC_PC_UR_) ........................ 29
Figura 26 Eventos de pasto Cogon ....................................................................... 36
P g i n a 3 | 58
LISTA DE TABLAS
Tabla 2-1. Resumen de distancias entre elementos. .............................................. 8
Tabla 1-1. Resumen de distancias entre elementos. ............................................ 17
P g i n a 4 | 58
ACTIVIDAD INICIAL
Las funciones para realizar las transformaciones, as como los resultados obtenidos
se presentan a continuacin.
sids_NAD=spTransform(sids, CRS("+init=epsg:3358"))
sids_SP=spTransform(sids, CRS("+init=ESRI:102719"))
Figura 0-1. Proyecciones de la capa sids
MATRIZ DE PESOS
Una vez definidos los datos a analizar, se procede a determinar las matrices de
pesos por cada uno de los criterios que aplican para datos de tipo lattice:
P g i n a 6 | 58
Min.
40100
1st Qu.
89770
Median
97640
Mean
96290
3rd Qu.
107200
Max.
134600
En virtud a que las bandas se realizaron con base en la distancia mxima, para el
caso de 0,75 veces la distancia mxima existen un alto nmero de elementos sin
vecindad.
Generalmente una matriz de pesos es expresada en forma binaria en donde para
cada elemento en filas se indica con 1 si existe vecindad y con cero 0 si no existe
vecindad; sin embargo, es til realizar una estandarizacin a partir del
fraccionamiento de los valores indicados con tal que cada fila sume la unidad. Para
el caso de estudio la matriz estandarizada para los primeros elementos as como la
matriz binaria del caso de matriz por contigidad en el caso queen y las funciones
empleadas se presentan a continuacin.
Figura 0-5. Matriz de pesos estandarizada (izquierda) y binaria (derecha).
P g i n a 8 | 58
sids_nbq_w<-nb2listw(sids_nbq)
sids_nbq_w$weights
sids_nbq_wb<-nb2listw(sids_nbq, style="B")
sids_nbq_wb$weights
Adicionalmente la matriz de pesos se puede definir a partir del inverso de las
distancias entre en este caso los centroides de los polgonos; se definen las
distancias, la funcin inversa y la matriz de pesos por contigidad en el caso queen
cuyas funciones y resultado se presenta a continuacin.
dist=nbdists(sids_nbq, coordinates(sids_SP))
idw=lapply(dist, function(x) 1/(x/1000))
sids_nbq_idwb=nb2listw(sids_nbq, glist=idw, style="B")
sids_nbq_idwb$weights
Figura 0-6. Matriz de pesos por inverso de distancia.
Como se puede observar el valor del ndice para la variable en particular, son
similares y cercanos a cero, sin embargo el pvalue para un nivel de confianza del
95% de la matriz estandarizada es menor por lo que su significancia indica que se
rechaza la hiptesis alternativa de aleatoriedad espacial indicando que existe una
autocorrelacion dbil.
As mismo, el i de moran supone normalidad y aleatoriedad en los datos, razn por
la cual para el primer supuesto se acostumbra a realizar simulaciones de Montecarlo
en las cuales a partir de un nmero significativo de simulaciones se obtiene
conjuntamente la normalidad. En el caso de estudio se realizaron 999 simulaciones
cuyas funciones aplicadas y resultados se presentan a continuacin:
bperm=moran.mc(sids_NAD$SIDR79, listw=sids_nbq_w, nsim=999)
P g i n a 10 | 58
Como se puede observar el ndice presenta un valor similar pero el pvalue se reduce
an ms indicando posible autocorrelacin espacial.
Figura 0-3. Histograma residuales I de moran Monte-Carlo.
P g i n a 11 | 58
alto-alto.
bajo-bajo.
bajo-alto.
alto-bajo.
relacin no significativa.
A continuacin se presentan las funciones aplicadas para graficar los valores del i
de moran resaltando los estadsticos significantes agrupados as como los
resultados obtenidos.
nci=moran.plot(sids_NAD$SIDR79,sids_nbq_w,labels=as.character(sids_NAD$NA
ME), xlim=c(-1,6.5), ylim=c(-1,4.5), xlab="SIDS Rate", ylab="SL SIDS Rate")
P g i n a 12 | 58
P g i n a 14 | 58
ACTIVIDAD INICIAL
El objetivo del anlisis de regresin espacial consiste en tratar la autocorrelacin
espacial que existe entre una variable dependiente con relacin a una o varias
variables independientes y la correlacin de los errores entre las observaciones y
las estimaciones; en el caso de estudio se tiene una capa de datos de tipo puntual
de la ciudad de Boston del estado de Massachusettes en los Estados Unidos de
Norteamrica.
El anlisis de regresin espacial requiere de la definicin de la autocorrelacin entre
las variables y los residuales del modelo de regresin, razn por la cual el presente
taller requiere de las herramientas y conceptos definidos en el taller anterior.
En primer lugar luego de cargados los datos, se requieren realizar las proyecciones
y transformaciones. Segn el estado de anlisis se adoptan los siguientes cdigos
presentes en la organizacin de referencia espacial:
son las mismas que se presentaron anteriormente razn por la cual a continuacin
se presentan los mapas de vecindad indicados.
Figura 0-2. Mapas de vecindad K vecinos.
Al igual que en los anlisis anteriores, se evidencia que a mayor nmero de vecinos
indicados mayores relaciones se observan en los mapas de vecindad.
Para el caso de la matriz de pesos por el mtodo de bandas de distancias se
calculan nuevamente las distancias entre cada uno de los elementos con el objeto
P g i n a 16 | 58
1st Qu.
1088.0
Median
1790.0
Mean
2472.0
3rd Qu.
3128.0
Max.
13030.0
P g i n a 17 | 58
Figura 0-5. ndices I de moran para matriz de pesos por k vecinos (arriba) y bandas de
distancias (abajo).
Como se puede observar los pvalue son iguales indicando significancia, el valor del
ndice es mayor en el caso de la matriz por k vecinos (0.76) respecto del ndice para
el caso de bandas de distancias (0.39), indicando as una mayor autocorrelacin
espacial para el primer mtodo, igualmente se presentan los diagramas de
dispersin para ambos casos.
Figura 0-6. Diagramas de dispersin I de moran para matriz de pesos por k vecinos
(izquierda) y bandas de distancias (derecha).
P g i n a 18 | 58
REGRESIN ESPACIAL
Se realiza la regresin espacial de la variable de estudio en funcin de 6 variables
independientes RM, LSTAT, CRIM, ZN, CHAS y DIS. Y se procede a guardar los
datos de los residuales para cada una de las observaciones. El resumen del modelo
de regresin el cual busca definir la significancia de las variables independientes se
presenta a continuacin.
Figura 0-1. Resumen modelo de regresin.
Como se puede observar, todas las variables incluidas son significativas, adicional
al valor del R2, la cual si bien no es una medida confiable del ajuste del modelo para
la regresin espacial es indicativa.
Una vez definida la matriz de pesos, como aquella obtenida mediante el mtodo de
k vecinos, se procede a realizar el test de moran mediante la siguiente funcin con
el objeto de verificar los residuales para autocorrelacin espacial, cuyos resultados
se presentan a continuacin
lm.morantest(bostlm,boston_kn1_w)
Figura 0-2. Test de moran.
P g i n a 19 | 58
En virtud a que se tiene un pvalue significativo y al valor alto del ndice de moran de
los residuales se puede establecer que existe autocorrelacin espacial para los
residuales indicando as que el modelo requiere de la inclusin de una variable
espacial.
Para determinar el tipo de dependencia espacial del modelo de regresin se
obtienen todos los parmetros del test de moran mediante la siguiente funcin con
los siguientes resultados.
lm.LMtests(bostlm, boston_kn1_w, test="all")
Figura 0-3. Parmetros Test de moran.
Estos resultados indican como significativos LMerr y LMlag, razn por la cual se
aplican test robustos para determinar el tipo de dependencia espacial.
Adicionalmente se aplica el test de Breusch-Pagan, el cual busca establecer la
existencia de heterocedasticidad (varianza no constante) en los errores. Las
funciones aplicadas as como los resultados del test se indican a continuacin:
library(lmtest)
bptest(bostlm)
Figura 0-4. Resultados Test de Breusch-Pagan.
P g i n a 20 | 58
El resultado del test y el valor de pvalue significativo indican que los errores son
heteroscedsticos, lo cual es consistente puesto que se tiene dependencia espacial
Finalmente se corren los modelos de retardo espacial y de error, los cuales buscan
definir la variable espacial a agregar al modelo de regresin. Las funciones
aplicadas y los resultados obtenidos se presentan a continuacin:
bostlag=lagsarlm(LOGMEDV~RM + LSTAT + CRIM + ZN + CHAS + DIS,
data=boston, boston_kn1_w)
summary(bostlag)
bptest.sarlm(bostlag)
Figura 0-5. Resumen modelo de retardo espacial.
Para el modelo de retardo espacial el pvalue del test LM indica que an existe una
mnima autocorrelacin espacial de los para el nivel de confianza definido y el test
BP indica que permanece la heterocedasticidad en los residuales.
P g i n a 21 | 58
Para el modelo de error el pvalue del test LR indica el peso de la variable espacial
lambda equivalente al 41%.
P g i n a 22 | 58
Despus creamos los pesos por el mtodo basado contigidad, utilizando el caso
Queen de orden grado uno, esto se realiza necesario para probar la auto
correlacin espacial. Con este paso se genera un archivo (.gal)
Figura 7-2 Creacin Matriz de pesos (China 35)
P g i n a 23 | 58
P g i n a 24 | 58
Variacin Total
Illiteracy v. Urban Pop%
Prediccin
regresin
OLS_Predict
Pop%
por
v.
P g i n a 25 | 58
P g i n a 26 | 58
Este mismo procesamiento se realiza para los datos de China con 29 provincias.
Figura 4-9 12Ploteo China 29 en GeoDa
Variacion Total
Illiteracy v. Urban Pop%
P g i n a 27 | 58
P g i n a 28 | 58
P g i n a 29 | 58
Grfica Morans I
Dado que LAMBDA es la variable espacial, esta dice cumplir con el 60% del
todo el modelo y esta dependen del p-valor y el nivel de confianza, y como
el valor es de 0.871 podemos afirmar que este No es significativo.
Figura 4-20 Regresin mltiple los resultados del modelo de retardos espaciales.
P g i n a 31 | 58
P g i n a 32 | 58
P g i n a 33 | 58
Aleatorio: Cualquier
punto es igualmente
probable de ocurrir en
cualquier ubicacin y la
posicin de cualquier
punto no es afectada por
la posicin de otro punto.
Agregado:
Muchos
puntos se agrupan cerca
los unos a los otros y en
extensas reas se ubican
unos pocos.
P g i n a 34 | 58
border<-readShapePoly(paste(workingDir,
"/FLBndy.shp",
sep=""))
flbord<-border@polygons[[1]]@Polygons[[1]]@coords
str(border)
flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp")
flinvxy<-coordinates(flinv)
flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp")
flpt<-as(flinv,"ppp")
border<-readShapePoly(paste(workingDir,
"/FLBndy.shp",
sep=""))
flbdry<-as(border,"owin")
flppp<-ppp(flpt$x,flpt$y,window=flbdry)
Adicionalmente se grafica la ventana de anlisis y los eventos al interior de ella.
P g i n a 35 | 58
plot(flppp,axes=T)
Figura 16 Eventos de pasto Cogon
nx=10,
P g i n a 36 | 58
Resultado de la prueba
Chi-squared test of CSR using quadrat
counts
Pearson X2 statistic
data: flppp
X2 = 292.51, df = 89, p-value < 2.2e-16
alternative hypothesis: two.sided
Quadrats: 90 tiles (irregular windows)
El p-valor de esta prueba efectuada sobre una distribucin a dos colas, indica
claramente que se rechaza la hiptesis nula. Por lo anterior es posible afirmar que
los datos conforman un patrn puntual agregado.
Ahora se grafica el resultado del conteo por cada tile de la cuadrcula versus el
conteo esperado.
P g i n a 37 | 58
ESTIMACIN KERNEL
P g i n a 38 | 58
poly<-slot(border, "polygons")[[1]]
poly1 <-slot(poly, "Polygons")[[1]]
coords<-slot(poly1, "coords")
min(coords[,1])
min(coords[,2])
grd<-GridTopology(cellcentre.offset=c(616593,531501),
cells.dim=c(400,400))
summary(grd)
cellsize=c(150,150),
P g i n a 39 | 58
P g i n a 40 | 58
Usando spatstat
plot(density(flppp, sigma =
600))
P g i n a 41 | 58
ESTIMACIN DE LA FUNCIN G
r=seq(0,350,by=50)
G <-envelope(flppp, Gest, r=r, nsim= 59,
rank= 2)
P g i n a 42 | 58
plot(G)
P g i n a 43 | 58
ESTIMACIN DE LA FUNCIN F
P g i n a 45 | 58
ESTIMACIN DE LA FUNCIN L
P g i n a 47 | 58
Patrn aleatorio
plot(pa)
Figura 24 Eventos de un patrn puntual aleatorio CSR
P g i n a 49 | 58
Patrn regular
P g i n a 50 | 58
P g i n a 51 | 58
Patrn agregado
r=r,
P g i n a 52 | 58
P g i n a 53 | 58
#FUNCION K
flu1<-stkhat(fluxy, date2, flubord, c(12400, 13580), seq(1,10,.5), seq(30,1200,20))
flu1se<-stsecal(fluxy,
date2,
flubord,
c(12400,
13580),
seq(1,10,.5),
seq(30,1200,20))
flu1mc <- stmctest(fluxy, date2, flubord, c(12400, 13580), seq(0,10,.5), seq(30,
1200, 20), nsim=49,quiet=TRUE)
stdiagn(fluxy, flu1, flu1se, flu1mc, Dzero=TRUE)
Figura 6-1. Resultados Funcin K agregacin espacio temporal
#MARCAS
spasthma<-readShapePoints("C:/TrabajoR/E ESPACIAL/Clase 6/spasthma.shp")
border<- readShapePoly("C:/TrabajoR/E ESPACIAL/Clase 6/spbdry.shp")
ppp<-as(spasthma,"ppp") # make points into ppp file
bdry<-as(border,"owin") # make boundary into owin file
m<-spasthma$Asthma # create marks file
asthppp<-ppp(ppp$x,ppp$y,marks=m,window=bdry)
Figura 6-2. Mapeo casos y controles
P g i n a 56 | 58
i="case",
j="control",
r=r,
P g i n a 57 | 58
P g i n a 58 | 58