TALLER 11.19.28 A. M PDF

Universidad Nacional de Colombia
Facultad de Ciencias
Departamento de Estadı́stica
Maestrı́a en Ciencias - Estadı́stica
Estadı́stica espacial
Bogotá, 13 de Noviembre del 2018
TALLER DE PATRONES PUNTUALES

Yesica Alejandra Salas Cardenas 1
1 RESUMEN:
Este trabajo es un compendio de lo visto en el curso de estadı́stica espacial, en este caso se realizará
un análisis geoestadı́stico de 467 mediciones de lluvias diarias realizadas en Suiza el 8 de mayo de
1986, medidos en diferentes sitios metereológicos. Se espera obtener una región de predicción con
nuevas observaciones de la variable en estudio.
2 INTRODUCCION:
La geoestadistica es una rama de la estadistica que se interesa en la estimacion, prediccion y
simulacion de fenomenos espaciales, a traves de una descripcion de la correlacion entre los puntos
del espacio, para ello se usa una funcion para describir la varianza de los incrementos de que
la variable medida, dicha funcion se denomina variograma , utilizado posteriormente para hacer
predicciones sobre puntos no muestrados con tecnicas kriging.
En la primera parte de del trabajo se hará un análisis descriptivos de los datos para evaluar la
tendencia, se modelará la dependencia espacial y la correlación por medio del semiovariograma y el
test de montecarlo, se ajustará un modelo teórico del semivariograma, finalmente se hará kriging
para obtener nuevas observaciones.
3 OBJETIVO GENERAL
• Modelar la dependencia espacial por medio del semivariograma, ajustado un modelo teórico,
para finalmente estimar nuevas observaciones de lluvias diaria en suiza.
4 OBJETIVOS ESPECIFICOS
• Hacer análisis descriptivo del promedio anual de precipitaciones en diferentes sitios en la
ciudad de Texas para verificar la tendencia y la distribución de los datos.
• Modelar la dependencia espacial por medio del semivariograma y por medio del mismo
analizar la anisotropı́a.
• Ajustar los datos a un modelo teórico de semivariograma.

1
yasalasc@unal.edu.co
1
• Hacer el test de Moran para verificar la dependencia.
• Predecir el comportamiento de los datos, por medio de nuevas observaciones.
5 MARCO TEORICO
Geoestadistica se define como un proceso estocástico espacial, de una familia de variables donde el
conjunto de ı́ndices D es continuo
{Z(s); s ∈ D ⊂ R2 }
que tiene como objetivo ajustar modelos que indiquen cuando hay dependencia entre las medidas
de los diferentes sitios y hacer predicción. Para esto ultimo, la geoestadistica, se maneja bajo
dos etapas, el análisis estructural y predicción espacial en sitios no muestrados por medio de la
técnica kriging. Una de las principales caracterı́sticas que debe tener un proceso estocástico para
ser modelado en geoestadistica es que sea estacionario. La estacionaridad se define como la ausencia
de una tendencia y se cumple si su función de distribución conjunta es invariante respecto a cualquier
translación. Existen tres tipos de estacionaridad: estricta, fuerte y débil.
Para el desarrollo del análisis estructural con base en la información muestral, se definen las
funciones de semivariograma, covariograma y correlograma. El semivariograma se puede obtener
a partir del variograma, que es igual a la varianza de la diferencia entre dos observaciones de un
proceso de estacionaridad dedil, es decir:
2γ(h) = V (Z(s) − Z(s + h)) = σ 2
2γ(h) = E(Z(s) − Z(s + h))2

2γ(h) = 2σ 2 − 2C(h)
Asi la funcion de semivariograma, que es la mitad del variograma queda como:
γ(h) = σ 2 − C(h)
donde C(h) es la función de covarianza muestral entre parejas de observaciones que se encuen-
tran a una distancia h, o también llamada función de covariograma, definida como:
C(h) = σ 2 − γ(h)
Y la funcion de correlacion espacial muestral, la cual depende del vector de distancia espacial,
o funcion de correlograma queda como:
C(h)
ρ(h) =
σ2
Para la predicción espacial, en el la geoestadistica se busca una predicción espacial óptima,

fundamentada en la minimización del error cuadrático medio de predicción, llamado kriging, que
encierra un conjunto de métodos de predicción espacial lineal (Simple, Ordinario y Universal)o no
lineal (Indicador, Probabilı́stico, Log Normal, Trans-Gaussiano y Disyuntivo). Ası́, sea la variable
de interés Z, con realizaciones Z(s1 , ..., Z(sn )), donde se desea predecir la variable Z(s0 ) donde no
hubo medición, se describirá el proceso por medio de los métodos de kriging lineal:
2
• Kriging Ordinario: Este método propone que el valor de la variable puede predecirse como
combinación lineal de los n variables aleatorias ası́:
n
X
Ẑ(s0 ) = λi Z(si )
i=1
Asumiendo que el proceso es estacionario de media m (desconocida) se demuestra que la

suma de λi sea igual 1, para garantizar que el estimador sea insesgado, es decir E(Ẑ(s0 )) =
E(Z(s0 )). Entonces, Ẑ(s0 ) es el mejor predictor lineal, haciendo que la obtención de los pesos
minimice la varianza del error de predicción bajo la restricción de insesgadez
n X
X n n
X n
X
2
min σ + λi λj Cij − 2 λi Ci0 − 2m( λi − 1)
λ,m
i j i i
donde Cij es la covarianza entre la variable Z(si ) y la variable Z(sj ), y Ci0 es la covarianza
entre las variables Z(si ) y la variable de prediccion Z(s0 ).
Ası́ la varianza del predictor con kriging ordinario, es:
n
X
2 2
σKO =σ +m+ λi Ci0
i
Y usando la funcion de semvarianza, tenemos que la varianza del error de predicicon:

n
X
2
σKO = λi γij + m
i
donde γij = σ 2 − Cij .
• Kriging Simple: Se supone una variable estacionaria con media m y covarianza conocidas.
Entonces Z(x) = m + (x), por lo tanto un predictor insesgado sera Ẑ(x0 ) = m + ˆ(x0 ), y no
habrá restricción ya que el predictor sera insesgado siempre que E(ˆ
(x0 )) = 0. Ası́, sera el
mejor predictor lineal cuando minimice la varianza del error de predicción:
n X
X n n
X
min σ 2 + λi λj Cij − 2 λi Ci0
λ
i j i
Y la varianza del predictor bajo kriging simple es:
n
X
2
σKS = σ2 − λi Ci0
i
• Kriging Universal: Este método se usa cuando las variables muestran una tendencia, en-
tonces se descompone Z(x) como la suma de la tendencia, tratada como una función deter-
ministica, mas una componente estocástica de media 0, Z(x) = m(x) + (x), con E((x)) = 0,
V ((x)) = σ 2 , E(Z(x)) = m(x) y m(x) se puede expresar como:
P
X
m(x) = aL fL (x)
L=1
3
con fL funciones conocidas, P el numero de términos empleados para ajustar m(x).
Luego, partiendo de que la definición de predictor kriging universal insesgado
n
X
Ẑ(x0 ) = λi Z(xi )
i=1
Pn PP
bajo la restriccion i λi Z(x0 ) = L fL (x0 ) , se obtendrán las ponderaciones de kriging
universal de tal forma que minimicen la varianza del error de prediccion
n X
X n n
X P
X Xn
min σ 2 + λi λj Cij − 2 λi Ci0 − mL [ λi fL (xi ) − fL (x0 )]
λ,m
i j i L=1 i=1
Y la varianza del predictor de kriging universal esta dada por:
n
X P
X
2
σKU = λi Ci0 + mL fL (x0 )
i L=1
Si P = 1 y fL (x) = 1, el sistema de ecuaciones y la varianza de prediccion conincide con la

del kriging ordinario.
6 RESULTADOS
DESCRIPCIÓN DE LOS DATOS:

Para realizar este taller vamos a utilizar dos bases de datos:
• La segunda base de datos corresponde a localización de homicidios en Pittsburgh, PA (1993),

consta de 143 observaciones.
Datos disponibles en George Tita, Department of Criminology, Law and Society, University of
California, Irvine, CA 92697, gtita@uci.edu.
b. Hacer el mapa de la función de intensidad del patrón en R (usando kernel) :
Construimos el mapa de la función de intensidad de los sitios metereológicos en el estado de Texas.
c. Interpretar en términos prácticos los resultados
Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que la mayorı́a de observaciones tienen intensidad media y alta. Es decir que el
mapa nos permite identificar donde están ubicados el mayor número de puntos por unidad de área,
identificando ası́ clústers de las observaciones. Se puede inferir que la mayorı́a de los puntos están
ubicados ”muy cerca”.
4
c. Interpretar en términos prácticos los resultados
Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que en estos datos encontramos observaciones tanto de poca intensidad como de
media(rojo) y alta intensidad (amarillo), ası́ como también podemos identificar algunos clústers en
el mapa.
6.1 CONCLUSIONES
• Podemos concluir que los datos de lluvias diarias de Suiza en 1986, presentan correlación
espacial.
• El modelo que se ajusto al semivariograma empirico por el método de minimos cuadrados es

el esférico.
• El modelo que se ajusto al semivariograma empirico por el método de máxima verosimilitud

es el exponencial.
• Se hicieron algunas predicciones sobre la región de estudio por medio de kriging universal.
References
[1] Diggle, P. Statistical Analysis of Spatial Point Pattern. 01 1983.
[2] Gimond, M. Intro to GIS and Spatial Analysis.
[3] Waller, L., and A. Gotway, C. Applied spatial statistics for public health data. Applied
spatial statistics for public health data (01 2004).

TALLER 11.19.28 A. M PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

TALLER 11.19.28 A. M PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Universidad Nacional de Colombia

TALLER DE PATRONES PUNTUALES

• Ajustar los datos a un modelo teórico de semivariograma.

• Predecir el comportamiento de los datos, por medio de nuevas observaciones.

2γ(h) = V (Z(s) − Z(s + h)) = σ 2

2γ(h) = E(Z(s) − Z(s + h))2

Para la predicción espacial, en el la geoestadistica se busca una predicción espacial óptima,

Asumiendo que el proceso es estacionario de media m (desconocida) se demuestra que la

Y usando la funcion de semvarianza, tenemos que la varianza del error de predicicon:

donde γij = σ 2 − Cij .

Y la varianza del predictor bajo kriging simple es:

Y la varianza del predictor de kriging universal esta dada por:

Si P = 1 y fL (x) = 1, el sistema de ecuaciones y la varianza de prediccion conincide con la

DESCRIPCIÓN DE LOS DATOS:

• La segunda base de datos corresponde a localización de homicidios en Pittsburgh, PA (1993),

b. Hacer el mapa de la función de intensidad del patrón en R (usando kernel) :

Construimos el mapa de la función de intensidad de los sitios metereológicos en el estado de Texas.

c. Interpretar en términos prácticos los resultados

• El modelo que se ajusto al semivariograma empirico por el método de minimos cuadrados es

• El modelo que se ajusto al semivariograma empirico por el método de máxima verosimilitud

[2] Gimond, M. Intro to GIS and Spatial Analysis.

S-ar putea să vă placă și