Sunteți pe pagina 1din 5

Universidad Nacional de Colombia

Facultad de Ciencias
Departamento de Estadı́stica
Maestrı́a en Ciencias - Estadı́stica
Estadı́stica espacial
Bogotá, 13 de Noviembre del 2018

TALLER DE PATRONES PUNTUALES


Yesica Alejandra Salas Cardenas 1

1 RESUMEN:
Este trabajo es un compendio de lo visto en el curso de estadı́stica espacial, en este caso se realizará
un análisis geoestadı́stico de 467 mediciones de lluvias diarias realizadas en Suiza el 8 de mayo de
1986, medidos en diferentes sitios metereológicos. Se espera obtener una región de predicción con
nuevas observaciones de la variable en estudio.

2 INTRODUCCION:
La geoestadistica es una rama de la estadistica que se interesa en la estimacion, prediccion y
simulacion de fenomenos espaciales, a traves de una descripcion de la correlacion entre los puntos
del espacio, para ello se usa una funcion para describir la varianza de los incrementos de que
la variable medida, dicha funcion se denomina variograma , utilizado posteriormente para hacer
predicciones sobre puntos no muestrados con tecnicas kriging.

En la primera parte de del trabajo se hará un análisis descriptivos de los datos para evaluar la
tendencia, se modelará la dependencia espacial y la correlación por medio del semiovariograma y el
test de montecarlo, se ajustará un modelo teórico del semivariograma, finalmente se hará kriging
para obtener nuevas observaciones.

3 OBJETIVO GENERAL
• Modelar la dependencia espacial por medio del semivariograma, ajustado un modelo teórico,
para finalmente estimar nuevas observaciones de lluvias diaria en suiza.

4 OBJETIVOS ESPECIFICOS
• Hacer análisis descriptivo del promedio anual de precipitaciones en diferentes sitios en la
ciudad de Texas para verificar la tendencia y la distribución de los datos.

• Modelar la dependencia espacial por medio del semivariograma y por medio del mismo
analizar la anisotropı́a.

• Ajustar los datos a un modelo teórico de semivariograma.


1
yasalasc@unal.edu.co

1
• Hacer el test de Moran para verificar la dependencia.

• Predecir el comportamiento de los datos, por medio de nuevas observaciones.

5 MARCO TEORICO
Geoestadistica se define como un proceso estocástico espacial, de una familia de variables donde el
conjunto de ı́ndices D es continuo
{Z(s); s ∈ D ⊂ R2 }
que tiene como objetivo ajustar modelos que indiquen cuando hay dependencia entre las medidas
de los diferentes sitios y hacer predicción. Para esto ultimo, la geoestadistica, se maneja bajo
dos etapas, el análisis estructural y predicción espacial en sitios no muestrados por medio de la
técnica kriging. Una de las principales caracterı́sticas que debe tener un proceso estocástico para
ser modelado en geoestadistica es que sea estacionario. La estacionaridad se define como la ausencia
de una tendencia y se cumple si su función de distribución conjunta es invariante respecto a cualquier
translación. Existen tres tipos de estacionaridad: estricta, fuerte y débil.
Para el desarrollo del análisis estructural con base en la información muestral, se definen las
funciones de semivariograma, covariograma y correlograma. El semivariograma se puede obtener
a partir del variograma, que es igual a la varianza de la diferencia entre dos observaciones de un
proceso de estacionaridad dedil, es decir:

2γ(h) = V (Z(s) − Z(s + h)) = σ 2

2γ(h) = E(Z(s) − Z(s + h))2


2γ(h) = 2σ 2 − 2C(h)
Asi la funcion de semivariograma, que es la mitad del variograma queda como:

γ(h) = σ 2 − C(h)

donde C(h) es la función de covarianza muestral entre parejas de observaciones que se encuen-
tran a una distancia h, o también llamada función de covariograma, definida como:

C(h) = σ 2 − γ(h)

Y la funcion de correlacion espacial muestral, la cual depende del vector de distancia espacial,
o funcion de correlograma queda como:

C(h)
ρ(h) =
σ2

Para la predicción espacial, en el la geoestadistica se busca una predicción espacial óptima,


fundamentada en la minimización del error cuadrático medio de predicción, llamado kriging, que
encierra un conjunto de métodos de predicción espacial lineal (Simple, Ordinario y Universal)o no
lineal (Indicador, Probabilı́stico, Log Normal, Trans-Gaussiano y Disyuntivo). Ası́, sea la variable
de interés Z, con realizaciones Z(s1 , ..., Z(sn )), donde se desea predecir la variable Z(s0 ) donde no
hubo medición, se describirá el proceso por medio de los métodos de kriging lineal:

2
• Kriging Ordinario: Este método propone que el valor de la variable puede predecirse como
combinación lineal de los n variables aleatorias ası́:
n
X
Ẑ(s0 ) = λi Z(si )
i=1

Asumiendo que el proceso es estacionario de media m (desconocida) se demuestra que la


suma de λi sea igual 1, para garantizar que el estimador sea insesgado, es decir E(Ẑ(s0 )) =
E(Z(s0 )). Entonces, Ẑ(s0 ) es el mejor predictor lineal, haciendo que la obtención de los pesos
minimice la varianza del error de predicción bajo la restricción de insesgadez

n X
X n n
X n
X
2
min σ + λi λj Cij − 2 λi Ci0 − 2m( λi − 1)
λ,m
i j i i

donde Cij es la covarianza entre la variable Z(si ) y la variable Z(sj ), y Ci0 es la covarianza
entre las variables Z(si ) y la variable de prediccion Z(s0 ).
Ası́ la varianza del predictor con kriging ordinario, es:

n
X
2 2
σKO =σ +m+ λi Ci0
i

Y usando la funcion de semvarianza, tenemos que la varianza del error de predicicon:


n
X
2
σKO = λi γij + m
i

donde γij = σ 2 − Cij .

• Kriging Simple: Se supone una variable estacionaria con media m y covarianza conocidas.
Entonces Z(x) = m + (x), por lo tanto un predictor insesgado sera Ẑ(x0 ) = m + ˆ(x0 ), y no
habrá restricción ya que el predictor sera insesgado siempre que E(ˆ
(x0 )) = 0. Ası́, sera el
mejor predictor lineal cuando minimice la varianza del error de predicción:

n X
X n n
X
min σ 2 + λi λj Cij − 2 λi Ci0
λ
i j i

Y la varianza del predictor bajo kriging simple es:

n
X
2
σKS = σ2 − λi Ci0
i

• Kriging Universal: Este método se usa cuando las variables muestran una tendencia, en-
tonces se descompone Z(x) como la suma de la tendencia, tratada como una función deter-
ministica, mas una componente estocástica de media 0, Z(x) = m(x) + (x), con E((x)) = 0,
V ((x)) = σ 2 , E(Z(x)) = m(x) y m(x) se puede expresar como:
P
X
m(x) = aL fL (x)
L=1

3
con fL funciones conocidas, P el numero de términos empleados para ajustar m(x).
Luego, partiendo de que la definición de predictor kriging universal insesgado

n
X
Ẑ(x0 ) = λi Z(xi )
i=1
Pn PP
bajo la restriccion i λi Z(x0 ) = L fL (x0 ) , se obtendrán las ponderaciones de kriging
universal de tal forma que minimicen la varianza del error de prediccion

n X
X n n
X P
X Xn
min σ 2 + λi λj Cij − 2 λi Ci0 − mL [ λi fL (xi ) − fL (x0 )]
λ,m
i j i L=1 i=1

Y la varianza del predictor de kriging universal esta dada por:

n
X P
X
2
σKU = λi Ci0 + mL fL (x0 )
i L=1

Si P = 1 y fL (x) = 1, el sistema de ecuaciones y la varianza de prediccion conincide con la


del kriging ordinario.

6 RESULTADOS

DESCRIPCIÓN DE LOS DATOS:


Para realizar este taller vamos a utilizar dos bases de datos:

• La segunda base de datos corresponde a localización de homicidios en Pittsburgh, PA (1993),


consta de 143 observaciones.

Datos disponibles en George Tita, Department of Criminology, Law and Society, University of
California, Irvine, CA 92697, gtita@uci.edu.

b. Hacer el mapa de la función de intensidad del patrón en R (usando kernel) :

Construimos el mapa de la función de intensidad de los sitios metereológicos en el estado de Texas.

c. Interpretar en términos prácticos los resultados

Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que la mayorı́a de observaciones tienen intensidad media y alta. Es decir que el
mapa nos permite identificar donde están ubicados el mayor número de puntos por unidad de área,
identificando ası́ clústers de las observaciones. Se puede inferir que la mayorı́a de los puntos están
ubicados ”muy cerca”.

4
c. Interpretar en términos prácticos los resultados

Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que en estos datos encontramos observaciones tanto de poca intensidad como de
media(rojo) y alta intensidad (amarillo), ası́ como también podemos identificar algunos clústers en
el mapa.

6.1 CONCLUSIONES
• Podemos concluir que los datos de lluvias diarias de Suiza en 1986, presentan correlación
espacial.

• El modelo que se ajusto al semivariograma empirico por el método de minimos cuadrados es


el esférico.

• El modelo que se ajusto al semivariograma empirico por el método de máxima verosimilitud


es el exponencial.

• Se hicieron algunas predicciones sobre la región de estudio por medio de kriging universal.

References
[1] Diggle, P. Statistical Analysis of Spatial Point Pattern. 01 1983.

[2] Gimond, M. Intro to GIS and Spatial Analysis.

[3] Waller, L., and A. Gotway, C. Applied spatial statistics for public health data. Applied
spatial statistics for public health data (01 2004).

S-ar putea să vă placă și