Documente Academic
Documente Profesional
Documente Cultură
Facultad de Ciencias
Departamento de Estadı́stica
Maestrı́a en Ciencias - Estadı́stica
Estadı́stica espacial
Bogotá, 13 de Noviembre del 2018
1 RESUMEN:
Este trabajo es un compendio de lo visto en el curso de estadı́stica espacial, en este caso se realizará
un análisis geoestadı́stico de 467 mediciones de lluvias diarias realizadas en Suiza el 8 de mayo de
1986, medidos en diferentes sitios metereológicos. Se espera obtener una región de predicción con
nuevas observaciones de la variable en estudio.
2 INTRODUCCION:
La geoestadistica es una rama de la estadistica que se interesa en la estimacion, prediccion y
simulacion de fenomenos espaciales, a traves de una descripcion de la correlacion entre los puntos
del espacio, para ello se usa una funcion para describir la varianza de los incrementos de que
la variable medida, dicha funcion se denomina variograma , utilizado posteriormente para hacer
predicciones sobre puntos no muestrados con tecnicas kriging.
En la primera parte de del trabajo se hará un análisis descriptivos de los datos para evaluar la
tendencia, se modelará la dependencia espacial y la correlación por medio del semiovariograma y el
test de montecarlo, se ajustará un modelo teórico del semivariograma, finalmente se hará kriging
para obtener nuevas observaciones.
3 OBJETIVO GENERAL
• Modelar la dependencia espacial por medio del semivariograma, ajustado un modelo teórico,
para finalmente estimar nuevas observaciones de lluvias diaria en suiza.
4 OBJETIVOS ESPECIFICOS
• Hacer análisis descriptivo del promedio anual de precipitaciones en diferentes sitios en la
ciudad de Texas para verificar la tendencia y la distribución de los datos.
• Modelar la dependencia espacial por medio del semivariograma y por medio del mismo
analizar la anisotropı́a.
1
• Hacer el test de Moran para verificar la dependencia.
5 MARCO TEORICO
Geoestadistica se define como un proceso estocástico espacial, de una familia de variables donde el
conjunto de ı́ndices D es continuo
{Z(s); s ∈ D ⊂ R2 }
que tiene como objetivo ajustar modelos que indiquen cuando hay dependencia entre las medidas
de los diferentes sitios y hacer predicción. Para esto ultimo, la geoestadistica, se maneja bajo
dos etapas, el análisis estructural y predicción espacial en sitios no muestrados por medio de la
técnica kriging. Una de las principales caracterı́sticas que debe tener un proceso estocástico para
ser modelado en geoestadistica es que sea estacionario. La estacionaridad se define como la ausencia
de una tendencia y se cumple si su función de distribución conjunta es invariante respecto a cualquier
translación. Existen tres tipos de estacionaridad: estricta, fuerte y débil.
Para el desarrollo del análisis estructural con base en la información muestral, se definen las
funciones de semivariograma, covariograma y correlograma. El semivariograma se puede obtener
a partir del variograma, que es igual a la varianza de la diferencia entre dos observaciones de un
proceso de estacionaridad dedil, es decir:
γ(h) = σ 2 − C(h)
donde C(h) es la función de covarianza muestral entre parejas de observaciones que se encuen-
tran a una distancia h, o también llamada función de covariograma, definida como:
C(h) = σ 2 − γ(h)
Y la funcion de correlacion espacial muestral, la cual depende del vector de distancia espacial,
o funcion de correlograma queda como:
C(h)
ρ(h) =
σ2
2
• Kriging Ordinario: Este método propone que el valor de la variable puede predecirse como
combinación lineal de los n variables aleatorias ası́:
n
X
Ẑ(s0 ) = λi Z(si )
i=1
n X
X n n
X n
X
2
min σ + λi λj Cij − 2 λi Ci0 − 2m( λi − 1)
λ,m
i j i i
donde Cij es la covarianza entre la variable Z(si ) y la variable Z(sj ), y Ci0 es la covarianza
entre las variables Z(si ) y la variable de prediccion Z(s0 ).
Ası́ la varianza del predictor con kriging ordinario, es:
n
X
2 2
σKO =σ +m+ λi Ci0
i
• Kriging Simple: Se supone una variable estacionaria con media m y covarianza conocidas.
Entonces Z(x) = m + (x), por lo tanto un predictor insesgado sera Ẑ(x0 ) = m + ˆ(x0 ), y no
habrá restricción ya que el predictor sera insesgado siempre que E(ˆ
(x0 )) = 0. Ası́, sera el
mejor predictor lineal cuando minimice la varianza del error de predicción:
n X
X n n
X
min σ 2 + λi λj Cij − 2 λi Ci0
λ
i j i
n
X
2
σKS = σ2 − λi Ci0
i
• Kriging Universal: Este método se usa cuando las variables muestran una tendencia, en-
tonces se descompone Z(x) como la suma de la tendencia, tratada como una función deter-
ministica, mas una componente estocástica de media 0, Z(x) = m(x) + (x), con E((x)) = 0,
V ((x)) = σ 2 , E(Z(x)) = m(x) y m(x) se puede expresar como:
P
X
m(x) = aL fL (x)
L=1
3
con fL funciones conocidas, P el numero de términos empleados para ajustar m(x).
Luego, partiendo de que la definición de predictor kriging universal insesgado
n
X
Ẑ(x0 ) = λi Z(xi )
i=1
Pn PP
bajo la restriccion i λi Z(x0 ) = L fL (x0 ) , se obtendrán las ponderaciones de kriging
universal de tal forma que minimicen la varianza del error de prediccion
n X
X n n
X P
X Xn
min σ 2 + λi λj Cij − 2 λi Ci0 − mL [ λi fL (xi ) − fL (x0 )]
λ,m
i j i L=1 i=1
n
X P
X
2
σKU = λi Ci0 + mL fL (x0 )
i L=1
6 RESULTADOS
Datos disponibles en George Tita, Department of Criminology, Law and Society, University of
California, Irvine, CA 92697, gtita@uci.edu.
Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que la mayorı́a de observaciones tienen intensidad media y alta. Es decir que el
mapa nos permite identificar donde están ubicados el mayor número de puntos por unidad de área,
identificando ası́ clústers de las observaciones. Se puede inferir que la mayorı́a de los puntos están
ubicados ”muy cerca”.
4
c. Interpretar en términos prácticos los resultados
Analizando el mapa podemos interpretar que las sitios donde se da el fenómeno con mayor
intensidad esta representado por los colores rojo y amarillo, y los sitios donde la intensidad es
menor esta representada por el color azul, mostrando ası́ mejor la distribución de los datos. Por lo
que podemos ver que en estos datos encontramos observaciones tanto de poca intensidad como de
media(rojo) y alta intensidad (amarillo), ası́ como también podemos identificar algunos clústers en
el mapa.
6.1 CONCLUSIONES
• Podemos concluir que los datos de lluvias diarias de Suiza en 1986, presentan correlación
espacial.
• Se hicieron algunas predicciones sobre la región de estudio por medio de kriging universal.
References
[1] Diggle, P. Statistical Analysis of Spatial Point Pattern. 01 1983.
[3] Waller, L., and A. Gotway, C. Applied spatial statistics for public health data. Applied
spatial statistics for public health data (01 2004).