Sunteți pe pagina 1din 25

Martha Bohrquez.

Geoestadstica

1.1

Estacionariedad e isotropa. Variograma y Covariograma

Conceptos y Definiciones

El campo aleatorio espacial (proceso estocstico) Z ( s ) : s D R d es una


familia de variables aleatorias cuyo conjunto ndice es D R d . Los datos
observados Z(si), i = 1, , n , no son una muestra ordinaria de tamao n sino

una nica realizacin del proceso Z ( s ) : s D R d , que en realidad es una


familia de modelos que genera resultados sobre el conjunto ndice D. No
existen rplicas de los datos, a menos que se tomaran medidas repetidas en
cada una de las ubicaciones s D , lo cual es muy poco frecuente en la
recoleccin de datos espaciales. Esto hace preciso, crear un mecanismo para
generar stas rplicas y poder hacer inferencia sobre los datos A estas
variables medidas en el espacio tambin se les llama variables regionalizadas.
Los dos componentes estructurales del campo aleatorio que permiten
incorporar rplicas son la estacionariedad y la isotropa.

1.1.1 Supuesto de Estacionariedad


Este supuesto se refiere a que la estructura probabilstica del campo aleatorio
es similar en diferentes partes de D, es decir que el proceso alcanza un estado
de equilibrio. Esto ocurre cuando las coordenadas absolutas no muestran
ninguna influencia sobre la ocurrencia de la variable. Si el campo aleatorio es
estacionario y se va a estimar la covarianza Cov [Z ( s ), Z ( s + h)] , por ejemplo, se
puede usar una funcin que dependa solamente de la distancia absoluta s(s+h)=h, sin importar donde estn localizados los puntos. Para que diferentes
pares de puntos puedan contribuir a la estimacin, solo se necesita que tengan
la misma distancia h. De manera formal, una variable regionalizada es
estacionaria si su funcin de distribucin no vara con la traslacin del vector h,
T
esto
es,
para
Z ( s ) = [Z (s1 ), Z (s 2 ), , Z (s n )]
y
Z ( s ' ) = [Z (s1 + h ), Z (s 2 + h ),
se tiene que

, Z (s n + h )]

FZ ( s ) = FZ ( s ')
Esta condicin es llamada tambin estacionariedad fuerte.

1.1.2 Supuesto de Isotropa


La estacionariedad permite combinar pares de datos con la misma diferencia
de coordenadas. Estos son vectores de diferencias. Si, adems, los vectores
de diferencias pueden ser reemplazados con distancias escalares, por ejemplo
una distancia euclidiana h para calcular medidas como la covarianza,
1

Martha Bohrquez. Geoestadstica

entonces el campo aleatorio se dice isotrpico. Esto es, la correlacin entre los
datos no depende de la direccin en la que esta se calcula. As, un campo
aleatorio que es estacionario pero no isotrpico se desarrolla de manera
diferente segn las diferentes direcciones del espacio. As no solo basta con
conocer cuanto estn separados un par de puntos, sino tambin se necesita
conocer la orientacin de dicha distancia. Por lo tanto, anisotropa es la
ausencia de isotropa, y puede ser detectada en los dispersogramas
rezagados, examinando si la dependencia espacial cambia al cambiar la
direccin.
En trminos geomtricos la estacionariedad y la isotropa son propiedades de
invarianza. La estacionariedad es invarianza bajo la traslacin. La isotropa es
invarianza bajo rotaciones y reflexiones. Ahora en trminos matemticos, se
define E [Z (s )] = (s ) , que es llamada la tendencia o media del atributo Z(), y
con base en esto se define:

1.1.3 Estacionariedad de segundo orden


Si se cumple que

(s ) = , es decir, la media es finita y constante s D


Cov [Z (s ), Z (s + h )] = C (h ) , para toda pareja {Z (s ), Z (s + h )}, es decir, la
covarianza existe y es funcin nica del vector h.
entonces, se dice que es un proceso dbilmente estacionario o estacionario de
segundo orden. Y si adems C() es una funcin nica de la distancia h se
llama isotrpica.

1.1.4 Estacionariedad Intrnseca


Si se tiene que
E [Z (s + h ) Z (s )] = 0 y
Var [Z (s + h ) Z (s )] = 2 (h )

La cantidad 2 (h ) es conocida como el variograma y es el parmetro mas


importante de la Geoestadstica. La definicin clsica del estimador del
variograma es :
2 (h )

1
N (h )

( )(Z (s ) Z (s ))

N h

Martha Bohrquez. Geoestadstica

donde la suma es sobre N (h ) = {(i, j ) : s i s j = h} y N (h ) es el nmero de


elementos distintos de N(h). Este es un estimador insesgado; sin embargo, se
ve afectado cuando hay observaciones atpicas.
Notas
C() y () son parmetros del proceso estocstico, solamente la varianza
es un parmetro de la distribucin de una variable aleatoria. As que
C() y () son cantidades desconocidas y sujetas a estimacin.
La isotropa es una caracterstica de C() y () . La frase correcta es un
proceso estacionario con semivariograma isotrpico.
La estacionariedad de segundo orden est definida en trminos del
covariograma
La estacionariedad intrnseca est definida en trminos del
semivariograma. No hay estacionariedad intrnseca con covariograma
C(). Si el covariograma existe, el proceso podra ser estacionario de
segundo orden, pero no necesariamente intrnseco.

C0

semivariograma

covarianza

Figura 1. Semivariograma Vs Covariograma

Isotropa significa que la fuerza de la dependencia espacial es solo una


funcin de una distancia escalar, no de la direccin
La clase de procesos estacionarios intrnsecos contienen estrictamente
la clase de procesos estacionarios de segundo orden. Si un proceso es
estacionario de segundo orden, es tambin intrnseco. Pero no todo
proceso estacionario intrnseco tambin ser de segundo orden. As se
C() existe, () necesariamente existe. Pero la existencia de () no
implica la existencia de C(). Si el proceso es intrnseco pero no
estacionario de segundo orden, la funcin covarianza no existe.
Ambos tipos de estacionariedad requieren que la media sea constante.
No requieren que la media sea conocida, pero si que la media no cambie
espacialmente.
(s1 s1 ) = (0 ) = Var [Z (s1 ) Z (s1 )] = 0
no
depende
de
la
ubicacin,
pero
C (s1 s1 ) = C (0 ) ,
Cov[Z (s i ), Z (s i )] = Var[Z (s i )] . Por lo tanto, en un proceso de
3

Martha Bohrquez. Geoestadstica

estacionariedad de segundo orden todas las observaciones tienen la


misma variabilidad.
Esta es una forma de la propiedad de
homocedasticidad. El supuesto de estacionariedad de segundo orden
en estadstica espacial, es equivalente al de igualdad de varianza en
estadstica clsica.
C (0 ) 0, C (h ) = C ( h ), C (h ) C (0 )
Para un proceso estacionario de segundo orden, se puede definir la
C (h )
funcin
, que es llamado el correlograma. Este expresa como la
C (0 )
correlacin entre ubicaciones cambia con la separacin espacial.
1.2

Relacin entre covariograma y semivariograma

Asumiendo que el proceso es estacionario de segundo orden y que por lo


tanto. C ( ) est definida; de la definicin de variograma se tiene
Var [Z (s1 ) Z (s 2 )] = Var [Z (s1 )] + Var [Z (s 2 )] 2Cov [Z (s1 ), Z (s 2 )]
1
1
1
Cov[Z (s1 ), Z (s 2 )] = Var [Z (s1 )] + Var [(s 2 )] Var [Z (s1 ) Z (s 2 )]
2
2
2
1
C (s1 s 2 ) = (Var [Z (s1 )] + Var [Z (s 2 )]) (s1 s 2 )
2

Adems como C (0) = Var [Z (s i )] , por ser estacionario de segundo orden, se


tiene que
C (s1 s 2 ) = C (0 ) (s1 s 2 )
(s1 s 2 ) = C (0 ) C (s1 s 2 )

Si un proceso es estacionario de segundo orden tiene C (h ) 0 , entonces


C (h ) C (0 ), C (0 ) 0 , y C (h ) 0 cuando h crece. El semivariograma de un
proceso estacionario de segundo orden tiene una asntota, C (0 ) . Esto provee
una herramienta para chequear estacionariedad. Se estima el semivariograma,
si tiende a una lnea horizontal cuando se incrementa la separacin de los
puntos, el proceso es estacionario de segundo orden; si crece constantemente,
el proceso no es estacionario de segundo orden. Por otro lado, la mitad de los
cuadrados de las diferencias, pueden ser usadas para estimar el
semivariograma del proceso.
El semivariograma es como mnimo
intrnsecamente estacionario si
(h )
0 cuando h
h

Como (s1 s2 ) C (0) = Var [Z (si )] cuando la separacin de coordenadas


aumenta, usualmente se grafican semivariogramas en lugar de variogramas.
Las siguientes son las dos caractersticas principales del semivariograma:
4

Martha Bohrquez. Geoestadstica

Silla es la asntota superior del semivariograma. nicamente los


procesos estacionarios de segundo orden tienen silla. En estos casos la
silla es C (0 ) . Tambin es conocida como meseta.
Rango de un proceso espacial es la distancia en la cual C (h ) 0 . Se
dice que aproximadamente ( ) porque algunos procesos alcanzan
correlacin cero solo asintticamente para h = , mientras que otros
tienen un rango finito.
El rango de un proceso espacial es la distancia a la cual los puntos ya no se
consideran correlacionados. Los puntos separados por una distancia inferior al
rango se consideran espacialmente correlacionados: Observaciones
espaciadas por mas que el rango se consideran independientes.
1.3

El efecto pepita

El semivariograma tiene las siguientes propiedades que se siguen directamente


de su definicin:

(h ) = ( h )
(0 ) = 0

Semivarianza

silla

rango
distancia

Figura 2. Elementos de un semivariograma

El semivariograma se aproxima a una asntota a medida que la distancia se


incrementa. El semivariograma emprico comienza en la distancia mas
pequea entre unidades experimentales. Podra ajustarse a los puntos una
funcin que pasara por el origen. Sin embargo, el grfico sugiere que el
intercepto es distinto de cero.
5

Martha Bohrquez. Geoestadstica

En general, en las aplicaciones se usa que (h ) c0 cuando h 0 . La


justificacin a esto es que la varianza de las distintas observaciones en la
misma ubicacin tiene un error de medida. Cuando no es posible repetir una
medida en la ubicacin s sin error, entonces se muestra su variabilidad. Pero
este efecto de (h ) c0 cuando h 0 puede deberse a que existe un proceso
espacial que opera a distancias mas pequeas que las que fueron tenidas en
cuenta para los valores de h. Este proceso de micro-escala, tiene silla cMS.
Entonces.
2
c0 = ME
+ cMS
2
donde ME
es la varianza del error. Por lo tanto, si cualquiera de las dos
componentes es diferente de cero, el semivariograma presentar una
discontinuidad puntual en el origen; la magnitud de esta discontinuidad es
llamada el EFECTO PEPITA y se representa c0.

Silla Parcial: si un semivariograma tiene efecto pepita c0 y silla C (0 ) , la


diferencia entre C (0 ) - c0 es llamada la silla parcial del semivariograma.
En presencia del efecto pepita, la relacin entre el semivariograma y el
covariograma se altera:
En el modelo sin pepita Var[Z (si )] = C (0) = 2
En el modelo con pepita se define Var [Z (si )] = C (0) = c0 + donde es la

silla parcial ( y 2 = Var[Z (si )] = c0 +

Se puede expresar el semivariograma como (h ) = c0 + f (h ) , para alguna f (h ) .


Entonces
(1 f (h ))
C (h ) =
c0 +

h>0
h=0

El efecto pepita es obvio en muchos conjuntos de datos. Si no hay error de


medida es un indicador de que no hay muestras a distancias menores que las
tomadas.
Nota: Si un proceso es estacionario de segundo orden, no debe tener un efecto
pepita. De igual forma, si se confirma el efecto pepita, el proceso no ser
considerado mas como estacionario de segundo orden.

Martha Bohrquez. Geoestadstica

Cuando existe el efecto pepita, se calcula una medida para la estructura de la


variabilidad relativa (RSV). Esta es la elevacin relativa del semivariograma
sobre el efecto pepita en porcentaje:


c
x100 = 1 0 x100
RSV=
+ c0
+ c0

RSV mide cuanta de la variabilidad de las observaciones es debido a la


estructura. El resto es debido a errores de medida y/o de la variabilidad de
micro-escala.

1.4

Modelos de semivariograma con isotropa

Los modelos paramtricos de semivariograma son muy importantes en


estadstica espacial. El semivariograma debe ser CND: condicionalmente no
negativo. Para cualquier conjunto de ubicaciones s1, ,sk y constantes a1,,ak,
se debe cumplir que
k

a a
i =1 j =

2 (s1 s j ) 0

Al estimar el semivariograma de un conjunto de datos, el semivariograma


emprico no necesariamente cumple esta condicin, y por lo tanto no puede ser
usado para inferencia, ni para ningn tipo de prediccin espacial. El
procedimiento usual es
calcular el semivariograma emprico de los datos
ajustar un modelo de semivariograma paramtrico al semivariograma
emprico.
La eleccin del modelo garantiza la condicin CND y por lo tanto se puede
proceder a la inferencia estadstica y al ajuste del modelo.

1.4.1 Modelo con solo efecto pepita (Pepita Puro)


Es un modelo estacionario de segundo orden.
h=0
0
(h; ) =
h0
c s
En este modelo todas las observaciones estn incorrelacionadas.
equivalente espacial de una muestra aleatoria en la estadstica clsica.

Es el

Martha Bohrquez. Geoestadstica

6
5
4
3
2
1
0
0

10

15

20

25

1.4.2 Modelo Lineal


Es un modelo con estacionariedad intrnseca, vlido en Rd, d 1 .
0

h=0

c0 + b h

h0

(h; ) =

45
40
35
30
25
20
15
10
5
0
0

10

15

20

25

Como se puede ver en grficamente este modelo no tiene estacionariedad de


segundo orden, pues el semivariograma no tienen asntota. Para que sea
vlido es necesario que c0 0, b 0

Martha Bohrquez. Geoestadstica

El modelo esfrico es uno de los mas populares

1.4.3 Modelo Esfrico


Es estacionario de segundo orden vlido en R1 , R2 y R3

3 h 1 h 3


(h; ) = c0 + c s
2 a 2 a

c0 + c s

h =0
0< h a
h >a

14
12
10
8
6
4
2
0
0

10

20

30

40

50

Tiene rango a y silla c0 + c s . Cerca al origen este semivariograma es muy


semejante al lineal. Inmediatamente sobrepasa el rango, el modelo se hace
cero, hecho que indica que la covarianza sera nula a partir de esta distancia.
Esto hace que su uso sea muy generalizado. Sin embargo, el hecho de que
sea solo una vez diferenciable en h = a genera problemas pues se requieren
las segundas derivadas para la estimacin va mximo verosimilitud. Se ha
sugerido como alternativa trabajar con su cuadrado, pero este cerca al origen
tiene forma parablica.

1.4.4 Modelo Exponencial


Es estacionario de segundo orden, vlido en Rd, d 1

(h; ) =
c0 + c s 1

h =0

3h
a

h >0

Martha Bohrquez. Geoestadstica

14
12
10
8
6
4
2
0
0

10

15

20

25

30

35

El modelo exponencial tiene una silla asinttica. El parmetro del rango a es la


distancia a la cual el semivariograma completa el 95% de la silla, este valor se
llama tambin el rango efectivo. La parametrizacin de este modelo por lo
tanto no es nica.

1.4.5 Modelo Gaussiano


Es estacionario de segundo orden, vlido en Rd, d 1

(h ) =

+
c
c
s 1
0

h =0
h 2
3
a

h >0

14
12
10
8
6
4
2
0
0

10

15

20

25

30

35

La diferencia entre el modelo Gaussiano y el exponencial es el cuadrado en el


exponente. Al igual que en el modelo exponencial, el parmetro a es el rango
efectivo. El modelo Gaussiano es el mas continuo cerca al origen, de los

10

Martha Bohrquez. Geoestadstica

modelos considerados hasta el momento.


diferenciable cerca de 0.

De hecho, es infinitamente

1.4.6 Modelo cuadrtico Racional


Estacionario de segundo orden. vlido en Rd, d 1 .

(h; ) =
h

+
c
c
s
0
2
1 + h a

h =0

h >0

14
12
10
8
6
4
2
0
0

10

15

20

25

30

1.4.7 Modelo Potencial


Estacionariedad intrnseca, vlido en Rd, d 1
0

(h; ) =

c0 + c s h

h =0

h >0

Este modelo es vlido para 0 < 2 , ya que en otro caso crece demasiado
rpido y con esto violara la estacionariedad intrnseca.

11

Martha Bohrquez. Geoestadstica

160
140
120
100
80
60
40
20
0
0

10

15

20

25

La hiptesis de estacionariedad intrnseca

2 (h )
h

0 cuando h

1.4.8 Modelo del Seno Cardinal


Estacionariedad de segundo orden, vlido en R1 , R2 y R3.

(h; ) =
h
c0 + c s 1 arcsen
a

12

h =0

h >0

30

Martha Bohrquez. Geoestadstica

Este modelo admite correlaciones negativas que pueden ser causadas por la
periodicidad del proceso.
1.5

Grado de Continuidad

El grado de continuidad de un proceso espacial muestra que tan bien est


estructurado el proceso, es decir, que tan uniforme es. El que presente un
semivariograma con menor incremento cerca al origen y la estructura mas
precisa es el ms uniforme. La prediccin en un lugar no muestreado es ms
fcil y mas precisa si el proceso es uniforme. Cuando se incrementa la
irregularidad le falta estructura al proceso espacial y existe menos informacin
sobre Z() en los lugares vecinos de s. Para la misma silla y rango, el
semivariograma exponencial se eleva ms rpido que el esfrico. Se
encuentra mas estructura en un proceso con un semivariograma esfrico que
con un semivariograma exponencial.
Adems, la inferencia estadstica
depende en gran medida de la uniformidad del proceso y as de una correcta
modelacin del semivariograma. La mala especificacin de un semivariograma
gaussiano tiene un impacto negativo en la robustez de las predicciones
espaciales. Por ejemplo, un semivariograma con un efecto cuadrtico cerca al
origen (gaussiano, racional cuadrtico), muestra un grado de continuidad
mayor al de un semivariograma que presente una tendencia lineal cerca al
origen(esfrico, exponencial). El de mayor irregularidad es el modelo pepita
puro, que no tiene absolutamente ninguna estructura.

13

Martha Bohrquez. Geoestadstica

2.1

El mtodo Geoestadstico

Caractersticas del mtodo geoestadstico

Uno de los principales propsitos de los datos geoestadsticos es predecir el


atributo Z(s) en puntos no muestreados. El mtodo geoestadstico consiste de
los siguientes pasos:
Usando tcnicas exploratorias, conocimiento a priori del fenmeno, y/o
ambas, propone un modelo posible de media no estacionaria mas un
error estacionario o intrnseco de segundo orden, para Z(s).
Estima por mnimos cuadrados ordinarios, la funcin media que suaviza
los datos. Si la media es estacionaria, este paso no es necesario. Los
mtodos usados no toman en cuenta la correlacin espacial.
Si la media es estacionaria, se calcula el semivariograma emprico
usando los residuales del paso anterior de los datos originales. Es
posible analizar la anisotropa en mltiples direcciones.
Selecciona un modelo vlido de semivariograma (h; ) que sea
compatible con el semivariograma emprico.
Ajusta el modelo elegido para estimar sus parmetros.
Usando los parmetros estimados del semivariograma ajustado, se
vuelven a estimar los parmetros de la funcin media, tomando en
cuenta la correlacin espacial.
Se aplican iterativamente los pasos anteriores si es necesario.
Se predice el atributo Z en puntos no muestreados y se calculan las
correspondientes varianzas de los errores de prediccin.
Se determinan las ubicaciones ptimas para tomar las observaciones
adicionales y se repite todo el proceso si es necesario.
El semivariograma y/o covariograma del proceso espacial juega un papel
fundamental en el mtodo geoestadstico. Sin embargo, los semivariogramas
empricos no garantizan que las funciones lineales de los atributos Z(s) tienen
varianza positiva. As, se impone la condicin de negativo condicional (cnd)
para el semivariograma emprico y ste se puede ajustar a un modelo de
semivariograma paramtrico. As, la estimacin emprica del semivariograma
es en si misma una ciencia.
2.2

Estimacin del semivariograma

Recordando que el Variograma


se calcula (h) = Var [Z (s + h ) Z (s )].
estimador clsico de 2 (h) es un estimador del momento

14

El

2 (h) =

1
N ( h)

{Z (s ) Z (s )}

N (h)

Martha Bohrquez. Geoestadstica

donde
Y

N (h ) = {(si , s j ) : si s j = h; i = 1,..., n}

N (h)

es la cantidad de pares distintos en N(h). Note que

Z(s1)-Z(s3) es el mismo par Z(s3)-Z(s1). El estimador de momentos no requiere


estimacin de la media = E [Z (s )]. Sin embargo, se ha hecho implcitamente
el supuesto de que la media es constante, de otro modo, el proceso no es
estacionario. Si existe una fuerte tendencia en Z(s), es necesario eliminarla
antes de la estimacin del semivariograma.
Por ejemplo, estimar el
semivariograma con los residuos en lugar de los datos originales.
Este estimador trabaja con los datos en una cuadrcula regular. Si los datos no
estn igualmente espaciados, el nmero de pares que estn a una distancia h,
N(h), puede ser muy pequeo, posiblemente tan pequeo como N (h) = 1 .
Para datos desigualmente espaciados se crean intervalos de distancias y se
combinan todos los pares de puntos a una cierta tolerancia de h:

2 + (h ) = Promedio (Z (si ) Z (s j )) : i, j N (h ); h T (hl )


2

donde T Donde T (hl ) es una regin de tolerancia (intervalo de distancia)


alrededor de h : hl = h
Si el proceso es estacionario de segundo orden, existen ambos, tanto el
covariograma como el variograma, y se puede estimar cualquiera de ellos. El
estimador del covariograma est dado por:
C (h ) =

1
N (h )

{Z (s ) Z }{Z (s
i

N (h )

donde
Z =

Z )}

Z (s )
i

Sin embargo, este estimador C (h ) es sesgado para C(h) bajo estacionariedad


de segundo orden.
Estimar (h ) es mas conveniente ya que:
No requiere estimacin del promedio
Es insesgado bajo estacionariedad intrnseca
Lo afecta menos la tendencia
15

Cuando hay que eliminar tendencias de los datos mediante algunos


ajustes funcionales, la estimacin se debe hacer con los
semivariogramas y covariogramas de los residuos. En este caso los
semivariogramas tienen menos sesgo que los covariogramas.
Martha Bohrquez. Geoestadstica

Por lo tanto, si se va a estimar empricamente la estructura de dependencia del


proceso espacial se debe estimar (h ) y no C (h ) .
Pero, si existe tendencia en los datos, y esta no es eliminada, los dos son
sesgados y muy pobres.
2.3

Prediccin Espacial

Sea el campo aleatorio Z (s ) : s D R d donde se ha observado el atributo Z


en las ubicaciones s1 , s 2 , , s n y se desear predecir dicho atributo en una
ubicacin no observada, basndose en los valores obtenidos en las muestras
hechas. Las tcnicas de prediccin espacial son modalidades de una familia
de mtodos llamada Kriging. El nombre se debe al Ingeniero minero D.G.
Krige, quien desarroll en la dcada de los 50, mtodos empricos para
predecir caractersticas de una mina en alguna ubicacin de inters donde no
se conocan datos, usando las caractersticas conocidas en lugares cercanos
donde si haban sido tomados. Su mtodo original es conocido como Kriging
ordinario.
El Kriging aparece en muchas formas de acuerdo a si se conocen la media, la
distribucin de probabilidad de Z(s), si las predicciones son hechas para puntos
o reas y as sucesivamente.
Sin embargo, es importante recordar que el Kriging no es el nico mtodo de
prediccin espacial; existen mtodos determinsticos como distancia inversa,
interpolacin polinomial global, interpolacin polinomial local, triangulacin
lineal, funciones de base radial entre otros. La ventaja del kriging sobre los
mtodos determinsticos es la estimacin de la varianza del error de prediccin,
lo cual permite adems estimar intervalos de confianza para dicha prediccin
adems de que el kriging es un mtodo de estimacin que da el mejor
estimador lineal insesgado (cuando se cumplen todos los supuestos).
Inicialmente, el kriging fue desarrollado para aquellos casos donde hay
presencia de estacionariedad y posteriormente fue extendido para casos donde
se cumple la hiptesis intrnseca.

2.3.1 Generalidades sobre el kriging


La toma de muestras da la informacin de lo que ocurre en cada punto. Sin
embargo, no da informacin acerca de la relacin que pueda existir entre
16

dichos puntos. Se requiere de una forma precisa de estimar valores en puntos


intermedios o en el caso de bloques, por ejemplo, estimar el promedio sobre el
bloque. La precisin del estimador usado depende de varios factores:
El nmero de muestras tomadas
La calidad de la medicin en cada punto
Martha Bohrquez. Geoestadstica

Las ubicaciones de las muestras en la zona; si las muestras son


igualmente espaciadas se alcanza una mejor cobertura, dando mayor
informacin acerca de la zona que aquella que se obtendra de muestras
muy agrupadas en unos sectores y separadas en otros. Sin embargo, en
la prctica, debido a las caractersticas de las regiones de estudio,
muchas veces es preciso tomar muestras irregularmente espaciadas.
las distancias entre las muestras; para la prediccin es mas confiable
usar muestras vecinas que muestras distantes, esto es, la precisin
mejora cuando la cercana de las muestras aumenta, y se deteriora
cuando esta disminuye. La extrapolacin no es aconsejable.
La continuidad espacial de la variable o atributo en estudio; es ms fcil
estimar el valor de una variable bastante regular en una regin que una
que presenta grandes fluctuaciones.

2.3.2 Introduccin a la teora del kriging


Ejemplo 1
Supongamos que se tienen las mediciones Z(s1), Z(s2), Z(s3) y Z(s4), en los
puntos s1, s2, s3 y s4 respectivamente, y se requiere predecir el valor Z(s0). El
valor a predecir se ubica mas cerca de s2 que de cualquier otra ubicacin
donde se tenga medicin; por lo tanto, es lgico pensar que Z(s0) es mas
parecido a Z(s2) que a cualquiera de los otros tres valores medidos. De
acuerdo a lo anterior, se puede optar para la prediccin, por una media
ponderada de las cuatro mediciones, en la cual Z(s2) tiene mayor peso que
cualquier otra, seguida en su orden por Z(s4), Z(s3) y por ltimo Z(s1).
*s1

*s2
+s0
*s3

As,

*s4

)= Z(s )+ Z(s )+ Z(s )+ Z(s )


Z(s
0
1
1
2
2
3
3
4
4

17

Donde los i , i = 1, 2,3,4 son los factores de ponderacin o pesos tales que

2 > 4 > 3 > 1 y

i =1

= 1.

En general, para obtener una estimacin de Z(s0), se realiza una combinacin


lineal de los valores Z(si), i = 1 n :
Martha Bohrquez. Geoestadstica

Z ( s0 ) = i Z ( si )
i =1

Los parmetros i son los factores de ponderacin o coeficientes de


ponderacin y son calculados de acuerdo a los siguientes criterios:
Z ( s0 ) sea insesgado
Var ( Z ( s ) Z ( s )) sea mnima
0

Note que

Var ( Z ( s 0 ) Z ( s0 )) = E ( Z ( s 0 ) Z ( s0 )) 2 E 2 ( Z ( s 0 ) Z ( s0 ))
2

= E ( Z ( s 0 ) Z ( s0 )) 2 E ( Z ( s 0 ) Z ( s0 )) = E ( Z ( s 0 ) Z ( s0 )) 2
Ahora
n
n

n
E ( Z ( s 0 ) Z ( s0 )) 2 = E i Z ( si ) j Z ( s j ) 2 i Z ( si )Z ( s0 ) + Z 2 ( s0 )
i =1
j =1

i =1

= i j E Z ( si ) Z ( s j ) 2 i E [ Z ( si ) Z ( s0 ) ] + E Z 2 ( s0 )
i =1 j =1

i =1

Si ha estimado el semivariograma o bien se conoce la funcin de covarianza,


tambin se tendrn los valores

E Z ( si ) Z ( s j ) , E [ Z ( si ) Z ( s0 ) ] y E Z 2 ( s0 )
Por lo tanto, se encontrarn los i minimizando esta varianza. Del respectivo
proceso de minimizacin se obtendr un sistema de ecuaciones, que cambiar
de acuerdo a las hiptesis que se tengan sobre la media y la covarianza del
proceso, y la distribucin de la variable en estudio. En la prxima seccin se
mencionarn algunos de estos casos.

18

2.3.3 Clculo de los factores de ponderacin para algunos casos


Kriging Simple
El kriging simple asume el conocimiento tanto de la media como de la
covarianza del proceso. Por supuesto, es poco prctico ya que en general
Martha Bohrquez. Geoestadstica

estos dos parmetros son desconocidos y es preciso estimarlos a partir de los


datos de la muestra.
Definamos la variable
Y (s) = Z (s)

donde

es la media de la variable en la regin de estudio y por lo tanto


E Y ( s ) = 0 .

Entonces si ahora encontramos la prediccin de Y ( s0 ) , tendremos


n

Y ( s0 ) = iY ( si ) .
i =1

Ahora para encontrar los factores de ponderacin vamos a minimizar el error


de prediccin Y ( s0 ) Y ( s0 ) . Como Y ( s0 ) es desconocido, se minimizar el

error cuadrtico medio de prediccin; esto es, hay que minimizar

E Y ( s0 ) Y ( s0 )

Que segn vimos en la seccin anterior, se puede escribir como


n

E (Y ( s 0 ) Y ( s0 )) 2 = i j E Y ( si ) Z ( s j ) 2 i E [Y ( si ) Y ( s0 ) ] + E Y 2 ( s0 )
i =1 j =1

i =1

= i j Cov si s j 2 iCov [ si s0 ] + Cov(0)


i =1 j =1

i =1

Ahora, se aplica el proceso clsico de minimizacin derivando parcialmente


respecto a cada uno de los parmetros i e igualando a cero estas derivadas,
con lo que las ecuaciones quedan:

19

n
2

E Y ( s0 ) Y ( s0 ) = 2 j Cov si s j 2Cov ( si s0 ) = 0
i
j =1

i = 1 n

con lo cual queda definido un sistema de n ecuaciones con n incgnitas. Para j


( j = 1 n ) arbitraria la ecuacin es:

Martha Bohrquez. Geoestadstica

2 j Cov si s j 2Cov ( si s0 ) = 0
j =1

Cov s
j =1

s j = Cov ( si s0 )

Que es un sistema con nica solucin en virtud de la matriz de coeficientes la


cual es definida positiva.
As para predecir la variable original Z
n

Z ( s0 ) = + i ( Z i )
i =1

y la varianza del error de prediccin queda

Var Z ( s0 ) Z ( s0 ) = Var ( Z ( si ) ) i Cov ( si s0 )


i =1

De donde podemos concluir que la varianza del error de prediccin es menor a


la varianza de la variable en estudio, lo cual es consecuencia del conocimiento
de los parmetros del proceso.
Kriging Ordinario
El kriging ordinario se usa cuando la variable es estacionaria con covarianza
conocida y media desconocida. Aunque el proceso es similar al del kriging
simple, no podemos centrar la variable, ya que no conocemos , as que es
necesario trabajar directamente con la variable en estudio Z. Nuevamente la
prediccin es
n

Z ( s0 ) = i Z ( si )
i =1

Al no conocer la media es necesario garantizar la propiedad de insesgamiento:

20

( )

E Z = Z

De esta forma,

E i Z ( si ) = E ( Z ) =
i =1

lo cual es equivalente a
Martha Bohrquez. Geoestadstica
n

E [ Z ( s )] = =
i =1

i =1

Por tanto, es indispensable que se cumpla la condicin de que


n

i =1

=1

para obtener un estimador insesgado. Se mantiene igual la segunda condicin


que es la de mnima varianza; partamos de la expresin ya deducida de la
varianza
n

E ( Z ( s 0 ) Z ( s0 )) 2 = i j E Z ( si ) Z ( s j ) 2 i E [ Z ( si ) Z ( s0 ) ] + E Z 2 ( s0 )
i =1 j =1

i =1

Donde bajo las nuevas condiciones se tiene:

E Z ( si ) Z ( s j ) = Cov ( si s j ) + 2
E Z 2 ( s0 ) = Cov(0) + 2 = 2 + 2
Sustituyendo en la varianza queda
n
n
n
n
n n

E ( Z ( s 0 ) Z ( s0 )) 2 = i j Cov ( si s j ) 2 iCov ( si s j ) + C ( 0 ) + 2 i j 2 i + 1
i =1 j =1
i =1
i =1
i =1 j =1

pero
n
n n
n

i j 2 i + 1 = i 1 = 0
i =1

i =1 j =1
i =1
2

por la propiedad de insesgamiento.


As que la expresin a minimizar es
21

Cov ( s s ) 2 Cov ( s s ) + C ( 0 )
n

i =1 j =1

i =1

bajo la restriccin

( )

E Z = Z
Se utiliza para estos casos el mtodo de los multiplicadores de Lagrange:
Martha Bohrquez. Geoestadstica

( i , )
i
( i , )
i

i =1

= iCov ( si s j ) Cov ( si s j )
n

i =1

Cov ( s s ) Cov ( s s ) = 0
n

i =1
n

Cov ( s
i =1

= iCov ( si s j ) Cov ( si s j )
n

( i , )

s j ) = Cov ( si s j )

= i 1
i =1

1 = 0
i =1
n

i =1

=1

Dando como resultado el sistema de n + 1 ecuaciones del kriging ordinario:

Cov ( s
n

i =1

s j ) = Cov ( si s j )
n

i =1

=1

a partir de las cuales se encuentran los valores de los factores de ponderacin


para llevar a cabo la prediccin.
Por ltimo, la varianza del error de prediccin para este caso es

Var Z ( s0 ) Z ( s0 ) = Var ( Z ( si ) ) iCov ( si s0 ) +


i =1

que tal como es de esperarse es mayor que la del kriging simple, debido al
desconocimiento de la media de la variable en estudio.
Kriging Ordinario para variables intrnsecas
22

Este es un caso ms general, en el cual la varianza no existe y las condiciones


impuestas sobre la variable regionalizada son:
E Z ( s + h ) Z ( s ) = 0
1
( h ) = Var Z ( s + h ) Z ( s )
2
Nuevamente, hay que imponer las siguientes restricciones

Martha Bohrquez. Geoestadstica

Estimacin lineal
n

Z ( s0 ) = i Z ( si )
i =1

Insesgamiento

( )

E Z = Z
Mnima varianza
Var Z ( s0 ) Z ( s0 ) = E Z ( s0 ) Z ( s0 ) es mnima
2

Aplicando nuevamente el mtodo de los multiplicadores de Lagrange, se


obtienen los factores de ponderacin y la varianza del error de prediccin es

Var Z ( s0 ) Z ( s0 ) = i ( si s0 ) +
i =1

Este es el caso ms general ya que es vlido tanto para variables estacionarias


como para variables intrnsecas.
En general, el kriging es ptimo cuando la variable en estudio proviene de una
poblacin con distribucin normal. Si esto no se cumple, aun cuando se puede
aplicar ya no es ptimo puesto que deja de ser insesgado. La alternativa con
cual se debe trabajar es aplicarle a la variable una transformacin que la lleve a
una normal y a partir de la nueva variable transformada estimar el
semivariograma y aplicarle las ecuaciones del kriging. Al final, el anlisis
requiere llevar la variable a su escala original. Un caso que surge bastante en
casos prcticos es el de la distribucin log-normal. Por otro lado, si la variable
en estudio muestra alguna tendencia en una direccin especfica, es
indispensable, determinar la forma de esta tendencia y llevar a cabo el
respectivo suavizamiento antes de estimar el semivariograma.
23

Martha Bohrquez. Geoestadstica

2.3.4 Tipos de Kriging


En la siguiente tabla se muestra una lista de las variantes de los mtodos de
Kriging.

Caracteristicas
Tamao del objetivo

Mtodo
Kriging puntual
Kriging en Bloques

Puntos
Area

Se conoce

es conocida
Kriging Simple
es desconocida pero
constante
= E [Z (s )] = X , conocido

Kriging Ordinario
Kriging Universal

Distribucin
Z(s) N
lnZ(s) N

Kriging
Log-normal Kriging
Kriging
Transgaussiano

(Z (s )) N

Z(s)
es
una
variable
Kriging Indicador
indicador
Z(s) N con valores atpicos
Kriging robusto
aislados.
Kriging
Distribucin desconocida
Mediana Polish
(s ) es
un
proceso
Kriging Bayesiano
aleatorio
Nmero de Atributos
Un nico atributo
Mltiples atributos
Linealidad

24

Kriging
Cokriging

Predictor lineal en Z(s)


Kriging
Predictor lineal en funciones
Kriging Disyuntivo
de Z(s)

Martha Bohrquez. Geoestadstica

2.3.5 Validacin Cruzada


El mtodo mas usado para verificar la calidad de los resultados as como la
validez de los supuestos hechos para la prediccin es el de validacin cruzada.
Consiste en extraer de la muestra los n datos pero uno a la vez, para con los
n 1 restantes predecir el valor de la variable en la ubicacin extrada; as, se
elimina la fila correspondiente a Z ( si ) , se encuentra Z ( si ) con los n 1 datos
restantes, se calcula el error de prediccin para cada una de las ubicaciones:
Z ( si ) Z ( si )

Tambin se puede llevar a cabo un diagrama de dispersin de los datos


observados contra cada una de sus respectivas predicciones; esto es, graficar
todas las parejas Z ( si ) , Z ( si ) ; si las predicciones son aceptables esta nube

de puntos debera tender a una lnea recta de pendiente 45.

25

S-ar putea să vă placă și