Documente Academic
Documente Profesional
Documente Cultură
PTS
SG
Interpolation spatiale
Pierre Bosser
(Pierre.Bosser@ensg.eu)
EN
Ecole
Nationale des Sciences Geographiques
EN
SG
/D
PTS
/D
PTS
INTERPOLATION SPATIALE
1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Linterpolation d
eterministe globale
10
2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
SG
15
EN
3.2.1
3.2.2
Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.3
Methode dAkima . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3.2
Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24
2011-2012
INTERPOLATION SPATIALE
3.5.2
Spline dinterpolation . . . . . . . . . . . . . . . . . . . . . . . 27
3.5.3
/D
PTS
3.5.1
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4 Linterpolation stochastique
34
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.2
Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
. . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.1
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.2
Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3
Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2.4
4.2.5
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3.2
Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42
SG
4.3.1
4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47
4.4.2
Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.4.3
Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50
4.4.4
EN
4.4.1
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 Conclusion
Pierre Bosser
53
2011-2012
1
1.1
Introduction
Objectifs du cours
1 Introduction
/D
PTS
INTERPOLATION SPATIALE
EN
SG
Lors de ce cours, nous allons donc etudier les methodes permettant lestimation
et linterpolation de donnees georeferencees. Ce cours sera une introduction aux
differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes
plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages
suivants :
Akima, H., A method of bivariate interpolation and smooth surface fitting for
values given at irregularly distributed points , OT Report 75-70, U.S. Department
of Commerce.
Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes
deterministes et geostatistiques , Hermes, 2000.
Baillargeon, S., Le krigeage : revue de la theorie et application a` linterpolation spatiale de donnees de precipitation , Memoire de M. Sc., Universite
LAVAL, 2005.
Verdun, J., Methodes destimation et dinterpolation spatiales , Cours donne
aux IT2, ENSG, 2006.
Pierre Bosser
2011-2012
INTERPOLATION SPATIALE
1.2
1 Introduction
Notations
/D
PTS
1.3
Caract
eristiques des m
ethodes dinterpolation
SG
Dans le cas general, la variable regionalisee ne peut etre representee par une fonction
mathematique explicite. Cependant, elle presente une structuration spatiale bien
definie, avec une correlation des valeurs prises en deux sites proches. Ceci rend
possible la prevision dune valeur inconnue `a partir dobservations. On parle ainsi
dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque
le site inconnu est situe hors des limites du domaine geographique engendre par
lechantillonnage des sites dobservation.
EN
On sinteresse dans de ce cours `a ces methodes de prevision. Elles se divisent usuellement en deux groupes, selon les mod`eles mathematiques sur lesquels elles reposent :
M
ethodes d
eterministes : elles reposent sur des proprietes purement mathematiques, generalement geometriques, sans tenir compte du phenom`ene physique qui
nous interesse.
M
ethodes stochastiques : elles font appel `a des mod`eles probabilistes et decoulent de lanalyse statistique des donnees considerees. On parle alors de techniques
g
eostatistiques.
Pierre Bosser
2011-2012
INTERPOLATION SPATIALE
1 Introduction
Modle dterministe
Modle probabiliste
Phnomne naturel
Variable rgionalise
Fonction alatoire
fz(s)/ s 2 Dg
fZ(s)/ s 2 Dg
Valeurs rgionalises
Variables alatoires
Interpolation spatiale
dterministe
Interpolation spatiale
stochastique
/D
PTS
Ralit Physique
On differencie egalement ces methodes selon quelles soient globales ou locales. Une
methode globale consiste `a calculer la moyenne de la variable generalisee sur le
champ `a partir de lensemble des observations disponibles ; une methode locale
realise une estimation de cette moyenne sur une partie plus reduite du champ, voire
en un site ponctuel.
SG
Une methode exacte conserve les valeurs des echantillons originaux, contrairement
`a une methode approch
ee.
EN
Pierre Bosser
2011-2012
INTERPOLATION SPATIALE
1 Introduction
S3
/D
PTS
S6
S7
S0
S2
S5
S1
FIG 2 - Effet decran : le site S7 peut potentiellement masquer le site S6 ; linterpolateur va donner moins dimportance
au site masque, S6 , par rapport au site masquant S7 .
1.4
Repr
esentations
SG
` partir dun champ dont on connait certaines valeurs prises par la variable regionaliA
see, on veut deduire la representation densemble de cette variable sur le champ.
Cette representation peut se faire sous la forme :
de lignes de niveau,
de niveaux de couleur,
dune perspective 3D, etc.
On retrouve sur les figures suivantes differents modes de representation du champ
interpole.
240
220
200
180
160
140
EN
120
140
160
180
200
220
240
260
280
Pierre Bosser
2011-2012
INTERPOLATION SPATIALE
1 Introduction
240
240
220
650
200
200
180
/D
PTS
700
220
160
600
180
160
550
140
140
500
120
120
140
160
180
200
220
240
260
280
140
160
180
200
220
240
260
280
800
800
700
700
600
240
240
600
220
500
220
500
200
400
140
180
180
140
160
160
200
400
180
160
160
180
200
140
220
200
140
220
240
120
260
240
120
260
280
280
X
SG
700
650
800
600
700
240
600
220
500
550
200
400
180
140
500
160
160
180
200
140
220
240
EN
260
120
280
Pierre Bosser
2011-2012
INTERPOLATION SPATIALE
1.5
1 Introduction
Applications
EN
SG
/D
PTS
Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons
par exemple :
En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,
de pluviometrie.
En geodesie : mesures du champ de gravite, retards tropospheriques et ionospheriques, hauteur du geode.
En geologie : teneur du sol en elements mineraux.
Les figures suivantes presentent differentes visualisations dinterpolation spatiale
dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique
GPS, anomalie de gravite).
Pierre Bosser
2011-2012
1 Introduction
/D
PTS
INTERPOLATION SPATIALE
EN
SG
Pierre Bosser
2011-2012
2
2.1
/D
PTS
INTERPOLATION SPATIALE
Linterpolation d
eterministe globale
D
efinition
Lestimation globale vise `a estimer la moyenne arithmetique dune ensemble dobservations (valeurs de la variable regionalisee) dans un domaine geographique (le
champ). Cette estimation nest pas triviale puisque les observations ne sont pas
forcement representatives et peuvent presenter une densite differentes en fonction
de la zone du champ, donnant alors une influence trop importante a` certaines parties
de la zone etudiee.
2.2
SG
Deux solutions sont alors envisageables. La premi`ere consiste en une selection des
donnees observees. Le probl`eme reside alors dans le choix des observations a` prendre
en compte. Aucun crit`ere objectif ne peut permettre detre certain ni de la qualite ni de la pertinence des observations choisies. Une seconde solution consiste a`
ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici
nous interesser `a des methodes globales basees sur cette solution.
Polygone de Thiessen
EN
Pour tous les points dobservation du champs, on definit un polygone dinfluence tel
que chaque point du polygone est plus proche du point dobservation que de tout
autre site :
~s Pi , ~sj D r Pi , k~si ~sk 6 k~sj ~sk
Pierre Bosser
10
2011-2012
INTERPOLATION SPATIALE
S3
/D
PTS
S6
S0
S2
S5
S1
Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite
surface, les donnees isolee un polygone de grande surface. Notons que le decoupage
de Thiessen depend uniquement de la configuration geometrique et non pas des
valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines
directions de lespace : il faut ainsi limiter la partition aux fronti`eres de D, ou fixer
une distance dinfluence limite.
S3
S6
S0
S2
S5
SG
S1
Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponderation des observations pour le calcul de la moyenne de la variable regionalisee sur
le champ detude :
EN
z(D) =
n
X
|Pi |
z~si
i=1 |D|
(1)
O`
u |Pi | est laire du polygone Pi associee au site ~si et |D| laire du champ :
|D| =
n
X
|Pi |
(2)
i=1
Par construction, les zones `a observations denses sont les zones a` polygones de
Thiessen de surface moindre : linfluence de ces zones est donc limitee.
Pierre Bosser
11
2011-2012
INTERPOLATION SPATIALE
200
150
100
140
160
180
/D
PTS
250
200
220
240
260
280
2.3
M
ethode des cellules
SG
EN
n
N
X
1 X
~s(i )
z(D) =
N =1 i =1
(3)
O`
u N est le nombre de cellules de decoupage du domaine D contenant au moins un
site dobservation, ~s(i ) les sites dobservation localises dans la cellule .
En pratique, on rep`ete lalgorithme plusieurs fois (5 `a 10) avec differents decoupages
dans le but dobtenir une estimation globale independante du reseau.
Pierre Bosser
12
2011-2012
INTERPOLATION SPATIALE
250
200
150
100
140
160
180
/D
PTS
Notons que si la taille des cellules est trop petite, chacune contiendra au plus un
site dobservation et les donnees auront toutes le meme poids. Si la taille est trop
grande, toutes les observations appartiendront `a la meme cellule et auront donc
le meme poids. Dans ces 2 cas, lestimation globale reviendra alors a` calculer la
moyenne arithmetique de toutes les observations.
200
220
240
260
280
2.4
SG
Conclusion
Les methodes destimation globale presentees ici reposent uniquement sur la configuration geometrique des donnees. Elles permettent donc de quantifier la quantite
totale ou moyenne dun ensemble dobservations de repartition variable dans lespace.
EN
Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).
Mis a` part un cas (decoupage en cellules de taille minimale), on observe que les
resultats obtenus sont dans lensemble relativement homog`ene.
Pierre Bosser
13
2011-2012
INTERPOLATION SPATIALE
z(D)
620.6693
609.9030
615.4803
618.9132
619.6649
614.0666
/D
PTS
Interpolation
Polygones de Thiessen
Cellules, pas de 1 m
Cellules, pas de 10 m
Cellules, pas de 20 m
Cellules, pas de 50 m
Cellules, pas de 100 m
EN
SG
Pierre Bosser
14
2011-2012
/D
PTS
INTERPOLATION SPATIALE
Linterpolation d
eterministe locale
Nous nous interessons ici aux methodes deterministes pour lestimation locale et
ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee a`
partir de combinaisons lineaires des observations en tenant compte de leur disposition les unes par rapport aux autres mais aussi de la distance entre le secteur a`
estimer et les points de donnees.
3.1
Polygones de Thiessen
SG
Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas
de lestimation globale. Linterpolation par la methode de Thiessen consiste a` affecter a` lensemble des points dun polygone donne la valeur de la variable regionalisee
correspondante (on parle aussi de plus proche voisin). On obtient alors une surface discontinue ; ces discontinuites nont rien `a voir avec de possibles discontinuites
reelles, mais sont simplement liees `a la configuration geometrique des observations.
On trouve dans la litterature differentes methodes pour palier ce probl`eme de discontinuites (methode de Sibson par exemple basee sur linterpolation par combinaison
lineaire des valeurs aux sommets voisins).
S3
S6
EN
S?
S0
S2
S5
S1
Pierre Bosser
15
2011-2012
INTERPOLATION SPATIALE
800
700
/D
PTS
Sur la figure suivante, on represente un exemple dinterpolation par plus proche voisin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses
discontinuites.
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
3.2.1
Interpolation `
a partir dune triangulation
D
efinition
SG
3.2
EN
16
2011-2012
INTERPOLATION SPATIALE
/D
PTS
S3
S?
S2
S0
S5
S1
Il existe plusieurs methodes pour linterpolation de donnees `a partir dune triangulation. Ici, deux dentres elles seront exposees.
3.2.2
Interpolation lin
eaire
On consid`ere le triangle (~s1 , ~s2 , ~s3 ) contenant le point dinteret ~s. La valeur recherchee de la variable regionalisee secrit sous la forme :
z(~s) = z(x, y) = x + y +
SG
S3
S?
S2
S1
EN
La solution est determinee `a partir dune combinaison lineaire des valeur observees
au sommet du triangle en resolvant le syst`eme :
O`
u zi = z(~si ).
Pierre Bosser
x1 + y1 + = z1
x2 + y2 + = z2
x3 + y3 + = z3
17
2011-2012
INTERPOLATION SPATIALE
z1
z2
z3
/D
PTS
O`
u |~s1 , ~s2 , ~s3 | represente laire du triangle forme par les vecteurs (~s1 , ~s2 , ~s3 ) : la
solution devient donc la somme ponderee des aires des triangles formes par les 3
sommets et le point dinteret.
S3
jS2,S,S3j jS1,S,S3j
S2
jS1,S,S2j
S3
jS2,S,S3j
S1
S2
jS1,S,S3j
jS1,S,S2j
S1
SG
Chaque site dobservation recoit donc un poids egal `a la proportion de surface occupee par le triangle qui lui est oppose : plus le point recherche est proche dun
site dobservation plus la valeur de la variable regionalisee est proche de la valeur
observee en ce site.
EN
Pierre Bosser
18
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
3.2.3
SG
EN
La methode dAkima est une autre methode dinterpolation `a partir dune triangulation. On ajuste cette fois-ci `a chaque triangle une surface dont lequation est un
polynome de degre 5 :
z(~s) = z(x, y) =
5 5j
X
X
jk xj y k
j=0 k=0
Pierre Bosser
19
2011-2012
INTERPOLATION SPATIALE
z(~s3 )
/D
PTS
z(~s1 ),
6 autres conditions sont obtenues `a partir des derivees premi`eres aux sommets de
chaque triangle :
z
(~s1 )
y
z
(~s2 )
y
z
(~s3 )
y
z
(~s1 ),
x
z
(~s2 ),
x
z
(~s3 ),
x
9 autres conditions sont obtenues `a partir des derivees secondes aux sommets de
chaque triangle :
2z
2z
(~
s
)
,
(~s1 )
1
y 2
xy
2z
2z
(~
s
)
,
(~s2 )
2
y 2
xy
2z
2z
(~
s
)
,
(~s3 )
3
y 2
xy
2z
(~s1 ),
x2
2z
(~s2 ),
x2
2z
(~s3 ),
x2
SG
5z
(~s1 ) = 0,
nt4
n1
S3
t1
EN
S?
S2
5z
(~s3 ) = 0
nt4
n2
t2
S1
t3
n3
Pierre Bosser
20
2011-2012
INTERPOLATION SPATIALE
/D
PTS
La derni`ere condition assure donc la continuite et la derivabilite de la surface obtenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses
derivees partielles premi`eres et secondes selon x et y suffisent donc a` determiner les
valeurs de la fonction et de ses derivees selon n et t aux sommets.
Ainsi, En limite de 2 triangles, la section de la surface est un polynome de degre
5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees
aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les
derivees premi`ere selon n et seconde selon n puis t aux sommets permettent decrire
la derivee premi`ere selon n sous forme dun unique polynome de degre 3, en t : on
a donc egalement la derivabilite.
Pour calculer les derivees partielles en chaque sommet du triangle, Akima propose
lutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.
Les derivees premi`eres sont obtenues en estimant le plan moyen (par rapport aux
differents sites voisins choisis) passant par le sommet dinteret. Les derivees secondes sont calculees en repetant cette operation, mais cette fois-ci en considerant
les derivees premi`eres au lieu des valeurs de la variable regionalisee.
Bien quen apparence complexe, limplementation de cette methode est relativement
directe (un formulaire complet existe).
EN
SG
Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permet
lestimation dune surface continue et derivable. Il existe des variantes permettant
une extrapolation au del`a de lenveloppe convexe formee par lensemble des triangles.
Pierre Bosser
21
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 19 - Interpolation par la methode dAkima : application sur un champ dobservations - vue en perspective. On
observe que la surface obtenue est beaucoup plus esthetique
que celle issus dune interpolation lineaire.
M
ethodes barycentriques
SG
3.3
Netant pas limitees au voisinage direct du point dinteret, les methodes barycentriques presentent lavantage de prendre en compte plus de donnees du champ dobservation. Un poids plus important est affecte aux sites les plus proches, un poids
moindre aux sites plus eloignes.
3.3.1
EN
z(~si )
si ~sk
i=1 k~
z(~s) = X
n
1
si ~sk
i=1 k~
Pierre Bosser
22
2011-2012
INTERPOLATION SPATIALE
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 20 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - vue en
perspective.
SG
Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs
interpolees sont limitees par les valeurs minimale et maximale du champ dobservation, la ponderation etant positive.
EN
Elle presente cependant quelques inconvenients. Elle est indifferente a` la configuration geometrique des observations, seule la distance compte. Elle tend a` surponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur
presentent des structures en forme dil de buf autour des sites dobservation
en raison de linfluence du site le plus proche. Plus la puissance de la distance est
elevee, plus cet est important.
Pierre Bosser
23
2011-2012
INTERPOLATION SPATIALE
220
200
180
160
140
120
140
160
180
/D
PTS
240
200
220
240
260
280
FIG 21 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - representation par courbes de niveau, vue de dessus. On distingue
nettement leffet doil de buf lie `a lutilisation de cette
methode.
Interpolation bilin
eaire
SG
3.3.2
EN
z2
z1
Si+1,j+1
Si,j+1
Si,j
a1
b2
S
b1
Si+1,j
a2
Pierre Bosser
24
2011-2012
INTERPOLATION SPATIALE
Avec :
b1 zi+1,j+1 + b2 zi,j+1
b1 + b2
b1 zi+1,j + b2 zi,j
=
b1 + b2
z1 =
z2
a1 z1 + a2 z2
a1 + a2
/D
PTS
z (~s) =
Comme nous lavons dit, cette methode necessite un echantillonnage regulier des
sites dobservation, ce qui la rend inutilisable dans la majorite des cas.
3.4
On cherche `a ajuster par moindre-carre une surface polynomiale aux valeurs observees. Cette surface se presente sous la forme :
z(~s) = z(x, y) =
p X
pi
X
ij xi y j
i=0 j=0
EN
SG
O`
u p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par
P
minimisation de la quantite ni=1 [
z (~si ) z(~si )]2 par moindre-carre par exemple. Il
faut alors que le degre du polynome verifie 21 (p + 1)(p + 2) n. Linversion peut
secrire sous la forme matricielle suivante :
0,0
.
p 0
. . . x1 y1
..
..
...
.
0,p
.
..
. . . xpn yn0
p,0
z1
..
.
zn
On represente sur les figures suivantes, linterpolation par des surfaces de tendance
dordre respectif 2, 3 et 5.
Pierre Bosser
25
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
800
700
600
500
400
140
SG
240
220
200
180
160
160
EN
180
200
140
220
240
120
260
280
X
Pierre Bosser
26
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
SG
Les test statistiques concernant la significativite des resultats sont a` utiliser avec
prudence car ils reposent sur une hypoth`ese dindependance des valeurs, ce qui est
rarement verifie dans le contexte spatial.
3.5
Les splines
3.5.1
G
en
eralit
es
3.5.2
EN
Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous
certaines contraintes dajustement. Dans notre contexte, il existe deux categories
de fonctions de splines : les splines dinterpolation qui passent exactement par les
points dobservation et les splines de lissage qui passent `a proximite.
Spline dinterpolation
On desire obtenir une fonction qui soit la plus lisse possible tout en restituant
les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(~s))
Pierre Bosser
27
2011-2012
INTERPOLATION SPATIALE
ZZ
/D
PTS
represente la surface par une plaque mince et flexible que lon contraint a` passer par
chaque site. Elle doit ainsi minimiser lenergie de flexion :
2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2
On peut montrer que la fonction spline solution secrit alors sous la forme :
z(~s) = z(x, y) = a0 + a1 x + a2 y +
n
X
bi K (~s ~si )
i=1
Avec :
a0 + a1 xi + a2 yi +
n
P
j=1
bj = 0,
n
P
j=1
n
P
j=1,j6=i
bj xj = 0,
n
P
j=1
bj yj = 0
. . . K1,n
a
0
..
a
...
.
1
a
...
0
2
b
...
1
1
..
. . . xn .
SG
1 x1 y1
0
.
.
..
..
..
..
.
.
1 xn yn Kn,1
0 0
0
1
0 0
0
x1
0 0 0
y1
...
yn
bn
z
1
..
.
zn
0
0
0
EN
Pierre Bosser
28
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 26 - Interpolation par spline dinterpolation : application sur un champ dobservations - vue en perspective.
3.5.3
n
X
i=1
SG
Il peut etre judicieux dans certaines situations (mesures presentant une incertitude
importante) de chercher une surface qui sapproche au mieux des observations tout
en restant la plus lisse possible. Dans R2 , on traduit ces conditions en cherchant a`
minimiser la fonction qui minimise :
[
z (~si ) z (~si )]2 +
ZZ
2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2
O`
u est un param`etre strictement positif et fixe a priori.
EN
On peut montrer que la solution se presente alors sous la forme de la solution obtenue
dans le cas des splines dinterpolation :
z(~s) = z(x, y) = a0 + a1 x + a2 y +
Avec :
n
X
bi K(~s ~si )
i=1
Pierre Bosser
29
2011-2012
INTERPOLATION SPATIALE
a0 + a1 xi + a2 yi + bi +
n
P
j=1
bj = 0,
n
P
j=1
/D
PTS
j=1,j6=i
n
P
bj yj
j=1
bj xj = 0,
=0
1 x1 y1
..
..
..
..
.
.
.
.
1 xn yn Kn,1
0 0
0
1
0 0
0
x1
0 0 0
y1
. . . K1,n
..
..
.
.
...
...
1
. . . xn
. . . yn
a0
a1
a2
b1
..
.
bn
z
1
..
.
zn
0
0
0
800
600
500
400
140
SG
700
240
220
200
180
160
160
180
200
140
220
240
120
260
280
EN
FIG 27 - Interpolation par spline de lissage - = 103 : application sur un champ dobservations - vue en perspective.
Pierre Bosser
30
2011-2012
800
700
/D
PTS
INTERPOLATION SPATIALE
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 28 - Interpolation par spline de lissage - = 106 : application sur un champ dobservations - vue en perspective.
La surface obtenue tend vers un plan.
3.6
SG
Conclusion
EN
Pierre Bosser
31
2011-2012
INTERPOLATION SPATIALE
Interpolation Exacte
oui
oui
Effet decran
total
total
Akima
Inverse des distances
oui
oui
total
faible
non
oui
non
faible
partiel
faible
Surface de tendance
Spline dinterpolation
Spline de lissage
Limite(s)
Discontinuites
Aspect
pyramidal
Implementation
Effet
il-de-buf
Peu robuste
/D
PTS
Interpolation
Polygones de Thiessen
Lineaire
FIG 29 - Quelques caracteristiques des methodes dinterpolation. Si une observation est masquee par une autre
observation par rapport au site `a estimer, elle peut recevoir un poids nul (ecran total), peu eleve (ecran partiel) ou
modere (ecran faible).
Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantillon test (ou Jackknife ou bootstrap). Cette technique consiste a` partager les observations en deux ensembles : un ensemble permettant la determination du mod`ele,
un second permettant le test de ce mod`ele. On effectue ainsi une sorte de validation
croisee.
SG
On est cependant incapable de dire laquelle de ces methodes est la plus proche de
la verite, leur reussite etant largement dependante du contexte : une methode peut
fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en
fait impossible de dire quelle methode fournit globalement les meilleurs resultats.
Aucune methode deterministe ne parait universellement meilleure.
EN
` titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees
A
pour les differentes methodes presentees en un point quelconque de lespace. Si une
majorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne
peut pas vraiment conclure quant `a la valeur exacte de laltitude du point estimee.
Pierre Bosser
32
2011-2012
INTERPOLATION SPATIALE
/D
PTS
Interpolation
z (~s)
Thiessen
680.0000
Lineaire
674.3876
Methode dAkima
675.8825
2
Inverse des distances (d )
660.6881
Surface de tendance dordre 2 647.6674
Surface de tendance dordre 3 654.2670
Surface de tendance dordre 5 672.3207
Spline dinterpolation
674.7240
Spline de lissage ( = 103 )
668.2837
6
Spline de lissage ( = 10 )
630.6910
EN
SG
Notons enfin une limite importante des methodes ici presentees : celles-ci sappliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la
variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais
pas necessairement precise. Nous allons voir par la suite des methodes permettant
la prise en compte dune eventuelle structuration spatiale en faisant appel a` des
mod`eles probabilistes : les methodes stochastiques.
Pierre Bosser
33
2011-2012
4 Linterpolation stochastique
/D
PTS
INTERPOLATION SPATIALE
Linterpolation stochastique
SG
4.1.1
Notion de fonction al
eatoire
EN
4.1
D
efinition
Le concept de fonction al
eatoire fournit des outils permettant danalyser le caract`ere a` la fois incertain et structure dun phenom`ene, permettant ulterieurement
destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire
permet de prendre en compte le fait que la variable regionalisee peut prendre des
valeurs tr`es erratiques (inconstantes, ne suivent pas de mod`ele, difficiles a` predire) et
que ces valeurs ne sont par vraiment independantes mais structurees dans lespace.
Pierre Bosser
34
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
/D
PTS
On rappelle que z(~s) represente la valeur prise par la variable regionalisee z au site
~s D. On linterpr`ete comme une realisation dune variable aleatoire Z (~s) definie
en ~s. On appelle alors fonction aleatoire (aussi appelee processus al
eatoire ou
processus stochastique) la famille des variables aleatoires {Z (~s) /~s D}.
Chaque valeur z(~s) de la variable regionalisee z est donc interpretee comme un
realisation de la variable aleatoire Z(~s) definie en ~s. La fonction aleatoire represente
lensemble des variables aleatoires qui interpr`ete la variable regionalisee. Les differentes variables aleatoires ne sont pas independantes : une correlation existe et permet
de decrire la structure de la variable regionalisee.
La variable regionalisee constitue donc une realisation de la fonction aleatoire.
4.1.2
Moments
Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi
spatiale qui correspond `a la donnee de toutes les lois de probabilite de tous les
vecteurs aleatoires {Z(~s1 ), ...Z(~sn )} que lon peut extraire de la fonction aleatoire
Z(~s). Pratiquement, en raison de la complexite de la determination de loi spatiale
enti`ere, on limite la description de la loi spatiale `a ses deux premiers moments. Le but
est alors de retrouver les caracteristiques de la loi `a partir de la seule connaissance
de ces 2 moments.
SG
EN
Pierre Bosser
35
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
/D
PTS
Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en
~s1 et ~s2 .
On appelle variance (ou variance a priori), la covariance entre la variable aleatoire
Z (~s1 ) et elle-meme :
var [Z (~s1 )] = cov [Z (~s1 ) , Z (~s1 )]
1
var [Z (~s1 ) Z (~s2 )]
2
SG
Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre
les sites ~s1 et ~s2 . On verra par la suite que cette quantite est un outil essentiel de la
geostatistique, en particulier du krigeage.
Ces moments sont les principaux param`etres de la fonction aleatoire : ils contiennent
linformation la plus pertinente et la plus utile. Ils seront largement utilises par la
suite.
4.2
Inf
erence statistique
EN
Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire
`a letude geostatistique dune variable regionalisee. Nous allons voir maintenant
comment rattacher la mesure dune variable regionalisee au concept de fonction
aleatoire pour pouvoir exploiter ses proprietes.
Pierre Bosser
36
2011-2012
INTERPOLATION SPATIALE
4.2.1
4 Linterpolation stochastique
D
efinition
/D
PTS
Linf
erence statistique consiste `a reconstituer les caracteristiques de la fonction
aleatoire (en loccurrence ses deux premiers moments) `a partir dune realisation de
la variable regionalisee (soit un ensemble de donnees experimentales).
La variable regionalisee constitue une unique realisation de la fonction aleatoire : il
nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire
ne peut donc etre definie sans ambig
uite `a partir de la seule variable regionalisee.
Pour permettre linference, deux hypoth`eses limitatives supplementaires doivent etre
realisees :
lergodicite de la fonction
la stationnarite du processus
Signalons enfin quen fonction des hypoth`eses realisees, nous serons limites sur les
possibilites doperations `a effectuer sur la fonction aleatoire.
4.2.2
Ergodicit
e
SG
Lhypoth`ese dergodicit
e suppose que linformation statistique peut etre obtenue
a` partir dune seule realisation quelconque de la fonction aleatoire definie sur un
domaine spatial infiniment grand. Autrement dit, une realisation de la fonction
aleatoire sur un grand domaine (cest `a dire pour un grand nombre de variables
aleatoires) apporte la meme information quun grand nombre de realisations de la
fonction aleatoire.
En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la
variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la
description de la fonction aleatoire (cest-`a-dire la restitution de ces moments).
En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors
supposee egale `a lesperance mathematique de la fonction aleatoire :
EN
mZ = E [Z (~s)]
ZZZ
1
z (~s) d~s
= lim
D+ D
D
Letude des moments de la fonction aleatoire `a partir dune realisation est alors
possible.
Pierre Bosser
37
2011-2012
INTERPOLATION SPATIALE
4.2.3
4 Linterpolation stochastique
Stationnarit
e
/D
PTS
Nous allons detailler de la plus exigeante `a la plus flexible les differentes hypoth`eses
de stationnarite qui peuvent etre formulees.
Hypoth`
ese de stationnarit
e du second ordre : Une fonction aleatoire {Z (~s)}
est dite stationnaire dordre 2 quand son esperance mathematique
existe et nest
n
o
pas dependante du point et que la covariance entre chaque paire Z(~s + ~h), Z(~s)
existe et ne depend que de ~h (et pas du point de lespace ~s) :
(1) ~s D, E [Z (~s)] = m
h
i
(2) ~s D, (~s + ~h) D, cov Z(~s + ~h), Z(~s) = C ~h
Formule autrement, cette hypoth`ese signifie donc que la variable regionalisee z fluctue autour dune meme valeur dans lespace et que la covariance entre deux sites ne
depend pas de leur position mais du vecteur qui les separe.
Deux proprietes en decoulent :
La variance est la meme en chacun des sites ~s.
Le variogramme entre deux sites depend uniquement de la distance qui les separe.
SG
EN
38
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
/D
PTS
~s D, (~s + ~h) D,
h
i
(1) E Z(~s + ~h) Z(~s) = 0
i2
= 2(~h)
Selon cette hypoth`ese, lesperance des accroissements est donc nulle et sa variance
ne depend que du vecteur separant les deux points. Notons que les variance et
covariance de la fonction aleatoire ne sont pas forcement definies.
On remarque que lhypoth`ese de stationnarite du second ordre implique lhypoth`ese
intrins`eque. La reciproque est fausse.
Hypoth`
eses quasi-stationnaire et quasi-intrins`
eque : En pratique on suppose que la fonction aleatoire est intrins`eque mais egalement quasi-stationnaire
dordre 2 sur un domaine borne :
(1) ~s D, E [Z (~s)] = m
h
i
(2) ~s D, (~s + ~h) D/k~hk < b, cov Z ~s + ~h , Z (~s) = C ~h
4.2.4
SG
EN
Pierre Bosser
39
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
E
var
"
"
/D
PTS
Hypoth`
ese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lineaires ponderees sont autorisees :
X
wi Z (~si )
wi Z (~si )
= m
wi
XX
i
wi wj C (~si ~sj )
Hypoth`
ese intrins`
eque : Si la fonction aleatoire est intrins`eque, seules les combinaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous
la forme daccroissements :
X
i
4.2.5
wi = 0
var
P
i
P
i
Conclusion
wi Z (~si )
= 0
wi Z (~si )
PP
i
wi wj (~si ~sj )
SG
Le mod`ele probabiliste constitue une meilleure alternative lorsque les donnees etudiees sav`erent complexes. Pour rendre le mod`ele operationnel `a partir dune mesure
de la variable regionalisee, il est necessaire de se ramener `a des hypoth`eses. Les
hypoth`eses de stationnarite (second ordre ou intrins`eque) sont choisies en fonction
de lhomogeneite des donnees.
Maintenant que nous avons detaille le choix du mod`ele probabiliste, nous allons nous
focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le
variogramme.
4.3
Analyse variographique
EN
Pierre Bosser
40
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
4.3.1
/D
PTS
elle permet posterieurement destimer les valeurs inconnues de la variable regionalisee et dassortir leur estimation dune precision.
Propri
et
es du variogramme
Propri
et
es math
ematiques :
Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est
une fonction paire, nulle pour ~h = ~0, positive et bornee. On dit que cest une
fonction de type n
egatif conditionnelle puisque elle obeit a` la relation :
k N , w1 , ..., wk R /
k
X
n X
n
X
wi wj (~si ~sj ) 0
i=1 j=1
i=1
De plus,
lim
k~hk+
(~h) = C(~0)
SG
EN
Comportement `
a lorigine Le comportement `a lorigine refl`ete de degre de
regularite spatiale de la variable regionalisee. On distingue usuellement trois types
de comportements :
Parabolique : cas dune grande regularite spatiale avec une variable regionalisee
derivable et daspect lisse.
Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation
continue mais plus derivable
Discontinu : saut abrupt `a lorigine en raison de labsence (totale ou partielle) de
correlation entre les valeurs prises par deux sites proches. La variable regionalisee
est discontinue. On parle alors deffet de p
epite du fait de lexemple des teneurs
en or des gisements aurif`eres qui varient `a tr`es courte echelle.
Ces differents types de comportement sont representes sur cette figure :
Pierre Bosser
41
2011-2012
INTERPOLATION SPATIALE
(h)
(a)
(h)
(c)
(b)
/D
PTS
(h)
4 Linterpolation stochastique
FIG 30 - Differents comportement `a lorigine du variogramme : (a) : comportement parabolique ; (b) : comportement lineaire ; (c) : comportement discontinu.
4.3.2
Inf
erence du variogramme
SG
Variogramme exp
erimental : Le variogramme experimentale est calcule empiriquement `a partir des observations de la variable regionalise. Il est donne par la
formule :
X
1
(~h) =
[z(~si ) z(~sj )[2
~
2|N(h)| (i,j)N (~h)
O`
u N(~h) = {(i, j)/~si ~sj = ~h/i 6= j} est lensemble des paires distinctes et |N(~h)|
est le cardinal de N(~h). En pratique, les donnees netant pas reguli`erement espacees,
on definira lensemble N(~h) par N(~h) = {(i, j)/~si ~sj ~h /i 6= j}.
EN
Pierre Bosser
42
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
x 10
2
1.8
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(a)
50
100
150
200
250
150
200
250
150
200
250
h [m]
x 10
1.8
1.6
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(b)
50
100
h [m]
x 10
1.8
1.6
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(c)
/D
PTS
1.6
50
100
h [m]
SG
EN
sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en
comparaison des distances entre sites dobservation.
Mod
elisations : Le variogramme experimental permet lestimation du variogramme theorique pour un nombre defini de distances, cest-`a-dire uniquement des valeurs
ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques
du variogramme (en particulier la propriete negative conditionnelle, complexe a`
etablir). Lidee est donc dajuster un mod`ele variographique classique presentant les
caracteristiques necessaires et defini pour un ensemble de vecteurs ~r.
Pierre Bosser
43
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
[
(~rk ) (~rk )]2
/D
PTS
(r) =
(a)
(r)
pour r = 0
pour r > 0
SG
C 3 r
(r) =
2a
1 r3
2 a3
pour 0 r a
pour r > a
EN
Pierre Bosser
44
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
(b)
/D
PTS
(r)
C 7 r22
a
(r) =
35 r 3
4 a3
7 r5
2 a5
3 r7
4 a7
pour 0 r a
pour r > a
(c)
(r)
SG
(r) = C 1 e a
(d)
(r)
EN
C
0.95C
3a
r
Pierre Bosser
45
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
r2
(e)
(r)
C
0.95C
/D
PTS
(r) = C 1 e
1.7a
r
1.21C
C 1
sin
r
a
r
a
(f)
(r)
SG
4.49a
FIG 37 - Mod`ele `
a effet de trou.
EN
Mod`eles isotropes sans palier : ils sont utilises dans le cadre non stationnaire
dordre 2 :
Mod`ele puissance dexposant et de facteur dechelle : [0; 2]. Plus est
proche de 2, plus la variable regionalisee est reguli`ere. Plus est proche de 0,
plus son comportement est erratique.
Pierre Bosser
(r) = r
46
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
/D
PTS
(r)
(a)
(r)
(b)
SG
Les methodes utilisees pour des mod`eles non-isotropes existent mais sont plus complexes a` mettre en uvre. On cherchera en general `a se ramener a` un ou plusieurs
variogramme isotrope en fonction des directions privilegiees.
4.4.1
Le krigeage
EN
4.4
Origine de la m
ethode
47
2011-2012
INTERPOLATION SPATIALE
4.4.2
4 Linterpolation stochastique
Principe
/D
PTS
n
X
i (~s0 )z(~si )
i=1
SG
EN
Estimation : On sinteresse au cas le plus commun avec letude dune seule variable regionalisee, sous lhypoth`ese de stationnarite intrins`eque : on parle de krigeage ordinaire. Cest le type de krigeage le plus communement utilise.
Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.
Contrainte de linearite : Lestimee est donc une combinaison lineaire des observations :
n
X
s0 ) =
i (~s0 )Z(~si )
Z(~
Pierre Bosser
i=1
48
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
s0 ) Z(~s0 ) =
Z(~
=
=
"
n
X
i=1
" n
X
i=1
" n
X
/D
PTS
i (~s0 )Z(~si )
" n
X
i (~s0 )Z(~s0 ) +
i=1
i=1
" n
X
i=1
" n
X
i (~s0 ) 1
i=1
"
n
X
i=1
SG
n
X
j=1
+ 2
n
X
i (~s0 )
i=1
O`
u represente un multiplicateur de Lagrange.
Apr`es developpement, on peut reecrire le lagrangien sous la forme :
i (~s0 )j (~s0 )ij + 2
EN
L=
n X
n
X
i=1 j=1
n
X
j=1
j (~s0 )j0 + 2 1
n
X
i=1
i (~s0 )
O`
u ij = (~si , ~sj )
Le calcul des derivees partielles premi`eres de L par rapport aux i (~s0 ) donne les
Pierre Bosser
49
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
n
X
j=1
/D
PTS
n
X
L
= 2
i (~s0 )ij + 2i0 2
i (~s0 )
i=1
= 0
j (~s0 )ij + = i0
j=1
j (~s0 )ij + = i0
n
P
j=1
j (~s0 )
0 12 13
21 0 23
..
..
..
.
.
.
n1 n2 n3
1
1
1
. . . 1n
. . . 2n
.
. . . ..
1
1
..
.
...
...
1
0
0
1
1 (~s0 )
2 (~s0 )
..
.
n (~s0 )
10
20
..
.
n0
1
(4)
4.4.3
SG
Notons que la mise en place du syst`eme de krigeage necessite une unique inversion
de la matrice carree de lequation de krigeage (mod`ele du krigeage), celle-ci etant
valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule
en chaque point. Le vecteur estime est lui aussi valable en un point.
Propri
et
es du krigeage
EN
2 (~s0 ) = var [
z (~s0 ) z(~s0 )[
=
n
X
i (~s0 )i0 +
i=1
Pierre Bosser
50
2011-2012
INTERPOLATION SPATIALE
4.4.4
4 Linterpolation stochastique
Impact du mod`
ele de variogramme
/D
PTS
(h)
5000
4000
3000
2000
1000
50
100
150
200
250
SG
0
0
h [m]
EN
Les valeurs estimees `a laide du krigeage pour ces differents mod`eles de variogrammes, ainsi que leur precision, sont presentees dans le tableau suivant. On
constate que la variance de lestimateur est minimale pour un mod`ele de variogramme de type exponentiel.
Pierre Bosser
51
2011-2012
INTERPOLATION SPATIALE
4 Linterpolation stochastique
/D
PTS
Mod`ele
Valeur estimee Incertitude formelle
Exponentiel
653.2109
0.2729
Gaussien
660.6695
0.1796
Effet de trou
671.9119
0.4602
La surface obtenue par krigeage `a partir du jeu dobservation dont on dispose est
alors :
800
700
Z
240
600
220
500
200
400
180
140
160
160
180
200
140
220
SG
240
120
260
280
Conclusion
EN
4.5
Pierre Bosser
52
2011-2012
INTERPOLATION SPATIALE
Conclusion
Conclusion
/D
PTS
associees.
EN
SG
Nous avons aborde deux types de methodes pour la resolution des probl`emes dinterpolation spatiale :
Les methodes deterministes globales : elles permettent lestimation de la moyenne
sur un domaine donne dune grandeur mesuree en differents points dobservation.
Elles sont basees sur des proprietes purement geometriques de lechantillon dobservation.
Les methodes deterministes locales : elles sont aussi basees sur des proprietes
purement geometriques de lechantillon dobservation et ne permettent pas une
evaluation de leur precision. Il est de plus generalement difficile de conlcure quant
`a la fiabilite globale dune technique deterministe.
Les methodes stochastiques : elles font appel `a un mod`ele cense mieux sadapter
aux donnees observees. Ce mod`ele permet lestimation de la variable en des sites
non echantillonnes apr`es letude de la distribution spatiale (variogramme) de la
variable.
Lutilisation de techniques de validation croisee (bootstrap) permet de controler la
conformite du mod`ele choisi `a la realite.
Pierre Bosser
53
2011-2012