Topo 111

/D
PTS
SG
Interpolation spatiale
Pierre Bosser
(Pierre.Bosser@ensg.eu)
EN
Ecole
Nationale des Sciences Geographiques
Departement Positionnement Terrestre et Spatial
Annee Scolaire 2011-2012
EN
SG
/D
PTS
Table des mati`

eres
1 Introduction
Table des matières
/D
PTS
INTERPOLATION SPATIALE
1.1 Objectifs du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . .
1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Linterpolation d
eterministe globale
10
2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
SG
2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Linterpolation d
eterministe locale
15
3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2 Interpolation à partir dune triangulation . . . . . . . . . . . . . . . . 16
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
EN
3.2.1
3.2.2
Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.3
Methode dAkima . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1
Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22
3.3.2
Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Les surfaces de tendances . . . . . . . . . . . . . . . . . . . . . . . . . 25

Pierre Bosser
2011-2012
Table des matières
3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5.2
Spline dinterpolation . . . . . . . . . . . . . . . . . . . . . . . 27
3.5.3
Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29
/D
PTS
3.5.1
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4 Linterpolation stochastique
34
4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.1
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.2
Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Inference statistique
. . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.1
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.2
Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3
Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2.4
Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39
4.2.5
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Proprietes du variogramme . . . . . . . . . . . . . . . . . . . . 41
4.3.2
Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42
SG
4.3.1
4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47
4.4.2
Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.4.3
Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50
4.4.4
Impact du modèle de variogramme . . . . . . . . . . . . . . . 51
EN
4.4.1
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 Conclusion
Pierre Bosser
53
2011-2012
1
1.1
Introduction
Objectifs du cours
1 Introduction
/D
PTS
` partir dobservations georeferencees, pas necessairement reparties regulièrement,

A
on cherche à estimer les valeurs prises par le paramètre observe en dautres points
de lespace. On parle alors destimation spatiale : cest une procedure consistant
a` estimer la valeur dune grandeur en un site à partir de dechantillons de cette
grandeur recoltes dans dautres sites.
Ce besoin sapplique à de nombreux domaines o`
u la connaissance de la distribution spatiale de phenomènes est importante : altimetrie, gravimetrie, meteorologie,
geologie, etc.
EN
SG
Lors de ce cours, nous allons donc etudier les methodes permettant lestimation
et linterpolation de donnees georeferencees. Ce cours sera une introduction aux
differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes
plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages
suivants :
Akima, H., A method of bivariate interpolation and smooth surface fitting for
values given at irregularly distributed points , OT Report 75-70, U.S. Department
of Commerce.
Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes
deterministes et geostatistiques , Hermes, 2000.
Baillargeon, S., Le krigeage : revue de la theorie et application a` linterpolation spatiale de donnees de precipitation , Memoire de M. Sc., Universite
LAVAL, 2005.
Verdun, J., Methodes destimation et dinterpolation spatiales , Cours donne
aux IT2, ENSG, 2006.
Pierre Bosser
2011-2012
1.2
1 Introduction
Notations
/D
PTS
On definit une variable r

egionalis
ee comme etant une fonction numerique prenant
ses valeurs dans une region limitee, appelee champ.
Par la suite, on utilisera les notations suivantes :
z, la variable regionalisee.
D, le champ de la regionalisation, cest à dire le domaine dans lequel la variable
regionalisee est definie. En general, D R, R2 ou R3 .
~s D, le vecteur de coordonnees (x, y, z) qui indique la position dun site dans le
champ D.
z(~s), la valeur prise par la variable regionalisee z au site ~s D.
z(V ), la valeur moyenne de z sur le domaine V D.
n, le nombre de sites o`
u la variable a ete mesuree.
z(~s1 ), ..., z(~sn ), les valeurs prises par z aux sites dobservation ~s1 ...~sn .
z(~s0 ), une estimation de z(~s0 ) avec ~s0 D.
1.3
Caract
eristiques des m
ethodes dinterpolation
SG
Dans le cas general, la variable regionalisee ne peut etre representee par une fonction
mathematique explicite. Cependant, elle presente une structuration spatiale bien
definie, avec une correlation des valeurs prises en deux sites proches. Ceci rend
possible la prevision dune valeur inconnue à partir dobservations. On parle ainsi
dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque
le site inconnu est situe hors des limites du domaine geographique engendre par
lechantillonnage des sites dobservation.
EN
On sinteresse dans de ce cours à ces methodes de prevision. Elles se divisent usuellement en deux groupes, selon les modèles mathematiques sur lesquels elles reposent :
M
ethodes d
eterministes : elles reposent sur des proprietes purement mathematiques, generalement geometriques, sans tenir compte du phenomène physique qui
nous interesse.
M
ethodes stochastiques : elles font appel à des modèles probabilistes et decoulent de lanalyse statistique des donnees considerees. On parle alors de techniques
g
eostatistiques.
Pierre Bosser
2011-2012
1 Introduction
Modle dterministe
Modle probabiliste
Phnomne naturel
Variable rgionalise
Fonction alatoire
fz(s)/ s 2 Dg
fZ(s)/ s 2 Dg
Valeurs rgionalises
Variables alatoires
z(si) pour i = 1, ..., n
Z(si) pour i = 1, ..., n
dterministe
stochastique
/D
PTS
Ralit Physique
FIG 1 - Methodes deterministes et stochastiques : un

phenomène physique observe en certains sites peut etre estime en des sites quelconques via lutilisation de methodes
deterministes (basees sur de simples constats geometriques)
ou de methodes stochastiques (basees sur des constats statistiques).
On differencie egalement ces methodes selon quelles soient globales ou locales. Une
methode globale consiste à calculer la moyenne de la variable generalisee sur le
champ à partir de lensemble des observations disponibles ; une methode locale
realise une estimation de cette moyenne sur une partie plus reduite du champ, voire
en un site ponctuel.
SG
Une methode exacte conserve les valeurs des echantillons originaux, contrairement
à une methode approch
ee.
EN
Enfin, on parle deffet d

ecran lorsquune observation commande limpact dune
autre observation lors de linterpolation. Linfluence de lobservation ecrantee sera alors :
nulle dans le cas dun ecran total,
peu elevee dans le cas dun ecran partiel,
moderee dans le cas dun ecran faible.
Pierre Bosser
2011-2012
1 Introduction
S3
/D
PTS
S6
S7
S0
S2
S5
S1
FIG 2 - Effet decran : le site S7 peut potentiellement masquer le site S6 ; linterpolateur va donner moins dimportance
au site masque, S6 , par rapport au site masquant S7 .
1.4
Repr
esentations
SG
` partir dun champ dont on connait certaines valeurs prises par la variable regionaliA
see, on veut deduire la representation densemble de cette variable sur le champ.
Cette representation peut se faire sous la forme :
de lignes de niveau,
de niveaux de couleur,
dune perspective 3D, etc.
On retrouve sur les figures suivantes differents modes de representation du champ
interpole.
240
220
200
180
160
140
EN
120
140
160
180
200
220
240
260
280
FIG 3 - Exemple de representation dune variable regionalisee : sites dobservation.
Pierre Bosser
2011-2012
1 Introduction
240
240
220
650
200
200
180
/D
PTS
700
220
160
600
180
160
550
140
140
500
120
120
140
160
180
200
220
240
260
280
140
160
180
200
220
240
260
280
FIG 4 - Exemple de representation dune variable regionalisee : representations planes.
800
800
700
700
600
240
240
600
220
500
220
500
200
400
140
180
180
140
160
160
200
400
180
160
160
180
200
140
220
200
140
220
240
120
260
240
120
260
280
280
X
SG
700
650
800
600
700
240
600
220
500
550
200
400
180
140
500
160
160
180
200
140
220
240
EN
260
120
280
FIG 5 - Exemple de representation dune variable regionalisee : perspectives.
Pierre Bosser
2011-2012
1.5
1 Introduction
Applications
EN
SG
/D
PTS
Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons
par exemple :
En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,
de pluviometrie.
En geodesie : mesures du champ de gravite, retards tropospheriques et ionospheriques, hauteur du geode.
En geologie : teneur du sol en elements mineraux.
Les figures suivantes presentent differentes visualisations dinterpolation spatiale
dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique
GPS, anomalie de gravite).
FIG 6 - Exemple dobservations interpolees spatialement :

mesures de pression, temperature, precipitation ( MeteoFrance).
Pierre Bosser
2011-2012
1 Introduction
/D
PTS
FIG 7 - Exemple dobservations interpolees spatialement :

retards tropospheriques GPS ( RGP / IGN), anomalies
de gravite ( LAREG / IGN) et temperature à 500 m de
profondeur ( BRGM).
EN
SG
Pierre Bosser
2011-2012
2
2.1
Linterpolation deterministe globale
/D
PTS
Linterpolation d
eterministe globale
D
efinition
Lestimation globale vise à estimer la moyenne arithmetique dune ensemble dobservations (valeurs de la variable regionalisee) dans un domaine geographique (le
champ). Cette estimation nest pas triviale puisque les observations ne sont pas
forcement representatives et peuvent presenter une densite differentes en fonction
de la zone du champ, donnant alors une influence trop importante a` certaines parties
de la zone etudiee.
2.2
SG
Deux solutions sont alors envisageables. La première consiste en une selection des
donnees observees. Le problème reside alors dans le choix des observations a` prendre
en compte. Aucun critère objectif ne peut permettre detre certain ni de la qualite ni de la pertinence des observations choisies. Une seconde solution consiste a`
ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici
nous interesser à des methodes globales basees sur cette solution.
Polygone de Thiessen
EN
Pour tous les points dobservation du champs, on definit un polygone dinfluence tel
que chaque point du polygone est plus proche du point dobservation que de tout
autre site :
~s Pi , ~sj D r Pi , k~si ~sk 6 k~sj ~sk
D est alors partitionne en une famille de polygone convexes, nommes polygone de

Thiessen (aussi appeles polygones de Voronoi ou cellules de Dirichlet).
Pierre Bosser
10
2011-2012
S3
/D
PTS
S6
S0
S2
S5
S1
FIG 8 - Construction des polygones de Thiessen.
Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite
surface, les donnees isolee un polygone de grande surface. Notons que le decoupage
de Thiessen depend uniquement de la configuration geometrique et non pas des
valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines
directions de lespace : il faut ainsi limiter la partition aux frontières de D, ou fixer
une distance dinfluence limite.
S3
S6
S0
S2
S5
SG
S1
FIG 9 - Decoupage en polygones de Thiessen.
Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponderation des observations pour le calcul de la moyenne de la variable regionalisee sur
le champ detude :
EN
z(D) =
n
X
|Pi |
z~si
i=1 |D|
(1)
O`
u |Pi | est laire du polygone Pi associee au site ~si et |D| laire du champ :
|D| =
n
X
|Pi |
(2)
i=1
Par construction, les zones à observations denses sont les zones a` polygones de
Thiessen de surface moindre : linfluence de ces zones est donc limitee.
Pierre Bosser
11
2011-2012
200
150
100
140
160
180
/D
PTS
250
200
220
240
260
280
FIG 10 - Exemple de decoupage en polygones de Thiessen.
2.3
M
ethode des cellules
SG
La methode des cellules consiste à diviser le champ en cellules rectangulaires de

meme taille, contenant chacune un nombre variable de sites dobservation. La ponderation des observations lors de lestimation globale est realisee a` laide du nombre
de sites contenus dans chaque cellule.
La procedure destimation est la suivante :
1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.

2. On calcule ensuite la moyenne des moyennes de toutes les cellules, sans ponderation.
EN
Lestimation globale du champ etudie est donc donne par la formule :
n
N
X
1 X
~s(i )
z(D) =
N =1 i =1
(3)
O`
u N est le nombre de cellules de decoupage du domaine D contenant au moins un
site dobservation, ~s(i ) les sites dobservation localises dans la cellule .
En pratique, on repète lalgorithme plusieurs fois (5 à 10) avec differents decoupages
dans le but dobtenir une estimation globale independante du reseau.
Pierre Bosser
12
2011-2012
250
200
150
100
140
160
180
/D
PTS
Notons que si la taille des cellules est trop petite, chacune contiendra au plus un
site dobservation et les donnees auront toutes le meme poids. Si la taille est trop
grande, toutes les observations appartiendront à la meme cellule et auront donc
le meme poids. Dans ces 2 cas, lestimation globale reviendra alors a` calculer la
moyenne arithmetique de toutes les observations.
200
220
240
260
280
2.4
SG
FIG 11 - Exemple de decoupage en cellules.
Conclusion
Les methodes destimation globale presentees ici reposent uniquement sur la configuration geometrique des donnees. Elles permettent donc de quantifier la quantite
totale ou moyenne dun ensemble dobservations de repartition variable dans lespace.
EN
Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).
Mis a` part un cas (decoupage en cellules de taille minimale), on observe que les
resultats obtenus sont dans lensemble relativement homogène.
Pierre Bosser
13
2011-2012
z(D)
620.6693
609.9030
615.4803
618.9132
619.6649
614.0666
/D
PTS
Interpolation
Polygones de Thiessen
Cellules, pas de 1 m
TAB 1 - Estimation globale par differentes methodes : estimation de laltitude moyenne.
EN
SG
Il est cependant plus important de pouvoir localiser / cartographier les zones de

fortes valeurs et celles de valeurs moindres : cest le but de lestimation locale que
nous allons voir par la suite.
Pierre Bosser
14
2011-2012
3 Linterpolation deterministe locale
/D
PTS
Linterpolation d
eterministe locale
Nous nous interessons ici aux methodes deterministes pour lestimation locale et
ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee a`
partir de combinaisons lineaires des observations en tenant compte de leur disposition les unes par rapport aux autres mais aussi de la distance entre le secteur a`
estimer et les points de donnees.
3.1
SG
Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas
de lestimation globale. Linterpolation par la methode de Thiessen consiste a` affecter a` lensemble des points dun polygone donne la valeur de la variable regionalisee
correspondante (on parle aussi de plus proche voisin). On obtient alors une surface discontinue ; ces discontinuites nont rien à voir avec de possibles discontinuites
reelles, mais sont simplement liees à la configuration geometrique des observations.
On trouve dans la litterature differentes methodes pour palier ce problème de discontinuites (methode de Sibson par exemple basee sur linterpolation par combinaison
lineaire des valeurs aux sommets voisins).
S3
S6
EN
S?
S0
S2
S5
S1
FIG 12 - Interpolation par la methode de Thiessen (plus

proche voisin).
Pierre Bosser
15
2011-2012
800
700
/D
PTS
Sur la figure suivante, on represente un exemple dinterpolation par plus proche voisin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses
discontinuites.
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 13 - Interpolation par plus proche voisin : application

sur un champ dobservations - vue en perspective.
3.2.1
Interpolation `
a partir dune triangulation
D
efinition
SG
3.2
La triangulation consiste à diviser le champ en triangles disjoints dont les sommets

sont les sites dobservation. On calcule alors la valeur en un point donne a` partir
des valeurs des sommets du triangle auquel il appartient.
EN
Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation

de Delaunay : les sommets de chaque triangle sont les sites du champ D tels que
les polygones de Thiessen associes ont un cote en commun. Notons les proprietes
dune telle triangulation :
La triangulation est independante de lordre de traitement.
Lensemble du domaine nest pas recouvert : on opère uniquement dans lenveloppe
convexe des sites.
Les cercles circonscrits à chacun des triangles ne contiennent pas dautre site
dobservation.
Pierre Bosser
16
2011-2012
Tous les points sont relies à leur plus proche voisin.

S6
/D
PTS
S3
S?
S2
S0
S5
S1
FIG 14 - Triangulation de Delaunay.
Il existe plusieurs methodes pour linterpolation de donnees à partir dune triangulation. Ici, deux dentres elles seront exposees.
3.2.2
Interpolation lin
eaire
On considère le triangle (~s1 , ~s2 , ~s3 ) contenant le point dinteret ~s. La valeur recherchee de la variable regionalisee secrit sous la forme :
z(~s) = z(x, y) = x + y +
SG
S3
S?
S2
S1
FIG 15 - Interpolation lineaire : Geometrie du problème.
EN
La solution est determinee à partir dune combinaison lineaire des valeur observees
au sommet du triangle en resolvant le système :
O`
u zi = z(~si ).
Pierre Bosser
x1 + y1 + = z1
x2 + y2 + = z2
x3 + y3 + = z3
17
2011-2012
Lequation matricielle secrit sous la forme :

x1 y1 1
x2 y2 1
x3 y3 1
z1
z2
z3
/D
PTS
On peut alors montrer que cette solution secrit sous la forme :

z(~s) =
|~s1 , ~s, ~s2 | z3 + |~s1 , ~s, ~s3 | z2 + |~s2 , ~s, ~s3 | z1

|~s1 , ~s2 , ~s3 |
O`
u |~s1 , ~s2 , ~s3 | represente laire du triangle forme par les vecteurs (~s1 , ~s2 , ~s3 ) : la
solution devient donc la somme ponderee des aires des triangles formes par les 3
sommets et le point dinteret.
S3
jS2,S,S3j jS1,S,S3j
S2
jS1,S,S2j
S3
jS2,S,S3j
S1
S2
jS1,S,S3j
jS1,S,S2j
S1
SG
FIG 16 - Interpolation lineaire : interpretation geometrique

de la solution : plus le point auquel on souhaite estimer la
valeur de la variable regionalisee est proche dun site dobservation, plus la proportion de surface occupee par le triangle oppose `
a ce sommet est importante ; le poids associe
est donc plus important et la valeur estimee proche de celle
du sommet.
Chaque site dobservation recoit donc un poids egal à la proportion de surface occupee par le triangle qui lui est oppose : plus le point recherche est proche dun
site dobservation plus la valeur de la variable regionalisee est proche de la valeur
observee en ce site.
EN
Un exemple de cette methode dinterpolation est represente ci-dessous.
Pierre Bosser
18
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 17 - Interpolation lineaire : application sur un champ

dobservations - vue en perspective. On observe laspect pyramidal de la surface obtenue.
3.2.3
SG
Linterpolation lineaire presente les proprietes suivantes :

Lestimation est unique pour une triangulation donnee.
Cette methode est exacte.
La surface obtenue est continue ; elle est composee de pyramides juxtaposees.
Lextrapolation nest pas possible au delà de lenveloppe convexe des sites dobservation.
M
ethode dAkima
EN
La methode dAkima est une autre methode dinterpolation à partir dune triangulation. On ajuste cette fois-ci à chaque triangle une surface dont lequation est un
polynome de degre 5 :
z(~s) = z(x, y) =
5 5j
X
X
jk xj y k
j=0 k=0
Il faut donc 21 conditions pour determiner les 21 coefficients jk :

les 3 premières conditions sont obtenues à partir des valeurs prises par la variable
Pierre Bosser
19
2011-2012
regionalisee aux 3 sommets de chaque triangle :

z(~s2 ),
z(~s3 )
/D
PTS
z(~s1 ),
6 autres conditions sont obtenues à partir des derivees premières aux sommets de
chaque triangle :
z
(~s1 )
y
z
(~s2 )
y
z
(~s3 )
y
z
(~s1 ),
x
z
(~s2 ),
x
z
(~s3 ),
x
9 autres conditions sont obtenues à partir des derivees secondes aux sommets de
chaque triangle :
2z
2z
(~
s
)
,
(~s1 )
1
y 2
xy
2z
2z
(~
s
)
,
(~s2 )
2
y 2
xy
2z
2z
(~
s
)
,
(~s3 )
3
y 2
xy
2z
(~s1 ),
x2
2z
(~s2 ),
x2
2z
(~s3 ),
x2
SG
Les 3 dernières conditions sont obtenues à laide de considerations de continuite

et de derivabilite aux limites de chaque triangle. La derivee partielle de la fonction dinterpolation dans la direction normale à chaque cote du triangle est un
polyn
ome de degre 3, au plus, de la variable mesuree selon ce cote.
5z
(~s2 ) = 0,
nt4
5z
(~s1 ) = 0,
nt4
n1
S3
t1
EN
S?
S2
5z
(~s3 ) = 0
nt4
n2
t2
S1
t3
n3
FIG 18 - Interpolation dAkima : Geometrie de la solution.
Pierre Bosser
20
2011-2012
/D
PTS
La dernière condition assure donc la continuite et la derivabilite de la surface obtenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses
derivees partielles premières et secondes selon x et y suffisent donc a` determiner les
valeurs de la fonction et de ses derivees selon n et t aux sommets.
Ainsi, En limite de 2 triangles, la section de la surface est un polynome de degre
5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees
aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les
derivees première selon n et seconde selon n puis t aux sommets permettent decrire
la derivee première selon n sous forme dun unique polynome de degre 3, en t : on
a donc egalement la derivabilite.
Pour calculer les derivees partielles en chaque sommet du triangle, Akima propose
lutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.
Les derivees premières sont obtenues en estimant le plan moyen (par rapport aux
differents sites voisins choisis) passant par le sommet dinteret. Les derivees secondes sont calculees en repetant cette operation, mais cette fois-ci en considerant
les derivees premières au lieu des valeurs de la variable regionalisee.
Bien quen apparence complexe, limplementation de cette methode est relativement
directe (un formulaire complet existe).
EN
SG
Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permet
lestimation dune surface continue et derivable. Il existe des variantes permettant
une extrapolation au delà de lenveloppe convexe formee par lensemble des triangles.
Pierre Bosser
21
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 19 - Interpolation par la methode dAkima : application sur un champ dobservations - vue en perspective. On
observe que la surface obtenue est beaucoup plus esthetique
que celle issus dune interpolation lineaire.
M
ethodes barycentriques
SG
3.3
Netant pas limitees au voisinage direct du point dinteret, les methodes barycentriques presentent lavantage de prendre en compte plus de donnees du champ dobservation. Un poids plus important est affecte aux sites les plus proches, un poids
moindre aux sites plus eloignes.
3.3.1
Inverse des distances
EN
Cest la methode barycentrique la plus employee. elle consiste a` attribuer un poids

inversement proportionnel à la distance entre les sites et le point à estimer :
n
X
z(~si )
si ~sk
i=1 k~
z(~s) = X
n
1
si ~sk
i=1 k~
On peut generaliser cette formule en prenant comme ponderation une puissance p
Pierre Bosser
22
2011-2012
800
700
/D
PTS
de la distance entre sites et point à estimer

p 0 : moyenne arithmetique
p + : methode de Thiessen
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 20 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - vue en
perspective.
SG
Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs
interpolees sont limitees par les valeurs minimale et maximale du champ dobservation, la ponderation etant positive.
EN
Elle presente cependant quelques inconvenients. Elle est indifferente a` la configuration geometrique des observations, seule la distance compte. Elle tend a` surponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur
presentent des structures en forme dil de buf autour des sites dobservation
en raison de linfluence du site le plus proche. Plus la puissance de la distance est
elevee, plus cet est important.
Pierre Bosser
23
2011-2012
220
200
180
160
140
120
140
160
180
/D
PTS
240
200
220
240
260
280
FIG 21 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - representation par courbes de niveau, vue de dessus. On distingue
nettement leffet doil de buf lie à lutilisation de cette
methode.
Interpolation bilin
eaire
SG
3.3.2
Linterpolation bilineaire necessite un

echantillonnage r
egulier des sites dobservation. On cherche les quatre points entourant le point dinteret. On effectue alors
une interpolation à laide de linverse des distances. Linterpolation est exacte et
restitue une surface continue. Les calculs sont rapides.
EN
z2
z1
Si+1,j+1
Si,j+1
Si,j
a1
b2
S
b1
Si+1,j
a2
FIG 22 - Interpolation bilineaire : geometrie de la solution.
Pierre Bosser
24
2011-2012
Le valeur de la variable regionalisees au point ~s est donnee par :
Avec :
b1 zi+1,j+1 + b2 zi,j+1
b1 + b2
b1 zi+1,j + b2 zi,j
=
b1 + b2
z1 =
z2
a1 z1 + a2 z2
a1 + a2
/D
PTS
z (~s) =
Comme nous lavons dit, cette methode necessite un echantillonnage regulier des
sites dobservation, ce qui la rend inutilisable dans la majorite des cas.
3.4
Les surfaces de tendances
On cherche à ajuster par moindre-carre une surface polynomiale aux valeurs observees. Cette surface se presente sous la forme :
z(~s) = z(x, y) =
p X
pi
X
ij xi y j
i=0 j=0
x01 y10 . . . x01 y1p

..
..
.
...
.
0 0
0 p
xn yn . . . xn yn
EN
SG
O`
u p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par
P
minimisation de la quantite ni=1 [
z (~si ) z(~si )]2 par moindre-carre par exemple. Il
faut alors que le degre du polynome verifie 21 (p + 1)(p + 2) n. Linversion peut
secrire sous la forme matricielle suivante :
0,0
.
p 0
. . . x1 y1
..
..
...
.
0,p
.
..
. . . xpn yn0
p,0
z1
..
.
zn
On represente sur les figures suivantes, linterpolation par des surfaces de tendance
dordre respectif 2, 3 et 5.
Pierre Bosser
25
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
800
700
600
500
400
140
SG
FIG 23 - Interpolation par une surface de tendance dordre

2 : application sur un champ dobservations - vue en perspective.
240
220
200
180
160
160
EN
180
200
140
220
240
120
260
280
X

Pierre Bosser
26
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280

La solution est unique. Linterpolateur est approche. La duree du calcul depend de

lordre de la surface.
SG
Les test statistiques concernant la significativite des resultats sont a` utiliser avec
prudence car ils reposent sur une hypothèse dindependance des valeurs, ce qui est
rarement verifie dans le contexte spatial.
3.5
Les splines
3.5.1
G
en
eralit
es
3.5.2
EN
Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous
certaines contraintes dajustement. Dans notre contexte, il existe deux categories
de fonctions de splines : les splines dinterpolation qui passent exactement par les
points dobservation et les splines de lissage qui passent à proximite.
Spline dinterpolation
On desire obtenir une fonction qui soit la plus lisse possible tout en restituant
les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(~s))
Pierre Bosser
27
2011-2012
ZZ
/D
PTS
represente la surface par une plaque mince et flexible que lon contraint a` passer par
chaque site. Elle doit ainsi minimiser lenergie de flexion :
2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2
Avec comme contrainte z(~si ) = z(~si ).
On peut montrer que la fonction spline solution secrit alors sous la forme :
z(~s) = z(x, y) = a0 + a1 x + a2 y +
n
X
bi K (~s ~si )
i=1
Avec :
K(~h) = k~hk2 ln(k~hk)
Les inconnues a0 , a0 , a0 , b1 , ..., bn sont solutions du système suivant :
a0 + a1 xi + a2 yi +
n
P
j=1
bj = 0,
n
P
j=1
n
P
j=1,j6=i
bj xj = 0,
bj K (~si ~sj ) = z(~si )
n
P
j=1
bj yj = 0
On traduit ce système sous forme matricielle :
. . . K1,n
a
0
..
a
...
.
1
a
...
0
2
b
...
1
1
..
. . . xn .
SG
1 x1 y1
0
.
.
..
..
..
..
.
.
1 xn yn Kn,1
0 0
0
1
0 0
0
x1
0 0 0
y1
...
yn
bn
z
1
..
.
zn
0
0
0
EN
Lestimation en un point donne necessite la resolution de n+3 equations. Lexistence

et lunicite de la solution sont garanties lorsque les points ne sont pas alignes. Les
splines dinterpolation sont des interpolateurs exacts.
Pierre Bosser
28
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 26 - Interpolation par spline dinterpolation : application sur un champ dobservations - vue en perspective.
3.5.3
Les splines de lissage
n
X
i=1
SG
Il peut etre judicieux dans certaines situations (mesures presentant une incertitude
importante) de chercher une surface qui sapproche au mieux des observations tout
en restant la plus lisse possible. Dans R2 , on traduit ces conditions en cherchant a`
minimiser la fonction qui minimise :
[
z (~si ) z (~si )]2 +
ZZ
2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2
O`
u est un paramètre strictement positif et fixe a priori.
EN
On peut montrer que la solution se presente alors sous la forme de la solution obtenue
dans le cas des splines dinterpolation :
z(~s) = z(x, y) = a0 + a1 x + a2 y +
Avec :
n
X
bi K(~s ~si )
i=1
K(~h) = k~hk2 ln(k~hk)
Pierre Bosser
29
2011-2012
Les inconnues a0 , a0 , a0 , b1 , ..., bn sont solutions du système suivant :

n
P
a0 + a1 xi + a2 yi + bi +
n
P
j=1
bj = 0,
n
P
j=1
bj K (~si ~sj ) = z(~si )
/D
PTS
j=1,j6=i
n
P
bj yj
j=1
bj xj = 0,
=0
On traduit ce système sous forme matricielle :
1 x1 y1
..
..
..
..
.
.
.
.
1 xn yn Kn,1
0 0
0
1
0 0
0
x1
0 0 0
y1
. . . K1,n
..
..
.
.
...
...
1
. . . xn
. . . yn
a0
a1
a2
b1
..
.
bn
z
1
..
.
zn
0
0
0
800
600
500
400
140
SG
700
240
220
200
180
160
160
180
200
140
220
240
120
260
280
EN
FIG 27 - Interpolation par spline de lissage - = 103 : application sur un champ dobservations - vue en perspective.
Pierre Bosser
30
2011-2012
800
700
/D
PTS
240
600
220
500
200
400
180
140
160
160
180
200
140
220
240
120
260
280
FIG 28 - Interpolation par spline de lissage - = 106 : application sur un champ dobservations - vue en perspective.
La surface obtenue tend vers un plan.
3.6
SG
Le terme permet de faire un compromis entre la contrainte dajustement et contrainte de lissage :

Si = 0, linterpolation est exacte : on est dans le cas des splines dinterpolation.
Plus augmente, plus les valeurs calculees aux sites dobservation seloignent des
valeurs observees.
Lorsque +, la surface estimee tend vers un plan dequation z(x, y) =
a0 + a1 x + a2 y : les termes bi tendent vers 0 pour compenser la forte valeur de .
Conclusion
EN
Nous avons maintenant un apercu de differentes techniques deterministes permettant

lestimation locale de variables regionalisees en des sites non echantillonnes. Dans le
tableau suivant, on represente une synthèse de ces methodes.
Pierre Bosser
31
2011-2012
Interpolation Exacte
oui
oui
Effet decran
total
total
Akima
Inverse des distances
oui
oui
total
faible
non
oui
non
faible
partiel
faible
Surface de tendance
Spline de lissage
Limite(s)
Discontinuites
Aspect
pyramidal
Implementation
Effet
il-de-buf
Peu robuste
/D
PTS
Interpolation
Lineaire
FIG 29 - Quelques caracteristiques des methodes dinterpolation. Si une observation est masquee par une autre
observation par rapport au site à estimer, elle peut recevoir un poids nul (ecran total), peu eleve (ecran partiel) ou
modere (ecran faible).
Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantillon test (ou Jackknife ou bootstrap). Cette technique consiste a` partager les observations en deux ensembles : un ensemble permettant la determination du modèle,
un second permettant le test de ce modèle. On effectue ainsi une sorte de validation
croisee.
SG
On est cependant incapable de dire laquelle de ces methodes est la plus proche de
la verite, leur reussite etant largement dependante du contexte : une methode peut
fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en
fait impossible de dire quelle methode fournit globalement les meilleurs resultats.
Aucune methode deterministe ne parait universellement meilleure.
EN
` titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees
A
pour les differentes methodes presentees en un point quelconque de lespace. Si une
majorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne
peut pas vraiment conclure quant à la valeur exacte de laltitude du point estimee.
Pierre Bosser
32
2011-2012
/D
PTS
Interpolation
z (~s)
Thiessen
680.0000
Lineaire
674.3876
Methode dAkima
675.8825
2
Inverse des distances (d )
660.6881
Surface de tendance dordre 2 647.6674
674.7240
Spline de lissage ( = 103 )
668.2837
6
Spline de lissage ( = 10 )
630.6910
TAB 2 - Valeur de la variable regionalisee estimee en un

meme point par les differentes methodes : estimation de laltitude.
EN
SG
Notons enfin une limite importante des methodes ici presentees : celles-ci sappliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la
variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais
pas necessairement precise. Nous allons voir par la suite des methodes permettant
la prise en compte dune eventuelle structuration spatiale en faisant appel a` des
modèles probabilistes : les methodes stochastiques.
Pierre Bosser
33
2011-2012
/D
PTS
Linterpolation stochastique
On sinteresse desormais à lutilisation de modèles probabilistes pour la description

du comportement de la variable regionalisee. Lutilisation de telles methodes doit
nous permettre egalement devaluer la precision dune estimation. On parle alors de
g
eostatistique : on utilise à la fois les valeurs observees et linformation de position
pour ameliorer lestimation dans le contexte spatial.
SG
On utilise donc un modèle probabiliste pour decrire le phenomène naturel a` laide

dun processus aleatoire. On est cependant limite par la statistique classique qui
necessitent que les valeurs mesurees soient :
Independantes.
Identiquement distribuees.
Ces hypothèses ne sont pas verifiees dans notre contexte (dependance spatiale, conditions dobservation differentes). Un nouvelle approche doit etre envisagee.
Dans ce chapitre, on suppose la notion de variable al
eatoire connue. On rappelle quune variable aleatoire est une fonction renvoyant une valeur resultante
dune experience aleatoire. Dans notre cas elle permet dassurer la relation entre
un phenomène et les resultats chiffres dune experience portant sur ce phenomène.
On appelle ce resultat r
ealisation de la variable aleatoire.
4.1.1
Notion de fonction al
eatoire
EN
4.1
D
efinition
Le concept de fonction al
eatoire fournit des outils permettant danalyser le caractère a` la fois incertain et structure dun phenomène, permettant ulterieurement
destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire
permet de prendre en compte le fait que la variable regionalisee peut prendre des
valeurs très erratiques (inconstantes, ne suivent pas de modèle, difficiles a` predire) et
que ces valeurs ne sont par vraiment independantes mais structurees dans lespace.
Pierre Bosser
34
2011-2012
/D
PTS
On rappelle que z(~s) represente la valeur prise par la variable regionalisee z au site
~s D. On linterprète comme une realisation dune variable aleatoire Z (~s) definie
en ~s. On appelle alors fonction aleatoire (aussi appelee processus al
eatoire ou
processus stochastique) la famille des variables aleatoires {Z (~s) /~s D}.
Chaque valeur z(~s) de la variable regionalisee z est donc interpretee comme un
realisation de la variable aleatoire Z(~s) definie en ~s. La fonction aleatoire represente
lensemble des variables aleatoires qui interprète la variable regionalisee. Les differentes variables aleatoires ne sont pas independantes : une correlation existe et permet
de decrire la structure de la variable regionalisee.
La variable regionalisee constitue donc une realisation de la fonction aleatoire.
4.1.2
Moments
Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi
spatiale qui correspond à la donnee de toutes les lois de probabilite de tous les
vecteurs aleatoires {Z(~s1 ), ...Z(~sn )} que lon peut extraire de la fonction aleatoire
Z(~s). Pratiquement, en raison de la complexite de la determination de loi spatiale
entière, on limite la description de la loi spatiale à ses deux premiers moments. Le but
est alors de retrouver les caracteristiques de la loi à partir de la seule connaissance
de ces 2 moments.
SG
Moments du premier ordre : Le moment du premier ordre dune fonction

aleatoire se situe dans le cas de letude de sa loi monovariable (soit la loi en un
site) : on sinteresse à lesp
erance math
ematique qui est dependante du point ~s :
E [Z(~s)] = mZ (~s)
EN
Cest la moyenne autour de laquelle les realisations en un point ~s de la variable

aleatoire Z(~s) se distribuent. Cest une moyenne sur les realisations et non une
moyenne spatiale.
Moments du second ordre : Les moments du second ordre fournissent une
description de la loi spatiale bivariable de la fonction aleatoire Z(~s), cest a` dire
la loi de probabilite entre les valeurs prises en deux sites ~s1 et ~s2 quelconques.
Pierre Bosser
35
2011-2012
La covariance centree entre Z (~s1 ) et Z (~s2 ) est donnee par :
/D
PTS
cov [Z (~s1 ) , Z (~s2 )] = E {[Z (~s1 ) mZ (~s1 )] [Z (~s2 ) mZ (~s2 )]}

= E [Z (~s1 ) Z (~s2 )] mZ (~s1 ) mZ (~s2 )
= C (~s1 , ~s2 )
Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en
~s1 et ~s2 .
On appelle variance (ou variance a priori), la covariance entre la variable aleatoire
Z (~s1 ) et elle-meme :
var [Z (~s1 )] = cov [Z (~s1 ) , Z (~s1 )]
= E [Z (~s1 ) mZ (~s1 )]2
Elle mesure la dispersion de la variable aleatoire Z (~s1 ) autour de sa moyenne.

Enfin, le (semi-)variogramme entre Z (~s1 ) et Z (~s2 ) est donne par
~ (~s1 , ~s2 ) =
1
var [Z (~s1 ) Z (~s2 )]
2
SG
Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre
les sites ~s1 et ~s2 . On verra par la suite que cette quantite est un outil essentiel de la
geostatistique, en particulier du krigeage.
Ces moments sont les principaux paramètres de la fonction aleatoire : ils contiennent
linformation la plus pertinente et la plus utile. Ils seront largement utilises par la
suite.
4.2
Inf
erence statistique
EN
Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire
à letude geostatistique dune variable regionalisee. Nous allons voir maintenant
comment rattacher la mesure dune variable regionalisee au concept de fonction
aleatoire pour pouvoir exploiter ses proprietes.
Pierre Bosser
36
2011-2012
4.2.1
D
efinition
/D
PTS
Linf
erence statistique consiste à reconstituer les caracteristiques de la fonction
aleatoire (en loccurrence ses deux premiers moments) à partir dune realisation de
la variable regionalisee (soit un ensemble de donnees experimentales).
La variable regionalisee constitue une unique realisation de la fonction aleatoire : il
nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire
ne peut donc etre definie sans ambig
uite à partir de la seule variable regionalisee.
Pour permettre linference, deux hypothèses limitatives supplementaires doivent etre
realisees :
lergodicite de la fonction
la stationnarite du processus
Signalons enfin quen fonction des hypothèses realisees, nous serons limites sur les
possibilites doperations à effectuer sur la fonction aleatoire.
4.2.2
Ergodicit
e
SG
Lhypothèse dergodicit
e suppose que linformation statistique peut etre obtenue
a` partir dune seule realisation quelconque de la fonction aleatoire definie sur un
domaine spatial infiniment grand. Autrement dit, une realisation de la fonction
aleatoire sur un grand domaine (cest à dire pour un grand nombre de variables
aleatoires) apporte la meme information quun grand nombre de realisations de la
fonction aleatoire.
En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la
variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la
description de la fonction aleatoire (cest-à-dire la restitution de ces moments).
En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors
supposee egale à lesperance mathematique de la fonction aleatoire :
EN
mZ = E [Z (~s)]
ZZZ
1
z (~s) d~s
= lim
D+ D
D
Letude des moments de la fonction aleatoire à partir dune realisation est alors
possible.
Pierre Bosser
37
2011-2012
4.2.3
Stationnarit
e
/D
PTS
Nous allons detailler de la plus exigeante à la plus flexible les differentes hypothèses
de stationnarite qui peuvent etre formulees.
Hypoth`
ese de stationnarit
e du second ordre : Une fonction aleatoire {Z (~s)}
est dite stationnaire dordre 2 quand son esperance mathematique
existe et nest
n
o
pas dependante du point et que la covariance entre chaque paire Z(~s + ~h), Z(~s)
existe et ne depend que de ~h (et pas du point de lespace ~s) :
(1) ~s D, E [Z (~s)] = m
h
i

(2) ~s D, (~s + ~h) D, cov Z(~s + ~h), Z(~s) = C ~h
Formule autrement, cette hypothèse signifie donc que la variable regionalisee z fluctue autour dune meme valeur dans lespace et que la covariance entre deux sites ne
depend pas de leur position mais du vecteur qui les separe.
Deux proprietes en decoulent :
La variance est la meme en chacun des sites ~s.
Le variogramme entre deux sites depend uniquement de la distance qui les separe.
SG
(3) ~s D, var [Z(~s)] = cov [Z(~s), Z(~s)] = C(~0)

h
i
(4) ~s D, (~s + ~h) D, var Z(~s + ~h) Z(~s) /2 = (~h) = C(~0) C(~h)
La relation (3) souligne quen chaque site, la dispersion autour de la valeur moyenne
est la meme. La relation (4) montre que la dissemblance entre deux sites est seulement fonction du vecteur qui les separe. Elle souligne egalement que, sous cette
hypothèse, lutilisation du variogramme ou de la covariance est equivalente pour
quantifier la dependance entre deux mesures separees par ~h.
EN
Lhypothèse de stationnarite dordre 2 ne peut etre validee de manière rigoureuse

et infaillible à partir de mesures experimentales : cest une decision plus ou moins
judicieuse prise par lutilisateur.
Hypoth`
ese intrins`
eque : Lhypothèse intrins`
eque est une version affaiblie de
lhypothèse de stationnarite du second ordre. Elle est basee uniquement sur les
accroissements de la fonction aleatoire.
Une fonction aleatoire est dite intrinsèque quand ses accroissements sont stationPierre Bosser
38
2011-2012
naires au second ordre :
/D
PTS
~s D, (~s + ~h) D,
h
i
(1) E Z(~s + ~h) Z(~s) = 0
(2) var Z(~s + ~h) Z(~s) = E

h
Z(~s + ~h) Z(~s)
i2
= 2(~h)
Selon cette hypothèse, lesperance des accroissements est donc nulle et sa variance
ne depend que du vecteur separant les deux points. Notons que les variance et
covariance de la fonction aleatoire ne sont pas forcement definies.
On remarque que lhypothèse de stationnarite du second ordre implique lhypothèse
intrinsèque. La reciproque est fausse.
Hypoth`
eses quasi-stationnaire et quasi-intrins`
eque : En pratique on suppose que la fonction aleatoire est intrinsèque mais egalement quasi-stationnaire
dordre 2 sur un domaine borne :
(1) ~s D, E [Z (~s)] = m
h

i

(2) ~s D, (~s + ~h) D/k~hk < b, cov Z ~s + ~h , Z (~s) = C ~h
4.2.4
SG
Il faut alors concilier deux facteurs :

La zone choisie ne doit pas etre trop etendue par rapport à la taille du champs
considere.
Le nombre de sites selectionnes ne doit pas etre trop faible.
Combinaisons lin
eaires autoris
ees
EN
On a choisi dutiliser uniquement les deux premiers moments de la loi spatiale, ce

qui entraine des limites quand à la manipulation de la fonction aleatoire : on ne peut
utiliser que des combinaisons lineaires ponderees de Z (~s), seules expressions pour
lesquelles ont peut calculer esperance et covariance.
Lhypothèse de stationnarite choisie impose de plus des contraintes supplementaires
car elle ne garantit pas necessairement lexistence de lesperance et de la variance
de toutes les combinaisons lineaires ponderees. On appelle combinaison lin
eaire
autoris
ee une combinaison lineaire qui possède une esperance et une variance.
Pierre Bosser
39
2011-2012
E
var
"
"
/D
PTS
Hypoth`
ese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lineaires ponderees sont autorisees :
X
wi Z (~si )
wi Z (~si )
= m
wi
XX
i
wi wj C (~si ~sj )
Hypoth`
ese intrins`
eque : Si la fonction aleatoire est intrinsèque, seules les combinaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous
la forme daccroissements :
X
i
4.2.5
wi = 0
var
P
i
P
i
Conclusion
wi Z (~si )
= 0
wi Z (~si )
PP
i
wi wj (~si ~sj )
SG
Le modèle probabiliste constitue une meilleure alternative lorsque les donnees etudiees savèrent complexes. Pour rendre le modèle operationnel à partir dune mesure
de la variable regionalisee, il est necessaire de se ramener à des hypothèses. Les
hypothèses de stationnarite (second ordre ou intrinsèque) sont choisies en fonction
de lhomogeneite des donnees.
Maintenant que nous avons detaille le choix du modèle probabiliste, nous allons nous
focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le
variogramme.
4.3
Analyse variographique
EN
Nous avons vu que le variogramme refletait la structure de la regionalisation. On

appelle analyse variographique linference du variogramme a` partir de donnees
experimentales. Elle permet de restituer des informations quant à la distribution spatiale de la variable regionalisee, cest-à-dire de la realisation de la fonction aleatoire
` titre de precision, on sattache usuellement à letude du variogramme
dinteret. A
plutot que de la covariance, celle-ci netant pas necessairement definie dans le cadre
intrinsèque.
Lanalyse variographique constitue une etape cruciale dans un etude geostatistique :
Pierre Bosser
40
2011-2012
4.3.1
/D
PTS
elle permet posterieurement destimer les valeurs inconnues de la variable regionalisee et dassortir leur estimation dune precision.
Propri
et
es du variogramme
Propri
et
es math
ematiques :
Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est
une fonction paire, nulle pour ~h = ~0, positive et bornee. On dit que cest une
fonction de type n
egatif conditionnelle puisque elle obeit a` la relation :
k N , w1 , ..., wk R /
k
X
wi = 0, ~s1 , ..., ~sk D ,
n X
n
X
wi wj (~si ~sj ) 0
i=1 j=1
i=1
De plus,
lim
k~hk+
(~h) = C(~0)
Ce palier, C(0) est atteint au niveau de la port

ee (distance a` partir de laquelle
2 valeurs ne sont plus correlees) et correspond donc à la dissemblance maximale.
Cas intrinsèque : Dans le cas intrinsèque, la covariance nexiste pas forcement. Le
variogramme nest pas borne et augmente indefiniment avec k~hk. On a de plus :
(~h) = o+ (k~hk2 )
SG
Anisotropie Le variogramme depend à la fois du module k~hk de ~h mais aussi de

sa direction.
EN
Comportement `
a lorigine Le comportement à lorigine reflète de degre de
regularite spatiale de la variable regionalisee. On distingue usuellement trois types
de comportements :
Parabolique : cas dune grande regularite spatiale avec une variable regionalisee
derivable et daspect lisse.
Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation
continue mais plus derivable
Discontinu : saut abrupt à lorigine en raison de labsence (totale ou partielle) de
correlation entre les valeurs prises par deux sites proches. La variable regionalisee
est discontinue. On parle alors deffet de p
epite du fait de lexemple des teneurs
en or des gisements aurifères qui varient à très courte echelle.
Ces differents types de comportement sont representes sur cette figure :
Pierre Bosser
41
2011-2012
(h)
(a)
(h)
(c)
(b)
/D
PTS
(h)
FIG 30 - Differents comportement à lorigine du variogramme : (a) : comportement parabolique ; (b) : comportement lineaire ; (c) : comportement discontinu.
4.3.2
Inf
erence du variogramme
On cherche maintenant à estimer le variogramme à partie dun ensemble de donnees

experimentales {z(~si )}/~si D}.
SG
Variogramme exp
erimental : Le variogramme experimentale est calcule empiriquement à partir des observations de la variable regionalise. Il est donne par la
formule :
X
1
(~h) =
[z(~si ) z(~sj )[2
~
2|N(h)| (i,j)N (~h)
O`
u N(~h) = {(i, j)/~si ~sj = ~h/i 6= j} est lensemble des paires distinctes et |N(~h)|
est le cardinal de N(~h). En pratique, les donnees netant pas regulièrement espacees,
on definira lensemble N(~h) par N(~h) = {(i, j)/~si ~sj ~h /i 6= j}.
EN
Le variogramme experimental est un nuage de point. Le calcul sans pas induit la

restitution dun variogramme très bruite à partir duquel il est difficile de deduire
tout information ; Le choix dun calcul moyen par pas permet lobtention dun variogramme plus lisse dont les valeurs seront plus fiables.
Pierre Bosser
42
2011-2012
x 10
2
1.8
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(a)
50
100
150
200
250
150
200
250
150
200
250
h [m]
x 10
1.8
1.6
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(b)
50
100
h [m]
x 10
1.8
1.6
1.4
(h)
1.2
1
0.8
0.6
0.4
0.2
0
(c)
/D
PTS
1.6
50
100
h [m]
SG
FIG 31 - Exemple de variogramme experimental calcule :

(a) sans pas, (b) pour un pas de 5 m, (c) pour un pas de 10
m.
h
La variogramme experimental est non biaise (E (~h) = (~h)), mais sa dispersion

augmente fortement quand k~hk devient grand. Cest un estimateur peu robuste car
EN
sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en
comparaison des distances entre sites dobservation.
Mod
elisations : Le variogramme experimental permet lestimation du variogramme theorique pour un nombre defini de distances, cest-à-dire uniquement des valeurs
ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques
du variogramme (en particulier la propriete negative conditionnelle, complexe a`
etablir). Lidee est donc dajuster un modèle variographique classique presentant les
caracteristiques necessaires et defini pour un ensemble de vecteurs ~r.
Pierre Bosser
43
2011-2012
Lajustement se fait alors par moindre-carre en minimisant la quantite :
[
(~rk ) (~rk )]2
/D
PTS
On trouve dans la litterature differents types de modèle. En fonction du variogramme

experimental, on choisira le modèle variographique qui sen rapproche le plus.
Modèles isotropes avec palier :
Modèle pepitique de palier C : comportement discontinu a` lorigine. Il est caracteristique des gisements miniers, en particulier aurifères.
(r) =
(a)
(r)
pour r = 0
pour r > 0
SG
FIG 32 - Modèle pepitique.
Modèle spherique de portee a et de palier C : lineaire à lorigine.

C 3 r
(r) =
2a
1 r3
2 a3
pour 0 r a
pour r > a
EN
Pierre Bosser
44
2011-2012
(b)
/D
PTS
(r)
FIG 33 - Modèle spherique.
Modèle cubique de portee a et de palier C : parabolique à lorigine.

C 7 r22
a
(r) =
35 r 3
4 a3
7 r5
2 a5
3 r7
4 a7
pour 0 r a
pour r > a
(c)
(r)
SG
FIG 34 - Modèle cubique.
Modèle exponentiel de paramètre a et de palier C : lineaire a` lorigine.

r
(r) = C 1 e a
(d)
(r)
EN
C
0.95C
3a
r
FIG 35 - Modèle exponentiel.
Pierre Bosser
45
2011-2012
Modèle gaussien de paramètre a et de palier C : parabolique a` lorigine.

2
r2
(e)
(r)
C
0.95C
/D
PTS
(r) = C 1 e
1.7a
r
FIG 36 - Modèle gaussien.
Modèle à effet de trou : parabolique à lorigine ; il permet de modeliser un

variogramme moins stable, presentant des fluctuations autour du palier : il est
caracteristique de donnees plus heterogènes.
(r) =
1.21C
C 1
sin

r
a
r
a
(f)
(r)
SG
4.49a
FIG 37 - Modèle `
a effet de trou.
EN
Modèles isotropes sans palier : ils sont utilises dans le cadre non stationnaire
dordre 2 :
Modèle puissance dexposant et de facteur dechelle : [0; 2]. Plus est
proche de 2, plus la variable regionalisee est regulière. Plus est proche de 0,
plus son comportement est erratique.
Pierre Bosser
(r) = r
46
2011-2012
/D
PTS
(r)
(a)
FIG 38 - Modèle puissance dexposant ( = 0, 5)
Modèle lineaire de pente : lineaire à lorigine.

(r) = r
(r)
(b)
SG
FIG 39 - Modèle lineaire.
Les methodes utilisees pour des modèles non-isotropes existent mais sont plus complexes a` mettre en uvre. On cherchera en general à se ramener a` un ou plusieurs
variogramme isotrope en fonction des directions privilegiees.
4.4.1
Le krigeage
EN
4.4
Origine de la m
ethode
Le krigeage est une methode dinterpolation applicable à des donnees spatiales.

Elle sappuie sur la geostatistique lineaire, notamment le variogramme. La theorie
du krigeage a ete developpee par un mathematicien francais (G. Matheron) a` partir
des travaux de lingenieur minier sud-africain D. G. Krige. Dans les annees 50,
Krige a developpe une serie de methodes statistiques empiriques afin de determiner
la distribution de minerais à partir dun ensemble de forages.
Pierre Bosser
47
2011-2012
4.4.2
Principe
/D
PTS
Voisinage : On appelle voisinage du krigeage le domaine du champ qui contient

le site a` estimer et les donnees utilisees pour linterpolation : dans la plupart des cas,
il nest pas necessaire de prendre toutes les donnees disponibles (trop nombreuses
ou trop eloignees : le calcul en serait plus long et pas necessairement plus precis).
Les sites dinteret sont selectionnes par un critère de nombre (les n plus proches)
ou de distances (les n sites situes à une distance inferieure à rmax ). En general, 15
sites sont necessaires pour une estimation optimale (trop peu de sites peut rendre
la solution moins precise : un bon compromis est donc necessaire).
Contraintes : Lobjectif est destimer le plus precisement possible la grandeur
recherchee par une combinaison lineaire ponderee des observations. Ce critère de
precision se traduit par une minimisation de lerreur quadratique moyenne. Ces
conditions se traduisent mathematiquement en 4 contraintes.
Contrainte de linearite : Lestimee doit etre une combinaison lineaire des donnees :
z(~s0 ) =
n
X
i (~s0 )z(~si )
i=1
SG
Contrainte dautorisation : Lesperance et la variance de lerreur de prevision

z(~s0 ) z(~s0 ) doivent obligatoirement exister (cette contrainte intervient dans le
cas stationnaire intrinsèque puisquelles existent obligatoirement dans le cas de la
stationnarite dordre 2).
Contrainte de non biais : Lesperance de lerreur de prevision est nulle :
E [
z (~s0 ) z(~s0 )] = 0
Contrainte doptimalite : les poids i doivent etre estimes de manière a` minimiser

la variance de lerreur de prevision var [
z (~s0 ) z(~s0 )]
EN
Estimation : On sinteresse au cas le plus commun avec letude dune seule variable regionalisee, sous lhypothèse de stationnarite intrinsèque : on parle de krigeage ordinaire. Cest le type de krigeage le plus communement utilise.
Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.
Contrainte de linearite : Lestimee est donc une combinaison lineaire des observations :
n
X
s0 ) =
i (~s0 )Z(~si )
Z(~
Pierre Bosser
i=1
48
2011-2012
s0 ) Z(~s0 ) =
Z(~
=
=
"
n
X
i=1
" n
X
i=1
" n
X
/D
PTS
Contrainte dautorisation : On doit assurer lexistence de lesperance et de la variance de lerreur de prevision.

#
i (~s0 )Z(~si ) Z(~s0 )

#
i (~s0 )Z(~si )
" n
X
i (~s0 )Z(~s0 ) +
i=1
i (~s0 ) [Z(~si ) Z(~s0 )] + Z(~s0 )
i=1
" n
X
i (~s0 )Z(~s0 ) Z(~s0 )
i=1
" n
X
i (~s0 ) 1
i=1
Lerreur de prevision prend donc la forme dune combinaison lineaire daccroisseP

ments si et seulement si i i (~s0 ) = 1. Dans ce cas, on a bien lexistence de la
variance et de lesperance sous lhypothèse de stationnarite intrinsèque.
Contrainte de non biais : On doit sassurer que lestimateur de lerreur de prevision
est non biaise :
s0 ) Z(~s0 ) =
E Z(~
"
n
X
i (~s0 ) E [Z(~si ) Z(~s0 )] cf. equations precedentes
i=1
SG
Lesperance des accroissements etant nulle sous lhypothèse intrinsèque, on a bien

un estimateur de lerreur de prevision non biaise.
s0 )
Contrainte doptimalite : On cherche à minimiser lerreur de prevision Z(~
P
Z(~s0 ). Cette minimisation sous la contrainte i i (~s0 ) = 1 se ramène a` la recherche
des extrema du lagrangien suivant :
L(1 (~s0 ), ..., n (~s0 ), ) = E
n
X
j (~s0 )Z(~sj ) Z(~s0 )
j=1
+ 2
n
X
i (~s0 )
i=1
O`
u represente un multiplicateur de Lagrange.
Après developpement, on peut reecrire le lagrangien sous la forme :
i (~s0 )j (~s0 )ij + 2
EN
L=
n X
n
X
i=1 j=1
n
X
j=1
j (~s0 )j0 + 2 1
n
X
i=1
i (~s0 )
O`
u ij = (~si , ~sj )
Le calcul des derivees partielles premières de L par rapport aux i (~s0 ) donne les
Pierre Bosser
49
2011-2012
equations constituant le système krigeage :
Soit, pour tout i [1; n[,
n
X
j=1
/D
PTS
n
X
L
= 2
i (~s0 )ij + 2i0 2
i (~s0 )
i=1
= 0
j (~s0 )ij + = i0
Au final, le système à resoudre secrit donc :

n
P
j=1
j (~s0 )ij + = i0
n
P
j=1
j (~s0 )
Ce que lon peut reecrire sous forme matricielle :
0 12 13
21 0 23
..
..
..
.
.
.
n1 n2 n3
1
1
1
. . . 1n
. . . 2n
.
. . . ..
1
1
..
.
...
...
1
0
0
1
1 (~s0 )
2 (~s0 )
..
.
n (~s0 )
10
20
..
.
n0
1
(4)
4.4.3
SG
Notons que la mise en place du système de krigeage necessite une unique inversion
de la matrice carree de lequation de krigeage (modèle du krigeage), celle-ci etant
valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule
en chaque point. Le vecteur estime est lui aussi valable en un point.
Propri
et
es du krigeage
La variance de lerreur destimation au point ~s0 est donnee par :
EN
2 (~s0 ) = var [
z (~s0 ) z(~s0 )[
=
n
X
i (~s0 )i0 +
i=1
La variance depend donc des paramètres du krigeage (termes i ) ainsi que de la

structure spatiale de la fonction aleatoire (variogramme).
Pierre Bosser
50
2011-2012
4.4.4
Impact du mod`
ele de variogramme
/D
PTS
On evalue en un point quelconque limpact de differents modèles de variogrammes

sur lestimation de la variable regionalisee.
Les variogrammes modelises estimes à partir du variogramme experimental sont
representes sur la figure suivante. Daprès la structure de ce dernier, on choisit de
sinteresser uniquement aux variogrammes exponentiel, gaussien et a` effet de trou.
Le modèle à effet de trou semble etre le plus adequat pour representer le variogramme determine experimentalement : comportement plus conforme a` lorigine,
meilleure restitution egalement de la dispersion. Cette dispersion nest cependant
pas representative dun phenomène physique reel, sa representation nest donc pas
forcement la plus judicieuse. Elle est vraisemblablement plutot liee au manque de
robustesse de lestimateur du variogramme.
8000
7000
6000
(h)
5000
4000
3000
2000
1000
50
100
150
200
250
SG
0
0
h [m]
FIG 40 - Variogramme experimental et differents modèles

variographiques associes : modèles exponentiel (magenta),
gaussien (vert) et `
a effet de trou (rouge).
EN
Les valeurs estimees à laide du krigeage pour ces differents modèles de variogrammes, ainsi que leur precision, sont presentees dans le tableau suivant. On
constate que la variance de lestimateur est minimale pour un modèle de variogramme de type exponentiel.
Pierre Bosser
51
2011-2012
/D
PTS
Modèle
Valeur estimee Incertitude formelle
Exponentiel
653.2109
0.2729
Gaussien
660.6695
0.1796
Effet de trou
671.9119
0.4602
TAB 3 - Interpolation par krigeage en un point quelconque

pour differents modèles de variogramme.
La surface obtenue par krigeage à partir du jeu dobservation dont on dispose est
alors :
800
700
Z
240
600
220
500
200
400
180
140
160
160
180
200
140
220
SG
240
120
260
280
FIG 41 - Krigeage : application sur un champ dobservations

- vue en perspective.
Conclusion
EN
4.5
La geostatistique permet de modeliser la structure du phenomène regionalise etudie

à laide doutils simples (covariance et/ou variogramme) et de resoudre efficacement
les problèmes dinterpolation.
Letude geostatistique debute avec lanalyse variographique qui consiste a` estimer
le variogramme experimental et à le modeliser à laide dune fonction standard.
Le modèle variographique peut alors etre utilise pour construire un système de
krigeage qui permettre dobtenir des estimations locales et les variances destimation
Pierre Bosser
52
2011-2012
Conclusion
Conclusion
/D
PTS
associees.
EN
SG
Nous avons aborde deux types de methodes pour la resolution des problèmes dinterpolation spatiale :
Les methodes deterministes globales : elles permettent lestimation de la moyenne
sur un domaine donne dune grandeur mesuree en differents points dobservation.
Elles sont basees sur des proprietes purement geometriques de lechantillon dobservation.
Les methodes deterministes locales : elles sont aussi basees sur des proprietes
purement geometriques de lechantillon dobservation et ne permettent pas une
evaluation de leur precision. Il est de plus generalement difficile de conlcure quant
à la fiabilite globale dune technique deterministe.
Les methodes stochastiques : elles font appel à un modèle cense mieux sadapter
aux donnees observees. Ce modèle permet lestimation de la variable en des sites
non echantillonnes après letude de la distribution spatiale (variogramme) de la
variable.
Lutilisation de techniques de validation croisee (bootstrap) permet de controler la
conformite du modèle choisi à la realite.
Pierre Bosser
53
2011-2012

Topo 111

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Topo 111

Încărcat de

Drepturi de autor:

Formate disponibile

/D

Departement Positionnement Terrestre et Spatial

Annee Scolaire 2011-2012

Table des mati`

Table des mati`eres

1.1 Objectifs du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . .

2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22

Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22

3.4 Les surfaces de tendances . . . . . . . . . . . . . . . . . . . . . . . . . 25

Table des mati`eres

3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29

4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34

4.2 Inference statistique

Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39

4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Impact du mod`ele de variogramme . . . . . . . . . . . . . . . 51

` partir dobservations georeferencees, pas necessairement reparties reguli`erement,

On definit une variable r

z(si) pour i = 1, ..., n

Z(si) pour i = 1, ..., n

FIG 1 - Methodes deterministes et stochastiques : un

Enfin, on parle deffet d

FIG 3 - Exemple de representation dune variable regionalisee : sites dobservation.

FIG 4 - Exemple de representation dune variable regionalisee : representations planes.

FIG 5 - Exemple de representation dune variable regionalisee : perspectives.

FIG 6 - Exemple dobservations interpolees spatialement :

FIG 7 - Exemple dobservations interpolees spatialement :

Linterpolation deterministe globale

D est alors partitionne en une famille de polygone convexes, nommes polygone de

Linterpolation deterministe globale

FIG 8 - Construction des polygones de Thiessen.

FIG 9 - Decoupage en polygones de Thiessen.

Linterpolation deterministe globale

FIG 10 - Exemple de decoupage en polygones de Thiessen.

La methode des cellules consiste `a diviser le champ en cellules rectangulaires de

1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.

Lestimation globale du champ etudie est donc donne par la formule :

Linterpolation deterministe globale

FIG 11 - Exemple de decoupage en cellules.

Linterpolation deterministe globale

TAB 1 - Estimation globale par differentes methodes : estimation de laltitude moyenne.

Il est cependant plus important de pouvoir localiser / cartographier les zones de

3 Linterpolation deterministe locale

FIG 12 - Interpolation par la methode de Thiessen (plus

3 Linterpolation deterministe locale

FIG 13 - Interpolation par plus proche voisin : application

La triangulation consiste `a diviser le champ en triangles disjoints dont les sommets

Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation

3 Linterpolation deterministe locale

Tous les points sont relies `a leur plus proche voisin.

FIG 14 - Triangulation de Delaunay.

FIG 15 - Interpolation lineaire : Geometrie du probl`eme.

3 Linterpolation deterministe locale

Lequation matricielle secrit sous la forme :

On peut alors montrer que cette solution secrit sous la forme :

|~s1 , ~s, ~s2 | z3 + |~s1 , ~s, ~s3 | z2 + |~s2 , ~s, ~s3 | z1

FIG 16 - Interpolation lineaire : interpretation geometrique

Un exemple de cette methode dinterpolation est represente ci-dessous.

3 Linterpolation deterministe locale