Documente Academic
Documente Profesional
Documente Cultură
Co-habilitation
Université Paris 6, Pierre et Marie Curie
&
Université Paris 7, Denis Diderot
En partenariat avec
Université Versailles-Saint-Quentin
et
Ecole Supérieure de Télécommunication
et
Ecole Nationale des Sciences Géographiques
Rapporteurs :
Stéphane Jacquemoud
Laurence Picon
3
4
Remerciements
Je tiens tout d’abord à remercier Dominique COURAULT, la responsable de stage, pour son
encadrement et sa patience à mon égard et avoir guidé mes travaux avec un grand esprit
d’ouverture et de décision.
Je remercie également tout les personnelles de l’INRA-CSE pour m’avoir accueilli à l’unité.
J’adresse aussi ma gratitude à Marie WEISS et Nadine BERTRAND, pour m’avoir aidé et
m’avoir confié en toute générosité, leurs connaissances et compétences. Je remercie aussi
Philipe CLASTRE et Patrice Lecharpentier qui m’ont aidé sur le plan technique et lors des
problèmes informatiques.
Finalement, je remercie toute l’équipe de stagiaires et de thésards de l’unité CSE et tout mes
nouvels amis d’Avignon, pour leur sympathie et tous les bons souvenirs que nous avons
partagés tout au long de ce stage.
5
Résumé
La télédétection, dans les domaines optique et proche infrarouge (PIR), est devenue un outil
très important pour suivre la dynamique des couverts végétaux. Notre travail s’est concentré
sur la région « Crau-Camargue », zone d’agriculture intensive, sur laquelle on dispose d’un
important jeu de données de sources variées : Images FORMOSAT, mesures météo, mesures
de terrain.
Le but de notre travail a été d’estimer à partir d’une série d’images FORMOSAT acquise de
Mars à Octobre 2006 sur ce site, les principales variables biophysiques caractérisant les
surfaces : indice foliaire (LAI), fraction de végétation : (fcover).
Pour réaliser ce travail, la première étape a été d’établir des cartes d’occupation du sol du site
d’étude en effectuant des classifications. Nous avons pour cela analysé le comportement
spectral des principales surfaces présentes sur la zone. La seconde partie de notre travail a
consisté à estimer l’indice foliaire à partir des images FORMOSAT (on disposait de 32
images de mars à octobre 2006). Nous avons appliqué pour cela un algorithme basé sur
l’utilisation d’un réseau de neurones calé à partir de simulations effectuées par un modèle de
transfert radiatif (SAIL couplé à PROSPECT, Jacquemoud et al., 1998) (appelé ici modèle
NNT, Weiss et al,. 2002). Les premiers résultats sont présentés dans ce rapport. La dynamique
des principales cultures est bien reproduite par le modèle. En revanche les valeurs de LAI
estimées sont très inférieures aux mesures. Ceci peut être dû aux sols de Crau mal représentés
par le modèle. Les résultats sont comparés avec des relations empiriques plus simples utilisant
que l’indice de végétation (NDVI). On observe que l’on arrive relativement bien à reproduire
le comportement de couverts bas tels que le blé, mais assez mal les couverts tels que le riz ou
les prairies irriguées qui ont des valeurs de LAI très élevées et conduisent à des saturations du
NDVI. Quelques pistes d’améliorations de ce travail sont envisagées à la fin de ce mémoire.
6
Abstract
During last years, lots of earth’s observation satellites are used on the agricultural domains. In
fact, in the visible and NIR fields, the Remote Sensing can become an interesting tool for
vegetation monitoring and we can relate radiometric information to biophysical
characteristics. This work is focused on the region of Crau-Camargue, intensive agricultural
zone, where a large number of the data is available: IGN maps, ASTER & FORMOSAT
images, meteorological measurements, ground truth observation, etc.
The most important goal of this study is to estimate the principal biophysical parameters of
surface characterisation, by using a temporal image crop of FORMOSAT since March 2006
to October 2006 (Leaf Area Index (LAI), vegetation fraction (fCover)).
To carry out this point, first we need to instate and up date the ground surface map of region
by applying a semi-automatic classification. For this, we analyse the spectral behaviour of
principal regional vegetational cover types. Secondly, the estimation of the leaf index via the
FORMOSAT images (32 images, March-October 2006 are in our disposition). Here we apply
an algorithm based on the neural network inversion model which is optimized to use the
simulated reflectance by the radiative transfer model (SAIL coupled with PROSPECT,
S.JACQUEMOUD et al., 1998), named NNT (M.WEISS et al., 2002). The first results are
presented in this work. The dynamics of the principal covers are regenerated with this model,
but the estimated LAI values are much lower than the observation. This mismatch could be
explained by the ill existence of dry soil of Crau in the model. The results are compared with
the empiric relationships, easily calculated, by using only the vegetation index (NDVI). We
can see that the estimations are more or less valid for the low covers as wheat, but not
excellent for high covers as prairie or rice which have the high NDVI (maybe by reaching the
saturating limit). Finally, some propositions to improve the estimation are presented in this
manuscript.
7
Table des matières
REMERCIEMENTS 5
RESUME 6
ABSTRACT 7
INTRODUCTION 14
1 PRESENTATION DU STAGE 15
8
2.3 Les principales variables biophysiques 19
2.3.1 Définition de l’indice foliaire 19
2.3.2 Méthodes d’estimation de l’indice foliaire 19
3 DEROULEMENT 28
DISCUSSION ET CONCLUSION 40
BIBLIOGRAPHIE 41
9
Liste des tableaux
10
Liste des figures
11
Liste des annexes
ANNEXES 43
12
Glossaire et sigles utiles
13
INTRODUCTION
Dans des domaines divers, tels que l’écologie ou l’agronomie, la télédétection optique est
devenue une technique indispensable du fait de sa capacité à fournir des informations
synoptiques à différentes résolutions spatio-temporelles.
Dans le domaine de l’agronomie, La gestion de l’eau à l’échelle d’une petite région agricole
est un problème qui devient de plus en plus préoccupant, d’autant plus important ces dernières
années en raison du changement climatique et des périodes de sécheresse plus longues
survenant à des périodes clés pour le développement de nombreuses cultures. Il apparaît donc
crucial de pouvoir suivre avec précision l’état hydrique des surfaces afin de pouvoir mieux
contrôler les apports d’eau. Il est nécessaire pour cela de connaître l’état de développement de
la végétation, et sa variabilité spatiale à l’échelle de la zone étudiée.
Les données de télédétection, notamment acquises dans les domaines visible au proche infra
rouge, nous permettent à répondre à ce besoin. La végétation a un rythme d’évolution assez
rapide. D’après les scientifiques, le suivi de la végétation nécessite une image tous les 10
jours et une résolution adaptée aux parcelles agricoles, soit inférieure à 20 mètres. Pour cette
raison, nous avons utilisé dans ce travail des données issues du satellite FORMOSAT (dont
nous présenterons les caractéristiques plus loin). Les caractéristiques de FORMOSAT sont
proches de celles de la future mission Venµs1. Les résultats obtenus au cours de ce travail
devraient permettre d’avoir une première évaluation des possibilités offertes pour ce nouveau
capteur.
- Le chapitre 1 est consacré à la présentation de notre étude, dans quel contexte elle se situe,
quels étaient les objectifs. Nous décrirons également dans ce chapitre brièvement le site et le
jeu de données disponible.
- Le chapitre 4 présente les premiers résultats obtenus et leur comparaison aux mesures
terrain.
1
Mission Franco- Israélienne, (Végétation and Environment monitoring on a New Micro-Satellite).
Période de revisite de 2 jours, avec 12 bandes spectrales accompagné une résolution spatiale de 4m.
14
1 PRESENTATION DU STAGE
L’objectif du stage est d’utiliser une méthode d’estimation des variables biophysiques
caractérisant la structure du couvert végétal sur une série d’images du satellite FORMOSAT,
récemment acquise sur la région Crau-Camargue en 20062. Ces images présentent l’intérêt
d’avoir une répétitivité temporelle élevée (tous les 3 jours) et une résolution spatiale fine
(8m), particulièrement bien adaptées pour un suivi fin du développement du couvert à
l’échelle de la parcelle. Plus de 32 images claires sont ainsi disponibles de mars à fin
septembre sur cette zone d’étude. Une expérimentation s’est déroulée également en 2006 sur
ce site avec de nombreuses mesures au sol (LAI, biomasse, flux…).
Cette étude s’insère dans un contexte plus général répondant à un projet inter-régions Midi –
Pyrénées-Provence Alpes-Côte d’Azur, dont le but était de quantifier l’impact des pratiques
culturales sur les variations climatiques et les flux (tels que l’évapotranspiration) à l’aide de
modèles simulant les transferts entre le sol, la plante et l’atmosphère et de données de
télédétection, en vue d’améliorer les prévisions d’alerte au développement de parasites, et de
mieux gérer les intrants des cultures (eau,azote) à l’échelle d’une région agricole (Courault et
Jacob, 2006).
Une des étapes importantes de ce travail est de caractériser les différentes surfaces, afin de
fournir des entrées spatialisées des principales variables caractéristiques des cultures aux
modèles de transfert radiatif.
Notre travail a porté sur l’estimation des principales variables biophysiques (LAI, fCover) à
partir des images FORMOSAT en utilisant la méthode développée dans le laboratoire CSE de
l’INRA Avignon par Marie Weiss et Frédéric Baret (2002), et basée sur l’utilisation d’un
réseau de neurones calé à partir de simulations effectuées par un modèle de transfert radiatif
(SAIL couplé à PROSPECT). Il s’agira ici 1) d’adapter la méthode aux données FORMOSAT
et 2) de valider les estimations par comparaison aux mesures au sol. Au préalable, nous avons
effectué une classification de l’occupation des sols à partir de ces images et analysé les profils
temporels de réflectances et de divers indices de végétation sur les principaux couverts de la
région afin de mieux comprendre le comportement des parcelles de la région étudiée.
2
Images fournies gratuitement par SPOT image dans le cadre d’un contrat
15
est fortement irriguée par un réseau dense de canaux. Les cultures dominantes sont les prairies
avec une valeur économique très importante (AOC foin de Crau exporté partout dans le
monde). La canalisation artificielle dans la Crau sèche a fait apparaître quelques grandes
zones de vergers au milieu d’une zone du sol nu et caillouteuse.
La seconde partie du site étudié est la Camargue située entre deux bras du Rhône, avec une
forte proportion de cultures de riz et de blé, et de grandes zones naturelles humides
(sansouïre, marais).
Crau
humide
Crau sèche
Camargue
50 km * 36km
Le satellite taïwanais FORMOSAT, lancé en 2004, a été développé dans le cadre du « plan
national à long terme de développement des technologies spatiales ».
16
Mode et résolution Panchromatique : 2m
Multispectral (B,V,R,PIR) : 8m
Bandes spectrales Pan : 500-900 nm
B1 (bleu) : 450-520 nm
B2 (vert) : 520-600 nm
B3 (rouge) : 630-690 nm
B4 (PIR) : 760-900 nm
Emprise 50km*36km
Revisite/angles de visée Délai de revisite de 1 jour
Programmation L’acquisition simultanée des images pan et multispectral est possible
Dynamique de l’image 8 bites/ pixel
Les images FORMOSAT dont nous disposons, ont été acquises tous les 3 jours à la même
heure (10:30TU) et globalement avec le même angle de visée (en moyenne 40° azimut). Les
images sont centrées sur le photomètre du CNES situé en Crau sèche. Ces données ont été
corrigées des effets atmosphériques et recalées par rapport à un référentiel géographique
(orthophoto) en Lambert 2 par Olivier Hagolle (CNES Toulouse). 36 images multi-spectrales
(du 12 mars au 9 octobre 2006) ont ainsi été traitées. Certaines dates comportent des nuages
sur une partie de notre zone d’étude et ont été éliminées sous traitement.
Le DVD reçu contient d’une part des images comportant chaque bande : bleu vert rouge PIR
(séparément) et d’autre part des synthèses temporelles effectuées par le CNES. Les synthèses
choisies ici correspondent à une « fusion » de n dates sur 14 jours (4 dates maxi suivant les
acquisitions). L’image résultante est la moyenne des pixels sur plusieurs images. On trouve
15 synthèses sur le DVD.
Nous avons travaillé dans un premier temps sur les synthèses pour effectuer des
classifications de l’occupation de surface et analyser quelques profils d’indices de végétation
sur divers couverts, puis nous avons travaillé sur toutes les dates pour estimer les variables
biophysiques en utilisant les 3 bandes suivantes V, R, PIR.
Toute la partie de classification et de saisie des échantillons des différents couverts ont été
effectué avec le logiciel ENVI. Les calculs, les graphes et toutes les estimations de variables
biophysiques sont effectués par langage de programmation MATLAB.
17
2 RAPPEL DE QUELQUES CONCEPTS DE BASE ET
DES METHODES DE MESURES DES VARIABLES
BIOPHYSIQUES
Il existe deux grandes familles de classification pixel par pixel : les classifications non
supervisées (l’agrégation se fait autour de centres mobiles) et les classification supervisées
(par maximum de vraisemblance) avec le choix de zones de référence. Il existe encore un
autre type de classification basé sur l’analyse de la texture orientée objet que nous n’avons pas
testé ici car pas disponible sous ENVI (logiciel utilisé).
PIR − R
NDVI =
PIR + R
Cet indice est facile à calculer et donc très utilisé, cependant il faut noter qu’il est sensible aux
conditions atmosphériques et aux sols. Il risque aussi de saturer pour des couverts de
végétation très dense.
a ( PIR − aR − b)
TSAVI =
R + aPIR − ab + 0.08(1 + a 2 )
C’est un indice qui minimise l’effet de le brillance du sol pour l’estimation de LAI et fAPAR
(Baret, F et al,. 1989) .
18
PIR − G
GNDVI =
PIR + G
Le LAI de la végétation dépend de la composition des espèces, des stades de croissance et des
conditions dominantes des sites. C’est un paramètre dynamique qui varie en fonction des
saisons, (Welles, 1990). On trouve les valeurs les plus hautes pour des canopées de
conifères.par exemple Beadle (1993) présente les valeurs maximums entre 6 et 8 qui sont
typiquement observées pour des forêts de caduque et entre 2 et 4 pour les cultures annuelles.
Schulze (1982) a trouvé que le LAI pour la plupart des biomasses (à part des déserts et des
toundras) varie entre 3 et 19. La valeur la plus haute est celle de forêt de conifères boréals.
Les méthodes indirectes utilisent des capteurs optiques et sont non destructives et plus
rapides. Elles permettent donc un échantillonnage spatial et temporel plus important. Quelle
que soit le capteur utilisé, le LAI est estimé à partir de mesures de la fraction de trou. Le
modèle généralement utilisé en mode inverse est le modèle de Poisson (Monsi et Saeki, 1953 ;
Welles et Norman, 1991), qui suppose que les feuilles sont opaques et distribuées de façon
aléatoire à l’intérieur du couvert. On peut utiliser différents capteurs pour estimer cette
fraction de trous
Une photographie hémisphérique est une photographie réalisée avec un objectif « fish-eye »
dont le champ de vue est 180° en zénith et 360° en azimut. La fraction de trou est calculée à
partir d’une image binaire où chaque pixel est classé en trou ou végétation. Les photos
peuvent être réalisées par-dessus ou par-dessous le couvert, ce qui permet de caractériser aussi
les couverts et les cultures, (Figure 2 ).
Plusieurs logiciels sont aujourd’hui disponibles pour calculer la fraction de trou à partir des
photographies, et estimer le LAI et certains autres paramètres structuraux de la végétation.
Les mesures utilisées dans ce travail ont été traitées avec le logiciel CAN-EYE
(http://www.avignon.inra.fr/can_eye/). Ce logiciel permet d’analyser un lot de N
photographies à la fois. La fraction de trou est estimée à partir d’une classification supervisée
réalisée sur le lot de photographies (Annexe 5). Les sorties du logiciel CAN-EYE sont les
suivants :
20
Figure 3: Les étapes principales de logiciel CAN-EYE
Le LAI vrai (LAItrue) est défini comme la surface de feuille verte par unité horizontale de
sol sans considérer l'agrégation des plantes (correspond la mesure traditionnelle destructive de
LAI: coupe de toutes les feuilles sur 1m2 de sol, mesure de leur surface par planimetre)
Le LAI effectif (LAIeff) est relié au LAI vrai selon l’équation LAIeff = λ *LAItrue. C’est une
sorte de LAI apparent, résultant de l’agrégation à l’intérieur du couvert. λ est appelée
paramètre d’agrégation et dépend de la structure du couvert, c’est-à-dire de la position relative
des plantes et des feuilles dans le couvert végétal. La taille et la forme des feuilles sont
également des facteurs de variabilité de λ.
Concernant les sorties de CAN-EYE, il y a également le LAI57, qui est un LAI effectif estimé
à partir de la fraction de trou dans une direction donnée particulière (57°5). LAIeff et LAItrue
sont, par contre, estimés à partir de la totalité de la variation directionnelle de la fraction de
trou.
Si l’on suppose une distribution ellipsoïdale des feuilles, l’angle moyen d’inclinaison des
feuilles (ALA) représente l’angle moyen de cette distribution (par ex, pour une distribution
planophile, ALA est faible et l’ellipsoïde est plate).
21
2.3.2.2.2 Mesures indirectes du LAI par Télédétection
De part la complexité des interactions entre le rayonnement et les surfaces végétales, les
relations utilisées pour relier le LAI aux données de télédétection ont souvent été établies
empiriquement à partir du calcul d’indices de végétation (Rouse et al., 1974 ; Huete 1988 ;
Kaufman et Tanre, 1992 ; Qi et al., 1994). Ces approches consistent à relier par des équations
simples la réflectance spectrale des couverts végétaux à certains paramètres biophysiques. Les
indices de végétations ont ainsi été très souvent utilisés pour estimer le LAI. L’ Équation 1
illustre une telle relation empirique (Eldaw Elwadie, M et al., 2003) :
Équation 1: LAI = aX 3 + bX 2 + cX + d
Où X est une variable liée aux réflectance (NDVI) dérivé des données de télédétection et les
coefficients a, b, c, d sont les paramètres empiriques. Les coefficients varient avec le type de
végétation.
Il existe un autre modèle théorique (WEISS, M., et al., 2000) permettant de calculer le LAI
d’une surface agricole :
22
Figure 4: Relation classique entre le NDVI et LAIeff (WEISS, M., et al., 2000)
Le LAI peut être estimé par inversion à partir des mesures de la réflectance. Les modèles les
plus souvent inversés sont basés sur l’hypothèse que les éléments du couvert sont
uniformément distribués, ce qui est très rarement vérifié dans la réalité. Les sorties des
modèles physiques décrivant le transfert radiatif dans l’atmosphère et la végétation sont par
exemple exploitées par des réseaux de neurones pour estimer le LAI à partir des observations
des satellites.
Nous décrivons ici la méthode développée dans laboratoire CSE de l’INRA Avignon par
Marie. Weiss et Frédéric. Baret, 2002, et basée sur l’utilisation d’un réseau neurones calé à
partir de simulation effectuée par le modèle de transfert radiatif SAIL couplé à Prospect
(Jacquemoud .S, 1999).
L’outil a été développé sous forme de routine Matlab à partir des programmes existant pour le
projet CYCLOPES à l’INRA-CSE. Le principe du réseau de neurones est assez simple : on
construit une base d’apprentissage décrivant l’ensemble des situations que l’on va rencontrer
dans l’application du réseau (par exemple, pour une image FORMOSAT sur un site agricole,
on limite par exemple le LAI entre 0 et 6). Les situations sont décrites d’une part, par les
variables à estimer (LAI, fAPAR, fCover, Cab…), et d’autre part par les réflectances « Top of
Canopy (TOC)» ou « Top of Atmosphere (TOA) » correspondantes dans les bandes
considérées comme utiles d’un capteur donné. On définit ainsi des distributions pour chaque
variable que l’on discrétise en un nombre de classes déterminé.
Les tirages des différents cas (un cas étant une combinaison de chacun des paramètres
tiré selon la loi pré-définie ci-dessus) sont optimisés selon un plan d’expérience numérique
(hypercube latin) de manière à échantillonner au mieux l’ensemble des possibilités.
Frequency(%)
Frequency(%)
Frequency(%)
Frequency(%)
Frequency(%)
Cab Cbp N LAI ALA
Frequency(%)
Frequency(%)
Frequency(%)
Frequency(%)
Cdm Cw_Rel HotS vCover
Figure 5: Histogrammes des paramètres estimés par méthode NNT (voir Tableau 3 pour les
descriptions des paramètres utilisés)
Les bases de données synthétiques sont construites à l’aide des modèles PROSPECT (modèle
de propriétés optiques des feuilles supposées lambertiennes) et SAIL (modèle 1D de transfert
radiatif dans le couvert), Les spectres de sol (considéré comme lambertien) utilisés pour
construire la base d’apprentissage sont fournis par un fichier auxiliaire qui peut-être modifié
en fonction de données expérimentales par exemple. Les spectres de sol dans ce fichier sont
ensuite multipliés par un facteur de brillance Bs, permettant de réaliser l’ensemble des
situations rencontrées (par exemple si le sol est plus ou moins humide).
Soil reflectance
Wavelength (nm)
24
Il est également possible de décrire des pixels mixtes (cas des capteurs large champ) en
utilisant la variable vCover qui décrit un pixel composé d’une partie de sol nu et d’une partie
de végétation. Dans notre cas le pixel de Formosat étant de 8m (dont les sensibilités spectrales
sont illustrées (Figure 6), on considère que le pixel est homogène donc vcover=1).
Spectral Sensitivity
Wavelength (nm)
L’utilisateur peut également rajouter un bruit aux réflectances simulées. Il est caractérisé par
un écart-type et un biais selon l’équation suivante :
Finalement l’ensemble paramètres d’entrée nécessaires au modèle est décrit dans le (Tableau
3).
Tableau 3: Description des paramètres d’entrée des modèles utilisés pour simuler la base
d’apprentissage des réseaux de neurones.
Le schéma ci dessous présente le couplage des différents modèles avec leurs entrées et sorties
respectives.
25
Géométrie τ 55, Patm , C w , CO
3
θ 0 ,θ s , φ
RTOC (λ )
Leaf optical ρ (λ ) Canopy
Réflectance
properties τ (λ )
SAIL
PROSPECT fAPAR
fCover
Background
Reflectance Rs (λ )
Data base
Soil type
Bs
Figure 8 : Schéma descriptif de l’enchaînement des modèles utilisés pour simuler les bases
de données synthétiques (Weiss 2005).
L’outil réseau de neurones a ensuite besoin de connaître la configuration de visée (entrée par
l’utilisateur) et une configuration solaire (entrée ou calculée à partir des données de latitude,
longitude, date et heure d’acquisition entrées par l’utilisateur).
La base de données synthétiques générée est ensuite divisée en trois jeux de données
‘indépendants’ : un jeu d’apprentissage sur lequel on calibre le réseau de neurones, un jeu de
test qui permet d’évaluer les performances du réseau et un jeu d’hyperspécialisation
permettant, durant l’apprentissage, d’éviter l’hyperspécialisation du réseau sur le jeu
d’apprentissage
26
L’architecture (nombre de couches cachées et nombre de neurones par couche) est définie par
l’utilisateur. Les fonctions de transfert utilisées sont des fonctions tangentes sigmoïdes
(Équation 4), sauf pour le neurone de la dernière couche qui est caractérisé par une fonction
de transfert linéaire (y=x). Pour permettre d’augmenter les performances de convergence du
réseau de neurones, les variables d’entrée et de sortie sont normalisées de la manière
suivante :
x−x
Équation 4: x* =
σ (x)
où x est la moyenne de la variable x et σ(x) son écart-type, tout deux évalués sur la base
d’apprentissage.
Les variables d’entrée du réseau sont différentes selon le choix des conditions d’observation
décrites en (Tableau 3), et le choix par l’utilisateur d’utiliser en entrée des réflectances TOC
ou TOA.
Des critères de performances sont calculés sur l’estimation des principales variables, des
graphes montrant les relations entre LAI/FAPAR .LAI/FCOVER sont tracés afin d’analyser si
le réseau a correctement fonctionné et évaluer les résultats (Figure 9)
LAI & fAPAR learning database values LAI & fAPAR estimated from NNT
fAPAR
Residuals FCOVER
LAI LAI
27
3 DEROULEMENT
Pour étudier les images, nous avons sélectionné des zones de références (appelées ici ROIs)
sur lesquelles on connaît l’occupation de surface). Pour cela nous avons utilisé les divers
documents élaborés par Nadine Bertrand (cf base de données
/3W/avignon.inra.fr/wenge2/depotpaysage/crau2006).
Ce qui nous intéresse est de calculer les statistiques sur ces ROIs, sur chaque bande spectrale
et pour chaque date et de les comparer. L’image comporte des secteurs très différents que
nous avons séparé en 4 zones :
Zone 1 : la Crau humide, constituée des champs de blé, de la prairie, du maïs, (et un peu de
riz).
3
1
2
4
Les graphiques qui nous intéressent de plus, sont tout d’abord les profils des NDVI moyennés
sur chaque zone.
28
Figure 11: NDVI moyenne de chaque zone
Un des buts de ce stage est d’établir la carte d’occupation du sol. Nous avons comparé
différentes méthodes de classifications en choisissant seulement quelques dates dans les
synthèses, pour éviter la taille immense d’images à traiter. Nous avons utilisé pour cela
quelques fonctions de ENVI qui permettent de fusionner les images de différentes dates et
avoir une seule image dont les bandes sont les dates souhaitées. Sur ENVI, il existe plusieurs
choix de classification, non supervisée et supervisée et, pour cette dernière catégorie, on peut
choisir une méthode basée sur le maximum de vraisemblance ou sur la distance minimale.
Nous avons comparé les différentes approches. Finalement nous avons retenu la classification
supervisée basée sur le calcul du maximum de vraisemblance, qui tient compte de chaque
image séparément ; (car la méthode « minimum distance » basée sur la distance euclidienne
des comptes numériques des pixels, prend la valeur moyenne des dates pour une classe
donnée ce qui peut conduire à des confusions entre couverts qui ont des profils temporels
différents mais dont la moyenne est identique).
Dans un premier temps, la classification est lancée sur une image dont les bandes sont 5 dates
que nous avons choisi représentative pour caractériser l’évolution des principales cultures:
12/03 21/05 18/06 16/07 13/08. Plusieurs classifications ont été testées, avec différents
nombres de classes et combinaison des dates.
Les cartes obtenues ne sont pas complètement satisfaisantes. Malgré de nombreux essais,
nous avons souvent observé des confusions entre classes, notamment entre la zone de marais
avec toutes les autres zones, surtout la ville, à cause sa nature très hétérogène. Par contre, les
champs du blé, les parcelles du riz, le bois et la Crau sèche sont relativement bien classés
(Figure 12).
29
Figure 12: Carte d'occupation du sol, maximum de vraisemblance, 12 classes,
kappa=0.9916
Pour cette partie nous avons considéré les valeurs du LAI effectif estimés à partir du
traitement des photos hémisphériques faites sur différents couverts végétaux que nous avons
comparé aux NDVI calculés pour les mêmes zones à chaque date FORMOSAT (localisation
sur Figure 13).
30
Blé S2 S3
Prairie
S4
Maïs
Riz 3
Blé S1 Riz 2
Riz 1
Les mesures effectuées sur le terrain ne sont pas forcément effectuées aux mêmes dates que
les acquisitions d’images aussi une interpolation temporelle est-elle nécessaire (Équation 5).
Cette interpolation a été faite différemment suivant les cultures considérées. En effet, pour le
blé, le maïs ou le riz, les courbes d’évolution du LAI en fonction du temps ont une forme
connue. Des modèles de fonctionnement du couvert tel que le modèle STICS (Brisson et al,
1998) permettent d’estimer le LAI en fonction des sommes de températures depuis le semis.
Nous avons utilisé le modèle proposé par (Baret, 1982) qui simule l’évolution du LAI en 2
parties : la croissance et la sénescence suivant un modèle à 5 paramètres : K , a, Ti , b, T f
1 j
Équation 5: LAI ( j ) = k * − exp(a * ( S ( j )) S ( j) = ∑T mj (°C )
1 + exp(−b * ( S ( j ) − Ti )) levée
k : LAI maximal
Ti :
Somme de température correspondante de point b
Tf :
Somme de température finale de la courbe de croissance
31
Figure 14: Exemple d’interpolation temporelle du LAIeff pour le blé
Pour la prairie, l’évolution du LAI est pilotée à la fois par les coupes, les irrigations, etc.
Ayant beaucoup de mesures, nous avons choisi une interpolation linéaire entre chaque coupe
La Figure 15 montre les différents profils de LAI obtenus sur les couverts étudiés.
32
1) on remarque que les valeurs de LAI pour la prairie irriguée sont très élevées. Il faut signaler que
c’est un couvert toujours bien alimenté en eau, très vert et complètement couvrant. Plusieurs méthodes
d’estimation de LAI ont été comparées sur le terrain par N.Bertrand et montrent une bonne
correspondance entre mesures.
2) les valeurs de LAI obtenus pour le blé sont relativement faibles. Ceci est dû à deux raisons, le blé
en Crau n’est pas très bien développé en raison des sols pauvres peu profonds et caillouteux, et l’année
climatique a été particulièrement sèche au printemps 2006 ne favorisant pas le développement des
cultures de céréales.
Néanmoins, on peut observer que le jeu de données présente une variété de couverts et donc une
gamme de valeurs assez étalée qu’il sera intéressant de confronter aux estimations faites à partir de
FORMOSAT.
Les estimations de LAI sont déterminées à partir de la génération d’une base d’apprentissage.
.La première étape est de préparer les fichiers d’entrée. Ceci se fait dans un fichier Excel, qui
est lu ensuite par différentes routines (MATLAB). Les informations nécessaires sont sorties
des fichiers d’entête des images, disponibles sur le DVD.
2 choix sont possibles pour appliquer l’algorithme de NNT sur notre série d’image. Soit on
choisit un réseau pour chaque date (contenant l’heure précise d’acquisition de l’image et
l’angle et l’azimut de visée). Soit on choisit un réseau pour toutes les dates (contenant la
moyenne des heures de prise des images et aussi celle des angles ici moyenne angle de visée=
40°). Nous avons fait des essais pour les 2 cas.
La première étape est de faire tourner le programme qui génère les données nécessaires pour
l’algorithme de réseaux de neurones. N simulations sont effectuées par SAIL-PROSPECT
suivant les distributions des classes choisies. On obtient en sortie des figures montrant les
performances du réseau, les statistiques des variables à estimer, les histogrammes des lois de
distributions, etc. (Figure 9)
L’étape suivante est ensuite d‘appliquer le réseau ainsi calibré aux images de réflectances
FORMOSAT pour obtenir des cartes de LAI, fCOVER et FAPAR. Pour cela on a besoin
d’avoir les réflectances dans les 3 bandes à chaque date dans un format matlab et sur une
petite zone pour ne pas avoir des problèmes de mémoires. Ainsi, on a fait tourné le
programme pour 2 zones de 500*500 pixels, (une en Crau humide (blé, prairie, maïs) et
l’autre en Camargue (riz) (Figure 13)).
33
4 PRESENTATION DES RESULTATS
La relation LAI estimé par photos hémisphériques via Can-eye et le NDVI dérivé des images
FORMOSAT est représentée ci-dessous en séparant dans un premier temps chaque type de
couvert. Ainsi pour le blé on obtient une relation linéaire.
Pour la prairie, le couvert étant beaucoup plus dense, les valeurs de LAI sont très élevées, on
observe plus de dispersion, le NDVI sature. On propose une relation faisant intervenir le
NDVI en exponentiel.
34
Enfin si l’on considère l’ensemble des couverts présents sur la zone, on obtient la Figure 18 .
Le modèle ajusté ne convient que pour des NDVI >0.2
Au final si l’on regroupe l’ensemble des résultats sur un même graphe et que l’on compare
avec les relations simplifiées utilisant le NDVI, on voit que le résultat est meilleur si l’on se
base sur des relations simplifiées de type d’Équation 1.
L’équation obtenue dans cette partie est de type d’Équation 1, qui peut être représentante de
relation entre NDVI et LAI pour l’ensemble des couverts.
Pour trouver la relation entre fCover et NDVI, nous avons besoins de valeurs de fCover
interpolées. Mais nous n’avons pas une équation précise qui nous permet d’interpoler les
valeurs de fCover sorties de logiciel Can-eye, comme celle qui existe pour LAI (Équation 5).
Pour cela, nous avons utilisé la relation entre LAIeff mesuré et fCover mesuré (par Can-eye),
qui nous donne l’équation qui relie LAIeff et fCover mesuré. En exploitant cette relation sur
les valeurs LAIeff interpolées, on aura le tableau de fCover interpolé (Figure 19) et nous
pouvons trouver la relation entre fCover mesuré et le NDVI (Figure 20).
35
Figure 19 : Relation entre LAI eff mesuré et fCover mesuré
L’équation présentée pour la relation NDVI/fCover, est aussi d’un type simplifié polynomial
qui est calculée à la base des mesures pour le bléS1.
36
0516 0708 0822
On remarque que les valeurs les plus élevées sont toujours pour la prairie avec cependant des
fluctuations importantes au cours du temps, valeurs maximales (>6) juste avant les coupes
vers le 11/5 le 7/7 et le 22/8, puis des valeurs entre 0.5 et 1 en début de cycle après la fauche.
Ces variations de LAI dues aux pratiques (coupes, irrigation) se voient nettement sur les
images où l’on peut identifier précisément quelle parcelle a été fauchée en premier et suivre le
travail de l’exploitant comme le montre les figures
Si la variabilité spatiale observée sur ces cartes semble représenter correctement la variabilité
rencontrée sur la zone, (les différences sont bien marquées entre blé, prairie, maïs), en
revanche la confrontation aux mesures faites aux sols montrent pour tous les couverts une
forte sousestimation du LAI estimé avec FORMOSAT quelle que soit la culture, comme le
montrent les figures ci-dessous.
37
Figure 23 : Les résultats schématiques des estimations par NNT
38
Les estimations pour les 2 champs de blé montrent plus ou moins l’allure générale de la
courbe des mesures. Des points aberrants restent à vérifier précisément pour les dates
correspondantes.
La courbe de maïs montre des comportements bizarroïdes au début du cycle. Cela peut être à
cause d’existence d’une autre culture (luzerne, probablement), qui a été coupé en mois de Mai
et remplacé par le maïs.
Nous avons choisi 4 zones du riz différent (Figure 13). La date pour la quelle nous avons le
LAI maximal est la même pour toutes les zones, et corresponde très bien au pic des mesures.
Mais on a toujours le même problème : l’écart remarquable entre les mesures et les
estimations.
On retrouve bien les variations temporelles, mais ayant une amplitude beaucoup plus faible,
pour tous les couverts. Pour le blé, la différence est de l’ordre de 0.5, et pourrait rester
acceptable, mais pour les couverts à fort développement maïs et prairie les écarts sont
supérieurs à 2 voir 4 pour la prairie. Figure ci-dessous montre les écarts importants pour
différentes zones. Comme déjà marque, le maximum d’écart correspond à la prairie.
39
DISCUSSION ET CONCLUSION
Cette étude nous a montré les possibilités d’utilisation des données FORMOSAT pour suivre
la dynamique des couverts végétaux, notamment estimer les variables biophysiques de la
végétation (LAI, fAPAR, fCOVER).
Ce stage comporte deux phases distinctes, 1) relier les informations dérivées des images
FORMOSAT aux variables biophysiques mesurées (observation terrain) par des relations
empiriques et 2) estimer ces variables en utilisant un algorithme basé sur des réseaux de
neurones.
Dans un premier temps on a établi des équations entre le NDVI et le LAIeff dérivé du logiciel
Can-eye à partir des photos terrain. Les équations ne sont pas identiques pour tous les types
des couverts. Dans le cas où le NDVI est inférieur à 0.6, on peut considérer la relation
NDVI/LAI comme une équation linéaire. Par contre, pour les NDVI supérieurs à 0.6, le LAI
croit exponentiellement, ce qui explique la relation exponentielle NDVI/LAI pour les zones
de prairie
On retrouve les variations temporelles du LAI conformément aux mesures en revanche les
estimations par réseau de neurones donnent des valeurs très inférieures aux mesures
- un point important porte sur l’impact des sols nus sur les relations obtenues. En effet
dans la base d’apprentissage nous avons utilisé une base de spectres de sols
disponibles au laboratoire et acquis sur différentes surfaces mais qui ne
correspondaient pas aux sols de Crau qui présentent en particulier une réflectance
beaucoup plus élevée que celles utilisées. C’est un point à améliorer.
- Par ailleurs il y a des points aberrants à vérifier, qui peuvent être liés aux mesures, et
/ou à la zone d’échantillonnage choisie, car quelquefois les parcelles sont hétérogènes.
40
BIBLIOGRAPHIE
Rapports imprimés
Articles de périodiques
BANARI, A., MORIN, D., BONN, F., HUETE, A.R., A review of vegetation indices.
Remote Sensing Reviews, 1995,13, pp : 95 -120.
BARET, F,. BACOUR, C., DERIVE, G., CYcLOPES Algorithmic Development foe
Estimating Biophysical Products from Large Swath Sensors. Geoscience and Remote
sensing Symposium, (France), 2003, 6: 3902-3904,
BRISSON, N., An analytical solution for the estimation of the critical soil water
fraction for the water balance under growing crops. Hydrology and earth system
science. 1998, 2: 221-231.
QI, J., CHECHBOUNI, A., HUETE, A.R., KEER, Y.H., & SOROOSHIAN, S., A
modified soil vegetation adjusted index. Remote Sensing of Environment. 1994, 48:
119-126.
ROSS, J., The radiation regime and architecture of plant stands. Junk, the Haugue,
(Netherland), 1981.
SCHULZE, E.D., Plant life forms and their carbon, water, and nutrient relations.
Encuclopedia of plant physiology, 1981, 12B: 65 -76.
41
WATSON, D. J., Comparative physiological studies on the growth of field crops: I.
Variation in net assimilation rate and leaf area between species and varieties, and
within and between years. Ann.Bot, 1947,11 : 41 :76.
WELLES, J.M., COHEN, S., Canopy structure measurement by gap fraction analysis
using commercial instrumentation. J. Exp. Bot , 1996, 47: 1335 -1342.
42
ANNEXES
43
Annexe 1 : Zones d’intérêts
Marais
Blé0
Blés2
Colza Bois
Lin prairie3
Tournesol
1 Foin
Rhône Maïs
Blé
Riz1
Riz2
Blés1
Olivier
Bois
Ville2
3
Crau sèche
2 Pêcher
Ville1
Sensouïre
44
Annexe 2 : Images FORMOSAT
Figure 26: carte des orbites et des zones accessibles par FORMOSAT
Contrairement des autres satellites à très-haute résolution, FORMOSAT garde les mêmes
paramètres de visée à chaque instant, ce qui nous permet de connaître combien des images
nous pouvons avoir. FORMOSAT visite l’équateur à 9h30 (T.U), où la plupart des autres
satellites vont passer une heure après. Cette heure de visite avancée, gouvernée avec le
revisite journalier, augmentent la chance d’acquisition des images plus utiles des régions
équatoriales, où les nuages convectifs se forment dans la matinée.
45
Annexe 3 : Méthode NNT
Base d’apprentissage :
Toc_Toa Toc
File_Soil Soil_VGT.mat
File_Mismatch Base_Mes.mat
RMSE_Mismatch 0,2
LAI_fAPAR_streamline
% 0,2
LAI_Max_Local 8
46
Exemples des cartes sorties d’algorithme NNT
12 Mars 05 Juin
27 Septembre 06 Octobre
Remarque :
Les zones qui apparaissent blanches sur ces cartes correspondent aux valeurs de LAI (NaN),
ou les valeurs très faibles.
47
Annexe 4 : Modèles de Transfert Radiatif
Les modèles basés sur les phénomènes physiques régissant la propagation du rayonnement à
l’intérieure du couvert sont classés à partir de leur mode de représentation du milieu :
Ces modèles considèrent le milieu comme un empilement de couches horizontales infini. Les
éléments foliaires sont distribués de manière homogène à l’intérieur de ces couches. Ils sont
caractérisés par leur réflectances, leur transmittance, leur distribution angulaire (LAD) et leur
surface (LAI m²/m²). Différentes méthodes de résolution des équations du transfert radiatif
peuvent alors être utilisées : méthode intégrale itérative (Myeni et al., 1991), modèles à 3 flux
(Kubelka et Munk, 1931 ; Suits, 1972), méthodes des ordonnées discrètes
(Goudrian,1977),…etc.
Ces modèles sont bien adaptés aux milieux homogènes tels que les cultures par exemple. Le
plus connu est le modèle SAIL (Verhoef, 1981). L’avantage de ces modèles est la rapidité des
simulations, ce qui permet une inversion directe avec les méthodes classiques telle que celle
du simplexe.
Ils représentent la végétation par des éléments géométriques (cylindres, sphères, ellipsoïdes,
cônes) répartis à l’intérieur du paysage. Ces éléments sont caractérisés par leur transmittance
et leur réflectances. La réflectance du paysage est une combinaison linéaire des réflectances
apparentes de tous les éléments présents, pondérées par leur section efficace. Elle peut donc
être obtenue par un calcul géométrique. Certains modèles font intervenir les diffusions
multiples (Li et al., 1995). Ces modèles sont bien adaptés à la représentation de milieux
forestiers peu denses. Leur temps de calcul peut être contraignant pour l’utilisateur en mode
inverse, qui peut nécessiter l’utilisation de méthodes spécifiques telles que les réseaux de
neurone.
Cependant, certains modèles de ce type ont été développés spécialement en vue de leur
inversion. Ainsi, le modèle film (forest-light interaction model) (Rosema et al., 1992) permet
d’exprimer la réflectance des forêts de conifères, à partir de fonctions analytiques faisant
intervenir le taux de recouvrement et le LAI. La forêt est considérée comme une couche
horizontale hétérogène, formée de couronnes d’arbres et de trous. Les diffusions multiples
sont négligées.
49
Annexe 5 : Logiciel CAN-EYE
Logiciel CAN-EYE est désigné pour traiter un grand nombre des images pour calculer les
variables caractéristiques de la canopée comme : LAI, fAPAR et fCover. Tout d’abord, il a
été développé pour les images hémisphériques. Cependant quelques extensions permettent de
traitement des autres types d’images afin d’améliorer la performance de quelques
caractéristiques de la canopée pour certaines canopées ou certaines conditions. Les
estimations des caractéristiques de canopées sont basées sur les mesures de fraction de trou, la
transmittance de lumière à travers de la canopée, en considérant que les éléments de
végétation soient opaques.
Ce logiciel est écrit en base de langage C, et il peut exploiter par différents systèmes
d’exploitation : Windows, Mac, Unix et Linux.
Prétraitement des images (masquer des parties d’images qu’on ne souhaite pas traiter,
etc)