Documente Academic
Documente Profesional
Documente Cultură
Septembre1999
Matre de stage:
Mehdi DANECH-PAJOUH
INRETS-GRETIA
Gnie des Rseaux de Transport et Informatique Avance
Remerciements
Ma reconnaissance va galement :
Monsieur Paul Deheuvels pour m'avoir permis de suivre le Dea de
statistiques.
Monsieur D. Pierre-Loti-Viaud pour sa collaboration et ses conseils.
L'ensemble du GRETIA pour sa bonne humeur et sa coopration.
1
RSUM
Ce document est un rcapitulatif de l'existant au niveau des mthodes d'estimation des matrices Origine-Destination
partir des comptages.
Il est compos de deux parties lune consacre lestimation dans un cadre statique lorsque lon ne tient pas compte
du temps, et lautre au cadre dynamique o le facteur temps intervient.
Cinq approches sont tudies dans la premire partie: l'approche gravitaire, la mthode de maximisation de
l'entropie, une approche bayesienne, une approche fonde sur le modle linaire gnralis et une approche fonde sur
le maximum de vraisemblance .
Ces mthodes ont t plus au moins appliques, selon leur nature et leur fiabilit, des cas concrets.
Par ailleurs, une grande partie de la premire partie de ce document est consacre la mthode de maximisation de
l'entropie (et/ou minimisation de l'information) vu l'intrt et la popularit de l'approche.
Les avantages et les limites de la mthode, notamment en ce qui concerne l'influence des erreurs en entre (
consistance des capteurs, matrices a priori, matrice d'affectation) ont t tudies. Une tude des modles entropiques
amliors qui prennent en compte ces dfaillances a aussi t ralise.
Dans la deuxime partie on a distingu deux types destimation : lestimation simultane qui est une extension de la
premire partie et lestimation squentielle qui considre la demande comme un processus stochastique. On a
particulirement tudi la notion de filtrage et plus particulirement celle du filtre de kalman sur lequel est fonde la
deuxime approche.
Une tude comparative des deux modles a t ralis.
Une bibliographie sommaire est finalement prcise la fin de chaque partie de ce document
2
SOMMAIRE
Introduction _________________________________________________________ 5
1.Dfinition ______________________________________________________________ 5
2.Utilits des matrices O-D _________________________________________________ 5
3.Obtention des matrices O-D_______________________________________________ 5
4.Cadre gnral et problmatique ___________________________________________ 5
5.Moyens de rsolution ____________________________________________________ 6
Notations ____________________________________________________________ 7
A. Approche Gravitaire_________________________________________________ 8
A.1. Notations, hypothses et modle _________________________________________ 8
A.2 Mthode _____________________________________________________________ 8
A.3 Le Modle____________________________________________________________ 8
Conclusion et Remarques __________________________________________________ 9
B. Maximisation de l'entropie __________________________________________ 10
B.I. Le Modle entropique ordinaire ________________________________________ 10
B.II. Les incertitudes des donnes en entres _________________________________ 11
B.II.1 La matrice daffectation ___________________________________________________ 12
B.II.2 La matrice a priori_______________________________________________________ 12
B.II.3 Les comptages des capteurs ________________________________________________ 12
B.III. Modles entropiques amliors________________________________________ 12
B.III.1 La modelisation bi-objectifs _______________________________________________ 12
B.III.2 La modelisation multi-objectifs _____________________________________________ 13
B.III.3 Quelques remarques _____________________________________________________ 14
B.IV Construction dintervalles de confiances ________________________________ 14
Remarques et commentaires _____________________________________________________ 16
C. Approche Bayesienne_______________________________________________ 17
C.I Introduction _________________________________________________________ 17
C.II modle _____________________________________________________________ 17
C.III. Conclusion ________________________________________________________ 18
D. Mthode de Maximisation de la vraisemblance __________________________ 19
D.I Introduction ________________________________________________________ 19
D.II Le modle __________________________________________________________ 19
E. Mthode des moindres carees generalisees______________________________ 20
E.I Introduction _________________________________________________________ 20
E.II. Le modle __________________________________________________________ 20
3
E.III Remarques_________________________________________________________ 20
F. Bibliographie PARTIE I ____________________________________________ 22
A.Introduction_______________________________________________________ 23
B.Hypothses et notations _____________________________________________ 25
BI. Notations globales ____________________________________________________ 25
B.II.Les erreurs de mesures _______________________________________________ 25
C.Mthodes Simultanes ______________________________________________ 27
C.I.Introduction _________________________________________________________ 27
C.II.Exemple____________________________________________________________ 27
C.III.Conclusion_________________________________________________________ 28
D.Mthodes Squentielles______________________________________________ 29
D.I.Introduction _________________________________________________________ 29
D.II.Notions de filtrage : Le filtre de Kalman _________________________________ 29
D.III.Application l'estimation de la demande de trafic ________________________ 30
E.Etude comparative des deux approches: tude d'un cas particulier___________ 34
E.I.Introduction _________________________________________________________ 34
E.II.Estimation de la demande de trafic _____________________________________ 35
F. Bibliographie PARTIE II ___________________________________________ 37
4
PARTIE 1 :ESTIMATION DES MATRICES O-D : CADRE
STATIQUE.
INTRODUCTION
Dans le cadre de la gestion du trafic en milieu urbain et inter urbain on est confront aux
problmes de l'estimation de la demande de trafic en unit de vhicules d'une zone i vers une zone
j, c'est la deuxime tape du modle quatre temps de la thorie du trafic :
Gnration : il s'agit d'tudier le nombre des dplacements mis et reus par zone.
Distribution: on essaye de calculer le nombre des dplacements entre les zones.
Choix modal : tude du mode de transport utilis.
Affectation : Il s'agit de connatre les chemins emprunts pour chaque couple Origine-
Destination
1.DFINITION
Une matrice Origine-Destination ( Matrice O-D ) est un tableau I lignes (nombre de zones
"origine" ) et J colonnes (nombre de zones de destination) dont les lments Tij reprsentent le
nombre des dplacements de la zone i vers la zone j pendant un intervalle de temps bien
dtermin k ( 24 heures, 1 heure, 15 min. etc..)
Cette matrice reprsente la demande de trafic en units de vehicule.
Les matrices O-D peuvent tre obtenues par des moyens directs notamment par des photos
ariennes et/ou par des enqutes sur routes ou domicile.
L'inconvnient de telles mthodes est qu'elles sont coteuses et leurs mises en oeuvre ainsi que
l'exploitation des donnes recueillies sont d'une dure relativement longue ( plus d'un an).
Pour remdier ces problmes on emploie une mthode indirecte qui consiste l'exploitation des
mesures recueillies par des capteurs placs sur certains tronons.
On supposera par ailleurs que les coefficients d'affectation sont indpendants du temps et ne
5
varient pas en fonction des Tij. Ces hypothses tant valables dans le cas o les itinraires ne
seraient pas saturs et le rseau ne serait pas modifi.
5.MOYENS DE RSOLUTION
Pour remdier cette incertitude on essaye de trouver soit la matrice O-D la plus probable ou la
plus vraisemblable soit la matrice O-D qui se rapproche le plus d'une certaine structure fixe au
pralable, soit on combine les deux approches.
La structure utilise est dans la plupart des cas une ancienne matrice O-D obtenue soit par des
enqutes, soit par une autre estimation.
Ces matrices dont les lments sont nots (tij) jouent un rle important et portent selon les
mthodes d'estimation utilises soit le nom de matrice de rfrence soit celui de matrice a priori.
6
NOTATIONS
Il est important de remarquer que selon le modle tudi une matrice Origine-Destination sera
reprsente soit par une matrice (NN), soit par un vecteur colonne (N1)
On introduit les notations matricielles suivantes .
Les matrices sont reprsentes par des lettres en gras de taille plus grandes que les autres :
Par exemple : T = (Tij )i , j est la matrice O-D estimer.
la notation matricielle exp(T) implique qu'on applique la fonction exponentielle tout les
lments de la matrice T .
7
A. APPROCHE GRAVITAIRE
Dans ce type de modle on suppose que les Tij ont une certaine structure, les comptages ne
servent dans ce cas qu'au calibrage du modle.
Le modle tudi est celui propos par S DEBAILLE [8] et qui a servi l'laboration du logiciel
NEMROD l'INRETS.
On suppose ici que l'on cherche mettre jour une matrice O-D partir d'une ancienne matrice.
Aij est un indicateur de relation entre le couple (i, j), et l'une des hypothses les plus importantes
de ce modle est que ce paramtre est suppos constant ( dans le temps) et symtrique.
A.2 MTHODE
La dtermination des Tij est fonde sur deux problmes de minimisation de distances
euclidiennes :
Dans un premier temps on dtermine les Aij (supposs constants par rapport au temps) partir
de la matrice de rfrence.
On ajuste en effet la structure de distribution avec le trafic de la priode de rfrence de faon a
obtenir le meilleur ajustement de la matrice de rfrence sur elle mme ( voir premier problme au
paragraphe suivant)
Dans un deuxime temps on dtermine les coefficients d'attraction et d'mission i et j
qui minimisent l'erreur quadratique entre les dbits observs et thoriques ( voir paragraphe
suivant)
A.3 LE MODLE
[log(t ) log( A )]
2
* *
Min ij i j ij
i, j
s.c Aij = A ji
8
*j = 1 j = 1,.., N
1/ N
N
t ij
j=1
*i = N i = 1,...N
t ji
j=1
Aij = t ij t ji / *i *j i, j = 1,.., N
2
m a
Min Va i jAijPij
a =1
i, j
Cette forme quadratique est rsolue moyennant un algorithme itratif .
CONCLUSION ET REMARQUES
Ce modle a t test et semble donner des rsultats satisfaisants. Cependant la matrice estime est
trs sensible la matrice de rfrence choisie et au nombre des capteurs..
L'une des hypothses les plus importante est la symtrie des coefficient Aij.
Le deuxime problme de minimisation concerne une fonction qui n'est pas convexe en (, ) elle
n'admet donc pas de minimum thorique unique. L'algorithme utilis qui consiste fixer une
variable et trouver la valeur de la seconde n'assure pas que le minimum trouv est le minimum de
la fonction (un minimum d'une fonction en avec fix ne veut pas dire que c'est un minimum
de f.).
9
B. MAXIMISATION DE L'ENTROPIE
W (Tij ) =
T!
Tij !
i, j
Le problme de maximisation s'crit alors :
Max W Tij ( )
s.c. Va = Pija Tij a = 1,.., m (1) (2)
i, j
En revanche, si on possde une matrice a priori ( t ij ), on suppose que le vecteur ( Tij ) suit une loi
t ij
multinomiale avec la probabilit qu'un individu appartienne un couple
t
Origine/Destination (i,j) donn, soit:
t ij
(Tij )i, j ~ MultinomialeT,
t i, j
Tij
t ij
La probabilit que Tij individus appartiennent un couple O-D donn est donc
t
D'o la probabilit que T individus soient rpartis sur les N couples O-D est gale :
Tij
t ij
W (Tij ) =
T!
Tij! i, j t
i, j
Le problme revient donc maximiser cette quantit sous les contraintes de comptages (1).
Van Zuylen et al (1980) [16], Willumsen (1982) [19] proposent une rsolution fonde sur le
Lagrangien :
T = Ti, j
ij
t = t
i, j
ij
10
Aprs passage au logarithme et en utilisant l'approximation de Stirling :
Log ( x! ) = xLog ( x ) x ,
aprs limination des termes constants, le problme peut tre transform en ( voir. [16] ):
T
Max S = - Tij Log ij 1 (3)
t
i, j ij
Sous les contraintes (1).
En annulant les drives partielles du Lagrangien L ( avec 1 ... m les multiplicateurs de
Lagrange), et puisque la fonction maximiser est concave on trouve :
m
Tij = t ij X a ij
Pa
(4)
a =0
Si on ne possdait pas de matrice a priori on donne aux ( t ij ) la valeur 1 pour tout couple (i,j), ce
qui rsout le problme le problme (2) cit ci-dessus.
Cette approche a t teste et valide, elle permet en effet lobtention dune matrice qui possde
une mme structure proche de celle de la matrice de rfrence et dont les coefficients (Tij)
satisfont les quations (1).
Bien que cette mthode soit trs populaire et malgr la satisfaction de ses rsultats elle prsente
plusieurs limites :
La premire est que la matrice estime est trs sensible aux variations de la matrice a priori.
Si le trafic augmente (ou baisse) dune manire sensible et puisque le modle fournit une matrice
proche de lancienne et qui reproduisent les comptages des capteurs on peut avoir des distorsions.
Pour contrecarrer ce problme Bell (1983) [2] a propos un modle qui prend en compte la
structure de la matrice a priori en rajoutant au problme de maximisation une contrainte de
proportionnalit :
T ij
=
i, j
, (5)
t ij
i, j
et qui est estime par la quantit:
V a
= a
(5)'
t P
a i, j
a
ij ij
On trouve alors
m
Tij = t ij Xaij
Pa
(6)
a =0
Le rsultat ne diffre de la solution (4) de Willumsen que par le coefficient de proportionnalit .
Ainsi le nouveau modle reste invariant si la matrice a priori est multiplie uniformment par un
certain scalaire.
De plus Bell propose lutilisation de lalgorithme de Newton-Raphson pour la rsolution du
problme de maximisation...
11
Lautre type de limitation est dun ordre plus important, en effet, les modles prsents ci-dessus
considrent les donnes en entre comme tant parfaitement exactes or on peut avoir plusieurs
types derreurs :
Les proportions dutilisation des chemins sont obtenues en gnral par des procds qui ne
peuvent tre considrs comme exacts. Et daprs Nguyen (1983), il nexiste aucune procdure
permettant le calcul de ces erreurs. On ne peut donc pas intgrer les carts causs par les modles
daffectation
Premirement cette matrice peut tre considre comme une premire estimation de la vraie
matrice or en gnral les quations (1) ne sont pas vrifies do une erreur sur la matrice a priori.
Deuximement la matrice a priori peut tre obtenue par le biais de sondages ou denqutes, elle
nest donc pas exacte cent pour cent et peut donc dpendre des mthodes de collecte des
donnes.
Une certaine mesure de cette erreur peut alors tre tablie.
Dun ct les donnes utilises sont des observations il y a donc un risque derreur lors de leur
rcupration. Dun autre ct les capteurs eux mmes ne peuvent pas tre considrs comme tant
parfaitement fiables . Aussi, les mesures recueillies ne correspondent pas toujours au mme
intervalle de temps pour tous les capteurs do un risque de non consistance des quations
a) Il peut arriver que le nombre total du flux lentre dun noeud soit diffrent de celui
la sortie donc il ny pas de continuit de flux (total entre = total sortie).
b) Non compatibilit entre le modle daffectation et les flux observs : Par exemple il
peut arriver quun modle daffectation nalloue pas de trafic sur un tronon (peut tre flux faible)
et dans ces conditions il ny aura aucune matrice permettant de reproduire les dbits observs.
Comme mesure de lincertitude on peut utiliser soit une matrice de variance-covariance si on dispose
dune suite de mesures de dbits de capteurs, soit faire des hypothses sur la distribution des
erreurs.
Plusieurs modles ont alors t proposs pour essayer de minimiser ces erreurs.
12
Ce qui donne la fonction entropie une forme de mesure derreur, il suggre donc de rajouter la
fonction objective du problme de maximisation la quantit
V*
V * Log a 1
Va
** (8)
a
et il propose de rsoudre le problme suivant
Tij Va*
Min
S = Tij Log
1 + V Log
* 1
t ij V
i, j a a (9)
s.c. Va* = Pija Tij a = 1,.., m
i, j
La rsolution du problme par la mthode du Lagrangien conduit :
m
Tij = t ij X a ij
Pa
a =0
et
Va* = Va X a1 /
Willumsen na pas propos de mthode pour calculer et ne donnait pas la signification du
coefficient . Il prcisait cependant que pour des grandes valeurs de (>100) le dbit rel est
proche du dbit observ et donc la limite on se retrouve dans le cas du problme simple ( 3 ). Et
plus se rapproche de zro avec Va* proche de Va on tend vers le cas limite Tij = t ij .
Le terme multi-objectif se rapporte au fait quon a plus dune fonction objectif dans le problme de maximisation.
13
T11
T11Log T11
t11
#
TNN
TNNLog TNN
min
t NN
s.c. Va* = Pija Tij a : 1..m (10)
V*Log V1 V*
*
i, j
1 V 1
1
#
V* Log Vm V*
*
m V m
m
T *
Log ij 1 + V * Log Va 1
Min ij ij t a a V
T (11)
i, j ij a a
s.c. Va* = Pija Tij a = 1..m
i, j
Comme mesure naturelle dincertitude, M Brenniger-Gthe et al, proposent linverse des variances
et montre quon obtient ainsi une amlioration du modle.
M.G.H Bell (1983) [3] a propos en effet une mthode pour calculer la matrice de variance-
covariance des ( t ij ) en supposant quils sont iid de variance , on pouvait ainsi construire des
intervalles de confiances.
On suppose rsolu le problme de maximisation (3) avec la contrainte de proportionnalit (5) :
14
m
Tij = t ij X a ij = t ij exp a = t ij exp a
Pa
(12)
a =0 a a
avec =Log()
v=PT
v de taille m x 1
P de taille m x N
T de taille N x 1
donc et avec lhypothse dindpendance
1 " 1
P1 " P1
S = 11 NN
# #
m m
P11 " PNN
1 " 1
1 1
P " PNN
R = 11
# #
m m
P11 " PNN
do l'galit (13) :
T=D.exp( S ) ( 13 )
y=RT
donc
Log( T ) = D + S
et
Var( Log( T ) )= S.Var( ).S
Ensuite par lutilisation de lapproximation Var(y)JVar()J
Voir le paragraphe Notation pour plus de prcisions
15
y
avec J = la matrice jacobienne (E(v) correspond aux dbits observs)
v v = E ( v )
On calcule des intervalles de confiances pour Log(Tij) et en dduit des intervalles pour Tij.
REMARQUES ET COMMENTAIRES
Cette mthode a t teste et Bell a pu ainsi construire des intervalles de confiances ce qui
permet de donner une ide sur lerreur commise.
En revanche lhypothse dindpendance est une hypothse relativement forte, par ailleurs les
calculs sont trs lourds. Cette mthode peut tre intressante dans le cas o les matrices
manipuler seraient de petites tailles.
La matrice jacobienne est dfinie strictement positive dans le cas o les quations (1)
relatives aux dbits seraient indpendantes ( rang( P )=m ) et la matrice J serait donc inversible
dans ce cas. Par ailleurs si les quations ne sont pas indpendantes il faut alors considrer les L
premires lignes indpendantes, ce cas a t tudi.
16
C . APPROCHE BAYESIENNE
C.I INTRODUCTION
Cette approche est fonde sur le thorme de Bayes qui peut scrire:
f(x \ y)p(y)
p( y \ x ) = ( 14 )
f(x \ y)p(y)dy
Ce modle a t propos par M. J. Maher (1983) [11], lide principale est de considrer la
demande de trafic et les dbits comme tant des variables alatoires multivaries notes
respectivement et .
Mettre jour une matrice O-D revient alors a trouver la distribution postrieure d'une variable
alatoire sachant la valeur prise par la seconde ( les dbits).
C.II MODLE
La variable alatoire admet donc a priori une matrice de variance covariance 0 et une
moyenne priori t et on cherche la loi conditionnelle de sachant lobservation des dbits
=v.( les dbits v sont des observations de cette variable). Cette distribution sera la distribution
posteriori de
On suppose que les dbits et les dplacements suivent des lois normales.
On a
=P. +
Avec les hypothses
MVN*** ( t , 0 )
MVN(0, )
(15)
Det 02 2
1
N
(2) 1
exp ( v ) 1 ( v ) (16)
2
Det 2
1
2
17
Daprs le thorme de Bayes, la distribution conditionnelle serait proportionnelle au produit des
deux densits (15) et (16) car le dnominateur de (14) ne dpend pas de .
Par identification en regroupant les termes et aprs simplification, il vient que :
1 = 0 0 P( + P0 P) 1 P0
et
T = t + 0 P( + P0 P) 1 (v Pt)
On a donc trouv une expression directe de la nouvelle matrice O-D ainsi quune matrice de
variance-covariance ce qui permettrait de faire des tests et de construire des intervalles de
confiances.
C.III. CONCLUSION
On peut dire que le modle bayesien est thoriquement trs intressant dans le sens o il permet
de prendre en compte les erreurs dues aux comptages et aux autres mesures et permet de faire des
tests statistiques . D'autant plus que la programmation informatique de rsolution ne prsente pas
de difficults majeures et est mme plus simple que le modle entropique.
L'inconvnient, si on admet les hypothses de normalit, est que cette mthode reste trs
dpendante de la dtermination de la matrice de variance-covariance des dplacements et qu'on ne
possde pas de moyen mathmatique capable de la calculer. En effet cette matrice dpend de la
construction de la matrice a priori et il existe par ailleurs dautres dpendances notamment avec la
matrice daffectation P.
Pour ces raisons il nexiste aucune mthode qui permet de calculer exactement cette matrice de
dispersion. Seules des hypothses simplificatrices sur la forme de la matrice sont utilises.
Lautre problme est que lutilisation de la solution bayesienne peut conduire des valeurs de T
ngatives ce qui est absurde (dans l'tude de V Pastinen et al ceci ne s'est pas ralis). Lhypothse
de normalit peut dailleurs tre mise dfaut si lon a des couples O-D avec des petits effectifs.
D'autres modles utilisent les lois de Poisson.
18
D. MTHODE DE MAXIMISATION DE LA VRAISEMBLANCE
D.I INTRODUCTION
Le principe est de donner une certaine signification statistique la matrice a priori qui est
considrer ici comme une estimation de la matrice O-D.
On considre ainsi que les t ij sont des observations issues d'une variable alatoire qui suit un
loi connue. L'ide est de maximiser la vraisemblance, d'observer l'chantillon issu d'une enqute .
H Spiess (1987) [14] prend comme hypothse de distribution la loi de Poisson, qui est une
approximation d'une loi multinomiale de faible moyenne. On considre en effet que l'on travaille
avec une matrice issue d'enqutes et on possde donc une matrice O-D faibles effectifs. Il est
donc important de noter la similitude avec le modle entropique qui prend comme hypothse de
distribution une loi miltinomiale.
D.II LE MODLE
Soit i , j un coefficient d'chantillonnage de la population des usagers de la paire O-D (i,j) i.e. la
fraction de la population recense ( suppose donc connue).
Les ( t ij )sont des observations d'une variable qui suit une loi de poisson de paramtre ijTij .
La probabilit d'observer t ij est donc donne par
( T ) t ij
exp( ij Tij )
Pr ob( = t ij ) = Pr ob{Poisson ( ij Tij ) = t ij } =
ij ij
t ij !
Donc la probabilit d'observer la matrice O-D a priori est donne par:
( T ) t ij
exp( ij Tij )
P= Pr ob[({t })] =
ij
ij ij
i, j t ij !
Min { T
i, j
ij ij t ij Log(Tij )}
19
E. MTHODE DES MOINDRES CAREES GENERALISEES
E.I INTRODUCTION
Il s'agit ici de calculer une matrice O-D partir d'une matrice obtenue par des sondages.
Cette matrice sera considre comme une premire estimation de la vrai matrice O-D.
Cette mthode, et contrairement la prcdente, permet d'obtenir une matrice sans que l'on
rajoute d'hypothses de lois sur l'ancienne matrice. On remarquera dans la suite qu'il existe une
grande ressemblance entre la matrice et la variance trouve par ce modle avec celles trouves par
l'approche bayesienne .
E.II. LE MODLE
Comme pour les derniers modles ici on considre les notations vectorielles.
On a alors les quations stochastiques suivantes :
t=T+
v =P. T +
On trouve ainsi:
T = ( 1 + P 1 P ) ( 1 t + P 1 v )
1
avec :
Var (T) = P (PP + ) 1 P
La matrice P (PP + ) 1 P est dfinie positive donc l'estimateur trouv est de variance
infrieure celle de la variance de l'estimateur initiale.
E. Cascetta(1984) [5] montre que cet estimateur est l'estimateur linaire sans biais de variance
minimale ( BLUE ).
L'inconvnient de cet estimateur est que l'on peut avoir des composantes Tij ngatives .
M.G.H Bell (1991) [1] propose de rajouter la contrainte Tij 0 au problme de minimisation
prcdent pour vincer les valeurs aberrantes .
Ce modle a t test par simulation d'une petite aire de circulation et les estimateurs trouvs
semblent tre meilleurs que ceux calculs par la mthode de maximisation de l'entropie.
E.III REMARQUES
Ce modle, et malgr les ressemblances, diffre de celui issue du modle bayesien propos par
Maher ( cf. ci-dessus) en effet:
Les thories probabilistes utilises sont diffrentes : dans l'une on minimise des distances
pondres et dans l'autres on cherche une distribution d'une variable alatoire.
Cette diffrence induit une interprtation diffrente des rsultats obtenus.
Dans les autres modles une distribution des Tij a t suppose, alors que dans ce modle
aucune hypothse n'a t prise.
20
Comme pour les autres modles le problme rside en l'approximation de la matrice des variance-
covariance Cascetta propose comme estimateur :
21
F. BIBLIOGRAPHIE PARTIE I
1.BELL M.G.H : The estimation of origin destination matrices by constrained generalized least
squares, Transport Research Vol 25B (1991).
2.BELL M.G.H.: The estimation of an origin destination matrice from traffic counts, Transport
Science 10 (1983)
3.BELL MG.H. : The estimation of origin-destination flows and their confidence intervals from
measurments of link volumes: a computer program, (1983).
4.BRENNINGER-GTHE M, KURT O,.JRNSTEN, JAN T. LUNDEGREN: Estimation of
origin destination matrices from traffic counts using multiobjectice programming
formulation
5.CASCETTA E. : Estimation of trip matrices from traffic counts and survey data : A generalized
least squares estimators . Transportation research Vol 18B (1984)
6.CASCETTA E., NGUYEN S : A unified framework for Estimating or Updating O_D matrices
from Traffic Counts Transportation. Research. Vol 18B (1988).
7.DANECH-PAJOU M : Estimation des matrices O-D par les comptages et la thorie de
l'information, Rapport INRETS N126 (septembre 1990)
8..DEBAILLE S. : Un modle de reconstitution des matrices Origines Destination en milieu
urbain ,Rapport de recherche IRT N 27 ( Dec1977).
9.GOLAN A., JUDGE G., MILLER D. : Maximum Entropy Econometrics Robust estiation with
limited data, Ed Series in financial and quantitative analysis
10.HALLEFJORD A. JORNSTEN K. : Multiobjective Gravity Models , Linkping Institute of
Technology , (1983)
11.MAHER M.J. : Inferences on trip matrices from observation on link volumes : A bayesian
statistical approach Transport Research. Vol 17B Vol N6( 1983)
12.PASTINEN V PURSULA M,: A bayesian approach to update traffic flows from traffic counts
12th International Symposium on Transportation and Traffic Theory (1993).
13.ORTUZAR J. de D. , WILLUMSEN L.G.: Modelling Transport
Second edition WILEY (1994)
14.SPIESS H : A Maximum likelihood model to estimate Origin-Destination Matrices, Transport
Research Vol 12B N5 (1987)
15.VAN VLIET D., WILLUMSEN L.G. : Validation of the ME2 model for estimating trip
matrices from traffic counts.8th International Symposium On transportation (1981)
16.VAN ZUYLEN H J.,WILLUMSEN L.G. : The most likely trip matrice estimated from traffic
counts, Transport Research Vol 14B (1980)
17.VAN ZUYLEN H J. : The estimation of errors traffic counts used for the estimation of an O-
D Matrix.
18.WILLUMSEN L.G : Estimating time-dependant trip matrices from traffic counts,
International Symposium on Transportation and traffic theory (1984)
19.WILLUMSEN L.G :Estimation of trip matrices from trafic volume counts validation of a
model under congested conditions. 10th Summer Meeting 12-15 July 1982 transportation
Analysis and Models
22
PARTIE 2 : ESTIMATION DES MATRICES O-D :
CADRE DYNAMIQUE.
A.INTRODUCTION
I l s'agit dans cette partie d'estimer la demande de trafic reprsente par des matrices Origine-
Destination pendant une dure de temps bien dtermine.
Il est important de noter la diffrence avec le cadre statique. Dans cette partie il est plus
judicieux de parler de demande de trafic que d'estimation moyenne des dplacements entre une
paire origine-destination.
L'effet dynamique peut se traduire de trois manires diffrentes :
1.On comptabilise le nombre des dplacements des vhicules partant pendant un instant, ou un
intervalle de temps, t fix et arrivant la destination l'instant, ou pendant l'intervalle de temps, h
(h>t). Le facteur temps intervient alors au dpart et l'arrive .
On estimera la demande non pas pendant un instant mais sur intervalle t. La priode de temps
sera ainsi subdivise en plusieurs intervalles t.
On rappelle que ces matrices servent mieux grer le trafic, estimer le temps des parcours et
faire des prvisions permettant, entre autres, le contrle du trafic et une meilleure gestion des
congestions.
L'estimation et la prvision du trafic dans le cadre dynamique est une tache complique dans le
sens o les dplacements sont fonction de l'espace et du temps.
Le trafic dpend ainsi de plusieurs variables difficilement quantifiables comme par exemple le
degr d'information reu par le conducteur sur le trafic, son comportement vis vis de
l'information reue etc.
Seules les donnes dont on dispose sont issues des capteurs ou d'informations concernant la
structure gnrale de la matrice O-D. On dispose ainsi de la vitesse des vhicules, du taux
d'occupation et des dbits des capteurs sur certains tronons de l'aire tudie. On supposera aussi,
comme pour le cas statique, qu'on dispose d'un historique concernant la demande de trafic
pendant toute la priode tudie. Cet historique se prsente sous la forme d'un ensemble de
matrices O-D correspondantes chacune un intervalle de temps de la priode tudie.
Ces deux types de mthode d'estimation seront dvelopps dans la suite. On s'efforcera par
ailleurs de donner un aperu sur la notion de filtre de KALMAN et de son utilit dans la
23
mesure o plusieurs modles qui semblent donner de bons rsultats l'utilisent.
Notons cependant que certains modles ne sont valables que dans le cas d'un rseau simple
comme les autoroutes ou les carrefours. On les a cependant incorpors dans ce rapport dans la
mesure o ces modles peuvent tre amliors et donc tendus au cas de rseaux complexes. On
mentionnera le cas chant le domaine de validit de chacun des modles tudis
24
B.HYPOTHSES ET NOTATIONS
Les notations matricielles de la premire partie seront globalement inchanges. Cependant, par
souci de clart de lexpos, on notera les matrices et les vecteurs respectivement par des lettres en
majuscules et en minuscules en gras.
Vu la complexit du problme et la diffrence des variables utilises pour chaque modle, on ne
mentionnera ici que les principales notations adoptes ainsi dans chaque dbut de modle
On prcisera le cas chant les nouvelles variables.
Dans tout ce qui suit, on considre un intervalle de temps H subdivis en nh intervalles supposs
sans perte de gnralit de mme dure et indexs par h. on a ainsi H=* nh .
h
v ah = Pahrt d rt (1)
t =1 r
L'quation (1) peut s'exprimer en une forme matricielle en notant P la matrice d'affectation on
ht
obtient
h
vh = P dt
t =1
ht
Les mesures recueillies des capteurs ne sont pas les vraies valeurs du dbit ceci est caus par les
problmes de recueil des donnes et par les imperfections de mesures. On exprimera ces
25
imperfections par des erreurs notes wah pour chaque capteur a.
Avec les notations matricielles adoptes on aura donc la relation
v h = v h + w h (2)
De mme que pour les capteurs, les modles d'affectation ne sont pas en gnral exacts. En effet
les matrices d'affectation qui traduisent les chemins emprunts et la probabilit de choix de ces
chemins n'est qu'une approximation de la ralit. Les proportions de la matrice Pah ne peuvent
donc pas traduire avec exactitude la relation (1) mme avec les vraies valeurs de la demande.
On traduit cette approximation par des erreurs alatoires ah (erreurs de modlisation) et on a
donc
h
v ah = Pahrt d rt + ah
t =1 r
qui s'crit sous forme matricielle :
h
vh = P dt + h (3)
t =1
ht
en notant h = h +w h
Lquation (3) devient
h
v h = P
t =1
ht d t + h
26
C .MTHODES SIMULTANES
C.I.INTRODUCTION
Comme on l'a montr dans la premire partie l'estimation de la demande de trafic peut tre obtenue
par la rsolution d'un problme de maximisation sous contraintes qui se traduit par :
d = arg min[ f 1 ( s, d ) + f 2 (v, v )].
sS
S est l'ensemble induit par les contraintes sur les capteurs, par exemple :
{
S = s N + , Ps = v + }
Les fonctions f 1 (.) et f 2 (.) dpendent du modle d'estimation choisi, du type de l'estimateur et
des informations dont on dispose.
Dans le cas statique l'estimation de la demande est relative une seule priode.
Les modles classiques ( cas statique) peuvent tre tendus au cas dynamique, notant que dans ce
cas on obtient simultanment toutes les matrices O-D en une seule rsolution.
Le vecteur de demande d est donc transform en un vecteur de taille n h N et de mme le
vecteur des dbits transforms en un vecteur de taille n h m .
La forme gnrale du problme d'estimation peut donc s'crire :
Comme on l'a prcis ci-dessus les fonctions f 1 (.) et f 2 (.) peuvent tre la log-vraisemblace ( [9 ],
[11] ) ou l'cart quadratique moyen rsultant de la mthode des moindres carres (
gnralises) [ 3 ] ou autres.
La fonction f 1 (.) peut tre dans le cas de l'estimateur de maximum de vraisemblance :
f1 ( s, d ) = [ r s r N log( r s r )]
r
Avec ( r )r les coefficients d'chantillonnage ( voir premire partie pour plus de dtails). Dans le
cas de la mthode des moindres carres la fonction f1 (.) s'crit :
f1 ( s, d ) = ( s - d )' V -1 ( s - d )
Avec V la matrice de variance-covariance du vecteur d. Cette quation reste valable dans le cas o
l'on appliquerait la mthode du maximum de vraisemblance en supposant une distribution
normale multivarie de la demande.
Dans le cas o l'on supposerait que la distribution suit une loi multinomiale la fonction f1 (.)
serait la fonction entropie [ 10 ].
L'expression la plus utilise pour la fonction f 2 (.) est la fonction quadratique :
f 2 ( s, d ) = W -1
= Ps- v
27
Avec la diffrence entre les dbits observs et les dbits calculs partir de la demande de trafic
selon le modle d'affectation choisi.
W tant la matrice de variance-covariance correspondant aux erreurs de mesures issues des
capteurs.
Cette forme quadratique rsulte de l'hypothse que les erreurs suivent une loi normale multivarie
dans un contexte du maximum de vraisemblance ou d'une estimation bayesienne. Cependant son
utilit dans un cadre de mthode des moindres carrs ne ncessite pas de telles hypothses.
Ainsi, si on prend comme modles la mthode de moindres carrs ou celle de la mthode
bayesienne avec une distribution multinomiale, on arrive l'quation
h
h = Pht s t v h
t =1
nh
(d1 ,..,dnh ) = argmin[(sh dh )Vh 1 (sh dh ) + h Wh-1 h
s1,..sn S h=1
h
C.III.CONCLUSION
Ces mthodes d'estimation ont t testes et valides sur des rseaux( [3] , [ 8 ]). L'efficacit de
telles mthodes t prouve
L'inconvnient est que de telles mthodes demandent des capacits de calculs trs puissantes vu le
nombre de paramtres et d'quations rsoudre. Aussi on ne peut pas les appliquer pour des cas
de prvision du trafic dans des programmes en ligne ( en temps rel). Cependant l'utilisation de
telles mthodes peut contribuer lobtention dune estimation du trafic qui elle-mme peut servir
dans le cas o l'on voudrait une estimation en ligne ( en temps rel) de la demande et
faire donc des prvisions.
28
D.MTHODES SQUENTIELLES
D.I.INTRODUCTION
Dans ce contexte, on estime pour chaque intervalle de temps h le vecteur demande correspondant.
On peut distinguer deux principaux avantages de cette mthode d'estimation :
Le premier est la rduction du problme d'optimisation plusieurs problmes de tailles plus
petites permettant ainsi un gain de temps de calcul. Le second avantage est que l'estimation pour
un intervalle h peut contribuer l'estimation de la demande pour (le ou) les intervalles de temps
qui suivent. Ce modle est principalement adapt une utilisation en temps rel.
Lorganigramme ci-dessous montre le fonctionnement dune estimation en temps rel.
L'ide principale de cette approche est de considrer la demande de trafic et les dbits (lis
dynamiquement par des quations linaires) comme des processus stochastiques auto-rgressifs.
La technique du filtre de KALMAN est l'approche utilise pour la rsolution d'un tel problme.
29
X ( t ) = ( t 1 ) X ( t 1 ) + K ( t )[ Y ( t ) ( t 1 ) X ( t 1 )] (a)
K ( t ) = S ( t ) 1 ( t 1 )[ W + ( t 1 )S ( t ) ( t 1 )] 1 (b)
Avec S(t) une matrice de variances-covariances qui satisfait le systme dquation suivant :
S ( t ) = ( t 1 )Q( t 1 ) ( t 1 ) + V
Q( t ) = S ( t ) K ( t ) ( t 1 )S ( t )
L'ide est d'essayer de formuler la demande du trafic pendant un intervalle h comme fonction des
autres observations des intervalles de temps prcdents.
Une premire formulation s'crit ( [ 6 ] , [ 4 ] ) :
h N
d rh +1 = f
t = h p r =1
r t
rh d rt + rt
Il a t montr ( [ 1 ] ) que ce modle n'explique que les dpendances temporelles entre les paires
O-D. Un tel modle auto-rgressif ne peut pas traduire l'information concernant la structure de la
matrice O-D. Pour amliorer ce modle on suppose que l'on dispose d'un historique (sur deux
jours ou plus) qui nous permet d'avoir une estimation de la demande sur tous les intervalles de
temps de la priode tudie. Ensuite on crit l'quation de transition non pas entre la demande de
trafic durant l'intervalle h et ceux qui le prcdent mais entre les carts par rapport la demande a
priori. L'quation de transition s'crit donc :
30
(d )
h N
d rh +1 d rh +1 = f
t = h p r =1
r t
rh
t
r d rt + rt
(F (d ))
h
d h+ 1 d h+ 1 = h
t
t d t + h (4)
t = h p
Avec Fht une matrice (NN) des effets des vecteurs ( d t d t ) sur le vecteur ( d h+ 1 d h+ 1 ) et
h un vecteur d'erreur ( un bruit blanc faible ) de moyenne nulle et de matrice de variance-
covariance V h + 1 de taille (NN).
Le calcul de la matrice Fht peut tre obtenu par le biais des matrices a priori. Lors de la mise en
application de cette mthode elle a t suppose diagonale postulant ainsi qu'il n'y a pas de
corrlation entre les diffrentes paires O-D. La valeur de p peut tre obtenue l'aide d'une
estimation partir des informations dont on dispose.
v h v h =
h
t = h q
( )
Pht d t d t + Pht d t v h + h
t = h q
h
(6)
D.III.c. La rsolution
Les quations (4) et (6) ne peuvent pas tre appliques directement au filtre de KALMAN.
En effet l'quation de transition telle qu'exprime en (4) donne la dpendance des carts la
priode h+1 et plus d'une priode prcdente. De mme l'quation 6 exprime une relation entre
une priode et plusieurs priodes prcdentes. Pour pouvoir appliquer le filtre de KALMAN des
transformations s'imposent. La mthode la plus simple consiste augmenter le vecteur d'tat de
manire inclure tous les vecteurs des priodes prcdentes .
Posons avec s= max.(p , q)
31
dh d h
d h1
d h = h1
~ d
le vecteur n(s+1) 1
#
d h s d h s
vh v h
v v h1
v~h = h1 le vecteur m(s+1) 1
#
v h s v h s
[
Ph = Phh ]
Phh1 " Phh s de taille m n(s+1)
~ ~
v h = Ph dh + B h + ~
h
~ ~ ~
dh+1 = dh + h
Avec
~
B h = Ph dh ~
vh
On suppose qu' l'tat initial le systme admet comme moyenne d0 et une matrice de variances-
covariances R0
Aprs ces transformations on montre que l'algorithme de KALMAN s'crit :
32
~ ~
(~ ~
d h = h 1d h-1 + K h v h Ph h 1d h-1 B h 1 )
Le gain tant
( ~ 1
K h = h Ph Ph h Ph + Wh )
Avec h solution du systme d' quations :
~
h = h 1 h 1 h 1 + V h 1
h = h K h Ph h
0 = R 0
On montre ( [ 2 ] , [ 7 ].) que ce filtre ( donne par les quations ci-dessous) fourni la plus petite
erreur quadratique parmi tous les estimateurs linaires.
Et sous lhypothse de normalit des erreurs, on obtient le meilleur estimateur parmi tous les
estimateurs ( linaires ou non-linaires)
33
E .ETUDE COMPARATIVE DES DEUX APPROCHES: TUDE
D'UN CAS PARTICULIER
E.I.INTRODUCTION
Il s'agit d'estimer une matrice O-D en supposant connu le nombre de dparts et d'arrives des
vhicules pour chaque nud. Ceci revient supposer qu'on connaisse les sommes marginales de la
matrice. Ce cas de figure peut se raliser dans le cas d'un petit rseau comme un carrefour ou dans
le cas dun rseau simple tel une autoroute o l'on placerait des capteurs chaque entre et
chaque sortie.
Les lments de B(t) ( la matrice estimer ) doivent satisfaire les contraintes suivantes:
n
b ij (t) = 1 , i = 1,.., m. (1.a)
j=1
b ij ( t ) 0 i = 1,.., m, j = 1,.., n. (1.b)
b j (t): le j me vecteur c olonne de la matrice B(t)
B(t) et b j (t) sont des estimat eurs de B(t) et de b j (t )
On supposera ici que l'intervalle de temps t est assez grand par rapport au temps de voyage de i
vers j. On peut alors lier les quantits ci-dessous par la relation :
Comme on l'a prcis dans les parties prcdentes, cette relation ne peut pas tre satisfaite cause
de diffrents types d'erreurs. On introduit ainsi le vecteur des erreurs e(t)= ( e j ( t )) j =1,..n
l'quation (2) devient ainsi :
34
E.II.ESTIMATION DE LA DEMANDE DE TRAFIC
L'estimateur de chaque colonne peut tre obtenu par la mthode des moindres carres ordinaires
selon :
1
b j = q(t)q' (t) q(t) y(t)
t t
1
t t
b j ( t ) = q(h)q' (h) q(h) y j (h)
h=1 h=1
Cet estimateur a t utilis par Cremer [ 4 ] pour estimer la demande de trafic dans un carrefour.
Nihan et Davis [ 5 ] ont amlior cette expression en appliquant un lemme sur les approximations
d'inversions des matrices:
On montre ainsi qu'on peut obtenir une relation de rcurrence qui permet le calcul de B :
En notant
1
1 1 t
P j ( t ) = q(h)q' (h)
t t h =1
on obtient les relations suivantes :
[ ]
b j ( t ) = b j ( t 1 ) + K j (t) y j ( t ) q' (t)b j (t 1)
P j (t 1)q(t)
K j (t) =
1 + q' (t)P j (t 1)q(t)
P j (t 1)q(t)q' (t)P j (t 1)
Pj ( t ) = Pj ( t 1 )
1 + q' (t)Pj (t 1)q(t)
Cette relation est trs proche de celle obtenue par le filtre de KALMAN si l'on considre le
systme suivant :
b j (t) = b j (t 1) + s(t)
y j ( t ) = q' (t)b j (t) + e j ( t )
35
[ ]
b j ( t ) = b j ( t 1 ) + K j (t) y j ( t ) q' (t)b j (t 1)
P j (t 1)q(t)
K j (t) =
r j + q' (t)Pj (t 1)q(t)
P j (t 1)q(t)q' (t)Pj (t 1)
Pj ( t ) = Pj ( t 1 ) + R j
r j + q' (t)Pj (t 1)q(t)
Ce rsultat rappelle donc celui trouv dans le cas de l'estimateur des moindres carres. En effet, si
les mesures taient sans erreurs ( c'est dire R j =0 ) et dans le cas o l'on appliquerait la
mthode des moindres carres gnralise en minimisant la quantit :
r [y ]
t
1
( h ) q' (h)b j
2
j
h =1 j
On peut donc dire que si l'on possde assez d'information sur la demande de trafic
notamment si l'on dispose des matrices de variance-covariance l'emploi du filtre de KALMAN
peut contribuer amliorer la qualit de note estimateur.
Dans cette estimation on na pas pris en compte les contraintes (1.a-1.b). En effet les auteurs
cits ci-dessous ne prennent en compte les contraintes que dans les algorithmes proprement dite,
les mthodes utilises sont les mthodes classiques du Lagrangien et de Newton.
Les rsultats obtenus ne diffrent pas dune manire considrable lorsque ces diffrent
modles ont t appliqu lestimation de la demande du trafic sur une autoroute.
36
F. BIBLIOGRAPHIE PARTIE II
[1] Ashok K., Ben-Akiva E. (1993 ) : Dynamic Origin-Destination matrix estimation and
Prediction for real time trafic management systems. In
Proceedings of 21th international Symposium on trafic
Theory. Berkley Ca.
[2] Bertein J.C. Ceshi R. ( 1998 ) : Processus Stochastiques et filtrage de Kaman .
Collection traitement du signal. Ed Hermes.
[3] Cascetta E., Inaudi D. , Marquis G. ( 1993 ) : Dynamic estimators of Origin-Destination
mtrices using trafic counts. Transp. Res. Vol 27 No.
4, november 1993.
[4] Cremer M, Keller H. ( 1987 ) : A new class of dynamic methods for the
identification of Origin-DestinationO-D flows. Transp.
Res. Vol 21B .
[5] Nancy L.N., Davis G.A. ( 1987 ) : Recursive estimation of Origin-Destination matrices
from input/output counts. Transp. Res. Vol 21B .
[6] Okutani I. (1987) : The kalman filtering approach in some
transportation and trafic problems In International
Symposium On Transportation and Trafic Theory .
eds N.H. Gartner and N.H. Wilson. Elsevier
Publishing Company Inc.
[7] Vieville T. ( 1996) : Filtre de Kalman et estimation robuste en vision
Article ( support de cours)
[8] Wong S.C. Tong C.D. (1998) : Estimation of time dependant Origin-Destination
Matrices for transit networks. Transp. Res. Vol 32. B
[9] Wu J. , Chang G.L.. ( 1996) : Estimation of time varying Origin-Destination
distribution with dynamic screenlline flow. Transp
Res. Vol 30.B.
[10] Wu J. (1997) : Areal time Origin-Destination matrix updating
alogorithm for on-line applications. Transp. Res.
Vol 31. B.
[11] Zhou J. Yang H. ( 1998) : Optimal trafic counting locations for Origin-
Destination matrix estimation Transp. Res. Vol. 32.B.
37