Maxime Gueriau

Modélisation et simulation multi-agents du trafic coopératif
Maxime Guériau
Université de Lyon, F-69000, Lyon, France
ENTPE, LICIT, F-69518, Vaulx-en-Velin
IFSTTAR, LICIT, F-69500, Bron
LIRIS, F-69000, Lyon
Téléphone: 04 72 14 25 66
Email: maxime.gueriau@entpe.fr
Romain Billot
Nour-Eddin El Faouzi
Salima Hassas
Frédéric Armetta
Mots-clés : Systèmes coopératifs, Simulation multi-agents, Confiance, Théorie du trafic
Nombre de mots : 4959
1
Introduction
Modélisation du trafic et approches multi-agents
La gestion du trafic s’appuie sur des systèmes complexes (i.e. les Systèmes de Transport In-
telligents (ITS)), dont la définition est adaptée aux paradigmes agents, qui se retrouvent bien
représentés dans le domaine des transports, de la simulation microscopique au contrôle à grande
échelle (1). Au niveau microscopique, les concepts agents ont été appliqués pour intégrer les
capacités de communication des ITS (2, 3) ou pour proposer un routage dynamique des véhi-
cules sur un réseau urbain (4, 5, 6). Au niveau d’un réseau urbain plus complexe, le contrôle des
feux de signalisation ou le contrôle des intersections sont des exemples d’applications concrètes
qui reposent sur une modélisation multi-agents, avec une nouvelle tendance en faveur des inter-
sections coopératives (7, 8, 9, 10). Toutefois, l’utilisation principale de ces concepts se trouve
à l’échelle macroscopique où les agents sont utilisés comme support de l’infrastructure pour la
gestion du trafic et comme de système d’aide à la décision pour le contrôle du trafic (11, 12, 13).
Vers une gestion décentralisée du trafic grâce aux systèmes coopératifs
Les avancées récentes dans le domaine des communications haut-débit et des systèmes de com-
munication inter-véhiculaire ont contribué au développement de nouveaux véhicules intelligents
dotés de capacités de communication : les véhicules coopératifs. La coopération peut être intro-
duite par le biais d’équipements embarqués et/ou de périphériques communicants. Un véhicule
coopératif est ainsi à la fois capable de percevoir son environnement immédiat (de la même
façon qu’un véhicule autonome), mais il peut en plus recevoir des informations à l’échelle du
réseau (comme un véhicule connecté).
F IGURE 1 : Exemple d’un trafic autoroutier mixte composé de véhicules coopératifs et non
coopératifs
Comme illustré dans la figure 1, ce papier aborde la modélisation d’un flux de trafic coopé-
ratif autoroutier. Les agents sont des véhicules qui communiquent entre eux (communication
Véhicule à Véhicule - V2V) ou avec les unités de bord de route (Road Side Units - RSU ;
communication Véhicule à Infrastructure - V2I - et Infrastructure à Véhicule - I2V). Les ap-
proches classiques de modélisation (voir (14) pour une revue) ne sont pas suffisantes car elles ne
prennent pas en compte ni la coopération ni les interactions avec l’infrastructure. De plus, dans
un contexte de déploiement de ces nouvelles technologies, se pose la question des problèmes
relatifs à la fiabilité des capteurs ainsi que de l’impact d’un trafic mixte (véhicules équipés et
non équipés). Une structure auto-organisée basée sur un système multi-agents (15) est flexible
quand le but du système est d’atteindre un bon niveau d’organisation à travers des processus
autonomes internes.
Concernant le trafic coopératif autoroutier, l’objectif est d’obtenir une auto-organisation
d’agents coopératifs qui tend vers l’homogénéisation du flux de trafic. Une attention particulière
doit être accordée à l’influence mutuelle des niveaux informationnel et comportemental (16).
Les systèmes basés sur la confiance et la réputation (17) sont souvent utilisés pour lier ces deux
niveaux, puisque le flux informationnel doit être organisé pour traiter l’information efficacement
2
et pour assurer sa fiabilité. Pour plus de détails, le lecteur est invité à consulter l’étude biblio-
graphique de (18). Dans le cas d’un trafic autoroutier et en présence de véhicules coopératifs
non fiables (défaillance des capteurs), le but collectif est de parvenir à un flux de trafic homo-
gène en toute sécurité. L’approche présentée dans cet article reprend le concept d’un système
de confiance avec la particularité d’utiliser une couche de confiance qui peut être vue comme la
couche d’apprentissage pour la détection des capteurs défaillants, et qui agit comme la couche
de consolidation des couches physique et communication.
Objectifs et organisation de l’article
Cet article présente une approche décentralisée qui tend à minimiser l’impact négatif des cap-
teurs défaillants dans un système d’interactions fondé sur la perception. Nous proposons une
architecture qui donne aux agents une représentation de la réputation des véhicules qui l’en-
tourent fondée sur la confiance. Nous avons choisi le contexte de la simulation de véhicules
coopératifs pour illustrer notre approche, imaginée comme une architecture générique en trois
couches. Cette contribution combine à la fois des concepts innovants en théorie du trafic et des
concepts orientés agent. Dans cet article, la première section présente les trois couches et leurs
concepts de modélisation associés. Ensuite, une architecture de validation à partir de données
trafic réelles et d’indicateurs de trafic pertinents est introduite. Les résultats sont exposés dans
la dernière partie. Ils confirment l’efficacité de la méthode pour modéliser le comportement dy-
namique du trafic coopératif autoroutier, et soulignent l’impact positif de la coopération ainsi
que l’importance de la fiabilité (effet de la confiance) dans de tels systèmes complexes.
Une architecture multi-agents en trois couches

Conception
En ce qui concerne la gouvernance du système, l’idée est de profiter des informations fiables
pour influencer le mouvement des véhicules tout en limitant les perturbations dans le flux de
trafic, et ainsi homogénéiser le flux. La figure 2 présente les interactions entre les trois couches.
La couche physique représente les règles qui modélisent la dynamique des véhicules. La couche
de communication gère les échanges d’information par des règles de proximité et de fiabilité,
qui sont traduites en terme de probabilité. La couche confiance propose une représentation de la
fiabilité de l’information et permet aux agents d’évaluer la confiance qu’ils accordent aux autres
(19, 20). Les couches communication et confiance influencent la couche physique, et donc le
comportement des véhicules.
Dans cette approche, nous considérons que chaque agent connaît ses paramètres cinématiques
(x, ẋ), et qu’un bruit (incertitude) peut être associé à ces connaissances. L’environnement est
composé d’unités de bord de route (RSU) qui font partie de l’infrastructure, et sont disposées
le long des voies, et de véhicules qui peuvent être coopératifs ou non coopératifs. Les RSU
et les véhicules coopératifs sont équipés de périphériques de communication sans fil qui leur
permettent d’envoyer et de recevoir des informations à chaque pas de temps dans un rayon de
communication associé.
La couche physique
Pour respecter la perception locale des agents, la modélisation de la dynamique physique des
véhicules s’appuie sur l’utilisation d’un modèle de suivi de véhicule qui calcule l’accélération
du véhicule considéré à partir d’une fonction f non linéaire qui s’écrit ẍn = f (ẋn , ∆xn , ∆ẋn )
où ẋn est la vitesse du véhicule courant, ∆xn l’inter-distance et ∆ẋn la vitesse relative avec
le véhicule prédécesseur immédiat (leader). Nous avons choisi Intelligent Driver Model (IDM),
qui est un modèle sans collisions et capable de reproduire les instabilités d’un flux de trafic (21).
3
F IGURE 2 : Architecture en 3 couches
Ce modèle est composé d’un terme de freinage et d’un terme d’accélération complétés par des
paramètres facilement interprétables. La fonction de IDM fIDM s’écrit
 !2 
γ
ẋn s∗ (ẋn , ∆ẋn )

ẍn = a 1 − − , (1)
Vmax s
où s est l’inter-distance entre le véhicule considéré et son leader, s∗ (ẋn , ∆ẋn ) = s1 +

max (0, ẋn T1 + ẋ2n√∆ab
ẋn
) est l’inter-distance désirée, a et b sont respectivement l’accélération
maximale et la décélération désirée, Vmax est la vitesse désirée, s1 est la distance minimum
pare-choc à pare-choc à l’arrêt, T1 est l’intervalle de sécurité temporel désiré avec le véhicule
précédent, et γ est un facteur d’agressivité de l’accélération (généralement fixé à 4). De plus, les
véhicules peuvent effectuer un changement de voie de manière opportuniste, au lieu de mettre
à jour leur accélération, en suivant la stratégie MOBIL (des mêmes auteurs (22)).
F IGURE 3 : Intéractions des véhicules non cooperatifs (en haut) et cooperatifs (en bas)
Une façon d’introduire une coopération au niveau microscopique est de concevoir un modèle de
suivi de véhicule multi-anticipatif capable de décrire les communication entre véhicules (V2V)
ainsi que d’améliorer la stabilité du trafic (23). Nous proposons la définition d’une loi bilatérale
multi-anticipative comme la combinaison des influences pondérées de chacun des véhicules
environnants : X X
ẍn = fIDM (ẋn , anj ∆xn+j , anj ∆ẋn+j ) (2)
j j
4
où aij est le coefficient d’interaction qui pondère l’information entre un agent i et l’agent j
perçu (comme décrit par la figure 3).
La couche communication
La section d’autoroute est subdivisée en sections contrôlées par des agents de type unité de bord
de route. Ces agents RSU sont responsables de leur zone géographique dédiée et collectent les
informations en provenance des véhicules pour déterminer les valeurs globales de l’état d’équi-
libre du système (ẋeq , ∆xeq ). Le rayon d’interaction des véhicules (i.e. rayon de perception) est
fixé à r = 4 · ∆xeq où ∆xeq est l’écart longitudinal inter-véhiculaire calculé par les RSU à partir
des informations reçues des véhicules coopératifs sur les trois voies de la section et sur les cinq
derniers pas de temps de communication, dans un diamètre de communication de 300 m (150 m
en amont et 150 m en aval, comme représenté dans la figure 4). Le rayon d’interaction des véhi-
cules a été calibré pour éviter les effets d’échelle lors du calcul des coefficients de coopération.
F IGURE 4 : Communications entre véhicules coopératifs
A chaque pas de temps, les agents perçoivent la vitesse, l’inter-distance et la vitesse relative
avec leurs voisins présents dans leur rayon d’intéraction r. Ensuite, chaque agent partage ses
propres mesures capteur avec les autres agents présents dans son rayon de communication, afin
de déterminer une valeur de divergence entre les valeurs perçues nommées mij et calculées à
partir de la norme euclidienne dans l’espace vectoriel défini par les variables (ẋn , ∆xn , ∆ẋn )
de la loi de suivi de véhicule :
||Ej − Ei ||2
mij = , (3)
|| (ẋeq , ∆xeq , ∆ẋeq ) ||2
où En est l’erreur de mesure initiale associée au véhicule n, initialisée aléatoirement. On suppose
que chaque capteur subit les mêmes perturbations pour les trois mesures.
La couche confiance
La notion de confiance est liée au concept de délégation, inhérent à la coopération dans les
systèmes multi-agents (24). Le trafic coopératif autoroutier est un parfait exemple d’un système
basé sur la délégation puisque les actions d’un véhicule s’appuient directement sur les actions
des autres véhicules. Nous proposons d’introduire le concept de confiance comme un méca-
nisme capable de faire face aux problèmes de fiabilité des capteurs. Dans un système fondé sur
la confiance, les véhicules coopératifs ne doivent pas communiquer avec les agents défaillants
qui fournissent une mauvaise estimation des conditions de trafic. Nous ne considérons pas les
comportements égoïstes ou de triche dans cette approche. Seule la fiabilité de l’information ba-
sée sur les erreurs des capteurs embarqués dans les véhicules a un impact sur la confiance qu’un
agent accorde aux autres (et à lui-même).
A chaque pas de temps de communication, les agents comparent leurs informations reçues avec
leurs propres mesures. Ensuite, chaque agent i mémorise et met à jour une opinion locale de
chacun des agents j qu’il a perçu auparavant sous la forme d’une valeur de confiance Tij . Cette
valeur de confiance est définie comme la combinaison des valeurs de confiance directe DTij et
de confiance indirecte ITij .
5
Premièrement, DTij se déduit directement de l’erreur de mesure mij :
DTij = max(1 − mij σ, 0), (4)
où σ exprime la tolérance à l’égard des erreurs de mesures.

Lors de la seconde étape, si et seulement si les valeurs de confiance directe ont été déterminées,
la confiance indirecte ITij est calculée. L’information indirecte désigne les données partagées
par les autres agents, de telle sorte que la confiance indirecte entre un agent i et un agent j soit
exprimée à partir des valeurs de confiance Tkj provenant des dernières communications directes
de l’agent k avec l’agent j. Ainsi, ITij s’écrit
Σk∈Nij Tik Tkj
ITij = , (5)
Σk∈Nij Tik
où Nij désigne l’ensemble des agents k de cardinal nij qui ont précédemment comparé leurs
informations directement avec les agents j et i et donc mis à jour leurs valeurs de confiance Tik
et Tkj .
Puis, la confiance en soi qu’un agent i a en lui-même peut être vue comme la confiance moyenne
qu’on les autres agents ayant interagit avec i en lui :
Σk∈Ni Tkk Tki
Tii = , (6)
Σk∈Ni Tkk
où Ni est l’ensemble des agents ayant communiqué directement avec i, de cardinal ni . Cette
confiance en soi représente l’assurance qu’un agent a en lui-même.
F IGURE 5 : Comparaison locale de la confiance
Dans la dernière étape, l’agent i peut calculer la valeur de confiance Tij , selon l’exemple de la
figure 5, comme une moyenne pondérée entre les trois types de confiance :
Tii DTij + ITij
Tij = . (7)
Tii + 1
La confiance influence ensuite directement la décision des agents en pondérant les coefficients
aij comme suit :
aij = pij · Tij , (8)
où pij représente la règle de proximité, définie comme une fenêtre cosinus qui permet de prendre
davantage en considération les véhicules les plus proches afin d’assurer la stabilité de la file de
véhicules. Elle s’écrit :
!!
1 (xj − xi )
Pij = 1 + cos π , (9)
2 r
Pij
pij = P . (10)
l Pil
De plus, nous avons défini un seuil de fiabilité δ ∈ ]0; 1[ en dessous duquel une plus faible
6
valeur de confiance implique un comportement non coopératif entre les agents considérés, ce
qui provoque l’arrêt de la communication avec ces véhicules identifiés comme peu fiables.
Conception de la simulation
Calibrage du modèle IDM par des données réelles
Toutes nos expérimentations numériques ont été menées à partir d’un jeu de données de trajec-
toires NGSIM (25). Le jeu de données est une fenêtre d’observation de 45 minutes (de 7h50 à
8h35) d’une section de l’Hollywood Freeway (US 101), située à Los Angeles en Californie. Les
données ont été collectées le 15 juin 2005. La section considérée est composée de cinq voies
et comporte une voie d’insertion et une voie de sortie. Dans cette étude, nous nous sommes
concentrés sur les comportements de suivi de véhicule sur les deux voies les plus à gauche (les
plus éloignées des voies d’entrée/sortie), afin de maximiser la proportion de situations de strict
suivi de véhicule. Les données comportaient 445 véhicules pour la voie la plus à gauche et
559 véhicules pour la seconde. Concernant le processus de filtrage, les séries temporelles des
vitesses des véhicules suiveurs ont servi de mesure de performance au calibrage. L’étape de
filtrage des données NGSIM est cruciale pour retirer les informations irréalistes et aberrantes.
Un seuil sur l’écart-type des vitesses des prédécesseurs de 10 feet/s a été fixé pour éliminer les
véhicules trop lents qui pourraient apporter un biais dans les résultats. La méthode utilisée est
le filtre passe-bas Butterworth (fréquence de coupure fc = 0.07 Hz, ordre n = 4) qui permet
d’écarter précisément les hautes fréquences tout en gardant plus de variations pour les faibles
profils. Si un des paramètres calibrés atteint les 1% autour de sa limite prédéfinie, le jeu ca-
libré est éliminé. Quand le nombre de générations atteint la limite maximale (130), le jeu est
lui-aussi écarté. A la fin de ce procédé, nous avons obtenu 305 jeux de cinq paramètres calibrés
pour IDM. Nous invitons le lecteur a consulter les travaux de (26) qui présentent en détail la
méthodologie de calibrage, notamment l’analyse statistique de la distribution des paramètres.
Architecture et implémentation
L’architecture présentée dans la figure 6 repose sur une boucle classique perception-décision-
action.
Après une étape d’initialisation qui permet de se placer dans les conditions initiales et de créer
les structures de données à partir des paramètres précédemment calibrés, la boucle principale
de la simulation est lancée. D’abord, pendant l’étape de perception, chaque véhicule perçoit son
environnement local immédiat et met à jour ses mesures. Puis tous les véhicules coopératifs
présents dans le rayon de communication partagent leurs informations comparables et leurs
valeurs de confiance précédemment calculées. Enfin, chaque véhicule coopératif met à jour ses
nouvelles valeurs de confiance qui représentent l’opinion locale qu’il accorde aux capteurs des
autres véhicules.
Durant cette étape, un véhicule peut être amené à effectuer un changement de voie (ou non) et
à mettre à jour son accélération. Cette mise à jour de l’accélération repose sur l’application de
la loi de poursuite coopérative ou du modèle non coopératif (en fonction des caractéristiques du
véhicule et des valeurs de confiance).
Indicateurs de performance
Des indicateurs pertinents doivent être correctement choisis pour évaluer le modèle proposé.
Ici, l’objectif est de montrer que le modèle coopératif en trois couches est capable d’améliorer
l’écoulement du flux de trafic en termes d’efficacité, d’homogénéité et de sécurité. L’efficacité
de la stratégie coopérative sur le trafic peut être facilement observable sur des diagrammes
espace-temps ou des distributions de temps de parcours. Alors que pour l’homogénéité du trafic,
l’hypothèse est d’obtenir un trafic lissé grâce à la coopération entre les véhicules. En plus de
l’observation des trajectoires d’accélération, un indicateur de divergence de groupe Gd (group
7
F IGURE 6 : Diagramme fonctionnel
disagreement value) a été introduit (27) :

1 X
Gd = bij (ẋj − ẋi )2 , (11)
4 (i,j)∈N 2
où bij est la valeur d’adjacence binaire (1 si présent dans le rayon d’interaction, 0 sinon), et
N représente l’ensemble des véhicules sur la portion de route. L’indicateur Gd prend son sens
pour comparer les écarts de vitesses sur une section où sont présents un nombre comparable de
véhicules, et permet ainsi d’évaluer les avantages apportés par la stratégie coopérative.
Pour évaluer l’homogénéité à un niveau individuel, nous utilisons l’indicateur Post-
Enroachment Time (PET). Le PET est défini comme la différence temporelle entre deux vé-
hicules passant par une même zone spatiale. Ainsi, il traduit un risque direct de collision : une
valeur de PET de 0 seconds équivaut à une collision. Très proche de l’indicateur Time To Colli-
sion (TTC), le PET a été sélectionné par l’administration américaine des transports (US DOT)
pour leur modèle d’évaluation de la sécurité (SSAM) (28). Pour plus d’informations concernant
les problèmes de sécurité des systèmes de régulation de vitesse autonomes, le lecteur peut se
référer à (29).
Résultats expérimentaux
Le trafic simulé comprend 600 véhicules qui évoluent sur une section d’autoroute à 3 voies.
L’objectif des simulations est d’étudier l’impact du pourcentage de véhicules coopératifs et de
la fiabilité des informations. Nous avons défini deux types de simulations :
• Expérimentation 1 : cas statique. La communication se limite à la propagation des valeurs
de confiance ; l’impact de la confiance est mis en évidence par une analyse de sensibilité.
8
• Expérimentation 2 : cas dynamique. Le bruit des capteurs évolue dynamiquement ; les
valeurs de confiance et les mesures des capteurs sont partagées.
Expérimentation 1
Pour cette première simulation, les erreurs de mesures des capteurs sont définies dans l’inter-
valle [− ∆x2eq , ∆x2eq ] pour les inter-distances et dans l’intervalle [− ẋ2eq , ẋ2eq ] pour les vitesses et
les vitesses relatives. Un facteur de bruit est appliqué aux capteurs perturbés. L’objectif est
d’améliorer l’écoulement du flux de trafic grâce à la coopération et ce, même en présence de
capteurs perturbés. Le trafic est initialisé à l’état d’équilibre (i.e. les positions des véhicules sont
sélectionnées pour créer un état de stabilité). Cette première expérimentation montre l’impact
de la stratégie coopérative même en présence de 60% de capteurs perturbés. Un premier dia-
gramme des Gd (calculés à partir de l’équation 11) permet de vérifier l’efficacité des couches
communication et confiance.
F IGURE 7 : Evolution du Gd au cours du temps avec 60% de capteurs perturbés, δ = 0, 7,

σ=5
La figure 7 représente les valeurs de Gd pour 60% de capteurs perturbés, avec plusieurs propor-
tions (taux de pénétration) de véhicules coopératifs. La décroissance des valeurs de Gd montre
l’efficacité de la stratégie coopérative dès 60% de véhicules coopératifs malgré un mauvais
contexte initial.
Expérimentation 2
On s’intéresse désormais à la façon dont réagit un trafic mixte composé de véhicules coopéra-
tifs équipés de capteurs perturbés face à un changement des valeurs de confiance, i.e. quand on
observe des écarts dans les mesures données par les capteurs (e.g. mauvaises conditions météo-
rologiques). Dans cette simulation, le facteur de bruit évolue linéairement au cours du temps
entre 0 et 0,25. Ce changement dans les erreurs de mesure correspond à une altération des va-
leurs de confiance de 1 à 0,5. Cette simulation permet d’en étudier les conséquences sur le flux
de trafic.
La figure 8 représente l’évolution temporelle des séries de PET. Le facteur de bruit évolue li-
néairement au cours du temps jusqu’à mener à une valeur de confiance de 0,5. La stabilisation
apportée par l’introduction de la coopération est observable verticalement. Un trafic non coopé-
ratif manifeste un étalement de la distribution des quartiles. Les ondes de type “stop and go”
se propagent et de telles instabilités résultent en un trafic hétérogène. En augmentant le taux de
pénétration des véhicules coopératifs, le trafic devient plus robuste et limite la propagation des
9
F IGURE 8 : Evolution des distributions de PET au cours du temps pour des valeurs de confiance
dynamiques et différentes fractions de véhicules équipés
instabilités : plus le pourcentage de coopération augmente, plus les distributions de PET sont
compactes. D’autre part, la figure 8 peut s’analyser horizontalement : lorsque la confiance entre
les agents décroit, les distributions se dispersent progressivement avec le temps. Ainsi, quand la
confiance atteint une valeur inférieure à 0,7 (qui correspond au seuil de coopération δ), ce qui
survient juste avant le temps t=60s, l’hétérogénéité du trafic commence à s’amplifier. Même si
une diminution des valeurs de confiance n’as que peu d’impact sur l’hétérogénéité du trafic (i.e.
dispersion des distributions de PET), la transition est, elle, facilement observable avec le seuil
qui délimite un trafic coopératif contre un trafic non-coopératif.
(a) (b)
F IGURE 9 : Diagrammes espace-temps avec (a) 25% et (b) 100% de véhicules coopératifs.
Cette tendance est clairement confirmée par les diagrammes espace-temps de la figure 9, où
tant pour 25 ou 100% de véhicules coopératifs, les nouvelles ondes de choc ne se propagent
que lorsque les valeurs de confiance passent sous le seuil δ, qui traduit la transition entre trafic
coopératif et non coopératif. Plus concrètement, sur la figure 9a, pour 25% de véhicules coopé-
ratifs, la fraction de véhicules coopératifs ne suffit pas à éliminer toutes les instabilités mais
permet tout de même d’éviter que ces instabilités ne prennent de l’ampleur, ce qui est confirmé
par l’évolution des distributions de PET (figure 8). Ainsi, quand le seuil δ est atteint, de nou-
velles ondes de choc s’ajoutent aux précédentes. Avec un taux de pénétration initial de 100%
de véhicules coopératifs, seul un état de confiance en deçà du seuil de coopération mène à la
10
propagation et au développement d’ondes de choc.
Dans le cas dynamique, il n’y a pas de connaissance a priori sur la qualité des capteurs qui
sont tous initialisés comme étant fiables. Le modèle devrait pouvoir apprendre à détecter quels
capteurs sont défaillants afin d’éviter les effets néfastes sur le flux de trafic. Cette expérimenta-
tion montre que la couche de confiance ainsi conçue requiert un nombre minimum d’échanges
d’informations pour être suffisamment précise dans la détection.
Conclusion
La définition des couches de communication et de confiance s’intègre dans la conception d’une
architecture robuste capable de maintenir l’homogénéité d’un flux de trafic même lorsque les
véhicules sont équipés de capteurs défaillants. La capacité d’apprentissage des véhicules intelli-
gents permet la détection des capteurs défaillants et l’émergence de nouvelles propriétés à partir
des interactions locales. Avec un minimum d’informations échangées, la couche confiance pro-
posée devrait permettre au système d’évoluer vers une auto-organisation entraînant une harmo-
nisation des vitesses. L’originalité de l’approche se traduit par l’utilisation de concepts récents
issus de la théorie du trafic : la communication V2V est intégrée au niveau d’un modèle clas-
sique de trafic via la notion de multi-anticipation. Puis cette couche physique est influencée
par les règles de communication contrôlées par des concepts fondés sur la confiance. Les ré-
sultats démontrent que le modèle en trois couches est capable de faire face aux problèmes de
fiabilité des informations. Le compromis entre le pourcentage de véhicules équipés et la fiabi-
lité de l’information devrait être déterminé en élaborant différentes stratégies de contrôle. Le
modèle présenté dans cet article peut être facilement ajusté pour tester différentes stratégies co-
opératives. La prochaine étape consiste à tester différentes méthodes de gestion du trafic (quelle
information considérer ? partager ? où ? quand ?) et à développer un apprentissage par renfor-
cement pour les véhicules coopératifs s’appuyant sur le concept de confiance. Les problèmes
d’hétérogénéité du flux de trafic (véhicules coopératifs et non coopératifs) ainsi que la fiabilité
devraient être étudiés en détails dans les prochains travaux. Une autre voie d’exploration re-
pose sur la définition et l’introduction d’une stratégie de changement de voie coopérative (30)
qui devrait catalyser l’émergence d’un comportement macroscopique depuis les interactions
locales.
11
Références
[1] B. Chen and H. H. Cheng. A review of the applications of agent technology in traffic
and transportation systems. IEEE Transactions on Intelligent Transportation Systems, 11
(2) :485–497, June 2010. ISSN 1524-9050. doi : 10.1109/TITS.2010.2048313. URL
http://dx.doi.org/10.1109/TITS.2010.2048313.
[2] B. Burmeister, A. Haddadi, and G. Matylis. Application of multi-agent systems in traffic
and transportation. Software Engineering. IEE Proceedings, 144(1) :51–60, 1997. ISSN
1364-5080. doi : 10.1049/ip-sen:19971023.
[3] R. Sukthankar, S. Baluja, and J. Hancock. Multiple adaptive agents for tactical dri-
ving. Applied Intelligence, 9(1) :7–23, July 1998. ISSN 0924-669X. doi : 10.1023/A:
1008243013521. URL http://dx.doi.org/10.1023/A:1008243013521.
[4] R. J. F. Rossetti, S. Bampi, Ronghui L., D. Van Vliet, and H. B. B. Cybis. An agent-based
framework for the assessment of drivers’ decision-making. In Intelligent Transportation
Systems, 2000. Proceedings. 2000 IEEE, pages 387–392, 2000. doi : 10.1109/ITSC.2000.
881094.
[5] H. Dia and S. Panwai. Modelling drivers’ compliance and route choice behaviour in
response to travel information. Nonlinear Dynamics, 49(4) :493–509, 2007. ISSN 0924-
090X. doi : 10.1007/s11071-006-9111-3. URL http://dx.doi.org/10.1007/
s11071-006-9111-3.
[6] J. L. Adler, G. Satapathy, V. Manikonda, B. Bowles, and V. J. Blue. A multi-agent
approach to cooperative traffic management and route guidance. Transportation Re-
search Part B : Methodological, 39(4) :297 – 318, 2005. ISSN 0191-2615. doi :
10.1016/j.trb.2004.03.005. URL http://www.sciencedirect.com/science/
article/pii/S0191261504000517.
[7] M. C. Choy, D. Srinivasan, and R.L. Cheu. Cooperative, hybrid agent architecture for real-
time traffic signal control. Systems, Man and Cybernetics, Part A : Systems and Humans,
IEEE Transactions on, 33(5) :597–607, 2003. ISSN 1083-4427. doi : 10.1109/TSMCA.
2003.817394.
[8] D. Srinivasan and M.C. Choy. Cooperative multi-agent system for coordinated traffic
signal control. Intelligent Transport Systems, IEE Proceedings, 153(1) :41–50, 2006. ISSN
1748-0248.
[9] C. Ruey-Shun, C. Duen-Kai, and L. Szu-Yin. Actam : Cooperative multi-agent system ar-
chitecture for urban traffic signal control. IEICE transactions on Information and Systems,
88(1) :119–126, 2005.
[10] D. A. Roozemond. Using intelligent agents for pro-active, real-time urban intersection
control. European Journal of Operational Research, 131(2) :293–301, 2001.
[11] J. Z. Hernández, S. Ossowski, and A. Garcıa-Serrano. Multiagent architectures for intelli-
gent traffic management systems. Transportation Research Part C : Emerging Technolo-
gies, 10(5) :473–506, 2002.
12
[12] B. Chen, H. H. Cheng, and J. Palen. Integrating mobile agent technology with multi-
agent systems for distributed traffic detection and management systems. Transportation
Research Part C : Emerging Technologies, 17(1) :1 – 10, 2009. ISSN 0968-090X. doi :
10.1016/j.trc.2008.04.003. URL http://www.sciencedirect.com/science/
article/pii/S0968090X08000314.
[13] F.-E. Wang. Agent-based control for networked traffic management systems. IEEE In-
telligent Systems, 20(5) :92–96, September 2005. ISSN 1541-1672. doi : 10.1109/MIS.
2005.80. URL http://dx.doi.org/10.1109/MIS.2005.80.
[14] D. Helbing. Traffic and related self-driven many-particle systems. Review of Modern
Physics, 73 :1067–1141, Dec 2001. doi : 10.1103/RevModPhys.73.1067. URL http:
//link.aps.org/doi/10.1103/RevModPhys.73.1067.
[15] R. Holzer, H. Meer, and C. Bettstetter. On autonomy and emergence in self-organizing
systems. In Proceedings of the 3rd International Workshop on Self-Organizing Systems,
IWSOS ’08, pages 157–169, Berlin, Heidelberg, 2008. Springer-Verlag. ISBN 978-3-
540-92156-1. doi : 10.1007/978-3-540-92157-8_14. URL http://dx.doi.org/
10.1007/978-3-540-92157-8_14.
[16] S. Abdallah and V. Lesser. Multiagent reinforcement learning and self-organization in a
network of agents. In Proceedings of the 6th international joint conference on Autonomous
agents and multiagent systems, AAMAS ’07, pages 39 :1–39 :8, New York, NY, USA,
2007. ACM. ISBN 978-81-904262-7-5. doi : 10.1145/1329125.1329172. URL http:
//doi.acm.org/10.1145/1329125.1329172.
[17] J. Sabater and C. Sierra. Review on computational trust and reputation models. Artificial
Intelligence Review, 24 :33–60, 2005.
[18] Hani Alzaid, Manal Alfaraj, Sebastian Ries, Audun Josang, Muneera Albabtain, and
Alhanof Abuhaimed. Reputation-based trust systems for wireless sensor networks :
A comprehensive review. In Trust Management VII, volume 401 of IFIP Advances
in Information and Communication Technology, pages 66–82. Springer Berlin Heidel-
berg, 2013. ISBN 978-3-642-38322-9. doi : 10.1007/978-3-642-38323-6_5. URL
http://dx.doi.org/10.1007/978-3-642-38323-6_5.
[19] M. Schillo, P. Funk, I. Stadtwald, and M. Rovatsos. Using trust for detecting deceitful
agents in artificial societies. Applied Artificial Intelligence Journal, Special Issue on Trust,
Deception and Fraud in Agent Societies, 2000.
[20] Q-A. Nguyen Vu, R. Canal, B. Gaudou, S. Hassas, and F. Armetta. Trustsets : using
trust to detect deceitful agents in a distributed information collecting system. Journal
of Ambient Intelligence and Humanized Computing, 3(4) :251–263, 2012. ISSN 1868-
5137. doi : 10.1007/s12652-012-0140-0. URL http://dx.doi.org/10.1007/
s12652-012-0140-0.
[21] M. Treiber and A. Kesting. Traffic flow dynamics : data, models and simulation. Springer,
2013. ISBN 978-3-642-32460-4.
[22] M. Treiber and A. Kesting. Modeling lane-changing decisions with mobil. In Traffic
and Granular Flow 07, pages 211–221. Springer Berlin Heidelberg, 2009. ISBN 978-
3-540-77073-2. doi : 10.1007/978-3-540-77074-9_19. URL http://dx.doi.org/
10.1007/978-3-540-77074-9_19.
13
[23] H. X. Ge, S. Q. Dai, and L. Y. Dong. An extended car-following model based on intelligent
transportation system application. Physica A : Statistical Mechanics and its Applications,
365(2) :543–548, 2006.
[24] C. Castelfranchi and R. Falcone. Principles of trust for mas : cognitive anatomy, social
importance, and quantification. In Proceedings of the International Conference on Multi
Agent Systems, pages 72–79, 1998. doi : 10.1109/ICMAS.1998.699034.
[25] V. Punzo, M. T. Borzacchiello, and B. Ciuffo. On the assessment of vehicle trajectory
data accuracy and application to the Next Generation Simulation (NGSIM) program data.
Transportation Research Part C : Emerging Technologies, 19(6) :1243 – 1262, 2011. ISSN
0968-090X. doi : 10.1016/j.trc.2010.12.007. URL 1.
[26] J. Monteil, R. Billot, J. Sau, C. Buisson, and N.-E. El Faouzi. Calibration, estimation
and sampling issues of car following model. Proceedings of the 93rd annual meeting
of the Transportation Research Board. Transportation Research Board of the National
Academies, Washington, DC, 2014.
[27] J. Choi, S. Oh, and R. Horowitz. Distributed learning and cooperative control for multi-
agent systems. Automatica, 45(12) :2802–2814, December 2009. ISSN 0005-1098.
doi : 10.1016/j.automatica.2009.09.025. URL http://dx.doi.org/10.1016/j.
automatica.2009.09.025.
[28] SSAM, software user manual. http ://www.fhwa.dot.gov/publications, 2008.
[29] M. M. Minderhoud and P. H.L. Bovy. Extended time-to-collision measures for road traffic
safety assessment. Accident Analysis and Prevention, 33(1) :89 – 97, 2001. ISSN 0001-
4575. doi : http://dx.doi.org/10.1016/S0001-4575(00)00019-1. URL http://www.
sciencedirect.com/science/article/pii/S0001457500000191.
[30] David M. and Pat L. Learning cooperative lane selection strategies for highways. In In
Proceedings of the Fifeenth National Conference on Artificial Intelligence, pages 684–691.
AAAI Press, 1998.
14

Maxime Gueriau

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Maxime Gueriau

Încărcat de

Drepturi de autor:

Formate disponibile

Modélisation et simulation multi-agents du trafic coopératif

Mots-clés : Systèmes coopératifs, Simulation multi-agents, Confiance, Théorie du trafic

Nombre de mots : 4959

Une architecture multi-agents en trois couches

où s est l’inter-distance entre le véhicule considéré et son leader, s∗ (ẋn , ∆ẋn ) = s1 +

F IGURE 4 : Communications entre véhicules coopératifs

DTij = max(1 − mij σ, 0), (4)

où σ exprime la tolérance à l’égard des erreurs de mesures.

F IGURE 5 : Comparaison locale de la confiance

disagreement value) a été introduit (27) :

F IGURE 7 : Evolution du Gd au cours du temps avec 60% de capteurs perturbés, δ = 0, 7,

S-ar putea să vă placă și