Intellegence Rtificielle - Technique de L'ingenieur

Réf.
: S7217 V2
Intelligence artificielle et
Date de publication :
10 mars 2020 diagnostic
Cet article est issu de : Automatique - Robotique | Automatique et ingénierie système
par Sylvain PIECHOWIAK
Mots-clés Résumé Le diagnostic est un problème important sur lequel se sont penchés depuis
intelligence artificielle | longtemps de nombreux chercheurs se réclamant de l’intelligence artificielle. Diverses
diagnostic | raisonnement
automatique | systèmes à base approches ont été imaginées : les unes se basent sur une formalisation logique du
de connaissance raisonnement. Les autres privilégient l’exploitation de l’expérience de terrain des
ingénieurs en maintenance.
Avec l’apparition d’une puissance de calcul et de stockage des nouveaux ordinateurs,
l’intelligence artificielle connaît actuellement un regain d’intérêt, notamment dans le
domaine des techniques d’apprentissage automatique. Ces techniques peuvent
également être exploitées pour réaliser des outils performants de diagnostic.
Keywords Abstract Diagnosis is an important issue that has been addressed for a long time by
artificial intelligence | many researchers claiming to be using artificial intelligence. Various approaches have
diagnosis | automatic
reasoning | knowledge-based been elaborated: some are based on a logical formalization of the reasoning process.
systems The others focus on exploiting the field experience of maintenance engineers.
New computers are now equipped with power processors and with very large memory:
this leads to a renewed interest for artificial intelligence, particularly in the field of
automatic machine learning techniques. These techniques can also be used to create
high-performance diagnostic tools.
Pour toute question :

Service Relation clientèle
Techniques de l’Ingénieur
Immeuble Pleyad 1 Document téléchargé le : 07/01/2021
39, boulevard Ornano
93288 Saint-Denis Cedex Pour le compte : 7200029588 - ec nat polytechnique enp // professeur ENP // 105.103.48.136
Par mail :
infos.clients@teching.com
Par téléphone :
00 33 (0)1 53 35 20 20 © Techniques de l'Ingénieur | tous droits réservés
Ce document a ete delivre pour le compte de 7200029588 - ec nat polytechnique enp // professeur ENP // 105.103.48.136
Intelligence artificielle et diagnostic

Professeur des universités
LAMIH UMR CNRS 8502, Université polytechnique Hauts-de-France, 59300 Valenciennes,
France
Note de l’éditeur
Cet article est la version actualisée de l’article [S 7 217] intitulé Intelligence artificielle et
diagnostic rédigé par Sylvain PIECHOWIAK et paru en 2003
1. Qu’est-ce que le diagnostic ?............................................................... S 7 217v2 - 2

1.1 Terminologie ............................................................................................... — 2
Parution : mars 2020 - Ce document a ete delivre pour le compte de 7200029588 - ec nat polytechnique enp // professeur ENP // 105.103.48.136
1.2 Supervision.................................................................................................. — 3
2. Diagnostic en IA ...................................................................................... — 3
2.1 Systèmes experts........................................................................................ — 4
2.2 Raisonnement à base de cas...................................................................... — 5
2.3 Réseaux de neurones ................................................................................. — 6
2.4 Réseaux bayésiens...................................................................................... — 8
2.5 Arbres de décision ...................................................................................... — 11
2.6 Diagnostic à base de modèles ................................................................... — 12
2.6.1 Concepts ............................................................................................. — 13
2.6.2 Diagnostic ........................................................................................... — 13
2.6.3 Formalisation...................................................................................... — 14
2.6.4 Méthodes de calcul ............................................................................ — 15
2.6.5 Quelques outils de calcul .................................................................. — 16
2.6.6 Autres méthodes ou outils ................................................................ — 16
2.7 Raisonnement hypothétique...................................................................... — 17
2.7.1 Systèmes de maintien du raisonnement ......................................... — 17
2.7.2 Des RMS aux CSP et des CSP aux diagnostics ............................... — 18
2.8 Problème des tests et du choix des observations.................................... — 18
2.9 Conclusion ................................................................................................... — 18
3. Discussion ................................................................................................. — 18
Pour en savoir plus .......................................................................................... Doc. S 7 217v2
L e monde dans lequel nous vivons voit naître des systèmes dont la
complexité s’accroît constamment. Avec le développement des nouvelles
technologies et de leur utilisation dans les nouveaux produits, les fonctions de
conception et de maintenance engendrent des tâches qui requièrent des
niveaux de qualification de plus en plus élevés. Cette constatation ne se limite
pas au seul domaine technique, mais concerne également d’autres domaines
tels que la médecine.
À l’origine, le diagnostic était une notion purement médicale qui désignait
l’activité consistant à identifier une maladie par ses symptômes. Bien évidem-
ment, cette activité entre dans un processus plus global dont l’objectif ne s’arrête
pas à l’identification des maladies, mais comprend surtout la définition des soins
à apporter pour guérir le patient ou pour le soulager. En effet, on ne va pas voir
son médecin pour connaître le nom de sa maladie, mais pour être soigné !
Copyright © – Techniques de l’Ingénieur – Tous droits réservés

S 7 217v2 – 1
tiwekacontentpdf_s7217 v2 Ce document a ete delivre pour le compte de 7200029588 - ec nat polytechnique enp // professeur ENP // 105.103.48.136
INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________
Cette vision médicale a ensuite été reprise dans le monde technique et indus-
triel. Cette fois, il ne s’agit plus de rechercher les causes d’une maladie chez un
patient, mais les causes d’une défaillance ou d’une panne d’un dispositif phy-
sique. D’un point de vue conceptuel, il n’y a pas de différence fondamentale
entre le diagnostic médical et le diagnostic technique. Tous les deux consistent
à rechercher les causes d’un dysfonctionnement d’un système physique ou
vivant en vue de le réparer ou de le soigner.
Dans le domaine technique, la fonction « maintenance » regroupe deux grandes
classes d’activités : les activités relatives à la gestion et à l’organisation de la main-
tenance et les activités relatives à ses aspects techniques. Cette dernière classe est
souvent englobée dans la supervision, notamment quand il s’agit de traiter des
systèmes complexes tels que des centrales nucléaires ou des dispositifs électro-
niques de gestion du trafic ferroviaire, par exemple. Elle se décline en trois tâches
importantes : la prévention, le diagnostic et le dépannage.
Cet article a pour objectif de présenter le diagnostic sous l’angle de l’intelligence
artificielle (IA), domaine à la frontière de disciplines scientifiques variées telles que
l’informatique, l’automatique, la psychologie, etc. Il s’articule en trois sections. La
première constitue un rappel de diverses définitions. La seconde présente les prin-
cipales méthodes de diagnostic issues de l’intelligence artificielle ; elle se focalise
sur les approches les plus représentatives. Enfin, une synthèse de ces approches
est faite dans la troisième section afin de dégager les propriétés de ces approches.
1. Qu’est-ce que il s’agit plutôt de diagnostic au sens médical, c’est-à-dire la

recherche des causes d’une maladie lorsque celle-ci laisse appa-
le diagnostic ? raître des signes ou des symptômes révélateurs.
Le vocabulaire relatif au diagnostic dans le domaine technique
Le diagnostic est une tâche hautement cognitive centrale dans de est précisé dans ce qui suit. Un vocabulaire similaire se retrouve en
nombreux domaines économiques, en médecine, dans le monde médecine ou dans d’autres domaines.
industriel, ou même dans l’enseignement. L’objectif visé par le dia-
gnostic consiste à déterminer les causes d’un dysfonctionnement ■ On appelle dispositif une entité composée d’éléments (les compo-
ou d’une maladie à partir d’observations et de symptômes consta- sants) qui évoluent dans le temps dans le but de remplir une fonc-
tés. Les techniques de diagnostic sont souvent liées au domaine tion définie. Chaque dispositif évolue en interaction avec son
traité et dépendent très fortement des caractéristiques du dispositif environnement.
à diagnostiquer.
■ Un composant est un élément discret d’un dispositif. Il est inter-
Exemples connecté ou en interaction avec d’autres composants. C’est l’unité
de description minimale de l’analyse systémique.
Dans le domaine médical, pour mener à bien son diagnostic, le méde-
cin doit tenir compte des caractéristiques humaines (psychologiques, Le domaine du diagnostic fait référence aux notions d’observa-
physiologiques, etc.) de ses patients lorsqu’il préconise des examens tion, de panne, de défaillance et de symptôme.
complémentaires. Il doit également tenir compte des caractéristiques de
ces examens. Leur coût ou les désagréments qu’ils engendrent entrent ■ Une observation est une information obtenue sur le dispositif réel.
souvent en ligne de compte. De plus, il n’est pas rare, au cours d’un exa- Cette information peut être obtenue soit à une entrée, soit à une sor-
men difficile à réaliser, de recueillir des informations qui n’étaient pas tie du dispositif, ou encore entre deux composants de celui-ci.
demandées a priori. L’objectif est d’apporter le maximum d’informations
au médecin, mais aussi de limiter les examens désagréables aux patients. ■ Une panne (fault en anglais) est la cause de l’apparition de symp-
tômes. Autrement dit, les symptômes sont les effets ou les consé-
Dans le domaine technique, l’ingénieur chargé de diagnostiquer un quences d’une panne. Une panne peut être définie comme un état
dispositif électronique sécuritaire doit prendre en compte les consé- anormal (état de fonctionnement non nominal) d’une unité fonc-
quences de ses actions et éviter, par exemple, que les mesures qu’il tionnelle la mettant dans l’impossibilité d’accomplir une fonction
prend pour acquérir de nouvelles informations n’affectent la fonction
requise. Par unité fonctionnelle, on entend soit un système
sécuritaire du dispositif.
complet, soit l’un de ses éléments. Il faut noter que le terme anglais
fault désigne aussi une anomalie, condition anormale diminuant ou
Dans la section 1.1, les définitions du vocabulaire utilisé dans la
supprimant l’aptitude d’une entité fonctionnelle à accomplir une
suite de cet article sont rappelées afin de donner une vision plus
fonction requise. Dans les situations les plus simples, la panne d’un
claire et plus précise de ce que l’on rassemble généralement sous
la dénomination « diagnostic ». seul composant constitutif du dispositif peut expliquer la panne du
dispositif complet. Dans d’autres situations, le fait que plusieurs
composants soient dans un fonctionnement « à la limite » d’un
fonctionnement normal provoque le dysfonctionnement du disposi-
1.1 Terminologie tif global. Cette situation est très difficile à diagnostiquer puisque
■ Dans le langage courant, le terme de diagnostic est souvent les composants pris individuellement semblent fonctionner norma-
utilisé pour désigner des notions variées. Par exemple, on parle lement. Dans le domaine de l’électronique, de telles situations sont
généralement de diagnostic financier pour désigner un bilan. Ici, fréquentes.

S 7 217v2 – 2
_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC
■ Lorsque l’on distingue les différentes situations de fonctionne- Diagnostiquer une panne pi consiste à trouver l’ensemble des
ment d’un dispositif, on parle de ses modes de fonctionnement. symptômes apparents et des tests pertinents qui permettent
De nombreux dispositifs sont capables de fonctionner même en d’incriminer un organe du dispositif. Si T = {t1, t2,…, tr} représente
cas de défaillance de l’un de leurs composants. Cependant, le fonc- l’ensemble des tests pertinents, alors la fonction de diagnostic σ
tionnement ne se fait plus de manière optimale, mais de façon peut être définie par :
dégradée.
Exemple On peut distinguer le diagnostic hors ligne du diagnostic en

Un avion possédant deux moteurs est capable de voler même ligne. Dans le diagnostic hors ligne, tout se passe « comme si » le
lorsque l’un de ses moteurs tombe en panne. Cependant, les perfor- dispositif diagnostiqué n’évoluait plus pendant la session de dia-
mances de l’avion sont amoindries. gnostic. Au contraire, dans le cas du diagnostic en ligne, le dispo-
sitif continue à évoluer. Il devient alors important d’anticiper
Généralement, on distingue les modes de fonctionnement nor- l’évolution du dysfonctionnement : on parle de pronostic.
mal, dégradé et défaillant. Selon les domaines, on peut trouver Dans les deux cas, le temps peut être pris en compte dans le
d’autres modes de fonctionnement : interdit, critique, sécuritaire processus de raisonnement. Dans le cas du diagnostic hors ligne,
ou exceptionnel. c’est la chronologie des événements qui est exploitée (on parle de
raisonnement avec et sur le temps). Dans le cas du diagnostic en
■ Selon l’Afnor, une défaillance (failure en anglais) est une « ces- ligne, se pose en plus le problème difficile du temps nécessaire
sation de l’aptitude d’une unité fonctionnelle à accomplir une fonc- pour réaliser ce raisonnement face à la rapidité d’évolution du dis-
tion requise avec les performances définies dans les spécifications positif. Ici, on parle de raisonnement dans le temps ou temps réel,
techniques ». La défaillance est un passage d’un état à un autre, il est caractéristique des systèmes de supervision. La prise en
par opposition à une panne qui est un état. compte du temps est traitée dans la section 2.
■ Un symptôme est un phénomène qui survient sur un dispositif
et qui révèle un dysfonctionnement. Une température trop élevée,
une pression trop basse, une tension nulle, etc., sont des exemples
de symptômes. Il est également fréquent de regrouper les symp-
2. Diagnostic en IA
tômes en fonction du dysfonctionnement auquel ils sont liés : on
parle alors de syndrome. Certains dysfonctionnements peuvent Pour plus de détails sur l’intelligence artificielle, le lecteur
ainsi être diagnostiqués plus rapidement lorsqu’ils sont associés à est invité à consulter les articles [R 7 215] et [H 3 740].
des syndromes caractéristiques.
En intelligence artificielle, on peut classer les approches de trai-

1.2 Supervision tement du diagnostic en deux classes, selon le type de connais-
sances utilisées.
Le diagnostic fait partie d’un processus plus global, la supervi-
sion, qui comporte trois grandes fonctions : la détection, la locali-
■ Dans la première classe, on trouve les approches basées sur
des connaissances de nature heuristique, issues de l’expérience
sation et la décision.
et de l’exploitation des dispositifs. Les systèmes experts ou les
■ La détection consiste à reconnaître qu’un dispositif est dans un systèmes dits à apprentissage entrent dans cette catégorie.
mode de dysfonctionnement à partir de la connaissance de cer- Dans ces approches, l’acquisition des connaissances reste le
taines de ses caractéristiques. Les alarmes sont des moyens qui problème central. Les réseaux bayésiens et les réseaux de neu-
permettent de signaler qu’un dispositif est dans un état particulier. rones sont d’autres exemples de ces approches. Le lecteur trou-
Généralement, une alarme prévient un état critique qui peut évo- vera des présentations complètes dans [1], [2] ou [3].
luer vers un état défaillant. La difficulté principale de la détection ■ Dans la deuxième classe, on trouve les approches basées sur
est qu’il n’est pas toujours possible de recenser a priori de manière des modèles construits à partir de la physique des dispositifs et
exhaustive les signes révélateurs d’une défaillance à venir. D’autre qui décrivent leur fonctionnement correct ou leurs dysfonction-
part, il n’est pas non plus toujours possible d’avoir une observabi- nements. Ces approches reposent sur différents types de raison-
lité complète de tout dispositif (par exemple, si un dispositif peut nement selon la nature des modèles. Ici, c’est l’élaboration des
être élaboré par l’assemblage de boîtes noires dont on ne peut modèles qui est centrale. Voici quelques exemples de « raison-
observer que les entrées et les sorties sans avoir accès à des nements » qui ont été utilisés dans le domaine du diagnostic :
observations sûres) ; dans ces cas, la détection devient très problé-
matique. • le raisonnement hypothétique, par nature non monotone [4], [5] ;
• le raisonnement qualitatif [6] ;
■ La localisation consiste à déterminer les causes physiques ou
fonctionnelles d’une panne. Généralement, on confond le diagnos- • le raisonnement par contraintes [7] ;
tic avec la localisation. Mais l’objectif du diagnostic ne s’arrête pas • le raisonnement multimodèle [8] ;
à cette première tâche. Ensuite, il faut déterminer le remède à
prescrire. Dans le cas le plus simple, ce remède consiste à rempla- • le raisonnement incertain ou flou [A 120].
cer un élément défaillant. Dans le problème du diagnostic, le temps joue un rôle impor-
tant et sa prise en compte peut intervenir à différents niveaux [9] :
■ La troisième fonction consiste en premier lieu à décider quel est
le mode de fonctionnement dans lequel on désire placer le disposi- • dans le modèle, prendre en compte le temps, c’est se deman-
tif (mode dégradé ou mode de fonctionnement normal). Ensuite, il der si l’on considère le dispositif comme dynamique ou
s’agit de définir précisément quelles sont les actions à entre- comme statique ;
prendre pour atteindre ce mode. • dans les pannes, c’est accepter ou refuser la présence de
Formellement, le diagnostic peut se définir de la manière sui- pannes fugitives ou évolutives ;
vante : soit un dispositif dont les symptômes de panne forment • dans les traitements, intégrer la notion temporelle oblige à
l’ensemble S = {s1, s2,…, sn} et dont les pannes forment l’ensemble définir des représentations du temps et des traitements
P = {p1, p2,…, pm}. adaptés, etc.
Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

S 7 217v2 – 3
Pour illustrer les différentes approches, le même dispositif sim- • règle 4

plifié sera utilisé. Celui-ci concerne une partie électrique d’une si « le moteur ne démarre pas »
automobile réduite à quatre composants : une batterie électrique,
alors « le problème vient de la batterie ou de l’allumage »
un système d’allumage, un moteur d’essuie-glaces et les ampoules
de l’éclairage. L’objectif est de déterminer parmi ces composants • règle 5
celui ou ceux qui sont défaillants. Les observations qui peuvent si « le problème vient de la batterie ou de l’allumage » et « les
être faites concernent les phares (ils fonctionnent ou non), les phares fonctionnent »
essuie-glaces (ils balaient ou non) et le moteur de l’automobile (il alors « l’allumage est en panne »
démarre ou non).
• règle 6
si « les essuie-glaces ne fonctionnent pas » et « le moteur ne
2.1 Systèmes experts démarre pas »
alors « la batterie est en panne »
Un système expert est un programme capable d’explorer une
expertise dans un domaine particulier. Cette expertise rassemble • règle 7
non seulement des connaissances directement liées à ce domaine, si « les essuie-glaces ne fonctionnent pas » et « le moteur
mais également des capacités de raisonnement acquises par les démarre »
spécialistes au cours de leur activité (les stratégies). alors « le moteur d’essuie-glaces est en panne »
Traditionnellement, un système expert se compose d’une • règle 8
base de connaissances, d’un moteur d’inférences et de diffé- si « les essuie-glaces ne fonctionnent pas » et « les phares fonc-
rentes interfaces qui lui permettent de communiquer avec son tionnent »
environnement.
alors « le moteur d’essuie-glaces est en panne »
La base de connaissances est élaborée à partir de l’expertise
d’un spécialiste. L’expertise elle-même s’obtient au cours d’un En supposant que la base de faits initiale comporte les faits « les
phares ne fonctionnent pas » et « le moteur ne démarre pas », on
processus cognitif généralement long et encore mal connu de nos

jours. C’est certainement à ce niveau que l’on peut situer la phase peut inférer, par la règle 1, que « le moteur ne démarre pas », ce qui
de création du savoir. permet ensuite d’inférer, par la règle 2, que « la batterie est en
panne ». Ce mode de fonctionnement correspond à un raisonne-
Nota : cela sort du cadre de cet article et fait appel notamment aux sciences ment déductif (on parle également de chaînage avant).
cognitives.
On peut également raisonner en partant des conclusions. Par
La simplicité du formalisme de la représentation par règles a exemple, si l’on souhaite démontrer que « la batterie est en panne »,
rendu célèbres les systèmes à base de règles (notamment dans on peut utiliser les règles 2 ou 6. En considérant la règle 2, il faudrait
les années 1980). Malheureusement, cette simplicité a masqué les démontrer que « le problème vient des ampoules ou de la batterie »
difficultés liées à l’extraction des connaissances et a provoqué et que « le moteur ne démarre pas ». « Le moteur ne démarre pas »
une certaine désillusion chez de nombreux utilisateurs. Dans ces fait partie des observations disponibles, c’est donc un fait acquis.
systèmes, les connaissances expertes sont formalisées par des Pour démontrer que « le problème vient des ampoules ou de la batte-
règles de la forme : rie », on peut utiliser la règle 1 ; dans ce cas, il faut démontrer que
« les phares ne fonctionnent pas ». Cela est acquis puisqu’il s’agit
d’une observation. Ce mode de fonctionnement correspond à un rai-
où conditions est une expression qui précise les conditions de sonnement abductif (on parle également de chaînage arrière).
déclenchement de la règle. Déclencher une règle, c’est admettre
ce qui est précisé dans les conclusions. On parle également d’infé- L’un des problèmes importants qui reste encore d’actualité
rence. Cela revient à modifier l’état des connaissances actuelles concerne l’extraction et la représentation des connaissances. En effet,
sur le problème en cours de résolution (appelées mémoire de tra- on constate que les spécialistes possèdent de manière inconsciente
vail) permettant d’avancer dans cette résolution. leur savoir : il leur est donc difficile d’exprimer leurs connaissances. Il
Le cas particulier des systèmes dans lesquels les connais- existe plusieurs freins qui rendent difficile l’extraction des connais-
sances manipulées sont des formules propositionnelles (sans sances. En premier lieu, les experts ont souvent le sentiment d’être
variable) et où les conditions sont de simples conjonctions peut dépossédés de leurs compétences. Ensuite, lorsque plusieurs experts
illustrer ce propos. L’état courant de la connaissance sur le pro- sont consultés, il se peut que les connaissances soient contradictoires
blème à résoudre est représenté par la base de faits qui et dans ce cas se pose le problème de l’arbitrage.
regroupe l’ensemble des faits connus a priori ou par déclenche- Les systèmes à base de règles ne sont pas les seuls systèmes à
ment de règles. base de connaissances capables d’exploiter des connaissances
expertes. D’autres modèles de représentation existent : la représenta-
Exemple tion par triplet (objet, attribut, valeur), les règles, les réseaux séman-
Voici des règles qui pourraient constituer une base de connais- tiques, les frames, la logique, etc. On peut trouver dans [H 3 740] une
sances pour l’exemple de l’automobile : présentation générale de ces systèmes à base de connaissances.
• règle 1 De plus, on peut distinguer des modes de raisonnement plus
si « les phares ne fonctionnent pas » complexes que celui de l’exemple précédent. En effet, dans cet
alors « le problème vient des ampoules ou de la batterie » exemple, les nouveaux faits déduits par inférence sont supposés
définitivement admis : le raisonnement est monotone. Mais il n’est
• règle 2 pas rare de devoir prendre en compte des faits qui évoluent dans le
si « le problème vient des ampoules ou de la batterie » et « le temps, ni même de progresser dans le raisonnement en posant des
moteur ne démarre pas » hypothèses. Dans ce cas, les inférences réalisées peuvent être révi-
alors « la batterie est en panne » sées parce que les connaissances utilisées lors d’une étape du rai-
sonnement peuvent devenir obsolètes (car les caractéristiques du
• règle 3
problème ont changé) ou contradictoires (car les hypothèses consi-
si « le problème vient des ampoules ou de la batterie » et « le dérées sont incompatibles). Le raisonnement est dit non monotone.
moteur démarre » Dans [10], on trouve une présentation complète des différents
alors « les ampoules sont en panne » modes de raisonnement.

S 7 217v2 – 4
2.2 Raisonnement à base de cas

Dans un système de raisonnement à partir de cas (CBR), les
connaissances sont emmagasinées sous la forme de cas. Un cas est
un morceau contextualisé d’une connaissance apprise lors d’une
expérience antérieure, face à un problème similaire. L’ensemble des
cas (connus) est indexé en fonction de critères de similarité. Ainsi,
face à un problème, la recherche d’un ou de plusieurs cas similaires
se fait de manière efficace. Le calcul de la similarité se fait à partir
des attributs pertinents sur les situations rencontrées auparavant.
Le raisonnement à partir de cas se fait en plusieurs étapes qui
s’enchaînent selon la figure 1. On distingue cinq grandes étapes :
1/ l’évaluation du problème à résoudre ;
2/ la recherche dans la mémoire de cas des candidats potentiels,
puis la sélection des meilleurs d’entre eux ;
3/ l’adaptation éventuelle des candidats retenus et la proposition Figure 2 – Base de cas initiale
d’une solution ;
4/ l’évaluation de cette solution proposée ;
5/ l’apprentissage qui entraîne la mise à jour de la base de cas. Lorsque la base de cas devient importante, il est nécessaire
d’envisager des structurations plus efficaces. Les structurations
Quand un nouveau problème doit être traité, il est d’abord « for-
hiérarchisées sont utilisées dans ce sens. Dans une structuration
maté », c’est-à-dire représenté par un ensemble de descripteurs, véri- hiérarchisée, les cas sont regroupés dans des clusters plus ou
tables attributs pertinents. Cette représentation va permettre de moins généraux. La recherche d’un cas se fait progressivement en
comparer ce nouveau problème avec l’ensemble des cas connus et partant des clusters les plus généraux vers les cas les plus spéci-
classés dans la base de cas. Parmi tous les cas connus, seuls ceux fiques. Une fois choisi le cluster correspondant le mieux au cas
ayant un lien avec le nouveau problème sont retenus. Puis ils sont traité, la recherche se poursuit uniquement parmi les éléments de
classés en utilisant une fonction de similarité. Ensuite, à partir du ou ce cluster. Les clusters peuvent se subdiviser en sous-clusters, ce
des meilleurs cas obtenus, la solution au problème est déterminée qui explique l’appellation d’organisation hiérarchique. Une telle
par adaptation ou correction des solutions connues. Enfin, la session organisation de mémoire accélère la recherche du meilleur cas
est conservée dans la base de cas : c’est la phase d’apprentissage. suivant l’ordre des indices. La figure 3 montre une organisation
Sur la figure 2, on donne l’exemple d’une simple bibliothèque hiérarchique possible liée à notre exemple. D’autres techniques
initiale de cas qui concerne notre dispositif. Dans cet exemple, la (indexation, partitionnement, recherche parallèle, etc.) permettent
bibliothèque est « plate ». De ce fait, la recherche des cas simi- aussi de traiter des bases importantes en volume.
laires se fait en considérant tous les cas et la solution proposée Un point délicat des approches CBR concerne le choix des
est la meilleure. indices. Un indice est un attribut particulier d’un cas, employé par
la fonction de similarité pour la détermination du degré de simili-
tude entre la situation étudiée et un cas déjà emmagasiné. Dans le
cas de l’exemple de cet article, il y a trois attributs qui corres-
pondent à l’état du moteur, des phares et des essuie-glaces. Les
Figure 3 – Bibliothèque initiale de cas suivant une organisation

Figure 1 – Cycle du raisonnement à base de cas hiérarchique

S 7 217v2 – 5
indices doivent être choisis attentivement : plus le nombre d’indices

employés est grand, plus le nombre d’attributs comparés est
important, ce qui entraîne des durées de recherche plus longues. La
précision de la similarité se dégrade avec l’insuffisance du nombre
d’indices. Dans cet exemple, trois indices sont choisis : moteur,
phares et essuie-glaces. Le choix de la fonction de similarité est
probablement le point le plus sensible dans un système à base de
cas, puisque cette fonction détermine presque entièrement l’effica-
cité de l’utilisation de la connaissance emmagasinée. Des tech-
niques d’appariement peuvent s’appuyer sur des techniques issues
de l’expérience du domaine. Pour ce problème de diagnostic, une
fonction de similarité est employée entre les attributs selon le
tableau 1 dans lequel les valeurs de 0, 1 et 2 représentent respecti-
vement des similarités nulles, faibles et fortes. La similarité entre
deux cas est définie à partir d’un calcul sur les similarités des attri- Figure 4 – Nouvelle situation en entrée ajoutée à la base de cas
buts en faisant par exemple une moyenne pondérée. Ici, c’est la
somme des similarités des attributs entre deux cas qui est utilisée.
cas ont la possibilité, bien que limitée, de s’adapter aux change-
La figure 4 présente un nouveau cas ; celui-ci aura des degrés ments d’un domaine puisqu’il suffit de rajouter des cas. Il faut noter
d’appariement avec les trois cas préexistants dans la base (ces degrés qu’avec des bibliothèques de cas hiérarchiquement organisées, ces
sont donnés dans le tableau 2). Le cas de la base qui est « le plus changements peuvent nécessiter une lourde réorganisation de la
similaire » à ce nouveau cas est le cas n° 2. En effet, il présente un bibliothèque.
degré d’appariement supérieur aux autres. Dans cet exemple, le dia-
gnostic « batterie en panne » sera proposé sur la base de cette simila- Les désavantages des systèmes CBR sont liés aux coûts de traite-
rité. En réalité, ce diagnostic est faux dans l’absolu, mais c’est le ment associés à la procédure d’appariement et aux coûts d’organi-
meilleur que le système puisse fournir compte tenu de l’état actuel de sation de la bibliothèque de cas. Une approche pour éviter ces
la base de cas. On peut effectivement constater que dans cette base, coûts peut être l’emploi de mécanismes d’apprentissage inductif
les pannes d’ampoules ne sont pas encore présentes. La base de cas pour extraire des règles générales qui couvrent la plupart des cas
doit donc évoluer, s’adapter et engranger de nouvelles connais- dans la base. Cela peut considérablement réduire la taille de la base
sances. Pour cela, le rôle d’un utilisateur expert reste nécessaire. de cas, à un point tel que les seuls cas dont la présence est néces-
saire dans la base soient les exceptions connues aux règles géné-
Si l’on fait l’hypothèse que l’utilisateur de la base est suffisam- rales induites. Cependant, l’applicabilité de telles techniques est
ment expérimenté pour répondre que le diagnostic retourné par le très dépendante de la nature du domaine, de la représentation des
système CBR est erroné et que le bon diagnostic dans cette situa- cas, de leur indexation et de leur mesure de similarité.
tion aurait dû être « ampoules en panne », le système ajoutera cette
nouvelle connaissance à la bibliothèque de cas (ce nouveau cas Le choix des descripteurs pour l’indexation et celui de la fonc-
n° 4 est présenté sur la figure 4b). Dans les sessions futures, le sys- tion de similarité utilisée lors de la recherche des cas similaires au
tème sera alors capable de diagnostiquer les pannes d’ampoules. problème à résoudre sont les points délicats de cette approche
sur lesquels repose, en grande partie, son efficacité.
Les systèmes CBR se distinguent des autres systèmes à base de
Pour une présentation plus détaillée des avantages et des
connaissances par le fait que la connaissance en diagnostic n’est
inconvénients de l’utilisation d’une base de cas dans le cadre du
mise ni sous la forme d’un modèle explicite du domaine, ni sous la
diagnostic, on peut se référer à la thèse [11] dans laquelle le CBR
forme de règles heuristiques. Les connaissances sont toutes repré-
sert à capitaliser et à réutiliser la connaissance de diagnostic d’un
sentées sous la forme de cas. La connaissance supplémentaire spé-
système complexe dans le domaine téléphonique.
cifique au problème est utilisée pour concevoir des heuristiques qui
guident dans la procédure d’appariement. Les systèmes à base de Le raisonnement à partir de cas, notamment pour rechercher les
diagnostics, repose principalement sur l’existence de cas repré-
sentatifs des problèmes et sur la possibilité d’enrichir la base de
connaissances.
Tableau 1 – Fonction de similarité Généralement, les techniques de l’intelligence artificielle trouvent
pour deux attributs x et y la source de leur fondement dans le modèle humain. Au lieu
d’essayer de reproduire le comportement d’un expert face à un pro-
x/y OUI NON X blème, il est également possible de s’inspirer d’un modèle « plus
organique » de l’homme. C’est l’un des objectifs visés par les
OUI 2 0 1 réseaux neuromimétiques, encore appelés réseaux de neurones.
NON 0 2 1
X 1 1 1 2.3 Réseaux de neurones

Le cerveau humain est composé d’une centaine de milliards de
cellules appelées neurones. Leur comportement est simple, elles
réagissent à des stimulus qui leur arrivent par des dendrites. Cette
Tableau 2 – Degrés d’appariement du nouveau cas
réaction se traduit par l’envoi d’une énergie électrique par les
axones. Les neurones sont connectés entre eux par des synapses.
Numéro du cas La réaction d’un neurone peut être propagée vers d’autres neu-
Degré d’appariement
de la bibliothèque rones. Ainsi, à partir d’un comportement local simple, on arrive à
obtenir un comportement global évolué.
1 2
Ce merveilleux organe où l’on situe une grande partie du mys-
2 3 tère de l’intelligence est à la base des réseaux connexionnistes, ou
réseaux neuronaux artificiels. Il s’agit de réseaux massivement
3 2 interconnectés et composés d’éléments de traitement relative-
ment simples.

S 7 217v2 – 6
Le plus grand intérêt des réseaux connexionnistes vient de leur

parallélisme massif, de leur aptitude à s’adapter par une modifica-
tion de leur structure et de leur bonne performance en présence
de bruit. Les n entrées d’un neurone sont représentées par un vec-
teur ou, dans le cas de modèles binaires, par un vecteur
binaire .
Chaque neurone calcule une fonction relativement simple à partir
des valeurs provenant de ses entrées (qui peuvent être reliées à
d’autres neurones) et transmet ses résultats à d’autres neurones
auxquels il est relié par ses liaisons de sortie. Une grande variété
de fonctions sont employées dans la pratique. Les plus communes
sont les fonctions linéaires, les fonctions à seuil et les fonctions
sigmoïdes. Figure 5 – Description d’un neurone
Exemples de fonctions associées à des neurones l’entrée correspondante aura une valeur 1. Sinon, la valeur de cette
entrée sera –1. Les quatre neurones de sortie du réseau corres-
■ Fonction linéaire :
pondent à quatre diagnostics possibles : ampoules en panne, batte-
rie en panne, moteur des essuie-glaces en panne et allumage en
■ Fonction à seuil : panne.
Pour interpréter le résultat fourni par le réseau, il suffit de
savoir que les sorties des neurones sont en concurrence et que
c’est le neurone dont la sortie est la plus élevée qui exprime le
résultat attendu. Le neurone gagnant produit une sortie de
■ Fonction sigmoïde : valeur 1, tandis que les autres fournissent –1. Cette stratégie,
appelée winner takes all dans la littérature, ne permet que le dia-

gnostic de pannes simples.
Exemple
À chaque neurone est associé un ensemble de paramètres
modifiables qui s’adaptent par apprentissage. Les paramètres Sur la figure 6, les valeurs des entrées moteur, phares et essuie-
employés sont les poids, qui représentent, en quelque sorte, la glaces sont : –1, –1 et 1. Cela signifie que le moteur et les phares ne
force des synapses entre les neurones. Les poids associés à un fonctionnent pas (–1) et que les essuie-glaces fonctionnent (1).
neurone i comportant n entrées sont représentés par un vecteur Chaque neurone utilise la valeur de ses entrées pour calculer la
de poids de dimension n : . valeur de sa sortie. Pour ce réseau, à une entrée [–1, –1, 1] corres-
pondent les sorties suivantes :
Le pouvoir de représentation et de traitement de ces réseaux de
neurones dépend à la fois des fonctions utilisées au niveau des
neurones, mais aussi de l’architecture du réseau (nombre des
neurones et type de connexion entre eux).
La conception d’un réseau de neurones passe par trois étapes :
1/ la construction du réseau de neurones : on y définit la topologie
du réseau (nombre de couches de connexion entre neurones) ainsi
que les fonctions à associer aux neurones ;
2/ l’ajustement des différents paramètres : cette étape, appelée
phase d’apprentissage, consiste à apprendre des classes de sortie Seule la sortie OBatterie en panne est de valeur 1, donc le réseau
en fonction d’exemples fournis aux entrées ; connexionniste a diagnostiqué un problème dû à la batterie. Une sor-
3/ l’exploitation du réseau de neurones : au cours de cette étape, le tie –1 signifie que le composant concerné est interprété comme
rôle d’un réseau de neurones est de reconnaître à quelle classe n’étant pas en panne.
connue appartient le problème fourni en entrée. Le diagnostic batterie en panne semble être un bon diagnostic au
Lors de la phase d’apprentissage, les réseaux neuronaux modi- vu des informations initiales. Pourtant, si l’on suppose que l’ensemble
fient les poids des entrées de chaque neurone. Cela consiste essen- d’apprentissage utilisé est celui qui est donné dans le tableau 3, ce
tiellement à rechercher les poids qui permettent au réseau de cas n’apparaît pas ! Cela montre certaines capacités de généralisation
classer correctement tous les exemples de l’ensemble d’apprentis- des réseaux de neurones (réseau limité dans cet exemple).
sage. Comme il s’agit fondamentalement d’un problème d’optimi-
sation, une variété de méthodes peut être employée pour la Un autre réseau de neurones est construit en utilisant une variante
détermination de ces poids. La plupart des algorithmes utilisent de règle d’apprentissage de Rosenblatt [13]. Le réseau obtenu est
une certaine forme de recherche guidée par l’erreur [12]. celui de la figure 7. Ce réseau a été construit de la manière suivante :
La figure 5 représente un neurone possédant trois entrées et on commence l’apprentissage avec un poids initial aléatoire pour
une sortie. La fonction utilisée, par exemple, pour ce neurone est chaque entrée ; des instances de l’ensemble d’apprentissage sont
la suivante : si la somme ∑ ei × wi est supérieure ou égale au seuil, ensuite présentées de manière séquentielle ou aléatoire.
la valeur en sortie est 1, sinon cette valeur est –1 (ei désigne une Les poids sont mis à jour si la classe de l’instance (le diagnos-
entrée et wi le poids qui lui est associé). tic) diffère du résultat donné par le réseau. La règle de modifica-
Les réseaux de neurones peuvent être utilisés pour effectuer tion de poids employée dans de telles circonstances est donnée
des diagnostics. Pour cela, on suppose connues les classes de dia- par l’équation :
gnostics reconnaissables. Faire un diagnostic consiste à détermi-
ner à quelle classe appartient une situation particulière.
Le réseau contient des neurones à trois entrées, une pour chaque où Wi est le vecteur poids associé au neurone i et t désigne le pas
état : moteur, phares et essuie-glaces. Si un composant fonctionne, de temps. di et oi représentent les sorties voulues et les sorties

S 7 217v2 – 7
Figure 7 – Nouveau réseau neuronal établi à l’aide de la règle

d’apprentissage hebbienne
Figure 6 – Réseau connexionniste

On voit donc qu’il n’existe pas de règles générales pour connaître
la performance des réseaux. Les capacités de généralisation d’une
combinaison de réseau neuronal et d’algorithme d’apprentissage

Tableau 3 – Ensemble d’apprentissage dépendent de divers facteurs qui incluent le bon choix de
l’ensemble d’apprentissage et l’adéquation entre la complexité de
Essuie- la tâche de classification et la complexité du réseau.
Moteur Phares Diagnostic n°
glaces En résumé, les réseaux neuronaux fournissent un ensemble
d’outils puissants pour l’apprentissage inductif de connaissances
ok ok ab(ampoules) 1 dédiées au diagnostic à partir d’exemples représentatifs. Ils sont
tolérants aux bruits et sont opérationnels même en cas d’insuffi-
ab(batterie) 2 sance de valeurs. Cependant, leur plus grand défaut par rapport
aux arbres de décision et aux systèmes experts est que leur
ok ab(moteur 3 comportement est difficile à comprendre car ils s’appuient sur
essuie-glaces) des calculs numériques impliquant un grand nombre de pondé-
rations dont la définition est de nature heuristique. Toutefois,
ok ab(allumage) 4 des techniques d’extraction de la connaissance apprise par un
réseau de neurones et de transcription sous forme de règles ont
ok ok ab(moteur 5 été proposées dans [13]. Cela ouvre la possibilité à une variété
essuie-glaces) de systèmes hybrides utilisant des combinaisons de systèmes
experts, d’arbres de décision, de réseaux neuronaux et d’autres
ok ok ab(allumage) 6 approches.
Pour une description plus approfondie des réseaux de neurones

obtenues actuellement lors de l’itération t pour le neurone i. Xi est dans le domaine du diagnostic, le lecteur peut consulter [1].
le vecteur représentant les valeurs d’entrée du neurone i et h est
le taux d’apprentissage (souvent choisi avec la valeur 1). La règle
d’apprentissage de l’équation est connue sous le nom de règle 2.4 Réseaux bayésiens
d’apprentissage hebbienne [1] :
Il n’est pas rare que la connaissance exploitée lors d’un raison-
nement en diagnostic soit incertaine. Par exemple, si nous savons
que la proposition p fut vraie dans 70 % des situations connues,
nous pouvons caractériser notre croyance dans la valeur de vérité
Il est intéressant d’observer que la réponse du réseau de neurones de p par l’emploi de probabilités, c’est-à-dire P (p) = 0,7 (probabi-
lité de 0,7 pour que la proposition p soit vraie).
de la figure 7 pour l’entrée [–1, –1, 1] produit la sortie [1, 1, –1, –1], ce
qui indique que le problème vient des ampoules, de la batterie ou des Les systèmes de reconnaissance des formes statistiques
deux à la fois. Ce résultat est beaucoup plus proche de ce que dirait emploient des procédures d’inférence probabilistes de classifica-
un expert face à une telle situation. tion qui utilisent la distribution statistique des valeurs des attri-
buts des motifs (un motif, ou encore une forme, est un ensemble
De la même façon, avec le réseau de neurones de la figure 6, de couples attribut/valeur) de chacune des classes. Une fois que
pour l’entrée [1, 1, 1] – ce qui signifie que tout fonctionne correc- cette distribution est estimée à partir des instances de l’ensemble
tement –, le réseau fournit en sortie [1, –1, –1, 1]. Cela indique d’apprentissage, les valeurs des attributs de l’exemple à classer
qu’il y a une panne d’ampoule ou d’allumage. C’est un diagnostic peuvent être employées pour calculer les croyances dans les diffé-
erroné. En revanche, avec les mêmes valeurs en entrée du réseau rentes classes, au regard de l’instance. Techniquement, la classe
de la figure 7, on obtient le diagnostic [–1, –1, –1, –1], ce qui cor- élue est la plus vraisemblable, étant donné les valeurs des attri-
respond mieux à ce qu’indiquerait un expert humain. buts de l’instance. La difficulté majeure est la spécification des

S 7 217v2 – 8
dépendances entre les variables du système étudié. Un moyen

pour simplifier cette spécification est l’utilisation de réseaux de
croyance.
Les réseaux bayésiens, parfois appelés réseaux de croyance ou
réseaux causaux probabilistes [3], sont des outils pour représenter
les relations entre des propositions ou des variables, même si ces
relations comportent de l’incertitude ou de l’imprécision (dans le
cas des réseaux de croyance). Ils peuvent être générés automati-
quement à partir de données fournies par des experts ou par
apprentissage. Cette représentation par graphe, facilement
compréhensible, permet une visualisation claire des relations
impliquées. Ces réseaux utilisent des algorithmes qui calculent
une approximation des probabilités conditionnelles qui fonc-
tionnent assez bien en pratique. Ils ont une structure qui repré-
sente de manière succincte les distributions conjointes de
probabilité des variables aléatoires. Ils contiennent des nœuds qui
représentent des ensembles de variables aléatoires et des arcs
dirigés entre ces nœuds qui représentent les influences entre ces
nœuds. Chaque nœud est équipé d’une table de probabilités
conditionnelles qui évalue les effets des parents du nœud.
Précisément, les réseaux bayésiens sont des graphes causaux
auxquels on associe des informations probabilistes [2]. Ainsi, ils
permettent de représenter graphiquement des connaissances dans
un domaine particulier. Les nœuds du réseau représentent les
concepts du domaine et les liens orientés désignent des relations

de causalité. Chaque nœud peut prendre une valeur dans
l’ensemble de ses valeurs d’instanciation. On impose aux graphes
d’être sans cycle. À cette structure graphique, on associe des infor-
mations probabilistes de la manière suivante : à chaque nœud du
Figure 8 – Exemple de réseau bayésien
graphe est associée une variable aléatoire. Les valeurs de cette
variable sont celles du nœud auquel elle est associée. Les probabi-
lités des valeurs des variables dépendent des valeurs des variables tés des réseaux [14]. Toutes ces techniques se basent sur l’existence
correspondant aux nœuds pères directs : il s’agit donc de probabili- d’une base d’exemples et ont des liens étroits avec les communau-
tés conditionnelles. Lorsqu’un nœud n’a pas de père, les valeurs de tés machine learning ou data mining.
la variable qu’il représente ont une distribution a priori.
Dans la communauté DX, plusieurs études ont été réalisées
La figure 8 illustre l’exemple d’un réseau bayésien dans le dans le but de construire automatiquement des réseaux bayé-
domaine médical. Chaque nœud représente une variable caractéris- siens. Par exemple, une méthode de construction des réseaux
tique du problème. Pour les nœuds sans parent, on donne la distri- bayésiens pour modéliser des dispositifs électroniques consiste à
bution de probabilité des valeurs possibles et pour les autres nœuds, partir de leur modèle fonctionnel et des taux de fiabilité connus de
on donne les probabilités conditionnelles en fonction des nœuds leurs composants. Dans [15], les auteurs exposent une construc-
parents directs. Les liens entre les nœuds expriment une causalité. tion qui se base sur la topologie des dispositifs.
L’utilisation essentielle des réseaux bayésiens réside dans le Nota : on désigne par communauté DX l’ensemble des chercheurs qui travaillent sur
calcul des probabilités conditionnelles d’événements liés les uns le diagnostic à base de modèles, en référence au workshop international qui porte ce
aux autres par des relations de cause à effet. Ce calcul se fait par nom.
propagation ou par inférence. Dès que l’on modifie les données L’idée suivie pour la construction consiste à associer un réseau
d’une variable, cette modification est propagée dans le réseau bayésien élémentaire à chaque composant en utilisant un nœud
pour mettre à jour la connaissance sur les autres variables. Cette pour chaque entrée/sortie et un nœud pour représenter l’état de
propagation se fait à partir de la règle de Bayes. fonctionnement du composant. Puis, le réseau du dispositif complet
est obtenu par assemblage des réseaux de base. La hiérarchisation
Exemple s’obtient en regroupant plusieurs composants et en définissant un
Lorsque l’on fixe la valeur d’une variable (elle est connue avec cer- nouveau réseau bayésien partiel pour ce groupe de composants.
titude), la probabilité de cette valeur passe à 1. Cette information Malheureusement, la hiérarchisation ne peut pas se limiter au
entraîne un changement de l’état de connaissance sur les autres regroupement de composants : une difficulté est due à la présence
variables. de différents niveaux d’abstraction dans les données manipulées.
Ainsi, par exemple, au niveau le plus bas, on peut manipuler des
La mise à jour d’un graphe en utilisant la règle de Bayes est très bits alors qu’à des niveaux supérieurs, il peut être nécessaire de trai-
coûteuse en temps de calcul. Pour limiter ce coût, il est possible ter des octets ou des entiers. Il est ensuite proposé de rechercher les
d’exploiter les propriétés structurelles du graphe de causalité diagnostics les plus probables (comme le préconisent également
associé. En particulier, J. Pearl a défini des algorithmes efficaces [16] ou [17]) en commençant les traitements au niveau le plus haut,
lorsque le graphe possède une structure arborescente [3]. puis en focalisant le raisonnement sur les parties « intéressantes »
des niveaux inférieurs.
Deux principaux reproches sont formulés contre les réseaux bayé-
siens. Le premier est qu’il est nécessaire de connaître le graphe de La suite de cette section traite plus précisément des fondements
causalité. Le second est que toutes les probabilités conditionnelles des réseaux bayésiens.
des variables doivent être connues. Pour résoudre ces problèmes, Les algorithmes d’approximation des probabilités conditionnelles
des propositions s’appuyant sur des techniques d’apprentissage ont utilisent tous le théorème de Bayes qui permet de calculer la vrai-
été formulées. Certaines techniques permettent de déterminer la semblance d’occurrence de chacune des hypothèses suivant des
structure d’un réseau alors que les autres recherchent les probabili- évidences. Si l’on considère un ensemble de causes possibles (qui

S 7 217v2 – 9
peuvent être des classes Ci représentant chacune un composant en

panne) et un événement X qui s’est réalisé (des observations sur le
système), le théorème de Bayes est le suivant :
(1)
avec
Une fois que les probabilités d’occurrence des classes de dia-

gnostic Ci conditionnées par X ont été calculées grâce à l’équation
précédente, la classification de X peut être réalisée en choisissant
la classe Ck qui présente la vraisemblance maximale, c’est-à-dire :
(2)
Le théorème de Bayes peut être employé dans des applications
Figure 9 – Réseau bayésien pour le problème de diagnostic de
de diagnostic s’il est possible de calculer, soit grâce à la connais- voiture
sance du domaine, soit grâce aux procédures d’estimation, la par-
tie droite de l’équation (1).
Ainsi, dans un scénario où les attributs sont caractérisés par les La structure du réseau bayésien, présenté sur la figure 9, obte-
trois variables aléatoires X1, X2 et X3 pour lesquelles on observe nue à partir des connaissances sur le domaine, permet de repré-
senter les variables du problème et leurs dépendances. Par
les valeurs v1, v2 et v3, l’équation (1) donne :

exemple, le fait que les ampoules soient en panne ne va pas
modifier le fonctionnement du moteur (X1). On peut alors écrire :
(3)
Les probabilités conditionnelles de l’exemple sont données

Pour calculer cette équation, on doit calculer la probabilité dans le tableau 4. Ces probabilités conditionnelles sont issues de
conditionnelle : l’expérience acquise sur ce type de matériel (que l’on peut trouver
dans des historiques de pannes ou auprès d’experts du domaine).
(4)
et la probabilité conjointe : Exemple
vaut 0,85 puisqu’en général, si le moteur et la
(5)
batterie fonctionnent bien, le moteur démarre, mais il y a 15 % des
Le calcul de la probabilité conjointe est difficile car il demande cas où pour une autre raison (non représentée ici), le moteur ne
l’examen de toutes les combinaisons possibles des attributs. À démarre pas.
noter que pour n classes Ci et m éléments d’observation Xj, il y a
2m+n situations possibles, ce qui demande 2n – 1 probabilités a représente le fait que l’on est certain de ne
priori et (2m – 1) × 2n probabilités conditionnelles. Pour contourner pas pouvoir démarrer sans batterie ou sans allumage.
ces difficultés, on a recours à des hypothèses simplificatrices,
comme l’indépendance des attributs Xi par rapport aux classes Ci, Une fois que ces probabilités conditionnelles sont calculées, le
l’exhaustivité des classes et leur exclusion mutuelle. La représenta- système est prêt pour effectuer un diagnostic. Par exemple, on
tion du problème sous la forme d’un réseau bayésien simplifie la peut considérer le cas où les essuie-glaces fonctionnent (X3 = ok),
spécification des indépendances entre les variables (observations et mais pas les phares , ni le moteur . Le
classes) du système. réseau bayésien permet de calculer :
Exemple
Pour le problème d’automobile choisi pour illustrer cet article, X1,
X2 et X3 peuvent représenter les observations faites sur les phares, le
moteur et les essuie-glaces. Chacune de ces observations prend une
valeur dans le domaine avec des probabilités spécifiques.
On peut utiliser, par exemple, l’ensemble d’apprentissage du
tableau 3 pour déterminer le nombre d’instances pour lesquelles le Puisque représente la valeur
moteur fonctionne. Ainsi, on obtient la probabilité pour que la variable de probabilité maximum, à partir de ces observations, le système
X2 ait la valeur ok. La tâche du système de diagnostic est d’assigner
aux observations X une des m catégories de diagnostic C1,…, Cm. Par déduit le diagnostic : ampoules en panne . Il convient de noter le
exemple, les classes C1, C2, C3, C4 correspondent aux diagnostics fait que le problème peut aussi provenir de l’allumage (allumage en
respectifs : ampoule = ok, batterie = ok, essuie-glaces = ok et allu-
mage = ok. Avec les instances du tableau 3, il est facile de détermi- panne, ). La panne double n’est pas non plus à exclure.
ner la fréquence de distribution des classes de diagnostic. Par En ajoutant des variables de décision (qui peuvent être maîtri-
exemple, on observe que 1/6 des problèmes viennent d’ampoules en sées) et des variables d’utilité (qui peuvent être optimisées) aux
panne . La probabilité a priori de chaque classe de diagnostic, cal- relations d’un réseau de croyance, on crée un réseau décisionnel
culée à partir de l’ensemble d’apprentissage, est donc : (appelé aussi diagramme d’influence). Celui-ci est utile pour opti-
miser des décisions, réguler des systèmes ou encore faire de la
planification.

S 7 217v2 – 10
Tableau 4 – Valeurs des probabilités conditionnelles du réseau bayésien
ok
Les réseaux bayésiens ne sont qu’une technique parmi d’autres 2.5 Arbres de décision
pour raisonner avec l’incertitude, comme le calcul de Dempster-
Schafer, la logique floue et d’autres méthodes qui leur sont liées. L’algorithme ID3 [18] fournit une méthode inductive pour déter-
La théorie de Dempster-Schafer est conçue pour faire la distinction miner les règles de classification. Ces règles sont représentées ici
entre l’incertitude et l’ignorance. La logique floue, quant à elle, par un arbre de décision. Un arbre de décision est composé de
représente la notion d’imprécision en utilisant des ensembles flous feuilles correspondant aux noms des classes (les diagnostics) et
pour caractériser de quelle manière un objet ou une situation satis- de nœuds internes correspondant à des tests avec une branche
fait une description vague. Plutôt que des valeurs booléennes, les pour chacun des résultats possibles du test. Les arcs entre les
prédicats flous sont des valeurs réelles comprises entre 0 et 1. Ces nœuds représentent des valeurs possibles pour les différents
systèmes modélisent ainsi le flou entre des limites de classe plutôt tests.
que l’incertitude au sens probabiliste. On trouvera une présentation Le problème de diagnostic cité en exemple pourrait être résolu
de la théorie des ensembles flous dans l’article [A 120]. en utilisant l’arbre de décision de la figure 10. Chaque nœud
interne, symbolisé par un rectangle, représente un test sur l’attri-
but indiqué dans la cellule. Les feuilles représentent des compo-
En résumé, les méthodes probabilistes présentées ici consti- sants en panne : les diagnostics.
tuent une approche efficace pour réaliser un diagnostic, sur-
tout dans les domaines où les données sont bruitées et dans Typiquement, les arbres de décision sont utilisés lorsque l’on
les applications pour lesquelles la connaissance partielle du traite un problème de diagnostic comme un problème de déci-
domaine est disponible sous la forme de réseaux causaux. sion ou de classification. La figure 10 reprend les instances de
Cette connaissance peut être complétée par des exemples de l’ensemble d’apprentissage du tableau 3.
diagnostic issus par exemple d’un ensemble d’apprentissage. Il est à noter que cet arbre de décision nécessite entre deux et
Malheureusement, ces approches nécessitent la connaissance trois tests pour aboutir à un diagnostic ; il n’est pas optimal. Il est
de toutes les probabilités a priori (probabilités conditionnelles possible qu’il demande plus de tests que nécessaire. Il existe un
et de distribution) ; elles font des hypothèses simplificatrices algorithme qui permet la construction optimale d’arbres de déci-
pas toujours réalistes (indépendances entre variables), exigent sion plus compacts.
de nombreux calculs et nécessitent une connaissance sur les Si l’ensemble d’apprentissage ne contient pas d’instances contra-
variables du système et leurs interdépendances pour former le dictoires (par exemple, deux instances présentant les mêmes valeurs
réseau qui devient vite complexe. pour ses attributs, mais aboutissant à deux diagnostics différents),
Figure 10 – Arbre de décision pour le problème de diagnostic de voiture

S 7 217v2 – 11
Figure 11 – Arbre de décision obtenu avec l’algorithme ID3
il est toujours possible de construire un arbre de décision qui classe Si l’attribut A peut prendre les valeurs a1,…, am, on définit la quan-
toutes les instances d’apprentissage correctement. Le but de l’induc- tité d’information apportée par la connaissance de la valeur de A par :
tion est de déterminer un arbre de décision qui non seulement classe

correctement les instances de l’ensemble d’apprentissage, mais
aussi effectue une généralisation. Étant donné un ensemble d’obser-
vations qui ont besoin d’être expliquées, on doit choisir la théorie ou (7)
le modèle – ici l’arbre – le plus simple qui puisse expliquer de
manière satisfaisante ces observations.
Pour la construction des arbres de décision, cela signifie qu’avec
un ensemble donné d’exemples, la procédure doit construire où représente le nombre d’instances de la classe j pour lesquelles
l’arbre de décision le plus simple qui les classe correctement. Les la valeur de l’attribut A vaut Ai.
petits arbres de décision nécessitent moins de tests et ont un plus L’arbre de décision est construit en privilégiant les attributs qui
grand pouvoir de généralisation, ce qui conduit à une classification permettent d’acquérir le maximum d’information. On obtient : gain
(un diagnostic) plus efficace car la solution est obtenue plus direc- (moteur) = 1,0 ; gain (essuie-glaces) = 0,586 et gain (phares) = 0,668.
tement. On a donc intérêt à commencer la construction de l’arbre en utilisant
L’idée générale d’ID3 est de choisir l’attribut qui apporte le maxi- l’attribut moteur.
mum d’information (au sens défini par Shannon) par rapport aux
Le procédé est ensuite répété en divisant les instances de
autres attributs pour réaliser la classification. ID3 construit un
l’ensemble d’apprentissage en deux sous-ensembles disjoints
arbre de décision en privilégiant en priorité les tests qui apportent
le maximum d’information. Cette approche permet ainsi de faire correspondant aux sous-arbres gauche et droit de l’arbre de déci-
une classification qui minimise le nombre de tests nécessaires sion construit jusqu’ici. À gauche, on place l’ensemble des ins-
pour aboutir aux feuilles de l’arbre. À chaque pas de l’algorithme tances pour lesquelles la valeur de l’attribut moteur est
de construction d’arbre, ID3 calcule le gain d’information pour tous « démarre », et à droite, on place l’ensemble des instances pour
les attributs non encore testés et choisit l’attribut avec le gain lesquelles la valeur de l’attribut moteur est « ne démarre pas ».
d’information maximal pour réaliser le test du nœud en cours Cela conduit à l’arbre de décision de la figure 11. On remarque
d’étude. que l’arbre obtenu est plus « compact » que celui de la figure 10.
Il donne un diagnostic en deux tests maximum.
Exemple On peut noter qu’un arbre de décision peut facilement être
Pour clarifier cette procédure, considérons le problème de diagnos- transformé en un ensemble de règles vues précédemment. Par
tic de voiture pris comme exemple dans cet article, ainsi que les indi- exemple, la branche de droite peut s’écrire : « si le moteur ne
cations fournies par le tableau 3. Ce problème a trois attributs : état démarre pas, les lampes ne s’allument pas, alors la batterie est en
du moteur, état des phares et état des essuie-glaces, et quatre panne ». Il s’agit d’une méthode efficace pour construire une base
classes (diagnostics possibles) : ampoules en panne, batterie en de connaissances à partir d’un ensemble d’exemples. Cependant,
panne, moteur d’essuie-glaces en panne et allumage en panne. les règles obtenues peuvent ne pas correspondre à l’intuition, ce
Notons pi le nombre d’instances la classe Ci. On peut alors calculer qui rend la phase d’explication des résultats difficile.
l’information prévue pour classer les instances de l’ensemble
d’apprentissage :
2.6 Diagnostic à base de modèles
Dans cette section, un état de l’art est dressé sur le raisonnement
(6) à base de modèles, et particulièrement sur le diagnostic à base de
modèles. Les premières publications qui font référence dans ce
domaine datent de 1984 avec la sortie du numéro spécial du journal
Artificial Intelligence sur le thème du raisonnement à base de
Dans l’exemple : I(p1, p2, p3, p4) = 1,9183
modèles [19]. Cette section est la plus importante de cet article car
en intelligence artificielle, les approches de diagnostic dites à base

S 7 217v2 – 12
de modèles sont actuellement celles qui concernent le plus grand Dans ce cas, il existe généralement une forte corrélation entre la
nombre de travaux de recherche. Il s’agit d’une « branche » à part topologie du dispositif et sa description logique.
entière de l’IA qui touche aussi bien les informaticiens que les auto-
La structure du circuit qui sert d’exemple à cet article est représen-
maticiens. Des sessions y sont entièrement consacrées dans les plus
tée sur la figure 13 où les quatre composants du circuit électrique C
grands congrès mondiaux dont DX, le workshop de référence.
étudié sont : COMPS = {B, A, M, P} et que les variables pouvant être
observées sont les trois sorties : phares, essuie-glaces et démarrage.
2.6.1 Concepts Ces variables peuvent prendre les valeurs ok ou . Pour simplifier
le modèle, les valeurs que peuvent prendre les variables sortie(X),
L’idée fondamentale du raisonnement à base de modèles, et par- alim(X), lumière(X), mouvement(X) et étincelle(X) sont 0 ou 1.
ticulièrement du diagnostic à base de modèles, est relativement
simple et peut s’expliquer à l’aide du schéma de la figure 12. Exemple
Cette idée consiste à comparer le comportement simulé d’un Si le courant qui sort de la batterie est correct en tension et en inten-
dispositif à l’aide du modèle de son fonctionnement correct avec sité, on lui affecte la valeur 1. De même, si la sortie lumière de l’ampoule
son comportement réellement observé. La présence de différences du phare est 1, cela signifie que l’ampoule est correctement allumée.
entre le comportement simulé et le comportement observé est le
point de départ de la recherche des diagnostics. Selon la nature du Bien sûr, ce choix est réducteur. Lorsqu’il s’agit de modéliser
modèle utilisé, cette recherche peut se faire par des approches des dispositifs réels, il est possible d’avoir recours à des descrip-
basées sur la consistance ou par des approches basées sur
tions beaucoup plus riches.
l’abduction. Dans les approches basées sur la consistance, on
cherche à expliquer les incohérences après les avoir détectées.
Dans les approches par abduction, on cherche à expliquer les La description du dispositif est :
observations et non plus nécessairement les incohérences. La suite
de cet article se focalise sur le diagnostic à base de modèles par SD = { % description du type des composants
les approches basées sur la consistance.
La section qui suit donne une brève présentation formelle du batterie (B), ampoule (P), allumage (A), moteur essuie-
diagnostic à base de modèles. Cette présentation met en évidence
le cœur du problème qui est la gestion de la cohérence dans une glaces (M), circuit électrique (C),
base de connaissances. Le maintien de la cohérence, qui est un
problème qui dépasse le cadre du diagnostic, est présenté dans la % description des connexions
section 2.7.
2.6.2 Diagnostic
Un système peut être modélisé par un triplet :
• SD représente la description du dispositif ;
• COMPS est l’ensemble fini des composants du dispositif ;
• OBS est l’ensemble des observations disponibles sur le dis-
positif. % description du fonctionnement normal
Ces observations sont les valeurs connues de certaines variables.
Les éléments de ces trois ensembles sont des formules de la
logique des prédicats du premier ordre. Généralement, SD décrit
non seulement le comportement normal de chaque composant,
mais définit également les connexions entre les différentes
variables, permettant ainsi de disposer d’une description du
comportement du dispositif entier. Cette vision provient du fait
qu’initialement, les travaux dans ce domaine étaient très axés sur le
problème du diagnostic de dispositifs électroniques combinatoires.
On remarque que SD se compose de prédicats qui décrivent le

type des composants du dispositif, de prédicats qui indiquent les
connexions entre les composants et de prédicats qui précisent le
fonctionnement normal pour chaque type de composant. ab(c)
indique que le composant c fonctionne anormalement.
Nota : ab provient de abnormal ; c’est le prédicat généralement utilisé dans la
littérature.
Dans la description du fonctionnement normal des composants,

ab(x) joue le rôle d’une hypothèse. En effet, dans les raisonne-
ments qui exploitent ces modèles, seul le fait qui concerne le
fonctionnement d’un composant peut être révisé. Cela revient à
dire que l’on suppose a priori que le modèle lui-même est correct.
Si cette hypothèse de base n’était pas respectée, rien n’interdirait
de remettre en cause le fait que B soit une batterie, ni même de
Figure 12 – Paradigme du diagnostic à base de modèles remettre en cause la validité d’une observation !

S 7 217v2 – 13
Figure 13 – Modèle du dispositif électrique
Ici, la formule se lit La première caractérisation concerne le principe de parcimonie

qui correspond à l’idée intuitive selon laquelle on peut limiter la

donc « si X est une batterie et si on fait l’hypothèse que X fonc-
recherche aux seuls diagnostics minimaux, au sens de l’inclusion
tionne correctement, alors la sortie de X doit être égale à 1 ». Les des ensembles. Un diagnostic D(Δ, COMPS-Δ) est dit minimal si et
autres formules se lisent de la même manière. seulement si aucun sous-ensemble strict de Δ n’est lui-même un
diagnostic. Dans la majorité des travaux sur le diagnostic à base de
Exemples modèles, ce sont généralement les diagnostics minimaux qui sont
Ces connaissances peuvent maintenant être exploitées pour recherchés. De plus, on suppose que les sur-ensembles d’un dia-
rechercher les diagnostics dans deux exemples. gnostic sont également des diagnostics. Ainsi, une méthode incré-
mentale simple de recherche des diagnostics consiste à soupçonner
■ Dans la première situation, on observe phare(C) = 1, essuie- les composants individuellement, puis en couple, etc. Cela revient à
glaces(C) = 1 et moteur(C) = 1. Compte tenu du modèle, aucune inco- rechercher la borne inférieure de l’ensemble des diagnostics dans le
hérence n’apparaît et on peut supposer que le dispositif fonctionne
treillis représentant tous les diagnostics possibles.
correctement.
Exemples
■ Dans la seconde situation, on observe phare(C) = 0, essuie-
glaces(C) = 0 et moteur(C) = 0. Avec ces observations, des incohé- Dans le cas du circuit de la figure 14, supposons que les observa-
rences apparaissent. En effet, si l’on suppose que la batterie fonctionne tions soient : A = 0 et C = 1.
correctement, la valeur de sortie (B) devrait être 1. De même, si l’on
■ Premier cas : modèle sans mode de panne
suppose que les composants A, M et P fonctionnent correctement, les
variables alim(A), alim(M) et alim(P) devraient valoir 0. Les incohé- Dans SD, on indique que si x est inverseur, alors s’il fonctionne cor-
rences disparaissent si l’hypothèse ab(B) est levée ou si les trois rectement, la valeur présente à sa sortie est l’opposée de celle qui
hypothèses ab(A) , ab(M) et ab(P) sont levées simultanément. est présente en entrée. On indique également la nature des différents
composants et on décrit les connexions entre les composants.
Dans le premier cas, on a déterminé un diagnostic de panne simple
(la batterie est défaillante), alors que dans le second cas, on a déter- SD :
miné une panne triple (les ampoules, le moteur d’essuie-glaces et
l’allumage sont défaillants).
2.6.3 Formalisation
Les premières définitions du diagnostic qui ont pu être données
dans la littérature décrivent un diagnostic comme un ensemble de
composants défaillants en supposant, implicitement, que les
autres composants fonctionnent correctement [20]. Un diagnostic OBS : (A = 0) (C = 1)
est une conjonction indiquant quels sont les composants défail- Dans ce premier cas, les diagnostics minimaux obtenus sont :
lants (représentés par l’ensemble Δ) et quels sont ceux fonction- D ({INV1}, {INV2}) et D ({INV2}, {INV1}). D ({INV1, INV2}, { }) est égale-
nant correctement. Elle est de la forme : ment un diagnostic mais il est non minimal.
D(Δ, COMPS-Δ) = ab(c) ab(c) (8)

c ∈Δ c ∈COMPS-Δ
et elle est telle que soit satisfiable.

Pour un ensemble de n composants, il y a 2n diagnostics pos-
sibles, correspondant à tous les cas de figure. Il convient donc de
caractériser les diagnostics afin de limiter l’espace de recherche. Figure 14 – Deux inverseurs en série

S 7 217v2 – 14
■ Deuxième cas : modèle avec mode de panne

En plus de la description du fonctionnement normal, on précise les
deux seuls modes de panne considérés : P1 correspond au collage à
0 et P2 correspond au court-circuit.
SD :
Figure 15 – Circuit composé de trois ampoules liées en parallèle

à une source d’électricité
par des expressions booléennes appelées conséquences, obte-

nues à partir d’une représentation causale de la structure du dis-
positif.
OBS : Il faut souligner que les diagnostics calculés ici sont purement
logiques. Ces calculs ne se basent que sur les données ou connais-
Dans ce deuxième cas, les diagnostics minimaux obtenus sont : sances exprimées. L’oubli de certaines de ces connaissances peut
D ({INV1}, {INV2}) et D ({INV2}, {INV1}). Cette fois, D ({INV1, INV2}, { }) parfois conduire à des diagnostics qui ne correspondent à aucune
n’est plus un diagnostic.
situation physiquement réaliste.
Cet exemple soulève deux problèmes importants. Le premier est
que l’exploitation des modes de panne remet en cause la définition
Exemple
initiale du diagnostic. Le deuxième problème soulevé est que pour
Dans le cas du circuit de la figure 15, les trois ampoules identiques
être effective, cette exploitation nécessite une connaissance exhaus-
sont reliées à une source de courant électrique. Les observations
tive des modes de panne.
sont : L1 = éteinte, L2 = éteinte et L3 = allumée. Les diagnostics
Cette propriété n’est plus vérifiée dès lors que l’on considère les (logiques) calculés sont : {L1, L2}, {Source, L3} et d’autres diagnostics
modèles de panne des composants dans le raisonnement [21]. impliquant les liaisons f1,…, f6. Le premier diagnostic se comprend
Parmi les sur-ensembles d’un diagnostic minimal, certains ne sont aisément : L1 et L2 sont grillées. Mais le second diagnostic exprime
plus des diagnostics. que L3 est en panne car elle est capable de briller malgré l’absence
d’énergie !
Dans [22], les auteurs ont proposé d’autres définitions dans le but
de caractériser les diagnostics, notamment en présence des modes
de panne. Pour cela, les notions de conflit et de conflit minimal sont L’exploitation des modes de panne permet d’éviter la définition
introduites. Un conflit est une expression logique de la forme : d’axiomes de situations physiquement impossibles. Par exemple, un
diagnostic qui prétend qu’une lampe brille en l’absence d’énergie
et que l’on doit être écarté. L’intérêt de ces modes physiquement impossibles
peut déduire de . est qu’il n’est pas nécessaire de les connaître exhaustivement pour
Quand les modes de panne sont ignorés, seuls les conflits posi- les exploiter, contrairement aux modes de panne.
tifs (sans le signe ) sont considérés. De manière intuitive, un
conflit positif de la forme : exprime que
compte tenu de SD et OBS, les composants c1,…, cn ne peuvent 2.6.4 Méthodes de calcul
pas tous fonctionner correctement.
Il existe un lien étroit entre la théorie du diagnostic qui a été pré-
Lorsque les modes de panne sont traités, les auteurs de [22] ont sentée auparavant et la logique des défauts. Ce lien vient du carac-
établi le lien entre les conflits minimaux et les diagnostics. Si Π tère non monotone des deux types de raisonnement. Quelques
est l’ensemble de tous les conflits minimaux du système (SD, définitions sont brièvement rappelées afin de préciser ce lien.
COMPS, OBS), et si , alors D(Δ, COMPS-Δ) est un dia-
gnostic si et seulement si est satisfiable. Mal-
heureusement, ce lien entre conflits minimaux et diagnostics On appelle défaut une formule de la forme :
reporte la recherche des diagnostics sur la recherche de tous les
dans laquelle M est
conflits minimaux qui est très coûteuse en temps de calcul. Pour
réduire ces coûts, on définit les diagnostics partiels. un métasymbole qui signifie « si rien ne contredit… », P(X) est
le prérequis du défaut, les Qi (X) sont la justification du défaut
Un diagnostic partiel est un diagnostic tel que toutes les et R(X) est le conséquent. Par exemple, la formule suivante
conjonctions d’ab-littéraux qu’il couvre sont des diagnostics. exprime que si X est un additionneur et que rien ne permet de
Nota : un ab-littéral est une formule de la forme ab(x) ou . On dit qu’une dire qu’il est défaillant, on peut déduire qu’il fonctionne correc-
conjonction A couvre une autre conjonction B si et seulement si chaque littéral de A tement :
apparaît dans B.
Parmi ces diagnostics partiels, ceux qui ne sont couverts par

aucun autre diagnostic sont appelés diagnostics noyaux. Les dia-
gnostics noyaux caractérisent l’espace de tous les diagnostics, mais Le couple Td dénote une théorie de défauts :
leur calcul reste encore très coûteux. De plus, pour des dispositifs
complexes, l’ensemble des diagnostics noyaux est de taille beau-
coup trop importante pour être réellement exploitable. Cela a
conduit à d’autres définitions plus restrictives du diagnostic : les où représente un ensemble de formules de premier ordre
diagnostics abductifs, les diagnostics premiers, les diagnostics
explicatifs ou les diagnostics critiques [23] [24] [25]. Dans [26], (la théorie) et où est l’ensemble
l’auteur propose de caractériser les diagnostics (par consistance) des défauts.

S 7 217v2 – 15
Soit E et (def, Th), un ensemble de formules (fermées) et une générateur de candidats de GDE maintient l’ensemble des candi-
théorie de défauts. E est une extension de (def, Th) s’il existe une dats minimaux courants et procède à une mise à jour lors de
suite (Ei) telle que : chaque ajout d’un conflit minimal. L’algorithme utilise la notion
d’environnement qui représente un ensemble de composants sup-
: posés fonctionner correctement. Chaque environnement permet
de déterminer un ensemble de prédictions. Lorsqu’une prédiction
contredit une observation, l’environnement est un conflit. Pour
obtenir les conflits minimaux, l’algorithme traite les environne-
ments selon le treillis d’inclusion de tous les sous-ensembles de
COMPS en commençant par l’ensemble vide. Pour éviter de calcu-
Où Th(Ei) représente les formules déductibles de Ei, au sens de ler plusieurs fois les mêmes prédictions, les auteurs utilisent un
la logique du premier ordre. ATMS (assumption truth maintenance system). Ce type d’outil est
Dans [20], l’auteur fait le lien entre logique des défauts et théo- présenté à la section 2.7.1.
rie des diagnostics à base de modèles : Δ est un diagnostic mini-
mal pour (SD, COMPS, OBS) si et seulement si est une
■ Sherlock : dans le système GDE, seules les descriptions du fonc-
tionnement correct des composants sont traitées. Sherlock, de
extension de Td.
Kleer et Williams [21] tentent d’exploiter les modes de panne des
composants. Ils sont confrontés au problème d’explosion combi-
2.6.5 Quelques outils de calcul natoire dû à l’utilisation des modes de panne. Ils doivent abandon-
ner l’idée de calculer les diagnostics minimaux et définissent la
Dans cette section, quelques méthodes ou outils qui calculent notion de diagnostics principaux. Les diagnostics principaux sont
les diagnostics à base de modèles sont présentées. D’une manière les diagnostics les plus probables. La recherche de ces diagnostics
générale, la recherche des diagnostics se fait en temps exponen- principaux se base sur des critères heuristiques qui précisent la
tiel, mais certains auteurs ont proposé des algorithmes moins limite de la probabilité en dessous de laquelle un diagnostic n’est
généraux mais de complexité polynomiale. La liste présentée ici pas « intéressant ».
est loin d’être exhaustive, mais elle est représentative des contri-
butions réalisées dans le domaine du diagnostic à base de Après avoir proposé un cadre théorique, de Kleer s’attaque à
modèles. des circuits réels de plus grande taille que celle des circuits qu’il
avait traités jusqu’ici. En particulier, il utilise un circuit électro-
■ Méthode naïve : pour calculer les diagnostics minimaux au sens nique qui sert de benchmark. Il constate que GDE et Sherlock sont
de la définition précédente, une méthode naïve consiste à énumé- inefficaces et incapables d’appréhender des dispositifs de grande
rer les diagnostics candidats Δ dans l’ordre croissant de la taille taille [16]. Pour maîtriser l’explosion combinatoire, il propose
des ensembles de composants et à vérifier la consistance des for- deux approches. La première concerne la prise en compte de
l’estimation des probabilités dans une phase de génération incré-
mules de . Bien sûr, cette méthode
mentale des candidats (seul le candidat le plus probable est
n’est pas satisfaisante pour les cas où les dispositifs sont de retenu). La deuxième concerne l’ATMS transformé en un HTMS
grande taille et où les diagnostics sont de cardinalité élevée. En (H pour hiérarchical) pour réduire l’explosion des conflits et des
revanche, elle peut suffire lorsque seuls les diagnostics de pannes prédictions.
simples sont recherchés.
■ Méthode de Reiter : au lieu d’énumérer puis de tester les candi- 2.6.6 Autres méthodes ou outils
dats, dans [20], l’auteur reprend une idée initialement présentée
par de Kleer en 1976 et qui s’appuie sur la notion de conflit. Un De nombreuses autres contributions ont été apportées à l’édi-
conflit pour (SD, COMPS, OBS) est un sous-ensemble {c1,…, cn} de fice du diagnostic à base de modèles. Certains efforts ont porté
COMPS tel que : sur la définition de différentes formes de modèles afin de réduire
la complexité défavorable des algorithmes précédents. D’autres
efforts ont été déployés pour appliquer la théorie du diagnostic à
base de modèles sur des dispositifs réels et souvent de grande
La génération des conflits peut se faire en calculant, grâce à un taille. Par exemple, les dispositifs électroniques de type analo-
démonstrateur de théorèmes, une réfutation pour : gique ont vite mis en évidence la nécessité de considérer la dyna-
mique et le caractère continu des grandeurs [28].
Parmi ces contributions, les travaux en physique qualitative ou
en raisonnement qualitatif (dont le lecteur trouvera une présenta-
Dans cette réfutation, chaque ab-littéral utilisé constitue un
tion dans [6]) se sont penchés sur les problèmes difficiles tels que
conflit. Un candidat est alors une « couverture » (traduction de hit-
ting-set dans [20]) de tous les conflits obtenus. Rappelons qu’une la modélisation pour le diagnostic des dispositifs continus ou dis-
couverture, pour une collection C d’ensembles, est un ensemble H crets et la modélisation pour le diagnostic des dispositifs dyna-
tel que : miques ou statiques. La séparation entre continu et discret ou
entre dynamique et statique n’est pas nette puisque certains dis-
positifs comportent à la fois des parties de nature dynamique (par
exemple, analogique dans le domaine de l’électronique) et une
partie de nature statique (par exemple, logique). Cela conduit à
concevoir des modélisations « hybrides ». De la même façon, un
dispositif qui évolue dans le temps peut être composé de proces-
Cette couverture est minimale si c’est le plus petit ensemble, au sus évoluant différemment dans le temps.
sens de l’inclusion, vérifiant la propriété précédente. Dans [20],
l’auteur a montré que les diagnostics minimaux sont exactement La prise en compte du caractère continu de certains dispositifs
les couvertures minimales des conflits. Il a proposé un algorithme se fait généralement par discrétisation. Pour cela, on définit diffé-
calculant les couvertures minimales. rentes algèbres. Par exemple, l’algèbre des signes (+, 0, –, ?) ou
l’algèbre sur les ordres de grandeur permettent de décrire le
■ General Diagnosis Engine (GDE) : dans leur système GDE, de comportement d’un dispositif en termes de tendances. D’autres
Kleer et Williams [27] calculent également les diagnostics en deux approches telles que celle suivie dans le système Cats/Diana
phases : génération des conflits et génération des candidats. Le consistent à utiliser des intervalles de valeurs.

S 7 217v2 – 16
Le temps est également un problème important à considérer.

On peut citer ici les travaux qui proposent une extension de GDE,
appelée XDE, en modélisant le temps en différents niveaux d’abs-
traction, permettant ainsi de diagnostiquer des circuits séquentiels
à états.
La théorie du diagnostic à base de modèles est difficile à appli-
quer directement sur les dispositifs de grande taille, à cause du
nombre trop élevé des composants à considérer. Les solutions
explorées pour maîtriser la complexité consistent à hiérarchiser le
modèle ou à recourir à plusieurs modèles [8]. Avec ces solutions,
le passage d’un niveau d’abstraction à un autre ou d’un modèle à
un autre reste une difficulté à surmonter pour laquelle peu de
solutions entièrement satisfaisantes ont été proposées.
2.7 Raisonnement hypothétique

Le raisonnement réalisé au cours d’un diagnostic s’appuie sou-
vent sur des hypothèses posées sur l’état de fonctionnement de
certains composants. On parle de raisonnement hypothétique. Figure 17 – Représentation graphique de deux dépendances
La présence simultanée de plusieurs hypothèses peut conduire
à la présence d’incohérences dans la base de connaissances.
Chaque inférence est transmise au RMS soit sous la forme
De la section précédente, il ressort que le cœur du raisonne- d’une justification, soit sous la forme d’un nogood. Une justifica-
ment à base de modèles est la détection des conflits utilisés lors tion est une clause de Horn. Un nogood est un ensemble de
de l’explication des incohérences : les explications constituent les termes inconsistants. Le rôle du RMS est de mémoriser les succès
diagnostics recherchés. La gestion de la cohérence dans une base et les échecs réalisés. Cela permet d’éviter de refaire plusieurs fois
de connaissances est donc centrale. Les outils qui assurent cette les mêmes inférences ou d’effectuer des inférences inutiles. Dans
gestion doivent permettre de contrôler l’impact d’une hypothèse [29], l’auteur propose une représentation graphique des dépen-
posée et de limiter les conséquences de la remise en cause d’une dances dans un RMS qui facilite la compréhension. La figure 17
hypothèse. Les systèmes de maintenance du raisonnement (RMS) donne l’exemple de la représentation d’une dépendance entre
sont des outils dédiés à ce travail. Nous commençons par les pré- faits obtenue après l’application des deux règles suivantes :
senter. Ensuite, compte tenu du lien fort qui existe entre les RMS
et les CSP (problèmes de satisfaction de contraintes), ces derniers
seront abordés plus en détail.
La première règle exprime que le fait E peut être déduit lorsque
les faits A et B sont des théorèmes (ils sont présents dans la base
2.7.1 Systèmes de maintien du raisonnement de faits ou ils sont déductibles de cette base) et lorsque les faits C
et D en sont absents (on ne peut déduire ni ni de la base
D’une manière générale, les systèmes de maintien de la cohé- de faits). La seconde règle exprime que E est également déduc-
rence fonctionnent en parallèle de systèmes d’inférences selon le tible si F est un théorème et que l’on ne peut déduire P.
schéma de la figure 16. L’ensemble constitue un système de rai-
sonnement hypothétique. Toute connaissance est représentée par un nœud qui comporte
une proposition, un état et une liste de justifications. L’ensemble
Le système d’inférences déduit de nouvelles informations à par- des nœuds représente la base de faits. L’état d’un nœud évolue au
tir des connaissances dont il dispose. Généralement, ce système cours du raisonnement. Un nœud est dans l’état IN si au moins
d’inférences manipule des connaissances représentées sous la l’une de ses dépendances est valide et il est dans l’état OUT si
forme de règles qui traduisent des dépendances entre des élé- toutes ses dépendances sont invalides. Une dépendance est dite
ments de connaissances. valide si tous les nœuds de sa liste IN sont dans l’état IN et si tous
les nœuds de sa liste OUT sont dans l’état OUT. Sinon, cette
dépendance est invalide. De plus, il y a des dépendances toujours
valides (elles n’ont ni liste IN ni liste OUT) et elles permettent de
représenter des axiomes ou faits initiaux. Une dépendance dont la
liste OUT n’est pas vide est dite non monotone.
Cette représentation permet de maintenir la consistance dans
une base de connaissances.
En résumé, les systèmes de maintien de la cohérence (RMS)

permettent de traiter les hypothèses. Cette capacité est indis-
pensable pour appréhender des problèmes réels dans lesquels
les connaissances sont souvent incomplètes, approximatives
ou même inexactes et donc sujettes à des révisions.
Trois propriétés caractérisent les RMS :
• leur capacité à traiter ou non plusieurs contextes simulta-
nément ;
• la nature monotone ou non monotone des inférences qu’ils
acceptent ;
Figure 16 – Architecture d’un système de raisonnement hypothétique • leur aptitude à traiter la négation.

S 7 217v2 – 17
2.7.2 Des RMS aux CSP et des CSP Plusieurs propositions ont été faites pour choisir une observa-
aux diagnostics tion qui va discriminer les diagnostics. Par exemple, dans [27], les
auteurs choisissent l’observation qui minimise l’entropie, au sens
Deux grandes familles de RMS peuvent être distinguées : les de la théorie de l’information.
RMS de type TMS et les RMS de type ATMS.
Concernant les tests et leur génération, des travaux ont été
Le TMS (truth maintenance system) a été défini par Doyle [4]. Il menés, mais peu d’entre eux l’ont été dans le cadre du diagnos-
se base sur la notion de justification. Une caractéristique des sys- tic à base de modèles. Parmi les rares travaux dans ce domaine,
tèmes appartenant à cette famille est qu’ils ne traitent qu’un seul on peut citer [32], dans lequel les auteurs proposent une forma-
contexte à la fois et de ce fait, le traitement s’apparente à un par- lisation du diagnostic à base de modèles intégrant la notion de
cours en profondeur d’abord. test, et [33].
L’ATMS (assumption truth maintenance system) a été défini par
de Kleer [5]. Cette fois, plusieurs hypothèses peuvent être consi-
dérées en même temps. Deux notions sont centrales dans les 2.9 Conclusion
ATMS : les environnements et les conflits. Un environnement est
un ensemble d’hypothèses et un conflit est un ensemble d’hypo- La théorie du diagnostic à base de modèles repose sur le rai-
thèses qui conduit à une contradiction. Les justifications sont sonnement hypothétique. Celui-ci peut être assuré grâce à des
monotones. systèmes de maintien de la cohérence dont le rôle essentiel est
On peut dire que les RMS trouvent leur origine dans les premiers de gérer l’apport ou le retrait d’une proposition dans une base
travaux effectués pour améliorer le backtracking, notamment avec de connaissances. Cette gestion des dépendances est également
la définition du backtracking dirigé par les justifications défini dans l’un des objectifs visés par les solveurs de CSP. Il n’est donc pas
[30]. Depuis, le lien entre les travaux sur les RMS et ceux sur les surprenant de vouloir traiter le diagnostic comme un véritable
problèmes de satisfaction de contraintes (CSP) reste très fort. CSP alors qu’il a été initialement formalisé comme un problème
Dans les problèmes de satisfaction de contraintes, certains logique de raisonnement hypothétique.
n’ont pas de solution (on dit qu’ils sont surcontraints ou inconsis-
tants). On peut se demander quelles sont les causes de ces situa-

tions particulières et rechercher quelles sont les contraintes à
relaxer pour que le problème ait des solutions : on parle de 3. Discussion
recherche d’explication. Cette démarche peut s’appliquer au pro-
blème du diagnostic. En effet, pour cela, il suffit de modéliser le
fonctionnement correct du dispositif par des contraintes. En sui- Dans cet article, différentes techniques de recherche des dia-
vant le paradigme du diagnostic à base de contraintes, lorsque le gnostics par des approches issues de l’intelligence artificielle ont
dispositif est défaillant, les observations sont prélevées sur le dis- été présentées. Bien évidemment, la liste des techniques présen-
positif réel et utilisées avec le modèle de fonctionnement correct. tées ici n’est pas exhaustive.
Immanquablement, des incohérences apparaissent. L’objectif est Dans le tableau 5 sont rappelées ces techniques avec la descrip-
ici de déterminer les ensembles minimaux de contraintes à tion des connaissances exploitées, les avantages et les inconvé-
relaxer (annuler) pour résoudre les incohérences. À partir de ces nients. Il est à noter qu’aucune approche n’est parfaite. Par exemple,
ensembles, on détermine les composants qui expliquent logique- les approches à base de modèles permettent de réaliser des dia-
ment les incohérences : ce sont les diagnostics recherchés. Au gnostics à partir de la description du fonctionnement correct d’un
niveau fondamental, il s’agit de la même idée qui a été présentée dispositif. Cette description est, en théorie, disponible auprès des
d’un point de vue logique dans les sections précédentes. Plu- concepteurs de ce dispositif. L’avantage incontestable de cette
sieurs raisons conduisent à s’orienter dans cette voie. D’abord, approche est donc de pouvoir s’appliquer sans attendre l’apparition
les algorithmes de traitement des réseaux de contraintes, qui de pannes nécessaire à la constitution d’une expertise en diagnostic.
représentent les CSP, ont une complexité directement liée à leur Cependant, cette approche repose sur l’exactitude du modèle
structure « topologique » [31]. Ensuite, les propriétés liées à cette exploité. Si celui-ci comporte des erreurs, les diagnostics obtenus
structure sont des notions plus faciles à exprimer d’un point de peuvent être erronés. D’autres approches telles que les réseaux de
vue graphique (au sens de la théorie des graphes) que d’un point neurones ou le raisonnement à partir de cas sont moins sensibles à
de vue formel (au sens de la logique). Par exemple, il est plus l’exactitude du modèle. En revanche, leur efficacité repose sur la
facile de voir qu’une base de connaissances présente des caracté- qualité des exemples utilisés lors de la phase d’apprentissage. Si
ristiques arborescentes sur un graphe que dans un ensemble de des classes d’exemples sont oubliées, des diagnostics ne pourront
formules. pas être calculés en phase normale d’utilisation.
L’hypothèse du monde clos est généralement prise dans les sys-
2.8 Problème des tests et du choix tèmes de diagnostic en intelligence artificielle. Cette hypothèse
stipule que le modèle utilisé est suffisamment puissant pour prou-
des observations ver tout ce qui est démontrable. Concrètement, cela revient à sup-
poser que le modèle exploité contient toute l’information
Dans la théorie du diagnostic à base de modèles telle qu’elle a
nécessaire pour réaliser le raisonnement qui l’utilise. Cependant,
été présentée auparavant, on suppose que le modèle et les obser-
dans la réalité, cette hypothèse ne peut pas toujours être suivie. En
vations nécessaires au diagnostic sont disponibles a priori et suf-
fisent pour obtenir des résultats « utiles ». Bien souvent, dans la effet, même si le modèle est une représentation fidèle d’un dispo-
réalité, les diagnostics obtenus ne sont pas suffisamment précis sitif, celui-ci est plongé dans un environnement qui influence son
et il convient alors d’exploiter des informations supplémentaires. comportement. Le modèle du dispositif seul ne suffit plus pour
L’acquisition de nouvelles informations nécessite de faire de nou- déterminer les causes d’un dysfonctionnement : celui-ci peut avoir
velles mesures en changeant ou en conservant les entrées du dis- une cause externe.
positif. Dans la littérature, on dit que l’on fait des observations
supplémentaires lorsque les entrées du dispositif sont conser- Exemple
vées. On parle de test lorsque les entrées sont changées. Dans Certains circuits électroniques voient leur fonctionnement perturbé
les deux cas, l’objectif est toujours d’obtenir des mesures qui sous l’influence de la température ou de l’humidité du milieu ambiant.
apportent un gain informationnel (de préférence le plus grand Pourtant, ni la température ni l’humidité ambiante ne sont des carac-
possible). téristiques du dispositif.

S 7 217v2 – 18
Tableau 5 – Synthèse des approches de diagnostic présentées
Approches Connaissances utilisées Avantages Inconvénients
Système à base Connaissances issues Permet l’utilisation L’extraction des connaissances

de connaissances expertes des experts en diagnostic. de la connaissance compilée, est généralement difficile
(section 2.1) donc rapide et longue. La mise à jour
à exploiter. de ces connaissances est délicate.
De plus, les connaissances sont
difficilement réutilisables pour
d’autres dispositifs.
Système à base de cas Exemples de cas représentatifs Il n’y a pas de modèle explicite La qualité de l’approche repose
(section 2.2) des diagnostics déjà réalisés. du comportement du dispositif. sur la quantité et la qualité
La constitution de la base de cas des cas utilisés pour constituer
ne nécessite pas de session la base de cas.
d’extraction de connaissances.
La base de cas évolue
constamment.
Réseau neuronal (section 2.3) Exemples de cas résolus. Robuste, parallélisable. Impossible à rapprocher
d’une connaissance humaine.
Le choix de la topologie
du réseau et des fonctions
associées aux neurones est

délicat.
Réseau bayésien (section 2.4) Relations de causalité entre Puissante et robuste. Il s’agit La collecte des probabilités
les variables représentatives d’une approche exploitable conditionnelles est difficile
du problème, probabilité dans d’autres domaines que (des recherches sont en cours
des pannes des composants, celui du diagnostic. pour les obtenir à partir
probabilités conditionnelles D’une manière générale, cette des historiques de pannes).
entre les événements. approche permet d’expliquer
des observations (pas
nécessairement liées à des
pannes) et apporte une aide
certaine dans les problèmes de
décision.
Arbre de décision (section 2.5) Exemples de cas résolus. Rapide à exécuter. Assez facile à Nécessite une reconstruction
interpréter. de l’arbre après chaque
modification du dispositif.
Système à base de modèles Modèles précis du dispositif. Utilisable sur les systèmes Demande un modèle précis.
(section 2.6) jeunes, diagnostic logique. L’explication des diagnostics
obtenus est difficile.
Parmi les axes de recherche privilégiés dans le domaine du des nouveaux dispositifs semble un fait acquis par de nombreux
diagnostic en intelligence artificielle, on peut citer celui qui chercheurs et acteurs des grandes entreprises telles que les
concerne la modélisation des dispositifs [34] et celui qui aborde constructeurs d’automobiles. À ce sujet, certains chercheurs pro-
le diagnostic dans un processus plus global qui débute dès la posent un ensemble de composants logiciels pour la constitution
phase de conception des dispositifs jusqu’à leur exploitation. À d’un outil intelligent de diagnostic. Ces composants rassemblent un
noter également que certaines approches préconisent l’intégra- système de raisonnement hypothétique, un système de prédiction à
tion de l’opérateur humain dans ce processus base de contraintes, un compilateur de modèles, un système de
Les communautés de l’informatique et de l’automatique réu- calcul des diagnostics et un système de transformation des modèles.
nissent leurs efforts dans ces voies. En particulier, l’intégration de la
tâche de diagnostic et de ses contraintes dès la phase de conception

S 7 217v2 – 19
P
O
U
Intelligence artificielle et diagnostic R
E
Professeur des universités
N
LAMIH UMR CNRS 8502, Université polytechnique Hauts-de-France, 59300 Valenciennes,
France
Sources bibliographiques
S
[1] DUBUISSON (B.). – Diagnostic, intelligence [14] BUNTINE (W.). – A guide to the literature on 14th International joint conference on artificial
A
[2]
artificielle et reconnaissance de formes.
Hermès (2001).
BECKER (A.) et NAÏM (P.). – Les réseaux
learning probabilistic networks from data.
IEEE Transactions on knowledge and data en-
gineering, no 8, p. 195-210 (1996).
intelligence (IJCAI 95), p. 211-217, Montréal
(1995). V
[27] DE KLEER (J.) et WILLIAMS (B.C.). – Diagno-
bayésiens – Modèles graphiques de connais-
sance. Eyrolles (1999).
[15] DELCROIX (V.), MAALEJ (M.-A.) et
PIECHOWIAK (S.). – Bayesian networks ver-
sus other probabilistic models for the mul-
sing multiple faults. Artificial intelligence,
n° 32, p. 97-130 (1987). O
[3] PEARL (J.). – Probabilistic reasoning in intel- [28] DAGUE (P.). – Model-based diagnosis of
I
ligent systems. Morgan-Kaufman (1988). tiple diagnosis of large devices. Internatio-

nal journal on artificial intelligence tools, analog electronic circuits, Annals of mathe-
[4] DOYLE (J.). – A truth maintenance system. matics and artificial intelligence, special is-
16, pp. 417-433 (2007).
Artificial intelligence, n° 12, p. 231-272 (1979).
[5] DE KLEER (J.). – An assumption-based TMS.
Artificial intelligence, n° 28, p. 127-162 (1986).
[16] DE KLEER (J.). – Focusing on probable diagno-
sis. Proceedings of the 9th American confe-
sue on model-based diagnosis, volume 11,
1-4, p. 439-492 (1994). R
rence on artificial intelligence (AAAI 91), [29] EUZENAT (J.). – Un système de maintenance
[6] TRAVÉ-MASSUYÈS (L.), DAGUE (P.) et p. 842-848, Anaheim (1991). de la vérité à propagation de contextes.
GUERRIN (F.). – Le raisonnement qualitatif Thèse de doctorat, université Joseph-Fourier
[17] KHOLAS (J.), ANRIG (B.) et HAENNI (R.). –
pour les sciences de l’ingénieur. Diagnostic (Grenoble-1) (1990).
[7]
et maintenance. Hermès (1997).
DECHTER (R.). – Constraint processing.
Model-based diagnosis and probabilistic as-
sumption-based reasoning. Artificial intelli-
gence, 104, p. 71-106 (1998).
[30] STALLMAN (M.) et SUSSMAN (G.). – Forward
reasoning and dependency-directed back-
P
Elsevier Science (2003).
[8] CHITTARO (L.), GUIDA (G.), TASSO (C.) et
TOPPANO (E.). – Functional and teleological
[18] QUINLAN (J.R.). – C4.5 : programs for ma-
chine learning. Morgan Kaufmann (1993).
tracking in a system for computer-aided circuit
analysis. Artificial intelligence, 9, p. 135-196
(1977).
L
[19] Artificial intelligence, n° 24 (1984).
knowledge in the multimodeling approach
for reasoning about physical systems : a case
study in diagnosis. IEEE Transactions on sys-
[20] REITER (R.). – A theory of diagnosis from first
principles. Artificial intelligence, n° 32, p. 57-
[31] DECHTER (R.) et FROST (D.). – Backtracking
algorithms for constraint satisfaction pro- U
95 (1987). blems. Technical report, department of Infor-
tems, man and cybernetics, 23, no 6, p. 1718-
[9]
1751 (1993).
RODRIGUEZ (J.) et PIECHOWIAK (S.). – Ex-
[21] DE KLEER (J.) et WILLIAMS (B.C.). – Diagno-
sis with behavioral modes. Proceedings of
mation and Computer science, university of
California, Irvine (1999). S
pressing the behaviour of time-varying de- the 11th International joint conference on ar- [32] McILRAITH (S.) et REITER (R.). – On tests for
vices for the model based diagnosis. Procee- tificial intelligence (IJCAI 89), Detroit, p. 1324- hypothetical reasoning, Readings in model-
dings of the 14th International workshop on 1330 (1989). based diagnosis, p. 89-96 (1992).
expert systems and their applications, Paris [22] DE KLEER (J.), MACKWORTH (A.K.) et REITER [33] EL AYEB (B.). – On the applicability of model-
(1994). (R.). – Characterizing diagnosis and systems. based diagnosis : examining the case of mul-
[10] HATON (J.P.), BOUZID (N.), CHARPILLET (F.), Artificial intelligence, 56 (2-3) (1992). tiple observations. Proceedings of the 7th In-
HATON (M.C.), LÂASRI (B.), LÂASRI (H.), [23] CONSOLE (L.) et TORASSO (P.). – A spectrum ternational conference on industrial and en-
MARQUIS (P.), MONDOT (T.) et NAPOLI (A.). of logical definitions of model-based diagno- gineering applications of artificial intelligence
– Le raisonnement en intelligence artificielle. sis. Computational intelligence, 7, no 3, and expert systems (IEA-AIE 94), p. 435-442,
Inter-Éditions (1991). p. 133-141 (1991). Austin (1994).
[11] CAULIER (P.). – Méthodologie de capitalisa- [24] CORDIER (M.O.) et BESNARD (P.). – Explica- [34] LEFEBVRE (F.). – Contribution à la modélisation
tion et de réutilisation de connaissances pour tions causales. Journées nationales sur les pour le diagnostic des systèmes complexes :
l’aide à la supervision des procédés automa- modèles de raisonnement, Paris, mai 1999. application à la signalisation des lignes à
tisés complexes. Thèse de doctorat, univer- [25] RAIMAN (O.), DE KLEER (J.) et SARASWAT grande vitesse. Thèse de doctorat, université
sité de Valenciennes (1997). (V.). – Critical diagnosis. Proceedings of the de Valenciennes (2000).
[12] RIPLEY (B.D.). – Pattern recognition and neu- 13th International joint conference on artifi- [35] VANDERHAEGEN (F.), JOUGLET (D.) et
ral networks. Cambridge university press cial intelligence (IJCAI 93), p. 18-23, PIECHOWIAK (S.). – Human-reliability analy-
(1996). Chambéry (1993). sis of cooperative redundancy to support dia-
[13] GALLANT (S.I.). – Neural network learning [26] DARWICHE (A.). – Model-based diagnosis gnosis. IEEE Transactions on Reliability, 53,
and expert systems. The MIT Press (1993). using causal networks. Proceedings of the pp. 458-464 (2004)
À lire également dans nos bases
GENTIL (S.). – Intelligence artificielle appliquée à HATON (J.-P.) et HATON (M.-C.). – Systèmes à
l’automatique. [R 7 215] (1997). bases de connaissances. [H 3 740] (2012).
MANDIAU (R.) et GRISLIN-LE STRUGEON (E.). – KAUFMANN (Z.). – Introduction à la logique floue.
Systèmes multi-agents. [S 7 216] (2002). [R 7 032] (1992).
Copyright © – Techniques de l’Ingénieur – Tous droits réservés Doc. S 7 217v2 – 1
GAGNEZ DU TEMPS ET SÉCURISEZ VOS PROJETS
EN UTILISANT UNE SOURCE ACTUALISÉE ET FIABLE
Techniques de l’Ingénieur propose la plus importante

collection documentaire technique et scientifique
en français !
Grâce à vos droits d’accès, retrouvez l’ensemble
des articles et fiches pratiques de votre offre,
leurs compléments et mises à jour,
et bénéficiez des services inclus.
   
RÉDIGÉE ET VALIDÉE MISE À JOUR 100 % COMPATIBLE SERVICES INCLUS
PAR DES EXPERTS PERMANENTE SUR TOUS SUPPORTS DANS CHAQUE OFFRE
NUMÉRIQUES
 + de 350 000 utilisateurs

 + de 10 000 articles de référence
 + de 80 offres
 15 domaines d’expertise
Automatique - Robotique Innovation
Biomédical - Pharma Matériaux
Construction et travaux publics Mécanique
Électronique - Photonique Mesures - Analyses
Énergies Procédés chimie - Bio - Agro
Environnement - Sécurité Sciences fondamentales
Génie industriel Technologies de l’information
Ingénierie des transports
Pour des offres toujours plus adaptées à votre métier,

découvrez les offres dédiées à votre secteur d’activité
Depuis plus de 70 ans, Techniques de l’Ingénieur est la source

d’informations de référence des bureaux d’études,
de la R&D et de l’innovation.
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com
LES AVANTAGES ET SERVICES
compris dans les offres Techniques de l’Ingénieur
  
ACCÈS
Accès illimité Téléchargement des articles Consultation sur tous

aux articles en HTML au format PDF les supports numériques
Enrichis et mis à jour pendant Pour un usage en toute liberté Des contenus optimisés
toute la durée de la souscription pour ordinateurs, tablettes et mobiles
 
SERVICES ET OUTILS PRATIQUES
Questions aux experts* Articles Découverte Dictionnaire technique multilingue

Les meilleurs experts techniques La possibilité de consulter des articles 45 000 termes en français, anglais,
et scientifiques vous répondent en dehors de votre offre espagnol et allemand
 
Archives Impression à la demande Alertes actualisations
Technologies anciennes et versions Commandez les éditions papier Recevez par email toutes les nouveautés
antérieures des articles de vos ressources documentaires de vos ressources documentaires
*Questions aux experts est un service réservé aux entreprises, non proposé dans les offres écoles, universités ou pour tout autre organisme de formation.
ILS NOUS FONT CONFIANCE
www.techniques-ingenieur.fr
CONTACT : Tél. : + 33 (0)1 53 35 20 20 - Fax : +33 (0)1 53 26 79 18 - E-mail : infos.clients@teching.com

Intellegence Rtificielle - Technique de L'ingenieur

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Intellegence Rtificielle - Technique de L'ingenieur

Încărcat de

Drepturi de autor:

Formate disponibile

Réf.

Cet article est issu de : Automatique - Robotique | Automatique et ingénierie système

par Sylvain PIECHOWIAK

Pour toute question :

Intelligence artificielle et diagnostic

par Sylvain PIECHOWIAK

1. Qu’est-ce que le diagnostic ?............................................................... S 7 217v2 - 2

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

1. Qu’est-ce que il s’agit plutôt de diagnostic au sens médical, c’est-à-dire la

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

Exemple On peut distinguer le diagnostic hors ligne du diagnostic en

En intelligence artificielle, on peut classer les approches de trai-

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

Pour illustrer les différentes approches, le même dispositif sim- • règle 4

processus cognitif généralement long et encore mal connu de nos

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

2.2 Raisonnement à base de cas

Figure 3 – Bibliothèque initiale de cas suivant une organisation

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

indices doivent être choisis attentivement : plus le nombre d’indices

X 1 1 1 2.3 Réseaux de neurones

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

Le plus grand intérêt des réseaux connexionnistes vient de leur

appelée winner takes all dans la littérature, ne permet que le dia-

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

Figure 7 – Nouveau réseau neuronal établi à l’aide de la règle

Figure 6 – Réseau connexionniste

combinaison de réseau neuronal et d’algorithme d’apprentissage

Pour une description plus approfondie des réseaux de neurones

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

dépendances entre les variables du système étudié. Un moyen

concepts du domaine et les liens orientés désignent des relations

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

peuvent être des classes Ci représentant chacune un composant en

Une fois que les probabilités d’occurrence des classes de dia-

les valeurs v1, v2 et v3, l’équation (1) donne :

Les probabilités conditionnelles de l’exemple sont données

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

Tableau 4 – Valeurs des probabilités conditionnelles du réseau bayésien

Figure 10 – Arbre de décision pour le problème de diagnostic de voiture

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

Figure 11 – Arbre de décision obtenu avec l’algorithme ID3

tion est de déterminer un arbre de décision qui non seulement classe

Copyright © – Techniques de l’Ingénieur – Tous droits réservés

_____________________________________________________________________________________________ INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC

On remarque que SD se compose de prédicats qui décrivent le

Dans la description du fonctionnement normal des composants,

Copyright © – Techniques de l’Ingénieur – Tous droits réservés.

INTELLIGENCE ARTIFICIELLE ET DIAGNOSTIC ____________________________________________________________________________________________

Figure 13 – Modèle du dispositif électrique

Ici, la formule se lit La première caractérisation concerne le principe de parcimonie

qui correspond à l’idée intuitive selon laquelle on peut limiter la