Sunteți pe pagina 1din 131

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE.

MINISTERE DE L'ENSEIGNEMENT SUPERIEUR ET DE LA


RECHERCHE SCIENTIFIQUE.
UNIVERSITE MENTOURI, CONSTANTINE.
FACULTE DES SCIENCES DE L'INGENIEUR.
DEPARTEMENT D'INFORMATIQUE.
N d'ordre:
Srie:

THESE
Prsente pour obtenir le grade de

DOCTORAT EN SCIENCES EN INFORMATIQUE

Intgration d'ontologies dans le cadre du


web smantique : une dtection des
relations smantiques base sur le RPC
Prsente par:
Kolli Manel

Dirige par:
Pr. Boufaida Zizette. Universit Mentouri Constantine.

Devant le jury
Prsident
: Pr. Mahmoud Boufaida, professeur luniversit Mentouri, Constantine.
Rapporteur
: Pr. Zizette Boufaida, professeur, Universit Mentouri Constantine.
Examinateurs : Pr. Nadir Farah, professeur l'universit Badji Mokhtar, Annaba.
Dr. Faiza Belala, MCA l'universit Mentouri, Constantine.
Dr. Hassina Seridi, MCA l'universit Badji Mokhtar, Annaba.

Merci mon Dieu de mavoir donn la force, la patience et la


volont darriver au terme de travail.

A Mes parents
Mon mari
Mes enfants: May, Maha et Mouhamed

Remerciements

Je tiens exprimer ma gratitude envers mon encadreur, Professeur Zizette


BOUFAIDA pour la qualit de ses conseils, sa disponibilit ainsi que le degr de
responsabilisation de son encadrement qui ma permis de progresser ce travail. Je la
remercie davoir consacr beaucoup de son temps pour les nombreuses relectures de mon
document et les articles publis.
Mes sincres remerciements aux membres du jury qui ont accept de juger mon
travail et dont les remarques et les suggestions auront le plus grand impact pour
lamlioration et le raffinement de ce travail. Ainsi, je remercie :
Pr. Mahmoud Boufaida, professeur luniversit Mentouri, Constantine.
Pr. Nadir Farah, professeur l'universit Badji Mokhtar, Annaba.
Dr. Faiza Belala, MCA l'universit Mentouri, Constantine.
Dr. Hassina Seridi, MCA l'universit Badji Mokhtar, Annaba.
Je salue galement tous les membres du laboratoire LIRE, spcialement de lquipe
SI & BC.
Enfin, je remercie les membres de ma famille et mes amis pour leur soutien et leur
comprhension.

Sommaire

Introduction gnrale ..
1. Contexte de la thse...... .
2. Problmatique .. ..
3. Objectifs ...... ...
4. Contributions de la thse .. ..
5. Organisation de la thse .. ...
Gnralits sur les ontologies et le Web smantique..

I
i
ii
iv
v
vi
1

1. Introduction .. ..
2. Le Web smantique .. .
3. Prsentation de la notion dontologie ... .
3.1 Origine de lontologie ..
3.2 Dfinitions .....
3.3 Composantes dune ontologie ...........
3.3.1. Les concepts ........
a. Les proprits portant sur un concept
b. Les proprits portant sur deux concepts ...
3.3.2. Les relations ....
a. Les proprits intrinsques une relation ....
b. Les proprits liant deux relations ...
c. Les proprits liant une relation et des concepts ........
3.3.3. Les fonctions ...................
3.3.4. Les axiomes (ou Rgles) ........
3.3.5. Les instances (ou individus) ....
3.4 Rles de lontologie ..
3.5 Classification des ontologies ...
3.5.1 Dimensions de classification des ontologies ...
a. Typologie selon lobjet de conceptualisation .......
b. Typologie selon le niveau de dtail de lontologie ...... ..
c. Typologie selon le niveau de compltude .... ..
d. Typologie selon le niveau du formalisme . ..
3.6 Formalismes de reprsentation des ontologies .
3.6.1 Les frames

2
2
3
3
4
5
5
6
6
7
7
7
7
8
8
8
9
10
10
10
13
13
14
15
15

3.6.2 Graphe conceptuel ... ...


- Le Modle des Graphes Conceptuels ...
3.6.3 Logiques de description ...
a. Les constructeurs des LDs ...... .
- Syntaxe de la logique de description ..... ...
- Smantique ...... ..
3.7 Le cycle de vie des ontologies .. ...
4. Langages pour le web smantique .... ...
4.1 RDF et RDF(S) fondement du Web Smantique . ..
4.1.1 Le noyau du modle ... ..
4.2 RDFS
4.3 DAML + OIL .
4.4 OWL .. ...
4.4.1 OWL et les autres langages .
4.1.2 Sous langages de OWL.
4.4.3 Syntaxe et smantique du langage OWL .. ..
5. Le Web smantique et le Web 2..
5.1 Apports du Web 2 pour le Web Smantique
5.2 Apports du Web Smantique pour le Web 2 ........
6. Conclusion ...

16
16
18
19
19
21
23
24
25
25
26
28
28
29
29
30
32
32
33
34

Intgration des ontologies . .

36

1. Introduction .....
2. Intgration des ontologies ..
2.1 Htrognit des ontologies .... ...
2.1.1 Niveau syntaxique ..
2.1.2. Niveau terminologique ... .
2.1.3. Niveau conceptuel .. .
2.1.4 Niveau pragmatique .... .
2.2 Diffrents types dintgration des ontologies ... ..
2.2.1 La mise en correspondance (mapping) des ontologies ....
a. Formalisation de la notion de mapping ..... ......
b. Mesures de similarit ......
c. Mthodologies du mapping ...
- MAFRA ......
- IF-Map ....
- RDFT .......
- C-OWL ..................................
- OntoMap ..... ..
2.2.2 Lalignement des ontologies ..
- Anchor-PROMPT ....
- GLUE ..
- S-Match .... ........
- QOM .... .
- ASCO ... ..
2.2.3 La fusion (merging) des ontologies .....
- PROMPT ....
- CHIMAERA ...
- FCA-Merge ....
- OntoMerge ..
3. Discussion ......

37
37
39
39
39
40
40
40
42
42
45
45
45
47
48
50
51
51
52
54
54
55
55
55
56
58
58
58
59

4. Conclusion .. .

60

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le
RPC.. 61
1. Introduction .... ..
2. Le raisonnement partir de cas (RPC) ....
3. Dtection des relations smantiques entre les ontologies en utilisant le raisonnement partir de cas
(RPC)
3.1. La phase de conception ...... .
3.1.1 Distance smantique ...
- Calcul de la distance smantique ... .
3.2. Phase de production .... ..
3.2.1. Elaboration .....
3.2.2. Remmoration ... .
3.2.3. La rutilisation ... .
a. Prparation des donnes ...
b. Fouille de donnes ....
- Appariement des ontologies ...... .
- Composition . ....
- Agrgation de similarit ... .
3.2.4. La rvision ..
3.2.5. La mmorisation ........................
4. Conclusion ........
Aspects techniques pour limplantation et tude de cas ..

62
63

1. Introduction .... .
2. Aspects techniques pour limplantation .. ..
2.1. Choix de lditeur dontologies ...... .
2.2. Langage de programmation et frameworks spcialises . ...
3. Etude de cas .....
3.1. Prsentation de ltude de cas ..
4. Prototype .....
5.Test et vrification ...
6. Conclusion .. .
Conclusion gnrale ...................................................................... .

86
86
86
87
89
89
93
98
101
102

1. Contributions
2. Perspectives ..

102
104

Bibliographie ..

105

64
64
68
69
73
73
74
76
76
78
78
79
80
82
83
84
85

Introduction gnrale

INTRODUCTION GENERALE
1. Contexte de la thse
La quantit dinformation disponible sur le web croit sans cesse. En effet, le web
classique ncessite de nouveaux outils pour la gestion, laccs et la manipulation de ces
informations. Lvolution du web actuel au web smantique permet des agents logiciels
dexploiter, de composer et de raisonner sur les contenus des ressources web via les
mcanismes de lintelligence artificielle.
Le Web smantique a pour objectif de transformer le World Wide Web actuel,
entirement tourn vers la prsentation des documents, vers un Web dont le contenu serait
comprhensible par les machines. La vision sappuie sur lutilisation dontologies, qui sont
des conceptualisations communes et partages entre diffrents agents, et dun langage de
description, permettant dexprimer la fois les dfinitions des concepts et des rles dans les
ontologies et dexprimer des annotations utilisant le vocabulaire de ces ontologies. Ce
langage et ces ontologies permettraient aux agents informatiques de comprendre les
diverses annotations et de communiquer entre eux, en effectuant des raisonnements sur les
concepts. Les problmatiques de la reprsentation de concepts en Intelligence Artificielle
sont donc fondamentales pour le Web smantique (Delteil 2002).
Il est clair que les recherches sur les ontologies sont essentielles pour la ralisation
du Web smantique. En effet, dune part, une fois construite et accepte par une
communaut particulire, une ontologie doit traduire un certain consensus explicite et un
certain niveau de partage qui sont essentiels pour permettre lexploitation des ressources du
Web par diffrentes applications ou agents logiciels.
Dautre part, la formalisation, autre facette des ontologies, est ncessaire pour que
ces outils puissent tre munis de capacits de raisonnement permettant de dcharger les
diffrents utilisateurs dune partie de leur tche dexploitation et de combinaison des
ressources du Web.
Du point de vue des ontologies, seront cruciales pour le Web smantique les
mthodes et les outils contribuant (Delteil 2002):

Construire les ontologies, que ce soit partir de sources primaires,


particulirement les corpus textuels, ou en recherchant une certaine
rutilisabilit. La construction dontologies partir de lanalyse de corpus
textuels est un domaine en forte volution o un certain nombre de
mthodologies et doutils sont tests par une communaut trs active. La

i
Kolli Manel.

Universit Mentouri Constantine.

Introduction gnrale

question de la rutilisabilit qui a suscit de longs dbats dans la communaut


Ingnierie des connaissances a permis de progresser vers la recherche dune
certaine gnricit mais reste un enjeu majeur pour le Web smantique.

Grer laccs aux ontologies, leur volution, avec gestion des versions, et leur
intgration. Les ontologies sont souvent riches de plusieurs milliers de
concepts et ne restent alors directement apprhendables que par leur
concepteur. Leur accs par des utilisateurs, mme professionnels, ncessite de
grer le lien entre les concepts des ontologies et les termes du langage naturel,
que ce soit pour une simple comprhension ou pour lindexation et la
construction de requtes destines des tches de recherche dinformation.
Les solutions mises en uvre ce jour passent par des mthodologies sparant
explicitement les termes et les concepts dun domaine et des outils de
visualisation et de navigation recherchant des proximits conceptuelles dans
les termes dun domaine et permettant dapprhender intuitivement la
complexit de ce domaine.

Assurer linteroprabilit des ontologies en grant les htrognits de


reprsentation et les htrognits smantiques. Ces dernires sont les plus
dures grer (Laublet et al. 2002).

L'ontologie est un facteur cl qui facilite l'interoprabilit dans le web smantique


(ACM 2009). Les ontologies sont le noyau du Web smantique parce qu'elles permettent
aux applications de communiquer en utilisant des termes partages. Lontologie facilite donc
la communication en fournissant des notions prcises qui peuvent tre employes pour
composer et changer des messages (questions, rponses, etc.).
Cependant, il nexiste pas dontologie universelle partage, adopte par tous les
utilisateurs dun domaine donn. Les problmatiques et les tentatives damlioration de
l'interoprabilit du systme comptent donc sur la rconciliation des diffrentes ontologies
utilises dans un domaine par les diffrents systmes. Cette rconciliation est souvent
ralise par l'intgration manuelle ou semi-automatise des ontologies. Elle consiste
identifier les liens de correspondance entre les ontologies, on parle alors de mapping
dontologies.

2. Problmatique
Le problme dintgration des ontologies (connu aussi comme mdiation des
ontologies, correspondance dontologies, etc.) joue un rle central dans le
dveloppement des systmes base de connaissances. Les nouvelles technologies
augmentent lutilisation des ontologies dans le Web smantique pour la reprsentation des
connaissances. Cette tendance a conduit au dveloppement de nouvelles ontologies, dou le
nombre lev des ontologies disponibles sur le Web.

ii
Kolli Manel.

Universit Mentouri Constantine.

Introduction gnrale

Le Web smantique exploite les ontologies dans la reprsentation des


connaissances (Charlet et al. 2005). Partant du fait que plusieurs connaissances peuvent
prendre des reprsentations diffrentes, nous trouvons de nos jours plusieurs ontologies de
domaine pour un mme champ dapplication. Il est alors ncessaire de disposer doutils
permettant de faire le lien entre les connaissances exprimes dans chacune des ontologies.
La mise en correspondance (mapping) des ontologies permet les changes de
manire smantique des connaissances. Dans ce cas la mise en correspondance est
essentielle dans la rutilisation des ontologies dans des systmes permettant leur
manipulation. Cette manipulation est ralise par lintgration de ces ontologies.
Ce vaste thme de recherche a donn lieu de trs nombreux travaux dont La
majorit se concentre sur lalignement des ontologies. Dans ce type dintgration, la mise
en correspondance permet dtablir un lien entre deux sources dinformations pour
changer les informations dune source lautre. Ainsi, lalignement dontologies permet
aussi de rconcilier, dun point de vue smantique, les opinions de plusieurs experts (Bach
et al. 2004).
Les autres travaux se concentrent sur la fusion dont la mise en correspondance
permet de construire une ontologie ou un schma global unifiant toutes les informations des
sources (Noy et Musem 2002).
Les techniques dintgration jouent un rle crucial dans la construction dun lien
smantique entre les ontologies dun mme domaine. Quelques approches dintgration
(Aleksovski et al, 2006, Stuckensschmidt et al, 2004, Hage et al. 2005) considrent que
lutilisation dune connaissance sur le domaine est une manire assurant la correspondance
smantique entre la dissimilarit syntaxique des ontologies. Lobtention de la bonne
connaissance sur le domaine est primordiale.
Dautres approches nexploitent pas une connaissance sur le domaine et ne ralisent
pas un modle smantique formel pour lalignement des structures produites. Dans ce cas,
la structure obtenue est difficile exploiter, e.g., pour rpondre aux requtes interrogeant
les ontologies (Lopez et al. 2006).
En outre, les approches courantes dintgration des ontologies (Noy 2004, Shvaiko
et Euzenat 2005, Bach 2006) sont bases sur les mesures de similarit entre chanes de
caractres et des structures composites. Les ontologies aligner peuvent tre reprsentes
avec diffrents formalismes ce qui soulve le problme de l'interoprabilit des
applications.
Dans le cadre de lintgration, les techniques dintgration doivent soulever d'autres
dfis comme :

iii
Kolli Manel.

Universit Mentouri Constantine.

Introduction gnrale

(i)

la robustesse, car des erreurs mineures ne doivent pas avoir des


consquences importantes,

(ii)

l'volutivit, car elles doivent travailler en un temps raisonnable avec un


nombre considrable de donnes distribues prsentes sur le Web et avec
des ontologies qui peuvent contenir des centaines de concepts
smantiques, mme lorsqu'elles concernent des domaines spcialiss.

Afin de raliser l'intgration des ontologies, il est ncessaire d'impliquer aussi bien
la syntaxe que la smantique des ontologies. Pour rsumer, le processus de mapping est un
des lments fondamentaux du processus d'intgration d'ontologies. Il permet danalyser et
de comparer des ontologies pour dterminer les correspondances entre leurs concepts et
pour dtecter des ventuels conflits. Le rsultat du processus de mapping est un ensemble
de liens de correspondances (Elbyed 2009).

3. Objectifs
Le but de notre travail est de proposer un systme capable didentifier les relations
smantiques entre les ontologies avec l'intention de soutenir l'interoprabilit des systmes
dinformations.
Lobjectif principal de cette thse est dcompose en objectifs intermdiaires :

Objectif 1 : La couverture des ontologies est trs rarement la mme et nest


pas complte (Elbyed 2009). Dou la ncessite doffrir aux utilisateurs un
systme de mapping capable didentifier les correspondances de tout ou
partie des lments de lontologie. En dautres termes, tre capable de faire
de lintgration totale ou partielle des ontologies;

Objectif 2 : Beaucoup de travaux portent sur lappariement des ontologies et


un grand nombre de techniques ont vu le jour, mais ils sont concentrs sur le
calcul de similarit entre les termes des concepts dontologies ou sur la faon
de combiner ces techniques. En effet, les algorithmes existants parviennent
dans le meilleur des cas proposer 70% de mappings corrects et didentifier
80% des correspondances existantes. De plus, ces valeurs changent selon la
structure et la richesse smantiques des ontologies faire correspondre. Il y a
donc encore un effort faire pour avoir une fiabilit plus importante du
mapping indpendamment de la conceptualisation des ontologies (Elbyed
2009). Notre but est danalyser et exploiter les dfinitions des entits
smantiques (concepts et rles) de ces ontologies afin damliorer les
rsultats du processus de mapping.
Objectif 3 : Les tudes d'valuation ont montr que le mapping rsultant
des approches dappariement existantes soit il contient un montant quitable
des erreurs ou bien il ne couvre qu'une petite partie des ontologies concernes

iv
Kolli Manel.

Universit Mentouri Constantine.

Introduction gnrale

(Euzenat et al. 2006) (Euzenat et al. 2007) (Caracciolo et al 2008). Afin de


pallier ces insuffisances, nous proposons de rduire l'application des mesures
autant que possible en utilisant des outils plus fiables comme le raisonnement
partir de cas (RPC) bas sur des mcanismes formels tels que la
subsomption.

Objectif 4 : La phase de validation et dinteraction avec lutilisateur est une


phase cl dans le processus de mapping, mais elle est trs complique. Pour
lensemble des systmes existants, les interactions avec lutilisateur portent
directement sur la validation des liens de correspondance entre les concepts
des ontologies, ce qui rend la phase de validation des mappings un processus
lourd et moins sr (Elbyed 2009). Partant de ce constat, il faudrait trouver un
autre moyen de valider les rsultats, qui soit plus automatique.

4. Contributions de la thse
Compte tenu des objectifs cits auparavant, les principales contributions de notre
thse peuvent tre rcapitules dans les points suivants :

1.

Nous proposons un systme bas sur un mcanisme du Raisonnement partir


de cas (RPC) pour la dtection des relations smantiques entre les entits
smantiques des ontologies en utilisant les techniques dextraction de
connaissances dans des bases de donnes (ECBD) et la distance smantique
et nous procdons des tests de vrification formelle pour valuer notre
approche.

2.

Problme de lautomatisation du processus de mapping: La plupart des


solutions de mapping existantes ne sont pas compltement automatises. En
effet, ces approches automatisent seulement une partie du processus (Elbyed
2009). Nous proposons daller plus loin dans lautomatisation du mapping;

3.

Problme de la prcision des rsultats: Afin de minimiser le tt d'erreurs,


nous proposons de rduire l'application des mesures de similarit autant que
possible en exploitant tous les liens (liens hirarchiques, smantiques)
existants entre les concepts de chaque ontologie dans le processus de filtrage
pour dtecter de nouveaux liens smantiques parmi les rsultats de mapping
dj obtenus.

4.

Enfin, Problme de la vrification: Afin dallger le processus de vrification


fait travers une interaction avec un expert sur tous les liens de
correspondance trouvs par le systme, nous proposons dutiliser un outil
formel.

v
Kolli Manel.

Universit Mentouri Constantine.

Introduction gnrale

5. Organisation de la thse
Le manuscrit est structur en quatre chapitres et une conclusion gnrale. Les deux
premiers sont ddis ltat de lart important pour la bonne comprhension du contexte de
travail. Les deux derniers chapitres sont consacrs la prsentation de notre contribution.
Dans le premier chapitre nous prsentons le contexte scientifique de nos travaux en
introduisant les concepts de base des ontologies et du web smantique ; plusieurs langages
et outils de reprsentation des ontologies sont prsents.
Le deuxime chapitre prsente une tude structure des techniques de mise en
correspondance dontologies. Tout dabord, nous commenons par la prsentation des
htrognits qui peuvent exister entre les diffrentes ontologies et leurs impacts sur le
processus de lintgration. Puis nous effectuons une classification des modes dintgration
des ontologies, avant de terminer par une dfinition du calcul des mesures de similarit
entre les entits smantiques.
Le chapitre trois est consacr la prsentation de notre systme. Nous commenons
par la prsentation de cycle de vie du mcanisme du RPC. Puis, nous dtaillons notre
systme qui distingue deux phases: la phase de conception et la phase de production. Au
cours du processus, nous utilisons un exemple pour bien expliquer le fonctionnement du
systme propos.
Le chapitre quatre regroupe les aspects techniques de limplantation de notre
systme, ainsi que lapplication de ce dernier dans une tude de cas adquate. Nous
commenons par donner les outils et les technologies lis la mise en uvre de chaque
composant. Par la suite, nous proposons une tude de cas, afin de motiver lintrt de notre
approche dun point de vue pratique.
Enfin, le manuscrit se termine par une conclusion gnrale qui rcapitule les
travaux raliss et propose quelques visions pour les travaux futurs.

vi
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Chapitre I : Gnralits sur le web smantique et les


ontologies

1
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

1. Introduction
Selon Tim Berners Lee (Berners-Lee 1999) et (Berners-Lee et al. 2001), le Web
Smantique doit permettre de porter le Web actuel son plein potentiel. Le Web actuel est
principalement tourn vers les tres humains. Lobjectif du Web Smantique est de rendre
le contenu du Web comprhensible des machines. Le procd consiste exploiter:

Des ontologies, une ontologie est un vocabulaire constitu de concepts, de relations


et des axiomes lis un certain domaine. (Gruber 1992) dfinit une ontologie
comme tant la spcification dune conceptualisation .

Un langage commun pour exprimer les ontologies et dcrire des annotations


utilisant les termes de ces ontologies.

Des moteurs de raisonnement permettant dinfrer sur les annotations daprs les
axiomes dclars dans les ontologies.

La suite de ce chapitre et organise comme suit : dans la deuxime section, nous


dfinissons le Web smantique. Dans la troisime section, nous tentons de revenir sur les
origines et les caractristiques de lontologie en gnral. La quatrime section est consacre
aux langages utiliss pour la reprsentation des ontologies au sein du Web smantique,
savoir, le langage OWL. Le chapitre se termine par une conclusion.

2. Le Web smantique
Pour bien comprendre ce qu'est le Web smantique, nous commenons par une
dfinition. Le grand dictionnaire terminologique dfinit le terme smantique comme
l'ensemble des relations entre les caractres, ou groupes de caractres, et leur
significations, indpendamment de la faon de les employer ou de les interprter. Il
prcise par la suite que si, en linguistique, la smantique porte sur l'tude du sens partir
de la combinaison des mots, en intelligence artificielle, elle porte sur la capacit d'un rseau
[le Web] reprsenter de la manire la plus humaine possible des relations entre des objets,
des ides ou des situations.
Le terme smantique implique donc que la machine ne se contentera plus de
prsenter visuellement les donnes du Web, mais, en les reliant, elle pourra conserver les
significations qui leur sont attribuables. Or, en transformant le contenu du Web pour qu'il
soit comprhensible par la machine et non seulement prsentable, nous permettons
cette mme machine d'tre plus efficace dans le traitement de l'information. Ainsi, le
dialogue avec les moteurs de recherche devient possible. Nous sommes alors en mesure de
nous exprimer dans des termes que nos ordinateurs peuvent aussi interprter et changer. Il
est galement possible d'automatiser, d'intgrer et de rutiliser l'information entre diverses
applications

2
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Le Web smantique est dcrit gnralement comme un Web destin aux


machines. Disposer d'un Web dont le contenu est abordable par les machines peut apporter
de grands bnfices:

L'automatisation de nombreuses tches fondes sur le contenu comme la


recherche de ressources ayant un contenu particulier, la comparaison du contenu
de ressources (pages, bases de donnes, ontologies, etc). Le Web smantique
permettrait de rsoudre la relative difficult de trouver de l'information sur le
web.

L'automatisation de tches lies la mise en relation de ce contenu comme la


composition de rponses fournies par plusieurs ressources.

La description de ressources informatiques (services) par leurs conditions


d'activations, rsultat, qualit, etc permet d'imaginer la recherche, l'invocation
et la connexion automatique de ces ressources.

La plus value du Web smantique sera principalement dans la mise en relation


d'lments pars comme dans la composition de services ou de rponses. Ces capacits
ncessitent l'interoprabilit entre les diffrentes ressources ou leurs descriptions.
Pour raliser une telle innovation, le web smantique exploite la notion dontologie.

3. Prsentation de la notion dontologie


Dans cette section, nous prsentons un aperu global sur la notion dontologie.

3.1 Origine de lontologie


Ontologie est un terme qui a tout dabord t dfini en Philosophie comme une
branche de la Mtaphysique qui sintresse lexistence, ltre en tant qutre et aux
catgories fondamentales de lexistant. En effet, ce terme est construit partir des racines
grecques ontos qui veut dire ce qui existe, lEtre, lexistant, et logos qui veut dire ltude, le
discours, do sa traduction par ltude de lEtre et par extension de lexistence (Amardeilh
2007).
Dans la philosophie classique, lOntologie correspond ce quAristote appelait la
Philosophie premire (prot philosopha), cest--dire la science de ltre en tant qutre,
par opposition aux philosophies secondes qui sintressaient, elles, ltude des
manifestations de ltre (les existants) (Psych 2007).
Bien que ce soient les Grecs qui aient invent cette science, ils ne lavaient pas
appel Ontologie , le terme tant beaucoup plus rcent (XVIIe sicle) que la discipline
quil dsigne. La discipline elle-mme a volu vers une voie imprvisible, il y a seulement

3
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

une vingtaine dannes. En effet, lontologie a t aborde dans le domaine de lintelligence


artificielle pour la premire fois par John McCarthy qui reconnut le recoupement entre le
travail fait en Ontologie philosophique et lactivit de construire des thories logiques de
systmes dintelligence artificielle. Il affirmait dj en 1980 que les concepteurs de
systmes intelligents fonds sur la logique devraient dabord numrer tout ce qui existe.

3.2. Dfinitions
Dans le cadre de lintelligence artificielle, Neeches et ses collgues (Neeches et al.
1991) furent les premiers proposer une dfinition savoir : une ontologie dfinit les
termes et les relations de base du vocabulaire dun domaine ainsi que les rgles qui
indiquent comment combiner les termes et les relations de faon pouvoir tendre le
vocabulaire.
En 1993, Gruber (Gruber 1993) propose la dfinition suivante : spcification
explicite dune conceptualisation qui est jusqu prsent la dfinition la plus cite dans la
littrature en intelligence artificielle. Cette dfinition a t modifie lgrement par Borst
(Borst 1997) comme spcification formelle dune conceptualisation partage.
Ces deux dfinitions sont regroupes dans celle de Studer (Studer et al. 1998)
comme spcification formelle et explicite dune conceptualisation partage.

Formelle : lontologie doit tre lisible par une machine, ce qui exclut le langage
naturel. Explicite : la dfinition explicite des concepts utiliss et des contraintes de
leur utilisation.

Conceptualisation : le modle abstrait dun phnomne du monde rel par


identification des concepts clefs de ce phnomne.

Partage : lontologie nest pas la proprit dun individu, mais elle reprsente un
consensus accept par une communaut dutilisateurs.

Pour Guarino & Giaretta (Guarino et Giaretta 1995) Une ontologie est une
spcification rendant partiellement compte dune conceptualisation. Swartout et ses
collgues (Swartout et al. 1997) la dfinissent comme suit : une ontologie est un ensemble
de termes structurs de faon hirarchique, conue afin de dcrire un domaine et qui peut
servir de charpente une base de connaissances.
La mme notion est galement dveloppe par Gomez (Gomez 1999) comme:
une ontologie fournit les moyens de dcrire de faon explicite la conceptualisation des
connaissances reprsentes dans une base de connaissances.
Pour conclure, nous pouvons donc affirmer que les dfinitions du terme ontologie
abondent dans la littrature scientifique. Les dfinitions, dans leur diversit, offrent des
points de vue la fois diffrents et complmentaires sur un mme concept.

4
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

En clair, une ontologie fournit les moyens dexprimer les concepts dun domaine
en les organisant hirarchiquement et en dfinissant leurs proprits smantiques dans un
langage de reprsentation des connaissances formel favorisant le partage dune vue
consensuelle sur ce domaine entre les applications informatiques qui en font usage.

3.3. Composantes dune ontologie


Comme nous lavons abord, les ontologies fournissent un vocabulaire commun
d'un domaine et dfinissent la signification des termes et des relations entre elles. La
connaissance dans les ontologies est principalement formalise en utilisant les cinq types de
composants (Gomez et Benjamins 1999) savoir : concepts (ou classes), relations (ou
proprits), fonctions, axiomes (ou rgles) et instances (ou individus).

3.3.1. Les concepts


Un concept est un constituant de la pense (un principe, une ide, une notion
abstraite) smantiquement valuable et communicable. Lensemble des proprits dun
concept constitue sa comprhension ou son intension et lensemble des tres quil englobe,
son extension.
Ces concepts selon Gomez (Gomez et Benjamins 1999) peuvent tre classifis
selon trois dimensions:

Niveau dabstraction (concrets ou abstraits).

Atomicit (lmentaires ou composs).

Niveau de ralit (rels ou fictifs).


Un concept est compos de trois parties (Hernandez 2005):

Une notion : elle correspond la smantique du concept, elle est dfinie travers
ses proprits et ses attributs. Elle est appele intention du concept.

Un ensemble dobjets : il correspond aux objets dfinis par le concept, il est


appel extension du concept. Les objets sont les instances du concept.

Un (ou plusieurs) terme(s) : les termes permettent de dsigner le concept. Ces


termes sont aussi appels labels de concept.

Exemple : le terme lapin renvoie la notion animal possdant de longues


oreilles et une queue et lensemble des objets ayant cette description.

5
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

a. Les proprits portant sur un concept


Selon Guarino, les proprits portant sur un concept sont :

La gnricit : un concept est gnrique sil nadmet pas dextension


la vrit est un concept gnrique.

Lidentit : un concept porte une proprit didentit si cette proprit permet de


conclure quant lidentit de deux instances de ce concept. Cette proprit peut
porter sur des attributs du concept ou sur dautres concepts.
Exemple : le concept dtudiant porte une proprit didentit lie au numro de
ltudiant, deux tudiants tant identiques sils ont le mme numro.

La rigidit : un concept est dit rigide si toute instance de ce concept en reste


instance dans tous les mondes possibles.
Exemple : humain est un concept rigide, tudiant est un concept non rigide.

Lanti-rigidit : un concept est anti-rigide si toute instance de ce concept est


essentiellement dfinie par son appartenance lextension dun autre concept.
Exemple : tudiant est un concept anti-rigide car ltudiant est avant tout un
humain.

Lunit : un concept est un concept unit, si pour chacune de ses instances, les
diffrentes parties de linstance sont lies par une relation qui ne lie pas dautres
instances du concept.
Exemple : les deux parties dun couteau, manche et lame sont lies par une
relationEmmanch qui ne lie que cette lame et ce manche.

Exemple :

b. Les proprits portant sur deux concepts

Lquivalence : deux concepts sont quivalents sils ont la mme extension.


Exemple : toile du matin et toile du soir.

La disjonction : (on parle aussi dincompatibilit) deux concepts sont disjoints si


leurs extensions sont disjointes.
Exemple : homme et femme.

La dpendance : Un concept C1 est dpendant dun concept C2 si pour toute


instance de C1 il existe une instance de C2 qui ne soit ni partie ni constituant de
linstance de C1.
Exemple : parent est un concept dpendant de enfant (et vice-versa).

6
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

3.3.2. Les relations


Elles reprsentent des interactions entre concepts permettant de construire des
reprsentations complexes de la connaissance du domaine (Charlet et al. 2004). Elles
tablissent des liens smantiques binaires, organisables hirarchiquement.
Exemple : les concepts Personnalit et Film sont relis entre eux par la
relation smantique ralise (Personnalit, Film) .

a. Les proprits intrinsques une relation

Les proprits algbriques : symtrie, rflexivit, transitivit

La cardinalit : nombre possible de relations de ce type entre les mmes concepts


(ou instances de concept). Les relations portant une cardinalit reprsentent souvent
des attributs.
Exemple: une pice a au moins une porte.

b. Les proprits liant deux relations

Lincompatibilit : on dit que deux relations R1 et R2 sont incompatibles si elles


ne peuvent lier les mmes instances de concepts.
Exemple : tre rouge et tre vert sont deux relations incompatibles.

Linverse : on dit que deux relations binaires R1 et R2 sont inverses lune de lautre
si, quand R1 lie deux instances I1 et I2, alors R2 lie I2 et I1.
Exemple : a pour pre et a pour enfant sont deux relations inverses lune de
lautre.

Lexclusivit : deux relations R1 et R2 sont exclusives si, quand R1 lie des


instances de concepts, R2 ne lient pas ces instances, et vice-versa. Lexclusivit
entrane lincompatibilit.
Exemple : lappartenance et la non appartenance sont exclusives.

c. Les proprits liant une relation et des concepts

Le lien relationnel : Il existe un lien relationnel entre une relation R et deux


concepts C1 et C2 si, pour tout couple dinstances des concepts C1 et C2, il existe
une relation de type R qui lie les deux instances de C1 et C2. Un lien relationnel
peut tre contraint par une proprit de cardinalit, ou porter directement sur une
instance de concept (Kassel 2002).
Exemple : Il existe un lien relationnel entre les concepts texte et auteur dune
part et la relation a pour auteur dautre part.

7
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

La restriction de relation : Pour tout concept de type C1, et toute relation de type
R liant C1, les autres concepts lis par la relation sont dun type impos.
Exemple: si la relation mange portant sur une personne et un aliment lie
une instance de vgtarien , concept subsum par personne , linstance de
aliment est forcment instance de vgtaux .

3.3.3. Les fonctions


Elles prsentent des cas particuliers de relations dans lesquelles le nime lment de
la relation est unique pour les n-1 lments prcdents (Gomez et Benjamins 1999).
Formellement, les fonctions sont dfinies telles que :
F : c1 * c2 * ...* cn-1 cn.
Exemple de fonctions : pre-de et carr sont des fonctions binaires. Tandis
que, prix-de voiture-usage qui calcule le prix dune voiture de seconde main en
fonction du modle de voiture, de la date de fabrication et du nombre de kilomtres est une
fonction ternaire.

3.3.4. Les axiomes (ou Rgles)


Les axiomes sont des expressions qui sont toujours vraies. Ils ont pour but de
dfinir dans un langage logique la description des concepts et des relations permettant de
reprsenter leur smantique. Ils reprsentent les intentions des concepts et des relations du
domaine et, de manire gnrale, les connaissances nayant pas un caractre strictement
terminologique (Staab et Maedche 2000). Leur inclusion dans une ontologie peut avoir
plusieurs objectifs :

 Dfinir la signification des composants.


 Dfinir des restrictions sur la valeur des attributs.
 Dfinir les arguments dune relation.
 Vrifier la validit des informations spcifies ou en dduire de nouvelles.

3.3.5. Les instances (ou individus)


Elles constituent la dfinition extensionnelle de lontologie ; elles sont utilises
pour reprsenter des lments dans un domaine.

8
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Exemple: les individus Mohamed et Maha sont des instances du concept


Personne.
Aprs cette prsentation de lorigine et de la dfinition de la notion dontologie,
nous allons prsenter quelques rles de lontologie.

3.4. Rles de lontologie


Plusieurs chercheurs se sont intresss la finalit des exploitations des ontologies.
Nous prciserons dans ce qui suit les rles et lintrt des ontologies au sein des systmes
base de connaissances (SBC) et du Web Smantique :

Les connaissances du domaine dun SBC : Les ontologies servent reprsenter


les connaissances du domaine dun SBC. En particulier, elles servent de squelette
la reprsentation des connaissances du domaine dans la mesure o elles dcrivent
les objets, leurs proprits et la faon dont ils peuvent se combiner pour constituer
des connaissances du domaine compltes.

La communication : Les ontologies peuvent intervenir dans la communication


entre personnes, organisations et logiciels (Uschold et Grninger 1996). En effet,
les ontologies servent par exemple, crer au sein dun groupe ou dune
organisation un vocabulaire conceptuel commun . Dans ce cas, on est plutt
dans le cadre dune ontologie informelle. Dans le cas de la communication entre
personnes et systmes, lontologie est formelle et sert en gnral une tche prcise
dans le SBC ou le systme dinformation. Lontologie est un puissant moyen pour
lever les ambiguts dans les changes.

Linteroprabilit : le dveloppement et limplantation dune reprsentation


explicite dune comprhension partage dans un domaine donn, peut amliorer la
communication, qui son tour permet une plus grande rutilisation, un partage plus
large et une interoprabilit plus tendue (Uschold et Grninger 1996).
Linteroprabilit est donc une spcialisation de la communication qui permet de
rpertorier les concepts que des applications peuvent schanger mme si elles sont
distantes et dveloppes sur des bases diffrentes.

Laide la spcification de systmes : La plupart des logiciels conventionnels


sont construits avec une conceptualisation implicite et que la nouvelle gnration
des systmes utilisant les travaux en intelligence artificielle devrait tre base sur
une conceptualisation explicitement reprsente (Mizoguchi et Ikeda 1996). En
effet, lontologie fournit une classification des objets que doit manipuler le
systme.

9
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Lindexation et la recherche dinformation : Dans le Web Smantique, les


ontologies y sont utilises pour dterminer les index conceptuels dcrivant les
ressources sur le Web.

Dans la section suivante, nous nous intressons aux diffrentes classifications pour
les ontologies.

3.5. Classification des ontologies


3.5.1 Dimensions de classification des ontologies
Les ontologies peuvent tre classifies selon plusieurs dimensions. Parmi celles-ci,
nous en examinerons quatre :
1. Objet de conceptualisation.
2. Niveau de dtail.
3. Niveau de compltude.
4. Niveau de formalisme de reprsentation.
Ces dimensions de classification sont illustres dans la figure 1.1.

a. Typologie selon lobjet de conceptualisation


Les ontologies classifies selon leur objet de conceptualisation par (Gmez 1999a),
(Guarino 1997a), (Mizoguchi 1998), (Mizoguchi et Ikeda 1996), (VanHeijst et al. 1997),
(Vanwelkenhuysen et Mizoguchi 1994), (Vanwelkenhuysen et Mizoguchi 1995) et
(Wieliinga et Schreiber 1993), le sont de la faon suivante :

Ontologie de reprsentation des connaissances (Gmez 1999b), (VanHeijst et


al. 1997) ce type dontologies regroupe les concepts (primitives de
reprsentation) impliqus dans la formalisation des connaissances. Un exemple
est lontologie de Frame qui intgre les primitives de reprsentation des
langages base de frames : classes, instances, facettes, proprits/slots, relations,
restrictions, valeurs permises, etc.

Ontologie suprieure ou de Haut niveau (Guarino 1997b), (Sowa 1995),


(Sowa 1995a). Cette ontologie est une ontologie gnrale. Son sujet est ltude
des catgories des choses qui existent dans le monde, soit les concepts de haute
abstraction tels que: les entits, les vnements, les tats, les processus, les
actions, le temps, l'espace, les relations, les proprits. L'ontologie de haut de

10
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

niveau est fonde sur : la thorie de l'identit, la mrologie (theory of whole and
parts role) et la thorie de la dpendance. Guarino et Sowa ont poursuivi chacun
indpendamment des recherches sur la thorie de lontologie. Tous deux
intgrent les fondements philosophiques comme tant des principes suivre
pour concevoir lontologie de haut niveau ou suprieure. Sowa introduit deux
concepts importants, Continuant et Occurrent, et obtient douze catgories
suprieures en combinant sept proprits primitives. Lontologie suprieure de
Guarino consiste en deux mondes : une ontologie des Particuliers (choses qui
existent dans le monde) et une ontologie des Universels comprenant les concepts
ncessaires dcrire les Particuliers. La conformit aux principes de lontologie
suprieure a son importance, lorsque le but est de standardiser la conception des
ontologies.

Figure 1.1- Typologies dontologies selon quatre dimensions de classification


(Psych et al. 2003)

11
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Ontologie Gnrique (Gmez 1999a), (Gmez 1999b), (VanHeijst et al. 1997).


Cette ontologie aussi appele, mta-ontologies ou core ontologies, vhicule des
connaissances gnriques moins abstraites que celles vhicules par lontologie
de haut niveau, mais assez gnrales nanmoins pour tre rutilises travers
diffrents domaines. Elle peut adresser des connaissances factuelles (Generic
domain ontoloy) ou encore des connaissances visant rsoudre des problmes
gnriques (connaissances procdurales) appartenant ou rutilisables travers
diffrents domaines (Generic task ontology). Deux exemples de ce type
dontologies sont : 1) lontologie mrologique (Borst 1997) contenant des
relations, Partie-de et 2) lontologie topologique contenant des relations,
Associ-.

Ontologie du Domaine (Mizoguchi et al. 2000). Cette ontologie rgit un


ensemble de vocabulaires et de concepts qui dcrit un domaine d'application ou
monde cible. Elle permet de crer des modles d'objets du monde cible.
L'ontologie du domaine est une mta-description d'une reprsentation des
connaissances, c'est--dire une sorte de mta-modle de connaissance dont les
concepts et proprits sont de type dclaratif. La plupart des ontologies
existantes sont des ontologies du domaine. Selon Mizoguchi, l'ontologie du
domaine caractrise la connaissance du domaine o la tche est ralise. Dans le
contexte de la formation distance, un domaine serait par exemple : le
tlapprentissage.

Ontologie de Tches (Mizoguchi et al. 2000). Ce type dontologies est utilis


pour conceptualiser des tches spcifiques dans les systmes, telles que les
tches de diagnostic, de planification, de conception, de configuration, de
tutorat, soit tout ce qui concerne la rsolution de problmes. Elle rgit un
ensemble de vocabulaires et de concepts qui dcrit une structure de rsolution
des problmes inhrente aux tches et indpendante du domaine. Selon
(Mizoguchi et al. 2000), l'ontologie de tche caractrise l'architecture
computationnelle d'un systme base de connaissances qui ralise une tche.
Deux exemples d'utilisation de l'ontologie de tche dans le domaine de
l'ducation sont les suivants :
1) l'ontologie de formation par ordinateur - Computer Based Training
Ontology (Jin et al. 1999) - qui rgit un ensemble de concepts spcifiques
un systme d'apprentissage inhrent des ontologies de tche ;
2) l'ontologie des objectifs d'apprentissage - Learning Goal Ontology
(Inaba et al. 2000) - qui dcrit les rles des apprenants et des agents dans le
cadre d'un apprentissage collaboratif.

12
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Ontologie d'Application. Cette ontologie est la plus spcifique. Les concepts


dans lontologie d'application correspondent souvent aux rles jous par les
entits du domaine tout en excutant une certaine activit (Maedche 2002).

b. Typologie selon le niveau de dtail de lontologie


Par rapport au niveau de dtail utilis lors de la conceptualisation de lontologie en
fonction de lobjectif oprationnel envisag pour lontologie, deux catgories au moins
peuvent tre identifies (Psych et al. 2003) :
1) Granularit fine : correspondant des ontologies trs dtailles, possdant ainsi
un vocabulaire plus riche capable dassurer une description dtaille des concepts
pertinents dun domaine ou dune tche. Ce niveau de granularit peut savrer utile
lorsquil sagit dtablir un consensus entre les agents qui lutiliseront;
2) Granularit large : correspondant un vocabulaire moins dtaill comme par
exemple dans les scnarios dutilisation spcifiques o les utilisateurs sont dj
pralablement daccord propos dune conceptualisation sous-jacente (Frst 2002),
(Guarino 1997a). Les ontologies de haut niveau possdent une granularit large,
compte tenu que les concepts quelles traduisent sont normalement raffins
subsquemment dans dautres ontologies de domaine ou dapplication (Frst 2002).

c. Typologie selon le niveau de compltude


Le niveau de compltude a t abord par (Mizoguchi 1998) et (Bachimont 2000).
titre dexemple, nous dcrivons la typologie de (Bachimont 2000). Ce dernier propose la
classification sur trois niveaux suivante :

Niveau 1 - Smantique : Tous les concepts (caractriss par un terme/libell)


doivent respecter les quatre principes diffrentiels :
1) Communaut avec lanctre;
2) Diffrence (spcification) par rapport lanctre;
3) Communaut avec les concepts frres (situs au mme niveau);
4) Diffrence par rapport aux concepts frres (sinon il naurait pas lieu de le
dfinir).

13
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Ces principes correspondent lengagement smantique qui assure que


chaque concept aura un sens univoque et non contextuel associ. Deux concepts
smantiques sont identiques si linterprtation du terme/libell travers les quatre
principes diffrentiels aboutit un sens quivalent.

Niveau 2 - Rfrentiel : Outre les caractristiques nonces au niveau prcdent,


les concepts rfrentiels (ou formels) se caractrisent par un terme/libell dont la
smantique est dfinie par une extension dobjets. Lengagement ontologique
spcifie les objets du domaine qui peuvent tre associs au concept, conformment
sa signification formelle. Deux concepts formels seront identiques sils
possdent la mme extension (exemple : les concepts dtoile du matin et dtoile
du soir associs Vnus).

Niveau 3 - Oprationnel : Outre les caractristiques nonces au niveau


prcdent, les concepts du niveau oprationnel ou computationnel sont
caractriss par les oprations quil est possible de leur appliquer pour gnrer des
infrences (engagement computationnel). Deux concepts oprationnels sont
identiques sils possdent le mme potentiel dinfrence.

d. Typologie selon le niveau du formalisme


Par rapport au niveau du formalisme de reprsentation du langage utilis pour
rendre lontologie oprationnelle, (Uschold et Grninger 1996) proposent une classification
comprenant quatre catgories :
1) Informelles : ontologies oprationnelles dans un langage naturel (smantique
ouverte) ;
2) Semi-informelles : utilisation dun langage naturel structur et limit ;
3) Semi-formelles : langage artificiel dfini formellement;
4) Formelles : utilisation dun langage artificiel contenant une smantique formelle,
ainsi que des thormes et des preuves des proprits telles la robustesse et
lexhaustivit (Gmez 1999a).
Selon Studer, "il y a diffrents types dontologie et chaque type remplit un rle
diffrent dans le processus de construction du modle du domaine". (Studer et al. 1998).
La section suivante aborde les formalismes de reprsentation des ontologies.

14
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

3.6. Formalismes de reprsentation des ontologies


Il existe actuellement de nombreux formalismes pour reprsenter les ontologies.
Parmi ces formalismes nous pouvons distinguer ceux qui sont simples tel que les frames et
ceux qui sont complexes tels que les graphes conceptuels et les logiques de descriptions que
nous utilisons dans notre travail. Nous allons prsenter ces trois formalismes dans la section
suivante.
Le langage pour dcrire les ontologies doit avoir une smantique bien dfinie pour
pouvoir raliser des raisonnements sur les formules de ce langage. Un tel langage doit
dfinir au minimum des primitives telles que lhritage pour tre utilisable dans des
situations pratiques; des langages plus expressifs peuvent tre fondes sur les langages de
reprsentation des connaissances dcrits dans les sections suivantes (par exemple les
logiques de description).

3.6.1

Les frames :

Introduits ds les annes 70 par Minsky (Minsky 1975) comme une modlisation
de base pour la reprsentation de connaissances dans le domaine dIntelligence Artificielle
(AI), le modle des frames a depuis t adapt dautre problmatiques puisquil a donn
naissance au modle objet, qui envahit peu peu les diffrentes branches de linformatique.
Lide de frame est trs simple. Un frame est dans ce contexte un objet
nomm, qui est utilis pour reprsenter un certain concept dans un domaine.
Un frame reprsente nimporte quelle primitive conceptuelle et il est dote
dattributs (slots), qui peuvent porter diffrentes valeurs (facets), et dinstances (Kifer et al.
1995).
Il y a une correspondance entre les systmes de frame et ceux orients objet o
les classes et les instances correspondent avec les frames, les attributs et les associations de
classes avec les slots. Entre les frames, il y a aussi la spcialisation qui donne lhritage
dans les concepts de frame. Une frame F1 est plus spcifique quune frame F2 si toute
instance de F1 est instance de F2.
Le formalisme F-logic (Kifer et al. 1995) tait propos comme le fondement
logique pour les langages de frame et orients objet. Il permet de comprendre le modle
smantique dans tous les langages de frame et daider la construction dune base de
connaissances.
Parmi les langages de frame on peut citer YAFOOL (Yet Another Frame Based
Object-Oriented Language), OML (Ontology Markup Language), Ontolingua, KRL
(Knowledge Representation Language), SHIRKA et bien dautres encore.

15
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Le langage SHIRKA est fond sur un modle classe/instance. Cest un modle


totalement uniforme dans lequel tout schma, attribut ou facette est une instance dun
schma de plus haut niveau. Les valeurs apparaissant dans une facette sont toujours des
instances ou des rfrences des instances. Linfrence des valeurs dattribut indtermines
ne fait pas appel des rgles, mais des filtres dcrits par des schmas. Les mcanismes
dinfrence quil utilise sont : hritage, attachement procdural, filtrage, valeur par dfaut,
spcialisation et classification (Jenhani 2003).
Cependant, il faut noter larrive en 1999 de XOL ( XML Ontology Exchange
Language) langage dchange qui utilise la syntaxe XML. Un schma XML est
automatiquement gnr. La phase de gnration utilise des rgles de passage qui
permettent dexprimer les connaissances existantes dans lontologie en terme de SchmaXML. Un prototype a t ralis, qui permet de faire lanalyse lexicale et syntaxique du
fichier XOL entrant et de gnrer un Schma-XML en sortie. Son dveloppement a t
inspir dOntolingua et de OML.

3.6.2 Graphes conceptuels


Les graphes conceptuels ont t initialement conus pour l'analyse et la
comprhension du langage naturel. De par leur similarit avec les rseaux smantiques, leur
pouvoir d'expression est tel qu'ils sont directement applicables la reprsentation des
connaissances. Les graphes conceptuels sont dcomposs en deux niveaux: le niveau
terminologique o sont dcrit les concepts, les relations et les instances de concepts, ainsi
que les liens de subsomption entre concepts et entre relations et le niveau assertionnel o
sont reprsents les faits, les rgles et les contraintes sous forme de graphes o les sommets
sont des instances de concepts et les arcs des relations (Jenhani 2003).

- Le Modle des Graphes Conceptuels


Dans le modle des Graphes Conceptuels, un support reprsente la connaissance
ontologique et les graphes conceptuels construits sur ce support reprsentent la
connaissance assertionnelle relative la connaissance ontologique (Delteil 2002).
Dfinition 1: support
Un support S est un couple (TC, TR) tel que :

TC, ensemble des types de concepts, est un ensemble partiellement ordonn par une
relation sorte de (note ) possdant un plus grand lment (not T) appel
type universel.

TR, ensemble des types de relations, est un ensemble partiellement ordonn,


partitionn en sous-ensembles de types de relations de mme arit. TR = TR1

16
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

TRp, o TRi est l'ensemble des types de relations d'arit i. Tout TRi admet un plus
grand lment (not Ti).
Le support dcrit en figure 1.2 dfinit des types de concepts tels que Ville (qui est
une sorte de Lieu) et des types de relations tels que agent.
Un GC exprime un fait en utilisant le vocabulaire dfini dans le support.

Figure.1.2 Un support (Delteil 2002).


Dfinition 2 : graphe conceptuel
Un graphe conceptuel G = (CG, RG, EG, tiqG) dfini sur un support S, est un
multigraphe non orient, biparti o :

CG est l'ensemble des sommets concepts et RG l'ensemble des sommets relations.

EG est l'ensemble des artes. Toutes les artes d'un graphe conceptuel G ont une
extrmit dans CG et l'autre dans RG.

tiqG est une application qui tout sommet de NG et toute arte de EG associe
une tiquette : si r RG, tiqG(r) TR ; si c CG, tiqG(c) TC ; si e EG,
tiqG(e) Te.

L'ensemble des artes adjacentes tout sommet relation r est totalement ordonn,
ce que l'on reprsente en tiquetant les artes de 1 au degr de r.

Figure. 1.3 Un graphe conceptuel (Delteil 2002).

17
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

La figure 1.3 prsente un GC dfini sur le support dcrit dans la figure 1.2. Les
sommets concepts sont reprsents par des rectangles et les sommets relations par des
ellipses.
Le graphe de la figure 1.3 peut tre interprt par Accident mortel (accident
dans lequel une personne est morte). Comme lillustre la figure, la nature graphique des
GC fait quil est facile de les interprter, de les modifier ou den crer de nouveaux. Cette
facilit de cration est renforce par la sparation explicite de diffrents types de
connaissances, et plus prcisment par la dfinition dun objet distinct des graphes, le
support, qui aide lors de la cration des graphes, car les tiquettes des sommets doivent tre
choisies dans ce support.
Le modle des GC est dot dune smantique logique: les types de relations et de
concepts correspondent des prdicats, les liens sorte de sont reprsents par des
implications et les graphes par des assertions.

3.6.3 Les logiques de descriptions


Les logiques de description (LDs) dcoulent directement des travaux fondateurs de
Brachmann et de son systme KL-ONE. Depuis le dbut des annes 90, la recherche en
logique de descriptions sest considrablement dveloppe.
Les logiques de description peuvent tre considres comme un fragment de la
logique du premier ordre, dans lequel les formules ont une variable libre pour les
descriptions de concepts et deux variables libres pour les descriptions de relations (Buchheit
et al. 1993).
Les LDs sont trs riches en constructeurs ce qui permet lexpression dtaille des
concepts. On remarque que plus les descriptions de concepts sont dtailles, plus les
mcanismes d'intgration d'ontologies peuvent tre efficaces dans la comparaison des
concepts et des rles.
Une LD est compose de deux parties : un langage terminologique TBox et un
langage assertionnel ABox. Le langage assertionnel est ddi la description de faits et le
langage terminologique la description de concepts et de rles. La principale tache de
raisonnement au niveau terminologique est de calculer les relations de subsomption entre
concepts (Napoli 1997).
Le TBox constitue la partie terminologique de la base de connaissances. Il contient
la dclaration des termes et des rles. Chaque nouveau concept est dfini base des
concepts dj dfinis, pour fournir la fin un ensemble de concepts de plus en plus
complexes. Cet ensemble de concepts est classifi en vrifiant la subsumption des concepts
qui positionne chaque concept la bonne place dans la hirarchie.

18
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Le mcanisme de subsomption est support par plusieurs algorithmes. Horrocks


propose le systme FaCT qui implmente un algorithme de classification pour la logique de
description bas sur la notion de Tableau Calculi (Horrocks 1998).
Le ABox contient les individus (ou instances) des concepts. Il utilise les concepts
tablis dans le TBox et permet de dfinir des instances pour chaque concept ou rle. Par
exemple, lassertion suivante permet de dfinir la personne Sara comme tant une mre
: Mre Personne (Sara). Concernant les rles, on peut dfinir lassertion suivante : AEnfant (Sara, Darine) qui indique que la personne Sara a un enfant Darine .

a.

Les constructeurs des LDs

Les entits de base qui sont dfinies et manipules dans une logique de
descriptions sont les concepts et les rles. Un concept permet de reprsenter un ensemble
dindividus, un rle reprsente une relation binaire entre concepts.
Un concept et un rle possdent une description structure, labore partir d'un
certain nombre de constructeurs. Les concepts et les rles peuvent tre primitifs ou dfinis.
Les concepts (ventuellement les rles) primitifs sont comparables des atomes et servent
de base la construction des concepts dfinis (ventuellement les rles dfinis).
Une smantique est associe chaque description de concept et de rle par
l'intermdiaire d'une interprtation. Les manipulations opres sur les concepts et les rles
sont ralises en accord avec cette smantique (Napoli 1997).

Syntaxe de la logique de description

Une LD est inductivement dfinie partir dun ensemble Pc de concepts primitifs,


un ensemble Pr de rles primitifs, des constantes (dnote le concept le plus gnral, son
extension inclut toutes les instances possibles) et ( dnote le concept le plus spcifique)
et des rgles de syntaxe suivantes :
C, D

plus gnral absurde (concept vide)

concept primitif

CD

conjonction de concepts

CD

disjonction de concepts

ngation

r.C

restriction universelle

19
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

r.C

restriction existentielle

n r.C

cardinalit maximum

n r.C

cardinalit minimum

rle primitif
r1 r2

conjonction de rles

r1 r2

disjonction de rles

La conjonction des concepts pour exprimer lintersection entre deux concepts


(CD). La smantique associe dsigne lensemble des individus obtenu par
lintersection des individus des concepts C et D.

La disjonction des concepts pour exprimer lunion entre deux concepts (CUD). La
smantique associe dsigne lensemble des individus obtenu par lunion des
individus des concepts C et D.

La ngation dun concept pour exprimer son complment (C). La smantique


associe dsigne lensemble des individus qui appartiennent au domaine
complment.

Dans lexemple suivant, on propose un concept qui reprsente les personnes qui ne
sont pas des femmes. Pour cela, on utilise la conjonction et le complment comme suit:
Personne Femme.
Ltablissement des relations entre les concepts est lune des caractristiques
importantes de la logique de description. Alors, un langage pour la logique de description
doit proposer les formalismes ncessaires pour exprimer les rles et pour tablir les
restrictions ncessaires sur eux. Dans ce contexte, deux lments sont fournis ; les
quantificateurs et les cardinalits.
Les quantificateurs permettent dtablir des restrictions de nombres sur les rles.
On trouve principalement deux quantificateurs ; le quantificateur universel et le
quantificateur existentiel . Par exemple, pour designer un concept dont les individus ont
tous des enfants fminins on peut lcrire comme suis : A-Enfant.Femme.
Les cardinalits constituent un moyen important pour assurer une restriction des
rles. Elles permettent dimposer des valeurs minimales ou maximales sur ces rles.

20
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Dans notre exemple concernant les membres dune famille, on peut ainsi dfinir un
concept qui a un nombre denfants entre 2 et 5 par : 2 A-Enfant 5 A-Enfant .
Les constructeurs utiliss dans cette syntaxe dterminent la puissance dexpression
de la LD ainsi dfinie.
Par exemple, la description de concept suivante dcrit toutes les personnes qui
travaillent dans un projet financ par un institut :
Personne travailledans.(Projet financpar.Institut).
Selon les applications considres, les constructeurs sont plus ou moins utiles.
Ainsi pour dcrire des objets, les constructeurs de cardinalit maximum et minimum
peuvent tre parfois trs utiles.

Smantique

La signification formelle dune description de concept est donne au moyen dune


smantique extensionnelle par une interprtation I qui est un couple ( I , I ) Le domaine I
est un ensemble arbitraire non vide dindividus et I une fonction d'interprtation qui fait
correspondre un concept un sous-ensemble de I et un rle un sous-ensemble de I I.
La smantique dun concept de la LD dfinie plus haut est donne par la
Table 2.1. Syntaxe et Smantique des descriptions dune LD.

Constructeur
Plus gnral / absurde

Syntaxe

Smantique

I /

Conjonction

C D

CI DI

Disjonction

CD

CI DI

Ngation

I \ C I

Restriction universelle

r.C

{a I / b I , si (a,b) rI
alors b CI }

21
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Restriction existentielle

r.C

{a I / b I , (a,b) rI et
b CI }

Cardinalit maximum

n r.C

{a I / | b I / (a,b) rI et
b CI }| n }

Cardinalit minimum

n r.C

{a I / | b I / (a,b) rI et
b CI }| n }

Conjonction des rles

r1 r2

{(a,b) I I / (a,b) r1I et


(a,b) r2I }

Disjonction des rles

r1 r2

{(a,b) I I / (a,b) r1I ou


(a,b) r2I }

Voici quatre proprits gnrales des LDs:


1.

Satisfiabilit :

Un concept C est satisfaisable si et seulement si il existe une interprtation I telle que


I
C .
2.

Subsomption :

Lorganisation des concepts et des rles par niveau de gnralit se fait par la relation
de subsomption. Un concept C subsume un concept D si C est plus gnral que D au
sens o lensemble des individus reprsent par C contient lensemble des individus
I
reprsent par D. En effet, Un concept C est subsum par D si et seulement si C
I
D pour toute interprtation I.
3.

Equivalence :
I

Un concept C est quivalent D si et seulement si C = D pour toute interprtation


I.

4.

Incompatibilit :

22
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Deux concepts C et D sont incompatibles si et seulement si: C D = pour toute


interprtation I.
I

Pour conclure cette section, nous avons considrablement mis laccent sur le
formalisme des logiques descriptions. Ce formalisme de reprsentation est trs riche en
constructeurs ce qui permet lexpression dtaille des concepts. Nous remarquons que plus
les descriptions des concepts sont dtailles, plus les mcanismes d'intgration d'ontologies
peuvent tre efficaces dans la comparaison des concepts et des rles.

3.7 Le cycle de vie des ontologies


Les ontologies tant destines tre utilises comme des composants logiciels dans
des systmes rpondant des objectifs oprationnels diffrents, leur dveloppement doit
sappuyer sur les mmes principes que ceux appliqus en gnie logiciel. En particulier, les
ontologies doivent tre considres comme des objets techniques volutifs et possdants un
cycle de vie qui ncessite dtre spcifi.
Les activits lies aux ontologies sont dune part des activits de gestion de projet
(planification, contrle, assurance qualit), et dautre part des activits de dveloppement
(spcification, conceptualisation, formalisation); sy ajoutent des activits transversales de
support telles que lvaluation, la documentation, la gestion de la configuration (Blzquez
et al. 1998).
Un cycle de vie inspir du gnie logiciel est propos dans (Dieng et al. 2001). Il
comprend une tape initiale dvaluation des besoins, une tape de construction, une tape
de diffusion, et une tape dutilisation. Aprs chaque utilisation significative, lontologie et
les besoins sont rvalus et lontologie peut tre tendue et, si ncessaire, en partie
reconstruite. La phase de construction peut tre dcompose en 3 tapes : conceptualisation,
ontologisation, oprationnalisation (figure 1.4).
La conceptualisation: identification des connaissances contenues dans un corpus
reprsentatif du domaine.
Lontologisation: formalisation, autant que possible, du modle conceptuel
obtenu ltape prcdente.
Loprationnalisation: transcription de lontologie dans un langage formel et
oprationnel de reprsentation de connaissances.
Ltape dontologisation peut tre complte dune tape dintgration au cours de
laquelle une ou plusieurs ontologies vont tre importes dans lontologie construire. Dans
ce travail, nous sintressons lintgration des ontologies qui sont dcrites en LDs.

23
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Corcho (Corcho 2002) insiste sur le fait que les activits de documentation et
dvaluation sont ncessaires chaque tape du processus de construction, lvaluation
prcoce permettant de limiter la propagation derreurs. Le processus de construction peut
tre intgr au cycle de vie dune ontologie comme indiqu en figure 1.5.

Figure- 1.4 : La phase de construction des ontologies (Dieng et al. 2001).


Dans la section suivante, nous allons prsenter les diffrents langages qui sont
dvelopps pour limplmentation des ontologies Web smantique.

4. Langages pour le web smantique


Comme nous lavons dj indiqu, le Web smantique apparat aujourdhui comme
la prochaine volution importante du Web. De par la taille que le World Wide Web a
atteinte, laccessibilit aux informations disponibles sur celui-ci exige des moyens de
raisonnement. Pour cela, diffrents langages de reprsentation des connaissances adapts au
Web ont t cres.
Dans cette section, nous prsentons quelques langages de reprsentation des
ontologies les plus connus et les plus utiliss.

24
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Figure- 1.5. Le cycle de vie dune ontologie (Corcho 2002)

4.1 RDF et RDF(S) fondement du Web Smantique


Le langage Resource Description Framework (RDF) est le standard mergeant
propos par le W3C pour la reprsentation et lchange de mta-donnes sur le Web (Rdf
1999), il est bas sur un modle de triplets (ressource, proprit, valeur) et possde une
syntaxe XML. Le langage RDF Schma (RDFS) est le standard accompagnant RDF qui
permet de reprsenter les connaissances ontologiques relatives aux annotations (Rdf 2000).
RDF(S) dsigne le couple compos de RDF et RDFS.

4.1.1 Le noyau du modle


Le modle de donnes RDF et la spcification de sa syntaxe est une
recommandation du W3C (Rdf 1999). Il est ddi la description des ressources du Web.
Tout objet du Web identifi par une URI est une ressource et peut tre dcrite en RDF, ce
peut aussi bien tre un document textuel quune image ou encore un document sonore.
Une description RDF consiste en un ensemble de dclarations spcifiant chacune la
valeur dune proprit dune ressource. Une dclaration RDF est donc un triplet (ressource,
proprit, valeur) o la valeur est soit une ressource soit un littral.

25
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Considrez comme un exemple simple, la phrase : La page index a pour titre


ontologie. Cette phrase est compose des parties suivantes (Figure 1.6):

Sujet (Ressource) : index.html

Prdicat (Proprit) : Titre

Objet (valeur) : "ontologie"

Figure-1.6 : Triplet (index.html, titre, ontologie) (Rdf 1999)


Le triplet (index.html, Titre, "ontologie") est l'lment de base d'un nonc RDF.
Le modle de donnes RDF est proche des rseaux smantiques. Un ensemble de
dclarations RDF peut tre vu comme un multi-graphe orient tiquet, dont les sommets
sont des ressources ou des littraux et dont les arcs sont tiquets par les proprits des
ressources.
Le modle de donnes RDF est dfini indpendamment de sa syntaxe. Lchange
de donnes RDF sur le Web a conduit associer au modle une syntaxe XML.

4.2 RDFS
RDF Schma (RDFS) est une recommandation du W3C en cours dlaboration. Il
sagit du langage de spcification de schmas associ RDF. Il est ddi la reprsentation
des connaissances ontologiques utilises dans des dclarations RDF.
Un schma RDF est un ensemble de dclarations de classes et de proprits. Il
sapparente en cela la partie terminologique dune Logique de Description (LDs) o sont
dclars les rles et les concepts dune base de connaissances. Il permet en outre, comme
dans les langages de Reprsentation de Connaissances par Objets (RCO), de dfinir les
domaines et les codomaines (domaines de valeurs) des proprits RDF ainsi que des

26
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

hirarchies de classes. Il permet galement de reprsenter des hirarchies de proprits,


celles-ci tant considres sur le mme plan que les classes.
Pour reprsenter les connaissances spcifiques un domaine, un schma RDF est
dfini par raffinement du schma noyau RDFS. Les classes spcifiques au domaine sont
dclares comme des instances de la classe Class et les proprits spcifiques au domaine
comme des instances de la classe Property. Les proprits subClassOf et subPropertyOf
permettent de dfinir des hirarchies de classes et des hirarchies de proprits.
Les hirarchies de classes et de proprits autorisent toutes deux lhritage
multiple. Les proprits range et domain permettent de restreindre les domaines et
codomaines des ressources de type Property. Dans la version (Rdf 2000), la signature
dune proprit autorise un domaine valeur unique : une proprit peut tre applique
diffrentes classes mais sa valeur appartient une classe unique.

Figure- 1.7. Le schma de RDF(S) (Rdf 1999)

27
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

La figure 1.7 montre les primitives de RDF(S). Les concepts et les relations
sont dclars dans un document RDF(S) comme instances de Class et de Property .
Une fois ce schma stock sur le Web, les primitives qui y sont dcrites peuvent
tre utilises dans une page si on y inclut une rfrence lURI du schma. Une application
ncessitant laccs la smantique de la page utilisera alors le schma dinterprtation. Le
RDF-S nest cependant pas un langage oprationnel de reprsentation, au sens o il ne
permet pas la reprsentation des axiomes et leur utilisation pour raisonner.

4.3 DAML + OIL


Dans loptique dune utilisation dontologies sur le Web, le langage RDF-S a t
enrichi par lapport du langage OIL (Ontology Interchange Language1) qui permet
dexprimer une smantique travers le modle des frames tout en utilisant la syntaxe de
RDF-S. OIL offre de nouvelles primitives permettant de dfinir des classes laide de
mcanismes ensemblistes issus des logiques de description (intersection de classes, union
de classes, complmentaire dune classe). Il permet galement daffiner les proprits de
RDF-S en contraignant la cardinalit ou en restreignant la porte (Fensel et al. 2000).
Le langage OIL a t fusionn avec le langage DAML pour former le DAML+OIL.
DAML (Darpa Agent Markup Language2) est conu pour permettre lexpression
dontologies dans une extension du langage RDF. Il offre les primitives usuelles dune
reprsentation base de frames et utilise la syntaxe RDF (Hendler et Mcguinness 2001).
Lintgration de OIL rend possible les infrences compatibles avec les logiques de
description, essentiellement les calculs de liens de subsomption.

4.4 OWL
La combinaison de RDF/RDF-S et de DAML+OIL a permis lmergence de OWL
(Web Ontology Language), un langage standard de reprsentation de connaissances pour le
Web.
Dvelopp par le groupe de travail sur le Web Smantique du W3C, OWL peut tre
utilis pour reprsenter explicitement les sens des termes des vocabulaires et les relations
entre ces termes. OWL vise galement rendre les ressources sur le Web aisment
accessibles aux processus automatiss (Gruber et Olsen 1994), dune part en les structurant
dune faon comprhensible et standardise, et dautre part en leur ajoutant des mtainformations.
Pour cela, OWL a des moyens plus puissants pour exprimer la signification et la
smantique que XML, RDF, et RDF-S. De plus, OWL tient compte de laspect diffus des
sources de connaissances et permet linformation dtre recueillie partir de sources
distribues, notamment en permettant la mise en relation des ontologies et limportation des
informations provenant explicitement d'autres ontologies.

28
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

4.4.1 OWL et les autres langages


XML (Bray et al. 2000) fournit une syntaxe pour des documents structurs, mais
nimpose aucune contrainte smantique la signification des documents. RDF est un
modle de donnes pour reprsenter les objets et les relations entre eux, fournissant une
smantique simple pour ce modle qui peut tre reprsent dans une syntaxe XML.
RDF-Schma est un langage de dfinition de vocabulaire pour la description de
proprits et de classes reprsentes par des ressources RDF. RDF-S permet de dfinir des
graphes de triplets RDF, avec une smantique de gnralisation/hirarchisation de ces
proprits et de ces classes.
OWL ajoute du vocabulaire pour la description des proprits et des classes, des
relations entre classes (par exemple disjointness), des cardinalits et des caractristiques de
proprits (par exemple symmetry). OWL est dvelopp comme une extension du
vocabulaire de RDF et il est driv du langage dontologies DAML + OIL.

4.1.2 Sous langages de OWL


OWL a trois sous langages de plus en plus expressifs : OWL Lite, OWL DL, et
OWL Full :
1. OWL Lite : Il supporte les utilisateurs ayant besoin principalement dune hirarchie
de classification et des contraintes simples (un ensemble est limit 0 ou 1
lment, par exemple). Il a une complexit formelle infrieure celle dOWL DL.
OWL Lite supporte seulement un sous-ensemble de constructions du langage
OWL.
2. OWL DL : Daprs son nom, OWL DL utilise la logique de description DL. Il a t
dfini pour les utilisateurs qui rclament une expressivit maximale tout en retenant
la compltude informatique (toutes les conclusions sont garanties tre calculables),
et la possibilit de dcision (les calculs finiront en un temps fini). Il inclut toutes les
constructions du langage OWL, qui ne peuvent tre utilises que sous certaines
restrictions.
3. OWL Full : Il a t dfini pour les utilisateurs qui veulent une expressivit
maximale et une libert syntaxique de RDF mais sans les garanties informatiques.
OWL Full permet une ontologie daugmenter la signification du vocabulaire
prdfini (RDF ou OWL). Il est peu probable que nimporte quel logiciel de
raisonnement soit capable de supporter le raisonnement complet de chaque
caractristique dOWL Full. Autrement dit, en utilisant OWL Full en comparaison
avec OWL DL, le support de raisonnement est moins prvisible puisque
limplmentation complte dOWL Full nexiste pas actuellement.

29
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

OWL Full et OWL DL maintiennent le mme ensemble de constructions dOWL.


La diffrence se situe dans les restrictions sur lutilisation de certaines de ses
caractristiques et sur lutilisation des caractristiques de RDF. OWL Lite permet le
mlange libre dOWL avec RDFS et, comme RDFS, nimpose pas une sparation stricte
des classes, des proprits, des individus, et des valeurs de donnes.
OWL Full peut tre vu comme tant une extension de RDF, tandis que OWL Lite et
OWL DL peuvent tre vus comme des extensions dune vue restreinte de RDF. Alors, les
utilisateurs de RDF devraient se rendre compte quOWL Lite nest pas simplement une
extension de RDFS. OWL Lite met des contraintes sur l'utilisation du vocabulaire de RDF
(par exemple, disjointness des classes, des proprits, etc.). OWL Full est conu pour la
compatibilit maximale de RDF. Quant opter pour OWL DL ou OWL Lite, il faut
considrer si les avantages du OWL DL/Lite (par exemple, support de raisonnement)
lemportent par rapport aux restrictions de DL/Lite l'utilisation des constructions de OWL
et de RDF.

4.4.3 Syntaxe et smantique du langage OWL


Pour utiliser OWL, deux types de syntaxe sont disponibles. Si la premire est
videmment base sur RDFS, la deuxime dite syntaxe abstraite ressemble la syntaxe
abstraite utilise pour les langages des frames et les langages des logiques de descriptions
(Djaghloul 2007). Elle est plus approprie la lecture et linterprtation. Dans (PatelSchneider et Horrocks 2004), on trouve la syntaxe abstraite en dtail pour le langage OWL
DL. Le cas de la smantique est plus clair. La smantique du langage OWL est trs lie
celle des logiques de descriptions.
Table 1.3 prsente les constructeurs de classes OWL et leurs correspondances en
LDs. C et D sont des classes, T est un type de donne, n est un nombre, a et b sont des
individus, p une proprit dobjet (ObjectProperty) et d une proprit de donnes
(DatatypeProperty).
Lexemple suivant montre une utilisation relle de OWL. On sintresse la
restriction transitive sur une proprit de type objet. Rappelons quune proprit P est
transitive si : P(x,y) et P(y,z) implique P(x,z). Dans notre exemple, la proprit Situ-Dans
de la classe Rgion est transitive. Alors, on peut proposer le code OWL suivant :
<owl:ObjectProperty rdf:ID=" Situ-Dans ">
<rdf:type rdf:resource="&owl;TransitiveProperty" />
<rdfs:domain rdf:resource="&owl;Thing" />
<rdfs:range rdf:resource="#Region" />
</owl:ObjectProperty>

30
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Table 1.3: Les constructeurs OWL (Web 2011)

31
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

7. Le Web Smantique et Web 2


Ces dernires annes ont vu la monte en puissance de deux visions du Web,
que lon pourrait premire vue considrer comme disjointes. La premire, le Web
Smantique, propose une extension de celui-ci dfinissant des formalismes de
reprsentations unifies pour les donnes dans une optique dchange et de
comprhension de celles-ci par les agents logiciels (Berners-Lee et al. 2001).
Lautre, communment appele Web 2, est beaucoup plus pragmatique et met
laccent sur la place centrale de lutilisateur au sein de la dmarche de production
dinformation (OReilly 2005). Elle met en avant les changes, louverture et la
collaboration entre internautes par lintermdiaire doutils et services simples
dutilisation.
De manire gnrale, la complmentarit entre Web 2 et Web Smantique
est ncessaire pour conduire un Web o les interactions sociales sont
omniprsentes dans un objectif de production de donnes interprtables et
interoprables. Ainsi, le Web Smantique et ses formalismes de reprsentation des
connaissances ne sopposaient pas bien au contraire lutilisation doutils et de
principes Web 2 (Passant 2009).

7.1 Apports du Web 2 pour le Web Smantique


Si lon se base sur la vision du Web 2 en tant que systme centr sur
lutilisateur, il nous semble important pour le Web Smantique de rutiliser certains
paradigmes de celui-ci afin de monter en puissance (Passant 2009):

lutilisation doutils simples pour la production grande chelle de donnes


formalises selon les principes du Web Smantique, publies de manire
personnelle ou collaborative.

la masse importante dutilisateurs passs du statut de consommateur celui


dacteur. Si le Web 2 est en effet un read-write Web, qui plus est collaboratif, les
outils du Web Smantique peuvent ainsi bnficier dune masse importante
dutilisateurs producteurs de donnes formalises, pour autant que les outils soient
simples et adapts;

la collaboration entre utilisateurs des fins de cration collective et consensuelle


dinformations et de connaissances, en corollaire des lments prcdents. Ainsi,
les wikis (un wiki est un site Web dynamique et volutif, au sens o il permet
chaque lecteur de modifier les pages consultes et den ajouter de nouvelles mais
aussi den supprimer) peuvent tre utiliss pour peupler ou maintenir des ontologies
de manire collaborative;

32
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

lutilisation dinterfaces simples et ergonomiques, pour la visualisation et la


navigation de graphes complexes dannotations smantiques. Si ces structures de
donnes sont relativement complexes, lutilisation doutils comme des interfaces
facettes permettrons de masquer cette complexit aux utilisateurs;

7.2 Apports du Web Smantique pour le Web 2


Rciproquement, si les outils du Web 2.0 proposent des mthodes qui nous
semblent efficaces en termes dusages et dinterfaces, nous pensons que lutilisation
des technologies du Web Smantique ne peut tre quun plus en termes de
structuration et dchange de donnes sur le Web 2 (Passant 2009).
En se basant sur les outils et langages du Web Smantique, les outils du
Web 2 peuvent ainsi profiter de (Figure 1.8) :

lutilisation de modles communs pour reprsenter leurs mtadonnes, logiquement


bass sur RDF, en lieu et place dAPIs htrognes. SIOC (Breslin et al. 2005)
rpond cette problmatique en proposant un vocabulaire pour dfinir les
mtadonnes du Web 2 (notion de billet, dutilisateur, de commentaire ...) via les
technologies du Web Smantique. Il permet ainsi de ne plus les services en ligne
comme des lots indpendants et isols sur le Web, mais comme des services
interconnects o lchange dinformations peut se faire de manire transparente;

lutilisation dontologies mtier pour permettre la structuration des connaissances


produites via ces outils. Lutilisation dontologies du domaine doit permettre de
capitaliser des connaissances de manire formelle des fins de rutilisation entre
services. En ce sens, les wikis smantiques nous semblent un bon exemple
dutilisation de technologies du Web Smantique pour augmenter le potentiel
doutils existants et dj bien accepts sur le Web 2;

lutilisation de protocoles de requtes et dchange standardiss. Lutilisation de


RDF pour la production de donnes et de SPARQL (SPARQL est un langage de
requte adapt la structure spcifique des graphes RDF) pour leur interrogation
permet ainsi de simplifier linteroprabilit entre applications. On favorise en ce
sens la dcouverte de contenus rpartis sur diffrents services Web 2.

33
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Figure- 1.8. Web Smantique pour le Web 2 (Passant 2009)


Ainsi, les outils du Web 2 peuvent bnficier des technologies du Web
Smantique pour assurer la structuration et lhomognit des donnes produites :
en saffranchissant des formats internes et dAPIs propritaires, on facilite les
changes entre et depuis des systmes originellement htrognes. En consquence,
les outils du Web 2 peuvent galement participer cet essor du Web of Data, en
produisant non plus de simples documents, mais un ensemble de donnes
interoprables (Passant 2009).

8. Conclusion
Nous avons dcrit dans ce chapitre le cadre technique de notre travail. Nous avons
prsent les concepts de base des ontologies et du web smantique, qui sont la base de notre
travail. Voici un rsume des principaux points que nous avons abords:

Le Web smantique transforme le contenu du Web pour qu'il soit comprhensible


par la machine. Pour raliser cette tche, il exploite la notion dontologie.

34
Kolli Manel.

Universit Mentouri Constantine.

Gnralits sur le web smantique et les ontologies

Une ontologie est une spcification explicite et formelle d'une conceptualisation


partage ;

Les ontologies sont considres comme des objets techniques volutifs possdant
un cycle de vie ;

Dans ltat de lart sur les formalismes de reprsentation dontologies, nous avons
soulign la grande expressivit des logiques de descriptions. Dans la suite de ce
travail nous allons exploiter ces logiques pour la description des ontologies
intgrer.

Une partie importante de ce chapitre a t ddie au langage OWL, langage que


nous avons choisi pour l'implantation des ontologies dveloppes dans le cadre de
cette thse. Ce choix est motiv par les possibilits offertes par ce langage, savoir
un fondement thorique consistant en se basant sur les logiques descriptions et le
support dune syntaxe utilisable dans le cadre du Web.

Les Graphes conceptuels sont un formalisme de notation graphique de la logique


dans lequel le raisonnement peut se faire par projection de graphes. Donc, nous
allons exploiter ce formalisme pour dcrire lontologie de lalignement pour sa
lisibilit. En plus, lontologie de lalignement gnre par notre systme reprsente
des cas simples dont on na pas besoin des constructeurs.

Aprs ce panorama des technologies qui constituent le paysage technique de ce


mmoire, le chapitre suivant se focalise sur les travaux de recherche autour de lintgration
dontologies.

35
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Intgration des ontologies

36
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

1. Introduction
Les ontologies jouent un rle cl dans le domaine du web smantique notamment
dans lintgration des systmes dinformation et dans la recherche de linformation. Comme
nous lavons soulign dans le chapitre prcdent, elles permettent de reprsenter les
connaissances dune manire formelle et explicite. Elles constituent alors la brique
supportant les changes et le partage des informations en tendant linteroprabilit
syntaxique du web en une interoprabilit smantique.
Le web smantique exploite les ontologies dans la reprsentation des connaissances
(Charlet et al. 2005). Partant du fait quil existe plusieurs connaissances qui peuvent
prendre des reprsentations diffrentes, nous trouvons de nos jours plusieurs ontologies de
domaine pour un mme champ dapplication (Zghal et Ben Yahia 2007). Ainsi, La mise en
correspondance (mapping) des ontologies, l'alignement et la fusion des ontologies devient
un grand dfi pour tablir un lien entre plusieurs sources d'information pour changer des
informations d'une source lautre.
Dans ce chapitre, nous commenons par voquer le problme de lintgration des
ontologies. En suite, nous prsentons les htrognits qui peuvent exister entre les
diffrentes ontologies et leurs impacts sur le processus de lintgration. Aprs, nous
dfinissons le calcul des mesures de similarit entre les entits smantiques. Puis, Nous
passons la prsentation en dtail des types dintgration des ontologies, nous les illustrons
par des exemples dapplication. Le chapitre se termine par une conclusion.
`

2. Intgration des ontologies


La mdiation d'ontologies qui est le processus qui permet de rconcilier diffrentes
ontologies, se base gnralement sur le principe de la combinaison d'ontologies. Ce
processus de combinaison est trs souvent appel intgration d'ontologies qui signifie la
fois le fait que les ontologies peuvent tre fusionnes en une ontologie unique nouvellement
cre, et aussi le fait que les ontologies peuvent tre mises en correspondance sans cration
de nouvelle ontologie (Klein 2001).
Il est gnralement admis que la dmarche d'intgration d'ontologies est base sur
trois sous-processus (Kavouras 2003): le processus d'extraction de la smantique, le
processus de comparaison et enfin le processus d'intgration proprement dit (figure 2.1).

37
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Figure2.1- Mthodologie d'intgration d'ontologies (Kavouras 2003)


Le processus d'extraction correspond la modlisation de la smantique effectue
sur la base d'ontologies. Le processus de comparaison d'ontologies permet de quantifier le
degr de similarit ou d'htrognit des concepts des ontologies intgrer, et ce en se
basant trs souvent sur des calculs de distances. Et enfin, le dernier processus permet
d'intgrer les ontologies concernes.
Le problme d'intgration des ontologies est la consquence logique de l'utilisation
des architectures se basant sur plusieurs ontologies. Plusieurs travaux existent qui tudient
cet aspect et qui proposent des solutions pour rsoudre les diffrentes htrognits qui
peuvent exister au niveau des ontologies (Sad 2006).

38
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Dans la section suivante nous allons tudier les htrognits d'ontologies et nous
allons ensuite prsenter les solutions typiques utilises pour leur rsolution.

2.1 Htrognit des ontologies


Le projet Knowledge Web (Knowledge 2004) distingue fondamentalement quatre
niveaux d'htrognits qui sont:
 les htrognits de niveau syntaxique (ou niveau de langage).
 les htrognits de niveau terminologique.
 les htrognits de niveau conceptuel.
 et des htrognits de niveau pragmatique.

2.1.1 Niveau syntaxique


Le premier type dhtrognit est li aux caractristiques des langages utiliss
pour reprsenter les ontologies. Les langages peuvent diffrer dans leur syntaxe, mais plus
important encore dans les concepts et aussi dans les contraintes utilises dans les deux
langages : certains concepts et/ou contraintes dun langage ne sont pas disponibles dans un
autre langage. Ce type dhtrognit soulve le problme de translation ou de traduction
dontologies (Corcho et al. 2003) qui constitue un cas particulier du problme dintgration
dontologies. Ce problme est gnralement rsolu de faon relativement simple par la mise
en uvre dun processus de translation ou de traduction qui se base souvent sur des
techniques de normalisation qui permettent ainsi de rsoudre les diffrences syntaxiques
pouvant exister entre deux ontologies donnes.

2.1.2. Niveau terminologique


Le second type dhtrognit concerne toutes les diffrences lies au processus
de nomination des entits (classes, proprits, etc.). A ce titre, il est possible dtablir les
conflits typiques suivants :

Synonymie : o plusieurs mots dsignent la mme entit.

Polysmie : o un mme mot est utilis pour dnommer diffrentes entits.

Multilinguisme : o des mots de diffrents langages sont utiliss pour nommer des
entits.

39
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Des variations syntaxiques d'un mme mot (abrviations, etc.).

Comme le prcise (Knowledge 2004), il est important de retenir que du point de


vue complexit, les htrognits terminologiques ne sont pas aussi complexes que les
htrognits conceptuelles. Cependant, la plu part des htrognits qui occurrent dans
la ralit se situent ce niveau. Ce qui rend ce dernier assez critique.

2.1.3. Niveau conceptuel


Les htrognits conceptuelles concernent les diffrences de couverture de
lunivers du discours, le degr de granularit et le point de vue de lontologie (figure 2.2) :
 Couverture : qui dsigne le fait que les ontologies couvrent diffrentes portions de
l'univers du discours. Par exemple, on peut dfinir une ontologie sur la fabrication
de composants lectroniques qui inclut la description des oprateurs de
maintenance, alors qu'on peut galement avoir une autre ontologie qui ne dcrit pas
les oprateurs.
 Granularit : qui signifie que les entits des ontologies peuvent dcrire les objets de
la ralit des degrs de dtails diffrents. Par exemple : on peut avoir une
ontologie d'quipement qui ne s'intresse qu'aux diffrents type de machines dont
on dispose, alors que l'on peut dfinir une autre ontologie qui inclut tous les
quipements individuels avec leurs caractristiques spcifiques.
 Perspective : qui signifie que les ontologies couvrent des points de vue diffrents.
Par exemple: on peut dfinir deux ontologies dcrivant les composants
microlectroniques avec deux points de vue diffrents: l'un concerne l'aspect
fabrication et l'autre concerne l'aspect marketing.

2.1.4 Niveau pragmatique


Le niveau pragmatique est le niveau le plus complexe. Il concerne les
htrognits d'interprtation d'une ontologie qui peuvent survenir lorsque des individus
ou des communauts diffrentes interprtent diffremment l'ontologie selon diffrents
contextes.
Dans ce qui suit nous prsentons en dtail les diffrents types dintgration des
ontologies.

2.2 Diffrents types dintgration des ontologies


Un certain nombre de techniques ont t proposes dans la littrature pour raliser
lintgration des ontologies. Elles sont souvent utilises pour permettre le partage des

40
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

donnes entre des bases de connaissance htrognes et pour la rutilisation des


informations de ces bases.

Figure 2.2- Trois dimensions dhtrognits conceptuelles (Knowledge 2004)


Dans louvrage "Semantic Web Technologies" (Bruijn et al. 2006), lauteur
distingue trois catgories principales qui sont :
1. Le mapping dontologies, qui a comme objectif la reprsentation des
correspondances entre les ontologies. Ceci permet, par exemple, dinterroger des
bases de connaissances htrognes en utilisant une interface commune ou en
transformant des donnes entre diffrentes reprsentations.

41
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

2. Lalignement dontologies, pour qui lobjectif consiste dcouvrir des


correspondances entre les ontologies. Lensemble des mappings reprsente
lalignement.
3. La fusion dontologies, qui permet de crer une nouvelle ontologie, appele
lontologie fusionne capturant les connaissances des ontologies dorigine. Le dfi
est alors dassurer que toutes les correspondances et les diffrences entre les
ontologies soient correctement prises en compte dans lontologie rsultante.
Ces trois techniques seront dtailles dans les sections suivantes.

2.2.1. La mise en correspondance (mapping) des ontologies


La mise en correspondance entre les entits smantiques des ontologies reprsente
le cur de lintgration de ces ontologies, elle peut se situer au niveau smantique et au
niveau conceptuel. Elle permet dtablir des liens smantiques entre les entits des
ontologies intgrer pour changer les informations des sources reprsentes par ces
ontologies. Les travaux existant pour tablir les relations de mise en correspondance se
focalisent la fois sur les aspects dautomatisation et de dcouverte de ces relations et aussi
sur laspect formalisation pour le raisonnement.
Le point central aux approches visant lautomatisation est lutilisation
dheuristiques permettant didentifier des similarits syntaxiques et structurelles. Labsence
de structure commune, de similarits syntaxiques et dinstances communes rend le
problme de mise en correspondance difficile et souvent bas sur de fortes hypothses pas
toujours trs ralistes. Le problme principal auquel est confront le processus de mise en
correspondance est li lhtrognit smantique introduite quand diffrentes ontologies
sont construites avec diffrentes terminologies pour reprsenter la mme information dans
les contextes relatifs aux diffrentes sources (Bennacer et Aufaure 2006).
Selon (Mellal 2007), trois phases principales peuvent tre distingues dans le
processus de mapping (voir la figure 2.3) :

la dcouverte du mapping ;

la reprsentation du mapping ;

lexploitation et lexcution du mapping

a. Formalisation de la notion de mapping


Formellement, il est possible de dfinir la notion de mapping d'ontologies comme
un ensemble de correspondances au sens mathmatique entre un certain nombre
dontologies (Knowledge 2004). Autrement dit, un mapping entre deux ou plusieurs

42
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

ontologies est un ensemble de liens (nommes aussi mappings). Un mapping dsigne une
expression formelle qui tablit une relation smantique entre deux ontologies. Quand la
relation inter-ontologique est oriente, on parle trs souvent de mapping au sens
mathmatique, c'est--dire de la notion de fonction ou de morphisme mathmatiques
(Kalfoglou et Schorlemmer 2003).

Figure 2.3 Le mapping des ontologies (Mellal 2007)

Du point de vue abstrait, (Knowledge 2004) dfinit un mapping de deux ontologies


O et O comme un oprateur (O, O) qui :

partir des deux ontologies O et O de couverture diffrente, permet de rconcilier


lutilisation simultane des deux ontologies pour la description de lunivers du
discours;

43
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

partir des deux ontologies O et O de granularit diffrente, permet dassocier aux


entits de lontologie O les entits homologues dans O;

partir des deux ontologies O et O de point de vue diffrent, permet de dduire le


point de vue de O associ une entit de lontologie O.

Le processus de mapping consiste donc gnrer une correspondance M partir


de deux ontologies O et O. Aussi, (Knowledge 2004) considre le processus de mapping
comme une fonction f qui partir dune paire dontologies O et O rconcilier, un
mapping initial M, un ensemble de paramtres p, un ensemble de ressources r, produit un
nouveau mapping M entre ces deux ontologies :
M = f(O, O, M, p, r)
Ce processus peut tre reprsent comme suit (figure 2.4) :

Figure 2.4- Processus gnrique de mapping (adapt de (Knowledge 2004))


Il est bien entendu possible de dfinir le mapping de plusieurs ontologies. Ce
dernier est alors appel le multi-mapping d'ontologies. Il peut tre considr comme tant
une extension de la fonction prcdente, en insrant comme arguments les n ontologies
concernes par le mapping :
M = f (O1, O2, , On , M, p, r)
Le mapping initial M peut tre (sil nest pas vide) un mapping inject (de faon
trs souvent manuelle) en entre en vue de le mettre jour ou le complter. Les ressources r
peuvent tre les ressources matrielles, logicielles et humaines utilises pour excuter le

44
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

processus de mapping. Quant aux paramtres p, ces derniers peuvent tre les hypothses
effectues comme le seuil de vraisemblance utiliser, etc.

b. Mesures de similarit
La mise en correspondance repose sur le calcul des mesures de similarit entre les
entits smantiques, pour identifier pour chaque entit dune ontologie, des entits qui lui
sont les plus similaires dans les autres ontologies. Daprs (Rahm et Bernstein 2001), les
diffrentes mesures de similarit sont organises comme suit:
La premire mthode se base sur la terminologie des entits. En effet elle consiste
comparer les labels des entits. Elle est dcompose en approches purement syntaxiques et
celles utilisant un lexique. Lapproche syntaxique effectue la correspondance travers les
mesures de dissimilarit des chanes (EditDistance). Tandis que, lapproche lexicale
effectue la correspondance travers les relations lexicales (synonymie, hyponymie, etc.).
La deuxime mthode sappui sur la comparaison des structures internes des
entits (intervalle de valeur, cardinalit dattributs, etc.).
Contrairement la deuxime mthode, la troisime mthode permet la comparaison
des structures externes. Elle compare les relations dentits avec dautres. Elle est
dcompose en mthodes de comparaison des entits au sein de leurs taxinomies et
mthodes de comparaison des structures externes en tenant compte des cycles.
La quatrime mthode des mesures de similarit compare les extensions des entits
(instances des classes).
Finalement la cinquime mthode compare les interprtations (ou plus exactement
les modles) des entits.

c. Mthodologies du mapping
Les outils et mthodologies, parmi les plus significatifs dans cette catgorie, sont
MAFRA (Maedche et al. 2002), IF-Map (Kalfoglou et Schorlemmer 2003), RDFT
(Omelayenko 2003), C-OWL (Bouquet et al. 2004) et OntoMap (Angele et Schnurr 2005).

MAFRA

MAFRA (MApping FRAmework) est une plate-forme pour le mapping


dontologies distribues. Son approche repose sur la notion fondamentale de Passerelle qui
permet de formaliser les mappings en tablissant des correspondances entre les entits
dune ontologie source et celles dune ontologie cible.

45
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Figure 2.5 Larchitecture conceptuelle de MAFRA selon (Maedche et al. 2002)


Larchitecture conceptuelle de MAFRA distingue la dimension horizontale et la
dimension verticale (Maedche et al. 2002) (voir la figure 2.5).
La dimension horizontale est caractrise par cinq modules. Le module de
normalisation o les ontologies sont reprsentes de manire uniforme. Le module de
similarits tablit les ressemblances entre lontologie source et lontologie cible. Le module
du " bridging " smantique, bas sur les similarits, vise tablir les correspondances entre
les entits appartenant aux ontologies sources et cibles en utilisant des heuristiques. Ce
module spcifie des passerelles entre entits pour lesquelles chaque instance reprsente
dans lontologie source est transforme en linstance la plus similaire dans lontologie cible.
Ce module prend en compte les entits (concepts, relations et instances), la cardinalit (1:1,
1:n et n:1), la structure (spcialisation, alternative, composition, abstraction), les contraintes
et les transformations.
Le module Excution transforme les instances partir de lontologie source vers
lontologie cible en valuant les passerelles smantiques. Enfin, le module Post-Processing

46
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

rcupre le rsultat dexcution afin de vrifier et damliorer la qualit des rsultats de


transformation.
La dimension verticale est galement divise en sous modules. Le module
dEvolution vise prserver les passerelles smantiques gnres dans le module bridging
smantique. Celui de Construction dun consensus coopratif consiste tablir un
consensus sur les passerelles smantiques entre deux communauts participant au processus
du mapping. Le module Domaine de connaissances et contraintes est utilis pour amliorer
les passerelles smantique. Enfin, le module Interface graphique pour lutilisateur (GUI) est
toujours recommand pour masquer la difficult des conceptions complexes.
En rsum, ltablissement des mappings dans la plateforme MAFRA repose
essentiellement sur la gnration de passerelles, lesquelles tablissent des correspondances
entre les entits de diffrentes ontologies.

Figure 2.6 Le mapping entre deux ontologies locales (Kalfoglou et Schorlemmer 2003)

IF-Map

IF-Map (Information Flow Mapping) est une mthodologie propose par


Schorlemmer et Kalfoglou ralisant des mappings entre diffrentes ontologies de domaine
(Kalfoglou et Schorlemmer 2003). IF-Map repose sur la thorie de Barwise "The logic of
Information Flow ", not IF Model (Barwise et Seligman 1997).

47
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Les auteurs tudient la thorie des flux dinformation qui fournit une description
thorique consistante du processus partiel dintgration smantique effectu par deux
agents. Pour cela ceux-ci ralisent un alignement progressif des ontologies laide des
instances de celles-ci. Leur approche est base sur une mise en correspondance dontologies
locales. Deux autres ontologies sont utilises dans le processus de mapping : lune que lon
appelle ontologie de rfrence et lautre, ontologie globale " (voir la figure 2.6).
Ils supposent que les ontologies locales sont utilises par diffrentes communauts
et sont peuples par des instances de leur domaine respectif, alors que lontologie de
rfrence est une interprtation commune ddie au partage de la connaissance mais prive
dinstances. Lontologie globale est une ontologie virtuelle cre au vol pour les besoins de
la fusion. Les relations entre les ontologies locales et lontologie virtuelle sont du type
infomorphismes logiques.
Bases sur le modle IF, les ontologies sont exprimes en termes de logiques
locales. Les mappings sont alors formaliss par les infomorphismes. Le processus de
mapping de lapproche IF-Map (Kalfoglou et Schorlemmer 2003) inclut quatre tapes
principales reprsentes la figure 2.7.

Lacquisition des ontologies (Ontology Harvesting) qui utilise des ontologies


existantes, en les tlchargeant partir du Web, ou en les crant.

La traduction dun ensemble dontologies dentre qui peut se faire en clauses de


Horn puisque IF-Map est spcifie dans cette logique. Par exemple, une ontologie
gnre en RDF peut tre traduite en Prolog.

La gnration des infomorphismes (Infomorphisms Generation) qui construit des


liens formels entre les lments similaires de deux diffrentes ontologies.

Laffichage des mappings (Display Mappings) qui traduit les infomorphismes en


syntaxe RDF et les stocke dans une base de connaissances pour une utilisation
ultrieure par dautres applications.

RDFT

Omelayenko a propos RDFT (Resource Description Framework Transformation)


pour rsoudre les mappings entre mta-ontologies (Omelayenko 2003) en spcifiant un
langage entre des ontologies exprimes au moyen de DTDs XML et de schmas RDF.
RDFT dispose dune classe de base appele " BRIDGE " ou " Passerelle ". Cette
classe vise connecter des concepts et spcifier leurs correspondances selon le type de
passerelle. Comme le montre la figure 2.7, deux types de passerelles sont requis, les
passerelles Un--plusieurs (one-to-many) qui dtaillent les correspondances entre une seule
entit et un ensemble dentits et les passerelles Plusieurs--un (many-to-one) ddies aux

48
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

correspondances inverses. RDFT se rapproche de MAFRA en ce qui concerne lide


dutiliser les passerelles pour le mapping dontologies.

Figure 2.7 Larchitecture de IF-Map (Kalfoglou et Schorlemmer 2003)

49
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

La relation entre les composants source et cible de la passerelle peut tre une
relation dquivalence ou encore une relation de version qui dclare que les lments de
lensemble cible forment une version postrieure des lments de lensemble source dans
lhypothse o les domaines sont identiques pour les deux ensembles.

C-OWL

C-OWL " Contextual Ontology Web Language " est une extension de OWL 6 qui a
t propose pour la reprsentation dontologies contextualises (Bouquet et al. 2004). Ces
dernires sont des reprsentations locales, appeles contextes. Les liens entre les contextes
sont reprsents en relation avec dautres contextes au travers des mappings.
Deux notions principales caractrisent lapproche C-OWL : lespace de contextes
et les passerelles; Les connaissances sont contenues dans un ensemble de contextes, appel
espace de contextes o chaque contexte est exprim par une ontologie dcrite en OWL
possdant son propre langage et sa propre interprtation.
Les mappings entre ontologies sexpriment sous la forme de passerelles. Une
passerelle entre un contexte, reprsent par une ontologie OWL Oi, et un autre contexte,
reprsent par une autre ontologie OWL Oj, permet de dclarer une correspondance entre
les lments de connaissances de ces deux contextes. Sur la base de ces correspondances,
une partie des connaissances contenues dans Oi peut tre interprte et rutilise dans Oj.

Figure 2.8 Les passerelles (Mellal 2007)

50
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Selon les auteurs (Bouquet et al. 2004), C-OWL permet lexploitation de


mcanismes de raisonnements globaux, sappuyant sur les passerelles (figure 2.8). Ainsi, le
calcul de la subsomption globale repose sur ce qui est appel le principe de propagation de
la subsomption : la subsomption dans un contexte Oj peut tre dduite de la subsomption
dans un contexte Oj et de passerelles de Oi Oj.
Linstanciation globale repose sur le principe de propagation de linstanciation,
fortement inspir du principe de propagation de la subsomption. Il est possible den dduire
quun individu est une instance dune classe dans un contexte en sappuyant sur
linstanciation dans un autre contexte et sur les passerelles. Un mapping en C-OWL est
dfini par un ensemble de passerelles entre deux ontologies. Lensemble des ontologies
OWL et de leurs mappings constituent lespace de contextes.

OntoMap

OntoMap reprsente un "plugin" dans la plate-forme OntoStudio. Il permet la


cration et la gestion des mappings dontologies. Ceux-ci sont accessibles par une
reprsentation graphique et avec lenvironnement Schema-View ddi lontologie (Angele
et Schnurr 2005). OntoMap associe des phrases formelles la dclaration des mappings
limitant ainsi la tche des utilisateurs la comprhension de la smantique de
reprsentations graphiques (par exemple, une flche qui connecte deux concepts). Les
utilisateurs de OntoMap disposent galement de la fonctionalit "Drag and Drop" et
peuvent aussi vrifier la consistance des proprits.
OntoMap supporte un ensemble de patterns de mapping tels que concept--concept,
attribut--attribut, relation--relation, et attribut--concept.

2.2.2 Lalignement des ontologies


Lalignement des ontologies permet dtablir des liens smantiques entre les
concepts et des relations inter-ontologies.
Lalignement dontologies est un processus de dcouverte des correspondances
entre deux ontologies source. Il est, gnralement, dcrit comme une application de
loprateur MATCH (appariement) (Rahm et Bernstein 2001), dont lentre est constitue
dun ensemble dontologies et la sortie, forme des correspondances entre ces ontologies
(voir la figure 2.9 ).
On trouve dans la littrature plusieurs algorithmes qui implmentent cet oprateur.
Ces algorithmes sont gnralement regroups en quatre classes. On trouve le matching
bas-schma, le matching bas-instance, le matching niveau-lment et le matching niveaustructure. Un matcher bas-schma prend en compte diffrents aspects des concepts et des

51
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

relations dans les ontologies et utilise des mesures de similarit pour dterminer la
correspondance.
Les instances appartenant aux concepts des diffrentes ontologies sont compares
pour dcouvrir les similarits entre les concepts. Dans le matching niveau-lment et le
matching niveau-structure, le " matcher niveau-lment " compare les proprits dun
concept particulier et dune relation particulire (par exemple pour trouver des similarits
partir du nom). Le " matcher niveau-structure " compare la structure, cest--dire la
hirarchie du concept pour trouver les similarits (Noy et Musem 2001) (Giunchigliaet al.
2005). Selon Ehrig, ces " matchers " peuvent galement tre combins (Ehrig et Staab
2004).
Les techniques dalignement jouent un rle crucial dans la construction dun lien
smantique entre les ontologies dun mme domaine. Quelques approches dalignement
(Aleksovski et al. 2006), (Stuckensschmidt et al.2004) et (Hage et al. 2005) considrent que
lutilisation dune connaissance sur le domaine est une manire assurant la correspondance
smantique entre la dissimilarit syntaxique des ontologies. Lobtention de la bonne
connaissance sur le domaine est primordiale.
Dautres approches nexploitent pas une connaissance sur le domaine et ne ralisent
pas un modle smantique formel pour lalignement des structures produites. Dans ce cas,
la structure obtenue est difficile exploiter pour rpondre aux requtes interrogeant les
ontologies (Lopez et al. 2006). En outre, les approches courantes dalignement dontologies
(Noy 2004), (Shvaiko et Euzenat 2005) et (Bach 2006) sont bases sur les mesures de
similarit entre chanes de caractres et des structures composites. Les ontologies aligner
peuvent tre reprsentes avec diffrents langages.
Lalignement suffit dans le cas de lutilisation dontologies portant sur des
domaines de connaissance complmentaires, ou sur des domaines de niveaux smantiques
diffrents. Par exemple, lutilisation, dans un mme systme, dune ontologie de haut
niveau et dune ontologie de domaine ne va ncessiter quune compatibilit entre les deux.
La compatibilit de deux ontologies est assure par lutilisation des mmes formalismes de
reprsentation, ou lutilisation de formalismes compatibles, mais galement par la
compatibilit des modles de connaissance utiliss (Maedche et al. 2002).
Parmi les approches dalignement dontologies, on trouve Anchor-PROMPT (Noy
et Musem 2001), GLUE (Doan et al. 2003), (Giunchigliaet al. 2005), QOM (Ehrig et Staab
2004) et ASCO (Thanh et al. 2004):

Anchor-PROMPT

Anchor-PROMPT est un algorithme qui a t developp par Noy et Musen (Noy et


Musem 2001) afin de dcouvrir automatiquement les termes smantiquement similaires.
Anchor-PROMPT traite une ontologie comme un graphe, les noeuds de ce graphe
reprsentant les classes et les arcs reprsentant les proprits. Lalgorithme utilise deux

52
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

paires de termes relatifs comme entre. Il analyse les chemins dans le sous-graphe dlimit
par des ancres et dtermine quelles sont les classes qui apparaissent frquemment dans des
positions similaires sur des chemins similaires.
Lalgorithme cherche alors des termes le long des chemins qui pourraient tre
similaires aux termes dautres chemins. Ces nouveaux termes relatifs sont identifis par une
similarit qui peut tre modifie pendant lvaluation dautres chemins dans lesquels ces
termes apparaissent. Les termes qui sont fortement semblables sont prsents lutilisateur
pour amliorer lensemble des suggestions possibles.

Figure 2.9 Loprateur MATCH (Mellal 2007)

53
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

GLUE

GLUE est un systme qui emploie une approche de type " machine learning " pour
crer des mappings semi-automatiques entre ontologies htrognes. Il se base sur des
donnes dinstances, une ontologie tant vue comme une taxinomie de concepts (Doan et
al. 2003). GLUE se focalise sur la dtermination des mapping de type 1--1. La similarit
de deux concepts A et B dans deux taxinomies O1 et O2 utilise lensemble des instances des
deux concepts qui convergent. Pour dterminer si une instance du concept B est galement
une instance du concept A, un classifieur est dabord construit en utilisant les instances de
A comme ensemble dapprentissage.
Ce classifieur est ensuite utilis son tour pour traiter les instances de B. Le
classifieur dcide alors pour chaque instance de B, sil est galement une instance de A ou
non. Avec ces classifications, quatre probabilits sont calcules : P(A,B), P(A,B), P(A,B) et
P(A,B). La probabilit P(A,B) par exemple, sinterprte par lappartenance de linstance du
domaine A et la non appartenance B. Ces quatre cas peuvent ensuite tre employes
comme paramtres pour calculer la distribution de probabilit commune pour les concepts
A et B, laquelle est une fonction crite par lutilisateur.

S-Match

S-Match est une approche pour le matching des hirarchies de classifications


(Giunchigliaet al. 2005). Les auteurs mettent en oeuvre un oprateur de correspondance qui
admet en entre deux structures sous forme de graphes (par exemple, schmas de base de
donnes ou ontologies) et produit un mapping entre les lments qui sont en
correspondance smantique.
Selon Giunchiglia et Shvaiko, presque toutes les anciennes approches utilisant les
schmas et le matching dontologies sont des approches de matching syntaxiques par
opposition au matching smantique. Dans le matching syntaxique, les labels et parfois la
structure syntaxique du graphe sont associs. Un certain coefficient de similarit exprim
dans lintervalle [0.1] est obtenu. Il indique la similarit entre deux noeuds du graphe.
Le matching smantique calcule une relation, de nature ensembliste, entre les
noeuds en tenant compte de la signification de chaque noeud. La smantique dun noeud est
dtermine par son label et celle de tous les noeuds qui sont plus haut dans la hirarchie.
Les relations possibles retournes par lalgorithme du matching smantique sont lgalit,
lintersection, la disparit, la gnralit ou la spcificit.
Dans ce cas, le problme du matching est vu comme un problme de satisfaction
dun ensemble de formules du calcul propositionnel. Les graphes et les correspondances
tester sont traduits en formules de la logique propositionnelle en considrant non seulement
leur nom, mais galement la position des concepts dans le graphe.

54
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

QOM

QOM (Quick Ontology Mapping) est une approche qui a t conue pour fournir
un outil efficace de matching pour la cration au vol des alignements entre les ontologies
(Ehrig et Staab 2004).
Afin dacclrer lidentification des similarits entre deux ontologies, QOM ne
compare pas celles de la premire ontologie avec toutes les entits de la seconde ontologie,
mais emploie des heuristiques (par exemple, labels semblables) pour abaisser le nombre de
mappings candidats. Le calcul rel de similarit est effectu en utilisant une large gamme
de fonctions de similarit, telles que la similarit des strings.
Plusieurs mesures de similarit sont calcules et servent dentre une fonction
dagrgation. QOM applique une fonction sigmode qui fait ressortir diffrentes similarits
leves et basses. Les correspondances relles entre les entits des ontologies sont extraites
en appliquant un seuil de mesure agrge de similarit. La sortie dune itration peut tre
utilise en tant qulment dentre pour litration suivante afin de raffiner le rsultat.
Aprs un certain nombre ditrations, une table de correspondances entre les ontologies est
obtenue.

ASCO

ASCO est un algorithme qui permet de comparer deux ontologies (Thanh et al.
2004). Il trouve des mappings en suivant un processus deux phases.

La phase linguistique dans laquelle la valeur de similarit entre deux entits, telles
que des concepts ou des relations provenant de deux ontologies diffrentes, est
calcule partir de diffrentes informations disponibles telles que leurs noms, leurs
tiquettes (des labels qui fournissent une version comprhensible par un humain du
nom du concept ou de la relation) et leurs descriptions. Le calcul de la valeur de
similarit linguistique est effectu de plusieurs manires. Pour amliorer la
prcision du calcul et pour exploiter les relations de synonymie ou hyperonymie
entre termes, ASCO intgre WordNet.

La phase structurelle exploite les informations taxonomiques dans les structures des
ontologies. Elle utilise des heuristiques et les connaissances du domaine pour
calculer les valeurs de similarit structurelle entre entits des deux ontologies. Les
valeurs de similarit dans les deux phases sont combines pour obtenir les valeurs
de similarit finales entre les entits. Les alignements sont dduits de ces valeurs.

2.2.3 Fusion des ontologies


Le processus de fusion d'ontologies est fond sur deux ontologies d'entre (ou plus)
et retourne une seule ontologie base sur les ontologies sources. La fusion manuelle
d'ontologies l'aide d'outils conventionnels d'dition sans support est longue, difficile, et

55
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

sujette l'erreur. Par consquent, plusieurs approches de fusion sont rcemment proposes
(Galle 2002).
La fusion dontologies reprsente la cration dune nouvelle ontologie partir de
deux ontologies ou plus. Lontologie rsultante unifie et remplace les ontologies dorigine
(Voir la figure 2.10). Cette dfinition ne prcise pas comment lontologie rsultante est
relie aux ontologies originales pour laisser ouvert le problme du choix de la mthode de
fusion.
Dans la nouvelle ontologie, on retrouve des rgions des anciennes ontologies qui
sont plus ou moins inchanges. Ce genre dapproche est utilis quand les diffrentes
ontologies intgrer ont une forme ou un contenu trs htrogne. Le rsultat est une
ontologie plus homogne quavec une approche par assemblage, mais le processus
d'intgration nest pas facilement automatisable (Pinto et al. 1999).
Dans le cadre de la fusion il faut faire attention :

Prserver la hirarchie des entits conceptuelles.

Prserver les types des entits conceptuelles.

Trouver les entits conceptuelles qui peuvent se superposer.

Corrler les entits conceptuelles qui sont smantiquement proches par


quivalence ou par des relations de subsomptions.

Les approches les plus courantes utilisent lunion ou lintersection. Dans lapproche
par union, lontologie rsultante contient lunion des entits provenant des ontologies
originales et suppose rsolues les diffrences de reprsentation dun mme concept. Dans
lapproche de type intersection, lontologie rsultante ne contient que les parties communes
des ontologies originelles.
Plusieurs approches mettant en oeuvre la fusion dontologies ont t proposes
telles que PROMPT (Noy et Musen 2000), CHIMAERA (McGuinness et al. 2000), FCAMerge (Stumme et Maedche 2001) et OntoMerge (Dou et al. 2002).

PROMPT

PROMPT est un outil dont le processus de fusion est de type interactif. Lensemble
de phases associ ce processus comprend les tapes suivantes :

Les candidats la fusion sont identifis partir des similarits des noms de classes.
Le rsultat est prsent lutilisateur comme une liste doprations potentielles de
fusion.

56
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Lutilisateur choisit une des oprations suggres par la liste ou spcifie


directement lopration de fusion.

Le systme effectue laction demande et excute automatiquement les


changements additionnels drivs de cette action.

Le systme cre une nouvelle liste dactions suggres par lutilisateur en se basant
sur la nouvelle structure de lontologie. Il dtermine les conflits prsents par la
dernire action, les solutions possibles ces conflits puis prsente ces derniers
lutilisateur.

PROMPT identifie un ensemble doprations pour la fusion dontologies (fusion


des classes, fusion de slots, fusion des liens, etc.) et un ensemble de conflits possibles
conscutifs lapplication de ces oprations (conflits de nom, redondance dans la hirarchie
des classes).

Figure 2.10 Le principe de la fusion dontologies (Mellal 2007)

57
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

CHIMAERA

CHIMAERA est un environnement pour la fusion dontologies (McGuinness et al.


2000) qui aide les utilisateurs crer et maintenir des ontologies distribues dans le Web.
Il fournit des outils de diagnostic et supporte deux fonctions principales :

Fusionner plusieurs ontologies.

Analyser des ontologies individuelles ou multiples.

La fusion est exprime par un oprateur entre les paires de termes, de noms et de
dfinitions considres comme candidats la fusion. CHIMAERA dispose galement de
techniques permettant de lier les termes par des relations de subsomption, disjonction, etc.
Lanalyse effectue par Chimaera comprend aussi bien une vrification de la rigueur
logique dune ontologie que le diagnostic des erreurs habituelles dans sa conception.

FCA-Merge

Stumme et Maedche ont propos FCA-Merge (Formal Conceptual Analysis Merge)


dans le but de fusionner des ontologies locales qui partagent le mme ensemble dinstances.
Pour cela, les auteurs exploitent lanalyse formelle des concepts (Stumme et Maedche
2001). Le processus de fusion ncessite trois tapes :

Lextraction des instances partir de documents de type texte.

La gnration du treillis de concepts en appliquant lanalyse formelle des concepts


aux instances. Chaque noeud du treillis est associ un ensemble de concepts des
ontologies locales lorsque les instances associes sont contenues dans les mmes
documents.

La gnration interactive de lontologie fusionne est ltape finale de lanalyse du


treillis qui construit lontologie globale. Cette tape est la charge du concepteur.

OntoMerge

OntoMerge est un outil qui facilite la cration dune ontologie appele Ontologie
Passerelle. Celle-ci importe les ontologies originelles et relie les concepts grce un certain
nombre daxiomes (Dou et al. 2002).
OntoMerge est une approche en ligne dans laquelle les ontologies source sont
maintenues aprs lopration de fusion, alors que dans PROMPT lontologie fusionne
remplace les ontologies source. Le rsultat de lopration de fusion dans OntoMerge nest

58
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

pas une ontologie compltement fusionne, comme dans PROMPT, mais une ontologie
passerelle qui importe des ontologies source.
Des rgles de traduction issues des axiomes relient la partie de convergence des
ontologies source. Les ontologies source sont traites avec les axiomes passerelle comme
une seule thorie par un dmonstrateur de thormes optimis pour trois oprations
principales :

La traduction de lensemble de donnes dune reprsentation une autre.

La gnration dextensions dontologie qui, tant donnes deux ontologies relies


O1 et O2, engendre une extension O2s de O2 ainsi quune extension O1s de O1.

Linterrogation de diffrentes ontologies.

3. Discussion
La majorit des approches cites dans les diffrentes catgories (mapping, fusion et
alignement) exploitent des mcanismes qui ne reposent pas sur des fondements thoriques
et/ou modles mathmatiques robustes. La plupart de ces mcanismes utilisent des
heuristiques, la logique propositionnelle ou les probabilits.
Ces approches reposent sur lutilisation des calculs de similarits syntaxiques afin
didentifier les correspondances entre concepts, mais prennent rarement en considration
leur smantique.
Les techniques cites prcdemment saccordent sur certaines proprits mais elles
prsentent certaines limites :
1. La plupart de ces approches, telles que MAFRA, RDFT etc, sont limites
lutilisation dalgorithmes semi-automatiques pour le mapping, la fusion et
lalignement dontologies.
2. La prolifration des concepts introduits dans les ontologies engendre souvent une
explosion combinatoire.
3. Pour lier les concepts de diffrentes ontologies, ces approches sappuient sur des
similarits syntaxiques entre ces concepts. Toutefois, deux concepts peuvent avoir
une mme syntaxe alors que leur smantique est diffrente car place dans des
contextes diffrents. A linverse, deux concepts peuvent avoir la mme smantique
alors quils sont dcrits par diffrentes syntaxes.
4. Enfin, ces mthodologies sont difficilement comprhensibles par les utilisateurs
cause de leur complexit.

59
Kolli Manel.

Universit Mentouri Constantine.

Intgration des ontologies

Dans linfrastructure web smantique qui repose sur les logiques de descriptions
pour la construction des ontologies (voir chapitre1), la fusion de ces ontologies repose sur
linsertion des entits smantiques des ontologies initiales lontologie globale qui doit
respecter les notions de subsomption et classification.
Pour cela nous devons dterminer les relations smantiques (quivalence,
subsomption, disjonction, ...) existantes entre ces concepts qui sont dj organiss par la
subsomption dans les ontologies initiales. O, la relation d'quivalence permet de fusionner
les entits similaires, la relation de subsomption permet d'organiser les concepts et les rles
en hirarchies dans un graphe et la relation de disjonction permet d'viter les comparaisons
inutiles, car si deux entits sont disjointes alors leur subsums sont disjoints aussi, par
exemple: les entits homme et femme.
Cependant, la majorit des approches dintgration des ontologies comme nous
lavons dj indiqu, tel que: GLUE (Doan et al. 2002), QOM (Ehrig et Staab 2004) et SMatch (Giunchiglia et al. 2005) sont bases uniquement sur le calcul des mesures de
similarit entre les entits smantiques pour effectuer le processus d'appariement des
ontologies (voir section 2).
Ces mesures renvoient comme rsultat une valeur qui dtermine les entits
similaires (seulement la relation d'quivalence) des ontologies compares. Cela signifie que
ces mesures ne sont pas suffisantes pour la construction de l'ontologie globale. En outre, ils
ne peuvent pas rsoudre tous les problmes des quivalences entre les entits smantiques,
par exemple nous pouvons avoir la mme valeur pour deux calculs diffrents car ils
reposent sur des critres syntaxiques et structurels.

4. Conclusion
Ce chapitre introduit la notion de lintgration des ontologies. Nous avons
commenc par la prsentation des htrognits qui peuvent exister entre les diffrentes
ontologies et leurs impacts sur le processus de lintgration. Par la suite, nous avons dfini
le calcul des mesures de similarit entre les entits smantiques. Enfin, nous avons prsent
en dtail les types dintgration des ontologies.
Pour conclure, nous pouvons constater que lunicit de format de reprsentation de
la connaissance est un mcanisme qui facilite lintgration des diffrentes ontologies, et sert
amliorer la communication entre les diffrents acteurs dans un mme domaine. Dans le
chapitre suivant, nous proposons un systme pour lintgration des ontologies dcrites en
logique
de
description,
en
appuyant
notre
systme
sur

60
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

un exemple concret. Notre travail fait partie de la deuxime catgorie des


mthodes dintgration qui consiste aligner des ontologies dcrites en LDs. Le systme
propos gnre une ontologie gnrique et extensible des relations smantiques entre les
entits smantiques des ontologies intgres.

Proposition dun systme de


dtection des relations smantiques
dans les ontologies base sur le
Raisonnement partir de cas

61
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

1. Introduction
Les tudes d'valuation ont montr que le mapping rsultant des approches
dappariement existantes soit il contient un montant quitable des erreurs ou bien il ne
couvre qu'une petite partie des ontologies concernes (Euzenat et al. 2006) (Euzenat et al.
2007) (Caracciolo et al 2008). Afin de pallier ces insuffisances, nous proposons de rduire
l'application des mesures autant que possible en utilisant des outils plus fiables comme le
raisonnement partir de cas (RPC) bas sur des mcanismes formels tels que la
subsomption.
Comme nous l'avons dj mentionn dans le chapitre1, les ontologies Web
smantique sont bases sur la relation de subsomption, o tout concept se compose dune
description propre dfinie par des proprits locales et dune description partage avec ses
subsumants (comme cest le cas entre une sous-classe et ses super-classes dans un langage
objets) (Napoli 1997). Cela implique que la comparaison des entits pour dduire des
relations smantiques entre eux peut bnficier de la comparaison de leurs subsumants
travers des petites modifications. La rutilisation de la solution d'un problme dj rsolu
pour rsoudre un autre problme similaire est le principe du RPC. Selon (Daquin, 2006),
Le mcanisme de RPC consiste rsoudre un problme cible, en adaptant la solution
dun problme source remmor de la base de cas, considr comme similaire au problme
cible.
Dans ce travail, nous proposons un nouveau systme (Kolli et Boufaida 2009)
(Kolli et Boufaida 2010) bas sur un mcanisme du RPC pour la dtection des relations
smantiques entre les entits smantiques des ontologies en utilisant les techniques
dextraction de connaissances dans des bases de donnes (ECBD) et la distance smantique
inspire par (Cullot et Jouanot 2003) et adapte aux logiques de description dans (Kolli et
Boufaida 2004).
Ce systme gnre une ontologie gnrique et extensible des relations smantiques
entre les entits smantiques. Nous avons dcrit cette ontologie avec le formalisme des
graphes conceptuels qui nous permet de reprsenter les cas dans une forme prcise, lisible
et utilisable par un ordinateur.
La suite de ce chapitre est organise comme suit: Dans la prochaine section, nous
prsentons brivement le cycle de vie du mcanisme du RPC. La section 3 dcrit de
manire dtaille le systme propos bas sur deux phases: la phase de conception et la
phase de production. Au cours du processus, nous utilisons un exemple pour bien expliquer
le fonctionnement du systme propos. Le chapitre se termine par une conclusion.

62
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

2. Le raisonnement partir de cas (RPC)


Comme nous lavons dj voqu, le raisonnement partir de cas rsout de
nouveaux problmes en sappuyant sur la remmoration et ladaptation de problmes passs
dj rsolus. Daprs (Cordier et al. 2006) le cycle du RPC est constitu de cinq tapes :

Elaboration. Les informations ncessaires la formulation dun problme sont


collectes et structures de faon constituer un nouveau cas : le cas cible. Lors de
cette tape, le systme sollicite lutilisateur ou lenvironnement extrieur (bases de
donnes, systmes dinformation) pour obtenir lensemble des informations
ncessaires la poursuite du raisonnement.

Remmoration. Ltape de remmoration consiste chercher dans la base de cas un


ou plusieurs cas passs rsolus jugs similaires au cas cible. La slection des cas
similaires sappuie gnralement sur une mesure de similarit. Certains systmes
conservent plusieurs cas remmors pour les combiner par la suite, mais la plupart
du temps, un seul cas est conserv pour la suite du processus. On lappelle le cas
source. La slection du cas source parmi les cas remmors peut tre la
consquence dune slection par le systme ou bien rsulter dun choix effectu par
lutilisateur.

Rutilisation. Cette tape permet dobtenir une solution au cas cible partir de la
solution du cas source slectionn qui est tout dabord recopie puis ventuellement
adapte afin de satisfaire les contraintes du problme pos. Ladaptation sappuie
sur des connaissances dadaptation qui peuvent prendre diffrentes formes selon les
systmes.

Rvision. Il est possible que la solution propose par le systme ne convienne pas
lutilisateur ou bien quune fois mise en application, elle savre inapte rsoudre
le problme pos. Lutilisateur a donc, pendant la phase de rvision, lopportunit
de modifier, corriger ou mme refuser la solution propose. Ltape de rvision
permet didentifier les causes ventuelles des checs et de proposer des adaptations
supplmentaires pour conduire une solution satisfaisante : il sagit du cas rvis.
Cette tape est la base du processus dapprentissage permettant la fois
damliorer des connaissances dadaptation existantes et den faire merger de
nouvelles.

Mmorisation. Traditionnellement, on considre ltape de mmorisation comme


ltape durant laquelle la base de cas est enrichie par le cas cible rvis. Cette
mmorisation implique une mise jour des index permettant de retrouver les cas et
parfois un processus de maintenance pour rorganiser la base de cas. Mais ltape
de mmorisation est galement le sige de lapprentissage dautres types de
connaissances. En effet, cest durant cette tape que lon peut concrtiser les efforts
effectus durant les autres tapes pour apprendre dautres connaissances.

63
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

3. Dtection des relations smantiques entre les ontologies en


utilisant le raisonnement partir de cas (RPC)
Lobjectif de notre travail est de proposer un systme bas sur le RPC pour
dduire les relations smantiques entre les entits smantiques des ontologies. Ici les
ontologies sont dcrites en logiques de description. En effet les hirarchies de concepts ou
de relation de ces ontologies sont organises selon les deux mcanismes : classification et
subsumption. Cette organisation implique lexistence des concepts ou bien des relations
dans les dfinitions intensionnelles de leurs subsums. Ce pendant la dtection des relations
smantiques entre les entits smantiques pourra se faire travers la combinaison des
relations de similitudes entre leurs subsumants. La rutilisation de la solution dun
problme dj rsolu pour rsoudre un autre problme similaire est le principe du RPC.
Comme tout systme base des connaissances, le cycle de vie dun systme de
RPC distingue plusieurs phases : la phase de conception, la phase de production et la
phase de maintenance. Dans la phase de conception, nous dfinissons les mthodes de
rsolution de problmes qui seront utilises pour constituer les bases de connaissances du
systme, dfinir une base de cas rsolus initiale, dcrire les connaissances du domaine, les
connaissances de similarit et les connaissances dadaptation.
Le systme peut galement tre utilis avec des cas connus afin dinstancier la base
de cas et de fournir une base au raisonnement. La question du formalisme de reprsentation
des connaissances se pose galement ce moment. La phase de production consiste
utiliser le systme pour rsoudre de nouveaux problmes. Le cycle de raisonnement
appliqu pour mener cette tche bien est tudi dans le deuxime paragraphe. Enfin,
notons que le systme peut effectuer seul les oprations de maintenance, tre sollicit par
lexpert pour les accomplir ou bien encore solliciter lexpert pour quil lui apporte son aide
(Cordier et al. 2006).
Dans ce chapitre, nous dtaillons les diffrentes phases de notre systme en
l'appliquant sur deux ontologies du mme domaine pour pouvoir reprsenter les cas
particuliers. Les figures 3.1 et 3.2 reprsentent les deux ontologies que nous avons choisies.
Ces ontologies sont dcrites en LDs.

3.1 Phase de conception


Daprs Kolodner (Kolodner 1998), un cas est constitu des mmes composantes
quelque soit le domaine dapplication. Ces composantes sont un problme et une solution.
En effet, un cas est un couple, not (pb, sol(pb)), associant un problme pb sa solution
sol(pb). Dans cette mme optique, pour notre systme, un cas est compos des deux
lments suivants :

64
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Le problme. Cest dterminer la relation de similitude entre deux concepts CJ et Cj`


qui appartiennent deux ontologies diffrentes.

La solution. La dtection de la relation smantique entre ces deux concepts. Nous


considrons limitons la relation smantique rel une des relations de l'ensemble:
{, , &, , }.
rel(Ci, Cj) = signifie que Ci est plus gnrale que Cj. Par consequent,
nous pouvons dire que Ci est le subsumant de Cj.
rel(Ci, Cj) = signifie que Ci est moins gnrale que Cj. Donc, Ci est le
subsum de Cj.
rel(Ci, Cj) = signifie que Ci est quivalent Cj. La relation d'quivalence
est dfinie comme la subsomption dans les deux sens. rel(Ci, Cj) = &
signifie que Ci est superpos avec CJ.
Enfin, rel(Ci, Cj) = signifie que Ci est diffrent de CJ.

Personne TOP
Ensemble TOP
Algrien Personne
Homme Personne
Femme = personne (homme)
Mineur = personne ge.nombre < 18
Adulte = personne ge.nombre 18
Algerien

_membre

personne

membre.algrien
Equipe = ensemble membre.personne 2
membre

Figure 3.1 La description des concepts de l'ontologie O1

65
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Humain = nom.chane
addresse.chane
Mle TOP
Parent = humain enfant.humain
Femelle = Mle
Homme = humain sexe.mle
Femme = humain

sexe.femelle

Fille = femme enfant.humain


Garon = homme enfant.humain

Figure 3.2 La description des concepts de l'ontologie O2


Lapplication du RPC pour la dduction des relations smantiques entre des
ontologies diffuses au sein du web smantique implique la reprsentation des
connaissances utiles ce raisonnement d'une manire formelle l'aide des logiques de
descriptions. Les mcanismes de raisonnements associs ce formalisme peuvent tre
utiliss pour le RPC, en particulier, la subsomption et la classification qui permettent de
construire une hirarchie de concepts de la base de cas.
A la fin de chaque tape de rsolution de problme, le nouveau cas rsolu est
mmoris dans la base de cas pour pouvoir tre rutilis ultrieurement. Il en rsulte une
augmentation graduelle de taille de la base de cas, ce qui met donc en vidence le besoin
dorganiser et de maintenir la base de cas tout au long de la vie du systme. Pour rpondre
ce besoin, nous utilisons lontologie qui a pour rle de modliser ce type de connaissances
au sein du web smantique. Cette ontologie gnrique et extensible est appele ontologie
d'alignement OA.
Le formalisme que nous utilisons pour la description de cette ontologie sont les
graphes conceptuels qui nous permettent de reprsenter les cas de manire prcise, lisible et
utilisable par un ordinateur. L'ensemble des relations dduites ce niveau reprsente
lalignement des l'ontologies A (voir la figure 3.3).

66
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

De manire gnrale, un graphe conceptuel est dfini comme un graphe avec deux
types de nuds (Chawk 1996): les concepts et les relations conceptuelles,
-

Les concepts reprsentent dans notre situation les entits smantiques des deux
ontologies O1 et O2

Les relations conceptuelles symbolisent la relation smantique entre deux


concepts.

O1
OA

O2

Figure 3.3 Processus d'appariement des ontologies


Les concepts sont reprsents graphiquement par des rectangles ou sont placs ente
crochets [Concept]; les relations conceptuelles sont reprsentes par des cercles ou bien
sont placs entre parenthses (relation conceptuelle), avec un seul arc entrant et un seul arc
sortant. Un arc entrant associe un concept une relation conceptuelle, et un arc sortant relie
une relation conceptuelle un concept.
Les libells des arcs ont t ajouts pour une meilleure comprhension. Dans le
formalisme des graphes conceptuels, les arcs sont numrots afin de les diffrencier.
A ce niveau, le processus d'appariement des ontologies (M) consiste comparer
l'ensemble des entits smantiques primitives de deux ontologies en utilisant la distance
smantique. Le rsultat sera une des relations de l'ensemble: {, , } (Figure 3.4). Ci Cj :
signifie que la relation entre Ci et Cj est floue. Cette relation floue peut tre l'une des
relations de l'ensemble: {&, , }.

67
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Si le rsultat de la comparaison n'est pas floue, c'est dire: quil est gal une des
relations de l'ensemble: {, } alors: directement, nous ajoutons ce cas la base de cas
(l'ontologie OA). Mais, si le rsultat de la comparaison est flou, c'est dire: quil est gal
, alors: sa prcision sera calcul au niveau de ltape de la rutilisation.

Comparison en utilisant la distance smantique

{}

{
}

{
}

{
}

{
}

{&
&}

Figure 3.4 Les rsultats de la comparaison

3.1.1 Distance smantique


Le calcul de la distance smantique inspire de (Cullot et Jouanot 2003) entres les
entits smantiques utilise la notion de synonymie et dantonymie.
La dfinition de synonymie daprs (Miller 1990) est la suivante : Deux
expressions sont synonymes dans un contexte linguistique C si la substitution de lune pour
lautre en C ne modifie pas la valeur de vrit de la phrase dans laquelle la substitution est
faite. Un synonyme donc est un terme de substitution pour nommer une entit
smantique. Un antonyme est un terme qui contredit fondamentalement la signification
dune entit. Pour calculer cette distance nous supposons que chaque ontologie possde un
dictionnaire qui dfinit les synonymes et les antonymes de chaque concept et de chaque
rle de lontologie.
Pour pouvoir appliquer cette distance sur les ontologies utilises, nous rajoutons
celles-ci une hirarchie de meta-classes conceptuelles qui servent comme des mtadonnes sur les concepts en associant chaque concept une liste de synonymes et
dantonymes.

68
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Calcul de la distance smantique:

Le calcul de la distance, appele distance globale, entre deux entits est calcule
partir de calculs de quatre distances lmentaires, deux distances lmentaires (DMC et
DC) sont appliques sur les concepts et les deux autres (Dr et Drj) sont appliques sur les
rles.
Ces distances prennent en compte les diffrents lments de l'environnement d'un
concept dans son contexte. Ces lments sont le domaine dont drive ventuellement un
concept, la terminologie du concept et les rles jous.
Le calcul de la distance globale s'effectue en quatre tapes. Chaque tape permet
soit de restreindre le nombre des concepts retenus comme potentiellement similaires, soit
d'affiner le calcul de la distance entre des concepts retenus aux tapes prcdentes.
Le premier calcul effectu se base sur les relations ventuelles des entits
smantiques avec leurs domaines de dfinition.

Distance lmentaire DMC (C, C')

Soient C et C' deux concepts de deux ontologies diffrentes. La distance DMC


(C, C') se calcule de la manire suivante :

DMC (C, C') = 1 si C et C' sont du mme domaine.

DMC (C, C') = 0 sinon.


Distance lmentaire DC (C, C')

Le calcul de la deuxime distance lmentaire appele DC se base sur la taxonomie


des concepts comparer (C et C'). Si le concept C est un synonyme du concept C' alors :
DC(C,C') = DMC(C, C'). Sinon DC(C,C') = 0.
Deux autres distances lmentaires sont calcules. Elles prennent en compte les
rles associs aux concepts C et C'.

Distance lmentaire Dr(C.ri, C.rj)

La distance Dr mesure la similarit entre des rles (resp. ri et rj) de deux concepts
(resp. C et C').
-

Dr(C.ri, C'.rj) =1 si ri est synonyme rj

69
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Dr (C.ri, C'.rj) = 0 sinon.

Chaque rle du concept C est compar chaque rle du concept C'. Une matrice
des distances des rles est ainsi construite o chaque lment Dr(C.ri, C'.rj) compare le rle
ri de C avec le rle rj de C'.

Distance lmentaire Drj (C,C')

Enfin la distance lmentaire Drj mesure la similarit entre deux concepts en


fonction des rles. Pour cela on calcule, une norme de la matrice MR des rles (calcule
avec la distance Dr).
|| MR || = (i=1..n (i)) / n
-

avec (i) = 1 si j=1.. m Dr(C.ri, C'.rj) >0,

(i) = 0 sinon.

La distance lmentaire Drj (C,C') vaut :

DC(C,C') x || MR || si C et C' jouent des rles,

0 si C et C' nont aucun rle.

Distance globale D(C,C') (dans le cas gnral) :

La distance globale entre deux concepts C et C' considre la taxonomie et


l'environnement complet de ces deux concepts. L'valuation prend en compte, comme le
montre la figure 3.5, les rles jous par les concepts C (r1 ru) et C' (r1 rt), les concepts
qui dfinissent le concept C (C1Cn) et le concept C' (C1'C'm) et la taxonomie des deux
concepts C et C'.

C = C1 C2 Ci r1.Cj ... ru.Cn

C' = C'1 C'2 C'i r1.C'j ... ru.C'm


Figure 3.5 Comparaison des concepts

70
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

On calcule tout d'abord une matrice de rapprochement qui compare deux deux les
concepts qui dfinissent les concepts C et C'.
La distance globale D(C, C) est calcule comme une pondration de la distance
DC(C,C'), de la distance Drj(C,C') qui mesure l'environnement des rles de C et C' et d'une
moyenne sur la matrice de rapprochement qui mesure les similarits entre les concepts qui
dfinissent les concepts C et C'.

D(C,C') = DC(C,C') + ( ( i=1..n j=1..n RC,C'(i, j) /n ) + Drj(C,C'))


Avec [0,1] et [0,1] et + =1.

Afin dinstancier notre base de cas (l'ontologie de l'alignement OA), nous prenons
toutes les entits primitives des deux ontologies O1 et O2 de lexemple que nous avons pris
et qui sont:

Les concepts primitifs : personne, homme, ensemble et algrien de lontologie O1 et


les concepts humain et mle de lontologie O2.

les rles primitifs : membre et age de O1 et les deux rles: enfant et sexe de O2.

Le premier problme ici (not pb1) est de trouver le relation smantique entre les
concepts racines des deux ontologies O1 et O2 c d: pb1 = Rel (personne, humain). La
rsolution de ce problme par le calcul de la distance smantique est comme suit :
1. Calcul de la distance DMC (humain, personne) :
DMC (humain, personne) = 1 (humain et personne sont du mme domaine).
2. Calcul de la distance DC (humain, personne) :
Humain est synonyme de personne donc : DC (humain, personne) = DMC(humain,
personne) = 1.
3. Calcul de la distance Dr (humain.ri, personne.rj) :
La distance Dr mesure la similarit entre des rles (ri et rj) de deux concepts
(humain et personne). Nous remarquons que les concepts : humain et personne nont aucun
rle. Donc Dr (humain.ri, personne.rj) = Drj (humain, personne) = 1.

71
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

4. Calcul de la distance globale D (humain, personne) :


D (humain, personne) = DC(humain, personne) + ( ( i=1..n R humain, personne (i)/n)
+ Drj(humain, personne)).
Les concepts humain et personne ne sont pas dfinis avec dautres concepts.
Donc : ( i=1..n R humain, personne (i, j) / n) = 1. Ce qui implique : D (humain, personne) = 1.
Deux entits (concepts ou rles) sont similaires si la distance smantique entre
elles est au moins gale une valeur minimale fixe. Nous supposons que cette valeur est
gale 0.8.
D (humain, personne)= 1 0.8 ce qui implique que le concept humain est similaire
au concept personne.
Apres avoir appliqu la mesure de similarit, qui est la distance smantique sur les
concepts personne et humain, nous avons trouv que personne est quivalent humain.
Donc, la solution sol1 = . Ce cas (cas1) est implment en formalisme des graphes
conceptuels, comme suit:
[personne]

()

e1

[humain]

s1

De la mme faon, nous appliquons la distance smantique sur les autres concepts
primitifs. Les rsultats de la comparaison entre ces concepts sont implments aussi en
graphes conceptuels, comme suit:
[ensemble]
[ensemble]
[algrien]
[algrien]

[homme]

()

e4

()

e5

e6

e7

e8

s2

()

e3

[personne]
[homme]

()

e2

()
()
()

s3

[mle]
[humain]
[humain]

s4

[humain]

s5

s6

s7

s8

[mle]
[humain]
[mle]

72
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Les trois premiers rsultats seront stocks dans l'ontologie de l'alignement OA. Les
autres rsultats (flous) seront dtermins aprs.
Les rsultats de la comparaison entre les rles primitifs des ontologies O1 et O2 sont
les suivants:
[age]
[ membre]

e10

[ membre]

e11

[age]

2.1.

()

e9

e12

()
()
()

[enfant]

s9

s11

s12

[sexe]

s10

[enfant]
[sexe]

Phase de production

Aprs avoir prsent les mcanismes et les outils utiliss, nous montrons dans cette
phase comment appliquer les tapes du RPC pour rsoudre le problme de La dtection
des relations de similitude et nous proposons quelques stratgies permettant cette dtection.
Le cycle du RPC que nous utilisons se dcompose en cinq oprations (figure
3.6) : llaboration, la remmoration, la rutilisation, la rvision et la mmorisation.

2.1.1. Llaboration
Cette tape permet la constitution de la premire partie du cas cible cest dire : le
problme, qui est dans notre cas la dtection de la relation de smantique entre deux
concepts des ontologies intgrer.
Dans la phase prcdente nous avons instanci notre base de cas avec les cas
suivant :
cas1 = (Rel (personne, humain), )
cas2 = (Rel (ensemble, humain), )
cas3 = (Rel (ensemble, mle), )
cas4 = (Rel (ge, enfant), )
cas5 = (Rel (membre, enfant), )
cas6 = (Rel (ge, sexe), )

73
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

et cas7 = (Rel (membre, sexe), ).


Nous prenons maintenant deux autres concepts qui sont parent et algrien
_membre. Ces deux concepts sont dfinis dans leurs ontologies (figure 3.1 et 3.2) comme
suit :
Parent = humain enfant.humain
Algerien _membre = personne membre.algerien

3.2.2. La remmoration
Le but de la remmoration nest pas seulement de trouver le cas source le plus
similaire au cas cible, nous cherchons aussi le cas le plus facile adapter. Dans ce mme
esprit, Leake suggre quune bonne remmoration dun cas permet de faciliter leffort
dadaptation (Leake et al. 1997).
La remmoration repose traditionnellement sur les mesures de similarit
smantiques qui sont bases sur des hypothses et des rgles. Daprs (Cordier et al. 2006),
ces mesures peuvent conduire des rsultats mdiocres dans la mesure o elles permettent
parfois de se remmorer des cas sources, certes trs "ressemblants" au cas cible, mais
difficiles voire impossibles adapter. Cette observation montre la limite des mesures de
similarit au regard du processus complet de raisonnement.
Dans notre situation, les concepts en question sont organiss selon la relation de la
subsumption dans leurs ontologies de base. En effet, les concepts sont dfinis avec leurs
subsumants. Ainsi, les cas les plus faciles adapter sont ceux qui contiennent les subsumant
des concepts concerns.
Nous proposons que le processus de la dtection se fait tout dabord en largeur,
cest dire : il faut dterminer la relation de similitude entre un concept de lontologie O1 et
tous les concepts voisins de lontologie O2. En suite, rpter cette opration avec leurs
subsums. Dans ce cas, nous pouvons profiter de la relation de subsomption pour faciliter
leffort de ladaptation. En effet, les cas remmors sont donc les cas qui contiennent leurs
subsumants.
Dans lexemple prcdant le problme pb2 est la dtection de la relation smantique
entre les concepts parent et algrien _membre qui sont des concepts dfinis. Nous
remarquons que le concept humain est le subsumant du concept parent et le concept
personne est le subsumant du concept algrien_membre. En effet, le cas remmor est le
cas: cas1.

74
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Deux ontologies intgrer O1 et O2

Elaboration

Deduire la relation
entre les entits

Remmoration

Les cas qui contiennent


les subsumants de Cet D

Rutilisation
Base de
cas

Connaissances
dadaptation

La dtection de
rel(C,D)

Rvision

((C,D), rel(C,D))

Mmorisation
Figure 3.6 Le cycle du RPC utilis pour la dtection des relations smantiques des
entits smantiques

75
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

3.2.3.

La rutilisation

Cette tape consiste combiner les solutions des cas remmors et les adapter pour
trouver une solution au cas cible. Dans ce travail, nous nous appuyons sur le modle
dadaptation propos dans (dAquin et al. 2006) que nous prsentons brivement ci-aprs :
1. (srce, cible) pb, o pb encode les similarits et dissimilarits entre des
problmes srce et cible.
2. (pb, CA) sol, o CA est un ensemble de connaissances dadaptation et sol
encode les similarits et dissimilarits entre Sol(srce) et la solution Sol(cible)
construire pour cible.
3. (Sol(srce), sol) Sol(cible), Sol(srce) est modifi en Sol(cible) selon sol.
Ce modle est bas sur les techniques dextraction de connaissances dans des bases
de donnes (ECBD). Dans cette tape nous rappelons les diffrentes tapes du processus
dECBD et nous dtaillons la faon dont celles-ci sont effectues dans notre systme. Le
but de lECBD est dobtenir des connaissances partir de donnes. Le processus dECBD
se fait sous la supervision dun analyste, qui est un expert du domaine. Une fois
lacquisition des donnes ralise, il se droule en deux tapes: la prparation des donnes
et la fouille de donnes (Figure 3.7).

a.

Prparation des donnes

La prparation des donnes est une tape de mise en forme et de slection des
donnes. Lopration de mise en forme met les donnes dans un format acceptable pour les
oprations de la fouille de donnes. La slection des donnes permet de concentrer la
fouille sur un sous-ensemble pertinent de concepts et dliminer les donnes bruites.
Ltape de prparation des donnes gnre un ensemble des concepts partir de la
base de cas BC, en appliquant successivement deux transformations.
La premire transformation formate chaque cas source remmor (srce,
Sol(srce)) en deux ensembles de proprits boolennes : (srce) et (Sol(srce)). Le
vocabulaire utilis pour dcrire les cas tant celui des ontologies initiales des concepts en
question, si srce = Relation(C, D) alors (srce) = ((C), (D)) = ({p1,C, . . . , pn,C}, {p1,D, . .
. , pn,D}), avec (p1,..., pn) sont les entits (concepts et des rles) qui dfinissent les concepts
C et D. Afin de comparer les concepts avec les concepts et les rles avec les rles, nous
avons mis c comme un indice pour indiquer les concepts et r pour indiquer les rles.
Pour l'exemple que nous avons pris, le cas source est: cas-srce = (Relation
(personne, humain), ) et le cas-cible = (Rel (parent, Algerien _membre), Sol (cible)).

76
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

L'application de la fonction sur le cas source et le cas cible est comme suit: (srce) =
{{Personnec}, {humainc}}, (Sol(srce)) = {} and (cible) = {{personnec, enfantr},
{humainc, membrer, algerienc}}

Cas
source1

Cas
sourcen

Cas
source2

Remmoration

Base des
Cas

Prparation des
donnes

Rutilisation

Fouille de
donnes
Le processus dECBD

Mmorisation

Cas
cible

Figure 3.7 La dtection des relations smantiques entre les ontologies avec un systme
RPC

77
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

La deuxime transformation produit un concept x partir de chaque couple de cas


sources ((cas-source), (cas-cible)). Suivant le modle dadaptation prsent dans
(dAquin et al. 2006), x doit encoder les proprits de pb et de sol. pb encode les
similarits et dissimilarits de srce et cible, c--d:

Les proprits communes srce et cible (marques par =),

Les proprits de srce que cible ne partage pas (-) et

Les proprits de cible que srce ne partage pas (+).

Toutes ces proprits sont relies des problmes et sont marques par pb1 et pb2.
pb1 correspond au deux premiers concepts de srce et cible et pb2 correspond au deux
derniers concepts de srce et cible. Nous comparons respectivement la premire et la
deuxime partie de srce avec la premire et la deuxime partie de cible. sol est calcul de
faon similaire et x = pb sol. Par exemple,
si

(srce1) = {{a, b, c}, {a, d}}, (Sol(srce)) = {}


(srce2) = {{c, d}, {b, c, d}}, (Sol(cible)) = {}

Alors : x ={a-pb1, c=pb1, b-pb1, d+pb1, a-pb2, d=pb2, c=pb2, -sol, +sol}
Aprs l'application de ce modle sur notre exemple:
x = {Personne=pb1,c, enfant+pb1,r, humain=pb2,c, membre+pb2,r, algerien+ pb2,c, -sol}.

b.

Fouille de donnes

La fouille de donnes permet d'extraire des lments dinformation partir des


donnes. Nous ralisons cette extraction en appliquant les connaissances d'adaptation (CA).
Nous prsentons ces connaissances d'adaptation en proposant une nouvelle mthode
formelle de la dtection des relations smantiques entre les concepts, que l'on appelle
mthode d'appariement des ontologies.

Appariement des ontologies

Notre mthode d'appariement est divise en deux oprations: lagrgation ou la


composition des relations smantiques. Ces oprations sont appliques sur les relations
smantiques entre les subsumants des concepts en question qui sont dj dduites avant.

78
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Composition

Dans l'infrastructure Web smantique, qui repose sur les LDs pour la construction
des ontologies, nous remarquons que les entits smantiques sont organises selon la
relation de subsomption. Cela, permet la dduction des relations de subsomption (, )
entre les concepts de la mme ontologie dune manire simple et directe.
Cette observation nous permettre de dire que la rutilisation des cas stocks dans
l'ontologie OA peut tre faite par l'opration de composition. Ainsi, s'il existe une relation
smantique entre le concept C1 de l'ontologie O1 et un concept C2 de l'ontologie O2 et une
autre relation smantique qui est la relation de subsomption entre le concept C2 et le
concept C3 de la mme ontologie (O2), alors il devrait tre possible dobtenir la relation
smantique entre les concepts C1 et C3.
Les rsultats possibles de cette composition sont indiqus dans la table 3.1.
Table 3.1 : Composition des relations smantiques

&

&

C1 R C2
C2 R C3

La preuve de ces rsultats est faite par la notion d'interprtation des LDs comme
suit:
1.

((C1 C2 C1I = C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).

2. ((C1 C2 C1I C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
3. ((C1 & C2 (C1 C2 )I ) C1I C2I ) (C2 C3 C2I C3I)) ((C1
C3 )I C1 & C3)), (I).
4. ((C1 C2 C1I = C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
5. ((C1 C2 C1I C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).

79
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

6. ((C1 C2 C1I C2I) (C3 C2 C3I C2I)) (C1I C3I C1 C3)), (I).
Toujours, selon la notion d'interprtation des LDs, on dduit quil existe des
rsultats floues () dans la table 3.1. Cela signifie que la composition de ces relations
gnre plusieurs rsultats.
Nous pouvons prendre par exemple le cas o nous avons: (C1 C2) et (C2 C3).
Cela implique: (C1I C2I) et (C2I C3I). Donc, nous pouvons dduire que: (C1I = C3I) or
(C1I C3I) or (C1I C3I). Dans ce cas, la relation entre C1 et C3 peuvent tre une des
relations de l'ensemble: {, , }.
Ainsi, l'application de l'opration de composition ces cas ne rsout pas le
problme de la dduction des relations. Pour la raison de la dtection de toutes les relations
possibles entre tous les concepts, nous proposons d'utiliser galement dans cette tape une
autre opration, qui est l'agrgation de similarit.
Dans l'exemple prcdent, nous avons le cas: (personne humain) stocks dans
l'ontologie OA1. Nous pouvons aussi dduire les deux cas: (homme personne) et
(Algrien _membre personne) de l'ontologie O1. Selon la table 3.1, l'application de
l'opration de composition ces cas nous donne comme rsultat les deux cas: (humain
homme) et (humain Algrien _membre).
Aussi, nous pouvons dduire selon la relation de subsomption les cas suivants:
(homme humain), (femme humain) et (parent humain) de l'ontologie O2.
Selon la table 3.1, l'application de l'opration de composition ces cas, nous donne
comme rsultat les cas suivants: (personne homme), (personne femme) et (personne
parent).

Agrgation de similarit

En gnral, on peut avoir plusieurs subsumsants pour la mme entit smantique


(pour cette opration, nous ne traitons que les entits dfinies). Ainsi, ils existent plusieurs
cas sources pour chaque paire d'entits. Leurs solutions doivent tre combines en une seule
solution pour le cas cible. Nous appelons cette opration: l'agrgation de similarit qui
prend en entre toutes les valeurs des relations de similarit (solutions) des cas source
obtenues comme rsultat de l'tape prcdente afin de les agrger en une seule valeur de
relation smantique en exploitant les techniques des LDs.
Dans la proposition 1, nous donnons quelques combinaisons possibles entre deux
concepts. Nous montrons aussi comment appliquer la fonction d'agrgation sur ces
concepts.

80
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

Proposition 1:
Soient C et D deux concepts dfinies comme suit: C = ( C1 Cv Cn Ci) et D
= ( D1 DU Dm Dj). Considrons les relations smantiques R1, R2, ... Rn
dduites entre les concepts Ci et Dj.
Aggreg(R1,R2, Rk) = R est la fonction d'agrgation applique aux relations
smantiques entre les diffrents concepts qui dfinissent les deux concepts C et D. Cette
fonction Renvoie la relation R entre les deux concepts C et D. La relation R peut tre
dduite comme suit:
1. Si (( Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) et (si les concepts C et D ne
sont que des conjonctions)) alors: Aggreg(R1,R2, Rk) = c d: C D.
2. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) alors: Aggreg(R1,R2, Rk) =
c d: C D.
3. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) et (Rt /t=1 ... k et t s tel que:
Rs = ) alors: Aggreg(R1,R2, Rk) = c d: C D.
4. Si ((Rs {R1, R2, Rk}/ s = 1 k, tel que: Rs = ) et ( Rt / t=1 k et t s tel
que: Rs = )) alors: Aggreg(R1,R2, Rk) = c d: C D.
5. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = & ou Rs = ou Rs = ou Rs = )
alors: Aggreg(R1,R2, Rk) = & c d: C & D.
Il est facile de prouver la proposition 1 en utilisant la notion d'interprtation des
LDs: Soient R1, R2, ... Rn, les relations smantiques dduites entre les concepts Ci et Dj.
1.

Rs {R1, R2, Rk}/ s=1 k, tel que: Rs = CV / v = 1 i et Du / u = 1


j, tel que: CV Du
CI V DI u = , (I)
(C1 Ci)I (D1 Dj)I = (C et D ne sont que des conjonctions)
CI DI =
C D

2. Rs {R1, R2, Rk}/s=1 k, Rs= CV / v = 1 i et Du / u = 1 j, CV


Du
CI V = DI u, (I)
(C1 CV Cn Ci)I = (D1 DU Dm Dj)I
CI = DI
CD

81
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

3. (Rs {R1, R2, Rk}/s=1 k, Rs = ) (CV / v = 1 i et Du / u = 1 j,


(1)
CV Du)
(Rt/ t=1... k et t s, tel que: Rs = ) (Co / o = 1 i et Dp / p = 1 j, tel
que: CV Du)
(2)
(1) et (2) CI V = DI u et CI o DI p, (I)
( C1 Ci)I = (D1 Dj)I et (CI o DI p)
( C1 Ci)I / CI o (D1 Dj)I / DI p
(C1 CV Co Ci)I = (D1 DU Dp Dj)I
CI DI
CD
4. De la mme faon, nous pouvons prouver le quatrime rsultat en inversant la
relation de subsomption.
5. Rs {R1, R2, Rk}/s=1 k, tel que: Rs = ) CV / v = 1 i et Du / u = 1
j, tel que: CV Du
CI V = DI u, (I)
( C1 CV Cn Ci)I ( D1 DU Dm Dj)I
CI DI
C&D
De la mme faon, nous pouvons prouver les autres combinaisons(Rs = or Rs =
or Rs = ).
Dans l'exemple prcdent, nous comparons les deux concepts: algrien_membre et
parent. Dans le concept x, nous avons: les concepts personne et humaine sont similaires, et
dans la base des cas nous avons : les rles ensemble et enfant sont diffrents. En effet, les
concepts Algrien_ membre et parent se superposent (selon la rgle 5).

3.2.4.

La rvision

La rvision des connaissances extraites peut produire des units de connaissances.


Dans notre exemple, on remarque que lapplication de la rgle 1 est possible sur les
concepts: quipe et parent c d: le concept ensemble est le subsumant du concept quipe et
le concept humain est le subsumant des concepts parent. Les concepts: ensemble et humain
sont diffrents. Donc quipe et parent sont aussi diffrents.

82
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

3.2.5.

La mmorisation

Lopration dadaptation gnre de nouveaux cas qui doivent tre rajouts la base
de cas aprs la rvision. Ltape de la mmorisation consiste sauvegarder les nouveaux
cas:
(Rel (humain, homme), )
(Rel (humain, Algrien _membre), )
(Rel (personne, homme), )
(Rel (personne femme), )
(Rel (personne, parent), )
(Rel (parent, Algrien _membre), &) et
(Rel (parent, equipe), ).

Cette mmorisation est implmente comme suit:


[Algerien_ membre]
[homme]
[homme]
[femme]
[parent]

e15
e16
e17

e19

()

()

e14

[Algrien _membre]
[quipe]

e13

()

s13
s14

s15

[humain]

[humain]
[personne]

()

s16

[personne]

()

s17

[personne]

(&)

e18

()

s19

s18

[parent]

[parent]

De la mme faon, nous dduisons les relations smantiques entre les diffrents
autres concepts des deux ontologies O1 et O2.

83
Kolli Manel.

Universit Mentouri Constantine.

Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC

4. Conclusion
La dtection des relations smantiques entre les diffrentes entits smantiques des
ontologies intgrer reprsente le cur du processus d'appariement par ce quelle permet la
construction de la hirarchie de lontologie globale.
Dans ce travail nous avons propos un systme qui permet la dtection de ces
relations pour intgrer des ontologies dcrites en logiques de description. Ce systme est
bas sur le raisonnement partir de cas qui permet la combinaison des relations dj
trouves entre les subsumants des entits smantiques en question pour dtecter les
relations smantiques entre eux. Ici, la dduction de ces relations est faite par l'agrgation
ou la composition des relations des subsumants. Les rsultats obtenus par ces oprations
sont valids par les mcanismes des LDs.
Nous avons utilis dans ce travail les techniques des logiques de descriptions, en
particulier, la subsomption qui a permit la remmoration des cas sources.

84
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Aspects techniques pour


limplantation et tude de cas

85
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

1. Introduction
Aprs avoir effectu la conception de notre systme bas sur un mcanisme
du RPC pour la dtection des relations smantiques entre les entits smantiques des
ontologies, nous allons prsent entamer la ralisation dune partie de ce systme.
Cette implmentation permet de valider la contribution propose en lappliquant dans
une tude de cas approprie.
Dans ce chapitre, nous nous focalisons sur deux principaux axes :
1) Les aspects techniques de limplantation de notre contribution.
2) Lapplication de lopration de composition dans une tude de cas.
Nous commenons par prsenter rapidement les technologies utilises,
savoir, Protg-OWL, lenvironnement de dveloppement et les frameworks
spcialises telle que OWL API pour la gestion de lontologie OWL. Ces aspects sont
importants dans la mise en uvre du prototype de lapplication. Ensuite, nous
prsentons quelques expriences effectues sur deux ontologies relles dcrites en
OWL pour valuer l'efficacit de l'opration de composition, et pour vrifier que la
solution propose renvoi des rsultats complets et prcis. Les rsultats obtenus
semblent trs prometteurs, en comparant avec les mappings d'un expert du domaine.
Le chapitre se termine par une conclusion.

2. Aspects techniques pour limplantation


Avant de commencer limplmentation de lopration de composition que
nous avons propose, nous allons tout dabord spcifier les outils utiliss qui nous ont
sembls tre un bon choix de part les avantages quils offrent.

2.1 Choix de lditeur dontologies


Pour limplmentation de nos ontologies, nous avons opt pour lditeur
dontologies Protg-OWL. Plusieurs raisons ont motiv notre choix :

Protg-OWL est un diteur open source et gratuit.

Protg-OWL permet dimporter et dexporter des ontologies dans les


diffrents langages dimplmentation dontologies (RDF-Schma, OWL,
DAML, OIL,...etc.)

Protg-OWL possde une interface modulaire, ce qui permet son


enrichissement par des modules additionnel (plugins).

86
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Protg-OWL permet ldition et la visualisation dontologies.

Protg-OWL permet le contrle de la cohrence de lontologie par des


vrifications de contraintes.

Protg-OWL est fourni avec une API crite en JAVA, qui permet de
dvelopper des applications pouvant accder aux ontologies de Protg et de
les manipuler (voir annexe).

2.2 Langage de programmation et frameworks spcialises


La programmation en JAVA ncessite seulement le compilateur et la machine
virtuelle associe (groups dans le SDK). Cependant il est vivement recommand
dutiliser un environnement de dveloppement qui assiste le dveloppeur et facilite le
codage. Plusieurs environnements sont disponibles pour le langage JAVA (plus de 20
environnements). Toutefois, il existe trois principaux acteurs : Code Gear JBuilder
qui est payant, SUN NetBeans et IBM Eclipse for JAVA qui sont libres.
Notre choix est port sur Eclipse for Java. En fait, Eclipse est un
environnement complet avec des possibilits dextension normes via les composants
extensibles (Plug-ins).
Eclipse possde de nombreux points forts qui sont l'origine de son norme
succs dont les principaux sont :

Support de plusieurs plateformes dexcution: Windows, Linux, Mac OS X, ...

Une plate-forme ouverte pour le dveloppement d'applications et extensible


grce un mcanisme de plug-ins.

Plusieurs versions d'un mme plugin peuvent cohabiter sur une mme
plateforme.

Un support multi langage grce des plug-ins ddis : Cobol, C, PHP, C#, ...

Malgr son criture en Java, Eclipse est trs rapide l'excution grce
l'utilisation de la bibliothque SWT (Standard Widget Toolkit) est dvelopp
en Java par IBM en utilisant au maximum les composants natifs fournis par le
systme d'exploitation sous jacent.

Un historique local des dernires modifications.

Une excution des applications dans une JVM ddie slectionnable avec
possibilit d'utiliser un dbogueur complet (points d'arrts conditionnels,

87
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

visualiser et modifier des variables, valuation d'expression dans le contexte


d'excution, changement du code chaud avec l'utilisation d'une JVM 1.4, ...)

Propose le ncessaire pour dvelopper de nouveaux plug-ins.

La plate-forme est entirement internationalise dans une dizaine de langue


sous la forme d'un plug-in tlchargeable sparment.

Les framesworks spcialises sont celles qui apportent des fonctionnalits


spcifiques dans un contexte particulier. Elles peuvent tre livres ou non avec le
langage utilis. Dans notre cas, nous avons besoin de deux frameworks, La premire
pour la gestion des ontologies et la deuxime pour la vrification de lontologie de
lalignement. Dans ce travail, on utilise la framework OWL API (OWL API 2010) et
le raisonneur FaCT++.
Nos ontologies sont implmentes en langage OWL (ontology Web
Language), or les fichiers OWL sont inexploitables en tat brut car leur structure est
trs complexe. Donc pour pouvoir lexploiter il nous a fallu un traducteur capable
de traduire les balises et la smantique vhicule par le fichier OWL en objet
manipulable par des programmes.
Un API (Application Programming Interface) est une interface de
programmation d'application, un jeu de fonctions ou de mthodes, utilis pour accder
certaines fonctionnalits. Cette interface permet d'accder aux services d'une
application depuis un langage de programmation (et non pas travers une interface
utilisateur traditionnelle). Un OWL API est donc une interface fournissant des
fonctionnalits traitant le OWL.
OWL API propose les oprations ncessaires pour la cration, la modification
et linterrogation de lontologie. OWL API supporte les ontologies en OWL, ce qui
motive son utilisation dans notre implmentation.
Un autre avantage de OWL API est le mcanisme de raisonnement intgr. Il
permet de profiter de laspect smantique de lontologie OWL en exploitant les
relations smantiques de ce dernier.
Pour la vrification de lontologie de lalignement, il existe diffrentes
implantations du raisonnement au travers d'outils performants. Nous avons choisi le
moteur d'infrence FaCT (Fast Classification of Terminologies) qui est un nouveau
raisonneur LD conu par des chercheurs de l'universit de Manchester (Royaume-Uni)
pour fournir une plate-forme d'exprimentation de nouveaux algorithmes d'aide la
dcision. Il utilise la mthode des tableaux et comprend deux raisonneurs, l'un base
sur la logique de description SHIF et l'autre base sur SHIQ. FaCT++ est une nouvelle
version de FaCT implante en C++.

88
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

3. Etude de cas
Afin de motiver nos recherches dun point de vue pratique, nous proposons
dappliquer l'opration de composition dans une tude de cas approprie. La suite de
cette section dcrit le fonctionnement rel dune application ddie lintgration des
ontologies dcrites en logique de descriptions.
Nous avons choisi deux parties de deux ontologies qui sont du mme domaine
pour pouvoir reprsenter les cas spciaux, afin de prsenter une tude de cas qui
concrtise la mthode propose.

3.1. Prsentation de ltude de cas


Dans cette section, nous effectuons une mise en uvre de l'opration de
composition sur deux ontologies O1 et O2 (figures 4.1 et 4.2). Ces ontologies sont
mises en uvre avec l'diteur d'ontologie bien connu: protegeOWL version 4.1_beta.

89
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Figure 4.1 La hirarchie des concepts de l'ontologie O1 avec Protg OWL

90
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Figure 4.2 La hirarchie des concepts de l'ontologie O2 avec Protg OWL


Comme nous lavons dj montr dans le chapitre 3, notre systme doit tre
utilis avec des cas connus afin d'instancier la base des cas (l'ontologie de
lalignement OA) et fournir une base de raisonnement. Pour faire a, nous prenons les
entits dfinies des ontologies O1 et O2, qui sont: les concepts: humain, femelle et
adulte de O1 et les concepts: personne, mle, mineur et ensemble de O2. Nous les
comparons avec la distance smantique.
Les rsultats de la comparaison sont comme suit :
[personne]
[ensemble]
[ensemble]
[mle]

()

e1

()

e2

e3

e4

s1

()

s2

[humain]
[femelle]

s3

()

[humain]

s4

[femelle]

91
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

[mineur]
[ensemble]

()

e5

e6

()

[adulte]

s5

s6

[adulte]

Ainsi, ces cas sont mis en uvre avec Protg OWL, comme suit (figure 4.3
et 4.4):

Figure 4.3 La hirarchie des concepts de l'ontologie OA avec Protg OWL

92
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Figure 4.4 La traduction des cas de l'ontologie OA avec le raisonneur FaCT++.

4. Prototype
Le prototype que nous avons implmente dcoule de l'algorithme suivant
(Kolli et Boufaida 2011):

Algorithme 1: Composition des relations smantiques.

Donnes :
1) O1 et O2 : deux ontologies aligner
2) OA : ontologie initiale dalignement
Rsultat : OA : ontologie finale dalignement

dbut
/* parcours des classes de lontologie O1 */
pour chaque (cls1 O1) faire {

93
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

/* lire les subsumants de cls1*/


pour chaque (sup1 super_class(cls1)) faire{
/* parcours des classes de lontologie O2 */
pour chaque (cls2 O2) faire {
/* lire les subsumants de cls2*/
pour chaque (sup2 super_class(cls2)) faire {
LIRE les dfinitions des concepts sup1 et sup2 dans lontologie OA
si (sup1 est quivalentes sup2) alors {
/* Ajouter cls1 comme subsum de sup2 et cls2 comme subsum de sup1
OA*/
AJOUTER((cls1, sup2), ), OA)
AJOUTER((cls2, sup1), ), OA)
}
Sinon {
Si (sup1 est diffrentes sup2) alors {
/* cls1 et cls2 sont diffrentes*/
AJOUTER((cls1, cls2), ), OA)
}
Sinon {
Si (sup1 est superpos avec sup2) alors
/* cls1 et cls2 sont superposes */
AJOUTER((cls1, cls2), &), OA)
}
Sinon {
Si (sup1 est subsum par sup2) alors
/* cls1 est subsum par sup2 */
AJOUTER((cls1, sup2), ), OA)
}
Sinon {

94
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Si (sup2 est subsum par sup1) alors


/* cls2 est subsum par sup1 */
AJOUTER((cls2, sup1), ), OA)
}
Retourner (OA)
}}}}
fin
Lalgorithme 1 permet de composer les relations smantiques entre des
concepts pour dduire de nouvelles relations smantiques entre dautres concepts de
deux ontologies. Il prend en entre les deux ontologies O1 et O2 aligner, dcrites en
LDs, ainsi que lontologie dalignement initiale OA, et donne en retour lontologie
dalignement finale OA. Il prend deux concepts cls1 et cls2 qui appartiennent
respectivement, aux ontologies O1 et O2. Il extrait leurs subsumants respectivement
sup1 et sup2. Puis, selon la relation entre sup1 et sup2 dfinie dans lontologie
dalignement OA, il dduit la relation entre cls1 et cls2, en respectant la table 3.1 du
chapitre 3. En fin, il ajoute le cas rsultant lontologie OA.
Dans ce qui suit, nous prsentons une partie du programme de composition
(table 4.1), qui met en uvre le cas: ((C1 C2 et C2 C3) (C1 C3)) de la table 3.1
du chapitre prcdant. L'interprtation de ce cas est comme suit: si le concept C3 est
subsum par le concept C2 et ce dernier est similaire au concept C1 alors : C3 est aussi
subsum par le concept C1.
Etant donn deux ontologies O1 et O2 comparer, notre programme de
composition mis en uvre en langage : OWL API utilise lontologie OA pour dduire
le relations smantiques entre les diffrents concepts des deux ontologies O1 et O2.
Table 4.1 : Une partie du programme de lopration de composition.

Program 1.

for(OWLClass cls1 : O1.getReferencedClasses())


{

95
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Set<OWLDescription> superc = cls1.getSuperClasses(O1);

for(OWLDescription desc : superc)


{

for(OWLClass cls2 : O2.getReferencedClasses())


{

Set<OWLDescription> superc2 = cls2.getSuperClasses(O2);

for(OWLDescription desc2 : superc2)


{

for(OWLClass cls : OA.getReferencedClasses())


{

if ( cls == desc )
{

Set<OWLDescription> equi = cls.getEquivalentClasses(OA);

10

for(OWLDescription descequi : equi)


{

11

if ( descequi == desc2)
{

12

OWLClass clsA = factory.getOWLClass(URI.create(OAURI+"#"+cls1));

13

OWLClass clsB = factory.getOWLClass(URI.create(OA URI+"#"+cls2));

14

OWLAxiom axiom = factory.getOWLSubClassAxiom(clsB, cls);

15

OWLAxiom axiom1 = factory.getOWLSubClassAxiom(clsA, cls);

16

AddAxiom addAxiom = new AddAxiom(OA, axiom);

17

AddAxiom addAxiom1 = new AddAxiom(OA, axiom1);

18

manager.applyChange(addAxiom);

19

manager.applyChange(addAxiom1);

20

manager.saveOntology(OA);
}
}

96
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Le programme 1 fonctionne de la manire suivante: il prend deux classes des


ontologies O1 et O2 respectivement, cls1 et cls2 en utilisant la fonction:
getReferencedClasses () (voir les linges 1 et 4 du programme 1). La fonction:
GetSuperClasses() (voir les deux lignes 2 et 5) permet d'extraire pour chaque classe,
ses subsumants. Ensuite, le programme 1 vrifie si les subsumants de la classe cls1
sont quivalents aux subsumants de la classe cls2 en appliquant la fonction
getEquivalentClasses () sur les dfinitions des subsumants de ces deux classes dans
lontologie OA (voir, la ligne 9).
Aprs avoir vrifi l'quivalence des subsumants, programme 1 ajoute cls1
comme subsum des subsumants de la classe cls2 et ajoute cls2 comme subsum des
subsumants de la classe cls1 la dfinition de ces subsumants dans l'ontologie
dalignement OA en utilisant l'axiome: OWLSubClassAxiom (voir les lignes 11 jusqu
20).
Dans l'exemple prcdent, les concepts: femme, homme, fille, garon, parent,
grand pre, grande mre et vielle dame sont subsums par le concept: humain et les
concepts: algrien, homme et femme sont subsums par le concept: personne.
Selon l'ontologie OA (figure 4.4), les concepts : personne et humain sont
quivalents. En effet, les subsums du concept personne sont les subsums du concept
humain et vice versa. Ainsi, le concept personne subsume les concepts: femme,
homme, fille, garon, parent, grand pre, grande mre et vielle dame et le concept
humain subsume les concepts: algrien, homme et femme.
Comme nous l'avons dj mentionn, les rsultats du programme de
composition sont mmoriss dans l'ontologie dalignement OA. Ainsi, aprs
l'excution du programme 1 sur notre exemple, l'ontologie OA sera comme suit (figure
4.5):

97
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Figure 4.5 La hirarchie des concepts de l'ontologie OA obtenue aprs l'excution du


programme de composition.

5. Test et vrification
En ce qui concerne la mthode de test, pour valuer la qualit des rsultats de
lappariement, toutes les paires d'entits smantiques ont t apparies manuellement
pour avoir des mappings de l'expert. Les rsultats gnrs par notre programme ont
t compars avec les mappings de l'expert. La fentre gauche (Figure 4.6) montre
les cas des mappings dduits aprs lexcution du programme de composition. On

98
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

peut aussi dire que notre ontologie est valide puisque tous les cas sont identiques aux
mappings de lexpert.
Nous constatons que les entits portant sur les cas prsents dans la table 3.1
sont bien apparies. Cette comparaison, bien que prliminaires, montre l'efficacit de
notre approche.
La vrification de la cohrence de notre ontologie dalignement OA a t
effectue grce au raisonneur FACT++ disponible sur protegeOWL. Lapplication de
ce raisonneur permet de dtecter les moindres anomalies et les incohrences de la
hirarchie de lontologie.
FACT++ est un classificateur, il permet la classification des concepts selon
leur dfinition en se basant sur les logiques de descriptions. En effet, il permet aussi le
test de classification. Comme le montre la fentre droite, la hirarchie des classes de
OA dduite par FACT++ est identique la hirarchie des concepts de OA aprs
lexcution de notre programme (Figure 4.5).

99
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

Figure 4.6 La hirarchie des concepts de l'ontologie OA obtenue aprs l'excution du


raisonneur FaCT++.

100
Kolli Manel.

Universit Mentouri Constantine.

Aspects techniques pour limplantation et tude de cas

6. Conclusion
Dans ce chapitre, nous avons prsent les aspects techniques utiliss dans
notre approche, et lapplication de cette dernire dans une tude de cas.
Nous avons commenc par prsenter les aspects dimplmentation qui sont
utiliss dans notre travail. Limplantation repose essentiellement sur protegeOWL
pour ldition des ontologies, le langage JAVA et lenvironnement Eclipse pour le
codage, OWL API pour la gestion et linterrogation des ontologies OWL et FaCT++
pour la validation de lontologie dalignement.
Par la suite, nous avons appliqu lopration de composition dans une tude
de cas et les rsultats semblent trs prometteurs, en comparant avec les mappings
d'experts. A travers cette tude de cas, nous pouvons remarquer lapport de notre
contribution, en assurant une intgration smantique des ontologies base sur les
techniques des logiques descriptions.

101
Kolli Manel.

Universit Mentouri Constantine.

Conclusion gnrale

Conclusion gnrale

Lutilisation dontologies pour le Web Smantique entrane un besoin de


techniques de gestion de ces ontologies, notamment pour les intgrer. Le domaine de
lintgration des ontologies est trs vaste et ncessite normment de concentration et
dapprofondissement.
Le problme principal de tous les travaux sur l'interoprabilit porte sur la
comparaison et le mapping des diffrentes ontologies. Etant donne la nature
dcentralise du dveloppement du Web, le nombre d'ontologies est trs important.
Nous pouvons trouver plusieurs ontologies qui dcrivent soit des domaines
semblables, mais avec l'utilisation de terminologies diffrentes, soit des domaines
complmentaires. Pour intgrer les donnes des ontologies distinctes, nous devons
connaitre les correspondances smantiques entre leurs lments.
La dtection des relations smantiques entre les diffrentes entits
smantiques des ontologies intgrer reprsente le cur du processus de lintgration
par ce quelle permet les changes de manire smantique des connaissances.
Cette thse investit le domaine de lintgration des ontologies dans le domaine
lingnierie des connaissances et du Web smantique. Notre objectif a t de tirer
profit des travaux mens notamment dans le domaine de linteroprabilit smantique
des connaissances, dans le but d'intgrer des ontologies et galement daccder des
ressources distantes de faon transparente. Le rsultat de notre travail est un systme
originale d'intgration des dontologies.
Dans la suite de cette section, nous allons rsumer la contribution apporte,
les limitations de notre systme et donner quelques perspectives pour les travaux
futurs.

1. Contributions
Dans ce contexte, plusieurs contributions ont t dveloppes :

102
Kolli Manel.

Universit Mentouri Constantine.

Conclusion gnrale

La dtection des relations smantiques entre les diffrentes entits


smantiques des ontologies

Dans ce travail nous avons propos un systme qui permet la dtection


des relations smantiques entre les diffrentes entits smantiques pour intgrer
des ontologies dcrites en logiques de description. Ce systme est bas sur outil
fiable qui est : le raisonnement partir de cas.
Lutilisation de ce mcanisme ici permet la combinaison des relations
dj trouver entre les subsumants des entits smantiques en question pour
dtecter les relations smantiques entre ces entits.
Nous avons utilis dans ce travail les techniques dextraction de
connaissances dans des bases de donnes (ECBD) et les techniques des logiques
de descriptions, en particulier, la subsomption et la classification qui ont
permettent la remmoration des cas sources.

La formalisation de lappariement des ontologies avec les logiques


de descriptions

Ce travail propose une nouvelle approche formelle pour rsoudre le


problme de l'appariement des ontologies. Cette approche est base sur les
techniques de logiques de descriptions et la distance smantique pour la dtection
des relations smantiques entre les entits smantiques de deux ontologies
diffrentes.
Ici, la dduction de ces relations est faite par l'agrgation ou la
composition des relations des subsumants. Les rsultats obtenus par ces
oprations sont valids par les mcanismes des DLs.

Limplantation et ltude de cas.

Nous avons prsent les diffrents aspects techniques qui sont utiliss
dans limplantation de notre application. Ces aspects sont principalement, le
langage Java et lenvironnement Eclipse pour le codage, OWL API pour la gestion
et linterrogation des ontologies OWL et FaCT++ pour la validation de lontologie
dalignement. Par la suite, nous avons appliqu lopration de composition dans
une tude de cas et les rsultats semblent trs prometteurs, en comparant avec les
mappings d'experts. A travers cette tude de cas, nous pouvons remarquer lapport
de notre contribution, en assurant une intgration smantique des ontologies base
sur les techniques des logiques descriptions.

103
Kolli Manel.

Universit Mentouri Constantine.

Conclusion gnrale

2. Perspectives
Les travaux proposs dans cette thse nous permettent douvrir plusieurs
perspectives dont on peut citer :

Passage lchelle

Les exprimentations menes jusqu pressent ont port sur des


ontologies de taille relativement modeste. Il est important dvaluer nos
propositions sur des ontologies de tailles plus ralistes (plusieurs centaines de
concepts).

Problme dhtrognit du langage dontologie

Nous pouvons pallier ce problme en traduisant toutes les ontologies dans


un langage possdant lexpressivit de tous les autres (il sagit dans notre cas des
logiques de descriptions).

Le dveloppement de l'tape de maintenance

Notre orientation principale des travaux futurs est certainement: le


dveloppement de l'tape de maintenance en appliquant les techniques
d'apprentissage des connaissances afin de permettre le systme propos d'effectuer
seul les oprations de maintenance.

Implantation du systme propos

Afin dvaluer et valider la contribution prsente dans ce mmoire, une


phase d'implmentation tout le systme propos savre indispensable. Cette
phase a pour objectif d'tudier les performances de notre systme de mapping et
de montrer ses avantages. En outre, ceci nous permettra aussi didentifier les
contraintes et les insuffisances de notre systme.

104
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Bibliographie

105
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Bibliographie

ACM. 2009. Association for Computing Machinery. http://www.acm.org/


Aleksovski Z., Klein M., Kate W. T., Harmelen F. V., 2006. Matching
Unstructured Vocabularies using a Background Ontology, 15th
International Conference on Knowledge Engineering and Knowledge
Management, Hong Kong, China, pp. 182-197.
Amardeilh F., 2007. Web Smantique et Informatique Linguistique : propositions
mthodologiques et ralisation dune plateforme logicielle. Thse de
doctorat, Universit Paris X Nanterre.
Angele J. et Schnurr H., 2005. Do not use this gear with a switching lever!
automotive industry experience with semantic guides. In GI Jahrestagung,
pages 48 52.
Bach T. L., Dien-Kuntz R. et Gandon F., 2004. On Ontology Matching Problems for Building a Corporate Semantic Web in a Multi-Communities
Organization, Proceedings of ICEIS, Porto, Portugal, pp. 236-243
Bach T. L., 2006. Construction dun web smantique multi-points de vue. Thse
de PhD, cole des Mines de Nice Sophia Antipolis.
Bachimont B., 2000. Engagement smantique et engagement ontologique :
conception et ralisation d'ontologies en ingnierie des connaissances.
Ingnierie des connaissances. volution Rcentes et nouveaux dfis Paris:
Eyrolles, France, pp. 305-323.
Barwise J. et Seligman J., 1997. Information Flow: The Logic of Distributed
Systems. Cambridge University Press, Number 44.
Berners-Lee T., 1999. Weaving the Web. Harper, San Francisco.

106
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Berners-Lee T., Hendler J. et Lassila O., 2001. The semantic web: A new form of
web content that is meaningful to computers will unleash a revolution of
new possibilities. Scientific American, 3: 3543.
Bennacer
N.
et
Aufaure
M.,
www.supelec.fr/d2ri/RR_06_07/RR_06_07_Chap7.pdf

2006.

Blzquez M., Fernndez M., Garca-Pinar J. M. et Gmez p. A., 1998. Building


Ontologies at the Knowledge Level using the Ontology Design
Environment. http://ksi.cpsc.ucalgary.ca/KAW/KAW98/blazquez/
Bouquet P., Giunchiglia F., Harmelen F., Serafini L. et Stuckenschmidt H., 2004.
Contextualizing ontologiesstar, open. Web Semantic: Science, Services and
Agents on the World Wide Web, 1:325343.
Borst W. N., 1997. Construction of Engineering Ontologies. Thse de doctorat,
Center for Telematica and Information Technology, Universit de
Tweenty, Enschede.
Bray T., Paoli J. et Sperberg-McQueen C., 2000. Extensible Markup Language
(XML) 1.0. http://www.w3.org/TR/REC-xml.
Breslin J., Harth A., Bojars U. et Decker S., 2005. Towards SemanticallyInterlinked Online Communities. Lecture Notes in Computer Science,
3532: 500514.
Bruijn J., Ehrig M., Feier C., Recuerda F. M., Scharffe F. et Weiten M., 2006.
Semantic Web Technologies, trends and research in ontology-based
systems, chapter Ontology Mediation, Merging, and Aligning, WILEY, pp.
95113.
Buchheit M., Donini F., et Shaerf A., 1993. Decidable reasoning in terminological
knowledge representation systems. Journal of Artificial Intelligence
Research, 1: 109138.
Caracciolo C., J. Euzenat, L. Hollink, R. Ichise, A. Isaac, V. Malais et al., 2008.
Results of the Ontology Alignment Evaluation Initiative 2008.
www.dit.unitn.it/~p2p/OM-2008/oaei08_paper0.pdf
Charlet J., Bachimont B. et Troncy R., 2004. Ontologies pour le Web Smantique.
Srie de la Revue Information - Interaction - Intelligence (I3), 4 : 96-100.

107
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Charlet J., B. Bachimont et R. Troncy, 2005. Le Web smantique, vol. 4 of Hors


srie de la revue Information - Interaction - Intelligence, Cpadus, 4 : 720.
Chawk M., 1996. Modle de graphes conceptuels et reprsentation smantique du
langage
naturel.
www.revuetexto.net/marges/marges/Documents%20Site%206/doc0004_chawk_m/gra
phc.pdf
Corcho O., Fernandez-Lopez M. et Gomez P. A., 2002. OntoWeb Technical
Roadmap, Version 1.0. http://www.ontoweb.org.
Corcho O., Fernandez-Lopez M. et Gomez-Prez A., Methodologies, 2003. tools
and languages for building ontologies : Where is their meeting point ?.
Data & Knowledge Engineering, Elsevier, 46: 41-64.
Cordier A. Fuchs B. et Mille A., 2006. De lIngnirie lApprentissage des
connaissances
dadaptation
en
Raisonnement

Partir
de
Cas,http://www.sdc2006.org/cdrom/contributions/Cordier_et_al_IC06.pdf
Cullot N. et F. Jouanot, 2003. Context Comparison for Object Fusion. The 15th
Conference on Advanced Information Systems Engineering CAiSE03.
Klagenfurt/Velden, Austria, pp. 536-551.
DAquin M., 2006. Raisonnement partir de cas dcentralis pour le Web
smantique. http://hal.inria.fr/docs/00/06/57/13/PDF/daquin-final.pdf
DAquin M., F. Badra, S. Lafrogne, J. Lieber, A. Napoli et L. Szathmary, 2006.
Adaptation Knowledge Discovery from a Case Base. Proceedings of the
17th European Conference on Artificial Intelligence (ECAI-06). Trento,
Italy, pp. 795796.
Delteil A., 2002. Reprsentation et apprentissage de concepts et dontologies pour
le Web Smantique. Thse de doctorat, universit de Nice Sophia Antipolis
(UNSA).
Djaghloul Y., 2007. Intgration des ressources Web dans un environnement P2P,
base sur les ontologies et la gestion de la confiance. Thse de doctorat,
Universit Mentouri de constantine.

108
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Dieng R., Corby O., Gandon F., Giboin A., Golebiowska J., Matta N. et Ribire
M., 2001. Mthodes et outils pour la gestion des connaissances : une
approche pluridisciplinaire pour le knowledge management, 2me dition,
Paris: Dunod.
Doan A., Madhavan J., Domingos P. et Halevy A., 2003. Ontology matching: A
machine learning approach. Handbook on Ontologies in Information
Systems. Springer-Velag.
Doan A., J. Madhavan, P. Domingos et A. Halevy, 2002. Learning to map between
ontologies on the semantic web. Proceedings of the Eleventh International
World Wide Web Conference. Hawaii, USA, pp. 662-673.
Dou D., Mcdermott D. et Qi P., 2002.Ontology translation by ontology merging
and
automated
reasoning.
http://cswww.cs.yale.edu/homes/dvm/papers/DouMcDermottQi02.pdf
Ehrig M. et Staab S., 2004. Qom quick ontology mapping. International Semantic
Web Conference (ISWC2004), Japan, pp. 683-697.
Elbyed A., 2009. ROMIE, une approche dalignement dontologies base
dinstances. Thse de doctorat de lINSTITUT NATIONAL DES
TELECOMMUNICATIONS dans le cadre de lcole doctorale S&I en coaccrditation avec lUNIVERSITE DEVRY-VAL DESSONNE.
Euzenat J., M. Mochol, P. Shvaiko, H. Stuckenschmidt, O. Svab, V. Svatek et al.,
2006. First results of the ontology alignment evaluation initiative 2006.
Proceedings of the ISWC workshop on Ontology Matching. Athens,
Greece, pp. 73-95.
Euzenat J., Isaac, C. Meilicke, P. Shvaiko, H. Stuckenschmidt, O. Svab et al.,
2007. Results of the Ontology Alignment Evaluation Initiative 2007.
International Semantic Web Conference 2007. Busan, Korea.
Fensel D., Horrocks I., van Harmelen F. et De S., 2000. Oil in a nutshell. In
Proceedings of European Knowledge Acquisition Workshop
(EKAW2000), 1937: 1-16.
Frst F., 2002. L'ingnierie Ontologique. Rapport de recherche, Institut de
Recherche en Informatique de Nantes, France.

109
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Galle L., 2002. Etat de lart: Ontologies et Intgration/Fusion dontologies,


casanuestra.free.fr/ontologie_fusion_lortal.pdf
Giunchiglia F., Sshvaiko P. et yatshevich M., 2005. S-match: an algorithm and an
implementation of semantic matching. Semantic Interoperability and
Integration conference, Schloss Dagstuhl, Germany,pp. 347-365.
Gomez P.A., 1999. Dveloppements rcents en matire de conception, de
maintenance et dutilisation dontologies. 3mes rencontres Terminologie
et intelligence artificielle TIA. 19 :9-20.
Gmez P. A., 1999a. Ontological Engineering: A state of the art. Expert Update, 2:
33-43.
Gmez

P.
A.,
1999b.
Tutorial
http://www.dsv.su.se/ijcai-99/

on

Ontological

Engineering.

Gomez P. A. et Benjamins V.R., 1999. Overview of Knowledge Sharing and


Reuse Components: Ontologies and Problem-Solving Methods.
http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-18/.
Guarino N., et Giaretta P., 1995. Ontologies and Knowledge Bases: Towards a
Terminological Clarification. In Towards Very Large Knowledge Bases:
Knowledge Building and Knowledge Sharing, Mars N. J. I., Amsterdam:
IOS Press. pp. 2532.
Guarino N., 1997. Semantic Matching: Formal Ontological Distinctions for
Information Organization, Extraction, and Integration. In Information
Extraction: A Multidisciplinary Approach to an Emerging Information
Technology. Springer Verlag, pp. 139-170.
Guarino N., 1997a. Understanding, building and using ontologies. International J.
Human-Computer Studies, 46: 293-310.
Guarino N., 1997b. Some organizing principles for a unified top-level ontology.
AAAI Spring Symposium on Ontological Engineering. Stanford, CA, pp.
57-63.
Gruber T., 1992. "Ontolingua: A mechanism to SupportPortable Ontologies".
http://www-ksl.stanford.edu/knowledgesharing/papers/README.html#ontolingua-long

110
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Gruber T., 1993. A translation approach to portable ontology specifications.


Knowledge Acquisition Journal. 5:199 -220.
Gruber T. et Olsen G.R., 1994. An ontology for enginering mathematics.
Proceedings of the 4th International Conference on Principles of
Knowledge Representation and Reasonning. Bonn, Germany, Morgan
Kaufmann, pp. 258-269.
Hage W., Katrenko S. et Schreiber G., 2005. A Method to combine Linguistic
Ontology-Mapping Techniques, International Semantic Web Conference,
Sardinia, Italy, pp. 732-744.
Hendler J. et Mcguinness D., 2001. The Darpa Agent Markup Language.
http://www.daml.org.
Hernandez N., 2005. Ontologies de domaine pour la modlisation du contexte en
recherche d'information. Thse de doctorat, universit Paul Sabatier de
Toulouse.
Horrocks I., 1998. The FaCT system. Proceding of the 2nd Int. Conf. on Analytic
Tableaux and Related Methods (TABLEAUX'98), Lecture Notes in
Artificial Intelligence, 1397: 307-312.
Inaba A., Supnithi T., Ikeda M., Mizoguchi R. et Toyoda J. 2000. An Overview of
Learning Goal Ontology. Proceeding of ECAI2000 Workshop on Analysis
and Modelling of Collaborative Learning Interactions. Berlin, Germany,
pp. 23-30.
Jenhani, O., 2003. Ontologies pour le WEB: relations, construction dontologies et
mthodes de raisonnement pour la gnration de langue naturelle. Rapport
ARC INRIA GeNI, France.
Jin L., Chen W., Hayashi Y., Ikeda M., Mizoguchi R., Takaoka Y. et Ohta M.
1999. An Ontology-Aware Authoring Tool - Functionalstructure and
guidance generation. Proceedinf of AIED1999, Le Mans, France, pp. 85
92.
Kalfoglou Y. et Schorlemmer M., 2003. If-map: an ontology mapping method
based on information flow theory. Journal on Data Semantics, 1:98127.

111
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Kassel G., 2002. OntoSpec : une mthode de spcification semi-informelle


dontologies. In Actes des journes francophones dIngnierie des
Connaissances, Rouen, France, pp. 75-87.
Kavouras M., 2003. A unified ontological framwork for semantic integration.
International Workshop on Next Generation Geospatial Information,
Cambridge,
UK,
http://www.ntua.gr/ontogeo/publications/bostonkavouras.pdf
Kifer M., Lausen G. et Wu J., 1995. Logical foundations of object-oriented and
frame-based languages. In Journal of the ACM. 42:741-843.
Klein M., 2001. Combining and relating ontologies: an analysis of problems and
solutions, International Joint Conferences on Artificial Intelligence
(IJCAI), Workshop on Ontologies and Information Sharing, Seattle, USA,
pp. 53-62.
Knowledge W., 2004. KnowledgeWeb, Deliverables of KWEB Project.
http://knowledgeweb.semanticweb.org/.
Kolli M. et Boufaida Z., 2004. A Method for the Integration of Ontologies in the
Semantic Web. Arab conference international of technology (ACIT2004).
Constantine, Algeria, pp. 665.
Kolli, M. et Z. Boufaida, 2009. Detecting semantic relations among ontologies
with a CBR system. Proceedings of the IADIS International Conference on
Applied Computing, Rome, Italy, pp. 361-368.
Kolli, M. et Z. Boufaida, 2010. A description logics formalization for the ontology
matching. Proc. Comput. Sci., ELSEVIER, 3: 29-35.
Kolli, M. et Z. Boufaida, 2011. Composing semantic relations among ontologies
with a description logics. Information Technology Journal, 10 : 1106-1112.
Kolodner J., 1998. Case-Based Reasoning. Proceeding of the European Workshop
on Case-Based Reasoning, EWCBR98. Dublin, Ireland, pp. 172-183.
Laublet P., Reynaud C. et Charlet J., 2002. Sur quelques aspects du Web
smantique. Actes des deuximes assises du GdR 13. Universit de ParisSorbonneCNRS (LaLICC), Universit Paris-Sud CNRS (L.R.I.) &
INRIA (Futurs),

112
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Leake B., A. Kinley et D. Wilson, 1997. Case-based similarity assessment:


Estimating adaptability from experience. Fourteenth National Conference
on Artificial Intelligence. Menlo Park, California, pp. 674-679.
Lopez V., Motta E. et Uren V., 2006. Next Generation Semantic Web
Applications. First Asian Semantic Web Conference (ASWC), Beijing,
China, pp. 24-29.
Maedche A., Motik B., Silva N. et Volz R., 2002. MAFRA - A Mapping
Framework for Distributed Ontologies. In Proc. of 13th European
Conference on Knowledge Engineering and Knowledge Management
(EKAW), Siquenca, Spain, pp. 60-68.
Maedche A., 2002. Ontology Learning for the Semantic Web. Boston: Kluwer
Academic Publishers.
McGuinness D., Fikes R., Rice J. et Wilder S., 2000. The chimaera ontology
environment.
http://ksl.stanford.edu/people/dlm/papers/dmcguinnessaaai00-camera-ready-withcitation.doc.
Mellal N., 2007. Ralisation de linteroprabilit smantique des systmes, base
sur les ontologies et les flux dinformation. Thse pour obtenir le grade de
DOCTEUR DE LUNIVERSIT DE SAVOIE.
Miller G., 1990. Nouns in WordNet: A Lexical Inheritance System, International
Journal of Lexicography . 4: 245-264.
Minsky M., 1975. A Framework for Representing Knowledge. The Psychology of
Computer vision, New York, USA, pp. 211-277,
Mizoguchi R. et Ikeda M., 1996. Towards Ontological Engineering. Technical
Report AI-TR-96-1, I.S.I.R., Osaka University, Japan.
Mizoguchi R., 1998. A Step Towards Ontological Engineering. www.
ei.sanken.osaka-u.ac.jp/english/step-onteng.html
Mizoguchi R., Kozaki K., Sano T. et Kitamura Y. 2000. Construction and
Deployment of a Plant Ontology. The 12th International Conference,
EKAW2000, Juan-les-Pins, France, pp. 113-128.

113
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Napoli

A., 1997. Une introduction


http://www.inria.fr/rrrt/rr-3314.html

aux

logiques

de

descriptions.

Neeches R., Fikes R. E., Finin T., Gruber T. R., Senator T. et Swartout W. R.,
1991. Enabling technology for knowledge sharing. AI Magazine. 12: 3656.
Noy N. et Musen M., 2000. PROMPT: Algorithm and Tool for Automated
Ontology Merging and Alignment. Seventeenth National Conference on
Artificial Intelligence. Austin, Texas, pp. 450455.
Noy N. et Musem M., 2001. Anchor-prompt: Using non-local context for semantic
matching. Workshop on Ontologies and Information Sharing at the
Seventeenth International Joint Conference on Arti.cial Intelligence,
Seattle, WA. pp. 63-70.
Noy N. et Musen M. A., 2002. Evaluating ontology-mapping tools: requirements
and
experience,
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.19.3489.
Noy N., 2004. Semantic Integration : A Survey of Ontology-based Approaches.
http://citeseerx.ist.psu.edu/viewdoc/ download?doi=10.1.1.133.1384
Omelayenko B., 2003. Rdft: A mapping meta-ontology for web service
integration, Knowledge Transformation for the Semantic Web, IOS Press,
Amsterdam, pp. 137153.
OReilly T., 2005. OReilly Network : What Is Web 2.0 : Design Patterns and
Business Models for the Next Generation of Software.
http://www.oreillynet. com/lpt/a/6228.
OWL

API
version
3.0.0,
http://sourceforge.net/projects/owlapi/files/OWL
2.0%29/3.0.0/owlapi-3.0.0.zip/download

28/01/
API %28for

2010,
OWL

Patel-Schneider P. F. et Horrocks I., 2004. Web ontology language (OWL)


abstract syntax and semantics. http://www.w3.org/TR/2004/REC-owlsemantics-20040210/syntax.html.
Passant A., 2009. Technologies du Web Smantique pour lEntreprise 2.0.
www.theses.paris4.sorbonne.fr/these.passant.pdf

114
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Pinto H., Gmez-Prez A. et Martins J., 1999. Some Issues on Ontology


Integration. Proceedings of the IJCAI-99 workshop on Ontologies and
Problem-Solving Methods (KRR5), Stockholm, Sweden, pp. 1-12.
Psych

V., Mendes O. et Bourdeau J.,


lemans.fr/num/vol2003/psyche06s/sticef_2003_psyche_06s.htm#Heading56

2003.

http://sticef.univ-

Psych V., 2007. Rle des ontologies en ingnierie des EIAH : Cas dun systme
dassistance au design pdagogique. Thse de doctorat, Universit du
Qubec, Canada.
Rahm E. et Bernstein P., 2001. A survey of approaches to automatic schema
matching. The VLDB Journal, 10:334350.
RDF. Resource Description Framework Model and Syntax Specification. http:
//www.w3.org/TR/REC-rdf-syntax/, 1999.
RDFS. Resource Description Framework Schema Specification 1.0. http:
//www.w3.org/TR/2000/CR-rdf-schema-20000327/, 2000.
Sad

I., 2006. INTEGRATION DES SYSTEMES D'INFORMATION


INDUSTRIELS : Une approche flexible base sur les services smantique,
Thse Pour obtenir le grade de Docteur de lEcole Nationale Suprieure
des Mines de Saint-Etienne.

Shvaiko P. et Euzenat J., 2005. A Survey of Schema-based Matching Approaches,


Journal on Data Semantics. 4 :146-171
Sowa J. 1995a. Top-level ontological categories. International Journal of Human
and Computer Studies, 43: 669-685.
Sowa J. 1995. Distinction, combination, and constraints. Proceedings of the IJCAI
Workshop on Basic Ontological Issues in Knoweldge Sharing, Menlo Park
CA, USA: AAAI Press, pp. 626633.
Staab S. et Maedche A., 2000. Axioms are objects too: Ontology engineering
beyond the modeling of concepts and relations. Research report 399,
Institute AIFB, Karlsruhe.

115
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Stuckensschmidt H., Harmelen F. V., Serafini L., Bouquet P. et Giunchiglia F.,


2004. Using C-OWL for the Alignment and Merging of Medical
Ontologies, Proceedings of the First Int. WS. on Formal Biomedical K. R.
(KRMed), Whistler, Colorado, pp. 8101.
Studer R., Benjamins V. R. et Fensel D., 1998. Knowledge engineering: Principles
and Methods. Data Knowledge Engineering, 25: 161-197.
Stumme G. et Maedche A., 2001. FCA-MERGE: Bottom-up merging of
ontologies. In Proceedings of IJCAI01, Seattle (WA), pp. 225234,
Swartout B., Patil R., Knight K. et Russ T., 1997. Towards Distributed Use of
Large Scale Ontologies. Spring Symposium Series on Ontological
Engineering, Stanford University, CA. pp. 138-138.
Thanh Le B., Dieng-Kuntz R. et F. Gandon F., 2004. On Ontology Matching
Problems (for building a corporate Semantic Web in a multi-communities
organization), 6th International Conference on Enterprise Information
Systems, Porto, Portugal, 14-17.
Uschold M. et Grninger M., 1996. Ontologies: Principles, Methods and
Applications. Journal of Knowledge Engineering Review. 11: 5-33.
Van Heijst G., Schreiber A. et Wielinga B. J., 1997. Using Explicit Ontologies in
KBS Development. International Journal of Human and Computer Studies
/Knowledge Acquisition, 46: 183-292.
Vanwelkenhuysen J. et Mizoguchi R., 1994. Maintaining the workplace context in
a knowledge level analysis. Proceeding of JKAW'94, Hatoyama, Japan, pp.
33-47.
Vanwelkenhuysen J. et Mizoguchi R., 1995. Workplace-Adapted Behaviors:
Lessons Learned for Knowledge Reuse. Proceeding of KB&KS '95.
Enschede, The Netherlands, pp. 270-280.
Web

smantique
et
ontologies
:
notes
de
cours.
2011.
http://www.loria.fr/~coulet/Teaching_files/esial_3_il_plbc_ws_poly.pdf

Wielinga B. et Schreiber A., 1993. Reusable and sharable knowledge bases: A


European perspective. Proceeding of KB & KS'93, Tokyo, Japan, pp. 103115.

116
Kolli Manel.

Universit Mentouri Constantine.

Bibliographie

Zghal S. et S. Ben Yahia, 2007. SODA: Une approche structurelle pour


lalignement
dontologies
OWL-DL.
www.cril.univartois.fr/spip/publications/zghal_etal_JFO07. pdf

117
Kolli Manel.

Universit Mentouri Constantine.

Rsum :
La dtection des relations de similitude entre les entits smantiques (concept
et rle) des ontologies est une des principales difficults rencontres durant le
processus de lintgration des ontologies. Dans le web smantique, ces
ontologies sont dcrites en logiques descriptions. En effet, les entits
smantiques sont organises selon le mcanisme de la subsomption dans leurs
ontologies. La comparaison des concepts pour dduire les relations de
similitude entre eux pourra bnficier des comparaisons de leurs subsumants ou
bien de leurs voisins travers des petites modifications ou bien sans aucune
modification. La rutilisation de la solution dun problme dj rsolu pour
rsoudre un autre problme similaire est le principe du raisonnement partir de
cas (RPC). Dans ce travail nous proposons un systme bas sur le RPC
pour la dtection des relations de similitude entre les entits smantiques des
ontologies qui distingue plusieurs phases : la phase de conception, la phase de
production et la phase de maintenance.

Mots cls
Ontologies, relations smantiques, web smantique, mapping, raisonnement
partir de cas, subsomption, entits smantiques.

Abstract
The detection of the semantic relations among the semantic entities (concept and
role) of ontologies is one of the principal difficulties faced during the process of
the ontology integration. In the Semantic Web, these ontologies are expressed as
Description Logics (DLs) knowledge bases. Indeed, the semantic entities are
organized according to the mechanism of subsumption in their ontologies. This
organization implies the existence of these entities in the intentional definitions
of their subsumee. Thus, the detection of the semantic relations among semantic
entities can be done through the combination of the semantic relations of their
subsumers with small modifications. The reuse of the solution of a problem
already solved to solve another similar problem is the principle of case-based
reasoning (CBR). The objective of this study is to develop a new system based
on a CBR to infer the semantic relations by using the techniques of knowledge
discovery from databases (KDD) and the semantic distance.

126
Kolli Manel.

Universit Mentouri Constantine.

Keywords
Ontologies, semantic relations, Semantic Web, mapping, CBR, subsumption,
semantic entities.

127
Kolli Manel.

Universit Mentouri Constantine.

S-ar putea să vă placă și