Documente Academic
Documente Profesional
Documente Cultură
THESE
Prsente pour obtenir le grade de
Dirige par:
Pr. Boufaida Zizette. Universit Mentouri Constantine.
Devant le jury
Prsident
: Pr. Mahmoud Boufaida, professeur luniversit Mentouri, Constantine.
Rapporteur
: Pr. Zizette Boufaida, professeur, Universit Mentouri Constantine.
Examinateurs : Pr. Nadir Farah, professeur l'universit Badji Mokhtar, Annaba.
Dr. Faiza Belala, MCA l'universit Mentouri, Constantine.
Dr. Hassina Seridi, MCA l'universit Badji Mokhtar, Annaba.
A Mes parents
Mon mari
Mes enfants: May, Maha et Mouhamed
Remerciements
Sommaire
Introduction gnrale ..
1. Contexte de la thse...... .
2. Problmatique .. ..
3. Objectifs ...... ...
4. Contributions de la thse .. ..
5. Organisation de la thse .. ...
Gnralits sur les ontologies et le Web smantique..
I
i
ii
iv
v
vi
1
1. Introduction .. ..
2. Le Web smantique .. .
3. Prsentation de la notion dontologie ... .
3.1 Origine de lontologie ..
3.2 Dfinitions .....
3.3 Composantes dune ontologie ...........
3.3.1. Les concepts ........
a. Les proprits portant sur un concept
b. Les proprits portant sur deux concepts ...
3.3.2. Les relations ....
a. Les proprits intrinsques une relation ....
b. Les proprits liant deux relations ...
c. Les proprits liant une relation et des concepts ........
3.3.3. Les fonctions ...................
3.3.4. Les axiomes (ou Rgles) ........
3.3.5. Les instances (ou individus) ....
3.4 Rles de lontologie ..
3.5 Classification des ontologies ...
3.5.1 Dimensions de classification des ontologies ...
a. Typologie selon lobjet de conceptualisation .......
b. Typologie selon le niveau de dtail de lontologie ...... ..
c. Typologie selon le niveau de compltude .... ..
d. Typologie selon le niveau du formalisme . ..
3.6 Formalismes de reprsentation des ontologies .
3.6.1 Les frames
2
2
3
3
4
5
5
6
6
7
7
7
7
8
8
8
9
10
10
10
13
13
14
15
15
16
16
18
19
19
21
23
24
25
25
26
28
28
29
29
30
32
32
33
34
36
1. Introduction .....
2. Intgration des ontologies ..
2.1 Htrognit des ontologies .... ...
2.1.1 Niveau syntaxique ..
2.1.2. Niveau terminologique ... .
2.1.3. Niveau conceptuel .. .
2.1.4 Niveau pragmatique .... .
2.2 Diffrents types dintgration des ontologies ... ..
2.2.1 La mise en correspondance (mapping) des ontologies ....
a. Formalisation de la notion de mapping ..... ......
b. Mesures de similarit ......
c. Mthodologies du mapping ...
- MAFRA ......
- IF-Map ....
- RDFT .......
- C-OWL ..................................
- OntoMap ..... ..
2.2.2 Lalignement des ontologies ..
- Anchor-PROMPT ....
- GLUE ..
- S-Match .... ........
- QOM .... .
- ASCO ... ..
2.2.3 La fusion (merging) des ontologies .....
- PROMPT ....
- CHIMAERA ...
- FCA-Merge ....
- OntoMerge ..
3. Discussion ......
37
37
39
39
39
40
40
40
42
42
45
45
45
47
48
50
51
51
52
54
54
55
55
55
56
58
58
58
59
4. Conclusion .. .
60
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le
RPC.. 61
1. Introduction .... ..
2. Le raisonnement partir de cas (RPC) ....
3. Dtection des relations smantiques entre les ontologies en utilisant le raisonnement partir de cas
(RPC)
3.1. La phase de conception ...... .
3.1.1 Distance smantique ...
- Calcul de la distance smantique ... .
3.2. Phase de production .... ..
3.2.1. Elaboration .....
3.2.2. Remmoration ... .
3.2.3. La rutilisation ... .
a. Prparation des donnes ...
b. Fouille de donnes ....
- Appariement des ontologies ...... .
- Composition . ....
- Agrgation de similarit ... .
3.2.4. La rvision ..
3.2.5. La mmorisation ........................
4. Conclusion ........
Aspects techniques pour limplantation et tude de cas ..
62
63
1. Introduction .... .
2. Aspects techniques pour limplantation .. ..
2.1. Choix de lditeur dontologies ...... .
2.2. Langage de programmation et frameworks spcialises . ...
3. Etude de cas .....
3.1. Prsentation de ltude de cas ..
4. Prototype .....
5.Test et vrification ...
6. Conclusion .. .
Conclusion gnrale ...................................................................... .
86
86
86
87
89
89
93
98
101
102
1. Contributions
2. Perspectives ..
102
104
Bibliographie ..
105
64
64
68
69
73
73
74
76
76
78
78
79
80
82
83
84
85
Introduction gnrale
INTRODUCTION GENERALE
1. Contexte de la thse
La quantit dinformation disponible sur le web croit sans cesse. En effet, le web
classique ncessite de nouveaux outils pour la gestion, laccs et la manipulation de ces
informations. Lvolution du web actuel au web smantique permet des agents logiciels
dexploiter, de composer et de raisonner sur les contenus des ressources web via les
mcanismes de lintelligence artificielle.
Le Web smantique a pour objectif de transformer le World Wide Web actuel,
entirement tourn vers la prsentation des documents, vers un Web dont le contenu serait
comprhensible par les machines. La vision sappuie sur lutilisation dontologies, qui sont
des conceptualisations communes et partages entre diffrents agents, et dun langage de
description, permettant dexprimer la fois les dfinitions des concepts et des rles dans les
ontologies et dexprimer des annotations utilisant le vocabulaire de ces ontologies. Ce
langage et ces ontologies permettraient aux agents informatiques de comprendre les
diverses annotations et de communiquer entre eux, en effectuant des raisonnements sur les
concepts. Les problmatiques de la reprsentation de concepts en Intelligence Artificielle
sont donc fondamentales pour le Web smantique (Delteil 2002).
Il est clair que les recherches sur les ontologies sont essentielles pour la ralisation
du Web smantique. En effet, dune part, une fois construite et accepte par une
communaut particulire, une ontologie doit traduire un certain consensus explicite et un
certain niveau de partage qui sont essentiels pour permettre lexploitation des ressources du
Web par diffrentes applications ou agents logiciels.
Dautre part, la formalisation, autre facette des ontologies, est ncessaire pour que
ces outils puissent tre munis de capacits de raisonnement permettant de dcharger les
diffrents utilisateurs dune partie de leur tche dexploitation et de combinaison des
ressources du Web.
Du point de vue des ontologies, seront cruciales pour le Web smantique les
mthodes et les outils contribuant (Delteil 2002):
i
Kolli Manel.
Introduction gnrale
Grer laccs aux ontologies, leur volution, avec gestion des versions, et leur
intgration. Les ontologies sont souvent riches de plusieurs milliers de
concepts et ne restent alors directement apprhendables que par leur
concepteur. Leur accs par des utilisateurs, mme professionnels, ncessite de
grer le lien entre les concepts des ontologies et les termes du langage naturel,
que ce soit pour une simple comprhension ou pour lindexation et la
construction de requtes destines des tches de recherche dinformation.
Les solutions mises en uvre ce jour passent par des mthodologies sparant
explicitement les termes et les concepts dun domaine et des outils de
visualisation et de navigation recherchant des proximits conceptuelles dans
les termes dun domaine et permettant dapprhender intuitivement la
complexit de ce domaine.
2. Problmatique
Le problme dintgration des ontologies (connu aussi comme mdiation des
ontologies, correspondance dontologies, etc.) joue un rle central dans le
dveloppement des systmes base de connaissances. Les nouvelles technologies
augmentent lutilisation des ontologies dans le Web smantique pour la reprsentation des
connaissances. Cette tendance a conduit au dveloppement de nouvelles ontologies, dou le
nombre lev des ontologies disponibles sur le Web.
ii
Kolli Manel.
Introduction gnrale
iii
Kolli Manel.
Introduction gnrale
(i)
(ii)
Afin de raliser l'intgration des ontologies, il est ncessaire d'impliquer aussi bien
la syntaxe que la smantique des ontologies. Pour rsumer, le processus de mapping est un
des lments fondamentaux du processus d'intgration d'ontologies. Il permet danalyser et
de comparer des ontologies pour dterminer les correspondances entre leurs concepts et
pour dtecter des ventuels conflits. Le rsultat du processus de mapping est un ensemble
de liens de correspondances (Elbyed 2009).
3. Objectifs
Le but de notre travail est de proposer un systme capable didentifier les relations
smantiques entre les ontologies avec l'intention de soutenir l'interoprabilit des systmes
dinformations.
Lobjectif principal de cette thse est dcompose en objectifs intermdiaires :
iv
Kolli Manel.
Introduction gnrale
4. Contributions de la thse
Compte tenu des objectifs cits auparavant, les principales contributions de notre
thse peuvent tre rcapitules dans les points suivants :
1.
2.
3.
4.
v
Kolli Manel.
Introduction gnrale
5. Organisation de la thse
Le manuscrit est structur en quatre chapitres et une conclusion gnrale. Les deux
premiers sont ddis ltat de lart important pour la bonne comprhension du contexte de
travail. Les deux derniers chapitres sont consacrs la prsentation de notre contribution.
Dans le premier chapitre nous prsentons le contexte scientifique de nos travaux en
introduisant les concepts de base des ontologies et du web smantique ; plusieurs langages
et outils de reprsentation des ontologies sont prsents.
Le deuxime chapitre prsente une tude structure des techniques de mise en
correspondance dontologies. Tout dabord, nous commenons par la prsentation des
htrognits qui peuvent exister entre les diffrentes ontologies et leurs impacts sur le
processus de lintgration. Puis nous effectuons une classification des modes dintgration
des ontologies, avant de terminer par une dfinition du calcul des mesures de similarit
entre les entits smantiques.
Le chapitre trois est consacr la prsentation de notre systme. Nous commenons
par la prsentation de cycle de vie du mcanisme du RPC. Puis, nous dtaillons notre
systme qui distingue deux phases: la phase de conception et la phase de production. Au
cours du processus, nous utilisons un exemple pour bien expliquer le fonctionnement du
systme propos.
Le chapitre quatre regroupe les aspects techniques de limplantation de notre
systme, ainsi que lapplication de ce dernier dans une tude de cas adquate. Nous
commenons par donner les outils et les technologies lis la mise en uvre de chaque
composant. Par la suite, nous proposons une tude de cas, afin de motiver lintrt de notre
approche dun point de vue pratique.
Enfin, le manuscrit se termine par une conclusion gnrale qui rcapitule les
travaux raliss et propose quelques visions pour les travaux futurs.
vi
Kolli Manel.
1
Kolli Manel.
1. Introduction
Selon Tim Berners Lee (Berners-Lee 1999) et (Berners-Lee et al. 2001), le Web
Smantique doit permettre de porter le Web actuel son plein potentiel. Le Web actuel est
principalement tourn vers les tres humains. Lobjectif du Web Smantique est de rendre
le contenu du Web comprhensible des machines. Le procd consiste exploiter:
Des moteurs de raisonnement permettant dinfrer sur les annotations daprs les
axiomes dclars dans les ontologies.
2. Le Web smantique
Pour bien comprendre ce qu'est le Web smantique, nous commenons par une
dfinition. Le grand dictionnaire terminologique dfinit le terme smantique comme
l'ensemble des relations entre les caractres, ou groupes de caractres, et leur
significations, indpendamment de la faon de les employer ou de les interprter. Il
prcise par la suite que si, en linguistique, la smantique porte sur l'tude du sens partir
de la combinaison des mots, en intelligence artificielle, elle porte sur la capacit d'un rseau
[le Web] reprsenter de la manire la plus humaine possible des relations entre des objets,
des ides ou des situations.
Le terme smantique implique donc que la machine ne se contentera plus de
prsenter visuellement les donnes du Web, mais, en les reliant, elle pourra conserver les
significations qui leur sont attribuables. Or, en transformant le contenu du Web pour qu'il
soit comprhensible par la machine et non seulement prsentable, nous permettons
cette mme machine d'tre plus efficace dans le traitement de l'information. Ainsi, le
dialogue avec les moteurs de recherche devient possible. Nous sommes alors en mesure de
nous exprimer dans des termes que nos ordinateurs peuvent aussi interprter et changer. Il
est galement possible d'automatiser, d'intgrer et de rutiliser l'information entre diverses
applications
2
Kolli Manel.
3
Kolli Manel.
3.2. Dfinitions
Dans le cadre de lintelligence artificielle, Neeches et ses collgues (Neeches et al.
1991) furent les premiers proposer une dfinition savoir : une ontologie dfinit les
termes et les relations de base du vocabulaire dun domaine ainsi que les rgles qui
indiquent comment combiner les termes et les relations de faon pouvoir tendre le
vocabulaire.
En 1993, Gruber (Gruber 1993) propose la dfinition suivante : spcification
explicite dune conceptualisation qui est jusqu prsent la dfinition la plus cite dans la
littrature en intelligence artificielle. Cette dfinition a t modifie lgrement par Borst
(Borst 1997) comme spcification formelle dune conceptualisation partage.
Ces deux dfinitions sont regroupes dans celle de Studer (Studer et al. 1998)
comme spcification formelle et explicite dune conceptualisation partage.
Formelle : lontologie doit tre lisible par une machine, ce qui exclut le langage
naturel. Explicite : la dfinition explicite des concepts utiliss et des contraintes de
leur utilisation.
Partage : lontologie nest pas la proprit dun individu, mais elle reprsente un
consensus accept par une communaut dutilisateurs.
Pour Guarino & Giaretta (Guarino et Giaretta 1995) Une ontologie est une
spcification rendant partiellement compte dune conceptualisation. Swartout et ses
collgues (Swartout et al. 1997) la dfinissent comme suit : une ontologie est un ensemble
de termes structurs de faon hirarchique, conue afin de dcrire un domaine et qui peut
servir de charpente une base de connaissances.
La mme notion est galement dveloppe par Gomez (Gomez 1999) comme:
une ontologie fournit les moyens de dcrire de faon explicite la conceptualisation des
connaissances reprsentes dans une base de connaissances.
Pour conclure, nous pouvons donc affirmer que les dfinitions du terme ontologie
abondent dans la littrature scientifique. Les dfinitions, dans leur diversit, offrent des
points de vue la fois diffrents et complmentaires sur un mme concept.
4
Kolli Manel.
En clair, une ontologie fournit les moyens dexprimer les concepts dun domaine
en les organisant hirarchiquement et en dfinissant leurs proprits smantiques dans un
langage de reprsentation des connaissances formel favorisant le partage dune vue
consensuelle sur ce domaine entre les applications informatiques qui en font usage.
Une notion : elle correspond la smantique du concept, elle est dfinie travers
ses proprits et ses attributs. Elle est appele intention du concept.
5
Kolli Manel.
Lunit : un concept est un concept unit, si pour chacune de ses instances, les
diffrentes parties de linstance sont lies par une relation qui ne lie pas dautres
instances du concept.
Exemple : les deux parties dun couteau, manche et lame sont lies par une
relationEmmanch qui ne lie que cette lame et ce manche.
Exemple :
6
Kolli Manel.
Linverse : on dit que deux relations binaires R1 et R2 sont inverses lune de lautre
si, quand R1 lie deux instances I1 et I2, alors R2 lie I2 et I1.
Exemple : a pour pre et a pour enfant sont deux relations inverses lune de
lautre.
7
Kolli Manel.
La restriction de relation : Pour tout concept de type C1, et toute relation de type
R liant C1, les autres concepts lis par la relation sont dun type impos.
Exemple: si la relation mange portant sur une personne et un aliment lie
une instance de vgtarien , concept subsum par personne , linstance de
aliment est forcment instance de vgtaux .
8
Kolli Manel.
9
Kolli Manel.
Dans la section suivante, nous nous intressons aux diffrentes classifications pour
les ontologies.
10
Kolli Manel.
niveau est fonde sur : la thorie de l'identit, la mrologie (theory of whole and
parts role) et la thorie de la dpendance. Guarino et Sowa ont poursuivi chacun
indpendamment des recherches sur la thorie de lontologie. Tous deux
intgrent les fondements philosophiques comme tant des principes suivre
pour concevoir lontologie de haut niveau ou suprieure. Sowa introduit deux
concepts importants, Continuant et Occurrent, et obtient douze catgories
suprieures en combinant sept proprits primitives. Lontologie suprieure de
Guarino consiste en deux mondes : une ontologie des Particuliers (choses qui
existent dans le monde) et une ontologie des Universels comprenant les concepts
ncessaires dcrire les Particuliers. La conformit aux principes de lontologie
suprieure a son importance, lorsque le but est de standardiser la conception des
ontologies.
11
Kolli Manel.
12
Kolli Manel.
13
Kolli Manel.
14
Kolli Manel.
3.6.1
Les frames :
Introduits ds les annes 70 par Minsky (Minsky 1975) comme une modlisation
de base pour la reprsentation de connaissances dans le domaine dIntelligence Artificielle
(AI), le modle des frames a depuis t adapt dautre problmatiques puisquil a donn
naissance au modle objet, qui envahit peu peu les diffrentes branches de linformatique.
Lide de frame est trs simple. Un frame est dans ce contexte un objet
nomm, qui est utilis pour reprsenter un certain concept dans un domaine.
Un frame reprsente nimporte quelle primitive conceptuelle et il est dote
dattributs (slots), qui peuvent porter diffrentes valeurs (facets), et dinstances (Kifer et al.
1995).
Il y a une correspondance entre les systmes de frame et ceux orients objet o
les classes et les instances correspondent avec les frames, les attributs et les associations de
classes avec les slots. Entre les frames, il y a aussi la spcialisation qui donne lhritage
dans les concepts de frame. Une frame F1 est plus spcifique quune frame F2 si toute
instance de F1 est instance de F2.
Le formalisme F-logic (Kifer et al. 1995) tait propos comme le fondement
logique pour les langages de frame et orients objet. Il permet de comprendre le modle
smantique dans tous les langages de frame et daider la construction dune base de
connaissances.
Parmi les langages de frame on peut citer YAFOOL (Yet Another Frame Based
Object-Oriented Language), OML (Ontology Markup Language), Ontolingua, KRL
(Knowledge Representation Language), SHIRKA et bien dautres encore.
15
Kolli Manel.
TC, ensemble des types de concepts, est un ensemble partiellement ordonn par une
relation sorte de (note ) possdant un plus grand lment (not T) appel
type universel.
16
Kolli Manel.
TRp, o TRi est l'ensemble des types de relations d'arit i. Tout TRi admet un plus
grand lment (not Ti).
Le support dcrit en figure 1.2 dfinit des types de concepts tels que Ville (qui est
une sorte de Lieu) et des types de relations tels que agent.
Un GC exprime un fait en utilisant le vocabulaire dfini dans le support.
EG est l'ensemble des artes. Toutes les artes d'un graphe conceptuel G ont une
extrmit dans CG et l'autre dans RG.
tiqG est une application qui tout sommet de NG et toute arte de EG associe
une tiquette : si r RG, tiqG(r) TR ; si c CG, tiqG(c) TC ; si e EG,
tiqG(e) Te.
L'ensemble des artes adjacentes tout sommet relation r est totalement ordonn,
ce que l'on reprsente en tiquetant les artes de 1 au degr de r.
17
Kolli Manel.
La figure 1.3 prsente un GC dfini sur le support dcrit dans la figure 1.2. Les
sommets concepts sont reprsents par des rectangles et les sommets relations par des
ellipses.
Le graphe de la figure 1.3 peut tre interprt par Accident mortel (accident
dans lequel une personne est morte). Comme lillustre la figure, la nature graphique des
GC fait quil est facile de les interprter, de les modifier ou den crer de nouveaux. Cette
facilit de cration est renforce par la sparation explicite de diffrents types de
connaissances, et plus prcisment par la dfinition dun objet distinct des graphes, le
support, qui aide lors de la cration des graphes, car les tiquettes des sommets doivent tre
choisies dans ce support.
Le modle des GC est dot dune smantique logique: les types de relations et de
concepts correspondent des prdicats, les liens sorte de sont reprsents par des
implications et les graphes par des assertions.
18
Kolli Manel.
a.
Les entits de base qui sont dfinies et manipules dans une logique de
descriptions sont les concepts et les rles. Un concept permet de reprsenter un ensemble
dindividus, un rle reprsente une relation binaire entre concepts.
Un concept et un rle possdent une description structure, labore partir d'un
certain nombre de constructeurs. Les concepts et les rles peuvent tre primitifs ou dfinis.
Les concepts (ventuellement les rles) primitifs sont comparables des atomes et servent
de base la construction des concepts dfinis (ventuellement les rles dfinis).
Une smantique est associe chaque description de concept et de rle par
l'intermdiaire d'une interprtation. Les manipulations opres sur les concepts et les rles
sont ralises en accord avec cette smantique (Napoli 1997).
concept primitif
CD
conjonction de concepts
CD
disjonction de concepts
ngation
r.C
restriction universelle
19
Kolli Manel.
r.C
restriction existentielle
n r.C
cardinalit maximum
n r.C
cardinalit minimum
rle primitif
r1 r2
conjonction de rles
r1 r2
disjonction de rles
La disjonction des concepts pour exprimer lunion entre deux concepts (CUD). La
smantique associe dsigne lensemble des individus obtenu par lunion des
individus des concepts C et D.
Dans lexemple suivant, on propose un concept qui reprsente les personnes qui ne
sont pas des femmes. Pour cela, on utilise la conjonction et le complment comme suit:
Personne Femme.
Ltablissement des relations entre les concepts est lune des caractristiques
importantes de la logique de description. Alors, un langage pour la logique de description
doit proposer les formalismes ncessaires pour exprimer les rles et pour tablir les
restrictions ncessaires sur eux. Dans ce contexte, deux lments sont fournis ; les
quantificateurs et les cardinalits.
Les quantificateurs permettent dtablir des restrictions de nombres sur les rles.
On trouve principalement deux quantificateurs ; le quantificateur universel et le
quantificateur existentiel . Par exemple, pour designer un concept dont les individus ont
tous des enfants fminins on peut lcrire comme suis : A-Enfant.Femme.
Les cardinalits constituent un moyen important pour assurer une restriction des
rles. Elles permettent dimposer des valeurs minimales ou maximales sur ces rles.
20
Kolli Manel.
Dans notre exemple concernant les membres dune famille, on peut ainsi dfinir un
concept qui a un nombre denfants entre 2 et 5 par : 2 A-Enfant 5 A-Enfant .
Les constructeurs utiliss dans cette syntaxe dterminent la puissance dexpression
de la LD ainsi dfinie.
Par exemple, la description de concept suivante dcrit toutes les personnes qui
travaillent dans un projet financ par un institut :
Personne travailledans.(Projet financpar.Institut).
Selon les applications considres, les constructeurs sont plus ou moins utiles.
Ainsi pour dcrire des objets, les constructeurs de cardinalit maximum et minimum
peuvent tre parfois trs utiles.
Smantique
Constructeur
Plus gnral / absurde
Syntaxe
Smantique
I /
Conjonction
C D
CI DI
Disjonction
CD
CI DI
Ngation
I \ C I
Restriction universelle
r.C
{a I / b I , si (a,b) rI
alors b CI }
21
Kolli Manel.
Restriction existentielle
r.C
{a I / b I , (a,b) rI et
b CI }
Cardinalit maximum
n r.C
{a I / | b I / (a,b) rI et
b CI }| n }
Cardinalit minimum
n r.C
{a I / | b I / (a,b) rI et
b CI }| n }
r1 r2
r1 r2
Satisfiabilit :
Subsomption :
Lorganisation des concepts et des rles par niveau de gnralit se fait par la relation
de subsomption. Un concept C subsume un concept D si C est plus gnral que D au
sens o lensemble des individus reprsent par C contient lensemble des individus
I
reprsent par D. En effet, Un concept C est subsum par D si et seulement si C
I
D pour toute interprtation I.
3.
Equivalence :
I
4.
Incompatibilit :
22
Kolli Manel.
Pour conclure cette section, nous avons considrablement mis laccent sur le
formalisme des logiques descriptions. Ce formalisme de reprsentation est trs riche en
constructeurs ce qui permet lexpression dtaille des concepts. Nous remarquons que plus
les descriptions des concepts sont dtailles, plus les mcanismes d'intgration d'ontologies
peuvent tre efficaces dans la comparaison des concepts et des rles.
23
Kolli Manel.
Corcho (Corcho 2002) insiste sur le fait que les activits de documentation et
dvaluation sont ncessaires chaque tape du processus de construction, lvaluation
prcoce permettant de limiter la propagation derreurs. Le processus de construction peut
tre intgr au cycle de vie dune ontologie comme indiqu en figure 1.5.
24
Kolli Manel.
25
Kolli Manel.
4.2 RDFS
RDF Schma (RDFS) est une recommandation du W3C en cours dlaboration. Il
sagit du langage de spcification de schmas associ RDF. Il est ddi la reprsentation
des connaissances ontologiques utilises dans des dclarations RDF.
Un schma RDF est un ensemble de dclarations de classes et de proprits. Il
sapparente en cela la partie terminologique dune Logique de Description (LDs) o sont
dclars les rles et les concepts dune base de connaissances. Il permet en outre, comme
dans les langages de Reprsentation de Connaissances par Objets (RCO), de dfinir les
domaines et les codomaines (domaines de valeurs) des proprits RDF ainsi que des
26
Kolli Manel.
27
Kolli Manel.
La figure 1.7 montre les primitives de RDF(S). Les concepts et les relations
sont dclars dans un document RDF(S) comme instances de Class et de Property .
Une fois ce schma stock sur le Web, les primitives qui y sont dcrites peuvent
tre utilises dans une page si on y inclut une rfrence lURI du schma. Une application
ncessitant laccs la smantique de la page utilisera alors le schma dinterprtation. Le
RDF-S nest cependant pas un langage oprationnel de reprsentation, au sens o il ne
permet pas la reprsentation des axiomes et leur utilisation pour raisonner.
4.4 OWL
La combinaison de RDF/RDF-S et de DAML+OIL a permis lmergence de OWL
(Web Ontology Language), un langage standard de reprsentation de connaissances pour le
Web.
Dvelopp par le groupe de travail sur le Web Smantique du W3C, OWL peut tre
utilis pour reprsenter explicitement les sens des termes des vocabulaires et les relations
entre ces termes. OWL vise galement rendre les ressources sur le Web aisment
accessibles aux processus automatiss (Gruber et Olsen 1994), dune part en les structurant
dune faon comprhensible et standardise, et dautre part en leur ajoutant des mtainformations.
Pour cela, OWL a des moyens plus puissants pour exprimer la signification et la
smantique que XML, RDF, et RDF-S. De plus, OWL tient compte de laspect diffus des
sources de connaissances et permet linformation dtre recueillie partir de sources
distribues, notamment en permettant la mise en relation des ontologies et limportation des
informations provenant explicitement d'autres ontologies.
28
Kolli Manel.
29
Kolli Manel.
30
Kolli Manel.
31
Kolli Manel.
32
Kolli Manel.
33
Kolli Manel.
8. Conclusion
Nous avons dcrit dans ce chapitre le cadre technique de notre travail. Nous avons
prsent les concepts de base des ontologies et du web smantique, qui sont la base de notre
travail. Voici un rsume des principaux points que nous avons abords:
34
Kolli Manel.
Les ontologies sont considres comme des objets techniques volutifs possdant
un cycle de vie ;
Dans ltat de lart sur les formalismes de reprsentation dontologies, nous avons
soulign la grande expressivit des logiques de descriptions. Dans la suite de ce
travail nous allons exploiter ces logiques pour la description des ontologies
intgrer.
35
Kolli Manel.
36
Kolli Manel.
1. Introduction
Les ontologies jouent un rle cl dans le domaine du web smantique notamment
dans lintgration des systmes dinformation et dans la recherche de linformation. Comme
nous lavons soulign dans le chapitre prcdent, elles permettent de reprsenter les
connaissances dune manire formelle et explicite. Elles constituent alors la brique
supportant les changes et le partage des informations en tendant linteroprabilit
syntaxique du web en une interoprabilit smantique.
Le web smantique exploite les ontologies dans la reprsentation des connaissances
(Charlet et al. 2005). Partant du fait quil existe plusieurs connaissances qui peuvent
prendre des reprsentations diffrentes, nous trouvons de nos jours plusieurs ontologies de
domaine pour un mme champ dapplication (Zghal et Ben Yahia 2007). Ainsi, La mise en
correspondance (mapping) des ontologies, l'alignement et la fusion des ontologies devient
un grand dfi pour tablir un lien entre plusieurs sources d'information pour changer des
informations d'une source lautre.
Dans ce chapitre, nous commenons par voquer le problme de lintgration des
ontologies. En suite, nous prsentons les htrognits qui peuvent exister entre les
diffrentes ontologies et leurs impacts sur le processus de lintgration. Aprs, nous
dfinissons le calcul des mesures de similarit entre les entits smantiques. Puis, Nous
passons la prsentation en dtail des types dintgration des ontologies, nous les illustrons
par des exemples dapplication. Le chapitre se termine par une conclusion.
`
37
Kolli Manel.
38
Kolli Manel.
Dans la section suivante nous allons tudier les htrognits d'ontologies et nous
allons ensuite prsenter les solutions typiques utilises pour leur rsolution.
Multilinguisme : o des mots de diffrents langages sont utiliss pour nommer des
entits.
39
Kolli Manel.
40
Kolli Manel.
41
Kolli Manel.
la dcouverte du mapping ;
la reprsentation du mapping ;
42
Kolli Manel.
ontologies est un ensemble de liens (nommes aussi mappings). Un mapping dsigne une
expression formelle qui tablit une relation smantique entre deux ontologies. Quand la
relation inter-ontologique est oriente, on parle trs souvent de mapping au sens
mathmatique, c'est--dire de la notion de fonction ou de morphisme mathmatiques
(Kalfoglou et Schorlemmer 2003).
43
Kolli Manel.
44
Kolli Manel.
processus de mapping. Quant aux paramtres p, ces derniers peuvent tre les hypothses
effectues comme le seuil de vraisemblance utiliser, etc.
b. Mesures de similarit
La mise en correspondance repose sur le calcul des mesures de similarit entre les
entits smantiques, pour identifier pour chaque entit dune ontologie, des entits qui lui
sont les plus similaires dans les autres ontologies. Daprs (Rahm et Bernstein 2001), les
diffrentes mesures de similarit sont organises comme suit:
La premire mthode se base sur la terminologie des entits. En effet elle consiste
comparer les labels des entits. Elle est dcompose en approches purement syntaxiques et
celles utilisant un lexique. Lapproche syntaxique effectue la correspondance travers les
mesures de dissimilarit des chanes (EditDistance). Tandis que, lapproche lexicale
effectue la correspondance travers les relations lexicales (synonymie, hyponymie, etc.).
La deuxime mthode sappui sur la comparaison des structures internes des
entits (intervalle de valeur, cardinalit dattributs, etc.).
Contrairement la deuxime mthode, la troisime mthode permet la comparaison
des structures externes. Elle compare les relations dentits avec dautres. Elle est
dcompose en mthodes de comparaison des entits au sein de leurs taxinomies et
mthodes de comparaison des structures externes en tenant compte des cycles.
La quatrime mthode des mesures de similarit compare les extensions des entits
(instances des classes).
Finalement la cinquime mthode compare les interprtations (ou plus exactement
les modles) des entits.
c. Mthodologies du mapping
Les outils et mthodologies, parmi les plus significatifs dans cette catgorie, sont
MAFRA (Maedche et al. 2002), IF-Map (Kalfoglou et Schorlemmer 2003), RDFT
(Omelayenko 2003), C-OWL (Bouquet et al. 2004) et OntoMap (Angele et Schnurr 2005).
MAFRA
45
Kolli Manel.
46
Kolli Manel.
Figure 2.6 Le mapping entre deux ontologies locales (Kalfoglou et Schorlemmer 2003)
IF-Map
47
Kolli Manel.
Les auteurs tudient la thorie des flux dinformation qui fournit une description
thorique consistante du processus partiel dintgration smantique effectu par deux
agents. Pour cela ceux-ci ralisent un alignement progressif des ontologies laide des
instances de celles-ci. Leur approche est base sur une mise en correspondance dontologies
locales. Deux autres ontologies sont utilises dans le processus de mapping : lune que lon
appelle ontologie de rfrence et lautre, ontologie globale " (voir la figure 2.6).
Ils supposent que les ontologies locales sont utilises par diffrentes communauts
et sont peuples par des instances de leur domaine respectif, alors que lontologie de
rfrence est une interprtation commune ddie au partage de la connaissance mais prive
dinstances. Lontologie globale est une ontologie virtuelle cre au vol pour les besoins de
la fusion. Les relations entre les ontologies locales et lontologie virtuelle sont du type
infomorphismes logiques.
Bases sur le modle IF, les ontologies sont exprimes en termes de logiques
locales. Les mappings sont alors formaliss par les infomorphismes. Le processus de
mapping de lapproche IF-Map (Kalfoglou et Schorlemmer 2003) inclut quatre tapes
principales reprsentes la figure 2.7.
RDFT
48
Kolli Manel.
49
Kolli Manel.
La relation entre les composants source et cible de la passerelle peut tre une
relation dquivalence ou encore une relation de version qui dclare que les lments de
lensemble cible forment une version postrieure des lments de lensemble source dans
lhypothse o les domaines sont identiques pour les deux ensembles.
C-OWL
C-OWL " Contextual Ontology Web Language " est une extension de OWL 6 qui a
t propose pour la reprsentation dontologies contextualises (Bouquet et al. 2004). Ces
dernires sont des reprsentations locales, appeles contextes. Les liens entre les contextes
sont reprsents en relation avec dautres contextes au travers des mappings.
Deux notions principales caractrisent lapproche C-OWL : lespace de contextes
et les passerelles; Les connaissances sont contenues dans un ensemble de contextes, appel
espace de contextes o chaque contexte est exprim par une ontologie dcrite en OWL
possdant son propre langage et sa propre interprtation.
Les mappings entre ontologies sexpriment sous la forme de passerelles. Une
passerelle entre un contexte, reprsent par une ontologie OWL Oi, et un autre contexte,
reprsent par une autre ontologie OWL Oj, permet de dclarer une correspondance entre
les lments de connaissances de ces deux contextes. Sur la base de ces correspondances,
une partie des connaissances contenues dans Oi peut tre interprte et rutilise dans Oj.
50
Kolli Manel.
OntoMap
51
Kolli Manel.
relations dans les ontologies et utilise des mesures de similarit pour dterminer la
correspondance.
Les instances appartenant aux concepts des diffrentes ontologies sont compares
pour dcouvrir les similarits entre les concepts. Dans le matching niveau-lment et le
matching niveau-structure, le " matcher niveau-lment " compare les proprits dun
concept particulier et dune relation particulire (par exemple pour trouver des similarits
partir du nom). Le " matcher niveau-structure " compare la structure, cest--dire la
hirarchie du concept pour trouver les similarits (Noy et Musem 2001) (Giunchigliaet al.
2005). Selon Ehrig, ces " matchers " peuvent galement tre combins (Ehrig et Staab
2004).
Les techniques dalignement jouent un rle crucial dans la construction dun lien
smantique entre les ontologies dun mme domaine. Quelques approches dalignement
(Aleksovski et al. 2006), (Stuckensschmidt et al.2004) et (Hage et al. 2005) considrent que
lutilisation dune connaissance sur le domaine est une manire assurant la correspondance
smantique entre la dissimilarit syntaxique des ontologies. Lobtention de la bonne
connaissance sur le domaine est primordiale.
Dautres approches nexploitent pas une connaissance sur le domaine et ne ralisent
pas un modle smantique formel pour lalignement des structures produites. Dans ce cas,
la structure obtenue est difficile exploiter pour rpondre aux requtes interrogeant les
ontologies (Lopez et al. 2006). En outre, les approches courantes dalignement dontologies
(Noy 2004), (Shvaiko et Euzenat 2005) et (Bach 2006) sont bases sur les mesures de
similarit entre chanes de caractres et des structures composites. Les ontologies aligner
peuvent tre reprsentes avec diffrents langages.
Lalignement suffit dans le cas de lutilisation dontologies portant sur des
domaines de connaissance complmentaires, ou sur des domaines de niveaux smantiques
diffrents. Par exemple, lutilisation, dans un mme systme, dune ontologie de haut
niveau et dune ontologie de domaine ne va ncessiter quune compatibilit entre les deux.
La compatibilit de deux ontologies est assure par lutilisation des mmes formalismes de
reprsentation, ou lutilisation de formalismes compatibles, mais galement par la
compatibilit des modles de connaissance utiliss (Maedche et al. 2002).
Parmi les approches dalignement dontologies, on trouve Anchor-PROMPT (Noy
et Musem 2001), GLUE (Doan et al. 2003), (Giunchigliaet al. 2005), QOM (Ehrig et Staab
2004) et ASCO (Thanh et al. 2004):
Anchor-PROMPT
52
Kolli Manel.
paires de termes relatifs comme entre. Il analyse les chemins dans le sous-graphe dlimit
par des ancres et dtermine quelles sont les classes qui apparaissent frquemment dans des
positions similaires sur des chemins similaires.
Lalgorithme cherche alors des termes le long des chemins qui pourraient tre
similaires aux termes dautres chemins. Ces nouveaux termes relatifs sont identifis par une
similarit qui peut tre modifie pendant lvaluation dautres chemins dans lesquels ces
termes apparaissent. Les termes qui sont fortement semblables sont prsents lutilisateur
pour amliorer lensemble des suggestions possibles.
53
Kolli Manel.
GLUE
GLUE est un systme qui emploie une approche de type " machine learning " pour
crer des mappings semi-automatiques entre ontologies htrognes. Il se base sur des
donnes dinstances, une ontologie tant vue comme une taxinomie de concepts (Doan et
al. 2003). GLUE se focalise sur la dtermination des mapping de type 1--1. La similarit
de deux concepts A et B dans deux taxinomies O1 et O2 utilise lensemble des instances des
deux concepts qui convergent. Pour dterminer si une instance du concept B est galement
une instance du concept A, un classifieur est dabord construit en utilisant les instances de
A comme ensemble dapprentissage.
Ce classifieur est ensuite utilis son tour pour traiter les instances de B. Le
classifieur dcide alors pour chaque instance de B, sil est galement une instance de A ou
non. Avec ces classifications, quatre probabilits sont calcules : P(A,B), P(A,B), P(A,B) et
P(A,B). La probabilit P(A,B) par exemple, sinterprte par lappartenance de linstance du
domaine A et la non appartenance B. Ces quatre cas peuvent ensuite tre employes
comme paramtres pour calculer la distribution de probabilit commune pour les concepts
A et B, laquelle est une fonction crite par lutilisateur.
S-Match
54
Kolli Manel.
QOM
QOM (Quick Ontology Mapping) est une approche qui a t conue pour fournir
un outil efficace de matching pour la cration au vol des alignements entre les ontologies
(Ehrig et Staab 2004).
Afin dacclrer lidentification des similarits entre deux ontologies, QOM ne
compare pas celles de la premire ontologie avec toutes les entits de la seconde ontologie,
mais emploie des heuristiques (par exemple, labels semblables) pour abaisser le nombre de
mappings candidats. Le calcul rel de similarit est effectu en utilisant une large gamme
de fonctions de similarit, telles que la similarit des strings.
Plusieurs mesures de similarit sont calcules et servent dentre une fonction
dagrgation. QOM applique une fonction sigmode qui fait ressortir diffrentes similarits
leves et basses. Les correspondances relles entre les entits des ontologies sont extraites
en appliquant un seuil de mesure agrge de similarit. La sortie dune itration peut tre
utilise en tant qulment dentre pour litration suivante afin de raffiner le rsultat.
Aprs un certain nombre ditrations, une table de correspondances entre les ontologies est
obtenue.
ASCO
ASCO est un algorithme qui permet de comparer deux ontologies (Thanh et al.
2004). Il trouve des mappings en suivant un processus deux phases.
La phase linguistique dans laquelle la valeur de similarit entre deux entits, telles
que des concepts ou des relations provenant de deux ontologies diffrentes, est
calcule partir de diffrentes informations disponibles telles que leurs noms, leurs
tiquettes (des labels qui fournissent une version comprhensible par un humain du
nom du concept ou de la relation) et leurs descriptions. Le calcul de la valeur de
similarit linguistique est effectu de plusieurs manires. Pour amliorer la
prcision du calcul et pour exploiter les relations de synonymie ou hyperonymie
entre termes, ASCO intgre WordNet.
La phase structurelle exploite les informations taxonomiques dans les structures des
ontologies. Elle utilise des heuristiques et les connaissances du domaine pour
calculer les valeurs de similarit structurelle entre entits des deux ontologies. Les
valeurs de similarit dans les deux phases sont combines pour obtenir les valeurs
de similarit finales entre les entits. Les alignements sont dduits de ces valeurs.
55
Kolli Manel.
sujette l'erreur. Par consquent, plusieurs approches de fusion sont rcemment proposes
(Galle 2002).
La fusion dontologies reprsente la cration dune nouvelle ontologie partir de
deux ontologies ou plus. Lontologie rsultante unifie et remplace les ontologies dorigine
(Voir la figure 2.10). Cette dfinition ne prcise pas comment lontologie rsultante est
relie aux ontologies originales pour laisser ouvert le problme du choix de la mthode de
fusion.
Dans la nouvelle ontologie, on retrouve des rgions des anciennes ontologies qui
sont plus ou moins inchanges. Ce genre dapproche est utilis quand les diffrentes
ontologies intgrer ont une forme ou un contenu trs htrogne. Le rsultat est une
ontologie plus homogne quavec une approche par assemblage, mais le processus
d'intgration nest pas facilement automatisable (Pinto et al. 1999).
Dans le cadre de la fusion il faut faire attention :
Les approches les plus courantes utilisent lunion ou lintersection. Dans lapproche
par union, lontologie rsultante contient lunion des entits provenant des ontologies
originales et suppose rsolues les diffrences de reprsentation dun mme concept. Dans
lapproche de type intersection, lontologie rsultante ne contient que les parties communes
des ontologies originelles.
Plusieurs approches mettant en oeuvre la fusion dontologies ont t proposes
telles que PROMPT (Noy et Musen 2000), CHIMAERA (McGuinness et al. 2000), FCAMerge (Stumme et Maedche 2001) et OntoMerge (Dou et al. 2002).
PROMPT
PROMPT est un outil dont le processus de fusion est de type interactif. Lensemble
de phases associ ce processus comprend les tapes suivantes :
Les candidats la fusion sont identifis partir des similarits des noms de classes.
Le rsultat est prsent lutilisateur comme une liste doprations potentielles de
fusion.
56
Kolli Manel.
Le systme cre une nouvelle liste dactions suggres par lutilisateur en se basant
sur la nouvelle structure de lontologie. Il dtermine les conflits prsents par la
dernire action, les solutions possibles ces conflits puis prsente ces derniers
lutilisateur.
57
Kolli Manel.
CHIMAERA
La fusion est exprime par un oprateur entre les paires de termes, de noms et de
dfinitions considres comme candidats la fusion. CHIMAERA dispose galement de
techniques permettant de lier les termes par des relations de subsomption, disjonction, etc.
Lanalyse effectue par Chimaera comprend aussi bien une vrification de la rigueur
logique dune ontologie que le diagnostic des erreurs habituelles dans sa conception.
FCA-Merge
OntoMerge
OntoMerge est un outil qui facilite la cration dune ontologie appele Ontologie
Passerelle. Celle-ci importe les ontologies originelles et relie les concepts grce un certain
nombre daxiomes (Dou et al. 2002).
OntoMerge est une approche en ligne dans laquelle les ontologies source sont
maintenues aprs lopration de fusion, alors que dans PROMPT lontologie fusionne
remplace les ontologies source. Le rsultat de lopration de fusion dans OntoMerge nest
58
Kolli Manel.
pas une ontologie compltement fusionne, comme dans PROMPT, mais une ontologie
passerelle qui importe des ontologies source.
Des rgles de traduction issues des axiomes relient la partie de convergence des
ontologies source. Les ontologies source sont traites avec les axiomes passerelle comme
une seule thorie par un dmonstrateur de thormes optimis pour trois oprations
principales :
3. Discussion
La majorit des approches cites dans les diffrentes catgories (mapping, fusion et
alignement) exploitent des mcanismes qui ne reposent pas sur des fondements thoriques
et/ou modles mathmatiques robustes. La plupart de ces mcanismes utilisent des
heuristiques, la logique propositionnelle ou les probabilits.
Ces approches reposent sur lutilisation des calculs de similarits syntaxiques afin
didentifier les correspondances entre concepts, mais prennent rarement en considration
leur smantique.
Les techniques cites prcdemment saccordent sur certaines proprits mais elles
prsentent certaines limites :
1. La plupart de ces approches, telles que MAFRA, RDFT etc, sont limites
lutilisation dalgorithmes semi-automatiques pour le mapping, la fusion et
lalignement dontologies.
2. La prolifration des concepts introduits dans les ontologies engendre souvent une
explosion combinatoire.
3. Pour lier les concepts de diffrentes ontologies, ces approches sappuient sur des
similarits syntaxiques entre ces concepts. Toutefois, deux concepts peuvent avoir
une mme syntaxe alors que leur smantique est diffrente car place dans des
contextes diffrents. A linverse, deux concepts peuvent avoir la mme smantique
alors quils sont dcrits par diffrentes syntaxes.
4. Enfin, ces mthodologies sont difficilement comprhensibles par les utilisateurs
cause de leur complexit.
59
Kolli Manel.
Dans linfrastructure web smantique qui repose sur les logiques de descriptions
pour la construction des ontologies (voir chapitre1), la fusion de ces ontologies repose sur
linsertion des entits smantiques des ontologies initiales lontologie globale qui doit
respecter les notions de subsomption et classification.
Pour cela nous devons dterminer les relations smantiques (quivalence,
subsomption, disjonction, ...) existantes entre ces concepts qui sont dj organiss par la
subsomption dans les ontologies initiales. O, la relation d'quivalence permet de fusionner
les entits similaires, la relation de subsomption permet d'organiser les concepts et les rles
en hirarchies dans un graphe et la relation de disjonction permet d'viter les comparaisons
inutiles, car si deux entits sont disjointes alors leur subsums sont disjoints aussi, par
exemple: les entits homme et femme.
Cependant, la majorit des approches dintgration des ontologies comme nous
lavons dj indiqu, tel que: GLUE (Doan et al. 2002), QOM (Ehrig et Staab 2004) et SMatch (Giunchiglia et al. 2005) sont bases uniquement sur le calcul des mesures de
similarit entre les entits smantiques pour effectuer le processus d'appariement des
ontologies (voir section 2).
Ces mesures renvoient comme rsultat une valeur qui dtermine les entits
similaires (seulement la relation d'quivalence) des ontologies compares. Cela signifie que
ces mesures ne sont pas suffisantes pour la construction de l'ontologie globale. En outre, ils
ne peuvent pas rsoudre tous les problmes des quivalences entre les entits smantiques,
par exemple nous pouvons avoir la mme valeur pour deux calculs diffrents car ils
reposent sur des critres syntaxiques et structurels.
4. Conclusion
Ce chapitre introduit la notion de lintgration des ontologies. Nous avons
commenc par la prsentation des htrognits qui peuvent exister entre les diffrentes
ontologies et leurs impacts sur le processus de lintgration. Par la suite, nous avons dfini
le calcul des mesures de similarit entre les entits smantiques. Enfin, nous avons prsent
en dtail les types dintgration des ontologies.
Pour conclure, nous pouvons constater que lunicit de format de reprsentation de
la connaissance est un mcanisme qui facilite lintgration des diffrentes ontologies, et sert
amliorer la communication entre les diffrents acteurs dans un mme domaine. Dans le
chapitre suivant, nous proposons un systme pour lintgration des ontologies dcrites en
logique
de
description,
en
appuyant
notre
systme
sur
60
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
61
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
1. Introduction
Les tudes d'valuation ont montr que le mapping rsultant des approches
dappariement existantes soit il contient un montant quitable des erreurs ou bien il ne
couvre qu'une petite partie des ontologies concernes (Euzenat et al. 2006) (Euzenat et al.
2007) (Caracciolo et al 2008). Afin de pallier ces insuffisances, nous proposons de rduire
l'application des mesures autant que possible en utilisant des outils plus fiables comme le
raisonnement partir de cas (RPC) bas sur des mcanismes formels tels que la
subsomption.
Comme nous l'avons dj mentionn dans le chapitre1, les ontologies Web
smantique sont bases sur la relation de subsomption, o tout concept se compose dune
description propre dfinie par des proprits locales et dune description partage avec ses
subsumants (comme cest le cas entre une sous-classe et ses super-classes dans un langage
objets) (Napoli 1997). Cela implique que la comparaison des entits pour dduire des
relations smantiques entre eux peut bnficier de la comparaison de leurs subsumants
travers des petites modifications. La rutilisation de la solution d'un problme dj rsolu
pour rsoudre un autre problme similaire est le principe du RPC. Selon (Daquin, 2006),
Le mcanisme de RPC consiste rsoudre un problme cible, en adaptant la solution
dun problme source remmor de la base de cas, considr comme similaire au problme
cible.
Dans ce travail, nous proposons un nouveau systme (Kolli et Boufaida 2009)
(Kolli et Boufaida 2010) bas sur un mcanisme du RPC pour la dtection des relations
smantiques entre les entits smantiques des ontologies en utilisant les techniques
dextraction de connaissances dans des bases de donnes (ECBD) et la distance smantique
inspire par (Cullot et Jouanot 2003) et adapte aux logiques de description dans (Kolli et
Boufaida 2004).
Ce systme gnre une ontologie gnrique et extensible des relations smantiques
entre les entits smantiques. Nous avons dcrit cette ontologie avec le formalisme des
graphes conceptuels qui nous permet de reprsenter les cas dans une forme prcise, lisible
et utilisable par un ordinateur.
La suite de ce chapitre est organise comme suit: Dans la prochaine section, nous
prsentons brivement le cycle de vie du mcanisme du RPC. La section 3 dcrit de
manire dtaille le systme propos bas sur deux phases: la phase de conception et la
phase de production. Au cours du processus, nous utilisons un exemple pour bien expliquer
le fonctionnement du systme propos. Le chapitre se termine par une conclusion.
62
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Rutilisation. Cette tape permet dobtenir une solution au cas cible partir de la
solution du cas source slectionn qui est tout dabord recopie puis ventuellement
adapte afin de satisfaire les contraintes du problme pos. Ladaptation sappuie
sur des connaissances dadaptation qui peuvent prendre diffrentes formes selon les
systmes.
Rvision. Il est possible que la solution propose par le systme ne convienne pas
lutilisateur ou bien quune fois mise en application, elle savre inapte rsoudre
le problme pos. Lutilisateur a donc, pendant la phase de rvision, lopportunit
de modifier, corriger ou mme refuser la solution propose. Ltape de rvision
permet didentifier les causes ventuelles des checs et de proposer des adaptations
supplmentaires pour conduire une solution satisfaisante : il sagit du cas rvis.
Cette tape est la base du processus dapprentissage permettant la fois
damliorer des connaissances dadaptation existantes et den faire merger de
nouvelles.
63
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
64
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Personne TOP
Ensemble TOP
Algrien Personne
Homme Personne
Femme = personne (homme)
Mineur = personne ge.nombre < 18
Adulte = personne ge.nombre 18
Algerien
_membre
personne
membre.algrien
Equipe = ensemble membre.personne 2
membre
65
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Humain = nom.chane
addresse.chane
Mle TOP
Parent = humain enfant.humain
Femelle = Mle
Homme = humain sexe.mle
Femme = humain
sexe.femelle
66
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
De manire gnrale, un graphe conceptuel est dfini comme un graphe avec deux
types de nuds (Chawk 1996): les concepts et les relations conceptuelles,
-
Les concepts reprsentent dans notre situation les entits smantiques des deux
ontologies O1 et O2
O1
OA
O2
67
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Si le rsultat de la comparaison n'est pas floue, c'est dire: quil est gal une des
relations de l'ensemble: {, } alors: directement, nous ajoutons ce cas la base de cas
(l'ontologie OA). Mais, si le rsultat de la comparaison est flou, c'est dire: quil est gal
, alors: sa prcision sera calcul au niveau de ltape de la rutilisation.
{}
{
}
{
}
{
}
{
}
{&
&}
68
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Le calcul de la distance, appele distance globale, entre deux entits est calcule
partir de calculs de quatre distances lmentaires, deux distances lmentaires (DMC et
DC) sont appliques sur les concepts et les deux autres (Dr et Drj) sont appliques sur les
rles.
Ces distances prennent en compte les diffrents lments de l'environnement d'un
concept dans son contexte. Ces lments sont le domaine dont drive ventuellement un
concept, la terminologie du concept et les rles jous.
Le calcul de la distance globale s'effectue en quatre tapes. Chaque tape permet
soit de restreindre le nombre des concepts retenus comme potentiellement similaires, soit
d'affiner le calcul de la distance entre des concepts retenus aux tapes prcdentes.
Le premier calcul effectu se base sur les relations ventuelles des entits
smantiques avec leurs domaines de dfinition.
La distance Dr mesure la similarit entre des rles (resp. ri et rj) de deux concepts
(resp. C et C').
-
69
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Chaque rle du concept C est compar chaque rle du concept C'. Une matrice
des distances des rles est ainsi construite o chaque lment Dr(C.ri, C'.rj) compare le rle
ri de C avec le rle rj de C'.
(i) = 0 sinon.
70
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
On calcule tout d'abord une matrice de rapprochement qui compare deux deux les
concepts qui dfinissent les concepts C et C'.
La distance globale D(C, C) est calcule comme une pondration de la distance
DC(C,C'), de la distance Drj(C,C') qui mesure l'environnement des rles de C et C' et d'une
moyenne sur la matrice de rapprochement qui mesure les similarits entre les concepts qui
dfinissent les concepts C et C'.
Afin dinstancier notre base de cas (l'ontologie de l'alignement OA), nous prenons
toutes les entits primitives des deux ontologies O1 et O2 de lexemple que nous avons pris
et qui sont:
les rles primitifs : membre et age de O1 et les deux rles: enfant et sexe de O2.
Le premier problme ici (not pb1) est de trouver le relation smantique entre les
concepts racines des deux ontologies O1 et O2 c d: pb1 = Rel (personne, humain). La
rsolution de ce problme par le calcul de la distance smantique est comme suit :
1. Calcul de la distance DMC (humain, personne) :
DMC (humain, personne) = 1 (humain et personne sont du mme domaine).
2. Calcul de la distance DC (humain, personne) :
Humain est synonyme de personne donc : DC (humain, personne) = DMC(humain,
personne) = 1.
3. Calcul de la distance Dr (humain.ri, personne.rj) :
La distance Dr mesure la similarit entre des rles (ri et rj) de deux concepts
(humain et personne). Nous remarquons que les concepts : humain et personne nont aucun
rle. Donc Dr (humain.ri, personne.rj) = Drj (humain, personne) = 1.
71
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
()
e1
[humain]
s1
De la mme faon, nous appliquons la distance smantique sur les autres concepts
primitifs. Les rsultats de la comparaison entre ces concepts sont implments aussi en
graphes conceptuels, comme suit:
[ensemble]
[ensemble]
[algrien]
[algrien]
[homme]
()
e4
()
e5
e6
e7
e8
s2
()
e3
[personne]
[homme]
()
e2
()
()
()
s3
[mle]
[humain]
[humain]
s4
[humain]
s5
s6
s7
s8
[mle]
[humain]
[mle]
72
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Les trois premiers rsultats seront stocks dans l'ontologie de l'alignement OA. Les
autres rsultats (flous) seront dtermins aprs.
Les rsultats de la comparaison entre les rles primitifs des ontologies O1 et O2 sont
les suivants:
[age]
[ membre]
e10
[ membre]
e11
[age]
2.1.
()
e9
e12
()
()
()
[enfant]
s9
s11
s12
[sexe]
s10
[enfant]
[sexe]
Phase de production
Aprs avoir prsent les mcanismes et les outils utiliss, nous montrons dans cette
phase comment appliquer les tapes du RPC pour rsoudre le problme de La dtection
des relations de similitude et nous proposons quelques stratgies permettant cette dtection.
Le cycle du RPC que nous utilisons se dcompose en cinq oprations (figure
3.6) : llaboration, la remmoration, la rutilisation, la rvision et la mmorisation.
2.1.1. Llaboration
Cette tape permet la constitution de la premire partie du cas cible cest dire : le
problme, qui est dans notre cas la dtection de la relation de smantique entre deux
concepts des ontologies intgrer.
Dans la phase prcdente nous avons instanci notre base de cas avec les cas
suivant :
cas1 = (Rel (personne, humain), )
cas2 = (Rel (ensemble, humain), )
cas3 = (Rel (ensemble, mle), )
cas4 = (Rel (ge, enfant), )
cas5 = (Rel (membre, enfant), )
cas6 = (Rel (ge, sexe), )
73
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
3.2.2. La remmoration
Le but de la remmoration nest pas seulement de trouver le cas source le plus
similaire au cas cible, nous cherchons aussi le cas le plus facile adapter. Dans ce mme
esprit, Leake suggre quune bonne remmoration dun cas permet de faciliter leffort
dadaptation (Leake et al. 1997).
La remmoration repose traditionnellement sur les mesures de similarit
smantiques qui sont bases sur des hypothses et des rgles. Daprs (Cordier et al. 2006),
ces mesures peuvent conduire des rsultats mdiocres dans la mesure o elles permettent
parfois de se remmorer des cas sources, certes trs "ressemblants" au cas cible, mais
difficiles voire impossibles adapter. Cette observation montre la limite des mesures de
similarit au regard du processus complet de raisonnement.
Dans notre situation, les concepts en question sont organiss selon la relation de la
subsumption dans leurs ontologies de base. En effet, les concepts sont dfinis avec leurs
subsumants. Ainsi, les cas les plus faciles adapter sont ceux qui contiennent les subsumant
des concepts concerns.
Nous proposons que le processus de la dtection se fait tout dabord en largeur,
cest dire : il faut dterminer la relation de similitude entre un concept de lontologie O1 et
tous les concepts voisins de lontologie O2. En suite, rpter cette opration avec leurs
subsums. Dans ce cas, nous pouvons profiter de la relation de subsomption pour faciliter
leffort de ladaptation. En effet, les cas remmors sont donc les cas qui contiennent leurs
subsumants.
Dans lexemple prcdant le problme pb2 est la dtection de la relation smantique
entre les concepts parent et algrien _membre qui sont des concepts dfinis. Nous
remarquons que le concept humain est le subsumant du concept parent et le concept
personne est le subsumant du concept algrien_membre. En effet, le cas remmor est le
cas: cas1.
74
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Elaboration
Deduire la relation
entre les entits
Remmoration
Rutilisation
Base de
cas
Connaissances
dadaptation
La dtection de
rel(C,D)
Rvision
((C,D), rel(C,D))
Mmorisation
Figure 3.6 Le cycle du RPC utilis pour la dtection des relations smantiques des
entits smantiques
75
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
3.2.3.
La rutilisation
Cette tape consiste combiner les solutions des cas remmors et les adapter pour
trouver une solution au cas cible. Dans ce travail, nous nous appuyons sur le modle
dadaptation propos dans (dAquin et al. 2006) que nous prsentons brivement ci-aprs :
1. (srce, cible) pb, o pb encode les similarits et dissimilarits entre des
problmes srce et cible.
2. (pb, CA) sol, o CA est un ensemble de connaissances dadaptation et sol
encode les similarits et dissimilarits entre Sol(srce) et la solution Sol(cible)
construire pour cible.
3. (Sol(srce), sol) Sol(cible), Sol(srce) est modifi en Sol(cible) selon sol.
Ce modle est bas sur les techniques dextraction de connaissances dans des bases
de donnes (ECBD). Dans cette tape nous rappelons les diffrentes tapes du processus
dECBD et nous dtaillons la faon dont celles-ci sont effectues dans notre systme. Le
but de lECBD est dobtenir des connaissances partir de donnes. Le processus dECBD
se fait sous la supervision dun analyste, qui est un expert du domaine. Une fois
lacquisition des donnes ralise, il se droule en deux tapes: la prparation des donnes
et la fouille de donnes (Figure 3.7).
a.
La prparation des donnes est une tape de mise en forme et de slection des
donnes. Lopration de mise en forme met les donnes dans un format acceptable pour les
oprations de la fouille de donnes. La slection des donnes permet de concentrer la
fouille sur un sous-ensemble pertinent de concepts et dliminer les donnes bruites.
Ltape de prparation des donnes gnre un ensemble des concepts partir de la
base de cas BC, en appliquant successivement deux transformations.
La premire transformation formate chaque cas source remmor (srce,
Sol(srce)) en deux ensembles de proprits boolennes : (srce) et (Sol(srce)). Le
vocabulaire utilis pour dcrire les cas tant celui des ontologies initiales des concepts en
question, si srce = Relation(C, D) alors (srce) = ((C), (D)) = ({p1,C, . . . , pn,C}, {p1,D, . .
. , pn,D}), avec (p1,..., pn) sont les entits (concepts et des rles) qui dfinissent les concepts
C et D. Afin de comparer les concepts avec les concepts et les rles avec les rles, nous
avons mis c comme un indice pour indiquer les concepts et r pour indiquer les rles.
Pour l'exemple que nous avons pris, le cas source est: cas-srce = (Relation
(personne, humain), ) et le cas-cible = (Rel (parent, Algerien _membre), Sol (cible)).
76
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
L'application de la fonction sur le cas source et le cas cible est comme suit: (srce) =
{{Personnec}, {humainc}}, (Sol(srce)) = {} and (cible) = {{personnec, enfantr},
{humainc, membrer, algerienc}}
Cas
source1
Cas
sourcen
Cas
source2
Remmoration
Base des
Cas
Prparation des
donnes
Rutilisation
Fouille de
donnes
Le processus dECBD
Mmorisation
Cas
cible
Figure 3.7 La dtection des relations smantiques entre les ontologies avec un systme
RPC
77
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Toutes ces proprits sont relies des problmes et sont marques par pb1 et pb2.
pb1 correspond au deux premiers concepts de srce et cible et pb2 correspond au deux
derniers concepts de srce et cible. Nous comparons respectivement la premire et la
deuxime partie de srce avec la premire et la deuxime partie de cible. sol est calcul de
faon similaire et x = pb sol. Par exemple,
si
Alors : x ={a-pb1, c=pb1, b-pb1, d+pb1, a-pb2, d=pb2, c=pb2, -sol, +sol}
Aprs l'application de ce modle sur notre exemple:
x = {Personne=pb1,c, enfant+pb1,r, humain=pb2,c, membre+pb2,r, algerien+ pb2,c, -sol}.
b.
Fouille de donnes
78
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Composition
Dans l'infrastructure Web smantique, qui repose sur les LDs pour la construction
des ontologies, nous remarquons que les entits smantiques sont organises selon la
relation de subsomption. Cela, permet la dduction des relations de subsomption (, )
entre les concepts de la mme ontologie dune manire simple et directe.
Cette observation nous permettre de dire que la rutilisation des cas stocks dans
l'ontologie OA peut tre faite par l'opration de composition. Ainsi, s'il existe une relation
smantique entre le concept C1 de l'ontologie O1 et un concept C2 de l'ontologie O2 et une
autre relation smantique qui est la relation de subsomption entre le concept C2 et le
concept C3 de la mme ontologie (O2), alors il devrait tre possible dobtenir la relation
smantique entre les concepts C1 et C3.
Les rsultats possibles de cette composition sont indiqus dans la table 3.1.
Table 3.1 : Composition des relations smantiques
&
&
C1 R C2
C2 R C3
La preuve de ces rsultats est faite par la notion d'interprtation des LDs comme
suit:
1.
((C1 C2 C1I = C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
2. ((C1 C2 C1I C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
3. ((C1 & C2 (C1 C2 )I ) C1I C2I ) (C2 C3 C2I C3I)) ((C1
C3 )I C1 & C3)), (I).
4. ((C1 C2 C1I = C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
5. ((C1 C2 C1I C2I) (C2 C3 C2I C3I)) (C1I C3I C1 C3)), (I).
79
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
6. ((C1 C2 C1I C2I) (C3 C2 C3I C2I)) (C1I C3I C1 C3)), (I).
Toujours, selon la notion d'interprtation des LDs, on dduit quil existe des
rsultats floues () dans la table 3.1. Cela signifie que la composition de ces relations
gnre plusieurs rsultats.
Nous pouvons prendre par exemple le cas o nous avons: (C1 C2) et (C2 C3).
Cela implique: (C1I C2I) et (C2I C3I). Donc, nous pouvons dduire que: (C1I = C3I) or
(C1I C3I) or (C1I C3I). Dans ce cas, la relation entre C1 et C3 peuvent tre une des
relations de l'ensemble: {, , }.
Ainsi, l'application de l'opration de composition ces cas ne rsout pas le
problme de la dduction des relations. Pour la raison de la dtection de toutes les relations
possibles entre tous les concepts, nous proposons d'utiliser galement dans cette tape une
autre opration, qui est l'agrgation de similarit.
Dans l'exemple prcdent, nous avons le cas: (personne humain) stocks dans
l'ontologie OA1. Nous pouvons aussi dduire les deux cas: (homme personne) et
(Algrien _membre personne) de l'ontologie O1. Selon la table 3.1, l'application de
l'opration de composition ces cas nous donne comme rsultat les deux cas: (humain
homme) et (humain Algrien _membre).
Aussi, nous pouvons dduire selon la relation de subsomption les cas suivants:
(homme humain), (femme humain) et (parent humain) de l'ontologie O2.
Selon la table 3.1, l'application de l'opration de composition ces cas, nous donne
comme rsultat les cas suivants: (personne homme), (personne femme) et (personne
parent).
Agrgation de similarit
80
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
Proposition 1:
Soient C et D deux concepts dfinies comme suit: C = ( C1 Cv Cn Ci) et D
= ( D1 DU Dm Dj). Considrons les relations smantiques R1, R2, ... Rn
dduites entre les concepts Ci et Dj.
Aggreg(R1,R2, Rk) = R est la fonction d'agrgation applique aux relations
smantiques entre les diffrents concepts qui dfinissent les deux concepts C et D. Cette
fonction Renvoie la relation R entre les deux concepts C et D. La relation R peut tre
dduite comme suit:
1. Si (( Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) et (si les concepts C et D ne
sont que des conjonctions)) alors: Aggreg(R1,R2, Rk) = c d: C D.
2. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) alors: Aggreg(R1,R2, Rk) =
c d: C D.
3. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = ) et (Rt /t=1 ... k et t s tel que:
Rs = ) alors: Aggreg(R1,R2, Rk) = c d: C D.
4. Si ((Rs {R1, R2, Rk}/ s = 1 k, tel que: Rs = ) et ( Rt / t=1 k et t s tel
que: Rs = )) alors: Aggreg(R1,R2, Rk) = c d: C D.
5. Si (Rs {R1, R2, Rk}/s = 1 k, tel que: Rs = & ou Rs = ou Rs = ou Rs = )
alors: Aggreg(R1,R2, Rk) = & c d: C & D.
Il est facile de prouver la proposition 1 en utilisant la notion d'interprtation des
LDs: Soient R1, R2, ... Rn, les relations smantiques dduites entre les concepts Ci et Dj.
1.
81
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
3.2.4.
La rvision
82
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
3.2.5.
La mmorisation
Lopration dadaptation gnre de nouveaux cas qui doivent tre rajouts la base
de cas aprs la rvision. Ltape de la mmorisation consiste sauvegarder les nouveaux
cas:
(Rel (humain, homme), )
(Rel (humain, Algrien _membre), )
(Rel (personne, homme), )
(Rel (personne femme), )
(Rel (personne, parent), )
(Rel (parent, Algrien _membre), &) et
(Rel (parent, equipe), ).
e15
e16
e17
e19
()
()
e14
[Algrien _membre]
[quipe]
e13
()
s13
s14
s15
[humain]
[humain]
[personne]
()
s16
[personne]
()
s17
[personne]
(&)
e18
()
s19
s18
[parent]
[parent]
De la mme faon, nous dduisons les relations smantiques entre les diffrents
autres concepts des deux ontologies O1 et O2.
83
Kolli Manel.
Proposition dun systme de dtection des relations smantiques dans les ontologies base sur le RPC
4. Conclusion
La dtection des relations smantiques entre les diffrentes entits smantiques des
ontologies intgrer reprsente le cur du processus d'appariement par ce quelle permet la
construction de la hirarchie de lontologie globale.
Dans ce travail nous avons propos un systme qui permet la dtection de ces
relations pour intgrer des ontologies dcrites en logiques de description. Ce systme est
bas sur le raisonnement partir de cas qui permet la combinaison des relations dj
trouves entre les subsumants des entits smantiques en question pour dtecter les
relations smantiques entre eux. Ici, la dduction de ces relations est faite par l'agrgation
ou la composition des relations des subsumants. Les rsultats obtenus par ces oprations
sont valids par les mcanismes des LDs.
Nous avons utilis dans ce travail les techniques des logiques de descriptions, en
particulier, la subsomption qui a permit la remmoration des cas sources.
84
Kolli Manel.
85
Kolli Manel.
1. Introduction
Aprs avoir effectu la conception de notre systme bas sur un mcanisme
du RPC pour la dtection des relations smantiques entre les entits smantiques des
ontologies, nous allons prsent entamer la ralisation dune partie de ce systme.
Cette implmentation permet de valider la contribution propose en lappliquant dans
une tude de cas approprie.
Dans ce chapitre, nous nous focalisons sur deux principaux axes :
1) Les aspects techniques de limplantation de notre contribution.
2) Lapplication de lopration de composition dans une tude de cas.
Nous commenons par prsenter rapidement les technologies utilises,
savoir, Protg-OWL, lenvironnement de dveloppement et les frameworks
spcialises telle que OWL API pour la gestion de lontologie OWL. Ces aspects sont
importants dans la mise en uvre du prototype de lapplication. Ensuite, nous
prsentons quelques expriences effectues sur deux ontologies relles dcrites en
OWL pour valuer l'efficacit de l'opration de composition, et pour vrifier que la
solution propose renvoi des rsultats complets et prcis. Les rsultats obtenus
semblent trs prometteurs, en comparant avec les mappings d'un expert du domaine.
Le chapitre se termine par une conclusion.
86
Kolli Manel.
Protg-OWL est fourni avec une API crite en JAVA, qui permet de
dvelopper des applications pouvant accder aux ontologies de Protg et de
les manipuler (voir annexe).
Plusieurs versions d'un mme plugin peuvent cohabiter sur une mme
plateforme.
Un support multi langage grce des plug-ins ddis : Cobol, C, PHP, C#, ...
Malgr son criture en Java, Eclipse est trs rapide l'excution grce
l'utilisation de la bibliothque SWT (Standard Widget Toolkit) est dvelopp
en Java par IBM en utilisant au maximum les composants natifs fournis par le
systme d'exploitation sous jacent.
Une excution des applications dans une JVM ddie slectionnable avec
possibilit d'utiliser un dbogueur complet (points d'arrts conditionnels,
87
Kolli Manel.
88
Kolli Manel.
3. Etude de cas
Afin de motiver nos recherches dun point de vue pratique, nous proposons
dappliquer l'opration de composition dans une tude de cas approprie. La suite de
cette section dcrit le fonctionnement rel dune application ddie lintgration des
ontologies dcrites en logique de descriptions.
Nous avons choisi deux parties de deux ontologies qui sont du mme domaine
pour pouvoir reprsenter les cas spciaux, afin de prsenter une tude de cas qui
concrtise la mthode propose.
89
Kolli Manel.
90
Kolli Manel.
()
e1
()
e2
e3
e4
s1
()
s2
[humain]
[femelle]
s3
()
[humain]
s4
[femelle]
91
Kolli Manel.
[mineur]
[ensemble]
()
e5
e6
()
[adulte]
s5
s6
[adulte]
Ainsi, ces cas sont mis en uvre avec Protg OWL, comme suit (figure 4.3
et 4.4):
92
Kolli Manel.
4. Prototype
Le prototype que nous avons implmente dcoule de l'algorithme suivant
(Kolli et Boufaida 2011):
Donnes :
1) O1 et O2 : deux ontologies aligner
2) OA : ontologie initiale dalignement
Rsultat : OA : ontologie finale dalignement
dbut
/* parcours des classes de lontologie O1 */
pour chaque (cls1 O1) faire {
93
Kolli Manel.
94
Kolli Manel.
Program 1.
95
Kolli Manel.
if ( cls == desc )
{
10
11
if ( descequi == desc2)
{
12
13
14
15
16
17
18
manager.applyChange(addAxiom);
19
manager.applyChange(addAxiom1);
20
manager.saveOntology(OA);
}
}
96
Kolli Manel.
97
Kolli Manel.
5. Test et vrification
En ce qui concerne la mthode de test, pour valuer la qualit des rsultats de
lappariement, toutes les paires d'entits smantiques ont t apparies manuellement
pour avoir des mappings de l'expert. Les rsultats gnrs par notre programme ont
t compars avec les mappings de l'expert. La fentre gauche (Figure 4.6) montre
les cas des mappings dduits aprs lexcution du programme de composition. On
98
Kolli Manel.
peut aussi dire que notre ontologie est valide puisque tous les cas sont identiques aux
mappings de lexpert.
Nous constatons que les entits portant sur les cas prsents dans la table 3.1
sont bien apparies. Cette comparaison, bien que prliminaires, montre l'efficacit de
notre approche.
La vrification de la cohrence de notre ontologie dalignement OA a t
effectue grce au raisonneur FACT++ disponible sur protegeOWL. Lapplication de
ce raisonneur permet de dtecter les moindres anomalies et les incohrences de la
hirarchie de lontologie.
FACT++ est un classificateur, il permet la classification des concepts selon
leur dfinition en se basant sur les logiques de descriptions. En effet, il permet aussi le
test de classification. Comme le montre la fentre droite, la hirarchie des classes de
OA dduite par FACT++ est identique la hirarchie des concepts de OA aprs
lexcution de notre programme (Figure 4.5).
99
Kolli Manel.
100
Kolli Manel.
6. Conclusion
Dans ce chapitre, nous avons prsent les aspects techniques utiliss dans
notre approche, et lapplication de cette dernire dans une tude de cas.
Nous avons commenc par prsenter les aspects dimplmentation qui sont
utiliss dans notre travail. Limplantation repose essentiellement sur protegeOWL
pour ldition des ontologies, le langage JAVA et lenvironnement Eclipse pour le
codage, OWL API pour la gestion et linterrogation des ontologies OWL et FaCT++
pour la validation de lontologie dalignement.
Par la suite, nous avons appliqu lopration de composition dans une tude
de cas et les rsultats semblent trs prometteurs, en comparant avec les mappings
d'experts. A travers cette tude de cas, nous pouvons remarquer lapport de notre
contribution, en assurant une intgration smantique des ontologies base sur les
techniques des logiques descriptions.
101
Kolli Manel.
Conclusion gnrale
Conclusion gnrale
1. Contributions
Dans ce contexte, plusieurs contributions ont t dveloppes :
102
Kolli Manel.
Conclusion gnrale
Nous avons prsent les diffrents aspects techniques qui sont utiliss
dans limplantation de notre application. Ces aspects sont principalement, le
langage Java et lenvironnement Eclipse pour le codage, OWL API pour la gestion
et linterrogation des ontologies OWL et FaCT++ pour la validation de lontologie
dalignement. Par la suite, nous avons appliqu lopration de composition dans
une tude de cas et les rsultats semblent trs prometteurs, en comparant avec les
mappings d'experts. A travers cette tude de cas, nous pouvons remarquer lapport
de notre contribution, en assurant une intgration smantique des ontologies base
sur les techniques des logiques descriptions.
103
Kolli Manel.
Conclusion gnrale
2. Perspectives
Les travaux proposs dans cette thse nous permettent douvrir plusieurs
perspectives dont on peut citer :
Passage lchelle
104
Kolli Manel.
Bibliographie
Bibliographie
105
Kolli Manel.
Bibliographie
Bibliographie
106
Kolli Manel.
Bibliographie
Berners-Lee T., Hendler J. et Lassila O., 2001. The semantic web: A new form of
web content that is meaningful to computers will unleash a revolution of
new possibilities. Scientific American, 3: 3543.
Bennacer
N.
et
Aufaure
M.,
www.supelec.fr/d2ri/RR_06_07/RR_06_07_Chap7.pdf
2006.
107
Kolli Manel.
Bibliographie
Partir
de
Cas,http://www.sdc2006.org/cdrom/contributions/Cordier_et_al_IC06.pdf
Cullot N. et F. Jouanot, 2003. Context Comparison for Object Fusion. The 15th
Conference on Advanced Information Systems Engineering CAiSE03.
Klagenfurt/Velden, Austria, pp. 536-551.
DAquin M., 2006. Raisonnement partir de cas dcentralis pour le Web
smantique. http://hal.inria.fr/docs/00/06/57/13/PDF/daquin-final.pdf
DAquin M., F. Badra, S. Lafrogne, J. Lieber, A. Napoli et L. Szathmary, 2006.
Adaptation Knowledge Discovery from a Case Base. Proceedings of the
17th European Conference on Artificial Intelligence (ECAI-06). Trento,
Italy, pp. 795796.
Delteil A., 2002. Reprsentation et apprentissage de concepts et dontologies pour
le Web Smantique. Thse de doctorat, universit de Nice Sophia Antipolis
(UNSA).
Djaghloul Y., 2007. Intgration des ressources Web dans un environnement P2P,
base sur les ontologies et la gestion de la confiance. Thse de doctorat,
Universit Mentouri de constantine.
108
Kolli Manel.
Bibliographie
Dieng R., Corby O., Gandon F., Giboin A., Golebiowska J., Matta N. et Ribire
M., 2001. Mthodes et outils pour la gestion des connaissances : une
approche pluridisciplinaire pour le knowledge management, 2me dition,
Paris: Dunod.
Doan A., Madhavan J., Domingos P. et Halevy A., 2003. Ontology matching: A
machine learning approach. Handbook on Ontologies in Information
Systems. Springer-Velag.
Doan A., J. Madhavan, P. Domingos et A. Halevy, 2002. Learning to map between
ontologies on the semantic web. Proceedings of the Eleventh International
World Wide Web Conference. Hawaii, USA, pp. 662-673.
Dou D., Mcdermott D. et Qi P., 2002.Ontology translation by ontology merging
and
automated
reasoning.
http://cswww.cs.yale.edu/homes/dvm/papers/DouMcDermottQi02.pdf
Ehrig M. et Staab S., 2004. Qom quick ontology mapping. International Semantic
Web Conference (ISWC2004), Japan, pp. 683-697.
Elbyed A., 2009. ROMIE, une approche dalignement dontologies base
dinstances. Thse de doctorat de lINSTITUT NATIONAL DES
TELECOMMUNICATIONS dans le cadre de lcole doctorale S&I en coaccrditation avec lUNIVERSITE DEVRY-VAL DESSONNE.
Euzenat J., M. Mochol, P. Shvaiko, H. Stuckenschmidt, O. Svab, V. Svatek et al.,
2006. First results of the ontology alignment evaluation initiative 2006.
Proceedings of the ISWC workshop on Ontology Matching. Athens,
Greece, pp. 73-95.
Euzenat J., Isaac, C. Meilicke, P. Shvaiko, H. Stuckenschmidt, O. Svab et al.,
2007. Results of the Ontology Alignment Evaluation Initiative 2007.
International Semantic Web Conference 2007. Busan, Korea.
Fensel D., Horrocks I., van Harmelen F. et De S., 2000. Oil in a nutshell. In
Proceedings of European Knowledge Acquisition Workshop
(EKAW2000), 1937: 1-16.
Frst F., 2002. L'ingnierie Ontologique. Rapport de recherche, Institut de
Recherche en Informatique de Nantes, France.
109
Kolli Manel.
Bibliographie
P.
A.,
1999b.
Tutorial
http://www.dsv.su.se/ijcai-99/
on
Ontological
Engineering.
110
Kolli Manel.
Bibliographie
111
Kolli Manel.
Bibliographie
112
Kolli Manel.
Bibliographie
113
Kolli Manel.
Bibliographie
Napoli
aux
logiques
de
descriptions.
Neeches R., Fikes R. E., Finin T., Gruber T. R., Senator T. et Swartout W. R.,
1991. Enabling technology for knowledge sharing. AI Magazine. 12: 3656.
Noy N. et Musen M., 2000. PROMPT: Algorithm and Tool for Automated
Ontology Merging and Alignment. Seventeenth National Conference on
Artificial Intelligence. Austin, Texas, pp. 450455.
Noy N. et Musem M., 2001. Anchor-prompt: Using non-local context for semantic
matching. Workshop on Ontologies and Information Sharing at the
Seventeenth International Joint Conference on Arti.cial Intelligence,
Seattle, WA. pp. 63-70.
Noy N. et Musen M. A., 2002. Evaluating ontology-mapping tools: requirements
and
experience,
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.19.3489.
Noy N., 2004. Semantic Integration : A Survey of Ontology-based Approaches.
http://citeseerx.ist.psu.edu/viewdoc/ download?doi=10.1.1.133.1384
Omelayenko B., 2003. Rdft: A mapping meta-ontology for web service
integration, Knowledge Transformation for the Semantic Web, IOS Press,
Amsterdam, pp. 137153.
OReilly T., 2005. OReilly Network : What Is Web 2.0 : Design Patterns and
Business Models for the Next Generation of Software.
http://www.oreillynet. com/lpt/a/6228.
OWL
API
version
3.0.0,
http://sourceforge.net/projects/owlapi/files/OWL
2.0%29/3.0.0/owlapi-3.0.0.zip/download
28/01/
API %28for
2010,
OWL
114
Kolli Manel.
Bibliographie
2003.
http://sticef.univ-
Psych V., 2007. Rle des ontologies en ingnierie des EIAH : Cas dun systme
dassistance au design pdagogique. Thse de doctorat, Universit du
Qubec, Canada.
Rahm E. et Bernstein P., 2001. A survey of approaches to automatic schema
matching. The VLDB Journal, 10:334350.
RDF. Resource Description Framework Model and Syntax Specification. http:
//www.w3.org/TR/REC-rdf-syntax/, 1999.
RDFS. Resource Description Framework Schema Specification 1.0. http:
//www.w3.org/TR/2000/CR-rdf-schema-20000327/, 2000.
Sad
115
Kolli Manel.
Bibliographie
smantique
et
ontologies
:
notes
de
cours.
2011.
http://www.loria.fr/~coulet/Teaching_files/esial_3_il_plbc_ws_poly.pdf
116
Kolli Manel.
Bibliographie
117
Kolli Manel.
Rsum :
La dtection des relations de similitude entre les entits smantiques (concept
et rle) des ontologies est une des principales difficults rencontres durant le
processus de lintgration des ontologies. Dans le web smantique, ces
ontologies sont dcrites en logiques descriptions. En effet, les entits
smantiques sont organises selon le mcanisme de la subsomption dans leurs
ontologies. La comparaison des concepts pour dduire les relations de
similitude entre eux pourra bnficier des comparaisons de leurs subsumants ou
bien de leurs voisins travers des petites modifications ou bien sans aucune
modification. La rutilisation de la solution dun problme dj rsolu pour
rsoudre un autre problme similaire est le principe du raisonnement partir de
cas (RPC). Dans ce travail nous proposons un systme bas sur le RPC
pour la dtection des relations de similitude entre les entits smantiques des
ontologies qui distingue plusieurs phases : la phase de conception, la phase de
production et la phase de maintenance.
Mots cls
Ontologies, relations smantiques, web smantique, mapping, raisonnement
partir de cas, subsomption, entits smantiques.
Abstract
The detection of the semantic relations among the semantic entities (concept and
role) of ontologies is one of the principal difficulties faced during the process of
the ontology integration. In the Semantic Web, these ontologies are expressed as
Description Logics (DLs) knowledge bases. Indeed, the semantic entities are
organized according to the mechanism of subsumption in their ontologies. This
organization implies the existence of these entities in the intentional definitions
of their subsumee. Thus, the detection of the semantic relations among semantic
entities can be done through the combination of the semantic relations of their
subsumers with small modifications. The reuse of the solution of a problem
already solved to solve another similar problem is the principle of case-based
reasoning (CBR). The objective of this study is to develop a new system based
on a CBR to infer the semantic relations by using the techniques of knowledge
discovery from databases (KDD) and the semantic distance.
126
Kolli Manel.
Keywords
Ontologies, semantic relations, Semantic Web, mapping, CBR, subsumption,
semantic entities.
127
Kolli Manel.