Sunteți pe pagina 1din 12

S emantique des folksonomies:

structuration collaborative et assist ee


Freddy Limpens
1
, Fabien Gandon
1
, Michel Buffa
2
1
Edelweiss, INRIA Sophia-Antipolis, France, 2004 route des lucioles - BP 93,
FR-06902 Sophia-Antipolis Cedex
{freddy.limpens, fabien.gandon}@sophia.inria.fr
2
KEWI, Laboratoire I3S, Universit e de Nice, France
buffa@unice.fr
R esum e : Lessor du tagging et des folksonomies pour lorganisation des res-
sources partag ees au sein du Web social et collaboratif constitue une opportunit e
pour lacquisition des connaissances par ceux-l` a m eme qui les manipulent. Ce-
pendant labsence de liens s emantiques entre les tags, ou la variabilit e d ecriture
de certains tags appauvrissent les potentiels de navigation et de recherche dinfor-
mation. Pour rem edier ` a ces limitations, nous proposons dexploiter linteraction
entre les utilisateurs et les syst` emes ` a base de folksonomies pour valider ou inva-
lider des traitements automatiques effectu es sur les tags. Ces op erations se basent
sur notre mod` ele pour lassistance ` a la structuration des folksonomies qui autorise
des vues conictuelles portant sur les liens entre les tags, tout en permettant aux
concepteurs des syst` emes dexploiter la diversit e de ces descriptions s emantiques
an doffrir des fonctionnalit es de navigation enrichies.
Mots-cl es : Folksonomies, Ontologies, Partage de Connaissances
1 Introduction
Le social tagging sest r ecemment impos e dans le paysage du web social et collabo-
ratif (Web 2.0) comme support ` a lorganisation de ressources partag ees en permettant
aux utilisateurs de cat egoriser ces ressources, simplement en leur associant des mots
clefs, appel es tags. Les folksonomies constituent le r esultat de la collecte de tags ainsi
cr e es, cest ` a dire associ es ` a des ressources par des utilisateurs. Lexploitation des folk-
sonomies pour la recherche dinformations et de ressources pose n eanmoins quelques
probl` emes. La variabilit e d ecriture entre certains tags equivalents (comme electricit e
et electricite), ou labsence de liens s emantiques entre les tags sont p enalisantes lors
dune recherche de ressources par tags. De nombreux travaux de recherche, recens es
dans une pr ec edente contribution (Limpens et al., 2008), tentent de d epasser les limi-
tations des folksonomies en les rapprochant de repr esentations s emantiquement struc-
IC 2009
tur ees. Ainsi, certains tentent de constituer des ontologie l eg` eres
1
` a partir de folkso-
nomies (Mika, 2005), ou dassister les cycles de vies des ontologies en les nourrissant
des notions extraites des folksonomies (Passant, 2007). Dautres approches proposent
dimpliquer les usagers directement dans la construction dontologies l eg` eres bas ees sur
les formalismes du Web S emantique (Braun et al., 2007), ou sur le mod` ele HyperTopic
du Web Socio-S emantique (Cahier et al., 2007).
Notre contribution se concentre sur les syst` emes ` a base de folksonomies outillant le
partage de connaissances au sein de groupes de personnes appartenant ` a des r eseaux
dint er ets communs, et regroup es autour de lusage dune m eme plateforme. Le type
de syst` eme que nous envisageons permet ` a ses utilisateurs de contribuer au partage,
au commentaire, ` a lindexation, et ` a l elaboration de documents de natures diverses
(photos, bookmarks, pages de wiki, etc.). En tant que ressource le bookmark a un statut
particulier, car il constitue ` a la fois un support pour documenter les traces de lectures,
mais egalement, et comme par effet secondaire d` es quil est partag e et associ e ` a des
tags, une opportunit e pour lindexation et la (multi)cat egorisation collaborative. A ce
titre, nous pensons que les pratiques de bookmarking social du Web 2.0 peuvent etre
adapt ees ` a l echelle plus restreinte des organisations et des communaut es dint er ets. Le
projet ANR ISICIL auquel nous participons sint eresse notamment ` a une adaptation de
ces outils et usages pour les appliqu ees ` a la veille technologique et economique.
Dans cet article nous proposons des m ethodes pour constituer des ontologies l eg` eres
qui peuvent etre exploit ees, par exemple, pour sugg erer des termes s emantiquement
proches lors dune recherche de documents par tags, ou encore pour enrichir les r esultats
dune requ ete par les variantes orthographiques dun m eme tag, ou spelling variant,
comme ecologie et ecologie. Pour atteindre cet objectif, nous proposons dallier
des traitements automatiques sur les folksonomies et lexpertise des utilisateurs en leur
proposant, dune part, de valider ou invalider les r esultats de ces traitements, et dautre
part, de sugg erer certaines propri et es s emantiques entre les tags ` a travers des fonction-
nalit es simples et ergonomiques de linterface. Ce syst` eme est bas e sur notre mod` ele
qui, plut ot que de r epercuter et repr esenter explicitement les traitements automatiques
des tags, permet, dans un premier temps, de recueillir les r esultats de ces traitements
ainsi que les op erations de validation des utilisateurs. Lexploitation de ces r esultats
est alors repouss ee aux etapes ult erieures, par exemple lors du tri ou du ltrage des
r eponses ` a une requ ete.
Notre article est organis e de la mani` ere suivante. Dans la section 2, nous pr esentons
les principales m ethodes propos ees pour etablir des liens s emantiques entre les tags
dune folksonomie, avant de d etailler notre m ethode pour lenrichissement s emantique
des folksonomies. Nous pr esentons ensuite dans la section 3 limplantation de cette
m ethode dans un syst` eme de gestion et dexploration de bookmarks tagu es et partag es.
Puis, en section 4, nous positionnerons et discuterons les apports de notre approche,
avant de conclure en section 5.
1. Gandon (2008) d enit les ontologies l eg` ere comme etant des ontologies qui ne comportent typique-
ment pas ou peu de d enitions formelles et qui se focalisent souvent sur la repr esentation de hi erarchies de
types ne n ecessitant pas des langages tr` es expressifs (ex : RDFS)
S emantique des folksonomies
2 Pr esentation de notre approche
2.1 Sc enario dapplication
Ce travail trouve un terrain dapplication dans le cadre dun partenariat avec lAdeme
(Agence pour lEnvironnement et la Matrise de lEnergie) o` u nous cherchons ` a evaluer
la validit e des usages li es aux outils du Web 2.0 dans le contexte dune organisation
professionnelle. Lun des sc enarios dapplication envisag es ici est lassistance aux pra-
tiques de veille, et plus particuli` erement la recherche dinformation et le partage de
ressources au sein dun groupe dexperts. Nous souhaitons ainsi promouvoir lusage
du bookmarking et du tagging social des ressources internes et partag ees, ainsi quune
int egration, dans les t aches quotidiennes des usagers, de lorganisation s emantique des
folksonomies.
2.2 Traitements sur les folksonomies
Une des limitations couramment reconnue aux folksonomies (Mathes, 2004) est la
variabilit e d ecriture des tags suppos es equivalents comme ecologie et ecologie.
Une solution possible pour traiter ce probl` eme consiste ` a mesurer la distance d edition
entre les tags (par exemple de type distance de Levenshtein (1966)), et au del` a dun
certain seuil, de consid erer ces tags equivalents. Specia & Motta (2007) ont appliqu e
cette m ethode sur un extrait de la folksonomie de delicious.com, et exploit e des bases
de connaissances externes (Wordnet) et quelques r` egles simples pour s electionner le
libell e du tag le plus repr esentatif de ses variantes orthographiques.
Un autre type de traitement des folksonomies consiste ` a mesurer la distance de simi-
larit e entre tags en se basant sur les liens entre les tags, les ressources, et les utilisateurs
(Mika, 2005). (Cattuto et al., 2008) distinguent sur ce point diff erents types de mesures
de similarit e : les mesures bas ees sur une fr equence de cooccurrence simple de deux
tags sur une m eme ressource, ou les mesures distributionnelles, qui prennent en compte
trois types de contextes dassociation des tags. Chaque contexte correspond ` a un es-
pace vectoriel pr elev e dans lespace vectoriel global de la folksonomie. Les mesures
distributionnelles prennent en compte lassociation des tags : (1) via leur usage par un
m eme utilisateur (contexte utilisateur-tag), ou (2) via leur usage pour une m eme res-
source (contexte ressource-tag), ou (3) via leur associations communes avec dautres
tags (contexte tag-tag).
An de caract eriser en termes s emantiques ces diff erentes mesures de similarit es
entre tags, Cattuto et al. proposent dexploiter la structure hi erarchique de Wordnet
(Fellbaum, 1998) pour les tags dont le libell e est pr esent dans cette base lexicale. Lis-
sue de cette exp erience montre que les tags associ es via des mesures de cooccurrences
simples tendent ` a entretenir des relations de subsomption, alors que les tags associ es
via une mesure distributionnelle de similarit e dans le contexte tag-tag tendent ` a se si-
tuer au m eme niveau hi erarchique, soit partageant le m eme parent, soit le m eme grand-
parent. Cattuto et al. expliquent que lassociation des tags via leur cooccurrence sur
une m eme ressource renvoie ` a leur utilisation simultan ee dans le m eme acte de tagging
o` u lusager a tendance ` a couvrir diff erents niveaux de g en eralit e. Par exemple, les tags
java et programming, ou encore tobuy et shopping sont fr equemment utilis es
IC 2009
simultan ement, et on peut supposer que, du point de vue du tagueur, ces tags ont des
niveaux diff erents de g en eralit e. Le lien mesur e par la mesure distributionnelle dans le
contexte tag-tag associe des tags ayant des sch emas de cooccurrence similaires mais
qui ne sont que peu ou pas utilis es simultan ement. Ce cas de gure correspond par
exemple aux tags tobuy et whishlist qui ne sont pas utilis es simultan ement mais
plut ot conjointement avec le tag shopping.
La principale limite ` a lutilisation de Wordnet comme base de connaissance est que
cette ressource termino-ontologique inclue peu de termes sp eciques ` a un domaine,
alors quils sont fr equents dans les folksonomies. Des ressources plus sp eciques ` a un
domaine pourrait donc permettre d elargir la port ee de la validation s emantique des
liens de similarit es entre certains tags. Cependant la raret e de telles ressources, et la
limite de leur couverture dun domaine repousse toujours plus loin le probl` eme. Lex-
pertise des utilisateurs dun syst` eme semble en d enitive la plus adapt ee, mais aussi
la plus complexe ` a exploiter si on cherche autant que possible, an d eviter toute sur-
charge cognitive, ` a limiter leffort de contribution n ecessaire ` a la formalisation de cette
expertise.
2.3 R eication des assertions s emantiques sur les tags
Lobjectif de notre mod` ele est de permettre la description des relations s emantiques
qui peuvent exister entre des tags, tout en prenant en compte le caract` ere discutable des
assertions portant sur ces relations s emantiques, et ceci autant lorsquelles sont le fruit
dun processus automatique que de laction dun utilisateur. Ainsi, chaque proposition,
validation, ou invalidation de relation s emantique devient un ev enement dont le syst` eme
garde une trace. A cette n nous proposons un sch ema RDF/s qui d ecrit les notions
dassertions et de relations s emantiques en sp eciant les liens quelles entretiennent
avec dautres notions issues notamment du mod` ele RDF de r eication des assertions
2
.
Dans notre mod` ele (voir gure 1), une assertion portant sur la relation s emantique
entre deux tags dune folksonomie est repr esent ee par une classe RDF/s (TagSemantic-
Statement) reli ee (par la propri et e hasSemanticRelation) ` a une autre classe
d ecrivant la relation s emantique en question (SemanticRelation et ses sous-types).
De plus, un utilisateur (sioc:User
3
, qui peut etre aussi un agent automatique) agit
sur une assertion s emantique quil peut avoir propos ee (hasProposed), approuv ee
(hasApproved) ou rejet ee (hasRejected) ; une assertion s emantique h erite des
propri et es de la classe rdf:Statement et a donc un sujet (tag subject sous-
type de rdf:subject) et un objet (tag object sous-type de rdf:object). La
notion de relation s emantique permet de sp ecier, a minima, quil existe une relation
s emantique entre deux tags, relation qui est sp eci ee par ses sous-types dont les si-
gnications sont inspir ees des propri et es de lontologie SKOS
4
: plus particulier
(Narrower) ; plus g en eral (Broader) ; s emantiquement reli e (Related), qui
peut etre pr ecis ee par diff erents types de mesures de similarit es ; et enn variations
2. voir http ://www.w3.org/TR/rdf-mt/#Reif
3. voir http ://rdfs.org/sioc/spec/
4. Simple Knowledge Organisation System, http ://www.w3.org/2004/02/skos/
S emantique des folksonomies
FIGURE 1 R eication de la notion de relation s emantique
orthographiques (SpellingVariant), qui peut par exemple etre sp eci ee par la
distance de Levenshtein entre les deux tags.
Notre mod` ele inclue des ontologies d ej` a existantes comme SIOC(Bojars et al., 2008),
ou SCOT (Kim et al., 2007). Le mod` ele SIOC permet de dissocier la notion de personne
de celle dutilisateur, et nalement dusage propre, car une personne peut avoir autant
dinstances de sioc:User que de comptes dans divers services. De plus, le ratta-
chement de chaque instance sioc:User ` a un prol FOAF (Brickley & Miller, 2004)
permet ` a toute personne de r eunir et de g erer en un seul point dacc` es toute son activit e
en ligne. Lontologie SCOT r eie egalement la notion de tagging (en se rattachant ` a la
Tag-Ontology de Newman et al. (2005)) en liant tout ev` enement de tagging ` a un compte
foaf:OnlineAccount, lui m eme caract eris e par un type pr ecis de plateforme web
(blog, forum, etc.). Ainsi, la formalisation de lacte de tagging nous semble conserver
la nature duale du tag, soulign ee par Monnin (2009)
5
, qui est ` a la fois chane de cha-
ract` eres interpr etable (ici captur e comme label de linstance de la classe scot:Tag),
mais aussi etiquette mat erielle associ ee ` a la ressource tagu ee dans le cadre dun usage
pr ecis et fortement conditionn e.
5. que nous rejoignons par ailleurs ` a propos de laccent qui doit etre mis sur le design informationnel
des plateformes d echanges de connaissances, en n ecessaire compl ement aux analyses plus sp eciquement
s emantiques.
IC 2009
tag1 tag2 Distance de Levenshtein
informatique information 0.75
geographie geographique 0.83
d echets d echet 0.85
industrie industriel 0.9
d eveloppementdurable d eveloppement-durable 0.95
TABLE 1 Distance de Levenshtein pour certains couples de tags
3 Implantation et r esultats
3.1 D etecter les variations orthographiques
En suivant lexemple de Specia & Motta (2007), nous avons utilis e la m ethode de
Levenshtein
6
pour mesurer la distance d edition entre deux chanes de caract` eres, ceci
dans le but de d etecter les variations orthographiques de tags suppos es equivalents.
Le tableau 1 montre les valeurs de la distance de Levenhstein pour une s erie de tags
extraits dun echantillon des bookmarks dutilisateurs de delicious.com ayant utilis e au
moins deux fois le tag ademe
7
(ou ses variantes orthographiques). A la lecture de
ce tableau nous voyons quil est d elicat de trouver une valeur permettant de dire dans
tous les cas que deux tags sont equivalents. Une mani` ere de rem edier ` a ces limitations
serait demployer un dictionnaire, ainsi que certaines r` egles heuristiques pour valider
l equivalence de deux tags dont la mesure de distance d edition pour passer de lun ` a
lautre passe un certain seuil, ou encore de combiner diff erentes mesures d editions.
Lid ee etant, dans le cadre de cet article, dillustrer nos id ees relatives ` a la validation
de traitements automatiques par les utilisateurs, et dans lattente du d eveloppement de
ces am eliorations, nous avons choisis pour notre implantation une valeur seuil de la
distance de Levenshtein entre deux tags egale ` a 0,83.
3.2 D etecter les tags th ematiquement proches
Nous proposons dans cette partie une m ethode qui permet de sugg erer des tags th ema-
tiquement proches. Nous nous appuyons dans ce sens sur les r esultats de l etude de
Cattuto et al. (2008) qui sugg` erent dans ce cas lutilisation dune mesure distribution-
nelle de similarit e bas ee sur le contexte tag-tag, par contraste avec les autres mesures
distributionnelles ou les mesures bas ees sur la simple cooccurrence qui ont tendance ` a
re eter des liens de types hi erarchiques. Cette mesure consiste tout dabord, pour deux
tags t
1
et t
2
, ` a calculer leurs vecteurs associ es v
1
et v
2
, o` u v
ik
correspond ` a la valeur
de cooccurrence des tags t
i
et t
k
qui est augment ee dune unit e ` a chaque fois que les
tags t
i
et t
k
sont employ es pour le m eme bookmark. La mesure de similarit e entre t
1
6. telle quimplant ee par http ://www.dcs.shef.ac.uk/sam/simmetrics.html
7. ademe correspond ` a lanagramme de Agence De lEnvironnement et de la Matrise de lEnergie.
Notre echantillon se compose des 6054 bookmarks post es par 16 utilisateurs, ayant associ e, globalement,
5153 tags distincts ` a 5969 URL distinctes.
S emantique des folksonomies
voiture auto (0.81), automobile (0.83), co2 (0.85), pollution (0.83)
d eveloppement durable (0.88), ecologie (0.8)
construction habitat (0.95), isolation (0.92), pdf (0.77)
solaire photovoltaque (0.74)
r eglementation logement (0.79), thermique (0.82)
TABLE 2 Pour un tag donn e, tags ayant une valeur de similarit e dans le contexte
tag-tag sup erieure ` a 0.7
et t
2
correspond quant ` a elle au cosinus de langle entre les vecteurs v
1
et v
2
, soit :
cos(v
1
, v
2
) =
v
1
.v
2
v
1

2
.v
2

2
.
Le tableau 2 nous montre une s election de tags ayant une valeur de similarit e (contexte
tag-tag) sup erieure ` a 0, 7. Pour ces mesures, nous avons pr elev e une partie de notre jeu
de donn ees en ne conservant que les tags associ es aux 100 bookmarks ayant et e tagu es
avec le tag ademe (ou une de ses variantes orthographiques)
8
. Nous pouvons ob-
server que les liens inf er es re` etent bien les relations th ematiques li ees au domaine de
lenvironnement, hormis pour le tag pdf qui est associ e au tag construction. Ceci
peut sexpliquer par le fait que le tag pdf ait pu etre associ e souvent aux autres tags
li es au tag construction, simplement car les documents taggu es etait au format .pdf.
3.3 Int egration dans un syst` eme de gestions de bookmarks
Le syst` eme que nous proposons pour illustrer notre propos est un syst` eme de naviga-
tion au sein dune base de bookmarks extraits de delicious.com (le jeu de donn ees utilis e
ici est le m eme que celui d ecrit ` a la section 3.1). Dans notre mod` ele, nous avons for-
malis e la notion de bookmark ` a laide de la classe Bookmark qui est une sous-classe
de la classe sioc:Item, faisant du bookmark un document au m eme titre quun billet
de blog (sioc:Post). De plus, les propri et es scot:tagOf et scot:hasTag re-
lient le bookmark ` a un ou plusieurs tags, et la propri et e sioc:about le relie ` a une
ressource (en tant que rdf:Ressource), ce qui rend compte de lindexation faite via
les bookmarks et permet de retrouver les tags associ es ` a une ressource ` a laide dune
simple requ ete SPARQL
9
.
Notre syst` eme sappuie egalement sur notre mod` ele de r eication des relations s eman-
tiques et se compose dagents automatiques effectuant en t ache de fond des traite-
ments sur les folksonomies, et dune interface dexploration de la base de bookmarks.
Limpr ecision et le caract` ere discutable des traitements automatiques d ecrits ci-dessus
(cf. sections 3.1 et 3.2) rendent d elicate leur application syst ematique. Nous proposons
donc de donner la possibilit e aux utilisateurs du syst` eme de contribuer ` a la validation
ou linvalidation des relations s emantiques automatiquement sugg er ees entre les tags
quils manipulent. La gure 2 montre, lors de la recherche de bookmarks par tag, un
exemple de fonctionnalit e s emantique sugg er ee par linterface qui propose une liste
8. cet extrait du jeu de donn ees se compose donc des 100 bookmarks des 75 utilisateurs ayant associ e,
globalement, 221 tags distincts ` a 107 URL distinctes.
9. SPARQL Query Language for RDF : http ://www.w3.org/TR/rdf-sparql-query/
IC 2009
de ressources associ ees ` a un tag et ses variations orthographiques (spelling variant)
calcul es gr ace ` a la distance de Levenshtein (la valeur seuil utilis ee est 0,83). La fonc-
tionnalit e sugg er ee en question consiste ` a retirer un des termes de la liste des termes
equivalents en cliquant sur la croix rouge encercl ee situ ee ` a c ot e de chaque terme.
Le recours ` a la fonctionnalit e s emantique propos ee reste optionnelle, car lutilisateur
est libre dinterpr eter les r esultats et peut tout ` a fait conserver les termes sugg er es (in-
dustrial et industriel pour industrie). Si toutefois lutilisateur d esire retirer lun de
ces termes, notre mod` ele laisse le choix aux concepteurs du syst` eme dappliquer cette
assertion s emantique (le tag industrial nest pas equivalent ` a industrie) pour toutes
les requ etes futures dautres utilisateurs, ou dun certain groupe dutilisateurs seule-
ment, ou simplement de ce m eme utilisateur (comportement que ce dernier attendra
certainement en toute logique).
Cet exemple montre la capacit e de notre mod` ele ` a supporter les actions contradic-
toires ou conictuelles des utilisateurs. En effet, lorsquun utilisateur choisit de retirer
le terme industrial, le syst` eme g en erera une annotation rendant compte de cette ac-
tion. Cette annotation sajoutera ` a celle rendant compte du lien d equivalence entre
industrie et industrial, sans lannuler pour autant. Ainsi notre mod` ele permet que
laction dun utilisateur nannule pas syst ematiquement celle dun autre lorsque ces
deux actions sont conictuelles. La d ecision nale revient aux concepteurs du syst` eme
qui peuvent choisir diff erentes politiques dapplications des actions de validation
par les utilisateurs. Plusieurs solutions sont en effet possibles pour g erer les situations
conictuelles : il est possible de (1) rendre visible ces divergences en les organisant en
points de vue qui sont explicitement montr es ` a lutilisateur, ou (2) dappliquer ces diver-
gences diff eremment selon lappartenance des utilisateurs ` a des sous-groupes dint er et
identi es par ailleurs au sein de lorganisation consid er ee, ou encore (3) de propo-
ser un syst` eme de vote au sein des groupes dutilisateurs pour s electionner lassertion
s emantique ` a conserver.
4 Positionnement et discussion
Dans le cadre de la recherche sur le Web social et s emantique, plusieurs applications
concr` etes ont implant e des fonctionnalit es s emantiques pour organiser des contenus par-
tag es. Les concepteurs de Revyu.com (Heath & Motta, 2007) proposent dexploiter les
formalismes du Web s emantique an de faciliter linterop erabilit e entre les plateformes
de partages de contenus et d eviter les redondances inutiles. Passant & Laublet (2008)
proposent un mod` ele (MOAT) et des outils qui permettent dassocier les diff erents sens
dun tag ` a des documents contenant la d enition vis ee, ou ` a des concepts dontologies
du Web S emantique. CartoDD (Cahier et al., 2007) est lexemple dun autre type dap-
proche bas ee sur les formalismes du Web Socio-S emantique (Zacklad et al., 2007), et
qui propose deffectuer une cartographie de contenus ` a laide de cartes de th` emes multi
points de vue construites collaborativement par les utilisateurs.
Notre approche quant ` a elle se d emarque de celle de Passant & Laublet (2008) en
d ecrivant, dans un premier temps, le sens des tags gr ace ` a des relations s emantiques
entre les tags (plus g en eral ou plus particulier) sans pour autant sinterdire, par la
suite et de mani` ere ind ependante, de relier les concepts ainsi quali es ` a des concepts
S emantique des folksonomies
FIGURE 2 Exemple de fonctionnalit e s emantique sugg er ee par linterface pour retirer
un tag non- equivalent
dontologies plus formelles lorsque cela est pertinent pour nos usagers. Notre but est
de construire en premier lieu des ontologies l eg` eres qui sapparenteraient aux th esaurus
tels que mod elis es par le sch ema SKOS, et quil est toujours possible ensuite de rappro-
cher dautres ontologies, formelles ou non, soit en adaptant des techniques dalignement
(Euzenat & Shvaiko, 2007), soit en les mettant en perspectives sous des points de vues
diff erents et explicit es dans linterface, ` a la mani` ere de (Cahier et al., 2007) qui ont
int egr e le th esaurus GEMET
10
comme un des points de vue de lontologie s emiotique
mise en uvre dans le syst` eme CartoDD
11
.
Nous cherchons donc ` a augmenter les syst` emes invitant les usagers ` a contribuer di-
rectement ` a l elaboration de vocabulaires partag es en ins erant des fonctionnalit es dor-
ganisation s emantique dans les interfaces de recherche et de navigation. Ces fonction-
nalit es consistent ` a permettre aux utilisateurs de valider ou corriger des suggestions
automatiques de termes pertinents pour une recherche dinformations. Elles doivent
egalement rester les moins intrusives possibles an de ne pas perturber les autres t aches
des usagers. Les solutions en cours d elaboration pr esent ees dans cet article peuvent
etre vues comme des fonctionnalit es compl ementaires dautres outils collaboratifs ex-
plicitement d edi es ` a lenrichissement s emantique de folksonomies comme par exemple
celui d evelopp e dans SweetWiki (Buffa et al., 2008).
Notre mod` ele cherche egalement ` a prendre en compte les diff erents points de vue, ` a
la mani` ere de Cahier et al. (2007). En effet, en r eiant la notion de relation s emantique,
notre mod` ele permet de faire de chaque assertion portant sur la s emantique des tags
un ev enement au m eme titre que le tagging. M eme les relations s emantiques entre les
tags qui seraient contradictoire (le tag co2 est plus pr ecis que le tag polluant mais
egalement plus pr ecis que le tag ressource-photosynth` ese par exemple) peuvent etre
10. http ://www.eionet.europa.eu/gemet/index html ?langcode=fr
11. http ://tech-web-n2.utt.fr/dd/ ?mod=navigation
IC 2009
recueillies et permettre ainsi de mettre en avant les diff erents points de vues portant sur
une m eme notion, et de r epercuter ces distinctions dans lontologie.
Lenrichissement s emantique des folksonomies a egalement et e abord e par Mika
(2005) qui propose danalyser la structure de graphe li ee aux folksonomies (via les asso-
ciations ressources/tag/utilisateurs) pour en d eduire des liens s emantiques entre les tags.
Dautres approches etablissent des correspondances entre les tags et des el ements don-
tologies disponibles en ligne sur le Web S emantique, et etendent les requ etes effectu ees
sur une folksonomie avec ces el ements dontologies (Angeletou et al., 2008). Si nous
exploitons le m eme type de traitements sur les folksonomies que Mika et Angeletou
et al., nous cherchons cependant ` a tirer partie de lexpertise des utilisateurs (` a la mani` ere
de Tanasescu & Streibel (2007) qui proposent de taguer les tags, o` u comme Braun et al.
(2007) qui proposent dint egrer les approches collaboratives du Web 2.0 dans les pro-
cessus d elaboration dontologies), ceci an dam eliorer lad equation de ces traitements
avec les usages. Par ailleurs, notre approche peut etre mise en regard avec celles visant ` a
construire des ontologies de domaines ` a partir dune extraction terminologique men ee
au sein dun corpus de documents (Aussenac-Gilles et al., 2000). Dun point de vue
m ethodologique, les tags que nous cherchons ` a lier s emantiquement ` a dautres tags
peuvent etre vus comme des candidats-tags (par analogie aux candidats-termes),
cest ` a dire des syntagmes soumis ` a la validation dexperts du domaine, avant de deve-
nir eventuellement des concepts ou des relations s emantiques dune ontologie.
5 Conclusion
Notre approche consiste ` a int egrer les donn ees folksonomiques dans un processus de
construction collaborative de repr esentations des connaissances, et ceci dans le but de
fournir des services et des fonctionnalit es plus avanc ees aux syst` emes ` a base de folk-
sonomies. Nous proposons ` a cet egard dexploiter des traitements automatiques tout en
permettant aux utilisateurs de les valider ou de les invalider. Les deux types de fonc-
tionnalit es s emantiques que nous proposons dans cet article sont la reconnaissance de
variations orthographiques des tags equivalents et la recherche de tags th ematiquement
proches
12
. An de valider ces inf erences automatiques, nous avons montr e un exemple
de fonctionnalit e sugg er ee par linterface invitant lutilisateur ` a retirer un tag de la liste
des tags automatiquement inclus dans la recherche.
Nous avons propos e egalement un mod` ele de formalisation des traitements auto-
matiques et des actions de validations par les utilisateurs qui supporte les situations
conictuelles. Nous sugg erons ainsi de capturer les assertions, eventuellement diver-
gentes, portant sur la s emantique des tags (et r esultantes des traitements automatiques
ou de laction dutilisateurs), puis de repousser leur traitement au moment de lexploi-
tation de ces r esultats, en fonction des choix des concepteurs du syst` eme. Ces derniers
peuvent ainsi choisir de montrer les r esultats des traitements s emantiques en fonction
de lappartenance ` a un sous-groupe dusagers, ou bien en fonction dune valeur seuil de
loccurrence dune assertion.
12. La premi` ere fonctionnalit e a et e implant ee dans notre syst` eme de gestion de bookmarks partag es, et la
seconde, permettant de sugg erer des tags th ematiquement proches (related), est en cours dimplantation
S emantique des folksonomies
Nos futurs travaux incluent, outre les tests de terrain avec lAdeme, la recherche
dautres types de traitements des tags permettant de proposer dautres fonctionnalit es
comme la caract erisation plus ne des relations s emantiques entre les tags (relation
plus pr ecis ou plus particulier). Dautres fonctionnalit es pr esentent un int er et dans
la perspective doutiller lorganisation collaborative des folksonomies, comme la recon-
naissance de divergence ou de convergence entre les utilisateurs pour la cat egorisation
de ressources similaires. Une des applications serait lassistance ` a la constitution de
groupes dint er ets qui pourraient, dans le cadre de notre mod` ele, etre utilis es pour per-
sonnaliser les interfaces en fonction des annotations s emantiques recueillies lors de
lusage du syst` eme. A cet egard, de multiples modalit es dapplications des connais-
sances formalis ees ainsi recueillies sont possibles et feront lobjet de recherches futures.
Notre etude sinscrit egalement dans la recherche de m ethodes pour outiller de mani` ere
dynamique l elaboration dontologies l eg` eres et partag ees. A cette n, nous cher-
chons ` a d evelopper des outils permettant aux usagers de saisir au cours de leurs t aches
quotidiennes la dimension partag ee de leur usage de certains termes. Dans un premier
temps, nous avons tent e dint egrer des fonctionnalit es s emantiques aux t aches de re-
cherche dinformations, et dans le cas de notre illustration, plus particuli` erement ` a la
recherche au sein dune base de bookmarks tagu es. Nous souhaitons donc etendre notre
recherche ` a lanalyse des usages et des t aches effectu ees par les membres dune commu-
naut e ou dun r eseau, dans le but didentier dautres t aches susceptibles d etre autant
doccasions pour lorganisation des connaissances partag ees. Une meilleure connais-
sance des usages permettra egalement daccrotre les possibilit es de personnalisation et
de manipulation des r esultats donn es par le syst` eme, ainsi que son utilisabilit e via une
plus grande transparence des raisonnements appliqu es pour obtenir un r esultat.
Remerciements. Nous remercions lANRpour le nancement du projet ISICIL ANR-
08-CORD-011 qui a permis la production de ces r esultats.
R ef erences
ANGELETOU S., SABOU M. & MOTTA E. (2008). Semantically enriching folksono-
mies with or. In CISWeb Workshop at Europ. Semantic Web Conf.
AUSSENAC-GILLES N., BI

EBOW B. & SZULMAN S. (2000). Corpus analysis for


conceptual modelling. In EKAW - Workshop on Ontologies and Texts.
BOJARS U., PASSANT A., CYGANIAK R. & BRESLIN J. (2008). Weaving SIOC into
the Web of Linked Data. In Proceedings of the WWW 2008 Workshop Linked Data
on the Web (LDOW2008), Beijing, China.
BRAUN S., SCHMIDT A., WALTER A., NAGYP

AL G. & ZACHARIAS V. (2007). On-


tology maturing : a collaborative web 2.0 approach to ontology engineering. In CKC,
volume 273 of CEUR Workshop Proceedings : CEUR-WS.org.
BRICKLEY D. & MILLER L. (2004). FOAF Vocabulary Specication. Namespace
Document 2 Sept 2004, FOAF Project. http ://xmlns.com/foaf/0.1/.
BUFFA M., GANDON F., ERETEO G., SANDER P. & FARON C. (2008). SweetWiki :
A semantic Wiki. J. Web Sem., 6(1), 8497.
CAHIER J.-P., ZAHER L. & ZACKLAD M. (2007). Information seeking in a socio-
semantic web application. In ICPW07 : Proceedings of the 2nd international confe-
rence on Pragmatic web, p. 9195, New York, NY, USA : ACM.
IC 2009
CATTUTO C., BENZ D., HOTHO A. & STUMME G. (2008). Semantic grounding
of tag relatedness in social bookmarking systems. 7th International Semantic Web
Conference.
EUZENAT J. & SHVAIKO P. (2007). Ontology Matching. Berlin, Heidelberg : Springer.
C. FELLBAUM, Ed. (1998). WordNet An Electronic Lexical Database. Cambridge,
MA; London : The MIT Press.
GANDON F. (2008). Graphes RDF et leur Manipulation pour la Gestion de Connais-
sances. Habilitation

A diriger des recherches, University of Nice - Sophia Antipolis.
HEATH T. & MOTTA E. (2007). Revyu.com : a Reviewing and Rating Site for the Web
of Data. In ISWC/ASWC, volume 4825 of LNCS, p. 895902 : Springer.
KIM H.-L., YANG S.-K., SONG S.-J., BRESLIN J. G. & KIM H.-G. (2007). Tag
Mediated Society with SCOT Ontology. In Semantic Web Challenge, ISWC.
LEVENSHTEIN V. I. (1966). Binary codes capable of correcting deletions, insertions
and reversals. Soviet Physics Doklady., 10(8), 707710.
LIMPENS F., GANDON F. & BUFFA M. (2008). Rapprocher les ontologies et les folk-
sonomies : un Etat de lart. IC.
MATHES A. (2004). Folksonomies - Cooperative Classication and Communica-
tion Through Shared Metadata. Rapport interne, GSLIS, Univ. Illinois Urbana-
Champaign.
MIKA P. (2005). Ontologies are Us : a Unied Model of Social Networks and Seman-
tics. In ISWC, volume 3729 of LNCS, p. 522536 : Springer.
MONNIN A. (2009). Quest ce quun tag ? entre acc` es et libell es, lesquisse dune
caract erisation. In Ing enierie des Connaissances, Hammamet, Tunisie.
NEWMAN R., AYERS D. & RUSSELL S. (2005). Tag Ontology Design.
http ://www.holygoat.co.uk/owl/redwood/0.1/tags/.
PASSANT A. (2007). Using Ontologies to Strengthen Folksonomies and Enrich Infor-
mation Retrieval in Weblogs. In International Conference on Weblogs and Social
Media.
PASSANT A. & LAUBLET P. (2008). Meaning of a tag : A collaborative approach to
bridge the gap between tagging and linked data. In Proceedings of the WWW 2008
Workshop Linked Data on the Web (LDOW2008), Beijing, China.
SPECIA L. & MOTTA E. (2007). Integrating folksonomies with the semantic web. 4th
European Semantic Web Conference.
TANASESCU V. & STREIBEL O. (2007). ExtremeTagging : Emergent Semantics
through the Tagging of Tags. In ESOE at ISWC.
ZACKLAD M., B

ENEL A., CAHIER J., ZAHER L., LEJEUNE C. & ZHOU C. (2007).
Hypertopic : une M etas emiotique et un Protocole pour le Web Socio-S emantique. In
IC, p. 217228 : C epadu` es. ISBN 978-2-85428-790-9.

S-ar putea să vă placă și