Sunteți pe pagina 1din 113

Mmoire dHabilitation diriger des Recherches Des descriptions linguistiques leurs reprsentations

tel-00372133, version 1 - 31 Mar 2009

Yvette Yannick Mathieu


27 janvier 2009 - Universit Paris 7

Jury : Nicholas Asher, Directeur de recherche au CNRS Laurence Danlos, Professeur lUniversit Paris 7 Christiane Fellbaum, Research Professor, Princeton University (rapporteur) Alain Kihm, Directeur de Recherche au CNRS (rapporteur) Jean-Luc Minel, Professeur, Universit Paris X Paul Sabatier, Directeur de Recherche au CNRS (rapporteur)

tel-00372133, version 1 - 31 Mar 2009

TABLE DES MATIRES

INTRODUCTION ______________________________________________________3 CHAPITRE 1. QUATRE TUDES IMPORTANTES SUR LE LEXIQUE ________7


1.1. LE LEXIQUE GRAMMAIRE ____________________________________________7
1.1.1. Approche du Lexique Grammaire ____________________________________________ 7 1.1.2. Les verbes de sentiment et psychologiques ____________________________________ 11 1.1.3. Les tables du lexique grammaire comme ressource en TAL ______________________ 13

1.2. LTUDE DES VERBES DE BETH LEVIN _______________________________15


1.2.1. Les alternances___________________________________________________________ 15 1.2.2. Les 49 classes de Beth Levin ________________________________________________ 17

tel-00372133, version 1 - 31 Mar 2009

1.2.3. Les verbes de sentiment et psychologiques ____________________________________ 18 1.2.4. La classification de Beth Levin comme ressource en TAL________________________ 21

1.3. WORDNET __________________________________________________________24


1.3.1. Organisation du lexique ___________________________________________________ 25 1.3.2. Les wordnets ____________________________________________________________ 28 1.3.3. WordNet, Ontologie et TAL ________________________________________________ 28 1.3.4. Wordnet et la classification de Beth Levin ____________________________________ 29 1.3.5. Exemple du verbe adore (Wordnet 2.1) _______________________________________ 30 1.3.6. En guise de synthse ______________________________________________________ 31

1.4. LE DICTIONNAIRE DES VERBES FRANAIS DE DUBOIS ET DUBOIS-CHARLIER ________________________________________________________32


1.4.1. Description du dictionnaire ________________________________________________ 32 1.4.2. La classe des verbes psychologiques__________________________________________ 34 1.4.3. Le dictionnaire des verbes comme ressource en TAL ___________________________ 34

CHAPITRE 2. SENTIMENTS, MOTIONS, ET OPINIONS : DESCRIPTIONS LINGUISTIQUES _______________________________________________________37


2.1. LES SENTIMENTS ET MOTIONS _____________________________________37
2.1.1. Le mot __________________________________________________________________ 37 2.1.2. La proposition ___________________________________________________________ 45 2.1.3. La phrase : formation de paraphrase par nominalisation ________________________ 47 2.1.4. Les sentiments dans un texte : traitements automatiques ________________________ 48

2.2. LES OPINIONS_______________________________________________________56


2.2.1. Le mot __________________________________________________________________ 56 2.2.2. Le segment et la phrase : Relations rhtoriques et valuation des opinions __________ 60 2.2.3. Le texte : valuation et Annotation des expressions dopinion ____________________ 61

2.3. BILAN COMPARATIF DE NOS DESCRIPTIONS AVEC CELLES DU LEXIQUE GRAMMAIRE, DE BETH LEVIN ET DE WORDNET __________________65
2.3.1. Lexique grammaire _______________________________________________________ 65 2.3.2. Les verbes de Beth Levin __________________________________________________ 66 2.3.3. WordNet ________________________________________________________________ 66

CHAPITRE 3. MODLES DE DONNES ET REPRSENTATIONS DES CONNAISSANCES ______________________________________________________69


3.1. AVANT LES SENTIMENTS : TRANSLEGS ET INTERFACILE ______________69
3.1.1. TRANSLEGS ____________________________________________________________ 69 3.1.2. INTERFACILE __________________________________________________________ 73 3.1.3. Comparaison de TRANSLEGS et INTERFACILE _____________________________ 75

3.2. LES SENTIMENTS : FEELING, FEELING-G ET LONTOLOGIE DES SENTIMENTS ______________________________________________________________76


3.2.1. FEELING _______________________________________________________________ 76 3.2.2. FEELING-G _____________________________________________________________ 81 3.2.3. Du lexique smantique lontologie__________________________________________ 82 3.2.4. Annotation et navigation travers les sentiments ______________________________ 83

tel-00372133, version 1 - 31 Mar 2009

3.3. REPRSENTATION DES EXPRESSIONS DOPINION ____________________91


3.3.1. Reprsentation dun segment dopinion ______________________________________ 91 3.3.2. Reprsentation discursive dun texte _________________________________________ 93 3.3.3. Reprsentation gnrale des opinions dans un texte_____________________________ 93

3.4. VOLUTION DES REPRSENTATIONS DES CONNAISSANCES UTILISES ___________________________________________________________________________96

CONCLUSION _______________________________________________________99 BIBLIOGRAPHIE ___________________________________________________103 TABLE DES FIGURES _______________________________________________109 TABLE DES TABLEAUX _____________________________________________111

INTRODUCTION
tel-00372133, version 1 - 31 Mar 2009

Bien souvent, la faon de considrer la langue est trs diffrente du point de vue des informaticiens et de celui des linguistes. Si ces divergences tendent samenuiser, elles taient importantes quand nous avons commenc nous intresser la linguistique et au TAL, au dbut des annes 1980. Nous avons pu le vrifier lors de notre mmoire de DEA dinformatique fondamentale (option traitement de linformation, Universit Paris 6, 1981) qui avait pour sujet La correction automatique des fautes dorthographe dans un texte. Nous venions darriver au LADL dirig par Maurice Gross, et lui avions demand conseil pour la faon daborder ce problme. Mais lui et le professeur dinformatique responsable du DEA, avaient des avis totalement divergents au sujet du traitement de la langue. Pour le linguiste, bien sr, la langue tait lobjet dtude, phnomne extrmement complexe, quil faudrait simplifier (bien que difficilement simplifiable) pour un traitement automatique, alors que du point de vue de linformaticien limportant tait la ralisation informatique, la langue ntant quune application comme une autre, ne prsentant pas de difficults particulires. Notre approche rejoint entirement celle de Maurice Gross, mais nous avons tent dans nos travaux davoir la fois une approche linguistique et une approche informatique, tout en essayant de ne pas appauvrir la description linguistique lors de la formalisation et de limplmentation. Les recherches du LADL taient essentiellement orientes vers la constitution du lexique grammaire du franais, cest pourquoi nous nous sommes trs vite intresse au lexique. Mais, jusqu notre travail de thse, notre activit tait essentiellement oriente vers le choix des reprsentations et leur implmentation. La linguistique et la smantique lexicale en particulier sont devenues des lments centraux de notre activit de recherche partir de notre travail de thse sur les verbes de sentiment, en 1994. Nous avons approfondi et complt cette tude en y intgrant les noms et les adjectifs ainsi que certaines proprits

les caractrisant. Nous avons ainsi fait une description linguistique dtaille et formalise de lexpression des sentiments en franais, dont nous avons vrifi la validit par le dveloppement du systme FEELING. Des travaux connexes nous ont montr lintrt dexploiter ces descriptions pour le reprage des expressions de sentiment dans des textes, et la ncessit de les reprsenter avec un format standard comme celui qui sera dfini plus loin des ontologies . Puis, nous avons largi ce champ smantique un domaine voisin, celui des opinions. Ces deux champs smantiques sont proches, ils relvent tous deux de la sphre affective ou intellectuelle dune personne, et se recoupent en partie car de nombreuses opinions sont lexpression de sentiments comme lindignation, la colre ou ladmiration. Nous avons adopt une approche lgrement diffrente car nous avons dabord tabli une typologie smantique des expressions dopinions que nous avons ensuite associe une analyse de la structure rhtorique des segments textuels contenant ces expressions, ce qui permet une tude dtaille des opinions dans les textes. Ces travaux sur les opinions sont mens en collaboration avec Farah Benamara et Nicholas Asher (IRIT, Toulouse). Nous naborderons pas dans ce mmoire dautres thmatiques de recherche auxquelles nous nous sommes intresse et qui ont contribu nourrir notre rflexion comme ltude des formes en o , par exemple franco-qubcois ou mdico-lgal, en collaboration avec Blandine Courtois et Andr Dugas (Dugas et al. 1992, 1995), ou lextraction automatique de nologismes (Mathieu 1998a, 1998b). Une part importante de nos recherches a t consacre la modlisation des connaissances ; cest ainsi que nous nous sommes intresse aux grammaires de construction (Mathieu 2003), dveloppes en particulier par Charles Fillmore (1988). Ce mmoire sorganise en trois parties. Dans la premire partie nous prsentons quatre approches sur le lexique qui nous semblent des tapes importantes parmi les nombreux travaux qui lui ont t consacrs. Ces tudes ont t ralises avec des objectifs diffrents des ntres, mais sont voisines par certains aspects de lapproche que nous avons adopte dans nos descriptions. Pour une lecture plus facile, nous avons prfr, bien que cela puisse sembler parfois fastidieux, laisser des exemples complets plutt que de les mettre en annexe. Les deux parties suivantes illustrent bien les deux axes de recherche que nous avons eus constamment en parallle lors de nos travaux : une approche de linguistique descriptive en smantique lexicale, et une approche formelle en vue de traitements automatiques dans la reprsentation des connaissances. Nous expliciterons les diffrentes descriptions linguistiques que nous avons ralises et leur complexification au fil du temps, et nous montrerons comment les reprsentations de ces connaissances, et les traitements et outils pour les exploiter, ont suivi une volution parallle. Cela nous amnera parfois certaines redites, ncessaires pour la comprhension du lecteur. 4

tel-00372133, version 1 - 31 Mar 2009

Plutt que de faire un expos exhaustif de ces travaux, qui ont t publis par ailleurs, nous en dgagerons des lments permettant dexpliquer les problmatiques auxquelles nous nous sommes intresse dans notre parcours. Dans la prsentation de ce mmoire nous utilisons le nous en place du je , except pour la partie consacre dune part au systme INTERFACILE et dautre part aux travaux sur les opinions, o il sagit dun nous collectif qui dsigne respectivement Paul Sabatier et moi-mme, et Nicholas Asher, Farah Benamara et moi-mme.

tel-00372133, version 1 - 31 Mar 2009

tel-00372133, version 1 - 31 Mar 2009

CHAPITRE 1. QUATRE TUDES IMPORTANTES SUR LE LEXIQUE


tel-00372133, version 1 - 31 Mar 2009

Nous prsentons dans ce chapitre plusieurs approches importantes dans ltude du lexique. Les trois premires (le Lexique grammaire de Maurice Gross et collaborateurs, les classes de verbes de Beth Levin et WordNet) sont des travaux qui nous ont influence divers titres ; bien quil tienne une place moindre dans nos travaux nous mentionnons galement le dictionnaire des verbes de Jean Dubois et Franoise Dubois-Charlier car il sinscrit parmi les descriptions importantes des verbes du franais . 1.1. LE LEXIQUE GRAMMAIRE 1.1.1. Approche du Lexique Grammaire Lapproche du Lexique-grammaire est essentiellement syntaxique, elle repose sur l'hypothse qu'on ne peut formuler de rgles de grammaire sans une description exhaustive des constructions et des distributions de tous les items lexicaux concerns. Ces travaux sont une application au franais du systme transformationnel de Zellig S. Harris ( 1971, 1990). Les citations extraites de Maurice Gross (1975) et de Jean-Paul Boons et al. (1976) sont notes MG et BGL respectivement. Maurice Gross et ses collaborateurs ont commenc dvelopper le Lexique-grammaire au milieu des annes 70 :
Notre intention a t daboutir une description exhaustive du franais par rapport aux proprits que nous avons choisies et par rapport un lexique donn. MG page 21.

Les premires constructions tudies ont t les phrases simples, cest--dire avec un verbe (smantiquement plein), puis les formes nominales et adjectivales, et enfin les 7

constructions figes. Le lexique grammaire des verbes est la classification de tous les verbes simples du franais (environ 5 000 verbes diviss en 15 000 emplois) rpartis en une soixantaine de tables qui rpertorient leurs proprits syntaxiques et distributionnelles (cf. Gross 1975, Boons et al. 1976, Guillet et Leclre 1992, entre autres). Les items lexicaux sont regroups en classes ou tables, selon les structures syntaxiques lmentaires qui les caractrisent, appeles constructions (ou phrases) dfinitionnelles . Lensemble des verbes qui acceptent cette proprit constitue la table. Chaque table a un code numrique comme les tables de verbes compltives numrotes de 1 19, ou les tables de constructions transitives locatives qui commencent par les numros 36, 37 et 38. chaque classe est associ un ensemble de proprits pertinentes, distributionnelles et concernant la slection des arguments (par exemple, le sujet est-il un substantif humain, non humain ou indiffrenci ?) ou transformationnelles (par exemple, le verbe est-il passivable ?, peut-on extraposer le sujet phrastique ?). Ainsi, la table 36DT a pour phrase dfinitionnelle N0 V N1 N2 avec pour N0 et N2 des substantifs humains (N0 est le sujet, V le verbe, N1 et N2. respectivement le 1er et le 2me complment). Elle dcrit un change de N1 entre deux humains N0 et N2. Tous les verbes (210) de cette table (offrir, rembourser, vendre, voler, etc.) ont cette caractristique tel le verbe voler par exemple, car la phrase Jean a vol 10 euros Marie est acceptable. Cette table a 22 proprits, comme la possibilit (ou non) pour un verbe d'avoir la construction "croise" N0 V N2 de N1 : Jean a vol Marie de 10 euros (dont le sens est voisin mais non exactement synonyme de la construction dfinitionnelle). Les tables sont reprsentes sous forme de matrice. Les lignes correspondent aux verbes et les colonnes des proprits syntaxiques :
lintersection de chaque range (verbe) et de chaque colonne (proprit syntaxique) dune table figure obligatoirement une marque reprsentant une estimation de la grammaticalit, i.e. de la bonne ou mauvaise formation de la structure syntaxique (en gros la colonne) lorsquelle est complte par linsertion du verbe. BGL page 50.

tel-00372133, version 1 - 31 Mar 2009

Cette marque est un signe + qui indique que le verbe a la proprit, et un signe correspondant au cas contraire. Pour dterminer si une construction est grammaticale ou non, un jugement dacceptabilit est utilis. Mais il est important de noter que dans le cadre du Lexique grammaire, ce qui nest pas inacceptable est acceptable , ce qui revient considrer comme grammaticaux les emplois douteux ou difficiles :
Nous avons donc opr une premire approximation en classant les formes de manire binaire : soit comme acceptables, soit comme inacceptables. En consquence, ces classes comporteront des informations douteuses. MG page 23. Les exemples cruciaux tant de manire gnrale les squences inacceptables, une premire tactique a t, en cas dhsitation sur lentre dun lment dans une structure et dabsence dune argumentation de niveau suprieur celui du jugement empirique ponctuel, de considrer provisoirement cette structure comme bien forme. En effet, le risque de considrer comme mal

forme une structure qui ne lest pas est pour nous plus grave que le risque inverse, inacceptable pour le puriste, daccepter une structure non recommandable . BGL page 47. Dans lensemble donc, nous avons considr comme acceptables des formes ressenties comme douteuses ou mme comme inacceptables par de nombreux locuteurs . MG page 24.

La mthode pour dterminer lacceptabilit dune phrase est lintrospection, avec parfois lusage de dictionnaires : Le franais est un franais standard , rvl essentiellement par introspection, et vrifi, pour
certains exemples douteux, par enqute auprs de locuteurs dappartenance socio-linguistiques voisines ; les grammaires et ouvrages de linguistique traditionnels ainsi que les dictionnaires nous ont galement fournies de nombreux exemples. MG page 21.

tel-00372133, version 1 - 31 Mar 2009

Dans le Lexique-grammaire, les proprits ne sont pas autonomes , elles doivent tre prise en compte en perspective avec la proprit dfinitionnelles de la table:
[...] en fait , les phrases construites sur les structures servant dintituls de colonnes ne sont juges que par comparaison avec les structures dfinitionnelles de la table. BGL page 50.

Les principales conventions adoptes pour la notation sont les suivantes :


Les formes de base comportent des indices numriques qui permettent de reprer les diffrents groupes nominaux : N0 V N1 Prp N2 . Les indices ont t dtermins partir de proprits syntaxiques. N0 est toujours un sujet formel. Lorsquun verbe accepte deux complments, leur ordre est dfini au moyen de leur proprit de prsence : facultative ou obligatoire. [] Rappelons que nous utilisons le symbole pour nous rfrer au(x) complment(s) sans distinction de forme.[...] MG pages 13, 15.

Les Ni peuvent avoir pour indice des symboles smantico-syntaxiques qui donnent des indications sur le contenu du groupe nominal. Par exemple, Ni = Nhum indique que la classe du groupe nominal du ime complment (ou du sujet si i = 0) est celle des substantifs humains, Ni = N-hum (ou -Nhum) que cette classe est celle des substantifs non humains, Ni = Npc caractrise une partie du corps, Ni = Nnr : indique que la position syntaxique i peut recevoir un substantif dune nature smantique quelconque, une compltive ou une infinitive, cest--dire la fois un nom propre, un nom commun humain ou abstrait, un verbe linfinitif ou une phrase ; on dit que le sujet ou le ime complment est non restreint . P reprsente une phrase, et Qu P une compltive sans distinction de contenu. Une construction compose dun verbe linfinitif et de ses complments ventuels est note V . Les suffixes inf (infinitif) ou ant (participe prsent) sont parfois utiliss, quand il est ncessaire de distinguer les deux formes. Les indices numriques des verbes V sont utiliss pour localiser la position du sujet de linfinitive : V0 , V1 , etc. Un verbe est not U dans le cas o il sagit dun verbe qui peut ne pas slectionner son sujet, comme commencer ou continuer : 9

Un verbe U apparaissant dans une phrase de forme N0 U Prp V0-inf peut ne pas imposer de contraintes sur N0. Autrement dit, tant donne une phrase quelconque N0 V0 , il est possible dy insrer un U sans que les relations entre N0 et V0 en soient affectes. MG page 160.

Les parenthses contenant plusieurs lments spars par le signe + indiquent une possibilit de choix entre ceux-ci. E est llment neutre par rapport la concatnation, c'est--dire une squence zro. Ainsi, N0 N1V (E + N1) reprsente les deux constructions N0 V et N0V N1. Des transformations appliques une phrase apparaissent entre crochets, par exemple [passif]. Lorganisation gnrale du Lexique-grammaire des verbes du franais est donne dans le tableau 1.

Constructions tel-00372133, version 1 - 31 Mar 2009 (N0+Qu P) V (E+Prp )(N1+ Qu P) (E+ Prp (N2+Qu P)) N0 V (E+Prp N1) N0 V (E+ N1) (E+Prp N2) N0 V N1 N0 V N1 Prp 2 Tables 1-19 Tables 31, 33-35 (et 2,7,8) Tables 32 Tables 36-38

Tableau 1. Organisation gnrale des tables du Lexique grammaire des verbes Maurice Gross a tudi les constructions compltives quil a rparties dans 19 tables. Le tableau 2 indique, pour chacune, le numro, la dfinition de la table et une ou plusieurs phrases reprsentatives.

Numro et dfinition des tables Table 1 (N0 U Prp V .).


0

Exemples de phrases Pierre se dpche damuser Paul Il court voir Marie, Il franchit la rivire retrouver Marie Paul envoie la balle rebondir contre le mur Que Luc vienne ennuie Paul. Que Paul ait pu faire cela dpasse mon imagination (cela dpasse mon imagination que ) Je vois que Paul travaille Paul tient ce que tout soit en ordre

Table 2 (N0 V (E+ N1 ) V ) verbes dits de mouvement


0

Table 3 (N0 V N1 V1 ) causatifs de mouvement except laisser. Table 4 (Qu P V N1). Table 5 (Qu P V Prp N1). Sujet extraposable. Table 6 (N0 V Qu P) Table 7 (N0 V ce Qu P)

10

Numro et dfinition des tables Table 8 (N0 V de ce Qu P) Table 9 (N0 V Qu P N2) Table 10 (N0 V Qu P Prp N2). Table 11 (N0 V N1 ce Qu P) Table 12 (N0 V N1 de V ).
1

Exemples de phrases Paul est content de ce quil soit venu. Jai dmontr Pierre que Paul tait venu Paul a ancr dans son esprit que tu avais fait cela Pierre accoutume Paul ce quil vienne au cours Paul dteste Marie davoir fait cela. Cette loi assure Max de ce que ses droits seront respects Max a collabor avec Luc ce que tout soit en ordre. Paul sexplique de cela auprs de Marie. Max conclut que le rsultat est correct de ce que les deux calculs concordent. Il semble Max que Luc est parti Max a reu de Luc comme garantie quil aurait une prime Quil parte discrdite Max auprs de Luc

Table 13 (N0 V N1 de ce Qu P). Table 14 (N0 V ce Qu P Prp N2). Table 15 (N0 V de ce Qu P Prp N2). Table 16 (N0 V Prp1 N1 Prp2 N2) Table 17 (Il V (E + Prp1 ce) Qu P (E + Prp2 N2)). Table 18 (N0 V Prp1 N1 Prp2 N2 (E + pour) que P subj)

tel-00372133, version 1 - 31 Mar 2009

Table 19 (Qu P V N1Prp N2).

Tableau 2. Tables des verbes constructions compltives 1.1.2. Les verbes de sentiment et psychologiques Les verbes qui relvent du champ smantique qui nous intresse (les sentiments et tats psychologiques) sont contenus principalement dans deux classes : la table 4, de proprit dfinitionnelle Qu P V N1 , cest--dire la possibilit dun sujet phrastique, dans laquelle sont les verbes de type irriter comme dans Que Luc vienne irrite Paul, et la table 12 dfinie par la construction N0 V N1 de V1 , par exemple Paul dteste Marie davoir fait cela. Un exemple extrait de la table 4 est donn dans le tableau 3. Notre description des verbes de sentiment a t tablie partir de ces deux classes (voir plus loin 2.1.1.).

11

N0= :le fait Qu P

N1 se V auprs de Nhum de ce que P

N1 se V de ce que P

N1 est Vpp de ce que P

tel-00372133, version 1 - 31 Mar 2009

+ + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + +

calmer captiver cataloguer chagriner chambouler charmer charpenter chatouiller chavirer chiffonner choquer cingler civiliser claquer classer coincer combler commotionner complter compromettre

+ + + + + + + + + + + -

+ + + + + + + + + + + + + + + + + + +

+ + + + + + + + + +

+ -

+ + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + +

+ -

+ + + -

+ + + + + + + -

+ + + + + + + + + + + + + + + + + + + +

Tableau 3. Extrait de la table 4 du Lexique grammaire (Gross 1975)

N0 V N1 contre Nhum + -

Adjectif =(E+at)eur

[passif par ]

Le fait Qu P

[passif de ]

N1= : Nhum

N1= :-Nhum

N0= :V1-

Adjectif = able

N0= :Nhum

Adjectif = eux

Adjectif = ant

N0= :Nnr

V concret

verbe

N0 V

1.1.3. Les tables du lexique grammaire comme ressource en TAL Les tables du Lexique grammaire nont pas t labores dans loptique du Traitement automatique de la langue, mais leur formalisation en matrices rend possible leur emploi par un logiciel. Selon Maurice Gross, cette description en classes de verbes partageant une mme construction dfinitionnelle et acceptant (ou non) des proprits de structure permet une approche nouvelle pour lanalyse syntaxique :
Une ventuelle analyse automatique prendrait alors une forme nouvelle. [...]. La procdure suggre par notre grammaire est diffrente. Des consultations de dictionnaires sont effectues pour les verbes de la phrase analyser, elles dterminent des ensembles de contextes possibles pour chaque verbe. Lexploration des contextes rels (e.g. lexamen des substantifs et de leurs relations avec les verbes), permettent deffectuer un choix parmi les contextes possibles et donc dliminer ceux qui sont incorrects. MG p.221

tel-00372133, version 1 - 31 Mar 2009

Nanmoins, leur utilisation est complexe, car comme nous lavons indiqu, la valeur binaire (+,-) des proprits autorise des acceptabilits parfois douteuses. De plus, les tables contiennent beaucoup dinformations trs dtailles, mais compactes cest--dire dont une grande partie nest comprhensible quavec des connaissances implicites et il ny a pas dindication dans la description sur la procdure qui a permis de les construire. lintrieur dune table, nous avons vu quune proprit est considre comme accepte sil existe au moins un emploi possible du verbe dans la construction. Mais aucune prcision nest donne sur cet emploi. Par exemple, dans la table 4, si nous considrons la possibilit du passif introduit par la prposition de , note N1 est Vpp de N0, que nous avons galement tudie, nous montrerons au 2.1.2.4, que lacceptabilit de ce passif est contrainte par la nature du N1. Ainsi, pour le verbe dconcerter par exemple, si le sujet ( lactif) est un substantif strictement humain, ce passif nest pas possible car si les phrases Marie/Le comportement de Marie dconcerte Luc et Luc est dconcert du comportement de Marie sont acceptables, *Luc est dconcert de Marie ne lest pas. Par ailleurs si le sujet est une infinitive, ce passif est toujours possible pour tous les verbes de la table 4, ce qui est dit dans (Gross 1975) mais pas indiqu dans la table. Donc, malgr lacceptabilit dun emploi indique par la proprit dfinitionnelle ou par un + pour toute construction de la table, lemploi nest pas toujours possible car il est contraint par la nature syntactico-smantique des arguments. Pour des applications de TAL, en gnration automatique par exemple, cette caractrisation des arguments est cruciale. Malgr la complexit demploi des tables du lexique grammaire, plusieurs travaux les utilisent comme ressource lexicale, aprs les avoir transformes et reformates selon leurs besoins spcifiques. Cest le cas en particulier de Laurence Danlos et ses collaborateurs, dans leur projet de constitution dun lexique morphologique et syntaxique du franais. Ce lexique lectronique, baptis Lefff (Lexique des Formes Flchies du Franais), est en cours dlaboration depuis 2004 (Danlos 2007). Il a t construit initialement avec des 13

informations sur les formes verbales induites principalement partir de corpus, il est enrichi progressivement avec lajout dautres catgories et des informations syntaxiques, partir des donnes du lexique grammaire. Lobjectif est de permettre son utilisation dans les applications dans le domaine du TAL, quel que soit le cadre thorique adopt. Un lexique syntaxique, Synlex , a galement t dvelopp par Claire Gardent et al. (2006), Falk et al. (2007). Il a t construit de faon semi-automatique partir dun extrait des tables de verbes du lexique grammaire disponibles et complt manuellement :
Seules 60% des tables du LADL tant disponibles, nous avons complt manuellement le lexique extrait des tables disponibles avec environ 2 000 verbes et leurs cadres de base. Gardent et al. 2006 page 3.

Ils ont galement propos une mthode de conversion des tables du LADL en un format appropri pour les applications du TAL. tel-00372133, version 1 - 31 Mar 2009

14

1.2. LTUDE DES VERBES DE BETH LEVIN Beth Levin (1993) a examin 3 000 verbes anglais et a montr comment certains modles syntaxiques sont parallles certains modles smantiques. Elle part de lhypothse que le comportement dun verbe, et particulirement lexpression et linterprtation de ses arguments, est guid par son sens. Les citations sont extraites de Beth Levin (1993), not BL dans la suite. 1.2.1. Les alternances Elle a tout dabord examin un large ensemble dalternances syntaxiques, avec parfois lindication smantique des verbes qui acceptent lalternance en question. Les alternances sont nommes, dcrites en texte libre, puis exemplifies avec des phrases acceptables ou non. Elles portent principalement : tel-00372133, version 1 - 31 Mar 2009 1) sur la modification de la transitivit du verbe : transitif <-> intransitif. Il y a dix alternances principales : - avec lobjet du verbe qui devient le sujet de la construction intransitive et alternance des rles smantiques (celui de lobjet de la forme transitive devient celui du sujet de la forme intransitive) : The butcher cuts the meat The meats cuts easily (6 alternances) ; - avec conservation du mme sujet du verbe Mike ate the cake Mike ate (1 alternance) et lobjet non exprim (9 alternances) ; - alternances conatives ; Lobjet du verbe dans la variante transitive devient lobjet de la prposition dans un syntagme prposionnel dont la tte est at (et quelquefois dautres prpositions comme against, on). I pushed the table I pushed at/on/against the table (1 alternance) ; - alternances causatives: impliquent des verbes avec des usages transitifs et intransitifs, avec lemploi transitif grossirement paraphras en cause to Vintransif . deux alternances principales : lalternance causative/inchoative et alternance action induite Jane broke the cup, the cup broke. (3 alternances) ; - alternances avec suppression de la prposition : la forme transitive apparat drive de la forme intransitive avec suppression de la prposition They skated along the canals They skated the canals (2 alternances) ; - alternances substance/source : avec les verbes dmission de substances Heat radiates from the sun , the sun radiates heat (1 alternance) ; 2) pour les verbes transitifs, sur les arguments lintrieur du syntagme verbal VP. Il y a quatorze alternances principales : - lalternance dative : Bill sold a car to Tom Bill sold Tom a car ;

15

- lalternance bnfactive: Martha carved a toy for the baby Martha carved the baby a toy ; - lalternance locative : Jack sprayed paint on the wall Jack sprayed the wall with paint (5 alternances) ; - les alternances de cration et de transformation : Martha carved a toy out of the piece of wood Martha carved the piece of wood into a toy (4 alternances); - les alternances rciproques : the car collided with the bicycle the car and the bicycle collided (6 alternances) ; - lalternance de satisfaction (fulfilling) : the judge presented a prize to the winner The judge presented the winner with a prize ; - lalternance dimpression : the jeweller inscribed the name on the ring the jeweller inscribed the ring with the name ; - lalternance with/against : Brian hit the stick against the fence Brian hit the fence with the stick ; - lalternance through/with : Alison pierced the needle through the cloth Alison pierced the cloth with a needle ; - lalternance blame : Mira blamed the accident on Terry Mira blamed Terry for the accident ; - lalternance search : Melissa searched the papers for a clue Melissa searched for a clue in the papers ; - lalternance de mise en relief du possesseur de la partie du corps : Selina touched the horse on the back Selina touched the horses back ; - lalternance de mise en avant du possesseur ou de lattribut : I admire his courage I admire him for his courage ; - lalternance as: The president appointed Smith press secretary The president appointed Smith as press secretary ; 3) les alternances sujet oblique avec changement du nombre de syntagmes nominaux associs au verbe : il y a un syntagme nominal de moins dans une forme que dans lautre. Les dix principales alternances sont : - lalternance avec le temps en sujet : The world saw the beginning of a new era in 1492 1492 the beginning of a new era ; - lalternance avec une force naturelle en sujet : I dried the clothes in the sun The sun dried the clothes ; - lalternance avec un instrument en sujet : David broke the window with a hammer The hammer broke the window ; - lalternance avec une cause abstraite en sujet : He established his innocence with the letter The letter established his innocence ;

tel-00372133, version 1 - 31 Mar 2009

16

- lalternance o lobjet localis devient sujet (oblique) : I filled the pail with water Water filled the pail ; - lalternance o le lieu est sujet (oblique) : We sleep five people in each room Each room sleeps five people ; - lalternance avec un contenant en sujet : I incorporated the new results into the paper the paper incorporated the new results ; - lalternance avec un matriel brut en sujet : She baked wonderful bread from that whole wheat flour That whole wheat flour bakes wonderful bread ; - lalternance avec une somme dargent en sujet : I bougth (you) a ticket for $5 $5 will buy (you) a ticket ; - lalternance avec une source en sujet : The middle class will benefit from the new tax laws The new tax laws will benefit the middle class ; 4) la rflexivit (2 alternances) ; tel-00372133, version 1 - 31 Mar 2009 5) les passifs (4 alternances) ; 6) les alternances qui impliquent des sujets postverbaux (2 alternances) ; 7) dautres constructions (9 alternances) ; 8) et enfin les verbes sans alternances, qui demandent des diathses particulires, par exemple le passif obligatoire It is rumored that he left town /* 1They rumored that he left town (6 alternances) ; 1.2.2. Les 49 classes de Beth Levin Dans une seconde tape de son tude, Beth Levin a ensuite identifi 49 classes de verbes cohrentes smantiquement, comme les verbes de contact, de perception, de jugement, etc. La liste complte de ces classes est donne dans le tableau 4. Chaque case du tableau dcrit la smantique des verbes de la classe. Les verbes de chaque classe ont un comportement semblable par rapport un sous-ensemble des alternances tudies prcdemment. Ce sous-ensemble est constitu de proprits caractristiques acceptes et non acceptes, exemplifies par des phrases avec un verbe considr comme reprsentatif de la classe. Beth Levin associe galement chaque classe un ensemble de proprits partages par tous ou quelques verbes de la classe :
Although any single property of a class of verbs will in itself not be very informative, the conjunction of properties shown by a class of verbs may well be more revealing , since it will reflect the entire set of meaning components shared by the class members. []

Le caractre * devant une phrase indique quelle est inacceptable.

17

Verbs classes arise because a set of verbs with one or more shared meaning components show similar behavior. BL page 17. A representative verb is then used to exemplify the characteristic properties of the class, including argument-taking properties, behavior with respect to diathesis alternations, and occasionally morphological properties (related nominals or adjectives). These properties have been chosen to illustrate what is distinctive to the members of that class. BL page 22. Placement Apprentissage Contact avec un objet pointu Coloration Perception Recherche Enlever Attraper et garder Contact Cration dimage tats psychologiques Interaction social Toilette, soin du corps Logement Mouvement Weekend Envoi et portage Dissimulation Coupure Cration et transformation Dsir Communication Meurtre Existence vitement Saison Exercer une force Lancer Mlanger, assembler et attacher Engendrer Jugements Sons produits par des animaux mission Apparition, disparition Raccourcissement ou prolongation de la dure dun vnement Avec des complments prdicatifs Changement de possession Contact par impact Sparation et dsassemblage Naissance danimaux Apprciation Ingestion Destruction Mouvement interne du corps Mesure

tel-00372133, version 1 - 31 Mar 2009

Impliquant le corps Changement dtat Position spatiale Aspectuels

Tableau 4. Classes des verbes anglais par Beth Levin (1993) Un verbe qui a plusieurs sens apparat dans plusieurs classes, par exemple arrange est dans la classe Put verbs et dans la classe Build verbs . 1.2.3. Les verbes de sentiment et psychologiques Les verbes qui relvent du champ smantique qui nous intresse (les sentiments et les tats psychologiques) sont contenus dans deux classes : la classe des verbes dtats psychologiques, quelle nomme Psych-Verbs, et la classe des verbes de Dsir. La classe des verbes psychologiques est sous divise en 4 classes : le type amuse, caractris par la position objet de la personne qui prouve le sentiment, appele lexprienceur, (221 verbes), le type admire dont lexprienceur est en position sujet, avec indication de la polarit (45 verbes : 26 positifs et 19 ngatifs), le type marvel qui contient des verbes intransitifs avec une prposition et dont lexprienceur est le sujet, comme marvel at (smerveiller de) ou groove on (samuser) (79 verbes) et le type appeal qui sont des verbes intransitifs avec une prposition et dont lexprienceur est le complment, comme appeal to (plaire ) (5 verbes).

18

Pour chacune de ces classes, et pour chaque type, nous allons dcrire les proprits quelle a considres. Les intituls de proprits, les commentaires et les exemples anglais sont extraits de Levin (1993). Nous navons pas repris la numrotation de Beth Levin, qui est une numrotation squentielle des exemples et des proprits. Nous avons numrot les proprits avec pour chacune un numro unique. Pour les verbes psychologiques, avec lexprienceur en position objet, elle a tudi 15 proprits pour les verbes du type amuse (amuser), et 2 pour les verbes comme appeal. Les proprits pour le type amuse sont :
1. The clown amused the children (construction de base) 2. Causative alternations (most verbs): The clown amused the children *The children amused (at the clown)

tel-00372133, version 1 - 31 Mar 2009

3. Middle alternation (most verbs): The clown amused the little children little children amuse easily

4. PRO-Arb Object alternation That joke never fails to amuse little children That joke never fails to amuse

5. Possessor Subject Possessor-Attribute Factoring Alternation (transitive) The clown amused the children with his antics The clowns antics amused the children

9. The clown was amusing to the children (most verbs) 10. an amusing joke

12. Extraposition of sentential complements That the clown had a red nose amused the children It amused the children that the clown had a red nose

14. Choice of prepositions in the passive depends on the verb The children were amused at/by/with the clown

15. Resultative Phrase : That movie bored me silly/to tears

19

17. Derived nominals has passive interpretation only The childrens amusement( at the clown) *The clowns amusement of the children

19.-er Nominal (some verbs) : Baffler, disturber, 20.-able Adjectives : *amusable, *surprisable, excitable, irritable, upsettable

La classe Appeal contient 5 verbes intransitifs. Lexprienceur est en position objet avec une prposition: niggle at, grate on, jar on, appeal on, matter on. Les proprits sont :
1. This painting appeals to Malinda (construction de base) 13. *Passive

tel-00372133, version 1 - 31 Mar 2009

*Malinda is appealed by this painting

Beth Levin a class les verbes psychologiques avec lexprienceur en position sujet, en deux sous-classes : les verbes de type admire, diviss en positifs et ngatifs, caractriss par 9 proprits, et les verbes de type marvel avec deux proprits. Les proprits pour le type admire sont :
1. The tourists admired the paintings (construction de base) 3.*Middle alternation

6. Possessor Object Possessor-Attribute Factoring Alternation I admire his honesty I admire him for his honesty

7. Attribute Object Possessor-Attribute Factoring Alternation I admire his honesty I admire the honesty in him

11. Sentential Complements (some verbs) The children liked that the clown had a red nose

12. Extraposition of sentential complements (some verbs) 16. Derived nominals has active interpretation only The childrens enjoyment of the movie

20

* The movies enjoyment by the children

18. *As alternation I admire him as a teacher *I admire him a teacher

19.-er Nominal 20.-able Adjectives : detestable, enjoyable, hatable, likable

Les verbes comme marvel sont des verbes intransitifs avec une prposition. Les proprits tudies sont :
1. Megan marveled at the beauty of the Grand Canyon (construction de base) 13. Passive (some verbs)

tel-00372133, version 1 - 31 Mar 2009

La deuxime classe, les verbes de dsir, est constitue de deux sous classes : les verbes transitifs comme want et les intransitifs, de type long. Comme le remarque Beth Levin :
These verbs are sometimes included among the psych-verb that take an experiencer subject, that is, the admire-type and the marvel-type psych-verbs . BL page 194.

Les proprits des verbes de type want sont :


1. Dorothy needs new shoes (construction de base) 6. Possessor Object Possessor-Attribute Factoring Alternation 7. *Attribute Object Possessor-Attribute Factoring Alternation 8. *Dorothy is needing new shoes 13. ?Passive 18. *As alternation

Les verbes de type long ont une prposition obligatoire comme long for or lust after/for. Les proprits considres sont :
1. Dana longs for a sunny day (construction de base) 8. Dana is longing for a sunny day 13. ?Passive

1.2.4. La classification de Beth Levin comme ressource en TAL Les classes smantiques de verbes contiennent une description trs dtaille des relations syntactico-smantiques entre un verbe et ses arguments, ce qui en fait une 21

ressource intressante pour des applications informatiques. Mais cette tude a t faite dans une optique purement linguistique sans aucun objectif de traitement automatique, il nest donc pas tonnant que lon ne puisse pas lutiliser telle quelle comme ressource informatique. Un problme majeur est que cette description nest pas homogne divers titres. Nous numrons plusieurs exemples de cette htrognit (cette liste nest pas exhaustive). - Le format de lnonc des proprits est multiple. En effet, Beth Levin dcrit une proprit soit par un nonc, par exemple Middle alternation , soit par un couple de phrases qui montre lalternance entre la construction de base et la proprit, comme The clowns amused the little children/ little children amused easily , soit uniquement par une phrase qui lexemplifie comme an amusing joke . - La description est faite au niveau de la classe, et exemplifie avec un verbe reprsentatif , mais aucune indication nest mentionne ou pas assez prcise pour pouvoir gnraliser tous les verbes. Par exemple, la proprit est suppose tre accepte (ou non) par tous les verbes de la classe, mais quelquefois elle ne lest que par la plupart : dans ce cas la mention most verbs est indique derrire la proprit, sans aucune autre indication des verbes concerns, comme Middle alternation (most verbs). De mme certaine listes donnes sont partielles, par exemple : -able Adjectives : *amusable, *surprisable, excitable, irritable, upsettable . Quen dduire pour la possibilit de formation dadjectifs partir des autres verbes de la classe ? Quand une proprit est indique explicitement, elle ne lest pas toujours de faon prcise comme choice of prepositions in the passive depends on the verb : The children were amused at/by/with the clowns , on comprend que pour le verbe amuse les trois constructions sont possibles, mais, l encore, quen est il des autres verbes de la classe ? - La nature des arguments nest pas prise en compte. Ainsi les proprits Possessor Object Possessor-Attribute Factoring Alternation et Attribute Object PossessorAttribute Factoring Alternation sont exemplifies par I admire his honesty / I admire him for his honest et / I admire the honesty in him respectivement. Mais si le complment est dune nature diffrente ces deux dernires constructions peuvent devenir difficilement acceptables comme le montrent les exemples suivants : I admire his haircut , ?I admire him for his haircut et *I admire the haircut in him . Cette caractrisation des arguments, complexe, est importante pour le TAL, dans une optique de gnration par exemple. - Certaines proprits sont implicites. Par exemple, le passif est suppos tre accept par tous les verbes. Cette construction nest indique que si elle est peu (classe Appeal et Desire) ou pas possible (classe Marvel). On pourrait la dduire de la proprit dj voque choice of prepositions in the passive depends on the verb pour les verbes comme amuse, mais pas pour les verbes comme admire (elle est implicite dans cette classe).

tel-00372133, version 1 - 31 Mar 2009

22

- Enfin, de nombreuses proprits sont indiques dans le commentaire de la classe comme la position syntaxique de lexprienceur et de lobjet (ou la cause) du sentiment ou la transitivit des verbes; par exemple, pour les Psych-verbs :
They are transitive verbs whose object is the experiencer of the emotion and whose subject is the cause of the change in psychological state. BL page 191.

Pour un usage en TAL de ce travail, il serait donc ncessaire de le complter, pour avoir des informations sur chaque verbe, et de le reformuler. Lindication de lexistence (ou non) de proprits de plusieurs faons diffrentes implique quil faut les crire dans une forme unifie et formalise, les proprits implicites doivent tre exprimes, etc. Une classification dun sous-ensemble des verbes du franais a t faite par Patrick Saint-Dizier (1996) en sappuyant sur ltude de Beth Levin, mais dans une optique de TAL.

tel-00372133, version 1 - 31 Mar 2009

23

1.3. WORDNET La base de donnes WordNet offre une large couverture lexicale de langlais. Elle est trs utilise car cest une ressource la fois libre et assez bien documente. Son dveloppement manuel a commenc en 1985, puis une premire version lectronique t construite en 1993 jusqu Wordnet 2.1 en 2005. La base est en constante volution. (Miller 1990, Miller et Fellbaum 1991, Fellbaum 1998, 1999). Cest un rseau lexical qui couvre la grande majorit des noms, verbes, adjectifs et adverbes, organiss en rseaux smantiques distincts. Son contenu est indiqu dans le tableau 5. Rseau Noms tel-00372133, version 1 - 31 Mar 2009 Verbes Adjectifs Adverbes TOTAL Formes 117798 11529 21479 4481 155287 Synsets 82115 13767 18156 3621 117659 Paires mot-sens 146312 25047 30002 5580 206941

Tableau 5. Contenu du rseau lexical WordNet (juillet 2008) Sa conception est base sur la notion de rseau smantique organis de faon hirarchique, en utilisant la relation d'inclusion qui lie, par exemple, des triplets comme animal , poisson , et saumon . Les units dans WordNet sont des ensembles de synonymes appels synsets . Ce sont des groupes de mots ou de phrases qui expriment un mme concept. Christiane Fellbaum a tudi et dcrit le lexique des verbes. Nous la citons (1999, not CF dans la suite):
Des diffrences de sens entre les membres d'un synset se montrent dans diffrentes restrictions de slection. Par exemple, rise (monter) et fall (tomber / descendre) peuvent choisir comme argument des entits abstraites comme temperature (temprature) et prices (prix), mais leurs proches synonymes ascend (monter) et descend (descendre) ne peuvent pas slectionner ces noms. D'ailleurs, tous les proches synonymes n'ont pas les mmes proprits syntaxiques : on peut give , hold, ou throw a party (organiser une soire), mais le dplacement du datif n'est possible qu'avec give : (1) We gave /threw/ held a party for John. (2) We gave / *threw / *held John a party. Nous avons organis une soire pour Jean. Les synonymes ont t choisis largement en examinant les dictionnaires traditionnels, o la synonymie est une faon habituelle de dfinir le sens des mots.

24

Les synsets sont relis par des arcs tiquets qui reprsentent des relations lexicales et smantiques. Les relations lexicales lient des mots tandis que les relations smantiques (ou conceptuelles) lient des synsets. WordNet n'a que des relations paradigmatiques, de sorte que les quatre catgories lexicales principales (N, V, Adj, Adv) sont traites sparment. CF pages 27-28.

chaque synset est associ une description du sens qu'il reprsente et des exemples d'usage. Les synsets nexpliquent pas ce que sont les concepts, ils en posent l'existence : :
These synonym sets (synsets) do not explain what the concepts are; they merely signify that the concepts exist. People who know English are assumed to have already acquired the concepts, and are expected to recognize them from the words listed in the synset. Miller et al., 1993, pages 5-6.

1.3.1. Organisation du lexique Deux types de relations sont dfinis dans le lexique, les relations lexicales entre les formes (les mots), et les relations smantiques entre les sens (les synsets). Les relations lexicales sont des relations de synonymie, dantonymie et des relations morphologiques. Les relations smantiques sont des relations hirarchiques qui relient les synsets entre eux. Ces relations dpendent de la catgorie des mots contenus dans les synsets.

tel-00372133, version 1 - 31 Mar 2009

1.3.1.1. Les noms Les synsets de noms sont organiss de faon hirarchique, partir dune racine unique (nomme Entity), puis 25 nuds fils dcrivant des champs smantiques diffrents : (Act/action/activity), (Animal/fauna), (Artifact), (Attribute, Property), (Body, Corpus), (Cognition, Knowledge), (Communication), (Event, Happening), (Feeling, Emotion), (Food), (Group, Collection), (Location, Place), (Motive), (Natural Object), (Natural Phenomenon), (Plant, Flora), (Possession), (Process), (Quantity, Amount), (Relation), (Shape), (State, Condition), (Substance), (Person, Human being), (Time). Les relations fondamentales qui relient les synsets de noms sont lhyperonymie (est une sorte de : un chien est une sorte danimal) et la mronymie (est une partie de : une roue est une partie de voiture). La figure 1 montre les relations dhyperonymie du substantif doberman fournies par WordNet 2.1. Rappelons que la racine unique de la hirarchie des noms est entity, les relations dhyperonymie sont ensuite notes -- ; ainsi, lextrait suivant (fin de la figure 1) working dog, watchdog, guard dog pinscher --Doberman pinscher -- Doberman , signifie : un Doberman est une sorte de Doberman pinscher qui est une sorte de pinscher qui est une sorte de working dog, watchdog, guard dog.

25

(Noun.top) entity --physical entity -- object, physical object--living thing, animate thing --organism, being --animal, animate being, beast, brute, creature, fauna -(noun.animal) chordate--vertebrate, craniate --mammal, mammalian --placental, placental mammal, eutherian, eutherian mammal --carnivore --canine, canid --dog, domestic dog, Canis familiaris --working dog, watchdog, guard dog--pinscher -Doberman pinscher -- Doberman

Figure 1. La relation dhyperonymie pour Doberman (WordNet 2.1).

1.3.1.2. Les adjectifs tel-00372133, version 1 - 31 Mar 2009 Les adjectifs sont diviss en deux catgories : les adjectifs descriptifs (grand, intelligent) et les adjectifs relationnels. Les adjectifs descriptifs sont structurs par des relations dantonymie (grand, petit) et de similarit. Aucune gradation nest reprsente dans WordNet. Les adjectifs relationnels sont relis un nom, par exemple electrical reli electricity ou maternal mother. Ils nont pas dantonymie directe mais une indirecte via leur similarit smantique avec des adjectifs qui ont un antonyme. Les adjectifs de couleur sont traits sparment.

1.3.1.3. Les verbes Le lexique verbal est divis en 15 domaines smantiques, dont nous donnons la liste avec des exemples de verbes dans le tableau 6. Un verbe polysmique peut se trouver dans diffrents domaines comme to hit (frapper, atteindre) qui relve de 7 domaines (communication, comptition, consommation, contact, interactions sociales, mouvement et perception). Les synsets de verbes sont relis entre eux par les relations hirarchiques dhyperonymie et de mronymie. Dautres relations existent galement, comme la troponomie , qui signifie V1 c'est V2 d'une certaine faon comme jogger qui est courir pour faire de lexercice ou crier qui est parler fort, limplication lexicale quand on peut dire quelqu'un V1 implique logiquement quelqu'un V2 comme ronfler qui implique dormir, mais pas linverse, et la relation de cause qui lie deux synsets ou deux verbes, comme donner et recevoir, tels que l'un dnote une cause et l'autre le rsultat. Les verbes (et non les synsets) sont relis entre eux par des relations de synonymie et dantonymie :
La plupart des verbes antonymes sont des verbes statiques ("live/die" (vivre/mourir), "differ/equal" (diffrer/galer), "wake/sleep" (se rveiller/dormir), etc.) ou des verbes dnotant un

26

changement d'tat ("grow/shrink" (grandir/rtrcir), "blacken/whiten" (noircir/blanchir), etc.) qui peut tre exprim par des attributs. CF page 32.

Domaines smantiques Changement Cognition Communication Comptition Consommation Contact Creation tel-00372133, version 1 - 31 Mar 2009 motion tats Interactions sociales Mtorologie Mouvement Perception Possession Soins du corps

Exemples de verbes grandir, chauffer penser, juger, douter, analyser dire, demander, chanter attaquer, sauter manger, boire, ingrer toucher, frapper, coudre, cuisiner, peindre aimer, har, craindre tre avoir lire, voter pleuvoir, neiger, geler se promener, voler, nager voir, entendre, sentir acheter, vendre, possder Se laver, se peigner, panser

Tableau 6. Domaines smantiques des verbes de WordNet chaque synset du lexique verbal est associ un ensemble de phrases reprsentatives qui indique quel type de sujet est choisi par les verbes dans le synset, ainsi que les proprits syntaxiques et smantiques des complments des verbes.

1.3.1.4. Les adverbes Les adverbes sont relis entre eux par des relations de synonymie et dantonymie, et aux adjectifs quand ils en sont drivs (sad, sadly). Les synsets contiennent galement des exemples dusage.

27

1.3.2. Les wordnets WordNet est en cours de dveloppement pour de nombreuses langues citons, parmi dautres, Arabic WordNet 2 dvelopp pour larabe, HindiWordnet 3 pour le hindi, ou le projet EuroWordNet 4 qui est une base de donnes multilingue constitue de lexiques organiss sur le modle de WordNet pour plusieurs langues europennes (allemand, nerlandais, italien, espagnol, franais, tchque et estonien). Lassociation The Global WordNet Association 5 est une plate-forme de discussion et permet la connexion aux diffrents Wordnet existants. Dans le domaine des sentiments, deux ressources sont en cours de ralisation partir de Wordnet : SentiWordnet et Wordnet-Affect. Dans SentiWordnet, Esuli et al. (2006) ont assign chaque synset de WordNet un triplet (ngativit, positivit, objectivit) ayant chacun un score de sentiment, la somme des 3 scores tant toujours gale 0. WordnetAffect (Strapparava et Valitutti 2004) a t construit partir dun ensemble de synsets extraits de WordNet, synsets relevant de concepts affectifs. La hirarchie de WordNet a t conserve, et des informations dtaillant le contenu dun point de vue affectif ont t ajoutes. 1.3.3. WordNet, Ontologie et TAL Pour rpondre plusieurs critiques faites WordNet, ses concepteurs ont apport un certain nombre damliorations, notamment pour son utilisation avec une approche ontologique, ou dans le domaine du TAL. Une ontologie est considre ici comme un ensemble de concepts organiss hirarchiquement auxquels sont associs des attributs qui caractrisent le concept. Les relations dhyperonymie qui hirarchisent les synsets de WordNet sont de mme type que les relations qui relient les concepts entre eux dans les ontologies ; il nest donc pas tonnant que lon considre parfois WordNet comme une ontologie. Mais WordNet na jamais t conu comme une ontologie, mme si, comme le souligne Georges Miller et Christiane Fellbaum (2007), quelques modifications ont t apportes pour le rendre plus proche des bonne pratiques ontologiques :
WordNet was originally constructed with 25 unique beginners, rather that a single root node. Most ontologists would agree that it is sensible to have a single class of all entities -real, abstract or imagined. Repeated requests to merge the 25 initial trees were finally met and WordNet version 2.1 provides a single unique beginner, labeled entity. Second, WordNet did not distinguish between Types (classes) and Instances. So A nation IS A KIND OF political unit and Spain IS A KIND OF nation were represented in the same way. But nations are a class and Spain is an instance of that class. By working through all the nouns in WordNet, this distinction was finally drawn [MH06]. [] As ontologies tend to confine themselves to higher-level concepts, a mapping to a lexical resource is

tel-00372133, version 1 - 31 Mar 2009

2 3

http://www.globalwordnet.org/AWN/ http://www.cfilt.iitb.ac.in/wordnet/webhwn/ 4 http://www.illc.uva.nl/EuroWordNet/ 5 http://www.globalwordnet.org/

28

desirable as it extends the concepts covered by the ontology down into the \leaves of the hierarchies. The Suggested Upper Merged Ontology (SUMO, [NP03]) has been fully linked to WordNet as well as to wordnets of other languages. page 210.

Une partie du succs de WordNet vient de son utilisation comme base de donnes lexicales dans le domaine du TAL, mais une critique souvent formule concerne labsence de liens entre les rseaux smantiques des diffrentes catgories : verbes, noms, etc. Pour rpondre cette remarque, des liens morphosmantiques entre noms et verbes ont t ajouts :
But WordNet's effectiveness for WSD 6 is limited by the sparsity of its arcs. We tried to address the lack of cross-part of speech arcs at least in part by including morphosemantic links ([FM03]). For example, the verb interest is connected to the noun interest and the adjective interesting. Since interest and interesting each have several meanings -not all of them related to an adjective sense- the links had to be entered manually among the appropriate senses. Miller et Fellbaum (2007) page 211.

tel-00372133, version 1 - 31 Mar 2009

Le manque de solution efficace pour rpondre la polysmie des mots est galement souvent mentionn par les utilisateurs. En effet, quand un mot est associ plusieurs synsets, il nest pas ais de distinguer entre ses diffrents sens. Pour aider les utilisateurs dsambiguser les mots, un corpus 7 construit manuellement et contenant des annotations smantiques a t associ aux synsets de Wordnet :
Currently, the words in the definitions (or glosses) that are part of each synset are manually disambiguated against WordNet. In this way, a user who wishes to better understand a gloss can refer to the synsets for more information on the nouns, verbs, adjectives, and adverbs in that gloss. In addition, we have created a semantically annotated corpus (the glosses) that can be used to train machine learning systems for WSD. Miller et Fellbaum (2007) page 211.

1.3.4. Wordnet et la classification de Beth Levin Les dmarches de Beth Levin et de Christiane Fellbaum (dans WordNet) pour ltude des verbes sont assez diffrentes mais ont nanmoins quelques points en commun relevs par Christiane Fellbaum :
Bien que dcouvrir des classes smantiques en examinant la syntaxe soit une approche trs diffrente de celle de WordNet -- qui cherche dcouvrir l'organisation smantique par des relations smantiques et lexicales -- les deux efforts ont en commun beaucoup de rsultats. De nombreuses classes de Levin ayant les mmes proprits syntaxiques, sont dans WordNet des hirarchies cres uniquement selon des critres smantiques. De plus, les phrases qui indiquent les proprits de souscatgorisation des verbes et leurs restrictions slectionnelles rvlent des irrgularits parallles celles qu'on trouve chez Levin. . CF page 37.
6 7

Word Sense Disambiguation http://wordnet.princeton.edu/glosstag

29

1.3.5. Exemple du verbe adore (Wordnet 2.1)


The verb adore has 1 sense (first 1 from tagged texts) 1. (1) adore -- (love intensely; "he just adored his wife")

Synonymes ------------par frquences adore -- (love intensely; "he just adored his wife") => love -- (have a great affection or liking for; "I love French food"; "She loves her boss and works hard for him") ----------------par similarits adore -- (love intensely; "he just adored his wife")

tel-00372133, version 1 - 31 Mar 2009

love -- (have a great affection or liking for; "I love French food"; "She loves her boss and works

hard for him")

Termes coordonns adore -- (love intensely; "he just adored his wife") -> love -- (have a great affection or liking for; "I love French food"; "She loves her boss and works hard for him") => love -- (be enamored or in love with; "She loves her husband deeply") => care for, cherish, hold dear, treasure -- (be fond of; be attached to) => dote -- (shower with love; show excessive affection for; "Grandmother dotes on her the twins") => adore -- (love intensely; "he just adored his wife")

Hyperonymes (adore est une faon de ) adore -- (love intensely; "he just adored his wife") love -- (have a great affection or liking for; "I love French food"; "She loves her boss and works

hard for him")

Troponymes (diffrentes manires de) adore -- (love intensely; "he just adored his wife") => idolize, idolise, worship, hero-worship, revere -- (love unquestioningly and uncritically or to excess; venerate as an idol; "Many teenagers idolized the Beatles") => drool over, slobber over -- (envy without restraint)

Formes associes par drivation

30

adore -- (love intensely; "he just adored his wife") RELATED TO->(noun) adorer#1 admirer, adorer -- (someone who admires a young woman; "she had many admirers")

Exemples de phrases adore -- (love intensely; "he just adored his wife") EX: Sam cannot adore Sue EX: Sam and Sue adore the movie

Usage : adore used as a verb is very rare (polysemy count = 1)

1.3.6. En guise de synthse tel-00372133, version 1 - 31 Mar 2009 o WordNet est un Rseau lexical ; o la constitution du lexique a t faite partir du Brown corpus puis enrichie avec diffrents thsaurus et lexiques ; o Le rseau ne contient pas des mots mais des Synsets (ensembles de synonymes) ; o les noms, verbes, adjectifs et adverbes sont organiss en rseaux smantiques distincts, mais des liens morphosmantiques entre noms et verbes ont t ajouts ; o La hirarchie des noms a une racine unique (nomme Entity) ; o Les nuds du rseau (le synsets) sont relis par diffrentes relation hirarchiques : lhyperonymie (est une sorte de), la mronymie (est une partie de), et, pour les verbes, la troponomie qui signifie V1 c'est V2 d'une certaine faon, limplication lexicale et la relation de cause ; o il y a une relation de synonymie et dantonymie entre mots, pas entre synsets ; o ces descriptions ont t implmentes et sont directement utilisables par des humains et par des outils informatiques.

31

1.4. LE DICTIONNAIRE DUBOIS-CHARLIER

DES

VERBES

FRANAIS

DE

DUBOIS

ET

Le dictionnaire des verbes franais a t labor par Jean Dubois et Franoise Dubois-Charlier (1997). Leur objectif et la mthode utilise sont dcrits dans lintroduction de leur ouvrage : (la rfrence est donne par Franois et al., 2007).
La classification syntaxique des verbes franais repose sur lhypothse quil y a adquation entre les schmes syntaxiques de la langue et linterprtation smantique quen font les locuteurs de cette langue []. Le schme syntaxique est dfini, dune part, par la nature des constituants de la phrase, leurs proprits et leurs relations, et, dautre part, par les mots du lexique qui entrent dans les types de constituants dfinis []. Lobjet est donc de faire linventaire le plus complet possible de ces schmes syntaxiques.

tel-00372133, version 1 - 31 Mar 2009

Lapproche adopte est assez voisine de celle du Lexique grammaire car le comportement des verbes est tudi au sein de la phrase lmentaire. 1.4.1. Description du dictionnaire Jean Dubois et Franoise Dubois-Charlier ont class 12 310 verbes franais. Un tiers de ces verbes faisant lobjet de plusieurs entres, le dictionnaire contient 25 610 entres verbales diffrentes. Ces verbes ont t rpartis en quatorze classes gnriques, parmi lesquelles treize se rapportent des domaines smantiques (verbes de communication, de don, etc.) et une classe contient les auxiliaires. (cf. Tableau 7).

Classes gnriques C Communication D Don, privation E Entre, sortie

Classes smantico-syntaxiques C1 sexprimer par un son, une parole, C2 dire/demander qc C3 montrer qc, C4 figur de C1 et C2 D1 donner qn qn/qc, D2 donner qc qn/qc D3 figur de D2 E1 (faire) sortir/venir de qp ou aller qp, sujet hum E2 figur de F1 E3 (faire) sortir/venir de qp ou aller qp, sujet non-anim E4 figur de E3 F1 frapper ou toucher qn, F2 figur de F1 F3 frapper ou toucher qc, F4 figur de F3 H1 tre/mettre qn dans tat physique H2 avoir tel comportement, activit H3 tre/mettre qc dans tel tat, H4 figur de H3 L1 tre ou mettre qn qp, L2 figur de L1 L3 tre ou mettre qc qp, L4 figur de L3 M1 faire/imprimer mouvement, hum, M2 figur de M1 M3 faire/imprimer mouvement, non-anim M4 figur de M3 N1 munir/dmunir qn de qc, N2 figur de N1 N3 munir/dmunir qc de qc, N4 figur de N3 P1 avoir tel sentiment, telle pense P2 faire avoir tel sentiment, P3 manifester telle pense sur qn/qc

F Frapper, toucher H tats physiques et comportements

L Locatifs M Mouvement sur place

N Munir, dmunir P Verbes psychologiques

32

Classes gnriques R Ralisation, mise en tat S Saisir, serrer, possder T Transformation, changement U Union, runion X Verbes auxiliaires

Classes smantico-syntaxiques R1 mettre en tat le corps de qn, R2 crer qn, un personnage R3 fabriquer qc, mettre qc en un certain tat, R4 figur de R3 S1 saisir, arrter, serrer qn, S2 prendre, choisir, abandonner qn S3 saisir, garder qc ; tordre, tirer qc, S4 figur de S3 T1 lier, unir qn ; dtacher qn de, T2 figur de T1 T3 lier, unir qc ; dtacher qc de, T4 figur de T3 U1 lier/unir qn ; dtacher qn de, U2 figur de U1 U3 lier/unir qc ; dtacher qc de, U4 figur de U3 X1 auxiliaires, semi-aux., modaux, X2 impersonnels X3 existence, X4 inchoatifs, rsultatifs

Tableau 7. Classes gnriques et syntaxico-smantiques des verbes franais (Dubois et DuboisCharlier 1997) Chacune de ces classes est divise en 3 ou 4 classes smantico-syntaxiques qui dcrivent les proprits du sujet et du complment des verbes (tre vivant / non-anim et emploi propre ou emploi figur). Ces classes sont elles-mmes constitues de sous-classes syntaxiques qui, leur tour, sont sous-divises en sous-types syntaxiques qui contiennent ventuellement des variantes syntaxiques. La description est donc une arborescence 5 niveaux : Classes gnriques Classes smantico-syntaxiques Sous classes syntaxiques Sous-types syntaxiques Variantes syntaxiques Ainsi, la classe gnrique des verbes psychologiques (classe P) contient 2074 entres, rparties en trois classes smantico-syntaxiques (P1 P3, cf. Tableau 7). La sous-classes P1 contient 1159 entres de type avoir tel sentiment, telle activit consciente, comporte dix sous-classes syntaxiques E1a E1j. La sous-classe syntaxique P1a contient 211 verbes de type tre dans tel tat psychologique ou avoir tel sentiment , et comporte douze sous-types : les intransitifs (Jean boude 8), les pronominaux (Jean sclate au concert), les pronominaux intransitifs

tel-00372133, version 1 - 31 Mar 2009

Les exemples de phrases sont extraits de Dubois et Dubois et Charlier (1997).

33

(avec 2 variantes : Jean colre, Jean se colre voir cette lchet) les pronominaux avec factitifs (Jean se braque ds la premire remarque, ce reproche a braqu Jean), les intransitifs pronominaux (Jean culpabilise, Jean se culpabilise, cette sparation culpabilise Jean), les pronominaux intransitifs avec factitif (Jean angoisse, Jean sangoisse, cette prdiction angoisse Jean), les pronominaux avec factitif sujet humain et instrumental pouvant devenir le sujet de phrase (Paul se dcourage facilement, ces critiques le dcouragent), les pronominaux avec locatifs (Jean se plat la campagne), les intransitifs avec un complment en pour (Jean craint pour sa vie), les pronominaux avec un complment en pour (Jean se passionne pour la musique baroque, Jean est passionn pour la musique), et enfin les formes tre participe pass avec manire bien/mal (Paul est mal lun ce matin) ou sans manire (Son rire est forc). chaque classe gnrique est associ un ensemble de schmas syntactico-smantiques appels oprateurs qui caractrisent cette classe. Par exemple, il y a 6 oprateurs pour la classe des verbes psychologiques : sent (avoir tel sentiment), f.sent (donner tel sentiment), ger.mens (avoir telle activit consciente), percep (avoir telle perception), percep.mens (avoir tel savoir) et scrut (appliquer son esprit quelque chose).. chaque entre lexicale, comme samuser de la classe P1a, sont associs une description du sens (gayer,divertir), des drivs nominaux (ment, -teur) et une ou plusieurs phrase(s) qui exemplifie(nt) lemploi du verbe (On s'a~ avec des riens. Un rien a~ P. On a~ P avec un rien). 1.4.2. La classe des verbes psychologiques La classe des verbes psychologiques, note P, contient 2074 entres verbales. La smantique des verbes qui figurent dans cette classe est plus tendue que celle considre habituellement dans les travaux sur les verbes psychologiques. En effet, cette classe comprend les verbes de sentiment mais galement tous les verbes qui expriment une activit de la conscience et de la pense, comme oublier, penser, critiquer, etc. Nous indiquons dans le tableau 8 lorganisation gnrale des verbes psychologiques dans le dictionnaire. Le nombre dentres et un exemple sont donns pour chaque sous-classe. 1.4.3. Le dictionnaire des verbes comme ressource en TAL Une version lectronique du dictionnaire a t implmente dans un tableur (EXCEL) et dans une base de donnes relationnelle (ACCESS) 9. Un projet est en cours (Denis Le Pesant, Modyco - Universit Paris X, Paul Sabatier, LIF - Universit et Max Silberztein, Laseldi - Universit de Franche-Comt) pour reformater cette version et lintgrer des logiciels de TAL existants comme Nooj (Koeva et al. 2007).

tel-00372133, version 1 - 31 Mar 2009

http://www.modyco.fr/

34

Classes smantico-syntaxiques

Sous classes syntaxiques


tre dans tel tat psychologique avoir tel sentiment (P1a) Manifester physiquement sentiment de joie, de douleur (P1b) Avoir telle manifestation physique due tel sentiment, avoir tel sentiment pour/contre (P1c) Avoir tel sentiment portant sur qque chose ou poussant qque chose (P1d)

Nombre dentres
211 34 214 70 180 71 89 97 102 91 438 18 80 71 136 172

Exemple
bouder ricaner blanchir parier mditer penser oublier penser concevoir adorer apaiser plaire encourager analyser critiquer connatre

tel-00372133, version 1 - 31 Mar 2009

Avoir tel sentiment, telle activit consciente (P1)

Avoir telle activit mentale (P1e) Avoir telle activit mentale dirige sur tel objet (P1f) Prendre quelque chose comme objet dactivit mentale (P1g) Avoir lesprit tendu vers (P1h) Avoir tel sentiment portant sur qque chose (P1i) Avoir tel sentiment lgard de qquun (P1j) Induire tel sentiment (P2a) Donner tel sentiment qquun (P2b) Augmenter, diminuer, remplir tel sentiment chez qquun (P2c) Diriger son esprit, son activit rflexive sur qquun (P3a) Diriger son esprit, son activit rflexive sur qque chose (P3b) Avoir ou ne pas avoir la connaissance de qque chose, qquun (P3c)

Faire avoir tel sentiment qquun, laugmenter ou le diminuer (P2)

Manifester telle connaissance, telle analyse (P3)

Tableau 8. Organisation des verbes psychologiques dans le dictionnaire des verbes franais de Dubois et Dubois-Charlier (1997)

35

tel-00372133, version 1 - 31 Mar 2009

36

CHAPITRE 2. SENTIMENTS, MOTIONS, ET OPINIONS : DESCRIPTIONS LINGUISTIQUES


tel-00372133, version 1 - 31 Mar 2009

Nous venons de prsenter quatre tudes qui ont t des tapes importantes dans la description du lexique. Nous montrerons comment certaines de ces tudes ont influenc nos travaux, et en particulier le Lexique grammaire qui a t le point de dpart de notre tude sur les verbes de sentiment. Nous avons tent de montrer que la description linguistique approfondie dun domaine smantique particulier peut tre utilise pour reprer et analyser les lments de ce champ smantique dans des textes. Nous avons ainsi tudi le domaine des sentiments, travaux que nous dcrirons dans une premire partie, puis celui des opinions que nous aborderons dans une deuxime partie. Le fil conducteur de cet expos sera le passage de ltude du mot, la prise en considration du mot dans une proposition, un segment (que nous dfinirons) ou une phrase et enfin ltude dun texte et de plusieurs textes. 2.1. LES SENTIMENTS ET MOTIONS Nous nous sommes intresse la faon dont les sentiments sont exprims dans la langue avec lobjectif de parvenir une description linguistique intuitivement plausible, et donc de rendre compte de la relation de synonymie, ou plus gnralement de la sensation du locuteur que certains mots relvent du mme champ smantique (la tristesse , par exemple) alors que dautres relvent daffects diffrents (la tristesse vs la joie ). 2.1.1. Le mot Il existe de trs nombreuses dfinitions des mots sentiment et motion , selon les niveaux de langage, populaire ou scientifique, selon les disciplines, ou encore en fonction

37

du point de vue thorique adopt. Pour notre tude, nous avons retenu ce que lon peut prouver ou ressentir, et nous parlerons indiffremment de sentiment ou dmotion. Pour rendre compte du champ smantique de ces mots de sentiment, nous avons considr les motions en gnral qui ont, depuis longtemps, suscit lintrt des philosophes et des psychologues. On peut distinguer plusieurs approches dans ltude et la catgorisation des motions : 1) de nombreux auteurs dfinissent des motions de base, comme par exemple Descartes (1649/1988) ou Philip N. Johnson-Laird et Keith Oatley (1989). Dans son Trait sur les passions de l'me, Descartes, tudie six passions simples : l'admiration, l'amour, la haine, le dsir, la joie et la tristesse, primitives dont sont drives toutes les autres passions. Voici un exemple de dfinition : Art.86. La dfinition du dsir. La passion du dsir est une agitation de lme cause par les esprits qui la dispose vouloir pour lavenir les choses quelle se reprsente tre convenables. Ainsi on ne dsire pas seulement la prsence du bien absent, mais aussi la conservation du prsent ; et de plus labsence du mal, tant de celui quon a dj que de celui quon croit pouvoir recevoir au temps venir. Philip N. Johnson-Laird et Keith Oatley ont tabli une taxinomie partir de 590 mots pour dcrire les motions. Leur classification comprend cinq rubriques : le bonheur, la tristesse, la peur, la colre, le dgot. Chaque rubrique est son tour classe en six catgories : les motions de base, les motions relationnelles, les motions qui ont une cause, les motions qui sont cause d'autres motions (ce sont en gnral des verbes) et enfin les motions complexes ; 2) dautres proposent des modles dimensionnels qui partent de lhypothse que toutes les ractions affectives peuvent tre dcrites partir de plusieurs dimensions, en gnral deux : la valeur (plaisir/dplaisir ou affect ngatif/affect positif) et le dynamisme (activation/tranquillit). Parmi eux, citons les travaux de Charles E. Osgood et al. (1957, 1979), et ceux de James A. Russel et Geraldine A. Pratt (1980) ; 3) enfin une troisime approche considre une motion comme le rsultat dune valuation cognitive que fait une personne des interactions entre ses croyances, ses espoirs etc. et son environnement. Citons en particulier le modle dAndrew Ortony et al. (1988), dans lequel les motions peuvent tre issues soit de l'valuation des consquences d'vnements, de l'action d'agents ou de la perception d'un objet. Par exemple, un vnement permettant de raliser un but dclenche de la joie ; une action de l'agent contraire ses principes dclenche de la honte ; la perception d'un objet peut dclencher du dgot suivant les prfrences de l'agent. Les auteurs spcifient dans ce modle les conditions de dclenchement de 22 motions types. Certains auteurs se sont intresss au vocabulaire des motions et la faon dont le langage est utilis pour dcrire des tats motionnels ou des attitudes. Cest le cas par exemple de Joel R. Davitz (1969) qui a fait une description systmatique de 50 termes dmotions, ou de J. R Martin et P.R.R. White (2005) qui ont fait une taxinomie du

tel-00372133, version 1 - 31 Mar 2009

38

langage utilis par des locuteurs anglais pour exprimer des attitudes et des engagements. Ils distinguent trois catgories dattitudes : les motions, les jugements et les apprciations. Leurs travaux sinscrivent dans lapproche de la linguistique systmique fonctionnelle (Michael A. K. Halliday 1994/2004). En linguistique, ltude des sentiments a t aborde dans le cadre de travaux plus gnraux, en smantique lexicale par exemple dans la recherche de primitifs smantiques par Anna Wierzbicka (1993), ou dans la classification des verbes de langlais faite par Beth Levin (1993) dont nous avons parl au 1.2. Les sentiments ont fait l'objet d'un grand intrt dans diffrents formalismes grammaticaux. Les travaux dAdriana Belleti et Luigi Rizzi (1988)], Ray Jackendoff (1990), Danielle Leeman (1995), Nicolas Ruwet (1993, 1994, 1995) Danile Van de Velde (1999) et Jan Van Voorst (1992), parmi dautres, en tmoignent. Enfin, plusieurs grandes ressources lexicales informatises contiennent des informations sur les sentiments et les motions. Cest le cas de deux dentre elles trs utilises : Wordnet, que nous avons dcrit au 1.3., et Framenet (2008). La base de donnes Framenet est organise sous forme de rseau. Elle contient 10 000 units lexicales, dont 6 100 annotes. Chaque item lexical est reli un patron smantique ou frame et associ un ensemble de mots qui voquent ce mme frame. Il y a actuellement 825 frames exemplifis par 135 000 phrases annotes. Dans notre tude, notre hypothse est que la faon dont nous conceptualisons le monde se reflte dans la langue, dans les interrelations tablies entre les mots par le systme linguistique, et que le sentiment de synonymie repose sur le fait que les mots ressentis comme relevant du mme champ notionnel ont des comportements formels similaires. Notre lexique comporte un millier de mots exprimant des sentiments et des motions, tels que des noms comme amour ou peur, des verbes comme aimer, effrayer, ou des adjectifs comme amoureux ou jaloux. Nous avons galement rpertori des expressions plus ou moins figes et familires, exprimant un sentiment, comme avoir les chocottes (avoir peur) ou boire du petit lait (jubiler). Nous proposons une classification dans laquelle ces mots sont rpartis en classes smantiquement homognes. Pour dterminer ces diffrentes classes, nous avons fait appel la notion de synonymie telle que la dfinit Igor Mel'uk (1992) :
Dans notre approche, la synonymie des phrases est prise comme une notion intuitive de dpart. Nous posons que la capacit de juger si deux phrases donnes sont quisignifiantes (= ont le mme sens) fait partie de la comptence linguistique des locuteurs. [...] nous dfinissons la notion de sens partir de la notion de mme sens, cette dernire tant considre comme acquise. . page 11.

tel-00372133, version 1 - 31 Mar 2009

Nous avons commenc cette tude des sentiments par le cas des verbes dits psychologiques , en partant des verbes de la table 4 Lexique grammaire, (Gross 1975), qui est dfinie, comme nous lavons vu au 1.1.2., par un sujet non restreint et un complment humain. La table 4 contient un grand nombre de verbes psychologiques, mais 39

nous en avons cart certains car ils ne correspondent pas notre critre d'interprtation (N1 ressent un sentiment dclench par N0). Ainsi, nous navons pas retenu comme psychologiques les verbes qui acceptent le complment aux yeux de Nhum, qui implique un jugement extrieur, comme dans les exemples suivants : Sa lchet dshonore Marie aux yeux de Max *Sa lchet irrite Marie aux yeux de Max Ce complment spare la classe de dshonorer (non psychologique) de celle de irriter (psychologique) car Max juge que la lchet de Marie dshonore Marie, mais Marie (N1) peut ne rien ressentir. partir de ces critres nous avons slectionn prs de 400 verbes auxquels nous avons ajout les verbes de sentiment comme adorer (environ 100). Puis nous avons class ces verbes en classes homognes smantiquement.

tel-00372133, version 1 - 31 Mar 2009

2.1.1.1. Les classes smantiques des sentiments Ces classes ont t construites partir de notre propre intuition laide de dictionnaires, puis nous les avons soumises pour vrification, un grand nombre de locuteurs qui sont pour la plupart des experts (des chercheurs en linguistique), mais galement des non spcialistes. Ce premier classement a t fait au milieu des annes 90, priode o le recours de grands corpus lectroniques nexistait pas encore, la mthode de travail tait alors lintrospection. Cette classification a t revue et tendue aux noms, adjectifs et quelques expressions plus ou moins figes, et contient actuellement 40 classes. Pour cela, nous avons tudi ces mots en contexte dans des grands corpus lectroniques comme la base Frantext [FRA 08], et dans diffrents textes disponibles sur le Web (articles de presse, blogs, critiques, moteur de recherche, etc.). Une classe a t supprime, Endurcir, une autre a chang de polarit (mouvoir de + est devenue neutre), dautres ont t ajoutes. Les verbes rflexifs nont pas t pris en compte. Cette classification nest pas totalement reprsentative de la complexit de la langue franaise car chaque mot a un sens particulier, et il y a trs peu de vrais synonymes dans la langue. S'il y a un large consensus pour regrouper ensemble des mots tels que nerver, exasprer et irriter, d'autres regroupements donnent lieu des avis divergents, mais pour une formalisation en vue dun traitement informatique, des regroupements sont ncessaires. De plus la langue volue, et des modifications de sens apparaissent frquemment. La langue du Web est galement diffrente de la langue des romans, car certains textes sont crits par des internautes qui ne respectent pas la langue standard . Nous distinguons trois catgories de classes selon leur valence (ou polarit) : 1-) Les classes de polarit ngative qui dcrivent un sentiment plutt dsagrable, comme la peur ou la colre. On en dnombre vingt-trois, telles Peur, Tristesse, Colre, etc. 40

2-) Les classes de polarit positive qui dcrivent un sentiment plutt agrable, comme lamour ou lamusement. Il y a quatorze classes de ce type, telles Amour, Intrt, Passion, etc. 3-) Les classes de mot sans polarit indique, soit qui dcrivent un sentiment qui nest souvent ni dsagrable ni agrable comme la classe Indiffrence, soit avec une polarit qui sera indique par le contexte : les classes mouvoir et tonnement. Par exemple, dans la phrase La hauteur de la Tour Eiffel surprend les touristes , le sentiment ressenti par les touristes na pas de polarit explicitement exprime alors que dans la phrase La trahison de son mari a surpris Marie ou La vue de tous ces morts causs par la bombe a bouleverse Marie , on comprend que Marie prouve un sentiment assez pnible et ngatif. Par convention, nous noterons neutre une polarit ni positive ni ngative. Prcisons toutefois que les mots dindiffrence sont le plus souvent de polarit ngative et les mots dmotion de polarit plutt positive. La liste des classes est donne dans le tableau 9. tel-00372133, version 1 - 31 Mar 2009

Polarit ngative Amertume Colre Dprime Dranger Effarement Ennui Intimidation Jalousie Remords Tracas Polarit positive Amour Amusement Fascination Intrt Piti Satisfaction Sans polarit mouvoir tonnement

Dception Dsapprobation Haine Obsession Tristesse Apaisement Joie Soulagement Indiffrence

Ddain Dconcerter Honte Offense

Dgot Douleur Indignation Peur

merveillement Excitation Orgueil Passion Stimulation

Tableau 9. Classes smantiques des sentiments La distribution des mots dans ces classes nest pas homogne. En effet, certains sentiments sont dcrits par trs peu de noms et dadjectifs, comme la honte ou le remords, et par aucun verbe. ces mots et ces classes, nous avons associ un ensemble de proprits syntaxiques et smantiques dont nous allons dcrire un sous-ensemble, on trouvera dans (Mathieu 1999, 2000 et 2005) lensemble des descriptions.

2.1.1.2. Relations entre classes Les classes smantiques sont relies entre elles par des relations de sens, dintensit et dantonymie, reprsentes par des graphes simples. Le graphe dintensit est un graphe

41

orient selon lintensit du sentiment exprim et ressenti. Nous avons reprsent une partie de ce graphe dans la Figure 2. Intrt Dranger Amour Colre Passion Indignation Fascination

Figure 2. Exemples de relations dintensit entre classes smantiques Les classes smantiques sont relies par des arcs qui sont tiquets par des indications de degr dintensit, reprsents par le symbole  . Ainsi, un accroissement dintensit de lintrt sur les lments de la classe Intrt (intrt, attraction, etc.), est dcrit par les mots de la classe Amour (affection, amour, etc.), un sentiment damour plus fort est reflt par la classe Passion (passion, excitation, etc.), et un sentiment de passion plus intense est reflt par les mots de la classe Fascination (fascination, subjuguer, etc.). De la mme faon, il y a une gradation de lintensit entre les classes Dranger (importuner, gner, etc.), Colre (exasprer, irriter, etc.) et Indignation (indigner, scandaliser, etc.). Le graphe des relations de sens est un graphe orient dont les arcs sont tiquets par des traits smantiques. Il contient divers types dinformation. Dune part, il reprsente les proximits smantiques de certaines classes, indiques par des arcs tiquets avec des traits smantiques spcifiques. Ainsi, dans lexemple de la figure 3, la classe Intrt (attirance, attirer, intrt, etc.) est relie la classe Excitation (moustiller, troubler, etc.) par lajout dun dsir sexuel. {Dsir sexuel } Intrt Excitation

tel-00372133, version 1 - 31 Mar 2009

Figure 3. Exemple de relation de sens entre classes smantiques (1/3) Dautre part, dans ce graphe est indiqu comment la smantique de certaines classes est construite partir de celles de plusieurs autres ; un exemple est donn dans la figure 4, avec la classe Amertume (aigrir, amertume, etc.) qui est un mlange de tristesse et de rancur due une dception (Le Petit robert 2001). Dception Amertume Tristesse Figure 4. Exemple de relation de sens entre classes smantiques (2/3)

42

Enfin, ce graphe contient galement le fait quune modification de sens, indique par la spcification dun trait smantique particulier, peut faire basculer la polarit dune classe neutre . Cest le cas dans lexemple de la figure 5, o la classe tonnement (qui contient des mots dtonnement comme tonner, surprendre, stupfaction, etc.) sans polarit explicite devient une classe de polarit positive, la classe merveillement (blouir ou merveiller, etc.), si ltonnement est ml dadmiration ; linverse, elle devient une classe de polarit ngative si ltonnement est ml deffroi (classe Effarement : consterner, effarer, etc.) Les relations dantonymie caractrisent des mots ayant un sens oppos. Ainsi, la classe Colre est antonyme de la classe Apaisement, cest--dire que chaque verbe, nom ou adjectif de la premire classe est antonyme avec au moins un verbe, nom ou adjectif respectivement de la seconde classe et vice versa. tel-00372133, version 1 - 31 Mar 2009 merveillement
POLARIT POSITIVE POLARIT NEUTRE POLARIT NGATIVE

{Admiration} tonnement {Effroi}

Effarement

Figure 5. Exemples de relation de sens entre classes smantiques (3/3) Une classe peut avoir plusieurs antonymes et tre antonyme de plusieurs classes. La relation dantonymie nimplique pas une inversion de polarit ; ainsi, les classes Apaisement et Stimulation sont toutes deux de polarit positive. Un extrait du graphe des antonymes est donn dans la figure 6. Lantonymie entre deux classes est indique par un arc et le symbole . Apaisement

Colre

Stimulation Satisfaction Amusement


Dception Ennui

Figure 6. Exemples de relation entre classes smantiques

43

2.1.1.3. Proprits des items lexicaux Nous avons tudi un ensemble de proprits linguistiques dune part pour les verbes, dautre part pour les emplois de noms et dadjectifs.

2.1.1.3.1. Intensifieur L'hypothse que nous avons propose pour les verbes est qu'il y a des verbes neutres et des verbes qui ont un intensifieur incorpor. Considrons les phrases (1) et (2) : (1) Les fantmes terrifient Luc (2) Les fantmes effrayent beaucoup Luc Le sens de ces phrases est trs proche, ce qui pourrait indiquer que le verbe terrifier est synonyme de effrayer beaucoup et contient l'intensifieur beaucoup. Ainsi, effrayer et terrifier sont dans la mme classe (Peur), mais terrifier est plus fort queffrayer. De la mme faon, exasprer et irriter sont dans la mme classe (Colre), mais exasprer est plus fort quirriter. Nous avons dfini une proprit [Intensifieur] qui dcrit cette diffrence dintensit, dont la valeur est Mdian pour irriter et effrayer, et Fort pour exasprer et terrifier. Nous avons tendu cette proprit des verbes aux autres catgories de mots (nom et adjectif).

tel-00372133, version 1 - 31 Mar 2009

2.1.1.3.2. Emploi mtaphorique des verbes Certains verbes ont uniquement un sens psychologique, comme aimer, alors que dautres, tels irriter ou blouir, ont deux sens, un qui est concret ou propre (phrases 3 et 4) et un psychologique par mtaphore (phrases 5 et 6) : (3) Le soleil irrite Marie (sa peau) (4) La lumire blouit Marie (ses yeux) (5) Paul irrite Marie (par son comportement) (6) Lintelligence de lorateur blouit Marie Cette particularit dexistence ou non dun emploi non psychologique pour un verbe, est dcrite par la proprit [Emploi non psychologique], dont la valeur est non pour le verbe aimer et oui pour le verbe irriter.

44

2.1.2. La proposition Certaines proprits caractrisent les constructions dans lesquelles litem lexical peut apparatre, comme la position syntaxique de lexprienceur, lagentivit du sujet du verbe, etc.

2.1.2.1 Exprienceur On appelle exprienceur la personne qui ressent lmotion ou le sentiment, et objet la cause ou lobjet de ce sentiment. Ainsi, dans les phrases (7) et (8), lexprienceur est Marie et lobjet est Paul : (7) Marie aime Paul (8) Paul effraye Marie tel-00372133, version 1 - 31 Mar 2009 Ces structures diffrent par la position syntaxique de lexprienceur. Dans (7), lexprienceur est le sujet syntaxique Marie et le complment Paul est lobjet de son amour. Dans (8), lexprienceur est le complment dobjet Marie, et le sujet Paul est la cause de sa frayeur. La valeur de cette proprit [Exprienceur] est Sujet pour les verbes comme aimer, et Complment pour les verbes comme irriter.

2.1.2.2. Agentivit du sujet du verbe De nombreux verbes de sentiment, comme le verbe effrayer, ont un sujet qui peut avoir une interprtation agentive. La phrase Luc effraye Marie a deux interprtations possibles : Luc effraye Marie de faon volontaire, intentionnellement, ou il leffraye sans le vouloir, par son comportement ou son apparence ou quelque chose dautre. Cette proprit est note [Sujet agentif] ( sujet actif dans Mathieu 2000), elle a pour valeur oui pour le verbe effrayer et non pour les verbes tracasser et obsder, par exemple.

2.1.2.3. Structure et slection des arguments du verbe Quand lexpression qui dcrit celui ou celle qui prouve le sentiment (lexprienceur) est en position de complment, il peut toujours tre explicitement une personne, comme Marie dans Paul irrite Marie, mais il peut galement, pour certains verbes, tre parfois une expression mtonymique se rfrant une personne. Nous avons distingu trois catgories dexpressions, selon la distance de la mtonymie par rapport la personne : ce peut tre (i) une mtonymie totale, une partie du corps ou partie de lme , comme cur ou esprit, (ii) une mtonymie partielle, un nom de sentiment ou de qualit comme colre, vanit, etc., ou (iii) aucune mtonymie, tout autre nom comme, par exemple, espoirs, convictions, etc. 45

Certains verbes slectionnent les noms de la premire catgorie tel briser, par exemple dans Marie a bris le cur de Luc, certains verbes slectionnent en plus les noms de la seconde catgorie comme apaiser ou calmer comme dans La berceuse a apais/ calm la colre du bb, certains verbes acceptent galement les noms de la troisime catgorie comme satisfaire dans Les promesses de Marie ont satisfait les espoirs de Luc. Enfin, certains verbes comme tracasser ou dgoter, acceptent parfois des complments non strictement humains, mais avec difficult. Lassociation de cette caractrisation du complment et de la proprit indiquant un possible emploi mtaphorique permettra, par exemple, de reconnatre un sens concret dans Marie a bris les doigts de Luc et une interprtation psychologique dans Marie a bris le cur de Luc.

2.1.2.4. Quelques contraintes dans les constructions passives tel-00372133, version 1 - 31 Mar 2009 Nous considrons ici les verbes comme irriter, cest--dire dont lexprienceur est en position de complment. la forme passive, le complment dagent est introduit par la prposition par, comme dans la phrase Paul est calm par les paroles de Marie. Le passif de nombreux verbes, tonner par exemple, peut se former galement avec la prposition de, comme dans Paul est tonn de l'attitude de Marie. Mais pour certains verbes cela nest pas possible : on ne peut pas dire *Paul est calm des paroles de Marie ou *Paul est intress de Marie/ de la politique. Nous notons cette proprit [N1 est Vpp de N0] avec pour valeur non pour les verbes calmer et intresser et oui pour le verbe tonner. Les caractristiques smantiques du sujet contraignent les possibilits de formation du passif avec la prposition de. Ainsi, si le sujet est un nom humain, le passif n'est pas toujours possible. Par exemple les phrases lactif Luc dconcerte Marie et Le comportement de Luc dconcerte Marie et la phrase passive Marie est dconcerte du comportement de Luc sont acceptables, mais Marie est dconcerte de Luc est plus difficile. Il en est de mme si le sujet est un substantif concret. En effet, les phrases Marie est dconcerte de ce tableau/tissu sont difficiles, voire inacceptables. La grande majorit des verbes de sentiment ont une forme passive avec le complment d'agent effac. Cest le cas du verbe calmer. Ainsi on peut dire Paul calme Marie, Marie est calme par Paul et Marie est calme. Cependant, un petit groupe de verbes interdit cet effacement, comme tenailler par exemple, car si Les remords tenaillent Marie et Marie est tenaille par les remords sont des phrases acceptables, on ne peut dire Marie est tenaille. On nomme cette proprit [passif avec agent obligatoire]. Elle prend la valeur oui pour tenailler et non pour calmer. Enfin, les quatre cinquimes de ces verbes agent obligatoire sont des emplois figurs de verbes dont l'emploi propre autorise un complment d'objet humain. Le passif sans agent n'est alors possible que par rfrence l'emploi propre. Par exemple Marie est brle peut tre le passif de Les flammes ont brl Marie qui est un emploi propre mais non de La

46

passion brle Marie. De mme Max est ras peut tre le passif de Le coiffeur rase Max mais beaucoup plus difficilement de Ce discours interminable rase Max.

2.1.2.5. Force des sentiments La force dun sentiment peut tre intensifie, comme nous lavons vu, par lemploi dun mot de mme smantique mais avec une intensit plus forte par exemple peur/terreur, mais galement par lutilisation dadjectif ou de verbe particulier. Ainsi, les noms de sentiment peuvent tre intensifis par les adjectifs dits intensifs comme grand, immense, profond, habituellement utiliss pour dnoter lintensit (un amour profond), mais aussi avec des adjectifs plus spcifiques certains noms de sentiment comme fou, ivre, mort (tre fou de joie, ivre de colre, mort de peur) et galement des adjectifs de couleur : on peut tre vert (de jalousie, de rage, de colre, de peur), rouge de colre, blanc (de colre, de peur), tre jaune de jalousie, blme (de colre, de rage), ple de colre, avoir une peur bleue, une colre noire, etc. Ces adjectifs, et en particulier ceux de couleur, sont utiliss le plus souvent pour des sentiments polarit ngative dont ils augmentent la force. Certains verbes indiquent une modification de lintensit de sentiment, en gnral une augmentation, exprime par une manifestation physique du corps tout entier : dborder de joie, trembler de peur/de rage, crever de jalousie, ou bien dune partie seulement, souvent le visage : cumer de rage, blmir de peur, rougir/blanchir de colre [LEE 91]. Lintensit exprime par les verbes de sentiment peut galement tre modifie, souvent par lajout dadverbe ou de locution adverbiale : aimer passionnment/ la folie. Enfin, des adverbes comme peu, trs, etc. modifient la force dadjectifs ou de verbes : il est trs amoureux, trs inquiet, etc. 2.1.3. La phrase : formation de paraphrase par nominalisation Les phases avec un verbe de sentiment comme Luc aime Marie ou La hauteur de la tour Eiffel tonne Jean peuvent tre paraphrases en remplaant le verbe de sentiment par prouver le sentiment , ainsi prouver de ltonnement a le mme sens qutre tonn, et prouver de lamour peut remplacer (dans certains cas) aimer. On pourra dire Luc prouve de ltonnement devant la hauteur de la tour Eiffel, et Jean prouve de lamour pour Marie. La valeur des prpositions introduites (devant, pour) dpend (dans notre description) de la classe du verbe, et de la nature du sujet (un humain, un objet concret, etc.). La phrase La prouve (du dgot + de la passion) pour la lecture est possible, mais les phases suivantes sont plus difficiles : La prouve du dgot / de la passion devant la lecture ou Jean prouve de lamour devant Marie ou Luc prouve de ltonnement pour la hauteur de la tour Eiffel. Prcisons que cette paraphrase par nominalisation nest pas toujours possible car certains verbes nont pas de nom associ, comme interloquer par exemple.

tel-00372133, version 1 - 31 Mar 2009

47

2.1.4. Les sentiments dans un texte : traitements automatiques Notre objectif, dans nos premiers travaux sur les sentiments, tait de faire une description linguistique, formalise mais sans buts applicatifs. Et, si la ralisation dun systme informatique (FEELING, cf description dtaille 3.2.) nous a permis de montrer le bien-fond, ainsi que leurs limites, des reprsentations que nous proposions, elle ntait pas le but initial de nos descriptions. La formalisation que nous avons adopte pour dcrire ces connaissances sur les sentiments est dans un format qui nous est propre, constitu de types htrognes de reprsentations. Cette disparit, due la complexit des donnes reprsenter, rend difficile leur emploi par des logiciels qui ne seraient pas ad hoc comme FEELING. Dun point de vue applicatif, on pourrait considrer ces connaissances comme des donnes accumules mais inertes, passives , ne pouvant tre utilises pour une quelconque application. Plusieurs lments ont contribu modifier notre perspective : tel-00372133, version 1 - 31 Mar 2009 - un large consensus sest fait au sein de la communaut linguistique et du TAL pour adopter des formalismes standardiss de reprsentation des donnes, comme les ontologies, ce qui permet de mettre les connaissances la disposition du plus grand nombre. Nous avons pu ainsi reprsenter une partie de notre description des sentiments sous forme dune ontologie (cf. description 3.2.3. dans la suite), ce qui rend ces connaissances accessibles aussi bien des utilisateurs humains qu des outils informatiques, nous avons ainsi transform ces donnes passives en donnes actives ; - laugmentation de la capacit de traitement et de stockage des ordinateurs et labondance de documents lectroniques disponibles dans tous les domaines et dans des formes trs varies (articles de presse, romans, forums, blogs, bases de donnes, etc.) a rendu possible divers traitements de corpus (recherches doccurrences, vrification dhypothses, etc.), au niveau dun document ou de plusieurs documents ; - enfin, tant donn la nature du support du texte, qui de papier est devenu numrique, et grce larrive dune nouvelle gnration de plateformes informatiques, comme Navitexte (Couto et Minel 2006, 2008, Couto paratre), qui proposent des outils divers ddies ce nouveau support, des problmatiques nouvelles sont apparues dans ltude dun texte ou de plusieurs textes. En effet, la lecture dun texte via un cran dordinateur nest pas la mme activit que lire un texte sur un support papier et sa version lectronique offre de nombreux modes de lecture. Une lecture linaire, bien sr, mais galement une lecture selon des modalits que le lecteur dfinit. Pour un roman, par exemple, on peut sintresser des personnages particuliers, se focaliser sur la chronologie des vnements, etc. Pour permettre ces diffrentes lectures, il faut dabord enrichir le texte, le dcorer , avec des annotations sur les morceaux de textes (mot, syntagme phrase, paragraphe, etc.) que lon estime pertinents pour ce que lon veut tudier, avec des annotations syntaxiques et/ou smantiques.

48

Une fois cette annotation faite, on peut, en utilisant NaviTexte par exemple, effectuer divers traitements smantiques sur ce texte, comme du filtrage avec certaines conditions, ou parcourir ce texte avec des objectifs prcis. Cest ce que nous avons propos dans le domaine des sentiments, en faisant appel lontologie que nous avons construite pour annoter des expressions de sentiment dans un roman, puis en dfinissant des parcours de lecture du roman, une navigation textuelle, en fonction de ces sentiments (leur nature, leur force, les personnages qui les prouvent, etc.) Le cadre que nous avons adopt est celui dvelopp dans les travaux de Javier Couto et Jean-Luc Minel pour qui la navigation textuelle :
telle quelle est conue, considre que lutilisateur parcourt un texte en exploitant, sans que cette dmarche soit pour lui ncessairement explicite, des informations linguistiques qui y sont prsentes : des marqueurs discursifs, des groupes nominaux portant sur un thme, des verbes lis linformation recherche, des phrases qui comportent une smantique particulire (phrases conclusives, rcapitulatives, dfinitoires, causales, etc.), lorganisation de diffrents units textuelles... Couto

tel-00372133, version 1 - 31 Mar 2009

paratre.

Le texte que lon veut parcourir doit donc dabord tre annot, avec des informations la fois syntaxiques et smantiques sur les sentiments. Nous montrons un exemple dannotation ci-dessous.

2.1.4.1. Annotation du texte Le texte que nous avons annot est un extrait de Madame Bovary de Gustave Flaubert (1857/2001). Les expressions de sentiment sont annots avec six attributs : la polarit du sentiment exprim (ngative, neutre ou positive), la catgorie syntaxique du mot de sentiment annot (nom, verbe ou adjectif), la classe smantique du sentiment, son niveau dintensit (Intensifieur Faible, Mdian ou Fort), la personne qui ressent le sentiment (Experienceur) et son objet ou sa cause (Objet). Lannotation est reprsente dans la figure 7. (1)- Partie I, Chap.IX, p.116. Elle se sentait, d'ailleurs, plus irrite de lui. [Polarit Ngative, Catgorie Verbe, Classe Irritation, Intensifieur Mdian, Experienceur Emma, Objet Charles]. (2)- Partie II, Chap.V, p.168. Elle tait amoureuse de Lon. [Polarit Positive, Catgorie Adjectif, Classe Amour, Intensifieur Mdian, Experienceur Emma, Objet Lon] (3)- Partie II, Chap.IX, p.225. - Oh ! Vous tes bon ! Dit-elle. - Non, je vous aime voil tout ! [Polarit Positive, Catgorie Verbe, Classe Amour, Intensifieur Mdian, Experienceur Rodolphe, Objet Emma] 49

tel-00372133, version 1 - 31 Mar 2009

(4)- Part.II, Chap.IX, p.234. C'tait Rodolphe. [] ! - Je t'aime ! [Polarit Positive, Catgorie Verbe, Classe Amour, Intensifieur Mdian, Experienceur Emma, Objet Rodolphe] (5)- Part.II, Chap.X, p.242. Il [Rodolphe] la subjuguait. [Polarit Positive, Catgorie Verbe, Classe Fascination, Intensifieur Fort, Experienceur Emma, Objet Rodolphe] (6)- Part.II, Chap.X, p.245. Elle se demanda mme pourquoi donc elle excrait Charles. Polarit Ngative, Catgorie Verbe, Classe Haine, Intensifieur Fort, Experienceur Emma, Objet Charles] (7)- Part.II, Chap.XI, p.258. Charles []. -Assieds-toi, dit-elle, tu m'agaces !. [Polarit Ngative, Catgorie Verbe, Classe Irritation, Intensifieur Mdian Experienceur Emma, Objet Charles] (8)- Part.II, Chap.XII, p.261. Plus elle se livrait l'un, plus elle excrait l'autre. [Polarit Ngative, Catgorie Verbe, Classe Haine, Intensifieur Fort, Experienceur Emma, Objet Charles] Figure 7. Annotation dun extrait de Madame Bovary Pour chaque phrase, les rsultats de lannotation sont mis entre crochets. La localisation des extraits dans le roman (Partie, Chapitre, page) est indique devant chaque phrase. Le processus dannotation est actuellement semi-automatique. Il se fait en plusieurs tapes : dans une premire tape, le texte source est soumis un analyseur syntaxique (Bourigault 2002) qui, associ des heuristiques ad hoc , produit une annotation morphosyntaxique et les relations entre les diffrentes parties du discours comme verbe et arguments ou nom et adjectifs. Puis, dans une deuxime tape, lontologie sera utilise pour ajouter automatiquement des proprits, telle que lintensit du sentiment ou les relations entre les diffrentes parties du discours, comme la dtermination de la personne qui prouve le sentiment ou de lobjet du sentiment. Enfin, dans ltape 3, une annotation manuelle rsout certaines difficults, comme la rsolution danaphores, et produit le texte final annot. La figure 8 montre lannotation de lexemple (3) de la figure 7. Dans cet exemple, la partie gauche de la figure indique les diffrentes tapes appliques au texte source, la partie

50

droite indique le texte modifi. Le rsultat de ltape 1 : je vous aime, Pro|je|1| Pro|vous|2| VCONJ|aimer|aime| sujet 1 cod 2 indique que je et vous sont des pronoms (Pro), de position 1 et 2 respectivement dans la phrase, aime est le verbe conjugu aimer , dont le sujet est en position 1 et le complment dobjet en position 2.

Texte source

Elle se tourna vers lui avec un sanglot. Oh ! vous tes bon ! dit-elle. Non, je vous aime, voil tout ! Vous n'en doutez pas ! Dites-le-moi ; un mot ! un seul mot ! Et Rodolphe, insensiblement, se laissa glisser du tabouret jusqu terre ;

tape 1 Parser + heuristiques

je vous aime, Pro|je|1| Pro|vous|2| VCONJ|aimer|aime| sujet 1 cod 2

tape 2 Appel lOntologie

tel-00372133, version 1 - 31 Mar 2009

je vous aime , Pro|je|1| Pro|vous|2| VCONJS|aimer|aime| sujet 1 cod 2 [Polarit Positive, Catgorie Verbe, Classe Amour, Intensifieur Mdian, Experienceur je, Objet vous] je vous aime [Polarit Positive, Catgorie Verbe, Classe Amour, Intensifieur Mdian, Experienceur Rodolphe, Objet Emma]

tape 3 Rsolution des anaphores = Texte final annot

Figure 8. Processus dannotation Dans ltape 2, lappel lontologie permet dindiquer la Polarit, la Catgorie, et la classe smantique de lexpression du sentiment , ici le verbe aimer , le niveau dintensit de cet amour (Intensifieur), lExprienceur je , et lObjet du sentiment vous . Enfin, dans ltape 3, lExprienceur je est remplac par Rodolphe , et lObjet du sentiment vous est remplac par Emma . La premire phase pour lannotation smantique des sentiments dans un texte est le reprage des expressions de sentiment. Ensuite, plusieurs solutions sont possibles : 1) Indiquer quon a repr un sentiment, mais nintroduire aucune autre information. Cela suppose un appel lontologie chaque fois quon sintressera un critre particulier. Dun point de vue informatique, il y a une conomie de la reprsentation, mais une dgradation des performances due des appels rpts lontologie ; 2) indiquer quon a repr un sentiment et ajouter toutes les informations le concernant qui sont contenues dans lontologie. Le texte annot contient ainsi toutes les connaissances connues, et donc il ny aura quun appel lontologie. Cette solution est trs performante,

51

nanmoins elle prsente le dsavantage de la perte de lisibilit du texte et dune grande redondance dans les annotations ajoutes ; 3) une solution mdiane : indiquer quon a repr un sentiment et inclure, par un appel lontologie, un certain nombre dinformations que lon estime pertinentes pour rpondre la majorit des interrogations du lecteur. Cela permet de ne faire appel ensuite lontologie que dans certains cas particuliers. Cest loption que nous avons choisie dans lexemple prcdent. Si, pour un sentiment repr (lamour dans cet exemple), on sintresse (uniquement) sa catgorie grammaticale, sa classe smantique, la polarit, aux personnages qui prouvent le sentiment, lobjet et lintensit de ce sentiment, lannotation du texte est suffisante. En revanche, si lon veut tudier les sentiments proches smantiquement mais de force plus ou moins grande, les synonymes, antonymes, etc., un nouvel appel lontologie est ncessaire.

tel-00372133, version 1 - 31 Mar 2009

2.1.4.2. Navigation textuelle Comme nous lavons expliqu, cette annotation des sentiments est utilise pour la navigation travers un texte avec des critres spcifis. Plusieurs parcours de lecture sont possibles travers les exemples (1) (8) de la figure 7. partir du dbut du roman, un parcours qui sintresse ce que ressent Emma pour Charles ? suivra les squences 1, 6, 7, 8; un autre que ressent Emma pour Rodolphe ? commence la phrase 4, puis va la phrase 5. Pour reprsenter ces diffrents parcours, nous avons implment le roman annot dans la station de travail informatique NaviTexte. La figure 9 reprsente lcran qui affiche lextrait annot de la figure 7.

Figure 9. Exemple dcran NaviTexte

52

Ici, le lecteur sintresse un sentiment particulier : lamour. partir dune phrase o Emma est lobjet dun amour (ici celui de Rodolphe), 5 parcours sont possibles dans la suite du roman. Ces parcours sont indiqus dans le rectangle bleu et jaune associ au verbe aime (en gras dans le texte) et reproduit ci-dessous pour une meilleure lisibilit : - Aller o Emma est lobjet dun sentiment plus faible - Aller o Emma est lobjet dun sentiment identique - Aller o Emma est lobjet dun sentiment plus fort - Aller o Emma est lobjet dun sentiment antonyme - Aller o Emma prouve le mme sentiment Le lecteur peut par exemple souhaiter aller vers une phrase (1) o Emma est lobjet dun sentiment plus faible, (2) aller o Emma est lobjet dun sentiment (amour) identique, (3) aller o Emma est lobjet dun sentiment plus fort, (4) aller o Emma est lobjet dun sentiment antonyme (comme la haine), ou enfin (5) aller vers une phrase o cest Emma et non plus Rodolphe, qui prouve un sentiment damour. Dans cet exemple, la navigation propose est vers lavant, mais il est possible aussi de combiner diffrentes conditions (intensit, exprienceur, etc.) avec lorientation souhaite (en avant ou en arrire).

tel-00372133, version 1 - 31 Mar 2009

2.1.4.3. Filtrage smantique Lannotation des sentiments dans un texte permet galement de dfinir des filtres smantiques sur ce texte. Nous citons Jean-Luc Minel ( paratre) pour qui le filtrage smantique :
se concrtise par lexistence dun certain nombre dlments : - une reprsentation unique et abstraite dun texte [...]. Un langage symbolique de description de ces units doit aussi tre propos pour exprimer cette reprsentation. - un jeu dannotations qui peuvent tre associes aux units et aux relations qui composent le texte. - une smantique associe ces annotations, celle-ci pouvant prendre la forme dune description formelle comme dans une ontologie ou plus descriptive comme celle dune reprsentation visuelle interprtable par un lecteur humain. - un langage qui permette de construire un filtre, cest--dire qui possde une puissance dexpression ncessaire llaboration de conditions de filtrage sur les lments annots du texte ainsi que sur leurs relations, elles aussi ventuellement annotes. - des spcifications des reprsentations visuelles qui seront prsentes au lecteur sous forme d crit dcran , [...]. - un langage qui permette de formaliser la navigation textuelle [...] ces connaissances incluent la modlisation des besoins spcifiques dun lecteur pour un type de support daffichage donn.

53

Certaines des proprits que avons tudies sont utilisables pour lannotation et le filtrage des sentiments dans les textes (que lon peut considrer comme un sous-ensemble des annotations) et permettent par exemple de : 1. reconnatre lexpression dun sentiment, mme si le mot de sentiment est employ avec un sens mtaphorique comme dans la phrase Marie a bris le cur de Luc qui indique une profonde souffrance morale de Luc, alors que dans Marie a bris les doigts de Luc, ce dernier ressent une souffrance physique. Il faut galement reprer les expressions comme en avoir gros sur lestomac (tre trs triste, avoir beaucoup de chagrin) ou avoir les foies (avoir peur), voir rouge (tre en colre) ; 2. comprendre et analyser smantiquement cette expression : est-ce de lamour, de la peur, de la joie, etc. ? Le contexte sera utilis pour rsoudre un problme que lon rencontre frquemment, celui de la polysmie. En effet, un mme item lexical peut rfrer plusieurs sentiments, par exemple le verbe ennuyer qui a trois interprtations possibles : (i) causer du souci (classe Tracas) comme dans Les mensonges de son fils ennuient/tracassent Paul (ii) remplir d'ennui, lasser (classe Ennui), par exemple dans Le discours fleuve de l'orateur ennuie/rase l'assistance ou (iii) importuner, causer du drangement (classe Drangement) qui est son sens dans la phase Le bruit assourdissant des pelleteuses (ennuie/drange) Paul ; 3. dterminer quel est loppos et ventuellement la dcomposition du sentiment exprim, par exemple lmerveillement est un mlange dadmiration et dtonnement (Le Petit Robert 2001) ; 4. reconnatre qui prouve le sentiment et quel est son objet. Par exemple dans le cas dune phrase avec un verbe de sentiment, comme nous lavons vu prcdemment, la reconnaissance du sujet et du complment du verbe nest pas suffisante, car si dans Jean aime Marie, cest effectivement le sujet Jean qui prouve de lamour pour le complment Marie, dans la phrase Les cris de Marie effrayent Luc, le sujet du verbe est Les cris qui sont lobjet de la frayeur de Luc, cest donc ce dernier qui prouve un sentiment de frayeur, alors quil est le complment du verbe effrayer ; 5. reprer que la force dun sentiment est amplifie ou diminue, et valuer le degr plus ou moins fort de cette intensit. Comme nous lavons vu, la force des sentiments peut tre indique de plusieurs faons : par lajout dadverbe (peu, trs), par lemploi dun mot de mme smantique mais avec une intensit plus faible ou plus forte par exemple peur vs terreur, ou par des expressions qui, le plus souvent, expriment une trs grande force du sentiment comme blmir/tre vert de peur, ou cumer de rage. Comme nous lavons soulign prcdemment, la perspective de nos recherches sest dplace au cours du temps et nous sommes passe de travaux orients description des travaux orients application (sans pour autant ngliger la description). Cette volution nous a amen travailler sur le texte. Cet intrt, ajout celui de mesurer la 54

tel-00372133, version 1 - 31 Mar 2009

gnricit de nos reprsentations, nous a conduite dune part complter notre ontologie des sentiments par une description des actes de paroles comme vocifrer : Parler en criant et avec colre (Le Petit Robert 2001) ou fulminer : Se laisser aller une violente explosion de colre, se rpandre en menaces, en reproches (Le Petit Robert 2001), et dautre part largir le champ smantique de nos recherches un domaine voisin, celui des opinions.

tel-00372133, version 1 - 31 Mar 2009

55

2.2. LES OPINIONS Nous proposons une tude des expressions dopinion dans les textes, en franais et en anglais. Ce travail est en cours dlaboration, il est fait en collaboration avec Nicholas Asher et Farah Benamara (Asher et al. 2008). Nous avons abord cette tude avec une mthodologie qui tait voisine au dpart de celle adopte dans ltude des sentiments car nous avons recherch des rgularits de sens entre les expressions dopinions et pris en compte certaines constructions afin didentifier des classes smantiques homognes. Lapproche est lgrement diffrente cependant car lobjectif tant une analyse et une valuation globales des opinions dans un (ou plusieurs) texte, nous nous sommes intresss aux diffrents lments qui concourent leur valuation, et en particulier, la faon dont les propositions contenant les expressions dopinion sont relies entre elles lintrieur dun discours. De nombreux travaux cherchent tablir la part de subjectivit ou dobjectivit dun texte (Pang et al. 2002) (Turney 2002), dterminer la polarit et la force des opinions exprimes dans un document (Yu et Hatzivassiloglou 2003) (Kim 2004), (Wilson et al. 2006) et/ou reprent celui qui exprime lopinion (Bethard et al. 2004), (Kim et Hovy 2005), (Choi et al. 2005). Certains, comme (Whitelaw et al. 2005], utilisent la classification des attitudes et des engagements de (Martin et White 2005). Lapproche du projet MPQA (Multi-Perspective Question Answering), dvelopp par Janice Wiebe et al. lUniversit de Pittsburg (Wiebe et al. 2005], est diffrente car leur objectif est de fournir un large corpus de textes de journaux annots manuellement, en reprant un ensemble dexpressions relevant de la sphre prive (opinions, sentiments, motions, valuations, spculations) et la source de ces expressions. 2.2.1. Le mot Il y a de trs nombreuses dfinitions de la notion dopinion, comme par exemple :
Jugement, avis, sentiment qu'un individu ou un groupe met sur un sujet, des faits, ce qu'il en pense Larousse - Jugement, en bien ou en mal, qu'on porte d'une personne ou d'une chose. - Sentiment qu'on se forme des choses. Littr Manire de penser sur un sujet ou un ensemble de sujets, jugement personnel que l'on porte sur une question, qui n'implique pas que ce jugement soit obligatoirement juste. TLFi Manire de penser, de juger; attitude de l'esprit qui tient pour vraie une assertion; assertion que l'esprit accepte ou rejette (gnralement en admettant une possibilit d'erreur). Petit Robert

tel-00372133, version 1 - 31 Mar 2009

Plutt quen adopter une prcise, nous avons prfr tudier comment un contenu intellectuel ou affectif sur un sujet donn est explicitement et lexicalement exprim. Notre approche pour catgoriser les opinions utilise les recherches en smantique lexicale de Beth Levin que nous avons cites au 1.2., et celles dAnna Wierzbicka (1987). 56

Anna Wierzbicka classe approximativement 270 verbes anglais qui se rfrent des actes de paroles rpartis en 37 classes selon leur signification. Cette classification est donne dans le tableau 10.
Accuser Blmer Dire Louer Se Plaindre Souligner Admettre Conclure Discuter Se moquer Promettre Soutenir Affirmer Confirmer Sexclamer Offrir Rcapituler Appeler Conseiller Informer Ordonner Remarquer Attaquer Dclarer Interdire Pardonner Remercier Avertir Demander Interroger Parler Rpondre Baptiser Deviner Laisser Entendre Permettre Rprimander

Tableau 10. Classes des verbes de parole anglais par Anna Wierzbicka (1987) Nous avons class les expressions dopinion en quatre catgories : 1) les expressions de Reportage qui permettent de relater ou dintroduire les opinions des autres ou les siennes propres, et qui fournissent une valuation du degr dimplication la fois de la personne qui exprime lopinion et de son objet, comme le verbe estimer dans la phrase les routiers franais estiment souffrir d'une fiscalit dsavantageuse compar leurs rivaux europens 10 ; 2) les expressions de Jugement, qui expriment des valuations normatives dobjets et dactions, lintrieur desquelles on peut distinguer des jugements relis aux normes sociales, par exemple les verbes approuver et critiquer dans Laurence Parisot approuve la rforme mais critique la mthode 11, et des jugements relis des normes personnelles comme C'est un pur chef d'uvre 12 ; 3) les expressions de Conseil, qui enjoignent de faire ou penser quelque chose, par exemple voir et mme revoir 13 ; 4) les expressions de Sentiment, qui expriment un sentiment ou une motion ressentie par une personne, comme J'ai ador ce film 14. Cette classification est reprsente dans le tableau 11. Dans la catgorie Reportage les opinions sont le plus souvent exprimes dans les complments des verbes utiliss pour rapporter un discours ou les opinions des autres. Ces verbes transmettent le degr dimplication de celui qui met lopinion pour lopinion quil prsente, et certains fournissent, au moins indirectement, un jugement de celui-ci. La polarit de lopinion
10 11

tel-00372133, version 1 - 31 Mar 2009

Libration, 16 juin 2008 Libration, 10 juin 2008 12 Allocine.fr, 8 mai 2008 13 Tlrama.fr, 21 aot 2008 14 Tlrama.fr, 9 janvier 2008

57

(positive, ngative ou neutre ) est donne par les complments du verbe ou le contexte. Cette catgorie est constitue de trois groupes selon le degr dimplication et de vracit concernant linformation contenue dans les complments : Informer/Soutenir, Dire/Remarquer et Penser/Supposer. Catgories Classes Informer Soutenir Reportage Dire Remarquer Penser Supposer Blmer/Louer Jugement tel-00372133, version 1 - 31 Mar 2009 Apprciation Recommander Conseil Suggrer Esprer Colre/Apaisement tonnement Amour/Fascination Haine/Dception Sentiment Peur Offense Tristesse/Joie mouvoir Exemples informer, notifier, rvler insister, prtendre, soutenir dire, annoncer, rapporter commenter, observer, remarquer penser, considrer prsumer, supposer, imaginer blmer, critiquer, condamner, louer, approuver bon, brillant, mauvais, nul recommander, dconseiller suggrer, proposer esprer colre, irritation, apaiser tonner, stupfier fasciner, captiver dmoraliser, dcevoir effrayer, peur choquer, outrer heureux, triste bouleverser, mouvoir

Ennui/Divertissement ennui, distraction

Tableau 11. Classification des expressions dopinion Le premier groupe Informer/ Soutenir est constitu de deux classes de verbes qui introduisent une information que lauteur estime vraie et tablie (classe Informer) ou pour laquelle lmetteur de lopinion est fortement engag (classe Soutenir). Les verbes de la classe Informer communiquent une information au moyen de leurs prsuppositions que lauteur prend pour tablies. Les verbes de ce groupe (rvler, ...) prsupposent la vracit de leurs complments. Ainsi, il serait incohrent de dire Paul a rvl quil tait malade mais il ntait pas malade , alors quil ne lest pas dutiliser un verbe de la classe Soutenir (soutenir, prtendre, etc.) et de dire Paul soutient/prtend quil tait malade mais il ntait pas malade . La vracit de linformation introduite par les verbes de la 58

classe Informer est plus forte que celle introduite par ceux de la classe Soutenir. Dautre part, les verbes de la classe Informer, contrairement ceux de Soutenir, nimpliquent pas ncessairement un fort engagement de la part celui qui met lopinion pour son contenu, il peut rvler quelque chose inconsciemment par exemple. Le second groupe Dire/Remarquer contient galement deux classes : Dire et Remarquer. Contrairement aux verbes dInformer, ces verbes nindiquent rien sur le point de vue ou sur lengagement de lauteur au sujet de lopinion mise. La distinction entre ces deux classes porte sur le statut de linformation transmise par lopinion. Les complments des verbes de la classe Remarquer sont un discours subsidiaire dans le texte. Ils fournissent le contexte, larrire plan ou des commentaires. Enfin, le dernier groupe Penser/Supposer introduit une opinion avec un certain degr de subjectivit. Lauteur exprime sa pense sur quelque chose sans tre sr de sa vracit. Les verbes de la classe Penser expriment le fait que lauteur a un fort engagement pour lopinion quil introduit (le complment du verbe) alors que les verbes de la classe Supposer expriment un engagement plus faible. La vracit de linformation introduite par des verbes de Penser est plus forte que linformation introduite par des verbes de Supposer et le lecteur aura plus confiance concernant P dans Il pense que P plutt que dans Il imagine que P . La seconde catgorie Jugement contient des mots qui expriment une estimation de quelque chose ou quelquun. Cette catgorie contient des noms, des verbes et des adjectifs. Les expressions de jugement transmettent une polarit binaire de lopinion (positive ou ngative). Nous avons considr deux classes: les jugements se rfrant un systme de normes sociales et les jugements se rfrant un systme de normes personnelles. La classe Blmer/Louer exprime un jugement moral sur la responsabilit ou le comportement de quelquun, alors que la seconde classe Apprciation implique une apprciation positive ou ngative sur quelquun ou sur quelque chose. Les expressions de la troisime catgorie Conseil enjoignent le lecteur adopter une certaine voie, un certain type daction ou dopinion. Celui qui met lopinion se place en position dautorit par rapport au lecteur et renforce son avis avec dautres arguments pour le convaincre. Nous avons considr trois classes : les verbes de la classe Recommander qui expriment une bonne ou mauvaise opinion et essayent de convaincre avec force; les verbes de la classe Suggrer qui sont utiliss par lmetteur dopinion pour dire ce quil suggre ou spcule sans en tre absolument certain; et enfin, les verbes de la classe Esprer qui expriment le sentiment gnral que certains dsirs seront satisfaits. Les expressions dopinion de Recommander sont plus fortes que celles de Suggrer et Esprer, ces dernires tant les plus faibles. Les mots de la dernire catgorie, Sentiment, expriment une attitude par rapport quelque chose, gnralement base sur le sentiment ou lmotion plutt que sur le raisonnement. Ils ont une polarit et une force. Nous distinguons ici entre des sentiments positifs, exprims par les mots des classes (ou sous-classes) Apaisement, Divertissement,

tel-00372133, version 1 - 31 Mar 2009

59

Joie, Amour et Fascination, des sentiments ngatifs exprims par les mots des classes Colre, Ennui, Offense, Tristesse, Peur, Haine et Dception, et des sentiments de polarit neutre dans les classes tonnement et mouvoir. 2.2.2. Le segment et la phrase : Relations rhtoriques et valuation des opinions La structure rhtorique est un lment important pour comprendre les opinions transmises par un texte. Lanalyse de diffrents corpus a montr que les relations de discours en modifient le sens et la force. Considrons, par exemple, les textes suivants : T1: [je suis daccord avec vous ]a mme si je suis choqu. T2: Achetez le DVD, [vous ne le regretterez pas]b Les opinions dans T1 et T2 sont positives mais le contraste introduit par ladverbe mme en T1 diminue la force de lopinion exprime dans (a), alors que lexplication donne fournie par (b) en T2 augmente la force de la recommandation. tel-00372133, version 1 - 31 Mar 2009

2.2.2.1. Annotation des segments dopinion Nous avons utilis nos quatre catgories dopinion pour tiqueter les expressions dopinion lintrieur dun segment de discours. Nous dfinissons un segment de base comme une proposition contenant une expression dopinion ou une squence de propositions (relies un segment exprimant lopinion par une relation de discours) exprimant une relation rhtorique avec un segment exprimant une opinion. Les segments complexes sont composs de segment de base relis par des relations de discours. Les segments sont alors connects entre eux en utilisant un petit ensemble de relations de discours (Asher et Lascarids 2003). Nous avons segment des propositions conjointes en propositions spares, par exemple, le film est beau et puissant est considr comme deux segments : le film est beau et le film est puissant. Actuellement lannotation est faite manuellement. Pour chaque segment dopinion, les informations que nous indiquons sont : la catgorie smantique laquelle il appartient, la modalit associe, celui qui met lopinion, le sujet ou thme de lopinion, et le dclencheur lexical qui a permis didentifier le segment dopinion. La modalit dpend de la catgorie smantique de lexpression dopinion : elle exprime le degr de prfrence, ou dengagement (avec sa force) ou une polarit (avec sa force) ; Nous la dcrivons plus en dtail au 3.3.

2.2.2.2. Relations rhtoriques Une relation rhtorique entre deux segments a and b est note NomRelation(a,b). Nous avons utilis quatre types de relations rhtoriques Contraste, Correction, Explication/laboration (runies dans une relation appele Support) et Rsultat. Les relations Contraste et Correction indiquent une diffrence dopinion ; Contraste(a, b) 60

tel-00372133, version 1 - 31 Mar 2009

implique que a et b sont vrais tous les deux, mais certaines implications de lun sont contredites par lautre, alors que Correction(a, b) dnote une opposition forte et implique que b est vrai quand a est faux. Pour reprer les relations de Contraste dans les textes, nous utilisons des marqueurs de discours spcifiques, tels que nanmoins, bien que, mais, mme si, etc. et les marqueurs contredire, rtorquer, objecter, dmentir, protester, nier, etc. pour les relations de Correction. La relation Support est la fusion des relations appeles gnralement Explication et laboration, car nous avons considr que ces relations sont toutes deux utilises pour soutenir les opinions. Les relations Explication(a, b), marques dans les textes avec parce que, car, etc. indiquent que b fournit une raison (suffisante) pour a. La relation laboration(a, b), marque avec par exemple, en particulier, etc. implique que b donne plus de dtails sur ce qui est exprim dans a. La relation Rsultat(a, b), note par des marqueurs comme donc, par consquent ainsi, etc., indique que b est une consquence ou un rsultat de a. Enfin, Continuation(a, b) signifie que a et b forment une partie dun tout, dune thmatique plus large, et relient deux constituants lintrieur de la mme phrase. Ainsi, il y a trois segments dopinion dans chacune des phases suivantes : T3: Mme [si le produit est excellent]a, [le design est trs basique]b, [ce qui est dcevant dans cette marque]c. T4: [[Cest bouleversant]d, [triste]e]g et [beau]f en mme temps. Dans T3, il y a une relation Contraste entre a et b, ce contraste introduit le segment c. La structure rhtorique de la phrase est Rsultat(Contraste(a,b),c). Dans T4, il y a une Continuation entre d et e, et un Contraste entre g et f. La structure rhtorique est Contraste(Continuation(d, e), f). 2.2.3. Le texte : valuation et Annotation des expressions dopinion De nombreux lments doivent tre pris en compte pour faire une valuation globale des opinions exprimes dans un texte, comme sa structure rhtorique ou le mode des verbes. Nous avons pu le vrifier en analysant des textes lectroniques de genres diffrents, en franais et en anglais.

2.2.3.1. valuation des opinions dans un texte Une fois les structures de traits tablies (cf. 3.3.1.), nous recherchons les relations de discours qui indiquent comment sont combins les diffrents segments. Dans certains cas, la relation Contraste modifie la force de lopinion alors que Continuation renforce sa polarit. Par exemple, dans la phrase T4 dj vue : [[Cest bouleversant]d, [triste]e]g et [beau]f en mme temps, le segment d appartient la classe motion de la catgorie Sentiment qui

61

a une polarit neutre, alors que le segment e appartient la catgorie Tristesse de Sentiment qui a une polarit ngative. Un ensemble de rgles ddies est utilis pour combiner les structures de traits de plusieurs segments et permettent dtablir que la polarit du segment g est ngative. Ces rgles sont en cours dlaboration et ne sont pas aises tablir. En effet, est-il possible de dterminer si cest la tristesse ou lmotion qui prdomine quand on crit bouleversant, triste ? De nombreux lments entrent en compte, comme lordre des mots qui influe peut-tre. La relation Rsultat indique la polarit ou lopinion dans le second argument. Pour la relation Contraste, nous avons distingu deux cas : si les deux arguments sont des segments dopinion, alors le Contraste affaiblit la polarit du premier argument : Jai aim ce film mais il tait un peu long ; si lun des arguments est en relation rhtorique avec lautre argument, alors le Contraste renforce la polarit de lopinion, comme dans [[Je suis athe], mais [je soutiens ce cur totalement]] 15. tel-00372133, version 1 - 31 Mar 2009 Nous avons galement pris en compte les impratifs, les conditionnels et les ngations pour lvaluation des opinions dans un texte. Les ngations sont traites en inversant la polarit de lexpression de lopinion dans son primtre (champ, porte). Les conditionnels sont complexes interprter. Dans certains cas, pour les opinions relevant du Conseil par exemple, ils peuvent inverser lopinion. Ainsi la phrase Si vous voulez gaspiller votre argent, achetez ce film ne sera pas interprte comme recommandant lachat de ce film, mais au contraire comme recommandant de ne pas lacheter. Mais les conditionnels peuvent galement renforcer la recommandation comme dans Si vous voulez passer un bon moment, Allez voir ce film. Une reprsentation discursive du texte est faite laide de graphes, que nous dcrivons au 3.3.2.

2.2.3.2. Annotation des expressions dopinion dans des textes De faon vrifier le bien-fond de notre approche, nous avons tudi la distribution des expressions dopinion dans des textes de genres diffrents, en anglais et en franais, puis nous avons dtermin la structure rhtorique des segments composant ces textes. Nous avons annot 3 types de corpus en ligne, chacun de style et daudience diffrents : critique de films par des internautes, courrier des lecteurs et articles de presse. Nous avons slectionn au hasard 40 articles de chaque catgorie et annot prs de 500 segments pour le franais ; pour langlais 15 articles ont t tudis et 170 segments annots. Cette annotation a t faite manuellement, notre objectif est de la rendre automatique. Pour chaque corpus, un segment a t annot seulement sil contient explicitement une expression dopinion, cest--dire un mot qui appartient notre lexique, ou si ce segment contient une relation rhtorique qui le relie un segment qui contient une expression

15

La Dpche du Midi, 25 avril 2007

62

dopinion. Quand un segment est identifi, lannotateur dfinit sa reprsentation smantique telle que nous lavons dcrite, puis relie les segments de discours en utilisant lensemble des relations rhtoriques que nous avons identifies. Lannotation de critiques de film a t trs aise. Le style dcriture est simple et bref, gnralement un paragraphe, et les expressions dopinion sont principalement des noms et des adjectifs. Lexemple qui suit en est assez reprsentatif : J'ai ador ce film. Denzel Washington en flic calme et zen est parfait, Owen en gangster des temps moderne, froid et impntrable est formidable, quant Jodie Foster, en mercenaire trs classe, elle est fascinante. Ce film est trs bien ralis, il a de l'action et le rythme est dans l'ensemble soutenu (une ou deux longueurs cependant). Spike Lee joue parfaitement bien sur la psychologie de ses personnages, mystre et une touche d'humour sont au rendez vous! A voir absolument!!! 16. Nous avons trouv en moyenne 5 segments par critique. Les chroniqueurs rsument leur opinion gnrale, puis donnent leur opinion sur chaque point particulier comme la mise en scne, le jeu des acteurs, etc. et concluent leur critique avec des expressions de recommandations ( allez voir ce film ) et quelquefois des expressions de suggestion ( ce film devrait gagner un oscar ). Les opinions exprimes sont essentiellement des sentiments et des apprciations, aussi bien en franais quen anglais. Le Courrier des lecteurs contient souvent un titre qui introduit la lettre puis un mlange de faits et dopinion, sur plusieurs paragraphes, comme dans cet exemple : NADAL, le rouleau compresseur. Pour ma part, je pense que Rafal Nadal est aujourd'hui invincible sur terre battue. Pour commencer, ce jeune espagnol a t impressionnant tout au long de l'anne dernire sur terre battue, de par sa qualit physique et un mental d'acier.[...] Seule la pression pourrait mettre un terme cette srie ou un Federer des grands jours 17. Les mots sont aussi bien des noms, des adjectifs que des verbes. Comme pour les critiques de films, les opinions sont principalement des apprciations et des sentiments. Par contre, les lettres en anglais contiennent plus dexpressions de jugement en fonction de normes sociales et moins dexpressions de sentiment quen franais. La distribution des jugements, apprciation, espoirs et reportage est la mme en franais et en anglais. Enfin, les opinions dans la presse contiennent essentiellement des discours rapports. Les articles sont longs et composs de plusieurs paragraphes. Comme nous navons annot que les segments contenant ou en relation, via les relations rhtoriques, avec des expressions dopinion, notre annotation couvre une faible partie du document. Les articles de presse sont les plus difficiles annoter car lcriture est plus libre, et ils contiennent beaucoup de structures introduites par des verbes de Reportage, ainsi que de nombreuses ngations. Il y a une grande similitude de distribution des catgories en franais et en anglais : beaucoup dexpressions de jugement et peu de sentiments.

tel-00372133, version 1 - 31 Mar 2009

16 17

Allocin.fr, 4 mai 2006 La Dpche du midi, 27 avril 2007

63

La comparaison des diffrentes annotations faites pour un mme corpus a montr quil y avait un large consensus pour la dtermination des segments et la rpartition des expressions dopinion dans les catgories. Les principales sources de divergence entre annotateurs ont t dans le choix de certaines relations rhtoriques et dans la distinction entre les jugements relatifs aux normes sociales (classe Blmer/Louer) et les jugements relatifs aux normes personnelles (classe Apprciation). Ces dsaccords montrent la complexit de ltude des opinions et la ncessit de prendre en compte dautres phnomnes. Nous en tudions certains comme par exemple lemploi de verbes modaux, du conditionnel ou du subjonctif ainsi que la prsence dadverbes qui peuvent modifier lintensit ou la force de lopinion mise comme dans J'ai vraiment ador ce film , Je vous le recommande vivement . ou Un film absolument gnial . Nous poursuivons notre travail de recherche afin de produire une annotation automatique des expressions dopinion, et fournir une valuation de lopinion globale dun texte. Ces annotations permettront ainsi de se dplacer dans un texte, ou dans des textes, selon des critres choisis par exemple lopinion elle-mme, la personne qui lmet, ou encore son sujet. Cependant de nombreuses difficults sont encore rsoudre. Dune part, la prise en compte dautres lments que les mots comme constituants signifiants dans un texte. De nombreux auteurs comme Edgar Poe, Gustave Flaubert ou Andr Breton ont utilis les italiques ou les guillemets pour donner un sens particulier un mot 18. Dans le cas de lexpression des opinions, une modification de leur intensit et de la conviction de celui qui lmet sont donnes par lutilisation de la ponctuation, de la casse des caractres, ou la graphie dune prosodie. On le voit dans les critiques de films avec lemploi de majuscules ou de points dexclamation qui renforce la recommandation dans Je vous le recommande VIVEMENT 19, Excellent film [...] Surtout ne le ratez pas !!! 20, et dans la rptition de mots ou le dcoupage en syllabes avec des majuscules pour reflter une intonation dans J'ai A-DO-RE ! Tout tout tout! Le scnario, la mise en scne, le montage, les acteurs, le suspens! Excellent! 21. Dautre part, les opinions ne sont pas toujours exprimes de faon littrale, le recours lhumour et lironie par exemple, est frquent. Ainsi, interprte dans son contexte, la phrase : Ce projet est une vraie russite signifie que ce projet est, en fait, un vrai fiasco, et On peut remercier le Conseil rgional davoir vot ce texte exprime une opinion trs ngative sur ce vote qui savre une grosse erreur.

tel-00372133, version 1 - 31 Mar 2009

Le lecteur intress pourra se reporter ltude de Julien Gracq sur lemploi des italiques dans luvre dAndr Breton [GRA 72]
19 20 21

18

Allocin.fr, 4 mai 2006 Allocin.fr, 29 mai 2006 Allocin.fr, 1er novembre 2006

64

2.3. BILAN COMPARATIF DE NOS DESCRIPTIONS AVEC CELLES DU LEXIQUE GRAMMAIRE, DE BETH LEVIN ET DE WORDNET 2.3.1. Lexique grammaire Nous sommes partie du cadre thorique du Lexique grammaire pour notre tude des verbes de sentiment (et en particulier pour les verbes psychologiques ), mais nous nous en sommes loigne par limportance que nous avons accorde aux descriptions smantiques, objet central de nos travaux. Nous avons constat que la description des tables ne rend pas compte du lien smantique (vident pour le locuteur) entre des verbes qui nont pas ncessairement les mmes proprits syntaxiques et, pour cette raison, nous avons adopt le principe heuristique inverse : que donne une description syntaxique dlimite au pralable par lintuition smantique ? Nous avons regroup les verbes en classes smantiquement homognes puis nous avons tudi un ensemble de proprits qui dcrivent des phnomnes syntaxiques et smantiques, et recherch des rgularits entre ces proprits et les classes. Nous avons gard quelques proprits des verbes de la table 4, que nous avons renommes pour certaines dentre elles. Les proprits dont nous avons conserv le libell sont : la possibilit (ou non) de la construction pronominale N1 se V de ce que P, lexistence ou non dun adjectif reli morphologiquement au verbe par une suffixation en able (Adjectif = able) ou une suffixation en ent ( Adjectif = ant), et la construction passive N1 est Vpp de ce que P. Nous avons renomm la possibilit du passif introduit par la prposition par [passif par] par N1 est Vpp par N0 , et de celui introduit par la prposition de [passif de] par N1 est Vpp de N0 . Enfin, nous avons appel emploi non psychologique la proprit V concret qui indique si un verbe est ou non un emploi mtaphorique dun verbe concret. Pour certains verbes, nous avons des acceptabilits diffrentes certaines proprits. Cest le cas par exemple pour le verbe choquer dont le passif en de est note inacceptable alors que nous lacceptons, acceptabilit que nous avons vrifie grce laccs des corpus : ... et j'avais t presque choqu de la violence de son ton 22. Cest le cas galement quand un verbe a diffrentes interprtations, et apparait alors dans diffrentes classes dans notre classification, mais accepte la mme construction syntaxique Qu P V N1 et donc fait partie de la table 4. Ainsi le verbe charmer qui a deux sens (Le Petit Robert 2001) (1) Captiver par un attrait puissant; plaire par son charme. et (2) Causer une grande joie . Les constructions passives [passif de] et N1 est Vpp de ce que P sont juges inacceptables dans la table 4, ce qui correspond lemploi (1) alors que lemploi (2) accepte ces passifs comme le montrent ces deux extraits : La bergre

tel-00372133, version 1 - 31 Mar 2009

22

PROUST Marcel, la recherche du temps perdu. 19. Le Temps retrouv, 1922, p. 737.

65

charme de ses bonts 23, Camarade, je suis charme de ce que vous venez de me dire 24. 2.3.2. Les verbes de Beth Levin Ltude de Beth Levin sur les verbes a t faite dans une perspective purement linguistique, avec pour objectif la mise en vidence dune correspondance entre modles syntaxiques et modles smantiques. Notre perspective (le traitement automatique des langues) et nos objectifs (une description smantique dtaille et formalise) sont trs diffrents dans notre tude sur les sentiments. Nanmoins, notre approche est voisine sur plusieurs aspects. Notre hypothse de dpart est la mme, nous considrons que le comportement syntaxique dun verbe est guid par son sens et notre classification prsente quelques similarits avec la sienne. En effet, nous avons distingu deux grandes catgories de verbes selon la position de lexprienceur, et certaines proprits que nous avons tudies ne concernent que lune ou lautre de ces deux catgories. Nous avons galement pris en compte la slection et la smantique des arguments du verbe, et certaines proprits que nous avons tudies lont t galement par Beth Levin dans sa classe Psych-Verbs et celle des verbes de Dsir, comme la proprit 1, qui est la construction de base avec indication de la position de lexprienceur, la proprit 13 qui est la possibilit ou non de formation du passif, la proprit 14 qui indique que le choix des prpositions du passif dpend du verbe, mais nous avons considr quil dpend aussi de la nature du sujet et du complment, et la proprit 20, similaire en franais, qui indique une possible drivation morphologique pour former des adjectifs en able. Nous avons galement pris en compte la proprit 19, la possibilit de nominalisation, avec diffrentes formations comme les suffixations en ation (adorer/adoration) ou -ement (tonner/tonnement), et les conversions (passionner/passion). Nous nous cartons de cette analyse dans la mesure o nous ne nous sommes pas intresse la langue en gnral (le franais) mais un domaine smantique particulier, et notre lexique nest pas limit aux verbes mais nous lavons tendu aux noms et aux adjectifs dont nous avons tudis des proprits particulires. De plus, tant donn notre projet de dpart (une description smantique) nous avons construit un ensemble de relations smantiques entre les classes et entre les mots, comme les relations dintensit ou dantonymie. Enfin, nous avons propos des formalismes pour reprsenter ces connaissances. 2.3.3. WordNet Nos descriptions sur les sentiments prsentent certaines similitudes avec le rseau WordNet. En effet, notre lexique est galement constitu de noms, verbes et adjectifs, mais

tel-00372133, version 1 - 31 Mar 2009

23 24

Les Colinettes par Madame d'Auneuil TZARA Tristan, Thtre (1912-1924), 1924, p. 530.

66

tel-00372133, version 1 - 31 Mar 2009

pas dadverbes. Nous avons construit des classes homognes smantiquement, mais, la diffrence des synsets, elles regroupent des mots de catgories diffrentes, avec des proprits qui dpendent de ces catgories. Les classes et les mots de sentiments sont lis par des relations, certaines similaires celles de WordNet comme la synonymie et lantonymie, mais nous navons pas dfini dhyperonymie ni de troponymie. Nous avons dfini des relations dantonymie entre classes, alors quelles sont entre les mots dans WordNet. Ces relations ne sont pas dfinies de la mme faon. Par exemple, dans notre description irriter et adorer ont des antonymes, respectivement calmer et har, alors que Irritate (irriter) ou Adore (adorer) nen nont pas dans Wordnet. De plus, nos relations dantonymie sont rciproques, dtester est antonyme daimer et vice versa, alors que dans Wordnet, love a pour antonyme hate qui a pour synonyme detest, mais si hate a bien pour antonyme love, on na pas la relation directe dantonymie entre detest et love. Ainsi, si on interroge WordNet 2.1. (2008), on obtient les rsultats indiqus dans la figure 10. La question de lutilisateur est en en caractres gras italiques, WordNet propose un menu avec le choix Antonyms que lutilisateur a choisi. Pour detest, le choix Antonyms nest pas propos. Search Word : love love -- (have a great affection or liking for; "I love French food"; "She loves her boss and works hard for him") Antonym of hate => hate, detest Search Word : hate hate, detest -- (dislike intensely; feel antipathy or aversion towards; []) Antonym of love Search Word : detest hate, detest -- (dislike intensely; feel antipathy or aversion towards; [])

Figure 10. Exemples dantonymie dans WordNet Les relations ou proprits dintensit nexistent pas en tant que telles dans WordNet, mais sont parfois indiques comme relation de troponymie, par exemple une des relations troponymiques donne par WordNet 2.1. pour terrify (terrifier), est frighten greatly (effrayer beaucoup , qui correspond notre proprit intensifieur avec la valeur Fort pour terrify et Mdian pour frighten. 67

Nous avons tudi des relations morphosyntaxiques aussi mais seulement si elles sont lies au sens cest--dire si elles dcrivent ou caractrisent un sentiment ou un tat psychologique ; ainsi nous ne prenons pas en compte la relation entre amuser et amuseur contrairement WordNet qui, dans un champ smantique lgrement diffrent, relie entertain (divertir) entertainer (personne qui procure du divertissement). Nous avons pris en compte la smantique des arguments des verbes, mais alors que dans WordNet des exemples de phrases sont construits en respectant cette caractrisation des arguments, dans notre description elle est explicitement indique par des proprits. Ainsi, les verbes de type irriter sont exemplifis par des phrases o ils ont un complment dobjet humain dans WordNet (The bad news will irritate him, The performance is likely to fascinate Sue), alors que dans notre description ils acceptent la proprit objet humain . Enfin WordNet dcrit la langue dans sa totalit alors que nous ne nous sommes intresse qu un domaine smantique particulier. tel-00372133, version 1 - 31 Mar 2009

68

CHAPITRE 3. MODLES DE DONNES ET REPRSENTATIONS DES CONNAISSANCES


tel-00372133, version 1 - 31 Mar 2009

Le problme de la modlisation des donnes linguistiques dans loptique de leur traitement par une machine a toujours t au centre de nos travaux. Dabord dans TRANSLEGS, une plate-forme de comparaison de lexiques grammaires de langues diffrentes, puis dans INTERFACILE, un systme de comprhension du langage qui permet de donner des explications sur un sujet donn et qui reformule les questions de lutilisateur mal comprises, et enfin dans nos travaux en smantique lexicale, en particulier dans le domaine des sentiments et des opinions avec les systmes FEELING et FEELING-G. Cela explique notre souci de construire une description entirement explicite et non-ambigu, utilisable par un systme informatique. 3.1. AVANT LES SENTIMENTS : TRANSLEGS ET INTERFACILE 3.1.1. TRANSLEGS TRANSLEGS est une station de travail linguistique qui permet, dune part, ltude du lexique grammaire dune langue et, dautre part, la comparaison de lexiques grammaires de langues diffrentes (Elia et Mathieu 1986, Mathieu 1989). Lapplication a t faite pour litalien et le franais, dans le sens italien vers franais, pour la comparaison des verbes un complment. La base contient 9 tables italiennes, une trentaine franaises, environ 2300 verbes, et de 20 36 proprits selon les tables. TRANSLEGS a t ralis en collaboration avec le professeur Annibale Elia de l'Universit de Salerne (Italie). Comme lexplique ce dernier (Elia 1984), des correspondances ont t tablies entre classes, entre verbes et entre proprits :

69

[...] les diffrences gnrales entre les structures du franais et de litalien impliquent une certaine prudence thorique quant la comparaison entre les deux langues. Cependant, ils ninterdisent pas de mettre en vidence des similarits de comportement des deux langues sur des fragments de lexique qui, notre avis, sont fort voisins . Elia page 160.

Les structures dfinitionnelles des classes du lexique grammaire italien et de celles du lexique grammaire franais ont t mises en correspondances, elles sont indiques dans le tableau 12. Classes italiennes (prfixes it) 41 42 43, 43B 44, 44B tel-00372133, version 1 - 31 Mar 2009 45, 45B, 46 47, 47B Classes franaises 4 5 6 7 8 9

Tableau 12. Correspondances entre les tables de verbes compltives italiennes et franaises chaque verbe italien a t associ son quivalent franais, cest--dire non seulement sa traduction ou son quivalent le plus proche, mais galement la table du lexique grammaire franais laquelle celui-ci appartient. Un extrait de la table italienne it41 est donn dans le tableau 13, la figure 11 montre un exemple de comparaison des Lexiques grammaires italien et franais.
N1=: Nhum Ppv = gli N1=:-Nhum N1=:il fatto Ch F a N1 ? in N1 ? (di + da) N1 ? Ppv = (ci + vi) del fatto Ch F N0 V N1 di V1- N0 V N0

N0=:Nhum N0=:Nnr N0=:Ch F N0=: V1

italien

Prep

franais

Table franaise

+ + + +

+ + +

+ + + +

accadere addirsi affiorare aggradare agire albergare aleggiare andare apparire apparire

a a loc a su loc loc a a loc

arriver convenir affleurer agrer agir demeurer voleter aller apparatre apparatre

5 5 35ST 5 5 5 35L 5 17 5

Tableau 13. Extrait de la table italienne it42

70

table IT42
occorrere a occorrere x

table IT43
dimenticare

table IT45
dimenticarsi

occorrere(V)

dimenticare

dimenticarsi

ITALIEN table 5
arriver

table 17
falloir

table 6
oublier oublier

arriver

falloir

oublier

FRANAIS

Figure 11. Exemple de comparaison des Lexiques grammaires italien et franais tel-00372133, version 1 - 31 Mar 2009 Les correspondances ne sont pas bijectives. En effet, une proprit ou une classe peuvent ne pas avoir de correspondant, ou en avoir plusieurs ; lorsquune proprit na pas de correspondant le systme doit proposer des proprits de substitution formellement voisines. Ainsi la proprit V de ce qu P nexiste pas en italien, le systme propose la proprit V del fatto Ch F . Un exemple avec le verbe douter est donn dans la figure 12. Les critres de choix des proprits de substitution peuvent tout moment tre modifis par lutilisateur. ITALIEN dubitare Ch F dubitare del fatto Ch F 0 FRANAIS douter qu P douter du fait qu P douter de ce qu P

La ligne <---------> indique le choix dune quivalence par proximit formelle Figure 12. Proprits de substitution du verbe douter

71

Le systme TRANSLEGS est constitu de deux modules : un module monolingue qui permet l'tude des proprits syntaxiques d'une langue (franais ou italien ou...), et un module bilingue qui est un outil d'aide la traduction, actuellement italien-franais. Linterface de TRANSLEGS avec lutilisateur est constitue dun ensemble dcrans affichant les choix dinterrogation possibles de la base de connaissances. Lutilisateur peut soit consulter le lexique grammaire dune langue, soit faire une comparaison entre les lexiques grammaires de deux langues, dans les deux cas partir dun verbe, dune proprit ou dune table choisis dans une liste propose par le systme. Il ny a donc pas de vritable dialogue entre TRANSLEGS et lutilisateur, les choix de ce dernier sont entirement dirigs par le systme. Quand lutilisateur interroge TRANSLEGS, il ne travaille pas sur une reprsentation fixe des lexiques grammaires : il tudie une vue temporaire qui nexiste pas en tant que telle dans les donnes et que TRANSLEGS construit dynamiquement au moment de la consultation. Lexemple de la comparaison dun verbe italien et de son correspondant franais est donn dans la figure 13.
TABLES DU LEXIQUE GRAMMAIRE ITALIEN
... IT42 IT41 4 5

tel-00372133, version 1 - 31 Mar 2009

FRANAIS
...

Modle rel

VUE

TRANSLEGS

Modle conceptuel RELATIONS (TABLES RELATIONNELLES)

Figure 13. Construction dune vue dynamique dans le systme TRANSLEGS Lutilisateur sintresse un sous-ensemble du lexique grammaire italien et un sous ensemble du lexique grammaire franais. La juxtaposition de ces 2 sous-ensembles

72

constitue une vue partielle et temporaire. TRANSLEGS va reconstituer cette vue partir de ses relations et des liens qui existent entre elles. Cette reconstitution est dynamique et nexiste que le temps de la consultation. Nous reprendrons cette notion de vue dynamique dans le systme FEELING. La base est construite autour d'un Systme de Gestion de Bases de Donnes (SGBD) relationnel (INFORMIX), avec des modules dinterface crites en langage procdural (langage C). Ce sont ces interfaces qui permettent de faire les dductions quand les constructions syntaxiques ne sont pas similaires dans les deux langues, et de communiquer avec l'utilisateur. Les tables du lexique-grammaire sont reprsentes sous forme de tables relationnelles, cest--dire des donnes structures avec un format fixe, dont on peut extraire linformation grce lalgbre relationnel et un langage de requtes (SQL). 3.1.2. INTERFACILE tel-00372133, version 1 - 31 Mar 2009 INTERFACILE est une interface en langage naturel entre un utilisateur et un ordinateur, qui permet la comprhension et la reformulation de questions mal comprise par la machine. INTERFACILE a t ralis en 1986 en collaboration avec Paul Sabatier (LIF, CNRS). Le systme est constitu dune petite grammaire du franais utilise pour comprendre les questions, rsoudre certaines anaphores et gnrer des rponses correctes syntaxiquement ; il contient galement des connaissances smantiques du domaine concern. Lapplication que nous avons dveloppe est laide lutilisation et la comprhension dun systme d'exploitation comme UNIX, pour des utilisateurs non informaticiens, lpoque o il fallait taper directement des lignes de commande (car les icones et les souris nexistaient pas). Voici des exemples de dialogues (extraits de Mathieu et Sabatier 1986) ; le prompt > prcde la question de lutilisateur, le prompt prcde la rponse dINTERFACILE en italiques. Les questions doivent commencer par comment . Dialogue 1 > comment crer un fichier ? - utilisez la commande : CREATE nomfichier > comment limprimer ? - utilisez la commande : PRINT nomfichier > comment modifier son contenu ? - utilisez lditeur avec la commande : EDIT nomfichier > comment copier un fichier dans un rpertoire ? - utilisez la commande : COPY nomfichier [nomrepertoire] > comment renommer ce dernier ? - utilisez la commande : RENAME/DIRECTORY [ancienrepertoire] [nouveaurepertoire]

73

Dans un but pdagogique pour les non spcialistes en informatique, INTERFACILE reformule les questions mal comprises, comme le montre le dialogue 2. Dialogue 2 > comment envoyer un message un utilisateur ? - utilisez la commande : MAIL > comment le supprimer ? - le renvoie : message ? (1) utilisateur ? (2) tapez le numro de votre choix. >2 - INTERFACILE nen sait rien, mais sait comment : envoyer un message crire un message supprimer un fichier supprimer un rpertoire supprimer un message Quand une question est dviante par rapport ce quattend le systme, soit parce que, telle quelle est formule, la question elle mme na pas de sens (dialogue 3), soit parce que le systme na pas les connaissances pour y rpondre (dialogue 4), INTERFACILE indique lutilisateur ce quil sait et le guide pour reposer sa question. Dialogue 3 > comment ajouter un fichier le contenu dun fichier ? - pour ajouter , utilisez la construction : ajouter [quelque chose] [quelque chose] compltez ou tapez / pour annuler) > comment ajouter ... Dialogue 4 > comment envoyer un message dans un terminal ? - pour envoyer , utiliser les constructions : envoyer [quelque chose] [quelquun] envoyer [quelque chose] sur [quelque chose]

tel-00372133, version 1 - 31 Mar 2009

74

compltez ou tapez / pour annuler) > comment envoyer ... Laide nest pas une reformulation linguistique : les informations sont dduites partir des connaissances smantiques du domaine de lapplication et reformules grce la grammaire. Les connaissances dans INTERFACILE sont reprsentes dans un formalisme de grammaire logique , sous forme de prdicats (clauses de Horn) avec un ensemble de rgles de dductions qui permet de les exploiter. Le systme a t implment dans un langage dclaratif avec un mcanisme dunification (Prolog). 3.1.3. Comparaison de TRANSLEGS et INTERFACILE tel-00372133, version 1 - 31 Mar 2009 Contrairement TRANSLEGS, dont linterface ne proposait que des crans figs prdfinis, INTERFACILE dialogue avec lutilisateur, et ses rponses sont construites de faon dynamique partir dune grammaire et dune base de connaissances smantiques. Le mode de reprsentation des donnes et la faon de les exploiter sont galement diffrents dans les deux systmes. La base de connaissances de TRANSLEGS est sous forme de tables relationnelles avec un format fixe, on y a accs grce un langage de requtes, et des dductions sont faites avec des rgles crites dans un langage procdural, cest--dire une succession dinstructions avec un ordre impratif. Les connaissances dans INTERFACILE sont dcrites de faon dclarative sous forme de faits lmentaires et de rgles associes. Leur exploitation est faite grce un mcanisme dunification. Cette volution dun systme (TRANSLEGS) lautre (INTERFACILE) se traduit donc par un niveau conceptuel supplmentaire dans la reprsentation, le traitement et lexploitation des donnes.

75

3.2. LES SENTIMENTS : FEELING, FEELING-G ET LONTOLOGIE DES SENTIMENTS 3.2.1. FEELING En 1993, nous avons conu et dvelopp le systme FEELING pour vrifier le bienfond de la description que nous avons propose pour les verbes de sentiment. Il fournit une interprtation smantique des verbes, gnre des paraphrases syntaxiquement correctes, et ( un niveau simple) vrifie la bonne formation d'un nonc. Nous avions galement pour objectif la conception dun systme qui explique la raison des dductions qu'il fait et qui offre la possibilit denrichir tout moment non seulement la connaissance du systme, mais galement ses moyens de traitements. Nous donnons ci-dessous un exemple danalyse de phrase ralise par FEELING. Le systme ne fait pas d'analyse syntaxique. Il faut donc lui fournir explicitement le sujet, le verbe et le complment. On doit lui indiquer galement la forme du sujet, c'est--dire s'il est phrastique, un substantif humain (Nhumain), un infinitif, ou autre, mais pour une meilleure lisibilit nous avons crit une phrase. Les rponses de FEELING sont divises en trois parties : (1). l'interprtation de la phrase, (2). les phrases associes et, la demande, les proprits de litem lexical (option non choisie dans cet exemple). (3). les modifications d'intensit du sentiment. Phrase interprter Luc exaspre Marie
(1). INTERPRTATION Le sentiment est prouv par Marie, La cause est Luc Le sentiment prouv est plutt dsagrable Le sentiment prouv est lexaspration Phrases synonymes : Luc nerve beaucoup Marie Luc (courrouce / enrage / excde / hrisse / horripile / impatiente / ulcre) Marie Phrases Antonymes Luc apaise Marie Paraphrases Marie prouve de l'exaspration ( envers / contre) Luc Marie est exaspre par Luc Nature du sujet Luc peut tre un sujet agentif : Luc exaspre Marie volontairement

tel-00372133, version 1 - 31 Mar 2009

76

(2). PHRASES ASSOCIES Marie est (exaspre / trs nerve) Marie est (exaspre / trs nerve) par Luc Marie prouve (de l'exaspration / beaucoup d'nervement) Marie prouve (de l'exaspration / beaucoup d'nervement) ( envers / contre) Luc

(3). MODIFICATION DE L'INTENSIT DU SENTIMENT (3.1) La diminution continue de l'intensit du verbe exasprer donne les sens suivants : Luc (agace / crispe /nerve / fche / irrite) Marie Luc (drange / dsoblige / emmerde / empoisonne ) Marie Luc ( ennuie / enquiquine /gne / importune / incommode / indispose) Marie (3.2) L'augmentation continue de l'intensit du verbe exasprer donne les sens suivants : Luc (braque / choque / cure / scandalise) Marie Luc (/ indigne / rebelle / rvolte) Marie

tel-00372133, version 1 - 31 Mar 2009

3.2.1.1. Reprsentation des connaissances dans FEELING Le systme FEELING exploite les classes smantiques de verbes psychologiques, (du type irriter) que nous avons dcrites, et les proprits associes, classification labore la fin des annes 1990. Comme nous lavons dj indiqu, cette classification a t modifie depuis pour prendre en compte les noms et les adjectifs. Certains passages sont extraits de Mathieu (2000) not YM dans la suite.

Les classes Nous avons adopt un formalisme qui utilise la notion de prototype pour reprsenter les classes smantiques. Nous utilisons un prototype au sens de Eleanor Rosch (1975, 1978) qui considre que pour un tre humain, les objets du monde rel sont structurs en catgories. Cependant, comme tous les exemplaires d'une mme catgorie nen sont pas galement reprsentatifs, on choisit pour prototype l' lment moyen , considr comme le meilleur reprsentant de la catgorie. Les classes smantiques de verbes ont t nommes par le verbe le plus typique de la classe, il y a donc analogie entre les noms des classes et leur prototype. Ainsi, le verbe nerver qui est le prototype des verbes de la classe smantique regroupant les verbes exprimant lnervement est galement le nom de cette classe. Ce prototype possde l'ensemble des caractristiques de la plupart des lments de la catgorie et contient une connaissance par dfaut. Le verbe nerver a pour proprits : (a un emploi non psychologique, a un sujet agentif, a un intensifieur Mdian). Chaque verbe de la mme classe est une spcialisation du prototype nerver, et hrite donc de ses trois proprits. Une spcialisation peut galement avoir des proprits qui lui sont propres. C'est le cas, par exemple, du verbe exasprer qui, contrairement au prototype, na pas demploi non psychologique. Les valeurs des proprits hrites sont alors masques par

77

des valeurs propres la spcialisation. Notre classification est ainsi reprsente par une arborescence :
Nous avons dfini une structure, appele
RACINE,

qui contient les connaissances communes

tous les verbes psychologiques de notre tude. Ce pre est la racine unique de la hirarchie des connaissances, dont les prototypes dfinis partir des classes smantiques sont des spcialisations. [...] Chaque verbe est alors une spcialisation d'un prototype. YM page 114.

Les proprits Parmi les proprits que nous avons tudies, certaines peuvent tre reprsentes, pour chaque item lexical, par une paire (attribut-valeur), lattribut est la proprit, la valeur est la valeur que prend cette proprit. Ainsi, pour le verbe exasprer, la proprit [Exprienceur] a pour valeur complment . tel-00372133, version 1 - 31 Mar 2009 Un exemple de ces proprits simples pour la classe nerver, le sous-ensemble des verbes psychologiques de la classe Colre, est donn dans le tableau 14. Chaque ligne correspond un verbe (agacer, nerver, etc.), et chaque colonne une proprit.

Verbe agacer nerver exasprer horripiler irriter

Sujet agentif Intensifieur N1 est Vpp Passif sans de N0 agent oui oui oui non oui Mdian Mdian Fort Fort Mdian oui oui oui oui oui oui oui oui oui oui

Emploi non psychologique non oui non non oui

Tableau 14. Exemple de proprits simples des verbes de sentiment Plusieurs reprsentations sont possibles pour dcrire les proprits plus complexes, comme des tableaux, des listes ou des rgles. Les bases de connaissances dans FEELING Nous appelons base de connaissances l'ensemble des traitements et infrences qu'il est possible d'effectuer sur les proprits et l'interprtation smantique qui peut tre dduite en fonction du triplet (verbe, sujet, complment). Nous avons reprsent ces connaissances par des rgles de production dclaratives de la forme si condition(s) alors conclusion(s)i sinon conclusion(s)j . Une base de connaissances peut concerner et donc s'appliquer tous les verbes, dans ce cas elle est contenue dans la Racine. Elle peut galement ne s'appliquer uniquement qu' 78

des prototypes particuliers ou leurs spcialisations; elle est alors contenue dans ces prototypes ou ces spcialisations. La base de connaissances d'un prototype contient ainsi des informations de plusieurs types : 1-) les infrences qui dterminent la valeur de la prposition dans certaines constructions ; 2) les infrences qui concernent les verbes qui acceptent un complment de la forme Dt N de Nhum, et qui permettent : - de dduire les possibilits de pronominalisation et de restructuration, - de dduire le domaine smantique du sujet quand le substantif appropri N du complment appartient certains domaines de valeurs, - de vrifier si une construction obtenue par restructuration ou pronominalisation d'une phrase de base, est acceptable ; 3-) les infrences qui permettent de gnrer des constructions passives et des nominalisations. Pour reprsenter ces infrences nous avons utilis des rgles de dductions de la forme si condition(s) alors conclusion(s)i sinon conclusion(s)j. Par exemple, nous donnons cidessous un exemple simplifi dune des rgles qui expriment les contraintes lies la nature du sujet dans la formation des constructions passives : 1. Si la phrase analyser est de la forme Sujet Verbe Complment (S V C) 2. et si le sujet est une phrase linfinitif 3. et si il existe pour le verbe au moins une construction passive avec la prposition de 4. et si le complment est un nom humain 5. alors la phrase Complment est (participe pass de V) de Sujet est acceptable Si on applique cette rgle la phrase Voir Luc partir doit Marie, la condition 1 est vrifie avec Voir Luc partir comme sujet, le verbe est doit (dcevoir) et le complment C est Marie. La condition 2 est vrifie car le verbe dcevoir accepte la formation du passif introduit par la prposition de. La condition 3 est vrifie car le sujet Voir Luc partir est une phrase linfinitif et enfin la condition 4 est vrifie car le complment Marie est un humain. La conclusion 5 permet donc de dire que Marie est due de voir Luc partir est une phrase acceptable. Chacune des parties de FEELING (proprits et base de connaissances) est optionnelle. Les proprits sont les caractristiques du prototype, ce sont des connaissances typiques, les plus frquemment rencontres chez les membres du prototype. La base de connaissances contient des rgles qui dcrivent le comportement du prototype.

tel-00372133, version 1 - 31 Mar 2009

79

3.2.1.2. Le mcanisme dhritage Un mcanisme d'hritage permet un partage des proprits et des bases de connaissances.
Chaque spcialisation hrite de son prototype. Elle hrite la fois des proprits et du contenu de la base de connaissances. Mais une spcialisation peut tre un lment exceptionnel, pour lequel il est ncessaire soit d'ajouter des proprits et/ou des lments dans la base de connaissances, soit de masquer les valeurs par dfaut des proprits et des connaissances hrites. Il y a donc un mcanisme de premption de la spcialisation sur son prototype (Walter Daelemans, Koenraad De Smedt et Gerald Gadzar (1992)). YM page118.

tel-00372133, version 1 - 31 Mar 2009

Un exemple de ce mcanisme dhritage entre la Racine, la classe nerver et le verbe horripiler est dcrit dans la figure 14. Tous les verbes psychologiques acceptent pour complment dobjet direct un substantif strictement humain (proprit [objet humain]), cette proprit est donc indique au niveau de la Racine, et sera hrite par toutes les classes puis par tous les verbes. Le verbe nerver, comme la majorit des verbes de la classe nerver, accepte un sujet agentif et un passif sans agent, ces proprits seront donc indiques au niveau de la classe. Tous les verbes de la classe nerver hritent de ces trois proprits, dont le verbe horripiler, mais ce dernier naccepte pas de sujet agentif, ce qui masque lhritage de cette proprit.

Racine [lobjet est humain]

Hritage Classes
Proprits hrites

nerver objet humain sujet agentif passif sans agent

Hritage
horripiler objet humain passif sans agent le sujet nest pas agentif Proprits hrites

Proprit propre verbe horripiler

au

Figure 14. Mcanisme dhritage dans le systme FEELING Nous avons utilis un langage dclaratif (Prolog) pour implmenter le systme FEELING. Pour permettre une indpendance des traitements vis vis de la base smantique, nous avons adopt une structuration du traitement des connaissances sous

80

forme d'oprateurs. Ils sont autonomes, chacun est spcialis pour un type prcis de recherche d'information ou de traitement des connaissances. Cette modlisation sous forme d'oprateurs permet un enrichissement permanent de la base smantique sans avoir modifier le traitement de ses connaissances. On peut ajouter, modifier ou enlever indiffremment des verbes, des classes smantiques, des proprits, des liens d'intensit entre classes ou des rgles dductives, sans avoir modifier les oprateurs qui portent sur ces diffrentes informations. La mthode de traitement est la mme que dans TRANSLEGS, pour chaque phrase, le systme cre un espace de travail temporaire dans lequel vont tre mises toutes les informations (descriptions et dductions) gnres par la (ou les) analyse(s) de la phrase. L'interface de communication pourra alors exploiter ces rsultats. Cette interface comprend galement un module destin l'enrichissement de la base smantique et des oprateurs. 3.2.2. FEELING-G tel-00372133, version 1 - 31 Mar 2009 Ce systme reprend les caractristiques du systme FEELING, auxquelles nous avons ajout une reprsentation smantique des sentiments donne sous forme de structure de traits. (Mathieu 2004). Rappelons quune structure de traits dcrit des connaissances sous forme de liste de couples attribut (nom du trait) : valeur . Les attributs ont des valeurs atomiques, mais galement des valeurs complexes reprsentes par dautres structures de traits. Nous avons dfini trois principales catgories de traits : sentim qui dcrit le sens, lintensit et les proprits linguistiques du sentiment considr, exper qui identife la personne qui prouve le sentiment, et causob qui dcrit la cause ou lobjet du sentiment. Le trait sentim contient 5 attributs : Prdicat dont la valeur est la lexicalisation du sentiment, Polarit et Niveau dintensit du sentiment, Classe qui caractrise la classe smantique laquelle appartient le sentiment et Synonymes de ce dernier. Le nom de ce trait est suivi de #i , ce qui permettra de lunifier avec lattribut Sentiment que nous allons dcrire plus loin. Lattribut Classe est lui-mme une structure de 5 traits : Smantique dont la valeur est le nom de la classe, Hritage qui est la classe dont cette classe hrite, la classe Antonyme, la classe o lintensit du sentiment est plus faible, W-classe, et enfin celle o lintensit du sentiment est plus leve, S-classe, si elles existent. Les traits exper et causob contiennent les caractristiques de lexprienceur et de la cause ou de lobjet du sentiment, dont lattribut Ident qui les identifie dans la phase considre. Le sentiment prouv par lexprienceur est celui dcrit dans le trait sentim, il nest pas dupliqu : on fait rfrence lui dans expr par la mme notation #i , qui, grce un mcanisme dunification, permettra de remplacer #i dans expr par la structure de traits sentim lors des traitements.

81

La reprsentation de lexemple prcdent Luc exaspre Marie est donn dans la figure 15.

Prdicat exaspration Polarit ngative Niveau dintensit haut Smantique IRRITER Hritage DRANGER Classe Antonyme CALMER W-classe DRANGER S-classe RVOLTER Synonymes horripiler, impatienter, ulcrer) (courroucer, enrager, excder, hrisser,

sentim #1

exper tel-00372133, version 1 - 31 Mar 2009

Ident Marie Sentiment #1

causob

Ident Luc Agentivit non

Figure 15. Reprsentation smantique de Luc exaspre Marie Les interfaces de FEELING et FEELING-G avec lutilisateur sont interactives. On fournit une phase analyser au systme, et tout moment on peut choisir davoir (option verbeuse ) ou non les informations quil dduit de ses connaissances. 3.2.3. Du lexique smantique lontologie Nous venons de le voir, la description du lexique smantique et des proprits a t faite avec un format propritaire , peu accessible. En effet, nous avons utilis diffrentes reprsentations : des paires attribut-valeur, des listes, des tableaux, des graphes, des rgles. Pour faciliter laccs ces connaissances et les rendre utilisables la fois par des utilisateurs humains et des logiciels, nous les avons reprsentes sous forme dontologie, formalisme qui permet de reprsenter les connaissances avec un format standard et de disposer doutils associs. Nous considrons une ontologie au sens o ce terme est utilis dans le Web smantique, cest--dire un ensemble de concepts organiss hirarchiquement auxquels sont associs des attributs qui caractrisent le concept (Uschold et Gruninger 1996), dfinition assez loigne du sens philosophique dOntologie, qui est Partie de la mtaphysique qui s'applique l'tre en tant qu'tre, indpendamment de ses dterminations particulires. (Le Petit Robert 2001).

82

Les valeurs des attributs sont de type atomique, comme une chaine de caractre ou un nombre entier. Les concepts (aussi appeles classes ) sont lis entre eux par des relations smantiques. La reprsentation sous forme dontologie permet davoir accs automatiquement aux connaissances smantiques pour des traitements entirement informatiss. Un accs aux connaissances, mais pas toutes les connaissances, car il nexiste pas lheure actuelle doutils pour les dcrire dans toute leur complexit, ni de consensus dans la communaut pour savoir quels seraient ces outils. Nous navons donc pu reprsenter quun sous-ensemble des connaissances que nous avons tudies et formalises, ce qui a entrain une perte dinformation et une dgradation de la description smantique trs fine que nous avons faite. Nous navons pas pu reprsenter, par exemple, les rgles qui permettent de gnrer des constructions passives ou dterminent la valeur de la prposition dans des nominalisations, etc., ou les rgles qui permettent de distinguer le sens concret de celui mtaphorique dun verbe dans une phase. Une solution partielle pourrait tre apporte par le langage OWL 25 dont les spcificits ont t dfinies par le consortium W3C 26 (World Wide Web Consortium) pour des applications dans le domaine du Web smantique. Ce langage permet de dfinir les lments dune ontologie et de les combiner avec un langage de rgles pour produire des raisonnements, mais son emploi est trs lourd et loin de tout rsoudre. Notre ontologie des sentiments contient 118 concepts (Mathieu 2005a]. Nous lavons implmente avec loutil de gestion des connaissances Protg-2000 27. 3.2.4. Annotation et navigation travers les sentiments 3.2.4.1. Annotation Comme nous lavons indiqu au 2.1.4., nous avons exploit lontologie des sentiments comme ressources pour lannotation et le filtrage des sentiments dans un texte, et la navigation travers ce texte annot. Nous avons adopt le cadre de travail de Javier Couto et Jean-Luc Minel que nous allons dcrire brivement. Les citations sont extraites de (Couto paratre). Le traitement informatique dun texte par un systme ncessite quil ait une reprsentation utilisable :
Cest le type de traitement effectuer qui viendra dterminer habituellement la reprsentation la plus convenable selon des critres choisir : rapport cot-performance, souplesse, exhaustivit, simplicit, entre autres. En consquence, il existe des reprsentations dun texte qui le conceptualisent comme une squence de caractres, jusqu des reprsentations fortement imprgnes par des

tel-00372133, version 1 - 31 Mar 2009

http://www.w3.org/TR/owl-features/ 26 http://www.w3.org/ 27 http://protege.stanford.edu/

25

83

approches linguistiques, o la reprsentation de texte permet de modliser certains phnomnes discursifs.

Le texte doit avoir les caractristiques suivantes :


ne pas restreindre un ensemble prdtermin le type dunits textuelles qui composent un texte ; offrir la fois une organisation hirarchique des units textuelles et une autre permettant dexprimer des relations non hirarchiques ; considrer les titres comme des units textuelles ; admettre que toute unit textuelle, y compris les titres et les relations non hirarchiques, est susceptible davoir un nombre non limit dannotations de nature quelconque.

tel-00372133, version 1 - 31 Mar 2009

Un texte est compos des trois lments : son titre, la tte, et le corps, dans cet ordre. Le titre est compos dunits textuelles dont lorganisation (une seule unit textuelle, une squence dunits, une hirarchie dunits) est dfinie par lutilisateur. Cette reprsentation est indique dans la figure 16. Le corps est constitu dune hirarchie dunits textuelles, la tte regroupe des relations non hirarchiques construites partir des dunits textuelles existantes dans le corps. Le titre et la tte sont des lments optionnels, le corps est un lment obligatoire.
Un texte est ainsi conu comme une hirarchie dunits textuelles de base, permettant la dfinition dunits plus complexes susceptibles de ne pas suivre la hirarchie tablie.

TEXTE Titre (optionnel) Tte (optionnelle) Relations non hirarchiques Construites partir de Corps Hirarchie dUT

Figure 16.. Composition dun texte Une unit textuelle (UT) est type, c'est--dire quau lieu davoir une unit textuelle section ou une unit textuelle paragraphe par exemple, les caractristiques dune unit textuelle sont donnes par la valeur de son type. Loin dtre une convention de reprsentation, cette dcision conceptuelle entraine une grande gnralit de la notion dunit textuelle qui donne lutilisateur la possibilit de dfinir lui-mme ses propres types. Ainsi, pour lannotation des sentiments, nous avons dfini un type Marque_Sentiment (voir exemple figure 17 ci-aprs).

84

Lunit textuelle de base contient des attributs fixes (type, numro, rang et chane) et des attributs dynamiques (des annotations de nature quelconque). Ces attributs diffrent selon la position, feuille ou nud, de lUT dans larborescence du texte. Une unit textuelle feuille porte linformation lexicale, indique par un attribut fixe nomm chane, alors quune unit textuelle nud sert reprsenter la hirarchie textuelle qui permet lembotement des diffrentes units. Cette dernire est compose dUT filles et ne contient pas dinformation lexicale, mais peut sinfrer partir des UT filles, en faisant un parcours dans larborescence. Les units textuelles peuvent tre annotes. Ces annotations peuvent tre hrites soit par les UT descendantes (hritage descendant), soit par les UT ascendantes (hritage ascendant), soit par les deux. La tte du texte contient des units textuelles construites par lutilisateur pour reprsenter des constituants textuels qui ne respectent pas la hirarchie tablie dans le corps du texte, par exemple des phnomnes linguistiques comme la discontinuit ou le recouvrement. Ces units sont construites partir dUT existantes dans le corps du texte, elles peuvent avoir des annotations (qui leur sont propres cest--dire qui ne pourront pas tre hrites par les UT de base du corps) et enfin elles peuvent se combiner afin de construire des lments plus complexes. On peut ainsi construire quatre ensembles dunits textuelles un Ensemble, une Squence, une Rfrence ou un Graphe :
Un Ensemble dclare un ensemble non ordonn dUT pour lesquelles existe, du point de vue de lannotateur, une relation dquivalence. [...] Une Rfrence dcrit une relation oriente entre deux UT. Typiquement, ce constructeur permet de reprsenter le lien entre une anaphore et son rfrent discursif. Une Squence est une suite ordonne dUT laquelle lannotateur attribue une cohsion.[...] Le dernier type dobjet, Graphe, est utilis pour construire des relations multiples entre des UT. Cette structure permet de reprsenter des phnomnes linguistiques complexes comme par exemple limbrication de diffrents cadres de discours [...], les diffrentes pistes de cohrence qui structurent un texte [...], ou encore les expressions des sentiments dun personnage dans un roman [...].

tel-00372133, version 1 - 31 Mar 2009

Pour la description des expressions de sentiment dans un texte, les units que nous avons annotes sont les verbes, les noms et les adjectifs exprimant un sentiment. Nous montrons un exemple dannotation dans la figure 17. Dans cet exemple, nous avons dfini cinq attributs pour une UT : - Catgorie : la catgorie grammaticale de lexpression du sentiment : verbe, nom, adjectif ; - Classe smantique (du sentiment) ; - Intensit. : le niveau dintensit (la force) du sentiment exprim (Faible, Mdian ou Fort) ; - Exprienceur : la personne qui prouve le sentiment ; 85

- Objet : lobjet ou la cause du sentiment ; De faon faciliter lexpression des oprations de navigation pour tre utilisables par le langage Sextant, nous avons mis tous les attributs sur lUT qui marque le sentiment. Par exemple, dans la phase Elle tait amoureuse de Lon, et elle recherchait la solitude, afin de pouvoir plus l'aise se dlecter en son image , nous avons agrg lensemble des annotations sur ladjectif amoureuse alors quun analyseur syntaxique, comme par exemple celui que nous avons utilis dans lexemple dannotation du 2.1.4.1., aurait mis les annotations sur lexprienceur elle (cf. figure 8). Nous avons galement fait manuellement la rsolution danaphore et remplac Elle par Emma. <UT Type="Paragraphe" Nro="85"> <UT Type="segment" Nro="1"> <Chaine> Elle tait </Chaine> </UT> <UT Type="Marque_Sentiment" Nro="1"> <Attribut Nom="Catgorie">Adjectif</Attribut> <Attribut Nom="Classe_Smantique">Amour</Attribut> <Attribut Nom="Intensit">Mdian</Attribut> <Attribut Nom="Experienceur">Emma</Attribut> <Attribut Nom="Objet">Lon</Attribut> <Chaine> amoureuse </Chaine> </UT> <UT Type="segment" Nro="2"> <Chaine> de Lon, et elle recherchait la solitude, afin de pouvoir plus l'aise se dlecter en son image. </Chaine> </UT> </UT> Figure 17. Exemple dannotation dun texte

tel-00372133, version 1 - 31 Mar 2009

3.2.4.2. Navigation travers les sentiments Nous avons utilis la plateforme de navigation textuelle NaviTexte pour lire le roman Madame Bovary en suivant diffrents parcours de lecture. Javier Couto et Jean-Luc Minel ont conu un langage dclaratif, le langage Sextant, qui propose, dans NaviTexte, des oprations prdfinies de visualisation et de navigation. Les oprations sont dfinies par une syntaxe formelle et leur sens est dtermin par une smantique oprationnelle. Ainsi, les vues dun texte peuvent tre de type linaire, arborescent ou graphe, et peuvent

86

contenir des chanes lexicales ou des annotations. Un langage de conditions a t dfini, compos de conditions simples, de conditions dexistence sur les lments des UT et de conditions sur leur hirarchie. Les conditions simples portent sur les attributs et sur les annotations des UT. Il existe un oprateur UT qui comporte cinq oprandes correspondant aux proprits suivantes dune UT : le type, le numro, le rang, les annotations et la chane lexicale. Le quatrime oprande annotations est utilis pour indiquer lexistence ou non dannotations, marque par un nom dannotation, une valeur ou un couple (nom dannotation valeur). Les autres oprandes sont des contraintes dgalit, dingalit, dordre (infrieur et suprieur), de prfixe, de suffixe et de recherche de sous-chane. Plusieurs contraintes peuvent sexprimer pour les annotations, comme lexemple de la figure 18 qui exprime la condition : des UT de type Marque_Sentiment comportant une annotation de nom Classe_Smantique dont la valeur est Amour. tel-00372133, version 1 - 31 Mar 2009 UT(type = Marque_Sentiment, *, *, {(Classe_Smantique, Amour)}, *)

Figure 18. Exemple de loprateur UT La condition ci-dessus est donc vrifie par les expressions de sentiment qui ont t annotes comme Amour (comme valeur de classe smantique). Pour vrifier les conditions dexistence des UT, un oprateur sans argument est dfini pour chaque lment (cf. figure 19). Des oprateurs unaires permettent de dfinir des conditions portant sur le rapport des UT entre elles dans leur hirarchie. Pour une description dtaille, on peut se reporter (Couto paratre). Enfin, les conditions peuvent se combiner en utilisant les oprateurs logiques classiques OU, ET et NON. existeAnnotations : teste si lensemble dannotations dune UT nest pas vide ; existeChaneLexicale : teste si la chane lexicale dune UT est dfinie ; existeTitre : teste si le titre dune UT nest pas vide ; existeParent : teste si une UT a une UT parent ; existeFils : teste si la suite dUT filles dune UT nest pas vide.

Figure 19. Oprateurs dexistence sur les lments des UT

87

Le langage Sextant propose des oprations de visualisation et de navigation sur les units textuelles. Les oprations de visualisation sont des oprations de mise en relief et des oprations daide contextuelle. Plusieurs oprations de navigation peuvent tre dfinies sur une UT, ce qui permet de proposer au lecteur plusieurs parcours de navigation partir de nimporte quel endroit du texte ds lors quil contient une opration de navigation dans son annotation. Une opration de navigation est dfinie comme une opration qui cherche lUT cible partir dune UT source, en vrifiant les diffrentes conditions, exprimes dans le langage de conditions que nous venons de prsenter, et en suivant lorientation relative au type dopration. La source est dfinie en utilisant une condition sur les UT. Une opration de navigation est disponible pour une UT dtermine si celle-ci vrifie la condition exprime par la source. La cible est dtermine partir de deux paramtres : une condition vrifier pour lUT cible et le type dopration de navigation. Une fois dtermine la source, plusieurs UT peuvent vrifier la condition de la cible, et cest le type dopration qui indique laquelle choisir. Chaque opration est type avec une valeur qui spcifie, dune part lorientation cest-dire dans quel sens (avant ou aprs lUT source) doit tre effectu la recherche de lUT cible, dautre part le rfrentiel par rapport la source. La valeur du type appartient lensemble: {premier, dernier, suivant[i], prcdent[i]}, i tant un nombre entier positif. Premier et dernier indiquent un rfrencement absolu : lUT afficher doit tre la premire (resp. la dernire) des UT cibles potentielles (= vrifiant les conditions spcifies pour la cible), suivant[i] et prcdent[i] indiquent un rfrencement relatif, lindex i permettant alors de spcifier le rang de la cible recherche. Par exemple, le type prcdent[1] sinterprte comme la recherche, dans les des UT cibles potentielles, de la premire unit textuelle situe avant lunit textuelle source. La reprsentation dune opration de navigation est montre dans la figure 20. OpNav = < ConditionSource, ConditionCible, TypeOpration>

tel-00372133, version 1 - 31 Mar 2009

Figure 20. Dfinition dune opration de navigation Du point de vue de la navigation textuelle, une vue a toujours une UT active, cest-dire une UT sur laquelle lutilisateur est positionn. Lors de la cration dune vue, sa premire UT active doit donc tre dfinie. Quand lexcution dune opration de navigation russit (i.e. une cible est dtermine pour une source donne), limpact sur la vue se concrtise par le changement de lUT active, si lUT cible est diffrente de lUT source. La reprsentation formelle de lexcution dune opration de navigation est donne dans la figure 21.

88

ExcuterOpNav (utSource, opnav, vue, texte) SI vrifie(utSource, opnav.ConditionSource) ALORS utCible = slectionner(opnav.ConditionCible, opnav.TypeOpration, texte) dfinirUTActive(utCible, vue)

Figure 21. Excution dune opration de navigation Si lon veut offrir un lecteur la possibilit de parcourir un texte en suivant les sentiments , cest--dire, si par exemple comme nous lavons vu au 2.1.4.2., on sintresse un personnage du roman et on veut suivre les sentiments quil ressent, pour qui les prouve t-il ?, leur intensit, un autre personnage prouve t-il un sentiment pour lui ?, si oui, lequel, de quelle intensit est-il, comment se modifie ce sentiment au fil du roman ?, etc., ces dplacements travers le texte, si certaines conditions sont remplies, se traduisent par des oprations de navigation de Sextant : il y a une source, une cible et des conditions pour passer de lune lautre. Supposons que lon souhaite, se dplacer dune phrase du roman dans lequel le systme a repr une marque qui indique quEmma Bovary prouve de lamour pour quelquun, une autre position dans la suite du roman (en allant vers la fin) o cest elle qui est l'objet de lamour de quelquun (sans condition sur la personne). Une reprsentation pseudoformelle de cette opration de navigation est donne dans la figure 22. Source Exprienceur = Emma Condition sur la source : Classe Smantique = Amour Cible Objet = Emma Condition sur la cible : Classe Smantique = Amour Type de lecture : narrative (= suite du roman, vers la fin) Figure 22. Exemple dopration de navigation (1/2) Par contre, si on veut aller une phrase du roman o Emma prouve aussi un sentiment damour pour quelquun (sans condition sur la personne qui est lobjet de cet amour, qui peut donc tre diffrente de la prcdente) mais avec force plus grande, ce qui correspond la classe Passion, toujours dans la suite du roman (en allant vers la fin), la condition sur la cible ne sera pas la mme comme le montre la figure 23.

tel-00372133, version 1 - 31 Mar 2009

89

Il sagit bien dune navigation qui, conceptuellement, est un chemin dans un graphe orient dont les arcs correspondent, par exemple, la force des sentiments des personnages du roman. Source Exprienceur = Emma Condition sur la source : Classe Smantique = Amour Cible Exprienceur = Emma Condition sur la cible : Classe Smantique = Passion Type de lecture : narrative (= suite du roman, vers la fin) Figure 23. Exemple dopration de navigation (2/2) La reprsentation de lopration de la figure 22, que lon peut dfinir comme Aller o Emma est lobjet dun sentiment identique , dans le formalisme impos par le langage Sextant, est reproduite dans la figure 24. La source et la cible sont types : TU Marque_Sentiment et les conditions sappliquent sur les attributs de ces UT. Quand on dclenche cette opration, dune phrase o Emma ressent de lamour pour quelquun, le lecteur va directement une phrase o cest Emma qui est lobjet de lamour de quelquun (cf. figure 9 du 2.1.4.2.). <Op_Nav Titre=" Aller o Emma est lobjet dun sentiment identique " Type="Forward"> <Source> <Condition Type="Simple"> <UT Type=" Marque_Sentiment "> <Attribut Nom="Experienceur">Emma</Attribut> <Attribut Nom="Classe_Smantique">Amour</Attribut> </Condition> </Source> <Cible> <Condition Type="Simple"> <UT Type=" Marque_Sentiment "> <Attribut Nom="Object">Emma</Attribut> <Attribut Nom="Classe_Smantique">Amour</Attribut> </Condition> </Cible> </Op_Nav> Figure 24. Exemple dopration de navigation en langage Sextant 90

tel-00372133, version 1 - 31 Mar 2009

3.3. REPRSENTATION DES EXPRESSIONS DOPINION Rappelons que nous avons dcrit les expressions dopinion lintrieur dun segment de discours. Nous avons dfini un segment de base comme une proposition contenant une expression dopinion ou une squence de propositions (relies un segment exprimant lopinion par une relation de discours) exprimant une relation rhtorique avec un segment exprimant une opinion. Les segments complexes sont composs de segment de base relis par des relations de discours. Les objectifs que nous avons poursuivis dans ltude des opinions sont diffrents de ceux de notre tude des sentiments. Nous voulons reprer les expressions dopinion dans un ou plusieurs textes, les dcrire et en faire une valuation locale au niveau du segment contenant cette expression et globale au niveau du texte. Ce travail est actuellement fait manuellement, mais notre but final est de le faire automatiquement. Nous avons fait une classification dtaille des opinions avec une fine granularit, en partie partir de celles des sentiments, mais nous navons pas cherch en faire une description linguistique dtaille. Ces diffrences expliquent que nous navons repris que partiellement les mmes modes de reprsentation des connaissances que ceux dfinis pour le domaine des sentiments. 3.3.1. Reprsentation dun segment dopinion La reprsentation smantique que nous avons adopte pour dcrire un segment dopinion est celle dune structure de traits contenant cinq attributs : la catgorie smantique laquelle il appartient (Catgorie), la modalit associe (Modalit), celui qui met lopinion (metteur de lopinion), le sujet ou thme de lopinion (Topique), et le dclencheur lexical qui a permis didentifier le segment dopinion (Lexicalisation). Une modalit est dfinie comme un degr de prfrence (Prfi) pour les expressions de la catgorie Conseil, une combinaison de degr dEngagement (Ci) et de leur Force dans la catgorie Reportage, ou une combinaison de Polarit (positive, ngative, neutre) et de leur Force pour les expressions des catgories de Jugement et de Sentiment. Des dimensions scalaires simples ont t utilises pour reprsenter la force, les valeurs 2, 1 et 0 signifiant respectivement que lexpression a une forte, moyenne ou faible intensit. Les classes Recommander, Suggrer et Esprer sont associes respectivement aux modalits Pref1, Pref2, Pref3, telles que Pref1>Pref2>Pref3. Les classes Informer et Soutenir sont associes la modalit C1, les classes Dire et Remarquer C2 et les classes Penser et Supposer C3, et on a la gradation C1>C2>C3. Par exemple, le segment [Ce film est poustouflant] a la structure de traits reprsente dans la figure 25. Quand les complments du verbe contiennent une expression dopinion, il y a un attribut supplmentaire (Contenu) dans la structure de traits qui dcrit le contenu de lexpression dopinion introduite par le verbe. Cet attribut est principalement utilis pour les verbes de la catgorie Reportage, sa valeur est galement une structure de traits.

tel-00372133, version 1 - 31 Mar 2009

91

[ Catgorie : [Sentiment : tonnement] Modalit : [Polarit : neutre, Force : 2] metteur de lopinion : rdacteur Topique : film Lexicalisation : poustouflant ]

Figure 25. Structure de traits du segment [Ce film est poustouflant] Par exemple, le segment [Le Ministre a soulign que [trois personnes sur quatre taient favorables une politique des quotas.]] 28 est reprsent par la structure de traits de la figure 26. Les valeurs des attributs ne sont pas dupliques, elles sont reprsentes par des nombres qui seront remplacs par les valeurs grce un mcanisme dunification. Ainsi, dans lexemple de la figure 26, la valeur du Topique est obtenue en remplaant le nombre (1) par la valeur du trait indic par (1) cest--dire la structure de traits du Contenu. Catgorie : [Reportage : Soutenir] Modalit : [ Engagement : C1, Force : 2] metteur de lopinion : Le Ministre Topique : (1) Contenu (1):[ Catgorie : [Jugement : Apprciation] Modalit : [Polarit: positive, Force : 1] metteur quatre Topique : une politique des quotas Lexicalisation : favorables ] ] Lexicalisation : soulign ] Figure 26. Structure de traits du segment [Le Ministre a soulign que [trois personnes sur quatre taient favorables une politique des quotas.]]
28

tel-00372133, version 1 - 31 Mar 2009

de lopinion : trois personnes sur

Le Monde 21 janvier 2008

92

3.3.2. Reprsentation discursive dun texte La reprsentation discursive du texte analyser est faite laide de graphes. Par exemple, le commentaire C du film (contenu dans un DVD) suivant : [ce film est poustouflant.]a. [[On peut ne pas tre compltement convaincu]b.1, mais [on en ressort boulevers]b.2].[[cest poignant]c.1, [triste]c.2] et la fois [superbe] c.3]d.[Achetez le]e. est reprsent par le graphe de la figure 27. Support

a Support

Rsultat b.1 Contraste tel-00372133, version 1 - 31 Mar 2009 Support c.1 Continuation c.2 Contraste c.3 b.2 e

Figure 27. Exemple de reprsentation discursive dun texte. 3.3.3. Reprsentation gnrale des opinions dans un texte Une fois cette reprsentation discursive du texte construite, la combinaison des diffrentes structures de traits laide des relations rhtoriques, permet dobtenir la reprsentation gnrale du texte. Nous reprenons ici une partie dcrite en dtail dans (Asher et al. 2008b). La combinaison de 2 structures de traits est effectue en 2 tapes successives : (1) on combine les structures de traits relies par des relations de coordination (Contraste et Continuation). Ainsi dans lexemple de la figure 27, on construit des nouvelles structures de traits partir des segments b.1 et b.2, des segments c.1 et c.2 , puis c.3. (2) on combine les structures de traits relies par des relations de subordination (Support et Rsultat), en oprant de faon ascendante. Dans lexemple de la figure 27, la structure de traits du segment est combine avec les structures dduites de ltape 1. La formalisation de cette procdure est donne figure 28. Pendant ce procd, un ensemble de rgles ddies est utilis. La relation de Continuation peut, par exemple, renforcer la polarit de lopinion en cours, comme le

93

montre lextrait de rgle donn figure 29 qui permet danalyser la phase un film poignant et triste . Soit a, b deux segments relies par la relation rhtorique R telle que : R(a, b). Soit Sa, Sb les structures de traits associes respectivement a et b i.e Sa : [catgorie : [groupa : subgroupa], modalit : [polarit : pa, force : sa] ] et Sb : [catgorie : [groupb : subgroupb],modality : [polarity : pb, strength : sb] ] alors la structure de traits dduite de la combinaison de Sa et Sb est S : [catgorie : [groupe],modalit : [polarit : p, force : f] ] tel-00372133, version 1 - 31 Mar 2009

Figure 28. Combinaison de deux structures de traits En effet, cette phrase contient deux segments Sa = un film poignant et Sb un film triste . Les caractristiques de Sa sont [groupea = Sentiment, sous-groupea = mouvoir, polarita = neutre, forcea=2], les caractristiques de Sb sont [groupeb = Sentiment, sous-groupeb = tristesse, polaritb= ngative, forceb=1]. Par application de la rgle (figure 29), on peut dduire que la phase entire exprime une opinion de type Sentiment de polarit ngative de force 2. si (groupea = groupeb) et (sous-groupea sous-groupeb)) alors si ((pa = neutre) et (pb neutre)) alors groupe = groupea et p = pb et f = max(fa, fb), Figure 29. Extrait de rgle pour la relation de Continuation Lensemble des opinions dun texte est reprsent par un graphe G= (N, R), o N est un ensemble de nuds tel que N = H T avec : o H = {hoi}, hoi est lmetteur de lopinion o et T = {toi : valeur} avec toi le topique et valeur une structure de traits telle que valeur = [Polarit : p, Force : s, Conseil : a], avec p = {positif, ngatif, neutre} et s, a = {0, 1, 2}.

94

Il y a trois types de relations : entre deux metteurs dopinion, entre 2 topiques, et entre un metteur et un topique. On a donc R = RH RT RHT o : o RT = {(ti, t j)/ti, t j T signifie que deux topiques sont relis via une relation laboration (une des deux relations de Support). Cela se produit gnralement entre un topique et un sous- topique, comme un film et son scnario o RH = {(hi, hj) , type } avec hi, hj H et type = Support ou Contraste} signifie que 2 metteurs dopinion sont relis soit par une relation Support (les metteurs partagent le mme point de vue) soit par une relation Contraste (les metteurs hi et hj ont une opinion contraste sur le mme topique); o et RHT = {(hi, t j , type)/ hi H et t j T et type = attribution ou engagement} signifie quune opinion propos dun topique t j est attribue hi ou est mise par hi avec un certain degr dengagement. tel-00372133, version 1 - 31 Mar 2009 Par exemple, dans Jean a dis que le film tait horrible , lopinion est attribue seulement Jean car les verbes de la classe Dire nindiquent rien propos du point de vue personnel de lauteur. Ce nest pas le cas dans Jean a inform la Commission que la situation tait horrible , car ici le rdacteur prend linformation comme tablie ; en effet, linformation introduite par les verbes de la classe Informer est estime vraie et tablie par lauteur (cf 2.2.1). La figure 30 montre la reprsentation gnrale de la critique de film C prcdente : ce film est poustouflant. On peut ne pas tre compltement convaincu, mais on en ressort boulevers. cest poignant, triste et la fois superbe. Achetez le .

Film : [ Polarit : positive Force : 2 Conseil : 1 ]

Rdacteur

Figure 30. Exemple de reprsentation gnrale de la critique de film C Une seconde reprsentation plus formelle (dite de smantique profonde ) est en cours dlaboration. Elle permet de prendre en compte les Modalits (degr de prfrence, degr dEngagement, etc.), de les combiner aux structures rhtoriques et de calculer une opinion globale sur un thme particulier dans un texte en utilisant une logique modale propositionnelle non monotone telle celle de Asher et Lascarides (2003). Cette analyse des opinions est actuellement manuelle, son implmentation est en projet.

95

3.4. VOLUTION UTILISES

DES

REPRSENTATIONS

DES

CONNAISSANCES

tel-00372133, version 1 - 31 Mar 2009

Depuis le dbut de nos travaux, les reprsentations que nous avons utilises ont volues. chaque tape des systmes que nous avons raliss, la complexit des donnes linguistiques que nous avons traites a t croissante. Cette complexit est mettre en relation avec lobjet dtude que nous avons considr : des tables du lexique grammaire (des matrices) dans TRANSLEGS et de ltude dun item lexical, nous sommes passe une petite grammaire du franais, (qui permet la rsolution danaphores et la gnration de phrases correctes) et des connaissances smantiques dans INTERFACILE, puis des classes smantiques, des tableaux, des graphes et des rgles de dduction dans FEELING et FEELING-G. Dans ces trois derniers systmes, ltude a t faite au niveau de la proposition ou la phrase. Enfin, nous avons utilis des annotations pour le filtrage smantique et la navigation dans les textes, des relations rhtoriques discursives et des rgles de combinaisons dopinions et de relations rhtoriques pour ltude des opinions, dans les textes galement. cette complexit croissante des donnes traiter a correspondu une complexit croissante de leurs modles de reprsentation et des outils de traitement. Nous sommes ainsi passe des tables relationnelles des reprsentations symboliques avec hritage et raisonnements. Les donnes de TRANSLEGS sont sous forme de tables relationnelles, relies par des jointures, exploites par lalgbre relationnel, un langage de requtes (SQL) et des rgles de dduction crites en langage procdural (langage C). Dans INTERFACILE, les donnes sont sous forme de prdicats logiques exprims en langage dclaratif (Prolog) avec un mcanisme dunification qui permet de les exploiter. Dans le domaine des sentiments, les donnes sont reprsentes sous forme de prototypes, de traits (attributs-valeurs), et de rgles dclaratives dans FEELING, et par des structures de traits rcursives dans FEELING-G, avec un mcanisme dhritage, implmentes sous forme de clauses dclaratives (crites en Prolog). Ces donnes sur les sentiments ont ensuite t dcrites par des concepts et des bases de connaissances dans une ontologie, implmente avec un outil de gestion des connaissances (Protg 2000). Dans le domaine des opinions, les donnes que nous traitons sont reprsentes sous forme de structure de traits, de graphes et de prdicats logiques. Enfin, nous avons exprim sous forme symbolique dans des oprations de navigation les connaissances contenues dans notre ontologie, ce qui nous a permis de faire des filtrages smantiques et de parcourir des textes avec des objectifs prcis en utilisant une plate-forme de navigation textuelle NaviTexte. Cet accroissement de la complexit se reflte galement dans les interfaces avec lutilisateur qui ont volu vers une interactivit et une dynamique de plus en plus grande, de TRANSLEGS la navigation textuelle. Ces diffrentes tapes sont synthtises dans le tableau 15. 96

DESCRIPTIONS

REPRSENTATIONS

OUTILS LOGICIELS

OBJET TUDI

AVANT LES SENTIMENTS


TRANSLEGS Tables du lexique-grammaire franais et du lexique-grammaire italien Petite grammaire du franais + lexiquegrammaire du domaine + connaissances smantiques du domaine Relations, Algbre relationnel, jointures, Rgles de dduction Prdicats logiques, rgles dductions, parsing , unification de SGBD + procdural Langage dclaratif langage Mot

INTERFACILE

Phrase

tel-00372133, version 1 - 31 Mar 2009

LES SENTIMENTS
FEELING Lexique, classes smantiques, graphes et rgles de dductions idem idem Concepts et relations Annotations, oprations de navigation tableaux, Prototypes, traits attributs-valeurs, rgles dclaratives, unification mcanisme dhritage Langage dclaratif Phrase

FEELING -G ONTOLOGIE NAVIGATION

Langage dclaratif Gestionnaire dontologie Plate forme de navigation textuelle

Phrase Phrase Texte

LES OPINIONS
Classes dopinions, relations rhtoriques discursives, rgles de combinaisons dopinions et de relations rhtoriques discursives, lambda terms Structure de traits, graphes, algbre, logique Texte

Tableau 15. volution des reprsentations des connaissances utilises.

97

tel-00372133, version 1 - 31 Mar 2009

98

CONCLUSION

tel-00372133, version 1 - 31 Mar 2009

Au dbut des annes 2000, diffrents bouleversements ont jalonn nos travaux. Quand nous avons commenc tudier les sentiments, nous avions pour objectif des descriptions linguistiques et nous les avons tablies avec des emplois construits, non attests en corpus. Un premier basculement a t une modification de perspective dans nos recherches avec le souci de pouvoir utiliser ces descriptions comme ressources. Paralllement avec la disposition de nombreux textes lectroniques, nous avons pu vrifier les emplois en corpus et passer dune linguistique construite une linguistique atteste , volution qui a t galement largement rpandue dans la communaut linguistique et du TAL. La possibilit dutiliser nos descriptions a entran un autre tournant important, en nous amenant rflchir aux moyens mettre en uvre pour rendre accessible des utilisateurs humains ou informatiques ces descriptions. En effet, une partie des reprsentations que nous avons adoptes dans notre tude sur les sentiments sont trs proches de celles proposes dans les ontologies utilises en Intelligence Artificielle dans le domaine du Web smantique. Nous avons pu ainsi aisment en traduire certaines, comme par exemple lorganisation en classes qui sont devenues les concepts de lontologie, lis entre eux par des relations qui reprsentent certains de nos graphes (intensit et antonymie). La rcente disponibilit de formats standards (XML et sa galaxie RDF, RDFS, OWL, etc.) exploits par des outils de gestion et dinterrogation des ontologies, comme Protg-2000, permet maintenant dexploiter une partie des ressources linguistiques que nous avons construites. En contrepartie, nous sommes oblige daccepter une part dapproximation et une dgradation dans nos reprsentations, lies aux formalismes utiliss.

99

Nous nous intressons prsent la dtection et lannotation des sentiments et des opinions non plus au niveau du mot et de la phrase mais dans les textes et en corpus. Ce passage dune linguistique construite une linguistique textuelle de corpus a entran que les proprits qui nous intressent ne sont plus exactement les mmes. Au dbut de notre tude sur les sentiments, nous avons tabli la liste des verbes partir de dictionnaires, et construit les exemples demploi pour la classification et ltude des proprits partir de notre intuition personnelle que nous avons vrifie auprs de locuteurs dont la langue maternelle est le franais. Par la suite, la gnralisation de corpus lectroniques a entran une modification de cette classification et de lacceptabilit de certaines proprits. Ainsi, nous avons trouv via un moteur de recherche du Web, des emplois attests de Nom hum dsempar de 29 alors que notre propre intuition (et celle de Maurice Gross dans la table 4 du Lexique grammaire) pensait cet emploi inacceptable pour le verbe dsemparer. Mais comme le remarque Celine Raynal (2005) tel-00372133, version 1 - 31 Mar 2009
Quels statuts donner des structures attestes uniquement sur le Web et en trs petite quantit ? page 140.

linverse, certaines proprits que nous avions estimes pertinentes dans une optique de TAL, pour gnrer des paraphrases par exemple, comme les constructions N1 se V de ce que P ou la possibilit dun sujet phrastique (Que P V N1), se rencontrent trs peu dans la langue des corpus (en 2008). Nous continuons penser, cependant, que lintrospection et lintuition sont ncessaires pour mettre en vidence ces proprits que lon risquerait de ne pas remarquer en ayant recours uniquement aux corpus. Or, ces proprits doivent tre prises en compte car notre propre intuition dans notre langue maternelle est valide, et ds lors que la langue est un systme on ne peut gnrer nimporte quelle phrase. Ce recours, ou non, au corpus fait lobjet dun large dbat dans la communaut. La position dun extrme est que La langue cest les corpus , et lon dcrit, par exemple, un phnomne syntaxique uniquement partir dun corpus cens reprsenter le fonctionnement dune langue ; de nombreux travaux en linguistique computationnelle ont cette approche. Le choix du corpus est donc crucial, et lon ne doit pas perdre de vue que ce nest le reflet que dune partie de la langue. loppos, certains travaux, en linguistique notamment, reposent encore sur lintrospection pure . Nous adoptons une position mdiane, assez rpandue, qui est dutiliser la fois lintuition et lintrospection, et les corpus pour attester les emplois ou rechercher des informations.

Escobar dsempar de douleur , Libration 27 octobre 2005, il-de-Faucon fut dsempar de la mort de sa femme http://hyperion2000.free.fr,

29

100

Une autre problmatique est venue depuis quelques annes questionner nos recherches, il sagit de lexploitation possible des ressources que nous avons construites pour assister un lecteur. De nombreux livres lectroniques ( ebooks ) sont maintenant disponibles, scanns ou numriss et prsents en mode texte ou dans des formats adapts la lecture sur cran (de priphrique lectronique ddi ou dordinateur). Le mode de lecture dun document dpend de son support : on ne lit pas sur papier comme on lit sur cran 30, et le support numrique a des modalits de consultation propres. Lors des Quinzimes entretiens Jacques Cartier (2002) sur le thme : Les dfis de la publication sur le Web , Christian Vandendorpe crivait :
[...] La question est de dterminer si la nouvelle technologie va remplacer le livre ou si, au contraire, elle va exercer une telle pression sur nos modes de lecture que la forme incarne traditionnellement par le livre et la littrature va tout simplement tomber en dsutude. [...] Plus prcisment, le Web est devenu, grce aux moteurs de recherche, une gigantesque

tel-00372133, version 1 - 31 Mar 2009

base de donnes. Et celle-ci instaure un type de textualit qui lui est propre, organis non plus en fonction dune lecture continue ou dune rcitation haute voix, mais selon les paramtres les plus susceptibles de correspondre des besoins spcifiques de lecture et dinformation.

Si la lecture sur un support papier est le plus souvent une lecture continue et dun seul document la fois, on utilise des outils de navigation pour se positionner directement des endroits particuliers dun livre ou dun document numrique en gnral, selon des objectifs que lon a choisis. Avec larrive de ce nouveau support qui se rpand rapidement, un nouveau champ dinvestigation est la conception doutils de navigation dans des textes. Des annotations ddies des applications particulires permettent, grce des plates formes de navigation intelligentes , de se dplacer dans un document, ou dans plusieurs documents, selon des critres spcifis (sur les annotations). Ce parcours peut tre ralis aussi bien vers le dbut que vers la fin du document. Ces outils amnent de nouveaux besoins comme des modes de lecture dynamiques , par exemple en suivant les sentiments des diffrents personnages dun roman, comment se transforment ces sentiments au fil du texte, etc., ou encore en sintressant lvolution des opinions, de quelquun ou sur quelquun, un homme politique par exemple, travers ses dclarations, ses discours, etc. Cette transformation de lcrit en une forme numrique offre de nouvelles possibilits de lecture, qui nest plus linaire et squentielle. Ainsi, on peut naviguer dans des textes, grce des raisonnements sur des connaissances quon leur a associes.

30

Le Monde 2, 16 fvrier 2008, page 25

101

linverse, si ces nouvelles technologies proposent de nouveaux modes de lecture, elles induisent de nouveaux modes dcriture et peuvent galement nous amener exprimer nos ides et nos affects de faon diffrente. Lvolution vers une technologie toujours plus performante, loin dexclure les agents humains de toutes applications, les y rintroduit. Cela nous conduira, peut tre, une meilleure comprhension des modes dexpression crits de nos comportements et de nos motions.

tel-00372133, version 1 - 31 Mar 2009

102

BIBLIOGRAPHIE
tel-00372133, version 1 - 31 Mar 2009

ASHER N., BENAMARA F., MATHIEU, Y. Y. 2008a. Discourse Based Opinion Categorizing: A preliminary study , Proceedings of ECAI2008, Patras, Greece, p. 835-836. ASHER N., BENAMARA F., MATHIEU, Y. Y. 2008b. Categorizing Opinion in Discourse , Proceedings of COLING2008 Companion Volume, Manchester, p. 710. ASHER N., BENAMARA F., MATHIEU, Y. Y. 2008c. Appraisal of Opinion Expressions in Discourse , Actes du 27e Colloque International sur le Lexique et la Grammaire, LAquila, Italie, p. 223-229. ASHER N., LASCARIDES A. 2003. Logics of Conversation, Cambridge University Press. BELLETI A., RIZZI L. 1988. Psych-Verbs and theory , Natural Language and Linguistic Theory 6, p. 291-352. BETHARD S., YU H., THORNTON A., HATZIVASSILOGLOU V., JU RAFSKY D., 2004. Automatic Extraction of Opinion Propositions and their Holders , Proceedings of AAAI04. BOONS J.-P., GUILLET A., LECLRE C. 1976. La structure des phrases simples en franais. Constructions intransitives, Genve, Droz. BOURIGAULT D., 2002. Upery : un outil d'analyse distributionnelle tendue pour la construction dontologies partir de corpus , Actes de TALN 2002, Nancy, p. 75-84. CHOI Y., CARDIE C., RILOFF E., PATWARDHAN S. 2005. Identifying Sources of Opinions with Conditional Random Fields and Extraction Patterns , Proceedings of HLT/EMNLP 2005.

103

COUTO J. paratre. Exploiter par navigation textuelle les informations filtres , In Filtrage smantique dans les textes. Approches symboliques, J-L Minel (Ed.), Paris, Herms Sciences, Lavoisier. COUTO J., MINEL, J.-L. 2006. Navigation textuelle : reprsentation des textes et des connaissances , TAL, Vol 47/2, p. 225254. COUTO J., MINEL, J.-L. 2008. A linguistic and navigational knowledge approach to text navigation , Third International Joint Conference on Natural Language Processing, Hyderabad, India, p. 667-672. DAELEMANS W., DE SMEDT K., GADZAR G. 1992. Inheritance in Natural Language Processing , Computational Linguistics ; 18/2, p. 205-218. DANLOS L., SAGOT B. 2007. Comparaison du Lexique-Grammaire des verbes pleins et de DICOVALENCE : vers une intgration dans le Lefff , Actes de TALN 2007, Toulouse. DAVITZ J. R., 1969. The Langage of Emotion, New York and London, Academic Press. DESCARTES R. 1649/1988. Les passions de lme, Gallimard. DUBOIS J., DUBOIS-CHARLIER F. 1997. Les Verbes franais, Paris, LarousseBordas. DUGAS A., COURTOIS B., MATHIEU Y. Y. 1992. O stories , In First KoreanFrench Colloquium : The Grammar and the Lexicon for NLP, Soul. DUGAS A., MATHIEU, Y. Y., COURTOIS B. 1995. Formes simples en o- , Linguisticae Investigationes, XIX/2, p. 429-441. ELIA A., 1984. Le verbe italien, Biblioteca della Ricerca, Fasano di Puglia Italie, Paris, France, Schena-Nizet. ELIA A., MATHIEU Y. Y. 1986. Computational Comparatives Studies on Romance Language. A Linguistic Comparison of Lexicon-Grammars , Invited paper In 11th International Conference on Computational Linguistics, COLING'86, Bonn, p. 146150. ESULI A., SEBASTIANI F. 2006. SENTIWORDNET: A Publicly Available Lexical Resource for Opinion Mining , Proceedings of LREC 06. FALK I., FRANCOPOULO G., GARDENT C. 2007. Evaluer SynLex. , Actes de TALN'07, Toulouse. FELLBAUM C. 1999. La reprsentation des verbes dans le rseau smantique WordNet , Langages 33, p. 27-40. FILLMORE C. J. 1988. The mechanisms of Construction Grammar. , BLS 14, p. 35-55. FLAUBERT, G. 1857/2001. Madame Bovary, Paris, Gallimard. FRAMENET http://framenet.icsi.berkeley.edu FRANOIS J, LE PESANT D., LEEMAN (eds.). 2007. Classements syntacticosmantiques des verbes franais, Langue Franaise 153. FRANTEXT http://www.frantext.fr.

tel-00372133, version 1 - 31 Mar 2009

104

GARDENT C., GUILLAUME B., PERRIER G., FALK I. 2006. Extraction d'information de sous-catgorisation partir des tables du LADL , Actes de Traitement Automatique des Langues Naturelles, Louvain, Belgique. GRACQ, J. 1972. ANDR BRETON, Paris, Jos Corti. GROSS M. 1975. Mthodes en syntaxe, Paris, Hermann. GROSS M. 1981. Les bases empiriques de la notion de prdicat smantique , Langages 63, Paris, Larousse. GUILLET A., LECLRE C. 1992. La structure des phrases simples en franais. Constructions locatives, Genve, Droz. HALLIDAY M.A. K. 1994/2004. An Introduction to Functional Grammar, London, Edward Arnold. HARRIS Z. 1971. Structures mathmatiques du langage, Paris, Dunod. HARRIS Z. 1990. La gense de lanalyse des transformations et de la mtalangue, Langages 99, p. 9-20.. JACKENDOFF R. 1990. Semantic Structures, Cambridge, Massachussets, The MIT Press. JOHNSON-LAIRD P.N., OATLEY K. 1989. The Language of Emotions : An Analysis of a Semantic Field , Cognition and Emotion 3, p. 81-123. KIM S. M., HOVY E. 2005. Identifying Opinion Holders for Question Answering in Opinion Texts. , Workshop on Question Answering in Restricted Domain, AAAI05. KIM S. M., HOVY E. 2006. Identifying and analyzing judgment opinions , HLT NAACL, New York. KOEVA S., MAUREL D., SILBERZTEIN M. 2007. Formaliser les langues avec lordinateur : de Intex Nooj, PU de Franche-Comt. LE PETIT ROBERT. 2001. Version lectronique. LEEMAN D. 1991. Hurler de rage, rayonner de bonheur : remarques sur une construction en de , Langue franaise 101, p. 80-101. LEEMAN D. 1995. Pourquoi peut-on dire Max est en colre mais non *Max est en peur ? Hypothse sur la construction tre en N , Langue franaise 105, p. 55-69. LEVIN B,. 1993. English Verb Classes and Alternations: A Preliminary Investigation, Chicago, IL, University of Chicago Press. MARTIN J. R., WHITE P.R.R. 2005. Language of Evaluation: Appraisal in English, Palgrave Macmillan. MATHIEU, Y. Y., SABATIER P. 1986. INTERFACILE : a Linguistic Coverage and Query Reformulation , In 11th International Conference on Computational Linguistics, COLING'86, Bonn, p. 46-49. MATHIEU, Y. Y. 1989. TRANSLEGS : une station de travail linguistique , In Colloque International sur la description des langues naturelles en vue d'applications informatiques, Qubec, Universit Laval, p. 309-320.

tel-00372133, version 1 - 31 Mar 2009

105

MATHIEU, Y., 1994. Interprtation par prdicats smantiques de structures d'arguments. FEELING : une application aux verbes psychologiques, Thse en Informatique fondamentale, Paris, Universit Paris 7. MATHIEU Y. Y. 1998a. tude pour une extraction semi-automatique des nologismes , In Cinquimes Journes Scientifiques : La mmoire des mots , septembre 1997, Tunis. p. 55-460 MATHIEU Y. Y., FOUQUER C., GROSS G. 1998b. Vers une extraction automatique des nologismes , Cahiers de lexicologie 72, p. 199-208. MATHIEU, Y. Y. 1999. Les prdicats de sentiment , Langages 136, p. 41-52. MATHIEU, Y. Y. 2000. Les verbes de sentiment. De l'analyse linguistique au traitement automatique, Paris, CNRS Editions. MATHIEU, Y. Y. 2004. Linguistic Knowledge and Automatic Semantic Representation of Emotions and Feelings. , International Conference on information Technology (ITCC2004), IEEE Computer Society, p. 314-318. MATHIEU, Y. Y., 2005a. Annotations of Emotions and Feelings in Texts , Conference on Affective Computing and intelligent Interaction (ACII2005), Dordrecht, Springer Lecture Notes in Computer Science, p. 350-357. MATHIEU, Y. Y. 2005b. A Computational Semantic Lexicon of French Verbs of Emotion , In Shanahan, G., Qu, Y., Wiebe, J. (eds.): Computing Attitude and Affect in Text, Dordrecht, Springer, p. 109-123. MEL'UK I., 1992. Dictionnaire explicatif et combinatoire du franais contemporain, Recherches lexico-smantiques III, Montral, Les presses de lUniversit de Montral. MILLER G., FELLBAUM C. 2007. Wordnet Then and Now , Language Resources and Evaluation 41:2, Netherlands, Springer, p. 209-214. MILLER, G. A. 1990. Nouns in WordNet: a lexical inheritance system. , In International Journal of Lexicography 3 (4), p. 245-264. MILLER, G. A., FELLBAUM C. 1991. Semantic networks of English. , In Cognition 41, p. 197-229. MILLER, G. A., FELLBAUM C., MILLER J. K. 1993. Five papers on WordNet. ftp://ftp.cogsci.princeton.edu/pub/wordnet/5papers.ps MINEL J-L., paratre. Le filtrage smantique dans les textes, In Filtrage smantique dans les textes. Approches symboliques. J-L Minel (d.). Paris, Herms Sciences, Lavoisier. ORTONY A, CLORE G.L, COLLINS A. 1988. The Cognitive Structure of Emotions, Cambridge University Press. OSGOOD C.E., 1979. From Yang And Yin To And Or But In Cross-Cultural Perspective , International Journal of Psychology 14, p. 1-35. OSGOOD C.E., SUCI G.J., TANNENBAUM P.H. 1957. The measurement of meaning, Urbana, University of Illinois Press.

tel-00372133, version 1 - 31 Mar 2009

106

PANG ,B.; LEE L., VAITHYANATHAN S. 2002. Thumbs up? Sentiment Classification using Machine Learning Techniques , Proceedings of EMNLP 2002. PROTG-2000. The Protg Project, http://protege.stanford.edu RUSSELL J. A., PRATT G. A. 1980. A Description of the Affective Quality Attributed to Environments , Journal of Personality and Social Psychology 38, p. 311-322. RUWET N. 1993. Les verbes dits psychologiques : trois thories et quelques questions , Recherches linguistiques de Vincennes 22, p. 95-124. RUWET N. 1994. tre ou ne pas tre un verbe de sentiment , Langue franaise 103, p. 45-55. RUWET, N. 1995. Les verbes de sentiment peuvent-ils tre agentifs? , Langue franaise 105, p. 28-39. SHANAHAN, G., QU, Y., WIEBE, J. eds., 2005. Computing Attitude and Affect in Text, Dordrecht, The Netherlands, Springer. STRAPPARAVA C., VALITUTTI A. 2004. WordNet Affect: an Affective Extension of WordNet , Proceedings of LREC 2004. TRSOR DE LA LANGUE FRANAISE INFORMATIS, http://atilf.atilf.fr/tlf.htm. TURNEY P., 2002. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews , Proceedings of 2006 International Conference on Intelligent User Interfaces (IUI06). USCHOLD, M., GRUNINGER, M. 1996. Ontologies: Principles, Methods and Applications , Knowledge Engineering Review 11(2). VAN DE VELDE, D. 1999. La multiplication des sentiments , Travaux de Linguistique 38, p. 63-87. VOORST J. V. 1992. The Aspectual Semantics of Psychological Verbs , Linguistics and Philosophy 15, p. 65-92. WHITELAW C., GARG N., ARGAMON S. 2005. Using Appraisal Taxonomies for Sentiment Analysis , Proceedings of Second Midwest Computational Linguistic Colloquium (MCLC 2005). WIEBE J., WILSON T., CARDIE C. 2005. Annotating Expressions of Opinions and Emotions in Language , Language Resources and Evaluation 1(2). WIERZBICKA A. 1987. Speech Act Verbs, Sydney, Academic Press. WIERZBICKA A. 1993. La qute des primitifs smantiques , Langue franaise 98, p. 9-23. WILSON T., WIEBE J., HWA R. 2006. Recognizing strong and weak opinion clauses , Computational Intelligence 22 (2), p. 73-99. WORDNET, http://wordnet.princeton.edu/ YU H., HATZIVASSILOGLOU V. 2003. Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences , Proceedings of EMNLP 03.

tel-00372133, version 1 - 31 Mar 2009

107

tel-00372133, version 1 - 31 Mar 2009

108

TABLE DES FIGURES Figure 1. La relation dhyperonymie pour Doberman (WordNet 2.1)......................26 Figure 2. Exemples de relations dintensit entre classes smantiques ..........................42 Figure 3. Exemple de relation de sens entre classes smantiques (1/3)..........................42 Figure 4. Exemple de relation de sens entre classes smantiques (2/3)..........................42 Figure 5. Exemples de relation de sens entre classes smantiques (3/3) ........................43 Figure 6. Exemples de relation entre classes smantiques..............................................43 Figure 7. Annotation dun extrait de Madame Bovary ...................................................50 Figure 8. Processus dannotation ....................................................................................51 tel-00372133, version 1 - 31 Mar 2009 Figure 9. Exemple dcran NaviTexte .............................................................................52 Figure 10. Exemples dantonymie dans WordNet ..........................................................67 Figure 11. Exemple de comparaison des Lexiques grammaires italien et franais ........71 Figure 12. Proprits de substitution du verbe douter ....................................................71 Figure 13. Construction dune vue dynamique dans le systme TRANSLEGS ..............72 Figure 14. Mcanisme dhritage dans le systme FEELING ........................................80 Figure 15. Reprsentation smantique de Luc exaspre Marie ......................................82 Figure 16.. Composition dun texte ................................................................................84 Figure 17. Exemple dannotation dun texte...................................................................86 Figure 18. Exemple de loprateur UT ...........................................................................87 Figure 19. Oprateurs dexistence sur les lments des UT ...........................................87 Figure 20. Dfinition dune opration de navigation ......................................................88 Figure 21. Excution dune opration de navigation ......................................................89 Figure 22. Exemple dopration de navigation (1/2) ......................................................89 Figure 23. Exemple dopration de navigation (2/2) ......................................................90 Figure 24. Exemple dopration de navigation en langage Sextant................................90 Figure 25. Structure de traits du segment [Ce film est poustouflant] ............................92 Figure 26. Structure de traits du segment [Le Ministre a soulign que [trois personnes sur quatre taient favorables une politique des quotas.]] ...............................92 Figure 27. Exemple de reprsentation discursive dun texte. .........................................93 Figure 28. Combinaison de deux structures de traits ......................................................94 Figure 29. Extrait de rgle pour la relation de Continuation ..........................................94 Figure 30. Exemple de reprsentation gnrale de la critique de film C ........................95 109

tel-00372133, version 1 - 31 Mar 2009

110

TABLE DES TABLEAUX Tableau 1. Organisation gnrale des tables du Lexique grammaire des verbes............10 Tableau 2. Tables des verbes constructions compltives .............................................11 Tableau 3. Extrait de la table 4 du Lexique grammaire (Gross 1975) ............................12 Tableau 4. Classes des verbes anglais par Beth Levin (1993) ........................................18 Tableau 5. Contenu du rseau lexical WordNet (juillet 2008)........................................24 Tableau 6. Domaines smantiques des verbes de WordNet ...........................................27 Tableau 7. Classes gnriques et syntaxico-smantiques des verbes franais (Dubois et DuboisCharlier 1997).....................................................................................................33 tel-00372133, version 1 - 31 Mar 2009 Tableau 8. Organisation des verbes psychologiques dans le dictionnaire des verbes franais de Dubois et Dubois-Charlier (1997).....................................................................35 Tableau 9. Classes smantiques des sentiments..............................................................41 Tableau 10. Classes des verbes de parole anglais par Anna Wierzbicka (1987) ............57 Tableau 11. Classification des expressions dopinion ....................................................58 Tableau 12. Correspondances entre les tables de verbes compltives italiennes et franaises .............................................................................................................................70 Tableau 13. Extrait de la table italienne it42...................................................................70 Tableau 14. Exemple de proprits simples des verbes de sentiment.............................78 Tableau 15. volution des reprsentations des connaissances utilises. ........................97

111

S-ar putea să vă placă și