Sunteți pe pagina 1din 9

1

TRAITEMENT AUTOMATIQUE DE LA SYNONYMIE

La synonymie n'a pas encore fait l'objet d'une tude approfondie dans le cadre du traitement automatique des langues. Cette lacune est due, tout la fois, la complexit des phnomnes linguistiques mis en jeu et l'absence d'outils de description appropris. La prsentation habituelle des synonymes met l'accent, en effet, sur le foisonnement des termes et leur htrognit : aigu, selon les cas, a pour quivalent pointu, strident, grave, etc. ; mais rien ne permet de prvoir, par des procdures explicites, le champ d'application de chaque variante. D'o un constat d'incohrence, qui se prte mal au traitement informatique. Nous pensons au contraire que la complexit inhrente la synonymie peut donner lieu une description prcise et rigoureuse, et que la slection des quivalences peut faire l'objet d'une prdictibilit automatique. Encore faut-il, pour obtenir ce rsultat, introduire dans l'analyse de nouveaux concepts. Nous proposons de montrer comment la notion de classe d'objets, situe au croisement de la smantique et de la syntaxe, offre un outil particulirement bien appropri au traitement de la synonymie.

1. Les traits syntaxiques A des variantes prs, il y a unanimit parmi les grammairiens pour dcomposer la phrase lmentaire en oprateur et arguments. Par dfinition, l'oprateur implique des arguments et est dfini par la nature de ces derniers (contrainte d'arguments)(1). Pour rendre compte, donc, du fonctionnement de l'oprateur, on se sert d'une typologie lmentaire;des arguments. On a ainsi subdivis les noms en sous-ensembles l'aide de traits comme humain, concret, abstrait, locatif, anim, etc. Ces traits servent aussi sparer les diffrents emplois d'oprateurs. A titre d'exemple, on distingue deux emplois de marcher selon que le sujet est humain ou concret : Luc marche Cet appareil marche Ce type de description a t popularis par la grammaire transformationnelle. et sert de base, en utilisant un trs grand nombre de traits, il est vrai, aux tables qui ont t mises au point dans le cadre du LADL. Cependant, si l'on essaie, partir de ces traits, d'analyser ou de gnrer
11

. Cf. Z. Harris 1976 "Les mots qui n'ont aucune contrainte sur leurs arguments sont les arguments lmentaires. Les autres sont des oprateurs, ils appartiennent diffrents ensembles.

automatiquement toutes les phrases possibles construites autour d'un oprateur donn, on s'aperoit que les rgles qu'on a ainsi dgages sont beaucoup trop puissantes et qu'il faut les appauvrir (2). Si on veut rendre compte de la construction d'un verbe comme tailler, il ne suffit pas de dire que le sujet dsigne un humain et l'objet un concret : tous les concrets ne peuvent pas constituer des objets naturels du verbe tailler : *Luc a taill un tlphone *Luc a taill une ficelle Comme d'autre part, il ne saurait tre question, dans un dictionnaire d'numrer tous les substantifs qui constituent les arguments de l'oprateur, on est amen sous-classer les traits en classes d'objets, comme en l'occurrence <arbre> ou <costume> : Luc a taill ce cerisier Luc a taill cette veste La description est encore amliore si on ajoute que, dans ce dernier exemple, le sujet n'est pas n'importe quel humain mais un substantif dsignant une profession comme tailleur ou couturire : Cette couturire taille bien les vestes Prenons un autre exemple. Le verbe soler (dans un de ses emplois) serait dcrit l'aide du trait humain pour l'objet et du trait concret pour le sujet. Dans une perspective de traitement automatique du franais, il est clair que cette description gnrerait beaucoup plus de phrases fausses que de phrases correctes, pour la raison que tous les concrets ne sont pas susceptibles de fonctionner avec soler. En revanche, si on dcrit le sujet de cet emploi en spcifiant qu'il est constitu de la classe d'objets <boisson alcoolise>, alors les phrases incorrectes potentielles seront du coup vites. Imaginons, d'autre part, que l'on fasse la liste de toutes les boissons alcoolises (ce qui est fait) alors on est en mesure de traiter automatiquement toute occurrence de ce verbe. 2. Les classes d'objets Nous proposons donc de crer des ensembles de substantifs smantiquement et syntaxiquement homognes, dont l'objectif est de dcrire avec plus de prcision les emplois d'oprateurs. Nous voudrions prendre une premire prcaution pour viter quelques confusions. Dans les dictionnaires lectroniques destins la TAO ou la traduction automatique (comme ceux de SYSTRAN, par exemple) figurent des indications smantiques prsentes sous forme d'arbres de drivations smantiques. Ces arbres reprsentent une
2.

Chomsky, dans ses premiers travaux, a propos de complter les traits syntaxiques par des traits smantiques (comme liquide, par exemple). Mais ceci ne semble avoir t qu'un projet.

structuration smantique de l'univers, tel qu'il est peru par l'auteur de ces arbres. Il y a ainsi l'arbre des objets, des actions, des tats, des qualits, etc. A chaque noeud de l'arbre correspond une classe et une seule. Or ces classes sont des ensembles conceptuels labors intuitivement par le chercheur, indpendamment d'une langue relle. Ce sont en fait des champs notionnels. Notre dmarche est diffrente. Nous partons des oprateurs rels du franais (verbes, noms ou adjectifs prdicatifs) et nous mettons au point les classes d'objets au fur et mesure des besoins de la description. On pourrait reprocher cette dmarche son caractre empirique. A quoi on peut rpondre que les arbres smantiques ne servent presque jamais dans la ralit. Dans SYSTRAN, le systme de traduction automatique qui a les dictionnaires les plus complets, et de loin, les informations venant de l'arbre smantique ne sont codes que pour 10% des substantifs. La complexit de l'arbre est telle qu'aucun codeur n'a t en mesure d'appliquer aux noms franais les catgories prvues . Nous avons voqu l'instant la classe d'objets <boisson alcoolise>. Elle nous servira aussi dans la description de l'un des emplois du verbe titrer : Ce vin titre 11 degrs Il est clair que les traits syntaxiques, respectivement concret pour le sujet et abstrait pour l'objet, sont insuffisants. Ces rgles gnreraient des milliers de phrases totalement inacceptables. Si l'on restreint le sujet la classe des <boissons alcoolises>, si l'objet est rduit au seul mot degr (ou ventuellement volume), si, d'autre part, on prcise que le dterminant de l'objet est un cardinal de 1 100, alors on a les informations suffisantes pour ne produire que des phrases correctes avec cet emploi de l'oprateur titrer. On a dfini, dans la tradition linguistique, les oprateurs l'aide des arguments. Comme la phrase est un ensemble, on ne voit pas pourquoi on ne pourrait, inversement, se servir des oprateurs pour dfinir les arguments. Imaginons que nous voulions dfinir la classe d'objets <vtements> pour un verbe comme acheter : Luc a achet cette veste on observerait que celui-ci n'est pas spcifique de cette classe mais de tout objet "achetable" : voiture, couteau, pain, parfum, etc. Nous cherchons donc un verbe qui soit, dans cet emploi, particulier cette classe. C'est le cas de porter, par exemeple : Luc a port cette veste D'autres verbes ont cette particularit : mettre, enlever, ter, changer de, aller bien 2. Nous dirons que les verbes que nous venons de citer sont des oprateurs appropris de la classe <vtements>. Un substantif susceptible d'tre complment la fois de chacun de ces verbes est un vtement.
2

. Bien entendu dans un des emplois de chacun de ces verbes qui sont tous polysmiques. On verra que les classes d'objets serviront par la suite rendre compte de la polysmie.

Les exemples de classes que nous venons de donner relvent des substantifs concrets, comme par exemple, les outils, les moyens de transport, les machines, les instruments, les aliments, les boissons, les combustibles. Parmi les classes d'abstraits on pourraient ranger les units de mesures, les sentiments, les noms de temps, les vnements, les actes chirurgicaux, etc. Les locatifs recouvriraient les lieux de travail, les lieux de culte, les voies, les habitations, les pays, les rgions, les villes, etc. La notion de classes d'objets a, dans le traitement des langues, des utilisations multiples. Elle permet de dcrire de faon plus prcise la distribution des oprateurs (verbes, noms et adjectifs prdicatifs), de rendre compte aussi de la polysmie de verbes gnraux comme prendre : prendre <aliment> : prendre un steak prendre <boisson> : prendre une bire prendre <moyen de transport : prendre le train prendre <voie> : prendre l'autoroute prendre <coup> : prendre une gifle etc. Nous voudrions montrer le parti que l'on peut tirer de cette notion pour rendre compte de faon naturelle du phnomne de la synonymie. 3. Les dictionnaires de synonymes Il y a plusieurs types de dictionnaires de synonymes. Les uns comme Le dictionnaire des synonymes de Ren Bailly (Larousse) ont une nomenclature limite et dfinissent les lments entrant dans le champ d'une synonymie l'aide d'un commentaire paraphrastique abondant. Cette richesse explique le nombre rduit de synonymes proposs. Inversement, les lexiques plus anciens se contentaient de donner, sans autres explications, une liste d'quivalents. Le lecteur avait le triste privilge de l'embarras du choix. Nul produit ne reflte mieux les apports de la linguistique l'enseignement des langues que le dictionnaire de synonyme. Les auteurs se sont efforcs de tenir compte des niveaux de langue et de dcrire les conditions dans lesquelles un lment lexical peut tre substitu un autre. Ils ont ajout la spcification du domaine. En effet, va-et-vient n'est le synonyme de interrupteur que dans le domaine de l'lectricit. Les dictionnaires rcents comme le Nouveau Dictionnaire des synonymes (Larousse 1977) se sert largement des proprits syntaxiques pour rendre compte des facteurs de synonymie. Les descriptions sont grandement facilites si l'on a sa disposition la notion d'emploi de mot. Un emploi est le rsultat du dgroupement de la polysmie. Il se trouve que ce dgroupement met, ipso facto, en vidence des proprits syntaxiques spcifiques. Tous les travaux qui ont t raliss sur les oprateurs ont montr que les proprits smantiques sont toujours corrles des comportements syntaxiques spcifiques. Nous allons

montrer, dans ce qui suit, que la notion de classe d'objets permet de dcrire la synonymie avec prcision et de faon assez conomique. 4. Classes d'objets et synonymie 4.1. Les adjectifs Le problme thorique qui se pose dans le traitement de la synonymie, c'est qu'il n'existe pas de correspondances biunivoques entre les termes que le sens met en rapport. Si l'on remplace un lment lexical par un synonyme dans n'importe quelle distribution, on aboutit assez rapidement des cocasseries ou des impossibilits comme on le voit avec le couple froid et glac : un temps froid, un temps glac une chambre froide, une chambre glace une chambre froide (fig) : *une chambre glace un repas froid, *un repas glac la guerre froide, *la guerre glace Ces impossibilits sont indpendantes du fait que glac est un intensif de froid. Il faut considrer chaque adjectif comme le centre d'un rseau de significations possibles. Chacune des branches de ce rseau reprsente une signification particulire (un emploi). Chaque signification particulire, donc chaque emploi, est susceptible de paraphrases synonymiques qui lui sont propres. La premire condition d'une description synonymique est donc de pouvoir dlimiter correctement les emplois. Pour ce faire, nous allons nous servir des classes d'objets. Nous pensons qu'elles sont le lieu naturel de la description de la synonymie (et de l'antonymie). Il ne servirait rien d'aligner les synonymes. Il faut indiquer les conditions dans lesquelles un mot peut tre considr comme le synonyme d'un autre. L'adjectif profond n'est pas, dans son sens spatial, synonyme de grand. Une armoire profonde ne signifie pas une grande armoire. Cependant, cette synonymie existe avec les noms de sentiments. On peut considrer comme synonymes les phrases suivantes : Luc a un grand respect pour son pre Luc a un profond respect pour son pre J'ai une profonde horreur de ces magouilles J'ai une grande horreur de ces magouilles L'adjectif pre relve, entre autres, du domaine des sensations (got et toucher) : Ces rochers sont pres

Le got de cette pomme est pre A quoi sert de dire que violent peut tre le synonyme de pre si l'on n'ajoute immdiatement que cette quivalence n'existe que pour la classe d'objets <conflit> : Il y a eu d'pres combats devant Stalingrad Il y a eu de violents combats devant Stalingrad Prenons d'autres exemples. L'adjectif aigu peut tre dcrit l'aide des classes suivantes : aigu (objet) : pointu, effil aigu <son> : strident, grinant aigu <maladie> : grave aigu <douleur> : vif aigu <qualit intellectuelle> : grand Le substantif objet entre parenthses indique qu'il ne s'agit pas d'une classe d'objets mais de n'importe quel substantif dsignant un inanim concret. En revanche, les classes figurent entre chevrons. Voici une bauche de description synonymique des adjectifs lourd, tendre, frais et grave : lourd (objet) : pesant lourd <charge> : difficile lourd <aliment> : indigeste lourd <faute> : grave lourd <terrain> : mouill lourd <odeur> : fort lourd <chec> : important, svre

tendre (humain) : affectueux, clin tendre <aliment> : fondant (ant : dur) tendre <couleur> : ple, dlicat tendre <sentiment> : amoureux tendre <musique> : douce tendre <vgtation> : frache frais (temps) : un peu froid

frais <aliment> : comestible, du jour, non avari frais <vnement> : rcent frais <fruits, lgumes> : non sch frais <look> : sain frais <habit> : non frip

grave <maladie> : srieuse grave <note> : basse grave <voix> : profonde grave <danger> : grand Les descriptions que nous venons de faire ne s'appliquent qu' des adjectifs prdicatifs, ceux qui forment avec le substantif un sens compositionnel, c'est--dire calculable. Elles ne concernent pas ceux des adjectifs qui figurent dans des ensembles figs : noms composs (cercle vicieux, cordon-bleu, grandpre), adverbes composs (de plein fouet, de haute lutte), etc. 4.2. Les verbes Il ne faut pas considrer les verbes comme une catgorie syntaxique homogne. On peut distinguer au moins cinq types de verbes diffrents. Il y a d'abord les verbes prdicatifs (ce sont des oprateurs au sens o nous avons utilis ce mot au dbut de cet article). Par dfinition, ces verbes ont des arguments. Ils constituent la grande majorit des verbes. Les verbes auxiliaires (aller, venir de, tre en train de) peuvent tre considrs comme permettant d'"actualiser" les verbes du groupe prcdent. Les verbes support, eux, actualisent non pas des verbes mais des substantifs prdicatifs : je voyagerai, je ferai un voyage. Un quatrime groupe est constitu par les verbes causatifs (faire, donner, mettre, etc.) qui s'appliquent une phrase lmentaire : Les enfants travaillent Le matre fait travailler les enfants J'ai faim Cela me donne faim Luc est en difficult Ce fait a mis Luc en difficult Un dernier groupe de verbes est reprsent par les verbes qui figurent dans des expressions figes et qui n'ont pas, de ce fait, leurs proprits syntaxiques habituelle : prendre le large, casser sa pipe, mordre la poussire. Les analyses que nous ferons ne s'appliquerons qu'aux verbes "ordinaires"

(prdicatifs) et aux verbes supports. Nous ne les sparerons pas dans nos exemples car notre objectif est de rendre compte des diffrents emplois de chaque verbe "morphologique" et qu' ce niveau cette distinction n'est pas pertinente. Les classes d'objets nous permettent de sparer les emplois et de donner les conditions dans lesquelles le synonyme propos est valable. prendre (objet) : saisir, s'emparer de prendre <aliment> : manger prendre <boisson> : boire prendre <moyen de transport coll> : emprunter prendre <voie> : emprunter prendre <coup> : recevoir, prendre <place forte> : s'emparer de prendre <temps> : durer <sentiment> prendre (hum) : envahir

passer <obstacle> : traverser passer <lgumes> : mixer passer <vitesse> : mettre (conduite auto) passer <examen> : subir passer <grade, fonction> : devenir, tre nomm <couleur> passer : devenir ple <liquide> passer : filtrer <temps> passer : s'couler filer (objet) : donner, accorder filer <textile> : tisser filer <objet tricot> : dchirer filer <maladie infectieuse> : transmettre filer <coup> : donner, allonger

battre <enfant> : frapper battre <adversaire> : l'emporter sur, vaincre battre <assaisonnement> : fouetter battre <rgion> : parcourir, visiter

donner (objet) : attribuer, accorder donner (humain) : dnoncer

donner <coup> : assner, allonger donner <prix> : attribuer donner <fte> : organiser donner <spectacle> : monter <arbre> donner <fruits> : produire <troupe> donner : attaquer Le fait de dfinir les classes partir des relations qui s'tablissent entre oprateurs et arguments dans le cadre de phrases nous permet de dcrire la synonymie et les conditions de son existence. Ceci n'est pas possible si l'on a recours des arbres smantiques indpendants d'une langue naturelle. Il apparat ainsi que la notion de classe d'objets a pour effet de renouveler l'analyse linguistique et de renforcer les liens entre syntaxe et smantique. Nous avons vu le rle qu'elle joue dans la dlimitation des emplois des oprateurs ; on pourrait de la mme faon dcrire avec plus de rigueur l'emploi des prpositions : comparer, par exemple, en <nom de vtement>, en <moyen de transport>, en <nom de matire>, etc. D'autres applications sont galement en vue, paralllement l'analyse de la synonymie : la gnration automatique de textes, la correction grammaticale et stylistique, l'enseignement assist par ordinateur (EAO), la matrise des niveaux de langue . S'il est vrai que la mise au point des classes est un travail de longue haleine, les prolongements prvisibles justifient nos yeux l'ampleur de l'entreprise.

REFERENCES GENOUVRIER, E., DESIRAT, Cl., HORDE, Tr., 1977, Nouveau dictionnaire des synonymes, Larousse, Paris. GROSS, G., ( paratre) "Forme d'un dictionnaire lectronique" GROSS, G., 1989, Les constructions converses du franais, Droz, Genve. BAILLY, R., 1947, Dictionnaire des synonymes de la langue franaise , Larousse, Paris.

S-ar putea să vă placă și